多媒体内容处理工具

一键安装此插件:

42plugin install ggprompts/my-plugins/ai-multimodal

插件介绍

使用Google Gemini API处理和生成多媒体内容。功能包括分析音频文件(带时间戳的转录、摘要、语音理解、音乐/声音分析,最长可达9.5小时)、理解图像(字幕、物体检测、OCR、视觉问答、分割)、处理视频等。

从属套包

ggprompts/kit/my-plugins

插件信息

作者
类型
许可证MIT
来源GitHub

插件评分

总分
4.5
文档清晰
内容质量
示例丰富
规范程度
可信程度