多模态内容处理与生成

一键安装此插件:

42plugin install mrgoonie/claudekit-skills/ai-multimodal

插件介绍

使用 Google Gemini API 处理和生成多媒体内容。功能包括分析音频文件(带时间戳的转录、摘要、语音理解、音乐/声音分析,最长可达 9.5 小时)、理解图像(标题、物体检测、OCR、视觉问答、分割)等。

从属套包

mrgoonie/kit/claudekit-skills

插件信息

作者
类型
许可证MIT
来源GitHub

插件评分

总分
4.5
文档清晰
内容质量
示例丰富
规范程度
可信程度