一键安装此插件:
42plugin install mrgoonie/claudekit-skills/ai-multimodal42plugin install mrgoonie/claudekit-skills/ai-multimodal插件介绍
使用 Google Gemini API 处理和生成多媒体内容。功能包括分析音频文件(带时间戳的转录、摘要、语音理解、音乐/声音分析,最长可达 9.5 小时)、理解图像(标题、物体检测、OCR、视觉问答、分割)等。
一键安装此插件:
42plugin install mrgoonie/claudekit-skills/ai-multimodal42plugin install mrgoonie/claudekit-skills/ai-multimodal使用 Google Gemini API 处理和生成多媒体内容。功能包括分析音频文件(带时间戳的转录、摘要、语音理解、音乐/声音分析,最长可达 9.5 小时)、理解图像(标题、物体检测、OCR、视觉问答、分割)等。