终极AI媒体创作指南如何用Generative-Media-Skills打造专业级音视频内容【免费下载链接】Generative-Media-SkillsMulti-modal Generative Media Skills for AI Agents (Claude Code, Cursor, Gemini CLI). High-quality image, video, and audio generation powered by muapi.ai.项目地址: https://gitcode.com/gh_mirrors/em/Generative-Media-SkillsGenerative-Media-Skills是一套面向AI代理的多模态生成媒体工具集专为Claude Code、Cursor和Gemini CLI设计通过muapi.ai提供高质量的图像、视频和音频生成能力。本文将详细介绍如何快速上手这套强大工具即使是新手也能轻松创建专业级媒体内容。 5分钟快速入门从安装到生成第一张图片1. 安装核心依赖首先需要安装muapi CLI这是所有功能的基础# 通过npm安装推荐无需Python环境 npm install -g muapi-cli # 或使用pip pip install muapi-cli # 也可以不安装直接运行 npx muapi-cli --help2. 配置API密钥获取API密钥后进行配置# 交互式设置 muapi auth configure # 或直接传入密钥 muapi auth configure --api-key YOUR_MUAPI_KEY提示API密钥可在muapi.ai/dashboard获取3. 安装技能包# 安装所有技能到AI代理 npx skills add SamurAIGPT/Generative-Media-Skills --all # 或安装特定技能 npx skills add SamurAIGPT/Generative-Media-Skills --skill muapi-media-generation4. 生成你的第一张图像使用以下命令生成图像体验AI创作的魔力# 基础生成命令 muapi image generate a cyberpunk city at night --model flux-dev # 自动下载结果 muapi image generate a sunset over mountains --model hidream-fast --download ./outputs使用Generative-Media-Skills生成的机械蜂鸟图像展示了工具的高细节处理能力 探索专家级媒体生成功能Generative-Media-Skills提供了丰富的专业级媒体生成功能分为核心原语和专家库两个层次。⚙️ 核心原语/core核心原语是对muapi-cli的轻量级封装提供原始API访问媒体处理core/media/文件上传功能编辑工具core/edit/基于提示的图像编辑平台支持core/platform/设置、认证和结果轮询 专家库/library专家库包含高价值技能将创意意图转化为技术指令视觉创作类Nano-Banana/library/visual/nano-banana/基于推理的图像生成Gemini 3风格UI设计师/library/visual/ui-design/高保真移动/网页原型原子设计Logo Creator/library/visual/logo-creator/极简矢量品牌设计几何原语使用Nano-Banana生成2K杰作的示例bash library/visual/nano-banana/scripts/generate-nano-art.sh \ --file ./my-source-image.jpg \ --subject a glass hummingbird \ --style macro photography \ --resolution 2k \ --view动态影像类电影导演/library/motion/cinema-director/专业电影指导和摄影Seedance 2/library/motion/seedance-2/导演级电影视频生成支持文本转视频、图像转视频以及带原生音视频同步的视频扩展使用Nano-Banana技能生成的高细节橘猫图像展现了工具的真实感渲染能力 电影级视频创作全流程创建史诗级电影场景使用电影导演技能创建10秒史诗级场景cd library/motion/cinema-director # 创建10秒史诗级揭示场景 bash scripts/generate-film.sh \ --subject a cybernetic dragon over Tokyo \ --intent epic \ --model kling-v3.0-pro \ --duration 10 \ --view将图像转换为视频bash library/motion/seedance-2/scripts/generate-seedance.sh \ --mode i2v \ --file ./concept.jpg \ --subject camera slowly pulls back to reveal the full landscape \ --intent reveal \ --view扩展现有视频bash library/motion/seedance-2/scripts/generate-seedance.sh \ --mode extend \ --request-id YOUR_REQUEST_ID \ --subject camera continues pulling back to reveal the vast city \ --duration 10Generative-Media-Skills的AI代理界面展示了任务管理和技能选择功能 MCP服务器无缝集成AI开发环境MCPModel Context Protocol服务器允许Claude Desktop、Cursor或任何MCP兼容代理直接调用生成工具无需shell脚本muapi mcp serve配置Claude Desktop~/Library/Application Support/Claude/claude_desktop_config.json{ mcpServers: { muapi: { command: muapi, args: [mcp, serve], env: { MUAPI_API_KEY: your-key-here } } } }MCP服务器提供19种结构化工具包括muapi_image_generate文本转图像14种模型muapi_video_generate文本转视频13种模型muapi_audio_create音乐生成Sunomuapi_enhance_upscaleAI放大muapi_edit_lipsync音频唇同步⚡ 高级代理管道示例异步处理与轮询# 提交异步请求捕获request_id就绪时轮询 REQUEST_ID$(muapi video generate a dog running on a beach \ --model kling-master --no-wait --output-json --jq .request_id | tr -d ) # ... 执行其他工作 ... muapi predict wait $REQUEST_ID --download ./outputs命令链上传→编辑→下载URL$(muapi upload file ./photo.jpg --output-json --jq .url | tr -d ) muapi image edit make it look like a painting --image $URL \ --model flux-kontext-pro --download ./outputs 开始使用Generative-Media-Skills要开始使用这套强大的媒体生成工具只需克隆仓库并按照快速入门指南操作git clone https://gitcode.com/gh_mirrors/em/Generative-Media-Skills cd Generative-Media-Skills无论你是AI代理开发新手还是有经验的开发者Generative-Media-Skills都能帮助你轻松创建专业级的图像、视频和音频内容。通过简单的命令行界面和丰富的技能库释放你的创意潜能 许可证信息本项目采用MIT许可证MIT © 2026详细信息请参见项目根目录下的LICENSE文件。【免费下载链接】Generative-Media-SkillsMulti-modal Generative Media Skills for AI Agents (Claude Code, Cursor, Gemini CLI). High-quality image, video, and audio generation powered by muapi.ai.项目地址: https://gitcode.com/gh_mirrors/em/Generative-Media-Skills创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考