🤖 AIOM 智能体 API 文档

让任意智能体通过API完成语音合成 → 对口型 → 字幕/动画渲染全流程

适用于 Coze / Dify / 自定义 Agent / MCP
📖 快速开始 🔑 注册接入 📦 MCP服务器

📖 概览

AIOM 智能体API让任何AI Agent(Coze、Dify、自定义Agent等)能够调用AIOM平台的完整视频创作能力。

⚠️ 重要:正确的API地址
REST APIhttps://www.aiom.com.cn/php/agent_api.php
生图APIhttps://www.aiom.com.cn/php/api_image_gen.php
生视频APIhttps://www.aiom.com.cn/php/api_video_gen.php
MCP端点http://47.94.137.152:3100/sse
不要使用 8000/8080 端口! 8000是其他项目,8080未启用。AIOM API全部通过 443(HTTPS) 或 3100(MCP) 访问。
项目
API基础URLhttps://www.aiom.com.cn/php/agent_api.php
认证方式Authorization: Bearer <token>X-API-Key: ak_xxx
请求格式JSON
响应格式JSON
MCP端点http://47.94.137.152:3100/sse

两大创作模式

🎬 口播视频模式

文案 → TTS语音 → 对口型 → 字幕/动画渲染

适合:真人出镜口播、产品介绍、店铺宣传

🎥 AI视频生成模式

文字描述/参考图片 → AI生成视频

适合:创意视频、广告素材、无真人出镜

🔐 认证方式

方式一:商户登录Token(推荐)

智能体先用商户账号密码登录,获取 Bearer token,之后所有请求携带此token。

POST /php/login.php Content-Type: application/json {"identifier": "13800138000", "password": "123456"} → 返回 token,后续请求: Authorization: Bearer <token>

方式二:API Key

适合长期运行的无交互智能体,需在后台创建API Key。

X-API-Key: ak_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
💡 建议:用方式一获取登录token即可调用所有API,无需额外申请API Key。

🔄 完整工作流

智能体按以下步骤依次调用各独立API即可完成完整视频创作:

模式一:口播视频流程

1️⃣ 登录
获取token
2️⃣ 文案
自行生成
3️⃣ 查录音
GET /recordings
4️⃣ TTS
POST /tts
5️⃣ 对口型
POST /lip-sync
6️⃣ 字幕
免费

模式二:AI视频生成流程

1️⃣ 登录
获取token
2️⃣ 生成视频
POST /video-gen
3️⃣ 轮询状态
GET /video-gen/status
4️⃣ 字幕
可选

模式三:带货视频流程

1️⃣ 生图
POST /image-gen
2️⃣ 生视频
POST /video-gen
3️⃣ TTS
POST /tts
4️⃣ 对口型
POST /lip-sync
5️⃣ 字幕
免费

模式四:品牌宣传流程

1️⃣ 生图×N
POST /image-gen
2️⃣ 生视频×N
POST /video-gen
3️⃣ 拼接
POST /video-concat
4️⃣ TTS
POST /tts
5️⃣ 字幕
免费

字幕二选一

📝 普通字幕(无动画)免费

自动ASR识别语音,添加静态白字字幕。无需传文案,简单快速。

POST /subtitle,只需传 video_url

✨ 动画字幕渲染免费

炫酷动画字幕,动态弹出、高亮关键词、配合视觉元素。自动ASR识别,无需传文案。

POST /animate,只需传 video_url

⚠️ 重要:语音合成(TTS)不支持voice_id,必须传audio_url(从录音列表获取的10秒音频样本URL)。

0️⃣ 注册账号 POST

注册AIOM账号,支持手机号或邮箱。注册成功自动登录,返回token可直接使用。

POST/php/register.php
参数类型必填说明
phonestring二选一手机号(11位)
emailstring二选一邮箱(需先调用发送验证码接口)
passwordstring登录密码
shopNamestring店铺/商户名称,不填自动生成
emailCodestring邮箱必填邮箱验证码(6位数字,邮箱注册时必填)

两种注册方式

📱 手机号注册

只需手机号+密码,无需验证码

最快捷的方式

📧 邮箱注册

需先发送验证码 → 输入验证码+密码

两步完成

curl -X POST "https://www.aiom.com.cn/php/register.php" \ -H "Content-Type: application/json" \ -d '{"phone":"13800138000", "password":"mypass123", "shopName":"我的小店"}' → {"code":200, "message":"注册成功", "data":{ "token":"abc123...", "userId":12, "phone":"138****8000", "shopName":"我的小店" }}

0️⃣.5 发送邮箱验证码 POST

向邮箱发送6位验证码,5分钟有效,60秒内只能发一次。邮箱注册前必须先调用此接口。

POST/php/send_email_code.php
参数类型必填说明
emailstring接收验证码的邮箱
typestringregister(默认)或 login
curl -X POST "https://www.aiom.com.cn/php/send_email_code.php" \ -H "Content-Type: application/json" \ -d '{"email":"user@example.com", "type":"register"}' → {"code":200, "message":"验证码已发送,请查收邮件", "data":{"expires_in":300}}

1️⃣ 智能体登录 POST

POST/php/login.php
参数类型必填说明
identifierstring手机号或邮箱
passwordstring登录密码
curl -X POST "https://www.aiom.com.cn/php/login.php" \ -H "Content-Type: application/json" \ -d '{"identifier": "13800138000", "password": "123456"}' → {"code":200, "data":{"token":"a1b2c3d4...", "userId":1, "shopName":"我的店铺"}}

2️⃣ 获取录音列表 GET

获取用户的录音(音色素材)。每条录音包含 audio_url,是约10秒的音频样本,用于TTS的audio_url参数提取音色。

GET/php/agent_api.php/recordings
curl "https://www.aiom.com.cn/php/agent_api.php/recordings" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{"recordings":[ {"id":1, "title":"男声-客服", "audio_url":"https://.../record.mp3", "tags":"男声,客服"} ]}}
💡 流程:先调此接口获取录音列表 → 选一条录音 → 用其 audio_url 调用 TTS

3️⃣ 获取视频列表 GET

获取用户的视频(人物底板素材)。每条视频包含 video_url,用于对口型的 video_url 参数。

GET/php/agent_api.php/videos
curl "https://www.aiom.com.cn/php/agent_api.php/videos" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{"videos":[ {"id":1, "title":"正面半身-西装", "video_url":"https://.../video.mp4", "tags":"正面,西装"} ]}}

3️⃣.5 上传录音 POST 免费

上传一段5-14秒的音频作为TTS音色样本。智能体通过公网URL传入音频文件,无需本地文件上传。每人最多6条录音。

⚠️ 声音克隆必读声明:
录音内容必须朗读以下声明文字,否则声音克隆会失败:
我的声音将用于平台克隆,并合法使用,为自己的行为负责
此声明为创客API V3模型要求,参考音频内容必须与指定文案一致,否则克隆失败。
POST/php/agent_api.php/upload-recording
参数类型必填说明
audio_urlstring音频文件公网URL(mp3/wav/webm,5-14秒,内容必须朗读上述声明文字)
titlestring录音标题,如"男声-客服",方便后续选择
tagsstring标签,逗号分隔,如"男声,客服,温柔"
descriptionstring录音描述,如"适合客服场景的温柔男声"
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/upload-recording" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"audio_url":"https://.../voice.mp3", "title":"男声-客服", "tags":"男声,客服"}' → {"success":true, "data":{"recording_id":5, "url":"https://.../voice.mp3", "title":"男声-客服", "tags":"男声,客服"}}

3️⃣.6 上传视频素材 POST 免费

上传一段人物出镜视频,用于后续对口型。智能体通过公网URL传入视频文件。视频分类:门头/环境/产品/日常。

POST/php/agent_api.php/upload-video
参数类型必填说明
video_urlstring视频文件公网URL(mp4/mov/webm)
video_typestring视频分类:门头 / 环境 / 产品 / 日常
titlestring视频标题,如"正面半身-西装"
tagsstring标签,逗号分隔,如"正面,西装,商务"
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/upload-video" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"video_url":"https://.../clip.mp4", "video_type":"日常", "title":"正面半身-西装", "tags":"正面,西装"}' → {"success":true, "data":{"video_id":3, "video_url":"https://.../clip.mp4", "video_type":"日常", "title":"正面半身-西装"}}

4️⃣ 语音合成(TTS) POST

用10秒音频样本提取音色,将文字转为语音。异步任务,创建后需轮询查询状态。

POST/php/agent_api.php/tts
参数类型必填说明
audio_urlstring音色样本音频URL(从录音列表获取的audio_url,约10秒音频,用于提取音色。不支持voice_id)
textstring要合成的文案内容
speedfloat语速 0.5~2.0,默认1.2(推荐)
pitchfloat音调 0.5~2.0,默认1.0
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/tts" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"audio_url": "https://.../record.mp3", "text": "欢迎光临我们的店铺...", "speed": 1.2}' → {"success":true, "data":{"task_id":"20260515_xxx", "status":"processing"}}
⚠️ 不支持voice_id!TTS只接受audio_url参数(从录音列表获取的10秒音频样本URL),不支持voice_id。

5️⃣ 查询TTS状态 GET

GET/php/agent_api.php/tts/status?task_id=xxx
curl "https://www.aiom.com.cn/php/agent_api.php/tts/status?task_id=20260515_xxx" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{"task_id":"...", "status":"completed", "audio_url":"https://.../voice.mp3"}}
⏱ 轮询建议:每 3~5 秒查询一次,通常 10~30 秒完成。status 为 completed 时 audio_url 即合成音频。

6️⃣ 对口型 POST

音频 + 真人视频 → 对口型视频。audio_url来自TTS合成结果,video_url来自视频列表。异步任务。

POST/php/agent_api.php/lip-sync
参数类型必填说明
audio_urlstring音频URL(来自TTS合成的音频结果)
video_urlstring视频URL(来自视频列表的人物底板视频)
high_qualitybool高清模式,默认true
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/lip-sync" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"audio_url": "https://.../voice.mp3", "video_url": "https://.../video.mp4"}' → {"success":true, "data":{"task_id":"lip_xxx", "status":"processing"}}

7️⃣ 查询对口型状态 GET

GET/php/agent_api.php/lip-sync/status?task_id=xxx
curl "https://www.aiom.com.cn/php/agent_api.php/lip-sync/status?task_id=lip_xxx" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{"status":"completed", "video_url":"https://.../lipsync.mp4"}}
⏱ 轮询建议:对口型通常 1~5 分钟,每 10 秒查询一次。status 为 completed 时 video_url 即成品视频。

8️⃣ 普通字幕添加(无动画)POST 免费

给视频自动识别语音并添加静态白字字幕。无需传文案,自动ASR识别。适用于只需要简单字幕的场景。

POST/php/agent_api.php/subtitle
参数类型必填说明
video_urlstring视频URL(来自lip_sync对口型成品视频URL)
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/subtitle" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"video_url": "https://.../lipsync.mp4"}' → {"success":true, "data":{"video_url":"https://.../subtitled.mp4"}}
💡 说明:同步返回,通常30秒~2分钟(按视频时长)。自动ASR识别语音生成字幕,无需传文案。动画字幕渲染暂不可用,请使用普通字幕。

9️⃣ 动画字幕渲染(有动画效果)POST ⚠️ 待上线

将口播视频渲染为带炫酷动画字幕的成品视频,字幕会随语音动态弹出、高亮关键词、配合视觉元素。自动ASR识别语音生成字幕,无需传文案。异步任务,需轮询状态。

⚠️ 渲染引擎部署中,暂不可用。请使用普通字幕(add_subtitle)替代。

POST/php/agent_api.php/animate
参数类型必填说明
video_urlstring口播视频URL(来自lip_sync对口型成品视频URL)
brand_namestring品牌/店铺名称,默认"品质优选"
templatestring渲染模板,默认merchant-universal

可用模板

模板名说明
merchant-universal万能模板横版16:9(默认,视觉元素随字幕动态生成)
merchant-universal-v万能模板竖版9:16(抖音/短视频比例)
merchant-claude通用商家口播横版16:9
merchant-business商家商务风
personal-ip个人IP口播
storyboard-ai分镜脚本模板
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/animate" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"video_url": "https://.../lipsync.mp4", "brand_name": "老王臭豆腐", "template": "merchant-universal"}' → {"success":true, "data":{"task_id":"task_xxx", "status":"processing", "status_url":"/php/agent_api.php/animate/status?task_id=task_xxx"}}
💡 说明:异步任务,渲染约1~2分钟。请用 get_animate_status 轮询状态,completed 时 video_url 即成品。如果只需要简单静态字幕,请用 add_subtitle,更轻量快速。

🔟 查询动画渲染状态 GET

GET/php/agent_api.php/animate/status?task_id=xxx
curl "https://www.aiom.com.cn/php/agent_api.php/animate/status?task_id=task_xxx" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{"task_id":"task_xxx", "status":"completed", "video_url":"https://.../animated.mp4"}}
⏱ 轮询建议:每 5 秒查询一次,通常 1~2 分钟完成。status 为 completed 时 video_url 即最终成品视频。

🤖 智能体工具箱 NEW

专为AI智能体/AI Agent设计的一站式工具集,解决智能体调用AIOM API时的核心痛点:不会写专业prompt、参数选择困难、缺少最佳实践。

🎯 核心价值:
Prompt Builder:根据场景自动生成专业级摄影/电影prompt(无需专业知识)
Video Presets:6种一键配置方案(抖音/小红书/微信/横幅等)
Image Presets:5种生图预设(电商主图/社交媒体/批量变体等)
降低门槛:从"需要专业知识"→"只需选场景+填产品名"

📝 1. Prompt Builder - 智能Prompt生成器

根据使用场景、产品名称、风格偏好,自动生成经过优化的专业prompt。内置3大场景×3种风格的模板库。

参数类型必填说明示例
typestring生成类型:imagevideoimage
scenariostring使用场景(见下表)ecommerce_product
productstring产品/主体名称(会替换到prompt中)芒果干
stylestring风格:cinematic(默认) / minimal / vibrantvibrant
platformstring目标平台(用于未来优化)douyin

🎬 可用场景列表

场景ID适用类型说明
ecommerce_productimage电商产品图(白底/专业)
social_media_lifestyleimage社交媒体生活化图片
food_beverageimage食品饮料类产品
ecommerce_product_showcasevideo电商产品展示视频
social_media_storyvideo社交媒体故事短视频
brand_introductionvideo品牌介绍/宣传片
GET/php/agent_api.php/prompt-builder?type=image&scenario=ecommerce_product&product=芒果干&style=cinematic
// 请求 curl "https://www.aiom.com.cn/php/agent_api.php/prompt-builder?type=video&scenario=ecommerce_product_showcase&product=芒果干" // 返回 { "success": true, "data": { "prompt": "Slow elegant cinematic push-in motion, 芒果干 gently rotating revealing texture details...", "metadata": { "type": "video", "scenario": "ecommerce_product_showcase", "style": "seedance15pro", "word_count": 245, "optimized_for": "AI video generation (Seedance)", "tips": [ "This prompt is professionally crafted for optimal AI generation results", "Contains technical photography/film terminology" ] }, "alternative_scenarios": ["ecommerce_product_showcase", "social_media_story", ...], "available_styles": ["cinematic", "minimal", "vibrant"] } }

🎬 2. Video Presets - 视频生成预设

6种针对不同平台和用途的一键配置方案,包含模型选择、时长、比例、分辨率、预估成本等完整配置。

预设ID名称平台模型时长比例分辨率预估费用推荐度
douyin_ecommerce_value🔥 抖音电商(高性价比)抖音1.5 Pro8s9:16480p¥2.40⭐⭐⭐⭐⭐
douyin_premium_quality⭐ 抖音精品(高质量)抖音2.010s9:16720p¥12.00⭐⭐⭐⭐
xiaohongshu_lifestyle📕 小红书种草小红书1.5 Pro6s3:4480p¥1.80⭐⭐⭐⭐
wechat_moment💬 微信朋友圈微信1.5 Pro5s1:1720p¥2.50⭐⭐⭐
banner_widescreen🖥️ 横幅Banner网站2.08s21:91080p¥19.20⭐⭐
fast_preview⚡ 快速预览测试2.0 Fast5s16:9480p¥3.00⭐⭐⭐
GET/php/agent_api.php/video-presets
// 返回示例(每个preset包含完整配置) { "success": true, "data": { "presets": [ { "id": "douyin_ecommerce_value", "name": "🔥 抖音电商(高性价比)", "description": "电商产品展示首选,性价比最高...", "suitable_for": ["电商产品展示", "零食/食品带货"], "platform": "douyin_tiktok", "config": { "model": "seedance15pro", "duration": 8, "ratio": "9:16", "resolution": "480p", "estimated_cost": 2.40, "quality_score": 85 }, "pros": ["成本最低", "支持首帧控制", "生成速度快"], "cons": ["分辨率限制480p", "时长最大12秒"], "popularity": 0.92, "recommended": true }, // ... 其他5个预设 ], "total": 6, "usage_tip": "使用preset ID调用 POST /video-gen 时传入 preset 参数" } }

📸 3. Image Presets - 生图预设

5种常见生图场景的标准化配置,包含模式、尺寸、数量和prompt模板。

预设ID名称模式尺寸数量预估费用推荐度
ecommerce_product_hero🛍️ 电商主图(白底)text2img1:11张¥0.28⭐⭐⭐⭐⭐
lifestyle_context✨ 场景 lifestyletext2img4:31张¥0.28⭐⭐⭐⭐
social_media_square📱 社交媒体(方图)text2img1:11张¥0.28⭐⭐⭐⭐
batch_variations🎨 批量变体(多角度)text2imgauto4张¥1.12⭐⭐⭐
seasonal_festive🎄 节日氛围(主题)text2img3:41张¥0.28⭐⭐⭐
GET/php/agent_api.php/image-presets
💡 智能体集成工作流(推荐):

// Step 1: 获取Prompt
const promptResp = await fetch('/php/agent_api.php/prompt-builder?type=video&scenario=ecommerce_product_showcase&product=芒果干');
const { prompt } = await promptResp.json();

// Step 2: 获取Preset配置
const presetResp = await fetch('/php/agent_api.php/video-presets');
const { presets } = await presetResp.json();
const config = presets.find(p => p.id === 'douyin_ecommerce_value').config;

// Step 3: 提交任务(使用自动生成的prompt + 预设配置)
const taskResp = await fetch('/php/agent_api.php/video-gen', {
  method: 'POST',
  body: JSON.stringify({ ...config, prompt })
});

// Step 4: 轮询状态直到完成
while (true) { const status = await fetch(`/video-gen/status?task_id=${taskId}`); ... }

🧠 专家系统 NEW GET

专为小商家设计的AI专家团队,智能体不需要懂摄影/视频/文案,只需根据商家需求选择对应专家,按照配方执行即可交付专业级成果。

🎯 核心价值:
降低智能体门槛:智能体不需要专业知识,选专家→拿配方→照做
专业prompt自动生成:配方里的prompt是专业级摄影/电影术语
模型/参数已配好:不会选错模型、不会传错参数
步骤间引用:上一步的结果自动成为下一步的输入
免认证:查看专家和配方不需要API Key

5个专家角色

专家ID名称解决什么痛点适合商家费用
product_photographer🛍️ 产品摄影师手机拍的产品图不好看,影响转化率电商卖家、抖音小店、拼多多、微商¥0.28/张
video_director🎬 视频导演不会拍视频、不会剪辑、没设备抖音带货、小红书种草、视频号推广¥2.40起
content_planner📝 内容策划师不知道发什么内容,缺乏创意所有需要做内容营销的商家免费
copywriter📢 文案高手标题/描述/标签不会写,没流量抖音/小红书/淘宝商家免费
ad_designer🎨 广告设计师大促/节日需要专题图,不会设计参加大促活动的商家、节日营销¥0.28/张
GET/php/agent_api.php/experts
💡 免认证端点 — 不需要API Key即可访问,方便智能体先了解有哪些专家可用
// 请求 curl "https://www.aiom.com.cn/php/agent_api.php/experts" // 返回 { "success": true, "data": { "experts": [ { "id": "product_photographer", "name": "🛍️ 产品摄影师", "tagline": "手机拍的产品图太丑?我来帮你出专业级产品图", "target_merchant": "电商卖家、抖音小店、拼多多商家、微商", "pain_point": "商家没有专业摄影设备,手机拍的产品图不好看,影响转化率", "capabilities": ["白底主图", "场景图", "批量变体", "节日氛围图"], "recommended_api": "POST /php/api_image_gen.php?action=generate", "recommended_preset": "ecommerce_product_hero", "example_workflow": [ "1. 调用 /agent_api/prompt-builder?type=image&scenario=ecommerce_product&product={产品名}", "2. 调用 /agent_api/image-presets 获取 preset 配置", "3. 调用 /php/api_image_gen.php?action=generate 生成图片", "4. 轮询 /php/api_image_gen.php?action=status 获取结果" ], "estimated_cost": "¥0.28/张", "estimated_time": "2-3分钟/张" }, // ... 其他4个专家 ], "total": 5, "usage_guide": "智能体应根据商家需求选择对应专家,按照 example_workflow 中的步骤调用API完成交付" } }

📋 专家配方 NEW GET

照着做就行的一站式执行清单。智能体不需要自己思考流程,配方里每一步的API、参数、prompt都已配好,只需填入实际值按序执行。

5种配方

配方ID名称步骤数总费用总耗时说明
product_photo🛍️ 产品摄影套餐2步¥0.564-6分钟白底主图 + 场景图
promo_video🎬 产品推广视频2步¥2.685-11分钟产品图 → 用图生视频
content_plan📝 内容策划套餐1步免费即时生成专业提示词
ad_poster🎨 广告海报套餐1步¥0.282-3分钟节日氛围产品图
full_package🎁 全案套餐3步¥2.967-14分钟产品图 + 场景图 + 推广视频

请求参数

参数类型必填说明示例
needstring配方ID:product_photo / promo_video / content_plan / ad_poster / full_packagepromo_video
productstring产品名称(会自动填入prompt)茶叶
platformstring目标平台:douyin(默认) / xiaohongshu / wechatxiaohongshu
budgetnumber预算上限(元),超预算会返回警告,默认105
GET/php/agent_api.php/expert-recipe?need=promo_video&product=茶叶&platform=douyin
// 请求:获取"茶叶推广视频"配方 curl "https://www.aiom.com.cn/php/agent_api.php/expert-recipe?need=promo_video&product=茶叶" // 返回 { "success": true, "data": { "expert": "video_director", "title": "产品推广视频套餐", "description": "用产品图生成抖音带货短视频", "steps": [ { "step": 1, "action": "生成产品展示图(作为视频首帧)", "api": "POST /php/api_image_gen.php?action=generate", "params": { "prompt": "Professional product photography of 茶叶, studio softbox lighting, shallow depth of field, warm golden hour tones, 8k", "mode": "text2img", "size": "9:16", "quantity": 1, "notify_url": "{YOUR_CALLBACK_URL}" }, "estimated_cost": 0.28, "estimated_time": "2-3分钟" }, { "step": 2, "action": "用产品图生成推广视频", "api": "POST /php/agent_api.php/video-gen", "params": { "model": "seedance15pro", "prompt": "Slow elegant cinematic push-in motion, 茶叶 gently rotating revealing texture details, warm golden hour lighting, smooth slow-motion, professional commercial showcase", "first_frame_url": "{STEP1_RESULT_IMAGE_URL}", "duration": 8, "ratio": "9:16", "resolution": "480p" }, "estimated_cost": 2.40, "estimated_time": "3-8分钟" } ], "total_cost": 2.68, "total_time": "5-11分钟" } }
🎯 智能体使用流程(3步走):

Step 1:调 GET /experts 查看有哪些专家 → 根据商家需求选一个
Step 2:调 GET /expert-recipe?need=xxx&product=xxx 获取配方
Step 3:按配方步骤依次调API,填入实际值({YOUR_CALLBACK_URL}填回调地址,{STEP1_RESULT_IMAGE_URL}填上一步返回的图片URL)
⚠️ 占位符说明:
{YOUR_CALLBACK_URL} — 你的回调通知地址,任务完成后AIOM会POST推送结果
{STEP1_RESULT_IMAGE_URL} — 上一步返回的图片URL,作为下一步的输入
• 配方中的prompt已包含产品名,无需手动修改

1️⃣1️⃣ AI视频生成 POST

用文字描述或参考图片生成视频。支持两个模型,异步任务,创建后需轮询查询状态。

⚠️ 并发限制与模型选择(重要):
所有模型并发数:3 - Seedance 2.0 / 1.5 Pro 同时最多处理3个任务
Seedance 1.5 Pro ⭐ 推荐:性价比最高(480p仅0.3元/秒),支持首帧/尾帧控制,适合电商产品视频
Seedance 2.0:全能型,支持多模态参考(图片+视频+音频),适合复杂创意视频
参数可调:duration(时长)、ratio(比例)、resolution(分辨率)都可通过API参数调整
POST/php/agent_api.php/video-gen

通用参数

参数类型必填说明
promptstring视频描述文字(描述想要生成的视频内容)
modelstring模型:seedance2(默认)或 seedance15pro
durationint视频时长(秒):seedance2范围1-15默认5,seedance15pro范围2-12默认5
ratiostring画面比例:16:9(默认)/ 9:16 / 1:1
resolutionstring分辨率:720p(默认)/ 480p

Seedance 1.5 Pro 专属参数

Seedance 1.5 Pro 的特色是支持首帧/尾帧图片,可以精确控制视频的起止画面。

参数类型必填说明
first_frame_urlstring首帧图片URL(控制视频起始画面)
last_frame_urlstring尾帧图片URL(控制视频结束画面,需配合first_frame_url使用)

Seedance 2.0 专属参数

参数类型必填说明
ref_image_urlstring参考图片URL(作为参考素材)
ref_video_urlstring参考视频URL(作为参考素材)
ref_audio_urlstring参考音频URL(作为参考素材)

模型对比

Seedance 2.0

支持参考视频和音频,时长1-15秒

480p: 0.8元/秒 · 720p: 1.2元/秒

Seedance 1.5 Pro ⭐

支持首帧/尾帧图片控制,时长2-12秒

480p: 0.3元/秒 · 720p: 0.5元/秒

性价比更高

请求示例

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/video-gen" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{ "prompt": "一只小猫在阳光下打盹", "model": "seedance15pro", "duration": 5, "ratio": "16:9", "resolution": "720p", "first_frame_url": "https://.../cat.jpg" }' → {"success":true, "data":{ "task_id":"vg_xxx", "status":"processing", "cost":2.5, "model":"seedance15pro", "message":"Video generation task created, use GET /video-gen/status?task_id=... to poll" }}
💡 提示:Seedance 1.5 Pro 支持首帧+尾帧图片,可以精确控制视频的起始和结束画面,适合制作有明确起止构图的创意视频。

1️⃣2️⃣ 查询视频生成状态 GET

GET/php/agent_api.php/video-gen/status?task_id=xxx
curl "https://www.aiom.com.cn/php/agent_api.php/video-gen/status?task_id=vg_xxx" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{ "task_id":"vg_xxx", "status":"succeeded", "video_url":"https://.../generated.mp4", "message":"Video generation completed! video_url is the final video URL" }}
⏱ 轮询建议:每 5~10 秒查询一次,通常 1~5 分钟完成。status 为 succeeded 时 video_url 即最终成品视频。

🔥 Seedance 2.0 全能参考视频生成 POST GET

Seedance 2.0 是字节跳动最新AI视频生成模型,全能参考模式是其最强大的能力——同时接受图片、视频、音频作为参考素材,模型综合所有参考生成新视频。

💡 核心卖点:全能参考模式比纯文生视频便宜42%!
提供参考素材时,单价仅 ¥0.70/秒(纯文生 ¥1.20/秒)。因为含视频输入的API调用成本更低,我们把节省全部让利给用户。

端点一览

操作方法URL说明
查看能力GET/php/agent_api.php/seedance?action=capabilities返回模型能力、定价、示例
计算价格GET/POST/php/agent_api.php/seedance?action=price根据参数计算视频费用
生成视频POST/php/agent_api.php/seedance创建视频生成任务
查询状态GET/php/agent_api.php/seedance?action=status&task_id=xxx查询任务状态和视频URL

定价

模式标准模型快速模型说明
🔥 全能参考(有参考素材)¥0.70/秒¥0.42/秒提供了图片/视频/音频中的至少一种
纯文生视频(无参考素材)¥1.20/秒¥0.72/秒仅文字描述,无参考素材

参考素材限制

素材类型最大数量角色(role)说明
参考图片 ref_images9张reference_image风格/人物/场景参考
参考视频 ref_videos3个reference_video动作/风格参考(总时长≤15秒)
参考音频 ref_audios3个reference_audio语音/音乐/音效参考
首帧图 first_frame1张first_frame视频第一帧图片
尾帧图 last_frame1张last_frame视频最后一帧图片

生成视频 - 请求参数

POST/php/agent_api.php/seedance
参数类型必填说明
promptstring与参考素材二选一视频描述文字
ref_imagesstring[]参考图片URL数组,最多9张
ref_videosstring[]参考视频URL数组,最多3个
ref_audiosstring[]参考音频URL数组,最多3个
first_framestring首帧图片URL
last_framestring尾帧图片URL
durationint视频时长(2-15秒),默认5
ratiostring画面比例:1:1/4:3/16:9/9:16/21:9/adaptive,默认16:9
modelstringseedance2(标准) / seedance2-fast(快速)
generate_audiobool是否生成音频,默认true
watermarkbool是否加水印,默认false

请求示例

示例1:纯文生视频

POST /php/agent_api.php/seedance Authorization: Bearer YOUR_TOKEN { "prompt": "一只金毛犬在麦田中奔跑,阳光明媚,电影级运镜", "duration": 5, "ratio": "16:9" } // 费用:5秒 × ¥1.20 = ¥6.00

示例2:图生视频(首帧)

POST /php/agent_api.php/seedance Authorization: Bearer YOUR_TOKEN { "prompt": "人物缓缓走向镜头,微笑", "first_frame": "https://example.com/character.jpg", "duration": 5 } // 费用:5秒 × ¥0.70 = ¥3.50(有参考素材,省42%)

示例3:🔥 全能参考模式(图片+视频+音频)

POST /php/agent_api.php/seedance Authorization: Bearer YOUR_TOKEN { "prompt": "人物用参考音频的语气说话,风格参考图片,动作参考视频", "ref_images": ["https://example.com/style1.jpg", "https://example.com/character.jpg"], "ref_videos": ["https://example.com/motion_ref.mp4"], "ref_audios": ["https://example.com/voice.mp3"], "duration": 10, "ratio": "16:9" } // 费用:10秒 × ¥0.70 = ¥7.00(全能参考模式,最划算)

响应示例

{ "success": true, "data": { "task_id": "cgt-2026xxxx-xxxx", "order_no": "V202605241234567890", "mode": "reference", "model": "seedance2", "duration": 10, "cost": 7.00, "unit_price": 0.70, "balance_remaining": 99971.80, "ref_count": 4, "tip": "All-reference mode active - 42% cheaper than text-only!" }, "message": "Video generation task created" }

💰 视频价格计算 GET

GET/php/agent_api.php/seedance?action=price

在生成前先计算费用,避免余额不足。

GET /php/agent_api.php/seedance?action=price Content-Type: application/json { "prompt": "test", "ref_images": ["https://example.com/img.jpg"], "duration": 10, "model": "seedance2" } // 响应: { "success": true, "data": { "duration": 10, "unit_price": 0.70, "total": 7.00, "mode": "reference", "model": "seedance2" } }

📊 查询视频任务状态 GET

GET/php/agent_api.php/seedance?action=status&task_id=xxx
// 任务进行中 { "success": true, "data": { "task_id": "cgt-2026xxxx", "status": "running", "model": "doubao-seedance-2-0-260128", "duration": 10, "resolution": "720p", "ratio": "16:9" } } // 任务完成 { "success": true, "data": { "task_id": "cgt-2026xxxx", "status": "succeeded", "video_url": "https://xxx.volces.com/xxx.mp4", "duration": 10, "resolution": "1080p", "ratio": "16:9", "usage": { "completion_tokens": 308880, "total_tokens": 308880 } } } // 任务失败(自动退款) { "success": true, "data": { "task_id": "cgt-2026xxxx", "status": "failed", "error": "Content policy violation", "refunded": true, "refund_amount": 7.00 } }
提示:视频生成通常需要1-3分钟。建议每30秒轮询一次状态。失败任务会自动退款到余额。

1️⃣3️⃣ AI生图(image2) POST

用文字描述或参考图片生成图片。支持文生图和图生图两种模式。异步任务,创建后需轮询查询状态。

✨ 新功能(2026-05-29):
自动入库:生成成功后自动保存到 images 表(带3次重试机制,并发安全)
状态查询:新增 GET /php/api_image_gen.php?action=status&task_id=xxx 简化版查询接口
🚀 回调通知:新增 notify_url 参数,任务完成后立即推送结果给智能体(延迟从5-7分钟→<1秒!)
完整闭环:提交 → (自动回调 or 轮询status)→ 拿到URL → 下载/使用
⚡ 性能提升(重要):
之前:智能体轮询等待 5-7 分钟才能收到结果 ❌
现在:提供 notify_url 后,任务完成**立即推送**(<1秒)✅
推荐:所有智能体务必传入 notify_url 参数以获得最佳体验
⚠️ 并发限制(重要):
生图并发数:2 - 同时最多处理2个生图任务,超出需排队等待
单次最大数量:4张 - quantity 参数范围 1~4,建议单次1-2张以保证速度
推荐策略:智能体应控制并发,每完成一个再提交下一个,避免排队超时
POST/php/api_image_gen.php?action=generate
参数类型必填说明
promptstring图片描述文字(描述想要生成的图片内容)
modestring生成模式:text2img(文生图,默认)或 img2img(图生图)
imagesarray参考图片数组(图生图模式必填,支持URL或base64 DataURL)
sizestring图片尺寸,默认auto
quantityint生成数量 1~4,默认1
modelstring模型,默认image2
notify_urlstring⭐推荐回调通知URL(任务完成后立即POST推送结果,解决5-7分钟延迟问题)

🚀 回调通知机制详解(新增)

为什么需要 notify_url?

没有 notify_url(旧方式):
  • 智能体必须主动轮询 status 接口
  • 轮询间隔不确定,可能 5-10 秒一次
  • 网络波动可能导致轮询失败
  • 结果:平均延迟 5-7 分钟

有 notify_url(新方式):
  • 任务完成瞬间,服务器主动调用你的 URL
  • 立即 POST 推送完整结果数据
  • 无需轮询,无需等待
  • 结果:延迟 < 1 秒!

📥 回调数据格式

// 任务成功时服务器会 POST 到你的 notify_url: { "event": "image_gen.completed", "timestamp": "2026-05-29T16:11:51+08:00", "task_id": "gpt-image2-image_xxx", "status": "success", "image_url": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png", "images": [ { "url": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png", "thumbnail": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png" } ] } // 任务失败时: { "event": "image_gen.completed", "timestamp": "2026-05-29T16:11:51+08:00", "task_id": "gpt-image2-image_xxx", "status": "failed", "error": "生成超时", "refund": true }

💡 智能体集成示例(使用回调)

// Step 1: 提交任务时传入 notify_url const response = await fetch('https://www.aiom.com.cn/php/api_image_gen.php?action=generate', { method: 'POST', headers: { 'Content-Type': 'application/json', 'Authorization': 'Bearer ' }, body: JSON.stringify({ prompt: '芒果干产品展示', mode: 'text2img', quantity: 1, notify_url: 'https://your-server.com/callback/image-gen' // ← 关键参数! }) }); const { task_id } = await response.json(); // Step 2: 设置 Webhook 监听器(Express.js 示例) app.post('/callback/image-gen', (req, res) => { const data = req.body; console.log('🎉 收到图片生成完成通知:', data.task_id); console.log(' 图片URL:', data.image_url); console.log(' 延迟:', Date.now() - new Date(data.timestamp).getTime(), 'ms'); // 立即处理结果(无需轮询!) if (data.status === 'success') { downloadAndProcessImage(data.image_url); } res.sendStatus(200); // 必须返回200确认收到 }); // ✅ 结果:任务完成后 <1秒 内就能收到通知! // 对比:之前需要轮询 5-7 分钟

两种模式

📝 文生图 (text2img)

纯文字描述生成图片

只需传 prompt

🖼️ 图生图 (img2img)

参考图片 + 文字描述生成新图片

需传 prompt + images

请求示例

curl -X POST "https://www.aiom.com.cn/php/api_image_gen.php?action=generate" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{ "prompt": "一只橘猫戴着墨镜坐在咖啡厅", "mode": "text2img", "quantity": 1, "size": "auto" }' → {"success":true, "task_id":"xxx", "quantity":1, "cost_amount":0.28, "unit_price":0.28, "balance_remaining":99.72, "status":"pending", "message":"任务已创建,正在生成..."}
⚠️ 认证:此接口需要 Bearer token 登录认证(不支持 API Key),需先调用登录接口获取 token。

1️⃣4️⃣ 查询生图状态 GET

方式一:完整查询(原接口)

GET/php/api_image_gen.php?action=query&task_id=xxx
curl "https://www.aiom.com.cn/php/api_image_gen.php?action=query&task_id=xxx" \ -H "Authorization: Bearer <token>" → {"success":true, "status":"success", "task_id":"xxx", "images":[{"url":"https://.../img1.png","thumbnail":"https://.../img1.png"}], "balance_remaining":99.72}

方式二:简化查询(推荐智能体使用)✨

🎯 推荐给智能体/AI Agent 使用:
返回标准化的状态码和图片URL,更适合程序化轮询。
GET/php/api_image_gen.php?action=status&task_id=xxx
curl "https://www.aiom.com.cn/php/api_image_gen.php?action=status&task_id=xxx" \ -H "Authorization: Bearer <token>" → { "success": true, "data": { "task_id": "image_4a28f02d-xxxx", "status": 2, "image_url": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png", "created_at": "2026-05-29 14:33:39", "updated_at": "2026-05-29 14:34:46" } }
状态码含义说明
0pending待处理,继续轮询
1processing处理中,继续轮询
2success✅ 成功,image_url 可用
-1failed❌ 失败,费用已退回
⏱ 轮询建议:每 3~5 秒查询一次,通常 10~30 秒完成。status 为 2(success)时 image_url 即生成的图片。生成失败自动退回余额。
💡 智能体集成示例:
// 1. 提交任务 → 获得 task_id
// 2. 循环调用 /action=status?task_id=xxx
// 3. 当 status === 2 时,取 data.image_url 使用
// 4. 即使 images 表偶尔入库失败,也能通过此接口拿到URL

1️⃣5️⃣ 视频拼接 POST 同步

将多段视频按顺序拼接成一段完整视频。适用于品牌宣传片多片段拼接、多角度展示拼接等场景。同步接口,直接返回结果,无需轮询。

POST/php/agent_api.php/video-concat
参数类型必填说明
video_urlsarray[string]视频URL数组,2-10个,按顺序拼接
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/video-concat" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"video_urls": ["https://oss.../clip1.mp4", "https://oss.../clip2.mp4", "https://oss.../clip3.mp4"]}' → {"success":true, "data":{ "video_url": "http://mathmind-files.oss.../merged.mp4", "download_url": "http://mathmind-files.oss.../merged.mp4?attachment=1", "task_id": "xxx" }, "message": "拼接成功"}
⚠️ 注意:同步接口,直接返回结果。视频URL必须公网可访问,单文件 < 30MB,总数 ≤ 10 个。

1️⃣6️⃣ 视频裁剪 POST 同步

按百分比截取视频片段。适用于截取精华片段、去掉开头结尾等场景。同步接口,直接返回结果,无需轮询。

POST/php/agent_api.php/video-cut
参数类型必填说明
video_urlstring原视频URL
start_percentint开始位置百分比(0-100),默认0
end_percentint结束位置百分比(0-100),默认100
curl -X POST "https://www.aiom.com.cn/php/agent_api.php/video-cut" \ -H "Authorization: Bearer <token>" \ -H "Content-Type: application/json" \ -d '{"video_url": "https://oss.../original.mp4", "start_percent": 20, "end_percent": 60}' → {"success":true, "data":{ "video_url": "http://mathmind-files.oss.../trimmed.mp4", "download_url": "http://mathmind-files.oss.../trimmed.mp4?attachment=1", "task_id": "xxx" }, "message": "裁剪成功"}
💡 说明:start_percent 和 end_percent 是百分比,不是秒数。例:30秒视频,start=20, end=60 → 截取第6秒到第18秒。

1️⃣7️⃣ 提示词模板查询 GET

按场景和行业获取生图prompt、生视频prompt、文案模板。智能体做视频前先调用此接口获取对应行业的提示词模板,填入方括号内容即可直接使用。

GET/php/agent_api.php/prompt-templates?scene=promo&industry=零食
参数类型必填说明
scenestring场景:promo(带货视频) / oral(口播视频) / showcase(产品展示) / brand(品牌宣传)。不传返回所有场景概览
industrystring行业:零食 / 餐饮 / 美妆 / 服装 / 3C数码 / 饮品。不传返回该场景所有行业
💡 MCP工具:智能体通过 MCP 调用 get_prompt_templates 工具获取模板,无需走 HTTP API。

📁 查询全部素材 GET

GET/php/agent_api.php/resources
curl "https://www.aiom.com.cn/php/agent_api.php/resources" \ -H "Authorization: Bearer <token>" → {"success":true, "data":{ "recordings": [{"id":1, "title":"男声-客服", "audio_url":"https://...", "tags":"男声,客服"}], "videos": [{"id":1, "title":"正面半身", "video_url":"https://...", "tags":"正面,西装"}] }}

💳 查询余额与套餐 GET

查询用户余额、当前套餐单价、今日/累计使用量。

GET/php/api_img_credits.php?action=balance
curl "https://www.aiom.com.cn/php/api_img_credits.php?action=balance" \ -H "Authorization: Bearer <token>" → {"success":true, "balance":99.72, "tier":"vip", "tier_name":"VIP会员", "unit_price":0.28, "today_used":3, "total_used":15, "total_cost":4.20}

其他操作

action说明
balance查询余额、套餐、使用量(需登录)
pricing查询充值套餐列表和模型单价(无需登录)
orders查询生图订单历史(需登录,分页)
GET /php/api_img_credits.php?action=pricing GET /php/api_img_credits.php?action=orders&page=1

📋 查询TTS合成记录 GET

获取用户的语音合成历史记录,包含合成状态和音频URL。

GET/php/get_voice_synthesis.php
curl "https://www.aiom.com.cn/php/get_voice_synthesis.php" \ -H "Authorization: Bearer <token>" → {"success":true, "records":[ {"id":1, "task_id":"xxx", "status":1, "status_text":"成功", "chuangke_url":"https://.../voice.mp3", "created_at":"2026-05-22 14:30"} ]}
💡 说明:status: 0=进行中, 1=成功, 2=失败。保留最近30天记录。

🔌 MCP服务接入

AIOM 提供 MCP (Model Context Protocol) 服务,支持智能体通过标准MCP协议连接。

端点URL
SSE连接http://47.94.137.152:3100/sse
健康检查http://47.94.137.152:3100/health

MCP 工具列表

工具名说明费用
register注册AIOM账号(手机号/邮箱)免费
send_email_code发送邮箱验证码免费
get_recordings获取录音列表(audio_url用于TTS)免费
get_videos获取视频列表(video_url用于对口型)免费
upload_recording上传录音(音色素材,公网URL)免费
upload_video上传视频素材(公网URL)免费
voice_synthesis语音合成TTS(需audio_url,不支持voice_id)按量
lip_sync对口型2元/分钟
add_subtitle普通字幕(无动画,自动ASR)免费
animate_render动画字幕渲染(炫酷动画效果)免费
get_animate_status查询动画渲染状态免费
generate_videoAI视频生成(Seedance 2.0 / 1.5 Pro)按时长
query_video_status查询视频生成状态免费
generate_imageAI生图(image2 文生图/图生图)按张
query_image_status查询生图状态免费
get_experts获取专家团队列表(免认证)免费
get_expert_recipe获取专家执行配方(免认证)免费
{ "mcpServers": { "aiom": { "url": "http://47.94.137.152:3100/sse", "headers": { "Authorization": "Bearer <token>" } } } }

💰 计费说明

功能计费方式会员价游客价
对口型按视频时长(秒)2元/分钟2元/分钟
普通字幕免费免费免费
动画字幕渲染免费免费免费
语音合成(TTS)按次数按第三方API消耗
AI生图(image2)按张数0.28元/张0.5元/张
Seedance 2.0按时长(秒)480p 0.8元/秒 · 720p 1.2元/秒
Seedance 1.5 Pro按时长(秒)480p 0.3元/秒 · 720p 0.5元/秒

计费公式

对口型:费用 = (视频秒数 ÷ 60) × 2 例:30秒 = 1.00元 · 60秒 = 2.00元 · 120秒 = 4.00元 AI生图:费用 = 单价 × 张数 会员:0.28 × 1 = 0.28元 · 游客:0.5 × 1 = 0.5元 视频生成:费用 = 每秒单价 × 时长 Seedance 1.5 Pro 720p 5秒 = 0.5 × 5 = 2.50元
💡 说明:生成失败自动退回余额,不会扣费。累计消费满99元自动升级VIP生图单价。

❓ 常见问题

Q: TTS为什么不能用voice_id?

AIOM的TTS采用"10秒音频样本提取音色"的方式,不支持voice_id。请先调用 GET /recordings 获取录音列表,用录音的 audio_url 作为TTS的音色来源。

Q: 普通字幕和动画字幕渲染怎么选?

普通字幕(add_subtitle):自动ASR识别,无需传文案,简单快速,适合只需要基础字幕的场景。
动画字幕渲染(animate_render):炫酷动画效果,自动ASR识别无需传文案,适合需要视觉冲击力的营销视频。两者都免费。

Q: 对口型视频URL从哪里获取?

调用 GET /videos 获取用户的视频列表,选一条取其 video_url

Q: 生成失败会扣费吗?

不会。任务失败自动退款。

Q: 动画字幕渲染完成后视频URL在哪?

轮询 GET /animate/status?task_id=xxx,status 为 completed 时返回的 video_url 就是成品视频地址(OSS直链)。

1️⃣5️⃣ 上传图片素材 POST

上传图片素材,供Seedance 2.0全能参考模式使用。图片是推"全能参考"的前提——没有图片上传,ref_images智能体没图可用。

POST/php/agent_api.php/upload-image
参数类型必填说明
image_urlstring必填图片公网URL
titlestring必填图片标题,如"芒果干包装图"
image_typestring必填图片类型:product(产品)/storefront(门头)/environment(环境)/other(其他)
tagsstring标签,如"零食,芒果"
POST /php/agent_api.php/upload-image Authorization: Bearer YOUR_TOKEN { "image_url": "https://example.com/mango.jpg", "title": "芒果干包装图", "image_type": "product", "tags": "零食,芒果" } // 响应 { "success": true, "data": { "image_id": 1, "image_url": "https://example.com/mango.jpg", "title": "芒果干包装图", "image_type": "product", "tags": "零食,芒果" }, "message": "Image uploaded successfully" }

1️⃣6️⃣ 获取图片列表 GET

GET/php/agent_api.php/images

获取用户上传的所有图片素材。支持按 image_type 过滤。

GET /php/agent_api.php/images Authorization: Bearer YOUR_TOKEN // 按类型过滤 GET /php/agent_api.php/images?image_type=product // 响应 { "success": true, "data": { "images": [ { "id": 1, "title": "芒果干包装图", "image_url": "...", "image_type": "product", "tags": "零食,芒果" } ], "count": 1 } }

🤖 智能体快速指南

如果你是第一次使用AIOM的智能体,按这个流程走就能帮商家做出宣传片。

第一步:了解你的主人

第一次跟主人对话时,自然地了解以下信息,记下来以后不用再问。

必须知道:

  • 店铺叫什么?→ 视频里要出现品牌名
  • 做什么行业的?→ 决定视觉风格和话术
  • 想宣传什么?→ 决定画面拍什么

问了效果更好的:

  • 客群是谁?→ 附近居民=接地气,年轻人=清新,上班族=干净利落
  • 想突出的卖点?→ 写进视频开头钩子,如"纯手工""进口的""三十年老店"
  • 想要什么感觉?→ 高级感/温暖接地气/热闹促销/清新文艺

防止翻车:

  • 有什么不能出现的?→ 如零食店不喊价、餐饮店不用"最"字
  • 店铺地址?→ 视频结尾引导用
💡 不用一次问完,主人说"帮我做个芒果干广告",你就知道行业=零食、产品=芒果干,补问一两个就够了。

第二步:按行业选风格

不同行业的视频风格完全不同:

行业画面色调话术
零食/食品产品特写,暖光,食欲感暖黄、橙色选品故事、真实体验,软营销不喊价
餐饮/小吃制作过程、热气腾腾暖色、红色烟火气、"每天现做"
美容/护肤干净高级、质感摆拍白、粉、金效果对比、成分故事
服装/穿搭穿搭场景、生活化按季节穿搭建议、场景代入
水果/生鲜新鲜水润、色彩饱满跟水果走新鲜、产地、时令
其他服务工作场景、专业工具蓝、灰专业靠谱、省心省力

第三步:选择创作模式

模式A:AI宣传片(推荐,无需真人素材)

适合所有商家,特别是新店、没有真人出镜素材的。

完整流程:

  1. 上传产品图片(如有)
    POST /upload-image → 获得 image_url
  2. AI生图(可选,没有产品图时先生成一张)
    POST /image-gen,prompt = 按行业风格 + 产品描述
    → 轮询 /image-gen/status 获得图片URL
  3. AI生视频
    POST /video-genPOST /seedance
    方案一(有产品图,推荐):用Seedance 1.5 Pro + 首帧图片
    {"prompt":"手缓慢拿起芒果干撕开,特写镜头推进,暖黄自然光","model":"seedance15pro","first_frame_url":"图片URL","duration":5,"resolution":"480p","ratio":"9:16"}
    方案二(有产品图要参考,不锁定画面):用Seedance 2.0全能参考
    {"prompt":"芒果干产品展示,温暖食欲感,特写镜头","ref_images":["产品图URL"],"duration":5,"ratio":"9:16"}
    💰 全能参考模式 ¥0.70/秒,比纯文生便宜42%!
    方案三(没有图片):纯文字生成
    {"prompt":"厚实的芒果干铺在木桌上,手缓慢拿起一片撕开,暖黄自然光,食物摄影风格","duration":5,"ratio":"9:16"}
    → 轮询 /video-gen/status/seedance?action=status 获得视频URL
  4. 重复2-3生成3-5个片段(可选)
  5. 告诉主人:视频片段已生成

模型选择建议:

场景推荐模型价格理由
日常商家宣传片Seedance 1.5 Pro¥0.30/秒(480p)性价比最高,支持首帧图控制画面
需要参考图/视频/音频🔥 Seedance 2.0 全能参考¥0.70/秒(720p)全能参考,效果最好
不在乎价格要最好的Seedance 2.0¥0.70-1.20/秒最新模型,效果最佳

模式B:对口型口播视频(需要真人素材)

适合有真人出镜视频和录音的商家。

  1. 查素材:GET /resources
  2. 写文案(根据行业风格模板)
  3. TTS:POST /tts(用主人的录音audio_url)
  4. 对口型:POST /lip-sync
  5. 字幕:POST /subtitle
💡 两种模式可以组合:AI生成的产品视频 + 老板口播片段,拼接后效果更好。

提示词公式

生图prompt = 产品 + 场景 + 光线 + 风格 + 配色

示例:"厚实的芒果干铺在木桌上,自然光,暖黄色调,旁边放几片新鲜芒果,食物摄影风格"

生视频prompt = 生图描述 + 动作/变化 + 镜头运动

示例:"手缓慢拿起一片厚实的芒果干撕开,果肉拉丝质感,特写镜头缓缓推进,暖黄自然光"

常见翻车点

问题怎么避免
生图太假像AIprompt加"自然光""真实质感""食物摄影风格"
生视频画面乱动加"缓慢""特写""稳定画面"
文案不像老板说的用口语:"我吃了三包停不下来" > "品质上乘"
视频太长15-30秒最好,一个卖点讲透
结尾太硬"导航就在左下角" > "快来购买吧"

完整示例:味蕾乐芒果干宣传片

主人说:"帮我做个芒果干广告"

智能体判断:行业=零食,产品=芒果干,风格=暖黄食欲感

确认:"这个芒果干有什么特别的?" → "菲律宾进口的,很厚实"

确认:"想要接地气还是高级一点?" → "接地气"

# 1. 先生产品图 POST /php/agent_api.php/image-gen { "prompt": "厚实的菲律宾芒果干铺在木桌上,自然光,暖黄色调,食物摄影风格", "quantity": 1, "size": "auto" } # 2. 等图片生成完成,用图片做首帧生视频 POST /php/agent_api.php/video-gen { "prompt": "手缓慢拿起一片厚实的芒果干撕开,果肉拉丝质感,特写镜头缓缓推进,暖黄自然光", "model": "seedance15pro", "first_frame_url": "{图片URL}", "duration": 5, "resolution": "480p", "ratio": "9:16" } # 3. 再生成一个片段(包装展示) POST /php/agent_api.php/image-gen { "prompt": "打开的芒果干包装袋,产品散落摆放,自然光,木桌,暖色调,产品摄影", "quantity": 1, "size": "auto" } # 4. 同样用首帧生视频 POST /php/agent_api.php/video-gen { "prompt": "镜头从包装袋缓缓推近到芒果干特写,暖黄自然光,食欲感", "model": "seedance15pro", "first_frame_url": "{第二张图片URL}", "duration": 5, "resolution": "480p", "ratio": "9:16" } # 完成!2个5秒片段,总成本约3元(生图0.28×2 + 生视频1.5×2)