AIOM 智能体API文档

📖 概览

AIOM 智能体API让任何AI Agent（Coze、Dify、自定义Agent等）能够调用AIOM平台的完整视频创作能力。

⚠️ 重要：正确的API地址
• REST API：https://www.aiom.com.cn/php/agent_api.php
• 生图API：https://www.aiom.com.cn/php/api_image_gen.php
• 生视频API：https://www.aiom.com.cn/php/api_video_gen.php
• MCP端点：http://47.94.137.152:3100/sse
• 不要使用 8000/8080 端口！ 8000是其他项目，8080未启用。AIOM API全部通过 443(HTTPS) 或 3100(MCP) 访问。

项目	值
API基础URL	`https://www.aiom.com.cn/php/agent_api.php`
认证方式	`Authorization: Bearer <token>` 或 `X-API-Key: ak_xxx`
请求格式	JSON
响应格式	JSON
MCP端点	`http://47.94.137.152:3100/sse`

两大创作模式

🎬 口播视频模式

文案 → TTS语音 → 对口型 → 字幕/动画渲染

适合：真人出镜口播、产品介绍、店铺宣传

🎥 AI视频生成模式

文字描述/参考图片 → AI生成视频

适合：创意视频、广告素材、无真人出镜

🔐 认证方式

方式一：商户登录Token（推荐）

智能体先用商户账号密码登录，获取 Bearer token，之后所有请求携带此token。

POST /php/login.php
Content-Type: application/json

{"identifier": "13800138000", "password": "123456"}

→ 返回 token，后续请求: Authorization: Bearer <token>

方式二：API Key

适合长期运行的无交互智能体，需在后台创建API Key。

X-API-Key: ak_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

💡 建议：用方式一获取登录token即可调用所有API，无需额外申请API Key。

🔄 完整工作流

智能体按以下步骤依次调用各独立API即可完成完整视频创作：

模式一：口播视频流程

1️⃣ 登录
获取token

→

2️⃣ 文案
自行生成

→

3️⃣ 查录音
GET /recordings

→

4️⃣ TTS
POST /tts

→

5️⃣ 对口型
POST /lip-sync

→

6️⃣ 字幕
免费

模式二：AI视频生成流程

1️⃣ 登录
获取token

→

2️⃣ 生成视频
POST /video-gen

→

3️⃣ 轮询状态
GET /video-gen/status

→

4️⃣ 字幕
可选

模式三：带货视频流程

1️⃣ 生图
POST /image-gen

→

2️⃣ 生视频
POST /video-gen

→

3️⃣ TTS
POST /tts

→

4️⃣ 对口型
POST /lip-sync

→

5️⃣ 字幕
免费

模式四：品牌宣传流程

1️⃣ 生图×N
POST /image-gen

→

2️⃣ 生视频×N
POST /video-gen

→

3️⃣ 拼接
POST /video-concat

→

4️⃣ TTS
POST /tts

→

5️⃣ 字幕
免费

字幕二选一

📝 普通字幕（无动画）免费

自动ASR识别语音，添加静态白字字幕。无需传文案，简单快速。

POST /subtitle，只需传 video_url

✨ 动画字幕渲染免费

炫酷动画字幕，动态弹出、高亮关键词、配合视觉元素。自动ASR识别，无需传文案。

POST /animate，只需传 video_url

⚠️ 重要：语音合成(TTS)不支持voice_id，必须传audio_url（从录音列表获取的10秒音频样本URL）。

0️⃣ 注册账号 POST

注册AIOM账号，支持手机号或邮箱。注册成功自动登录，返回token可直接使用。

POST/php/register.php

参数	类型	必填	说明
`phone`	string	二选一	手机号（11位）
`email`	string	二选一	邮箱（需先调用发送验证码接口）
`password`	string	是	登录密码
`shopName`	string	否	店铺/商户名称，不填自动生成
`emailCode`	string	邮箱必填	邮箱验证码（6位数字，邮箱注册时必填）

两种注册方式

📱 手机号注册

只需手机号+密码，无需验证码

最快捷的方式

📧 邮箱注册

需先发送验证码 → 输入验证码+密码

两步完成

curl -X POST "https://www.aiom.com.cn/php/register.php" \
    -H "Content-Type: application/json" \
    -d '{"phone":"13800138000", "password":"mypass123", "shopName":"我的小店"}'

→ {"code":200, "message":"注册成功", "data":{
    "token":"abc123...", "userId":12, "phone":"138****8000", "shopName":"我的小店"
  }}

0️⃣.5 发送邮箱验证码 POST

向邮箱发送6位验证码，5分钟有效，60秒内只能发一次。邮箱注册前必须先调用此接口。

POST/php/send_email_code.php

参数	类型	必填	说明
`email`	string	是	接收验证码的邮箱
`type`	string	否	`register`（默认）或 `login`

curl -X POST "https://www.aiom.com.cn/php/send_email_code.php" \
    -H "Content-Type: application/json" \
    -d '{"email":"user@example.com", "type":"register"}'

→ {"code":200, "message":"验证码已发送，请查收邮件", "data":{"expires_in":300}}

1️⃣ 智能体登录 POST

POST/php/login.php

参数	类型	必填	说明
`identifier`	string	是	手机号或邮箱
`password`	string	是	登录密码

curl -X POST "https://www.aiom.com.cn/php/login.php" \
    -H "Content-Type: application/json" \
    -d '{"identifier": "13800138000", "password": "123456"}'

→ {"code":200, "data":{"token":"a1b2c3d4...", "userId":1, "shopName":"我的店铺"}}

2️⃣ 获取录音列表 GET

获取用户的录音（音色素材）。每条录音包含 audio_url，是约10秒的音频样本，用于TTS的audio_url参数提取音色。

GET/php/agent_api.php/recordings

curl "https://www.aiom.com.cn/php/agent_api.php/recordings" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{"recordings":[
    {"id":1, "title":"男声-客服", "audio_url":"https://.../record.mp3", "tags":"男声,客服"}
  ]}}

💡 流程：先调此接口获取录音列表 → 选一条录音 → 用其 audio_url 调用 TTS

3️⃣ 获取视频列表 GET

获取用户的视频（人物底板素材）。每条视频包含 video_url，用于对口型的 video_url 参数。

GET/php/agent_api.php/videos

curl "https://www.aiom.com.cn/php/agent_api.php/videos" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{"videos":[
    {"id":1, "title":"正面半身-西装", "video_url":"https://.../video.mp4", "tags":"正面,西装"}
  ]}}

3️⃣.5 上传录音 POST 免费

上传一段5-14秒的音频作为TTS音色样本。智能体通过公网URL传入音频文件，无需本地文件上传。每人最多6条录音。

⚠️ 声音克隆必读声明：
录音内容必须朗读以下声明文字，否则声音克隆会失败：

我的声音将用于平台克隆，并合法使用，为自己的行为负责

此声明为创客API V3模型要求，参考音频内容必须与指定文案一致，否则克隆失败。

POST/php/agent_api.php/upload-recording

参数	类型	必填	说明
`audio_url`	string	是	音频文件公网URL（mp3/wav/webm，5-14秒，内容必须朗读上述声明文字）
`title`	string	否	录音标题，如"男声-客服"，方便后续选择
`tags`	string	否	标签，逗号分隔，如"男声,客服,温柔"
`description`	string	否	录音描述，如"适合客服场景的温柔男声"

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/upload-recording" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"audio_url":"https://.../voice.mp3", "title":"男声-客服", "tags":"男声,客服"}'

→ {"success":true, "data":{"recording_id":5, "url":"https://.../voice.mp3", "title":"男声-客服", "tags":"男声,客服"}}

3️⃣.6 上传视频素材 POST 免费

上传一段人物出镜视频，用于后续对口型。智能体通过公网URL传入视频文件。视频分类：门头/环境/产品/日常。

POST/php/agent_api.php/upload-video

参数	类型	必填	说明
`video_url`	string	是	视频文件公网URL（mp4/mov/webm）
`video_type`	string	是	视频分类：`门头` / `环境` / `产品` / `日常`
`title`	string	否	视频标题，如"正面半身-西装"
`tags`	string	否	标签，逗号分隔，如"正面,西装,商务"

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/upload-video" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"video_url":"https://.../clip.mp4", "video_type":"日常", "title":"正面半身-西装", "tags":"正面,西装"}'

→ {"success":true, "data":{"video_id":3, "video_url":"https://.../clip.mp4", "video_type":"日常", "title":"正面半身-西装"}}

4️⃣ 语音合成(TTS) POST

用10秒音频样本提取音色，将文字转为语音。异步任务，创建后需轮询查询状态。

POST/php/agent_api.php/tts

参数	类型	必填	说明
`audio_url`	string	是	音色样本音频URL（从录音列表获取的audio_url，约10秒音频，用于提取音色。不支持voice_id）
`text`	string	是	要合成的文案内容
`speed`	float	否	语速 0.5~2.0，默认1.2（推荐）
`pitch`	float	否	音调 0.5~2.0，默认1.0

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/tts" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"audio_url": "https://.../record.mp3", "text": "欢迎光临我们的店铺...", "speed": 1.2}'

→ {"success":true, "data":{"task_id":"20260515_xxx", "status":"processing"}}

⚠️ 不支持voice_id！TTS只接受audio_url参数（从录音列表获取的10秒音频样本URL），不支持voice_id。

5️⃣ 查询TTS状态 GET

GET/php/agent_api.php/tts/status?task_id=xxx

curl "https://www.aiom.com.cn/php/agent_api.php/tts/status?task_id=20260515_xxx" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{"task_id":"...", "status":"completed", "audio_url":"https://.../voice.mp3"}}

⏱ 轮询建议：每 3~5 秒查询一次，通常 10~30 秒完成。status 为 completed 时 audio_url 即合成音频。

6️⃣ 对口型 POST

音频 + 真人视频 → 对口型视频。audio_url来自TTS合成结果，video_url来自视频列表。异步任务。

POST/php/agent_api.php/lip-sync

参数	类型	必填	说明
`audio_url`	string	是	音频URL（来自TTS合成的音频结果）
`video_url`	string	是	视频URL（来自视频列表的人物底板视频）
`high_quality`	bool	否	高清模式，默认true

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/lip-sync" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"audio_url": "https://.../voice.mp3", "video_url": "https://.../video.mp4"}'

→ {"success":true, "data":{"task_id":"lip_xxx", "status":"processing"}}

7️⃣ 查询对口型状态 GET

GET/php/agent_api.php/lip-sync/status?task_id=xxx

curl "https://www.aiom.com.cn/php/agent_api.php/lip-sync/status?task_id=lip_xxx" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{"status":"completed", "video_url":"https://.../lipsync.mp4"}}

⏱ 轮询建议：对口型通常 1~5 分钟，每 10 秒查询一次。status 为 completed 时 video_url 即成品视频。

8️⃣ 普通字幕添加（无动画）POST 免费

给视频自动识别语音并添加静态白字字幕。无需传文案，自动ASR识别。适用于只需要简单字幕的场景。

POST/php/agent_api.php/subtitle

参数	类型	必填	说明
`video_url`	string	是	视频URL（来自lip_sync对口型成品视频URL）

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/subtitle" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"video_url": "https://.../lipsync.mp4"}'

→ {"success":true, "data":{"video_url":"https://.../subtitled.mp4"}}

💡 说明：同步返回，通常30秒~2分钟（按视频时长）。自动ASR识别语音生成字幕，无需传文案。动画字幕渲染暂不可用，请使用普通字幕。

9️⃣ 动画字幕渲染（有动画效果）POST ⚠️ 待上线

将口播视频渲染为带炫酷动画字幕的成品视频，字幕会随语音动态弹出、高亮关键词、配合视觉元素。自动ASR识别语音生成字幕，无需传文案。异步任务，需轮询状态。

⚠️ 渲染引擎部署中，暂不可用。请使用普通字幕(add_subtitle)替代。

POST/php/agent_api.php/animate

参数	类型	必填	说明
`video_url`	string	是	口播视频URL（来自lip_sync对口型成品视频URL）
`brand_name`	string	否	品牌/店铺名称，默认"品质优选"
`template`	string	否	渲染模板，默认merchant-universal

可用模板

模板名	说明
`merchant-universal`	万能模板横版16:9（默认，视觉元素随字幕动态生成）
`merchant-universal-v`	万能模板竖版9:16（抖音/短视频比例）
`merchant-claude`	通用商家口播横版16:9
`merchant-business`	商家商务风
`personal-ip`	个人IP口播
`storyboard-ai`	分镜脚本模板

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/animate" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"video_url": "https://.../lipsync.mp4", "brand_name": "老王臭豆腐", "template": "merchant-universal"}'

→ {"success":true, "data":{"task_id":"task_xxx", "status":"processing", "status_url":"/php/agent_api.php/animate/status?task_id=task_xxx"}}

💡 说明：异步任务，渲染约1~2分钟。请用 get_animate_status 轮询状态，completed 时 video_url 即成品。如果只需要简单静态字幕，请用 add_subtitle，更轻量快速。

🔟 查询动画渲染状态 GET

GET/php/agent_api.php/animate/status?task_id=xxx

curl "https://www.aiom.com.cn/php/agent_api.php/animate/status?task_id=task_xxx" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{"task_id":"task_xxx", "status":"completed", "video_url":"https://.../animated.mp4"}}

⏱ 轮询建议：每 5 秒查询一次，通常 1~2 分钟完成。status 为 completed 时 video_url 即最终成品视频。

🤖 智能体工具箱 NEW

专为AI智能体/AI Agent设计的一站式工具集，解决智能体调用AIOM API时的核心痛点：不会写专业prompt、参数选择困难、缺少最佳实践。

🎯 核心价值：
• Prompt Builder：根据场景自动生成专业级摄影/电影prompt（无需专业知识）
• Video Presets：6种一键配置方案（抖音/小红书/微信/横幅等）
• Image Presets：5种生图预设（电商主图/社交媒体/批量变体等）
• 降低门槛：从"需要专业知识"→"只需选场景+填产品名"

📝 1. Prompt Builder - 智能Prompt生成器

根据使用场景、产品名称、风格偏好，自动生成经过优化的专业prompt。内置3大场景×3种风格的模板库。

参数	类型	必填	说明	示例
`type`	string	✅	生成类型：`image` 或 `video`	`image`
`scenario`	string	❌	使用场景（见下表）	`ecommerce_product`
`product`	string	❌	产品/主体名称（会替换到prompt中）	`芒果干`
`style`	string	❌	风格：`cinematic`(默认) / `minimal` / `vibrant`	`vibrant`
`platform`	string	❌	目标平台（用于未来优化）	`douyin`

🎬 可用场景列表

场景ID	适用类型	说明
`ecommerce_product`	image	电商产品图（白底/专业）
`social_media_lifestyle`	image	社交媒体生活化图片
`food_beverage`	image	食品饮料类产品
`ecommerce_product_showcase`	video	电商产品展示视频
`social_media_story`	video	社交媒体故事短视频
`brand_introduction`	video	品牌介绍/宣传片

GET/php/agent_api.php/prompt-builder?type=image&scenario=ecommerce_product&product=芒果干&style=cinematic

// 请求
curl "https://www.aiom.com.cn/php/agent_api.php/prompt-builder?type=video&scenario=ecommerce_product_showcase&product=芒果干"

// 返回
{
  "success": true,
  "data": {
    "prompt": "Slow elegant cinematic push-in motion, 芒果干 gently rotating revealing texture details...",
    "metadata": {
      "type": "video",
      "scenario": "ecommerce_product_showcase",
      "style": "seedance15pro",
      "word_count": 245,
      "optimized_for": "AI video generation (Seedance)",
      "tips": [
        "This prompt is professionally crafted for optimal AI generation results",
        "Contains technical photography/film terminology"
      ]
    },
    "alternative_scenarios": ["ecommerce_product_showcase", "social_media_story", ...],
    "available_styles": ["cinematic", "minimal", "vibrant"]
  }
}

🎬 2. Video Presets - 视频生成预设

6种针对不同平台和用途的一键配置方案，包含模型选择、时长、比例、分辨率、预估成本等完整配置。

预设ID	名称	平台	模型	时长	比例	分辨率	预估费用	推荐度
`douyin_ecommerce_value`	🔥 抖音电商（高性价比）	抖音	1.5 Pro	8s	9:16	480p	¥2.40	⭐⭐⭐⭐⭐
`douyin_premium_quality`	⭐ 抖音精品（高质量）	抖音	2.0	10s	9:16	720p	¥12.00	⭐⭐⭐⭐
`xiaohongshu_lifestyle`	📕 小红书种草	小红书	1.5 Pro	6s	3:4	480p	¥1.80	⭐⭐⭐⭐
`wechat_moment`	💬 微信朋友圈	微信	1.5 Pro	5s	1:1	720p	¥2.50	⭐⭐⭐
`banner_widescreen`	🖥️ 横幅Banner	网站	2.0	8s	21:9	1080p	¥19.20	⭐⭐
`fast_preview`	⚡ 快速预览	测试	2.0 Fast	5s	16:9	480p	¥3.00	⭐⭐⭐

GET/php/agent_api.php/video-presets

// 返回示例（每个preset包含完整配置）
{
  "success": true,
  "data": {
    "presets": [
      {
        "id": "douyin_ecommerce_value",
        "name": "🔥 抖音电商（高性价比）",
        "description": "电商产品展示首选，性价比最高...",
        "suitable_for": ["电商产品展示", "零食/食品带货"],
        "platform": "douyin_tiktok",
        "config": {
          "model": "seedance15pro",
          "duration": 8,
          "ratio": "9:16",
          "resolution": "480p",
          "estimated_cost": 2.40,
          "quality_score": 85
        },
        "pros": ["成本最低", "支持首帧控制", "生成速度快"],
        "cons": ["分辨率限制480p", "时长最大12秒"],
        "popularity": 0.92,
        "recommended": true
      },
      // ... 其他5个预设
    ],
    "total": 6,
    "usage_tip": "使用preset ID调用 POST /video-gen 时传入 preset 参数"
  }
}

📸 3. Image Presets - 生图预设

5种常见生图场景的标准化配置，包含模式、尺寸、数量和prompt模板。

预设ID	名称	模式	尺寸	数量	预估费用	推荐度
`ecommerce_product_hero`	🛍️ 电商主图（白底）	text2img	1:1	1张	¥0.28	⭐⭐⭐⭐⭐
`lifestyle_context`	✨ 场景 lifestyle	text2img	4:3	1张	¥0.28	⭐⭐⭐⭐
`social_media_square`	📱 社交媒体（方图）	text2img	1:1	1张	¥0.28	⭐⭐⭐⭐
`batch_variations`	🎨 批量变体（多角度）	text2img	auto	4张	¥1.12	⭐⭐⭐
`seasonal_festive`	🎄 节日氛围（主题）	text2img	3:4	1张	¥0.28	⭐⭐⭐

GET/php/agent_api.php/image-presets

💡 智能体集成工作流（推荐）：


// Step 1: 获取Prompt

const promptResp = await fetch('/php/agent_api.php/prompt-builder?type=video&scenario=ecommerce_product_showcase&product=芒果干');

const { prompt } = await promptResp.json();


// Step 2: 获取Preset配置

const presetResp = await fetch('/php/agent_api.php/video-presets');

const { presets } = await presetResp.json();

const config = presets.find(p => p.id === 'douyin_ecommerce_value').config;


// Step 3: 提交任务（使用自动生成的prompt + 预设配置）

const taskResp = await fetch('/php/agent_api.php/video-gen', {

  method: 'POST',

  body: JSON.stringify({ ...config, prompt })

});


// Step 4: 轮询状态直到完成

while (true) { const status = await fetch(`/video-gen/status?task_id=${taskId}`); ... }

🧠 专家系统 NEW GET

专为小商家设计的AI专家团队，智能体不需要懂摄影/视频/文案，只需根据商家需求选择对应专家，按照配方执行即可交付专业级成果。

🎯 核心价值：
• 降低智能体门槛：智能体不需要专业知识，选专家→拿配方→照做
• 专业prompt自动生成：配方里的prompt是专业级摄影/电影术语
• 模型/参数已配好：不会选错模型、不会传错参数
• 步骤间引用：上一步的结果自动成为下一步的输入
• 免认证：查看专家和配方不需要API Key

5个专家角色

专家ID	名称	解决什么痛点	适合商家	费用
`product_photographer`	🛍️ 产品摄影师	手机拍的产品图不好看，影响转化率	电商卖家、抖音小店、拼多多、微商	¥0.28/张
`video_director`	🎬 视频导演	不会拍视频、不会剪辑、没设备	抖音带货、小红书种草、视频号推广	¥2.40起
`content_planner`	📝 内容策划师	不知道发什么内容，缺乏创意	所有需要做内容营销的商家	免费
`copywriter`	📢 文案高手	标题/描述/标签不会写，没流量	抖音/小红书/淘宝商家	免费
`ad_designer`	🎨 广告设计师	大促/节日需要专题图，不会设计	参加大促活动的商家、节日营销	¥0.28/张

GET/php/agent_api.php/experts

💡 免认证端点 — 不需要API Key即可访问，方便智能体先了解有哪些专家可用

// 请求
curl "https://www.aiom.com.cn/php/agent_api.php/experts"

// 返回
{
  "success": true,
  "data": {
    "experts": [
      {
        "id": "product_photographer",
        "name": "🛍️ 产品摄影师",
        "tagline": "手机拍的产品图太丑？我来帮你出专业级产品图",
        "target_merchant": "电商卖家、抖音小店、拼多多商家、微商",
        "pain_point": "商家没有专业摄影设备，手机拍的产品图不好看，影响转化率",
        "capabilities": ["白底主图", "场景图", "批量变体", "节日氛围图"],
        "recommended_api": "POST /php/api_image_gen.php?action=generate",
        "recommended_preset": "ecommerce_product_hero",
        "example_workflow": [
          "1. 调用 /agent_api/prompt-builder?type=image&scenario=ecommerce_product&product={产品名}",
          "2. 调用 /agent_api/image-presets 获取 preset 配置",
          "3. 调用 /php/api_image_gen.php?action=generate 生成图片",
          "4. 轮询 /php/api_image_gen.php?action=status 获取结果"
        ],
        "estimated_cost": "¥0.28/张",
        "estimated_time": "2-3分钟/张"
      },
      // ... 其他4个专家
    ],
    "total": 5,
    "usage_guide": "智能体应根据商家需求选择对应专家，按照 example_workflow 中的步骤调用API完成交付"
  }
}

📋 专家配方 NEW GET

照着做就行的一站式执行清单。智能体不需要自己思考流程，配方里每一步的API、参数、prompt都已配好，只需填入实际值按序执行。

5种配方

配方ID	名称	步骤数	总费用	总耗时	说明
`product_photo`	🛍️ 产品摄影套餐	2步	¥0.56	4-6分钟	白底主图 + 场景图
`promo_video`	🎬 产品推广视频	2步	¥2.68	5-11分钟	产品图 → 用图生视频
`content_plan`	📝 内容策划套餐	1步	免费	即时	生成专业提示词
`ad_poster`	🎨 广告海报套餐	1步	¥0.28	2-3分钟	节日氛围产品图
`full_package`	🎁 全案套餐	3步	¥2.96	7-14分钟	产品图 + 场景图 + 推广视频

请求参数

参数	类型	必填	说明	示例
`need`	string	✅	配方ID：`product_photo` / `promo_video` / `content_plan` / `ad_poster` / `full_package`	`promo_video`
`product`	string	❌	产品名称（会自动填入prompt）	`茶叶`
`platform`	string	❌	目标平台：`douyin`(默认) / `xiaohongshu` / `wechat`	`xiaohongshu`
`budget`	number	❌	预算上限（元），超预算会返回警告，默认10	`5`

GET/php/agent_api.php/expert-recipe?need=promo_video&product=茶叶&platform=douyin

// 请求：获取"茶叶推广视频"配方
curl "https://www.aiom.com.cn/php/agent_api.php/expert-recipe?need=promo_video&product=茶叶"

// 返回
{
  "success": true,
  "data": {
    "expert": "video_director",
    "title": "产品推广视频套餐",
    "description": "用产品图生成抖音带货短视频",
    "steps": [
      {
        "step": 1,
        "action": "生成产品展示图（作为视频首帧）",
        "api": "POST /php/api_image_gen.php?action=generate",
        "params": {
          "prompt": "Professional product photography of 茶叶, studio softbox lighting, shallow depth of field, warm golden hour tones, 8k",
          "mode": "text2img",
          "size": "9:16",
          "quantity": 1,
          "notify_url": "{YOUR_CALLBACK_URL}"
        },
        "estimated_cost": 0.28,
        "estimated_time": "2-3分钟"
      },
      {
        "step": 2,
        "action": "用产品图生成推广视频",
        "api": "POST /php/agent_api.php/video-gen",
        "params": {
          "model": "seedance15pro",
          "prompt": "Slow elegant cinematic push-in motion, 茶叶 gently rotating revealing texture details, warm golden hour lighting, smooth slow-motion, professional commercial showcase",
          "first_frame_url": "{STEP1_RESULT_IMAGE_URL}",
          "duration": 8,
          "ratio": "9:16",
          "resolution": "480p"
        },
        "estimated_cost": 2.40,
        "estimated_time": "3-8分钟"
      }
    ],
    "total_cost": 2.68,
    "total_time": "5-11分钟"
  }
}

🎯 智能体使用流程（3步走）：

Step 1：调 GET /experts 查看有哪些专家 → 根据商家需求选一个
Step 2：调 GET /expert-recipe?need=xxx&product=xxx 获取配方
Step 3：按配方步骤依次调API，填入实际值（{YOUR_CALLBACK_URL}填回调地址，{STEP1_RESULT_IMAGE_URL}填上一步返回的图片URL）

⚠️ 占位符说明：
• {YOUR_CALLBACK_URL} — 你的回调通知地址，任务完成后AIOM会POST推送结果
• {STEP1_RESULT_IMAGE_URL} — 上一步返回的图片URL，作为下一步的输入
• 配方中的prompt已包含产品名，无需手动修改

1️⃣1️⃣ AI视频生成 POST

用文字描述或参考图片生成视频。支持两个模型，异步任务，创建后需轮询查询状态。

⚠️ 并发限制与模型选择（重要）：
• 所有模型并发数：3 - Seedance 2.0 / 1.5 Pro 同时最多处理3个任务
• Seedance 1.5 Pro ⭐ 推荐：性价比最高（480p仅0.3元/秒），支持首帧/尾帧控制，适合电商产品视频
• Seedance 2.0：全能型，支持多模态参考（图片+视频+音频），适合复杂创意视频
• 参数可调：duration（时长）、ratio（比例）、resolution（分辨率）都可通过API参数调整

POST/php/agent_api.php/video-gen

通用参数

参数	类型	必填	说明
`prompt`	string	是	视频描述文字（描述想要生成的视频内容）
`model`	string	否	模型：`seedance2`（默认）或 `seedance15pro`
`duration`	int	否	视频时长（秒）：seedance2范围1-15默认5，seedance15pro范围2-12默认5
`ratio`	string	否	画面比例：`16:9`（默认）/ `9:16` / `1:1`
`resolution`	string	否	分辨率：`720p`（默认）/ `480p`

Seedance 1.5 Pro 专属参数

Seedance 1.5 Pro 的特色是支持首帧/尾帧图片，可以精确控制视频的起止画面。

参数	类型	必填	说明
`first_frame_url`	string	否	首帧图片URL（控制视频起始画面）
`last_frame_url`	string	否	尾帧图片URL（控制视频结束画面，需配合first_frame_url使用）

Seedance 2.0 专属参数

参数	类型	必填	说明
`ref_image_url`	string	否	参考图片URL（作为参考素材）
`ref_video_url`	string	否	参考视频URL（作为参考素材）
`ref_audio_url`	string	否	参考音频URL（作为参考素材）

模型对比

Seedance 2.0

支持参考视频和音频，时长1-15秒

480p: 0.8元/秒 · 720p: 1.2元/秒

Seedance 1.5 Pro ⭐

支持首帧/尾帧图片控制，时长2-12秒

480p: 0.3元/秒 · 720p: 0.5元/秒

性价比更高

请求示例

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/video-gen" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{
      "prompt": "一只小猫在阳光下打盹",
      "model": "seedance15pro",
      "duration": 5,
      "ratio": "16:9",
      "resolution": "720p",
      "first_frame_url": "https://.../cat.jpg"
    }'

→ {"success":true, "data":{
    "task_id":"vg_xxx",
    "status":"processing",
    "cost":2.5,
    "model":"seedance15pro",
    "message":"Video generation task created, use GET /video-gen/status?task_id=... to poll"
  }}

💡 提示：Seedance 1.5 Pro 支持首帧+尾帧图片，可以精确控制视频的起始和结束画面，适合制作有明确起止构图的创意视频。

1️⃣2️⃣ 查询视频生成状态 GET

GET/php/agent_api.php/video-gen/status?task_id=xxx

curl "https://www.aiom.com.cn/php/agent_api.php/video-gen/status?task_id=vg_xxx" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{
    "task_id":"vg_xxx",
    "status":"succeeded",
    "video_url":"https://.../generated.mp4",
    "message":"Video generation completed! video_url is the final video URL"
  }}

⏱ 轮询建议：每 5~10 秒查询一次，通常 1~5 分钟完成。status 为 succeeded 时 video_url 即最终成品视频。

🔥 Seedance 2.0 全能参考视频生成 POST GET

Seedance 2.0 是字节跳动最新AI视频生成模型，全能参考模式是其最强大的能力——同时接受图片、视频、音频作为参考素材，模型综合所有参考生成新视频。

💡 核心卖点：全能参考模式比纯文生视频便宜42%！
提供参考素材时，单价仅 ¥0.70/秒（纯文生 ¥1.20/秒）。因为含视频输入的API调用成本更低，我们把节省全部让利给用户。

端点一览

操作	方法	URL	说明
查看能力	GET	`/php/agent_api.php/seedance?action=capabilities`	返回模型能力、定价、示例
计算价格	GET/POST	`/php/agent_api.php/seedance?action=price`	根据参数计算视频费用
生成视频	POST	`/php/agent_api.php/seedance`	创建视频生成任务
查询状态	GET	`/php/agent_api.php/seedance?action=status&task_id=xxx`	查询任务状态和视频URL

定价

模式	标准模型	快速模型	说明
🔥 全能参考（有参考素材）	¥0.70/秒	¥0.42/秒	提供了图片/视频/音频中的至少一种
纯文生视频（无参考素材）	¥1.20/秒	¥0.72/秒	仅文字描述，无参考素材

参考素材限制

素材类型	最大数量	角色(role)	说明
参考图片 ref_images	9张	reference_image	风格/人物/场景参考
参考视频 ref_videos	3个	reference_video	动作/风格参考（总时长≤15秒）
参考音频 ref_audios	3个	reference_audio	语音/音乐/音效参考
首帧图 first_frame	1张	first_frame	视频第一帧图片
尾帧图 last_frame	1张	last_frame	视频最后一帧图片

生成视频 - 请求参数

POST/php/agent_api.php/seedance

参数	类型	必填	说明
prompt	string	与参考素材二选一	视频描述文字
ref_images	string[]	否	参考图片URL数组，最多9张
ref_videos	string[]	否	参考视频URL数组，最多3个
ref_audios	string[]	否	参考音频URL数组，最多3个
first_frame	string	否	首帧图片URL
last_frame	string	否	尾帧图片URL
duration	int	否	视频时长(2-15秒)，默认5
ratio	string	否	画面比例：1:1/4:3/16:9/9:16/21:9/adaptive，默认16:9
model	string	否	seedance2(标准) / seedance2-fast(快速)
generate_audio	bool	否	是否生成音频，默认true
watermark	bool	否	是否加水印，默认false

请求示例

示例1：纯文生视频

POST /php/agent_api.php/seedance
Authorization: Bearer YOUR_TOKEN

{
  "prompt": "一只金毛犬在麦田中奔跑，阳光明媚，电影级运镜",
  "duration": 5,
  "ratio": "16:9"
}
// 费用：5秒 × ¥1.20 = ¥6.00

示例2：图生视频（首帧）

POST /php/agent_api.php/seedance
Authorization: Bearer YOUR_TOKEN

{
  "prompt": "人物缓缓走向镜头，微笑",
  "first_frame": "https://example.com/character.jpg",
  "duration": 5
}
// 费用：5秒 × ¥0.70 = ¥3.50（有参考素材，省42%）

示例3：🔥 全能参考模式（图片+视频+音频）

POST /php/agent_api.php/seedance
Authorization: Bearer YOUR_TOKEN

{
  "prompt": "人物用参考音频的语气说话，风格参考图片，动作参考视频",
  "ref_images": ["https://example.com/style1.jpg", "https://example.com/character.jpg"],
  "ref_videos": ["https://example.com/motion_ref.mp4"],
  "ref_audios": ["https://example.com/voice.mp3"],
  "duration": 10,
  "ratio": "16:9"
}
// 费用：10秒 × ¥0.70 = ¥7.00（全能参考模式，最划算）

响应示例

{
  "success": true,
  "data": {
    "task_id": "cgt-2026xxxx-xxxx",
    "order_no": "V202605241234567890",
    "mode": "reference",
    "model": "seedance2",
    "duration": 10,
    "cost": 7.00,
    "unit_price": 0.70,
    "balance_remaining": 99971.80,
    "ref_count": 4,
    "tip": "All-reference mode active - 42% cheaper than text-only!"
  },
  "message": "Video generation task created"
}

💰 视频价格计算 GET

GET/php/agent_api.php/seedance?action=price

在生成前先计算费用，避免余额不足。

GET /php/agent_api.php/seedance?action=price
Content-Type: application/json

{
  "prompt": "test",
  "ref_images": ["https://example.com/img.jpg"],
  "duration": 10,
  "model": "seedance2"
}

// 响应：
{
  "success": true,
  "data": {
    "duration": 10,
    "unit_price": 0.70,
    "total": 7.00,
    "mode": "reference",
    "model": "seedance2"
  }
}

📊 查询视频任务状态 GET

GET/php/agent_api.php/seedance?action=status&task_id=xxx

// 任务进行中
{
  "success": true,
  "data": {
    "task_id": "cgt-2026xxxx",
    "status": "running",
    "model": "doubao-seedance-2-0-260128",
    "duration": 10,
    "resolution": "720p",
    "ratio": "16:9"
  }
}

// 任务完成
{
  "success": true,
  "data": {
    "task_id": "cgt-2026xxxx",
    "status": "succeeded",
    "video_url": "https://xxx.volces.com/xxx.mp4",
    "duration": 10,
    "resolution": "1080p",
    "ratio": "16:9",
    "usage": { "completion_tokens": 308880, "total_tokens": 308880 }
  }
}

// 任务失败（自动退款）
{
  "success": true,
  "data": {
    "task_id": "cgt-2026xxxx",
    "status": "failed",
    "error": "Content policy violation",
    "refunded": true,
    "refund_amount": 7.00
  }
}

提示：视频生成通常需要1-3分钟。建议每30秒轮询一次状态。失败任务会自动退款到余额。

1️⃣3️⃣ AI生图(KIMGA2) POST

用文字描述或参考图片生成图片。接入 KIMGA2 (KImage2-official) 模型，由 MathMind / kexiangai.com 提供上游能力。支持文生图和图生图两种模式。异步任务，创建后需轮询查询状态。

📌 模型信息（2026-06-06 更新）：
• 模型名：GPT-Image-2-Official（KImage2-official）
• 上游：MathMind / kexiangai.com
• 计费：按分辨率计价（见下方价格表）
• 输出格式：png / jpeg / webp

💰 分辨率定价（重要）：
• 1K 分辨率 → ¥0.28/张（默认）
• 2K 分辨率 → ¥0.40/张
• 4K 分辨率 → ¥1.00/张
默认分辨率 1K，通过 resolution 参数控制

✨ 新功能（2026-05-29）：
• 自动入库：生成成功后自动保存到 images 表（带3次重试机制，并发安全）
• 状态查询：新增 GET /php/api_image_gen.php?action=status&task_id=xxx 简化版查询接口
• 🚀 回调通知：新增 notify_url 参数，任务完成后立即推送结果给智能体（延迟从5-7分钟→<1秒！）
• 完整闭环：提交 → （自动回调 or 轮询status）→ 拿到URL → 下载/使用

⚡ 性能提升（重要）：
• 之前：智能体轮询等待 5-7 分钟才能收到结果 ❌
• 现在：提供 notify_url 后，任务完成**立即推送**（<1秒）✅
• 推荐：所有智能体务必传入 notify_url 参数以获得最佳体验

⚠️ 并发限制（重要）：
• 生图并发数：2 - 同时最多处理2个生图任务，超出需排队等待
• 单次最大数量：4张 - quantity 参数范围 1~4，建议单次1-2张以保证速度
• 推荐策略：智能体应控制并发，每完成一个再提交下一个，避免排队超时

POST/php/api_image_gen.php?action=generate

参数	类型	必填	说明
`prompt`	string	是	图片描述文字（描述想要生成的图片内容）
`mode`	string	否	生成模式：`text2img`（文生图，默认）或 `img2img`（图生图）
`images`	array	否	参考图片数组（图生图模式必填，支持URL或base64 DataURL）
`size`	string	否	图片比例，默认`1:1`。可选：auto/1:1/16:9/9:16/4:3/3:4/21:9/9:21 等13种
`resolution`	string	否	分辨率：`1k`（默认）/ `2k`/ `4k`。1K=¥0.28, 2K=¥0.40, 4K=¥1.00
`quality`	string	否	画质：`low` / `medium`（默认）/ `high`
`output_format`	string	否	输出格式：`png`（默认）/ `jpeg`/ `webp`
`quantity`	int	否	生成数量 1~4，默认1
`model`	string	否	模型，默认`image2`（KIMGA2 KImage2-official）
`notify_url`	string	⭐推荐	回调通知URL（任务完成后立即POST推送结果）

🚀 回调通知机制详解（新增）

为什么需要 notify_url？

❌ 没有 notify_url（旧方式）：
  • 智能体必须主动轮询 status 接口
  • 轮询间隔不确定，可能 5-10 秒一次
  • 网络波动可能导致轮询失败
  • 结果：平均延迟 5-7 分钟

✅ 有 notify_url（新方式）：
  • 任务完成瞬间，服务器主动调用你的 URL
  • 立即 POST 推送完整结果数据
  • 无需轮询，无需等待
  • 结果：延迟 < 1 秒！

📥 回调数据格式

// 任务成功时服务器会 POST 到你的 notify_url：
{
  "event": "image_gen.completed",
  "timestamp": "2026-05-29T16:11:51+08:00",
  "task_id": "gpt-image2-image_xxx",
  "status": "success",
  "image_url": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png",
  "images": [
    {
      "url": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png",
      "thumbnail": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png"
    }
  ]
}

// 任务失败时：
{
  "event": "image_gen.completed",
  "timestamp": "2026-05-29T16:11:51+08:00",
  "task_id": "gpt-image2-image_xxx",
  "status": "failed",
  "error": "生成超时",
  "refund": true
}

💡 智能体集成示例（使用回调）

// Step 1: 提交任务时传入 notify_url
const response = await fetch('https://www.aiom.com.cn/php/api_image_gen.php?action=generate', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json', 'Authorization': 'Bearer ' },
    body: JSON.stringify({
        prompt: '芒果干产品展示',
        mode: 'text2img',
        quantity: 1,
        notify_url: 'https://your-server.com/callback/image-gen'  // ← 关键参数！
    })
});

const { task_id } = await response.json();

// Step 2: 设置 Webhook 监听器（Express.js 示例）
app.post('/callback/image-gen', (req, res) => {
    const data = req.body;
    
    console.log('🎉 收到图片生成完成通知:', data.task_id);
    console.log('   图片URL:', data.image_url);
    console.log('   延迟:', Date.now() - new Date(data.timestamp).getTime(), 'ms');
    
    // 立即处理结果（无需轮询！）
    if (data.status === 'success') {
        downloadAndProcessImage(data.image_url);
    }
    
    res.sendStatus(200);  // 必须返回200确认收到
});

// ✅ 结果：任务完成后 <1秒 内就能收到通知！
// 对比：之前需要轮询 5-7 分钟

两种模式

📝 文生图 (text2img)

纯文字描述生成图片

只需传 prompt

🖼️ 图生图 (img2img)

参考图片 + 文字描述生成新图片

需传 prompt + images

请求示例

示例1：文生图（默认 1K 分辨率，¥0.28/张）

curl -X POST "https://www.aiom.com.cn/php/api_image_gen.php?action=generate" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{
      "prompt": "一只橘猫戴着墨镜坐在咖啡厅",
      "mode": "text2img",
      "quantity": 1,
      "size": "1:1"
    }'

→ {"success":true, "task_id":"xxx", "quantity":1,
   "cost_amount":0.28, "unit_price":0.28, "balance_remaining":99.72,
   "status":"pending", "message":"任务已创建，正在生成..."}

示例2：4K 高清生图（¥2.00/张）

curl -X POST "https://www.aiom.com.cn/php/api_image_gen.php?action=generate" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{
      "prompt": "一只金毛犬在草地上奔跑，电影感，高质量",
      "mode": "text2img",
      "size": "16:9",
      "resolution": "4k",
      "quality": "high",
      "output_format": "png",
      "quantity": 1
    }'

→ {"success":true, "task_id":"xxx", "quantity":1,
   "cost_amount":1.00, "unit_price":1.00, "balance_remaining":98.72,
   "status":"pending", "message":"任务已创建，正在生成..."}

⚠️ 认证：此接口需要 Bearer token 登录认证（不支持 API Key），需先调用登录接口获取 token。

1️⃣4️⃣ 查询生图状态 GET

方式一：完整查询（原接口）

GET/php/api_image_gen.php?action=query&task_id=xxx

curl "https://www.aiom.com.cn/php/api_image_gen.php?action=query&task_id=xxx" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "status":"success", "task_id":"xxx",
   "images":[{"url":"https://.../img1.png","thumbnail":"https://.../img1.png"}],
   "balance_remaining":99.72}

方式二：简化查询（推荐智能体使用）✨

🎯 推荐给智能体/AI Agent 使用：
返回标准化的状态码和图片URL，更适合程序化轮询。

GET/php/api_image_gen.php?action=status&task_id=xxx

curl "https://www.aiom.com.cn/php/api_image_gen.php?action=status&task_id=xxx" \
    -H "Authorization: Bearer <token>"

→ {
  "success": true,
  "data": {
    "task_id": "image_4a28f02d-xxxx",
    "status": 2,
    "image_url": "https://mathmind-files.oss-cn-beijing.aliyuncs.com/images/xxx.png",
    "created_at": "2026-05-29 14:33:39",
    "updated_at": "2026-05-29 14:34:46"
  }
}

状态码	含义	说明
`0`	pending	待处理，继续轮询
`1`	processing	处理中，继续轮询
`2`	success	✅ 成功，image_url 可用
`-1`	failed	❌ 失败，费用已退回

⏱ 轮询建议：每 3~5 秒查询一次，通常 10~30 秒完成。status 为 2（success）时 image_url 即生成的图片。生成失败自动退回余额。

💡 智能体集成示例：


// 1. 提交任务 → 获得 task_id

// 2. 循环调用 /action=status?task_id=xxx

// 3. 当 status === 2 时，取 data.image_url 使用

// 4. 即使 images 表偶尔入库失败，也能通过此接口拿到URL

🆕 14.5 NanoBanana 2 生图 POST

NanoBanana 2（NB2）是新一代AI图像生成模型，由 kexiangai.com 提供上游能力。支持文生图和图生图，异步任务，创建后需轮询查询状态。价格 ¥0.20/张，单次最多 4 张。

✨ 核心特性：
• 文生图 + 图生图：纯文字描述 / 参考图 + 文字两种模式都支持
• 多参考图：单次最多 14 张参考图（URL 或 base64 均可）
• 价格固定 0.20 元/张：比 image2 便宜 29%，比游客价（0.5元）便宜 60%
• 失败自动退款：上游调用失败 / 任务失败时自动退回余额，并发安全
• 认证方式灵活：支持 Bearer token 和 X-API-Key

⚠️ 使用须知：
• 需要登录：必须传入 Authorization: Bearer <token> 或 X-API-Key: ak_xxx
• 扣费时机：提交任务时先扣费，任务失败自动退款（事务保护）
• 并发限制：与 image2 共享生图并发池（2个），超出需排队
• 退款保障：所有失败场景（余额不足、上游报错、生成失败）都会原路退回

POST/php/api_image_gen_nb2.php?action=generate

请求参数

参数	类型	必填	说明
`prompt`	string	二选一	图片描述文字（与 images 至少传一个）
`mode`	string	否	生成模式：`text2img`（默认）或 `img2img`
`images`	array	二选一	参考图数组（图生图必填），最多 14 张。支持公网 URL 或 base64 DataURL
`size`	string	否	图片尺寸，默认 `1:1`
`quantity`	int	否	生成数量 1~4，默认 1（超出自动截断到 4）

两种模式

📝 文生图 (text2img)

纯文字描述生成图片

只需传 prompt

¥0.20/张

🖼️ 图生图 (img2img)

参考图 + 文字描述生成新图片

需传 prompt + images

¥0.20/张

请求示例

示例1：文生图

curl -X POST "https://www.aiom.com.cn/php/api_image_gen_nb2.php?action=generate" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{
      "prompt": "一只戴墨镜的橘猫坐在咖啡厅，胶片摄影风格",
      "mode": "text2img",
      "size": "1:1",
      "quantity": 1
    }'

→ {"success":true, "task_id":"nb2_xxx", "order_no":"N20260605xxx",
   "quantity":1, "cost_amount":0.20, "unit_price":0.20, "status":"pending"}

示例2：图生图（参考图 + 文字）

curl -X POST "https://www.aiom.com.cn/php/api_image_gen_nb2.php?action=generate" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{
      "prompt": "把这个产品图改成节日礼盒包装，金色丝带",
      "mode": "img2img",
      "images": ["https://example.com/product.jpg"],
      "size": "1:1",
      "quantity": 2
    }'

→ {"success":true, "task_id":"nb2_xxx", "order_no":"N20260605xxx",
   "quantity":2, "cost_amount":0.40, "unit_price":0.20, "status":"pending"}

示例3：批量生成 4 张

curl -X POST "https://www.aiom.com.cn/php/api_image_gen_nb2.php?action=generate" \
    -H "X-API-Key: ak_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
    -H "Content-Type: application/json" \
    -d '{
      "prompt": "产品四角度展示：正面、侧面、45度角、背面",
      "quantity": 4
    }'

→ {"success":true, "task_id":"nb2_xxx", "quantity":4,
   "cost_amount":0.80, "unit_price":0.20, "status":"pending"}

价格计算

💰 公式：总费用 = 0.20 × 张数
1张 = ¥0.20 · 2张 = ¥0.40 · 3张 = ¥0.60 · 4张 = ¥0.80

⚠️ 错误码说明：
• 401：未登录 / token 失效
• 400：参数错误（缺 prompt、缺 images、超出数量限制等）
• 500：上游调用失败 / 系统异常（费用已自动退回）

1️⃣4️⃣.6 NB2 状态查询 GET

查询 NB2 任务状态。提供两种接口：简洁版（智能体用）和完整版（前端轮询用）。

方式一：简洁查询（推荐智能体使用）✨

🎯 推荐给智能体/AI Agent 使用：
返回标准化的状态码和图片URL，更适合程序化轮询。

GET/php/api_image_gen_nb2.php?action=status&task_id=xxx

curl "https://www.aiom.com.cn/php/api_image_gen_nb2.php?action=status&task_id=nb2_xxx" \
    -H "Authorization: Bearer <token>"

→ {
  "success": true,
  "data": {
    "task_id": "nb2_xxx",
    "status": 2,
    "image_url": "https://kexiangai.com/cdn/xxx.png"
  }
}

状态码	含义	说明
`0`	pending	待处理，继续轮询
`1`	processing	处理中，继续轮询
`2`	success	✅ 成功，image_url 可用
`-1`	failed	❌ 失败，费用已退回

方式二：完整查询（前端轮询）

会主动调用上游查询最新状态，适合前端页面轮询。已完成的任务会走本地缓存，避免重复调用上游。

GET/php/api_image_gen_nb2.php?action=query&task_id=xxx

// 进行中
{
  "success": true,
  "data": {
    "task_id": "nb2_xxx",
    "status": "processing",
    "image_url": "",
    "message": ""
  }
}

// 已完成
{
  "success": true,
  "data": {
    "task_id": "nb2_xxx",
    "status": "succeeded",
    "image_url": "https://kexiangai.com/cdn/xxx.png",
    "message": ""
  }
}

// 失败（已自动退款）
{
  "success": true,
  "data": {
    "task_id": "nb2_xxx",
    "status": "failed",
    "image_url": "",
    "message": "Content policy violation"
  }
}

⏱ 轮询建议：每 3~5 秒查询一次，通常 10~60 秒完成。
状态对应：pending → processing → success（即 succeeded）
失败任务已自动退款，无需手动处理。

智能体集成示例

// 1. 提交任务 → 获得 task_id
const submitResp = await fetch('/php/api_image_gen_nb2.php?action=generate', {
    method: 'POST',
    headers: { 'Authorization': 'Bearer ', 'Content-Type': 'application/json' },
    body: JSON.stringify({ prompt: '芒果干产品图', quantity: 2 })
});
const { task_id, cost_amount } = await submitResp.json();
console.log(`任务 ${task_id} 已提交，扣费 ¥${cost_amount}`);

// 2. 循环调用 /action=status 轮询
let status = 0;
let imageUrl = null;
while (status === 0 || status === 1) {
    await new Promise(r => setTimeout(r, 3000));
    const r = await fetch(`/php/api_image_gen_nb2.php?action=status&task_id=${task_id}`, {
        headers: { 'Authorization': 'Bearer ' }
    });
    const { data } = await r.json();
    status = data.status;
    imageUrl = data.image_url;
}

// 3. 处理结果
if (status === 2) {
    console.log('生成成功:', imageUrl);
    // 下载 / 使用 imageUrl
} else if (status === -1) {
    console.log('生成失败，费用已自动退款');
}

1️⃣4️⃣.7 NB2 价格预览 GET

在提交前先计算费用，避免余额不足。免登录，智能体可在生成前先调用此接口确认价格。

GET/php/api_image_gen_nb2.php?action=price&quantity=2

参数	类型	必填	说明
`quantity`	int	否	生成数量 1~4，默认 1（超出自动截断到 4）

// 请求
GET /php/api_image_gen_nb2.php?action=price&quantity=3

// 响应
{
  "success": true,
  "unit_price": 0.20,
  "quantity": 3,
  "total": 0.60,
  "currency": "CNY"
}

价格表

张数	总费用	单张均价
1 张	¥0.20	¥0.20
2 张	¥0.40	¥0.20
3 张	¥0.60	¥0.20
4 张	¥0.80	¥0.20

💡 与 image2 价格对比：
• NB2：¥0.20/张（固定）
• image2 会员价：¥0.28/张
• image2 游客价：¥0.50/张
NB2 性价比最高，适合大批量生图场景

1️⃣5️⃣ 视频拼接 POST 同步

将多段视频按顺序拼接成一段完整视频。适用于品牌宣传片多片段拼接、多角度展示拼接等场景。同步接口，直接返回结果，无需轮询。

POST/php/agent_api.php/video-concat

参数	类型	必填	说明
`video_urls`	array[string]	是	视频URL数组，2-10个，按顺序拼接

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/video-concat" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"video_urls": ["https://oss.../clip1.mp4", "https://oss.../clip2.mp4", "https://oss.../clip3.mp4"]}'

→ {"success":true, "data":{
    "video_url": "http://mathmind-files.oss.../merged.mp4",
    "download_url": "http://mathmind-files.oss.../merged.mp4?attachment=1",
    "task_id": "xxx"
  }, "message": "拼接成功"}

⚠️ 注意：同步接口，直接返回结果。视频URL必须公网可访问，单文件 < 30MB，总数 ≤ 10 个。

1️⃣6️⃣ 视频裁剪 POST 同步

按百分比截取视频片段。适用于截取精华片段、去掉开头结尾等场景。同步接口，直接返回结果，无需轮询。

POST/php/agent_api.php/video-cut

参数	类型	必填	说明
`video_url`	string	是	原视频URL
`start_percent`	int	否	开始位置百分比(0-100)，默认0
`end_percent`	int	否	结束位置百分比(0-100)，默认100

curl -X POST "https://www.aiom.com.cn/php/agent_api.php/video-cut" \
    -H "Authorization: Bearer <token>" \
    -H "Content-Type: application/json" \
    -d '{"video_url": "https://oss.../original.mp4", "start_percent": 20, "end_percent": 60}'

→ {"success":true, "data":{
    "video_url": "http://mathmind-files.oss.../trimmed.mp4",
    "download_url": "http://mathmind-files.oss.../trimmed.mp4?attachment=1",
    "task_id": "xxx"
  }, "message": "裁剪成功"}

💡 说明：start_percent 和 end_percent 是百分比，不是秒数。例：30秒视频，start=20, end=60 → 截取第6秒到第18秒。

1️⃣7️⃣ 提示词模板查询 GET

按场景和行业获取生图prompt、生视频prompt、文案模板。智能体做视频前先调用此接口获取对应行业的提示词模板，填入方括号内容即可直接使用。

GET/php/agent_api.php/prompt-templates?scene=promo&industry=零食

参数	类型	必填	说明
`scene`	string	否	场景：promo(带货视频) / oral(口播视频) / showcase(产品展示) / brand(品牌宣传)。不传返回所有场景概览
`industry`	string	否	行业：零食 / 餐饮 / 美妆 / 服装 / 3C数码 / 饮品。不传返回该场景所有行业

💡 MCP工具：智能体通过 MCP 调用 get_prompt_templates 工具获取模板，无需走 HTTP API。

📁 查询全部素材 GET

GET/php/agent_api.php/resources

curl "https://www.aiom.com.cn/php/agent_api.php/resources" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "data":{
    "recordings": [{"id":1, "title":"男声-客服", "audio_url":"https://...", "tags":"男声,客服"}],
    "videos": [{"id":1, "title":"正面半身", "video_url":"https://...", "tags":"正面,西装"}]
  }}

💳 查询余额与套餐 GET

查询用户余额、当前套餐单价、今日/累计使用量。

GET/php/api_img_credits.php?action=balance

curl "https://www.aiom.com.cn/php/api_img_credits.php?action=balance" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "balance":99.72, "tier":"vip", "tier_name":"VIP会员",
   "unit_price":0.28, "today_used":3, "total_used":15, "total_cost":4.20}

其他操作

action	说明
`balance`	查询余额、套餐、使用量（需登录）
`pricing`	查询充值套餐列表和模型单价（无需登录）
`orders`	查询生图订单历史（需登录，分页）

GET /php/api_img_credits.php?action=pricing
GET /php/api_img_credits.php?action=orders&page=1

📋 查询TTS合成记录 GET

获取用户的语音合成历史记录，包含合成状态和音频URL。

GET/php/get_voice_synthesis.php

curl "https://www.aiom.com.cn/php/get_voice_synthesis.php" \
    -H "Authorization: Bearer <token>"

→ {"success":true, "records":[
    {"id":1, "task_id":"xxx", "status":1, "status_text":"成功",
     "chuangke_url":"https://.../voice.mp3", "created_at":"2026-05-22 14:30"}
  ]}

💡 说明：status: 0=进行中, 1=成功, 2=失败。保留最近30天记录。

🔌 MCP服务接入

AIOM 提供 MCP (Model Context Protocol) 服务，支持智能体通过标准MCP协议连接。

端点	URL
SSE连接	`http://47.94.137.152:3100/sse`
健康检查	`http://47.94.137.152:3100/health`

MCP 工具列表

工具名	说明	费用
`register`	注册AIOM账号（手机号/邮箱）	免费
`send_email_code`	发送邮箱验证码	免费
`get_recordings`	获取录音列表（audio_url用于TTS）	免费
`get_videos`	获取视频列表（video_url用于对口型）	免费
`upload_recording`	上传录音（音色素材，公网URL）	免费
`upload_video`	上传视频素材（公网URL）	免费
`voice_synthesis`	语音合成TTS（需audio_url，不支持voice_id）	按量
`lip_sync`	对口型	2元/分钟
`add_subtitle`	普通字幕（无动画，自动ASR）	免费
`animate_render`	动画字幕渲染（炫酷动画效果）	免费
`get_animate_status`	查询动画渲染状态	免费
`generate_video`	AI视频生成（Seedance 2.0 / 1.5 Pro）	按时长
`query_video_status`	查询视频生成状态	免费
`generate_image`	AI生图（image2 文生图/图生图）	按张
`query_image_status`	查询生图状态	免费
`generate_image_nb2`	🆕 AI生图（NB2 文生图/图生图，便宜29%）	¥0.20/张
`query_nb2_status`	查询NB2生图状态	免费
`nb2_price`	NB2价格预览（免登录）	免费
`get_experts`	获取专家团队列表（免认证）	免费
`get_expert_recipe`	获取专家执行配方（免认证）	免费

{
    "mcpServers": {
        "aiom": {
            "url": "http://47.94.137.152:3100/sse",
            "headers": { "Authorization": "Bearer <token>" }
        }
    }
}

💰 计费说明

功能	计费方式	会员价	游客价
对口型	按视频时长（秒）	2元/分钟	2元/分钟
普通字幕	免费	免费	免费
动画字幕渲染	免费	免费	免费
语音合成(TTS)	按次数	按第三方API消耗
AI生图(KIMGA2)	按张数×分辨率	1K: 0.28 · 2K: 0.40 · 4K: 1.00 元/张
🆕 NanoBanana 2 (NB2)	按张数	0.20元/张（固定价）
Seedance 2.0	按时长（秒）	480p 0.8元/秒 · 720p 1.2元/秒
Seedance 1.5 Pro	按时长（秒）	480p 0.3元/秒 · 720p 0.5元/秒

计费公式

对口型：费用 = (视频秒数 ÷ 60) × 2
  例：30秒 = 1.00元 · 60秒 = 2.00元 · 120秒 = 4.00元

AI生图(KIMGA2)：费用 = 单价(分辨率) × 张数
  1K：0.28 × 1 = 0.28元（默认）
  2K：0.40 × 1 = 0.40元
  4K：1.00 × 1 = 1.00元（高清）

视频生成：费用 = 每秒单价 × 时长
  Seedance 1.5 Pro 720p 5秒 = 0.5 × 5 = 2.50元

💡 说明：生成失败自动退回余额，不会扣费。累计消费满99元自动升级VIP生图单价。

❓ 常见问题

Q: TTS为什么不能用voice_id？

AIOM的TTS采用"10秒音频样本提取音色"的方式，不支持voice_id。请先调用 GET /recordings 获取录音列表，用录音的 audio_url 作为TTS的音色来源。

Q: 普通字幕和动画字幕渲染怎么选？

普通字幕(add_subtitle)：自动ASR识别，无需传文案，简单快速，适合只需要基础字幕的场景。
动画字幕渲染(animate_render)：炫酷动画效果，自动ASR识别无需传文案，适合需要视觉冲击力的营销视频。两者都免费。

Q: 对口型视频URL从哪里获取？

调用 GET /videos 获取用户的视频列表，选一条取其 video_url。

Q: 生成失败会扣费吗？

不会。任务失败自动退款。

Q: 动画字幕渲染完成后视频URL在哪？

轮询 GET /animate/status?task_id=xxx，status 为 completed 时返回的 video_url 就是成品视频地址（OSS直链）。

Q: image2 和 NB2 怎么选？

NB2（¥0.20/张）：价格便宜 29%，适合大批量生图、产品图批量出图、对成本敏感的场景。
image2（¥0.28/张会员 / ¥0.5/张游客）：上游是 gpt-image-1，效果更稳定，适合对画质要求高、单次少量生成的场景。
两者用法几乎一致（prompt / images / size / quantity），智能体可按需切换。

1️⃣5️⃣ 上传图片素材 POST

上传图片素材，供Seedance 2.0全能参考模式使用。图片是推"全能参考"的前提——没有图片上传，ref_images智能体没图可用。

POST/php/agent_api.php/upload-image

参数	类型	必填	说明
image_url	string	必填	图片公网URL
title	string	必填	图片标题，如"芒果干包装图"
image_type	string	必填	图片类型：product(产品)/storefront(门头)/environment(环境)/other(其他)
tags	string	否	标签，如"零食,芒果"

POST /php/agent_api.php/upload-image
Authorization: Bearer YOUR_TOKEN

{
  "image_url": "https://example.com/mango.jpg",
  "title": "芒果干包装图",
  "image_type": "product",
  "tags": "零食,芒果"
}

// 响应
{
  "success": true,
  "data": {
    "image_id": 1,
    "image_url": "https://example.com/mango.jpg",
    "title": "芒果干包装图",
    "image_type": "product",
    "tags": "零食,芒果"
  },
  "message": "Image uploaded successfully"
}

1️⃣6️⃣ 获取图片列表 GET

GET/php/agent_api.php/images

获取用户上传的所有图片素材。支持按 image_type 过滤。

GET /php/agent_api.php/images
Authorization: Bearer YOUR_TOKEN

// 按类型过滤
GET /php/agent_api.php/images?image_type=product

// 响应
{
  "success": true,
  "data": {
    "images": [
      { "id": 1, "title": "芒果干包装图", "image_url": "...", "image_type": "product", "tags": "零食,芒果" }
    ],
    "count": 1
  }
}

🤖 智能体快速指南

如果你是第一次使用AIOM的智能体，按这个流程走就能帮商家做出宣传片。

第一步：了解你的主人

第一次跟主人对话时，自然地了解以下信息，记下来以后不用再问。

必须知道：

店铺叫什么？→ 视频里要出现品牌名
做什么行业的？→ 决定视觉风格和话术
想宣传什么？→ 决定画面拍什么

问了效果更好的：

客群是谁？→ 附近居民=接地气，年轻人=清新，上班族=干净利落
想突出的卖点？→ 写进视频开头钩子，如"纯手工""进口的""三十年老店"
想要什么感觉？→ 高级感/温暖接地气/热闹促销/清新文艺

防止翻车：

有什么不能出现的？→ 如零食店不喊价、餐饮店不用"最"字
店铺地址？→ 视频结尾引导用

💡 不用一次问完，主人说"帮我做个芒果干广告"，你就知道行业=零食、产品=芒果干，补问一两个就够了。

第二步：按行业选风格

不同行业的视频风格完全不同：

行业	画面	色调	话术
零食/食品	产品特写，暖光，食欲感	暖黄、橙色	选品故事、真实体验，软营销不喊价
餐饮/小吃	制作过程、热气腾腾	暖色、红色	烟火气、"每天现做"
美容/护肤	干净高级、质感摆拍	白、粉、金	效果对比、成分故事
服装/穿搭	穿搭场景、生活化	按季节	穿搭建议、场景代入
水果/生鲜	新鲜水润、色彩饱满	跟水果走	新鲜、产地、时令
其他服务	工作场景、专业工具	蓝、灰	专业靠谱、省心省力

第三步：选择创作模式

模式A：AI宣传片（推荐，无需真人素材）

适合所有商家，特别是新店、没有真人出镜素材的。

完整流程：

上传产品图片（如有）
POST /upload-image → 获得 image_url
AI生图（可选，没有产品图时先生成一张）
POST /image-gen，prompt = 按行业风格 + 产品描述
→ 轮询 /image-gen/status 获得图片URL
AI生视频
POST /video-gen 或 POST /seedance
方案一（有产品图，推荐）：用Seedance 1.5 Pro + 首帧图片
{"prompt":"手缓慢拿起芒果干撕开，特写镜头推进，暖黄自然光","model":"seedance15pro","first_frame_url":"图片URL","duration":5,"resolution":"480p","ratio":"9:16"}

方案二（有产品图要参考，不锁定画面）：用Seedance 2.0全能参考
{"prompt":"芒果干产品展示，温暖食欲感，特写镜头","ref_images":["产品图URL"],"duration":5,"ratio":"9:16"}
💰 全能参考模式 ¥0.70/秒，比纯文生便宜42%！

方案三（没有图片）：纯文字生成
{"prompt":"厚实的芒果干铺在木桌上，手缓慢拿起一片撕开，暖黄自然光，食物摄影风格","duration":5,"ratio":"9:16"}
→ 轮询 /video-gen/status 或 /seedance?action=status 获得视频URL
重复2-3生成3-5个片段（可选）
告诉主人：视频片段已生成

模型选择建议：

场景	推荐模型	价格	理由
日常商家宣传片	Seedance 1.5 Pro	¥0.30/秒(480p)	性价比最高，支持首帧图控制画面
需要参考图/视频/音频	🔥 Seedance 2.0 全能参考	¥0.70/秒(720p)	全能参考，效果最好
不在乎价格要最好的	Seedance 2.0	¥0.70-1.20/秒	最新模型，效果最佳

模式B：对口型口播视频（需要真人素材）

适合有真人出镜视频和录音的商家。

查素材：GET /resources
写文案（根据行业风格模板）
TTS：POST /tts（用主人的录音audio_url）
对口型：POST /lip-sync
字幕：POST /subtitle

💡 两种模式可以组合：AI生成的产品视频 + 老板口播片段，拼接后效果更好。

提示词公式

生图prompt = 产品 + 场景 + 光线 + 风格 + 配色

示例："厚实的芒果干铺在木桌上，自然光，暖黄色调，旁边放几片新鲜芒果，食物摄影风格"

生视频prompt = 生图描述 + 动作/变化 + 镜头运动

示例："手缓慢拿起一片厚实的芒果干撕开，果肉拉丝质感，特写镜头缓缓推进，暖黄自然光"

常见翻车点

问题	怎么避免
生图太假像AI	prompt加"自然光""真实质感""食物摄影风格"
生视频画面乱动	加"缓慢""特写""稳定画面"
文案不像老板说的	用口语："我吃了三包停不下来" > "品质上乘"
视频太长	15-30秒最好，一个卖点讲透
结尾太硬	"导航就在左下角" > "快来购买吧"

完整示例：味蕾乐芒果干宣传片

主人说："帮我做个芒果干广告"

智能体判断：行业=零食，产品=芒果干，风格=暖黄食欲感

确认："这个芒果干有什么特别的？" → "菲律宾进口的，很厚实"

确认："想要接地气还是高级一点？" → "接地气"

# 1. 先生产品图
POST /php/agent_api.php/image-gen
{
  "prompt": "厚实的菲律宾芒果干铺在木桌上，自然光，暖黄色调，食物摄影风格",
  "quantity": 1,
  "size": "auto"
}

# 2. 等图片生成完成，用图片做首帧生视频
POST /php/agent_api.php/video-gen
{
  "prompt": "手缓慢拿起一片厚实的芒果干撕开，果肉拉丝质感，特写镜头缓缓推进，暖黄自然光",
  "model": "seedance15pro",
  "first_frame_url": "{图片URL}",
  "duration": 5,
  "resolution": "480p",
  "ratio": "9:16"
}

# 3. 再生成一个片段（包装展示）
POST /php/agent_api.php/image-gen
{
  "prompt": "打开的芒果干包装袋，产品散落摆放，自然光，木桌，暖色调，产品摄影",
  "quantity": 1,
  "size": "auto"
}

# 4. 同样用首帧生视频
POST /php/agent_api.php/video-gen
{
  "prompt": "镜头从包装袋缓缓推近到芒果干特写，暖黄自然光，食欲感",
  "model": "seedance15pro",
  "first_frame_url": "{第二张图片URL}",
  "duration": 5,
  "resolution": "480p",
  "ratio": "9:16"
}

# 完成！2个5秒片段，总成本约3元（生图0.28×2 + 生视频1.5×2）