Generates images, videos, and audio via fal.ai MCP. Supports text-to-image, text/image-to-video, text-to-speech, and video-to-audio tasks.
How this skill is triggered — by the user, by Claude, or both
Slash command
/everything-claude-code:fal-ai-mediaThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
> **易漂移技能。** fal.ai 模型 ID、定价、输入参数和 MCP 工具名称
易漂移技能。 fal.ai 模型 ID、定价、输入参数和 MCP 工具名称 变化很快。在承诺特定模型、参数、输出格式或成本之前, 请搜索或获取当前模型元数据。
通过 MCP 使用 fal.ai 模型生成图像、视频和音频。
必须配置 fal.ai MCP 服务器。添加到 ~/.claude.json:
"fal-ai": {
"command": "npx",
"args": ["-y", "fal-ai-mcp-server"],
"env": { "FAL_KEY": "YOUR_FAL_KEY_HERE" }
}
在 fal.ai 获取 API 密钥。
fal.ai MCP 提供以下工具:
search — 按关键词查找可用模型find — 获取模型详情和参数generate — 使用参数运行模型result — 检查异步生成状态status — 检查作业状态cancel — 取消正在运行的作业estimate_cost — 估算生成成本models — 列出热门模型upload — 上传文件作为输入适用于:快速迭代、草稿、文本转图像、图像编辑。
generate(
app_id: "fal-ai/nano-banana-2",
input_data: {
"prompt": "日落时的未来主义城市景观,赛博朋克风格",
"image_size": "landscape_16_9",
"num_images": 1,
"seed": 42
}
)
适用于:生产图像、写实主义、排版、详细提示。
generate(
app_id: "fal-ai/nano-banana-pro",
input_data: {
"prompt": "大理石表面上无线耳机的专业产品照片,影棚灯光",
"image_size": "square",
"num_images": 1,
"guidance_scale": 7.5
}
)
| 参数 | 类型 | 选项 | 说明 |
|---|---|---|---|
prompt | string | 必填 | 描述你想要的内容 |
image_size | string | square、portrait_4_3、landscape_16_9、portrait_16_9、landscape_4_3 | 宽高比 |
num_images | number | 1-4 | 生成数量 |
seed | number | 任意整数 | 可复现性 |
guidance_scale | number | 1-20 | 遵循提示的紧密程度(越高 = 越字面) |
使用 Nano Banana 2 配合输入图像进行内补绘制、外补绘制或风格迁移:
# 首先上传源图像
upload(file_path: "/path/to/image.png")
# 然后使用图像输入生成
generate(
app_id: "fal-ai/nano-banana-2",
input_data: {
"prompt": "同一场景但为水彩画风格",
"image_url": "<uploaded_url>",
"image_size": "landscape_16_9"
}
)
适用于:文本转视频、高质量运动的图像转视频。
generate(
app_id: "fal-ai/seedance-1-0-pro",
input_data: {
"prompt": "无人机飞越黄昏时分的山间湖泊,电影风格",
"duration": "5s",
"aspect_ratio": "16:9",
"seed": 42
}
)
适用于:带原生音频生成的文本/图像转视频。
generate(
app_id: "fal-ai/kling-video/v3/pro",
input_data: {
"prompt": "海浪拍打岩石海岸,戏剧性的云层",
"duration": "5s",
"aspect_ratio": "16:9"
}
)
适用于:带生成音频的视频,高视觉质量。
generate(
app_id: "fal-ai/veo-3",
input_data: {
"prompt": "熙熙攘攘的东京夜市,霓虹灯牌,人群噪音",
"aspect_ratio": "16:9"
}
)
从现有图像开始:
generate(
app_id: "fal-ai/seedance-1-0-pro",
input_data: {
"prompt": "镜头缓慢拉远,微风拂动树木",
"image_url": "<uploaded_image_url>",
"duration": "5s"
}
)
| 参数 | 类型 | 选项 | 说明 |
|---|---|---|---|
prompt | string | 必填 | 描述视频 |
duration | string | "5s"、"10s" | 视频时长 |
aspect_ratio | string | "16:9"、"9:16"、"1:1" | 画面比例 |
seed | number | 任意整数 | 可复现性 |
image_url | string | URL | 图像转视频的源图像 |
自然的、对话式质量的文本转语音。
generate(
app_id: "fal-ai/csm-1b",
input_data: {
"text": "你好,欢迎来到演示。让我向你展示这是如何工作的。",
"speaker_id": 0
}
)
从视频内容生成匹配的音频。
generate(
app_id: "fal-ai/thinksound",
input_data: {
"video_url": "<video_url>",
"prompt": "鸟鸣的森林环境音"
}
)
对于专业语音合成,直接使用 ElevenLabs:
import os
import requests
resp = requests.post(
"https://api.elevenlabs.io/v1/text-to-speech/<voice_id>",
headers={
"xi-api-key": os.environ["ELEVENLABS_API_KEY"],
"Content-Type": "application/json"
},
json={
"text": "你的文本在这里",
"model_id": "eleven_turbo_v2_5",
"voice_settings": {"stability": 0.5, "similarity_boost": 0.75}
}
)
with open("output.mp3", "wb") as f:
f.write(resp.content)
如果已配置 VideoDB,使用其生成式音频:
# 语音生成
audio = coll.generate_voice(text="你的旁白在这里", voice="alloy")
# 音乐生成
music = coll.generate_music(prompt="欢快的电子背景音乐", duration=30)
# 音效
sfx = coll.generate_sound_effect(prompt="雷鸣后接雨声")
在生成之前,检查预估成本:
estimate_cost(
estimate_type: "unit_price",
endpoints: {
"fal-ai/nano-banana-pro": {
"unit_quantity": 1
}
}
)
查找特定任务的模型:
search(query: "text to video")
find(endpoint_ids: ["fal-ai/seedance-1-0-pro"])
models()
seed 在迭代提示时获得可复现的结果estimate_costvideodb — 视频处理、编辑和流媒体video-editing — AI 驱动的视频编辑工作流content-engine — 社交平台的内容创作npx claudepluginhub aaione/everything-claude-code-zhGenerates images, videos, and audio via fal.ai MCP. Covers text-to-image, text/image-to-video, text-to-speech, and video-to-audio.
Generates AI images (Nano Banana), videos (Seedance, Kling, Veo 3), speech (CSM-1B), and audio via fal.ai MCP tools. Handles prompts, uploads, async jobs for media tasks.
Generates AI videos using Google Veo models via nano-banana CLI for text-to-video, image animation, lip-sync dialogue, and scene extensions.