Gemini 3.5 Flash:2026年5月19日Google I/O发布(289 tokens/秒,1M上下文,免费层5 RPM/25万TPM/20 RPD);Gemini 4.0:已发布(原生多模态架构,2小时4K视频分析,端云协同,免费层政策待确认);Gemini 3 Flash:输入输出token免费(5 RPM/25万TPM/20 RPD);Gemini 2.5 Flash:输入输出token免费(5 RPM/25万TPM/20 RPD);Gemini 2.5 Flash-Lite:输入输出token免费(10 RPM/25万TPM/20 RPD);Gemini 3.1 Flash-Lite 预览版:输入输出token免费(15 RPM/25万TPM/500 RPD);Gemini 3.1 Flash TTS:文本转语音免费(3 RPM/10K TPM/10 RPD);Gemini 2.5 Flash TTS:文本转语音免费(3 RPM/10K TPM/10 RPD);Gemini Robotics-ER 1.6/1.5:免费预览(5 RPM/25万TPM/20 RPD);Gemma 3/4系列:免费(30 RPM/15K TPM/14400 RPD);Google搜索/地图接地:500 RPD免费;⚠️ Gemini 2.5 Pro及Gemini 3.1 Pro自2026年4月1日起移除免费层(已转为付费);免费层不适用于EU/EEA/UK地区(需同意数据训练)
gemini-3.5-flash gemini-4.0 gemini-3-flash gemini-2.5-flash gemini-2.5-flash-lite gemini-3.1-flash-lite-preview +11
Google AI Studio (Gemini) 每日重置(永久免费层) × 免费额度 Gemini 3.5 Flash:2026年5月19日Google I/O发布(289 tokens/秒,1M上下文,免费层5 RPM/25万TPM/20 RPD);Gemini 4.0:已发布(原生多模态架构,2小时4K视频分析,端云协同,免费层政策待确认);Gemini 3 Flash:输入输出token免费(5 RPM/25万TPM/20 RPD);Gemini 2.5 Flash:输入输出token免费(5 RPM/25万TPM/20 RPD);Gemini 2.5 Flash-Lite:输入输出token免费(10 RPM/25万TPM/20 RPD);Gemini 3.1 Flash-Lite 预览版:输入输出token免费(15 RPM/25万TPM/500 RPD);Gemini 3.1 Flash TTS:文本转语音免费(3 RPM/10K TPM/10 RPD);Gemini 2.5 Flash TTS:文本转语音免费(3 RPM/10K TPM/10 RPD);Gemini Robotics-ER 1.6/1.5:免费预览(5 RPM/25万TPM/20 RPD);Gemma 3/4系列:免费(30 RPM/15K TPM/14400 RPD);Google搜索/地图接地:500 RPD免费;⚠️ Gemini 2.5 Pro及Gemini 3.1 Pro自2026年4月1日起移除免费层(已转为付费);免费层不适用于EU/EEA/UK地区(需同意数据训练)
接入参数 API 地址 https://generativelanguage.googleapis.com
支持模型(17) gemini-3.5-flash gemini-4.0 gemini-3-flash gemini-2.5-flash gemini-2.5-flash-lite gemini-3.1-flash-lite-preview gemini-3.1-flash-tts gemma-3-27b-it gemma-3-12b-it gemma-3-4b-it gemma-3-1b-it gemma-4-31b-it gemma-4-26b-a4b-it gemma-4-9b-it gemini-robotics-er-1.6 gemini-2.5-flash-tts gemini-robotics-er-1.5
新用户开通即赠 7000万Tokens + 100张AI生图 + 50秒视频生成额度(免费领取、无需绑卡);Qwen-Turbo、Qwen-Plus等模型100万tokens/天内免费调用;另赠200元无门槛代金券;DataWorks API已调整为按量付费(标准版10万次/月、专业版50万次/月);2026年5月20日阿里云峰会宣布全面开放接入第三方大模型:已上架智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、Pixverse-v6、可灵、Vidu Q3、阶跃星辰等;模型列表新增Qwen3.5-Omni、Qwen3-Coder-Plus、DeepSeek-R1-0528等;新推出Coding Plan Lite版(首月7.9元无限调用Qwen3-Coder)
qwen-plus qwen-turbo qwen-long qwen2.5-72b-instruct qwen2.5-32b-instruct deepseek-r1 +6
阿里云百炼 有效期180天(此前为90天);免费额度用完可开启「用完即停」避免扣费 × 免费额度 新用户开通即赠 7000万Tokens + 100张AI生图 + 50秒视频生成额度(免费领取、无需绑卡);Qwen-Turbo、Qwen-Plus等模型100万tokens/天内免费调用;另赠200元无门槛代金券;DataWorks API已调整为按量付费(标准版10万次/月、专业版50万次/月);2026年5月20日阿里云峰会宣布全面开放接入第三方大模型:已上架智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、Pixverse-v6、可灵、Vidu Q3、阶跃星辰等;模型列表新增Qwen3.5-Omni、Qwen3-Coder-Plus、DeepSeek-R1-0528等;新推出Coding Plan Lite版(首月7.9元无限调用Qwen3-Coder)
接入参数 API 地址 https://dashscope.aliyuncs.com/compatible-mode/v1
支持模型(12) qwen-plus qwen-turbo qwen-long qwen2.5-72b-instruct qwen2.5-32b-instruct deepseek-r1 deepseek-v3 glm-4-flash kimi-k2.5 qwen3.5-omni qwen3-coder-plus deepseek-r1-0528
【永久免费不限量】ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny 系列永久免费调用不限量(仅QPS限速50次/秒);ERNIE-3.5-8K 永久免费不限量;ERNIE-4.5-Turbo、DeepSeek(R1/V3系列)、Qwen3、Kimi K2.5 等主流模型每模型 100万 token(3个月有效);新用户注册送150万tokens,企业认证送200万tokens;2026年2月上线千帆Coding Plan;ERNIE-Speed/Lite从有限免费升级为完全免费不限量
ernie-4.5-turbo-128k ernie-4.5-turbo-32k ernie-x1-turbo-32k ernie-3.5-8k ernie-speed-8k ernie-lite-8k +9
百度千帆 Speed/Lite/3.5系列永久免费;主流模型额度3个月有效(自开通起算) × 免费额度 【永久免费不限量】ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny 系列永久免费调用不限量(仅QPS限速50次/秒);ERNIE-3.5-8K 永久免费不限量;ERNIE-4.5-Turbo、DeepSeek(R1/V3系列)、Qwen3、Kimi K2.5 等主流模型每模型 100万 token(3个月有效);新用户注册送150万tokens,企业认证送200万tokens;2026年2月上线千帆Coding Plan;ERNIE-Speed/Lite从有限免费升级为完全免费不限量
接入参数 API 地址 https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions
支持模型(15) ernie-4.5-turbo-128k ernie-4.5-turbo-32k ernie-x1-turbo-32k ernie-3.5-8k ernie-speed-8k ernie-lite-8k deepseek-r1 deepseek-r1-250528 deepseek-v3-250324 deepseek-v3.1-250821 kimi-k2-instruct qwen3-235b-a22b-instruct qwen3-30b-a3b-instruct qwen3-coder-480b-a35b-instruct ernie-tiny-8k
首次开通赠送 100万 token(通用包,1年有效)+ 100万 Embedding token;Hunyuan-lite 永久免费不限量;Hunyuan-T1(超大规模推理)、Hunyuan-TurboS(快思考)、Hunyuan-A13B(混合推理)均在通用包内;【额外】微信「AI小程序成长计划」:开发者可在小程序后台申领1亿混元文生文token + 1万张文生图额度(2026全年有效,至2026年12月31日);⚠️ 混元HY2.0模型输入价格已涨463%(从0.0008元/千Token涨至0.004505元/千Token),第三方模型免费公测已结束;⚠️ 原腾讯混元大模型平台将于2026年9月30日全面停服,建议迁移至TokenHub平台使用hy3-preview替代
hunyuan-t1 hunyuan-turbo-s hunyuan-a13b hunyuan-lite hunyuan-vision hunyuan-7b
腾讯混元 通用包1年有效;Lite版永久免费;小程序成长计划2026年12月31日前有效 × 免费额度 首次开通赠送 100万 token(通用包,1年有效)+ 100万 Embedding token;Hunyuan-lite 永久免费不限量;Hunyuan-T1(超大规模推理)、Hunyuan-TurboS(快思考)、Hunyuan-A13B(混合推理)均在通用包内;【额外】微信「AI小程序成长计划」:开发者可在小程序后台申领1亿混元文生文token + 1万张文生图额度(2026全年有效,至2026年12月31日);⚠️ 混元HY2.0模型输入价格已涨463%(从0.0008元/千Token涨至0.004505元/千Token),第三方模型免费公测已结束;⚠️ 原腾讯混元大模型平台将于2026年9月30日全面停服,建议迁移至TokenHub平台使用hy3-preview替代
接入参数 API 地址 https://api.hunyuan.cloud.tencent.com/v1
支持模型(6) hunyuan-t1 hunyuan-turbo-s hunyuan-a13b hunyuan-lite hunyuan-vision hunyuan-7b
每日 200万 token(支持豆包系列、DeepSeek-V3.2、Kimi-K2 等主流模型,永久免费);另每个新开通模型赠送 50万 token 新人包+冷启动包;2026年3月新增 Doubao-Seed-2.0 Lite 免费变体
doubao-lite-4k doubao-lite-32k doubao-pro-32k doubao-pro-128k deepseek-r1 deepseek-v3-241226 +3
火山引擎(豆包) 每日重置(永久免费);新人赠送额度一次性 × 免费额度 每日 200万 token(支持豆包系列、DeepSeek-V3.2、Kimi-K2 等主流模型,永久免费);另每个新开通模型赠送 50万 token 新人包+冷启动包;2026年3月新增 Doubao-Seed-2.0 Lite 免费变体
接入参数 API 地址 https://ark.cn-beijing.volces.com/api/v3
支持模型(9) doubao-lite-4k doubao-lite-32k doubao-pro-32k doubao-pro-128k deepseek-r1 deepseek-v3-241226 kimi-k2 kimi-k2.5 doubao-seed-2.0-lite
新用户注册即领 2000万 token(永久有效);完成新手任务可额外领取 1000万 token,累计最高 3000万 token;完成实名认证再赠 16元 代金券;支持DeepSeek-V4、Llama、Qwen等主流开源模型,完全兼容OpenAI格式;基础用户QPS=5,TPM=100k;部分轻量级模型提供永久免费调用额度;推理速度比行业领先平台快2.3倍
deepseek-ai/DeepSeek-V3 deepseek-ai/DeepSeek-R1 deepseek-ai/DeepSeek-V4-Flash Qwen/Qwen2.5-72B-Instruct Qwen/Qwen2.5-32B-Instruct meta-llama/Llama-3.3-70B-Instruct +2
硅基流动(SiliconFlow) 2000万token永久有效;实名认证代金券一次性赠送 × 免费额度 新用户注册即领 2000万 token(永久有效);完成新手任务可额外领取 1000万 token,累计最高 3000万 token;完成实名认证再赠 16元 代金券;支持DeepSeek-V4、Llama、Qwen等主流开源模型,完全兼容OpenAI格式;基础用户QPS=5,TPM=100k;部分轻量级模型提供永久免费调用额度;推理速度比行业领先平台快2.3倍
接入参数 API 地址 https://api.siliconflow.cn/v1
支持模型(8) deepseek-ai/DeepSeek-V3 deepseek-ai/DeepSeek-R1 deepseek-ai/DeepSeek-V4-Flash Qwen/Qwen2.5-72B-Instruct Qwen/Qwen2.5-32B-Instruct meta-llama/Llama-3.3-70B-Instruct THUDM/glm-4-flash Qwen/Qwen2-VL-72B-Instruct
新用户注册赠送 2000万 token(此前为500万,已大幅提升,永久有效);GLM-4-Air:每月100万tokens(长期有效,每月自动重置);GLM-4V(多模态):每月50万tokens(长期有效);GLM-4-Flash、GLM-4.7-Flash 永久免费调用(cost=0,30 QPS);GLM-5-Turbo、GLM-5 等旗舰模型按量付费;每日签到送1万tokens,邀请好友送50万tokens;⚠️ GLM-4.5-Flash已于2026年1月下线,自动路由到GLM-4.7-Flash;GLM-4.6V-Flash免费视觉模型可用;GLM-5.1(744B/40B激活)已发布;2026年内智谱进行了三次API价格上调,GLM-5国内API价格提升约50%;GLM Coding Plan旧套餐已于2026年4月30日关闭迁移
glm-5 glm-5-turbo glm-4.7-flash glm-4.7-coder glm-4.6v glm-4.5-air +7
智谱AI 新用户500万token;Flash系列模型永久免费;GLM-4-Air每月100万tokens自动重置;GLM-5系列按量付费 × 免费额度 新用户注册赠送 2000万 token(此前为500万,已大幅提升,永久有效);GLM-4-Air:每月100万tokens(长期有效,每月自动重置);GLM-4V(多模态):每月50万tokens(长期有效);GLM-4-Flash、GLM-4.7-Flash 永久免费调用(cost=0,30 QPS);GLM-5-Turbo、GLM-5 等旗舰模型按量付费;每日签到送1万tokens,邀请好友送50万tokens;⚠️ GLM-4.5-Flash已于2026年1月下线,自动路由到GLM-4.7-Flash;GLM-4.6V-Flash免费视觉模型可用;GLM-5.1(744B/40B激活)已发布;2026年内智谱进行了三次API价格上调,GLM-5国内API价格提升约50%;GLM Coding Plan旧套餐已于2026年4月30日关闭迁移
接入参数 API 地址 https://open.bigmodel.cn/api/paas/v4
支持模型(13) glm-5 glm-5-turbo glm-4.7-flash glm-4.7-coder glm-4.6v glm-4.5-air glm-4.5-flash glm-4.5-plus glm-4-flash glm-4-flash-thinking glm-4-plus glm-4 glm-4-long
Llama 3.1 8B:30 RPM / 6K TPM / 14,400 RPD(最高频次);Llama 3.3 70B:30 RPM / 12K TPM / 1000 RPD;Llama 4 Scout:30 RPM / 30K TPM / 1000 RPD;Kimi K2 Instruct:60 RPM / 10K TPM / 1000 RPD;Qwen3 32B:30 RPM / 6K TPM / 1000 RPD;Allam 2 7B:7,000 RPD / 6K TPM;Groq Compound:30 RPM / 70K TPM / 250 RPD;Groq Compound-Mini:30 RPM / 70K TPM / 250 RPD;GPT-OSS 120B:8K TPM / 1000 RPD;GPT-OSS 20B:8K TPM / 1000 RPD;GPT-OSS Safeguard 20B:8K TPM / 1000 RPD;Whisper:20 RPM / 2000 RPD;基于自研 LPU 芯片超高速推理(700+ tokens/秒),多模型永久免费层
llama-3.3-70b-versatile llama-3.1-70b-versatile llama-3.1-8b-instant meta-llama/llama-4-scout-17b-16e-instruct moonshotai/kimi-k2-instruct moonshotai/kimi-k2-instruct-0905 +11
免费额度 Llama 3.1 8B:30 RPM / 6K TPM / 14,400 RPD(最高频次);Llama 3.3 70B:30 RPM / 12K TPM / 1000 RPD;Llama 4 Scout:30 RPM / 30K TPM / 1000 RPD;Kimi K2 Instruct:60 RPM / 10K TPM / 1000 RPD;Qwen3 32B:30 RPM / 6K TPM / 1000 RPD;Allam 2 7B:7,000 RPD / 6K TPM;Groq Compound:30 RPM / 70K TPM / 250 RPD;Groq Compound-Mini:30 RPM / 70K TPM / 250 RPD;GPT-OSS 120B:8K TPM / 1000 RPD;GPT-OSS 20B:8K TPM / 1000 RPD;GPT-OSS Safeguard 20B:8K TPM / 1000 RPD;Whisper:20 RPM / 2000 RPD;基于自研 LPU 芯片超高速推理(700+ tokens/秒),多模型永久免费层
接入参数 API 地址 https://api.groq.com/openai/v1
支持模型(17) llama-3.3-70b-versatile llama-3.1-70b-versatile llama-3.1-8b-instant meta-llama/llama-4-scout-17b-16e-instruct moonshotai/kimi-k2-instruct moonshotai/kimi-k2-instruct-0905 qwen/qwen3-32b ibm/allam-2-7b-instruct groq/compound groq/compound-mini openai/gpt-oss-120b openai/gpt-oss-20b openai/gpt-oss-safeguard-20b mixtral-8x7b-32768 gemma2-9b-it whisper-large-v3 whisper-large-v3-turbo
Free Tier:每月 10亿 tokens(1 RPS/50万TPM),全模型免费(含 Mistral Large 3、Mistral Medium 3.1、Mistral Small 3.2、Magistral推理系列、Codestral/Devstral代码系列);需手机号验证,需同意数据训练;⚠️ 原 Experiment Plan(10亿token/月)已取消,但新免费层额度更大(从约100 credits/10万tokens大幅升级至10亿tokens/月)
mistral-large-latest mistral-medium-3 mistral-small-3.1 mistral-nemo codestral-latest codestral
Mistral AI 每月重置(Free Tier,10亿tokens/月;全模型免费;需手机号验证) × 免费额度 Free Tier:每月 10亿 tokens(1 RPS/50万TPM),全模型免费(含 Mistral Large 3、Mistral Medium 3.1、Mistral Small 3.2、Magistral推理系列、Codestral/Devstral代码系列);需手机号验证,需同意数据训练;⚠️ 原 Experiment Plan(10亿token/月)已取消,但新免费层额度更大(从约100 credits/10万tokens大幅升级至10亿tokens/月)
接入参数 API 地址 https://api.mistral.ai/v1
支持模型(6) mistral-large-latest mistral-medium-3 mistral-small-3.1 mistral-nemo codestral-latest codestral
20 RPM / 1000 RPM/月;模型共享月度配额;支持Command A+ 05-2026(最新)、Command A Reasoning、Command A Vision、Aya Expanse 32B、Aya Vision 32B等
c4ai-aya-expanse-32b c4ai-aya-vision-32b command-a-03-2025 command-a-plus-05-2026 command-a-reasoning-08-2025 command-a-translate-08-2025 +4
Cohere Trial Key免费(20 RPM / 1,000次/月) × 免费额度 20 RPM / 1000 RPM/月;模型共享月度配额;支持Command A+ 05-2026(最新)、Command A Reasoning、Command A Vision、Aya Expanse 32B、Aya Vision 32B等
接入参数 API 地址 https://api.cohere.ai/v1
支持模型(10) c4ai-aya-expanse-32b c4ai-aya-vision-32b command-a-03-2025 command-a-plus-05-2026 command-a-reasoning-08-2025 command-a-translate-08-2025 command-a-vision-07-2025 command-r-plus-08-2024 command-r-08-2024 embed-v4
gpt-oss-120b:30 RPM / 6万TPM / 900 RPH / 100万TPH / 14400 RPD / 100万TPD;Llama 3.1 8B:30 RPM / 6万TPM / 900 RPH / 100万TPH / 14400 RPD / 100万TPD;超高速推理(近3000 tokens/分钟);⚠️ Qwen3-235B/Qwen3-Coder-480B/Llama-4系列等模型可能已移出免费层,建议实测确认
llama-3.3-70b llama-3.1-8b qwen3-32b qwen3-235b-a22b qwen3-coder-480b-a35b llama-4-scout +2
Cerebras 每日重置(永久免费层,约14,400 RPD) × 免费额度 gpt-oss-120b:30 RPM / 6万TPM / 900 RPH / 100万TPH / 14400 RPD / 100万TPD;Llama 3.1 8B:30 RPM / 6万TPM / 900 RPH / 100万TPH / 14400 RPD / 100万TPD;超高速推理(近3000 tokens/分钟);⚠️ Qwen3-235B/Qwen3-Coder-480B/Llama-4系列等模型可能已移出免费层,建议实测确认
接入参数 API 地址 https://api.cerebras.ai/v1
支持模型(8) llama-3.3-70b llama-3.1-8b qwen3-32b qwen3-235b-a22b qwen3-coder-480b-a35b llama-4-scout llama-4-maverick gpt-oss-120b
新用户注册赠送500万Tokens(30天有效,无需信用卡);超出后纯按量付费;网页端chat.deepseek.com免费无次数限制;V4-Flash:输入1元/百万(缓存命中0.02元),输出2元/百万;V4-Pro:2026年5月22日宣布永久降价至原价1/4(2.5折优惠永久化),输入缓存命中0.025元/百万,输入未命中3元/百万,输出6元/百万;V4全系开源免费可商用;兼容OpenAI和Anthropic API格式;DeepSeek-V3-Lite:永久免费不限量(200万上下文,支持思维链可视化,QPS限制20,编程能力最强免费API);⚠️ deepseek-chat/deepseek-reasoner将于2026-07-24停用,请迁移至deepseek-v4-pro/deepseek-v4-flash;⚠️ deepseek-chat/deepseek-reasoner将于2026-07-24停用,请尽快迁移至deepseek-v4-pro/deepseek-v4-flash
deepseek-v4-pro deepseek-v4-flash deepseek-v3-lite deepseek-chat deepseek-reasoner
DeepSeek 开放平台 注册赠送500万Tokens(30天有效);网页端永久免费;V3-Lite永久免费 × 免费额度 新用户注册赠送500万Tokens(30天有效,无需信用卡);超出后纯按量付费;网页端chat.deepseek.com免费无次数限制;V4-Flash:输入1元/百万(缓存命中0.02元),输出2元/百万;V4-Pro:2026年5月22日宣布永久降价至原价1/4(2.5折优惠永久化),输入缓存命中0.025元/百万,输入未命中3元/百万,输出6元/百万;V4全系开源免费可商用;兼容OpenAI和Anthropic API格式;DeepSeek-V3-Lite:永久免费不限量(200万上下文,支持思维链可视化,QPS限制20,编程能力最强免费API);⚠️ deepseek-chat/deepseek-reasoner将于2026-07-24停用,请迁移至deepseek-v4-pro/deepseek-v4-flash;⚠️ deepseek-chat/deepseek-reasoner将于2026-07-24停用,请尽快迁移至deepseek-v4-pro/deepseek-v4-flash
接入参数 API 地址 https://api.deepseek.com
支持模型(5) deepseek-v4-pro deepseek-v4-flash deepseek-v3-lite deepseek-chat deepseek-reasoner
Yi-34B-Chat-Free 永久免费(社区版API被永久捐赠给开发者生态,李开复团队出品,34B参数,性能对标GPT-3.5-Turbo);每天1000次调用,每次最多16K token;中文理解极好,适合内容生成、客服对话、教育类应用;企业版收费,但社区版完全免费;支持OpenAI兼容格式
yi-34b-chat-free yi-34b-chat yi-34b-chat-200k yi-vl-plus
零一万物 (Yi) 每日重置(永久免费,1000次/天) × 免费额度 Yi-34B-Chat-Free 永久免费(社区版API被永久捐赠给开发者生态,李开复团队出品,34B参数,性能对标GPT-3.5-Turbo);每天1000次调用,每次最多16K token;中文理解极好,适合内容生成、客服对话、教育类应用;企业版收费,但社区版完全免费;支持OpenAI兼容格式
接入参数 API 地址 https://api.lingyiwanwu.com/v1
支持模型(4) yi-34b-chat-free yi-34b-chat yi-34b-chat-200k yi-vl-plus
Baichuan4-Air 永久免费(百川最新一代混合专家模型,推理速度极快,首包延迟通常低于300ms);每天500次调用,支持30并发;内置函数调用能力,可直接操作数据库、发邮件、调其他API;适合Agent开发、自动化工作流、实时交互应用;2026年5月22日发布Baichuan 4(国内SuperCLUE评测第一);支持多模态能力
Baichuan4-Air Baichuan4-Turbo Baichuan4 Baichuan3-Turbo Baichuan3-Turbo-128k
百川智能 (Baichuan) 每日重置(永久免费,500次/天) × 免费额度 Baichuan4-Air 永久免费(百川最新一代混合专家模型,推理速度极快,首包延迟通常低于300ms);每天500次调用,支持30并发;内置函数调用能力,可直接操作数据库、发邮件、调其他API;适合Agent开发、自动化工作流、实时交互应用;2026年5月22日发布Baichuan 4(国内SuperCLUE评测第一);支持多模态能力
接入参数 API 地址 https://api.baichuan-ai.com/v1
支持模型(5) Baichuan4-Air Baichuan4-Turbo Baichuan4 Baichuan3-Turbo Baichuan3-Turbo-128k
每天 2000 次免费调用(支持 DeepSeek-R1、Qwen2.5-VL、Flux.1 等开源模型)
deepseek-ai/DeepSeek-R1 qwen/Qwen2.5-72B-Instruct qwen/Qwen2.5-VL-72B-Instruct black-forest-labs/FLUX.1-dev deepseek-ai/DeepSeek-V4-Flash
魔搭社区(ModelScope) 每日重置(永久免费层,需绑定阿里云账号) × 免费额度 每天 2000 次免费调用(支持 DeepSeek-R1、Qwen2.5-VL、Flux.1 等开源模型)
接入参数 API 地址 https://api.modelscope.cn/v1
支持模型(5) deepseek-ai/DeepSeek-R1 qwen/Qwen2.5-72B-Instruct qwen/Qwen2.5-VL-72B-Instruct black-forest-labs/FLUX.1-dev deepseek-ai/DeepSeek-V4-Flash
新用户注册首次体验赠送 600万 token(此前为300万,已大幅提升,无时效限制);邀请活动可额外获得 1000万 token;支持 DeepSeek、Kimi、Claude、Gemini 等 50+ 模型
deepseek-r1 qwen-plus kimi-k2.5 deepseek-v4-flash
免费额度 新用户注册首次体验赠送 600万 token(此前为300万,已大幅提升,无时效限制);邀请活动可额外获得 1000万 token;支持 DeepSeek、Kimi、Claude、Gemini 等 50+ 模型
接入参数 API 地址 https://ai.qiniuapi.com/v1
支持模型(4) deepseek-r1 qwen-plus kimi-k2.5 deepseek-v4-flash
Lite版约5万 token/月(永久免费层);Ultra版(原Max升级版)赠送体验额度;Pro版免费体验包;新用户注册各模型赠送20万 token(注:Spark Max已于2026年3月10日下线,迁移至Ultra版)
spark-lite spark-ultra spark-pro spark-pro-128k spark-x1
讯飞星火 Lite永久(每月重置);Ultra/Pro体验额度一次性;模型赠送额度短期有效 × 免费额度 Lite版约5万 token/月(永久免费层);Ultra版(原Max升级版)赠送体验额度;Pro版免费体验包;新用户注册各模型赠送20万 token(注:Spark Max已于2026年3月10日下线,迁移至Ultra版)
接入参数 API 地址 https://spark-api.xf-yun.com
支持模型(5) spark-lite spark-ultra spark-pro spark-pro-128k spark-x1
新用户赠送 $10 免费积分(无需信用卡,支持 Jamba Mini、Jamba Large 等长上下文模型)
jamba-mini jamba-large jamba-1.5-large
免费额度 新用户赠送 $10 免费积分(无需信用卡,支持 Jamba Mini、Jamba Large 等长上下文模型)
接入参数 API 地址 https://api.ai21.com/v1
支持模型(3) jamba-mini jamba-large jamba-1.5-large
新用户注册赠送 1000万 Tokens(此前为200万,已大幅提升,永久有效);另有3个指定模型提供「无限Token」独立API Key(GLM-5量化版、Qwen3.5-397B、Qwen3.5-122B),每24小时可免费续期一次,不占用基础额度;另每月赠送 1000核时 免费算力(用于推理/微调,按月刷新不累积)
zai-org/GLM-5 Qwen/Qwen3.5-397B-A17B Qwen/Qwen3.5-122B-A10B
AtomGit AI(开放原子) 1000万Token永久有效;无限Token模型需每24小时手动续期;算力额度每月重置 × 免费额度 新用户注册赠送 1000万 Tokens(此前为200万,已大幅提升,永久有效);另有3个指定模型提供「无限Token」独立API Key(GLM-5量化版、Qwen3.5-397B、Qwen3.5-122B),每24小时可免费续期一次,不占用基础额度;另每月赠送 1000核时 免费算力(用于推理/微调,按月刷新不累积)
接入参数 API 地址 https://api-ai.gitcode.com/v1
支持模型(3) zai-org/GLM-5 Qwen/Qwen3.5-397B-A17B Qwen/Qwen3.5-122B-A10B
新用户注册GCP可获得 $300 免费试用额度(90天有效,需绑定信用卡但试用期内不扣费;可用于 GPT-4o、GPT-4.1、GPT-5、o3、o4-mini 等全系列模型);⚠️ 原$5积分非通用政策,实际以GCP $300试用额度为准;GitHub Student Developer Pack 可额外获得 $100 Azure 信用额度;2026年4月微软与OpenAI独家云合作终止
gpt-5.5 gpt-5 gpt-5-mini gpt-4o gpt-4o-mini gpt-4.1 +4
Azure OpenAI $300试用额度90天有效(需绑卡,试用期内不扣费);GitHub学生包$100信用额度12个月有效 × 免费额度 新用户注册GCP可获得 $300 免费试用额度(90天有效,需绑定信用卡但试用期内不扣费;可用于 GPT-4o、GPT-4.1、GPT-5、o3、o4-mini 等全系列模型);⚠️ 原$5积分非通用政策,实际以GCP $300试用额度为准;GitHub Student Developer Pack 可额外获得 $100 Azure 信用额度;2026年4月微软与OpenAI独家云合作终止
接入参数 API 地址 https://{your-resource-name}.openai.azure.com
支持模型(10) gpt-5.5 gpt-5 gpt-5-mini gpt-4o gpt-4o-mini gpt-4.1 o3 o4-mini dall-e-3 whisper
新用户注册赠送 $30 免费积分(支持任意 HuggingFace 模型部署,按 GPU 计算时间计费;冷启动快)
免费额度 新用户注册赠送 $30 免费积分(支持任意 HuggingFace 模型部署,按 GPU 计算时间计费;冷启动快)
接入参数 API 地址 https://api.baseten.co/v1
支持模型(0) 暂无
新用户赠送 $30 免费积分(Serverless GPU 推理平台,支持部署任意 HuggingFace 模型,冷启动低于5秒)
Cerebrium 一次性注册积分(需联系销售获取,无信用卡要求) × 免费额度 新用户赠送 $30 免费积分(Serverless GPU 推理平台,支持部署任意 HuggingFace 模型,冷启动低于5秒)
接入参数 API 地址 https://api.cerebrium.ai/v1
支持模型(0) 暂无
10,000 神经元单位/天(支持 50+ 模型:Llama 3/3.1/3.2/3.3/4 全系列、Qwen 1.5/2.5、DeepSeek R1/Coder、Mistral 7B/Small 3.1、Gemma 2/3、GPT-OSS-20B/120B、FLUX.2等)
@cf/meta/llama-3.2-1b-instruct @cf/meta/llama-3.2-3b-instruct @cf/meta/llama-3.3-70b-instruct @cf/mistral/mistral-7b-instruct-v0.1 @cf/deepseek-ai/deepseek-r1-distill-qwen-32b @cf/qwen/qwen2.5-72b-instruct +11
Cloudflare Workers AI 每日重置(永久免费层) × 免费额度 10,000 神经元单位/天(支持 50+ 模型:Llama 3/3.1/3.2/3.3/4 全系列、Qwen 1.5/2.5、DeepSeek R1/Coder、Mistral 7B/Small 3.1、Gemma 2/3、GPT-OSS-20B/120B、FLUX.2等)
接入参数 API 地址 https://api.cloudflare.com/client/v4/workers/ai/run
支持模型(17) @cf/meta/llama-3.2-1b-instruct @cf/meta/llama-3.2-3b-instruct @cf/meta/llama-3.3-70b-instruct @cf/mistral/mistral-7b-instruct-v0.1 @cf/deepseek-ai/deepseek-r1-distill-qwen-32b @cf/qwen/qwen2.5-72b-instruct @cf/google/gemma-3-27b-it @cf/openai/gpt-oss-120b @cf/openai/gpt-oss-20b @cf/google/gemma-4-26b-a4b-it @cf/aisingapore/gemma-sea-lion-v4-27b-it @cf/ibm-granite/granite-4.0-h-micro @cf/moonshotai/kimi-k2.5 @cf/moonshotai/kimi-k2.6 @cf/nvidia/nemotron-3-120b-a12b @cf/qwen/qwen3-30b-a3b-fp8 @cf/zai-org/glm-4.7-flash
新用户赠送 $1 免费积分(支持 50+ 开源模型,含 Llama 4、Qwen3、Gemma 3、Mixtral 等,快速推理)
accounts/fireworks/models/llama-4-scout accounts/fireworks/models/qwen3-72b-instruct accounts/fireworks/models/gemma-3-27b-it deepseek-ai/DeepSeek-V4-Flash
Fireworks AI 一次性注册积分(用完为止) × 免费额度 新用户赠送 $1 免费积分(支持 50+ 开源模型,含 Llama 4、Qwen3、Gemma 3、Mixtral 等,快速推理)
接入参数 API 地址 https://api.fireworks.ai/v1
支持模型(4) accounts/fireworks/models/llama-4-scout accounts/fireworks/models/qwen3-72b-instruct accounts/fireworks/models/gemma-3-27b-it deepseek-ai/DeepSeek-V4-Flash
50~150 次请求/天(GPT-4o、GPT-4.1、GPT-5/5.5系列、Grok-3、o3/o4系列、Llama 4、DeepSeek-R1-0528、Claude系列、Phi-4 等多模型;限速根据模型类型浮动;依赖Copilot订阅等级)
claude-sonnet-4 claude-opus-4-5 gpt-5 gpt-5-mini gpt-5-nano gpt-4o +20
GitHub Models 每日重置(永久免费层;不同模型每日请求次数不同,50-150次/天) × 免费额度 50~150 次请求/天(GPT-4o、GPT-4.1、GPT-5/5.5系列、Grok-3、o3/o4系列、Llama 4、DeepSeek-R1-0528、Claude系列、Phi-4 等多模型;限速根据模型类型浮动;依赖Copilot订阅等级)
接入参数 API 地址 https://models.github.com/inference
支持模型(26) claude-sonnet-4 claude-opus-4-5 gpt-5 gpt-5-mini gpt-5-nano gpt-4o gpt-4o-mini gpt-4.1 grok-3 grok-3-mini llama-4-scout llama-4-maverick llama-3.3-70b-instruct deepseek-r1-0528 o3 o4-mini phi-4 phi-4-mini-instruct phi-4-mini-reasoning phi-4-multimodal-instruct phi-4-reasoning meta-llama-3.1-405b-instruct ministral-3b mistral-medium-3 mai-ds-r1 openai/gpt-5-chat
免费 Serverless 推理(数百次请求/小时,支持 15万+ 开源模型)+ 新 Inference Providers 系统每月 $0.10 积分(支持 200+ 模型、18家推理提供商:Cerebras/Groq/Fireworks/Together等);Serverless推理限10GB以下模型
meta-llama/Llama-3.3-70B-Instruct Qwen/Qwen2.5-72B-Instruct google/gemma-2-27b-it
Hugging Face Inference API Serverless 每月重置(永久免费,速率限制);Inference Providers 每月 $0.10 积分(免费用户积分用完后停止) × 免费额度 免费 Serverless 推理(数百次请求/小时,支持 15万+ 开源模型)+ 新 Inference Providers 系统每月 $0.10 积分(支持 200+ 模型、18家推理提供商:Cerebras/Groq/Fireworks/Together等);Serverless推理限10GB以下模型
接入参数 API 地址 https://api-inference.huggingface.co
支持模型(3) meta-llama/Llama-3.3-70B-Instruct Qwen/Qwen2.5-72B-Instruct google/gemma-2-27b-it
新用户赠送 $1 免费积分(支持 DeepSeek V3、Llama 3.1 405B、Qwen 2.5 72B 等开源模型)
meta-llama/Llama-3.1-405B-Base deepseek-ai/DeepSeek-V3 Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-V4-Flash
免费额度 新用户赠送 $1 免费积分(支持 DeepSeek V3、Llama 3.1 405B、Qwen 2.5 72B 等开源模型)
接入参数 API 地址 https://api.hyperbolic.ai/v1
支持模型(4) meta-llama/Llama-3.1-405B-Base deepseek-ai/DeepSeek-V3 Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-V4-Flash
新用户赠送 $1 免费积分(回应调查可额外获得 $25;支持多种开源模型推理)
meta-llama/Llama-3.3-70B-Instruct deepseek-ai/DeepSeek-R1 deepseek-ai/DeepSeek-V4-Flash
Inference.net 一次性注册积分(用完为止) × 免费额度 新用户赠送 $1 免费积分(回应调查可额外获得 $25;支持多种开源模型推理)
接入参数 API 地址 https://api.inference.net/v1
支持模型(3) meta-llama/Llama-3.3-70B-Instruct deepseek-ai/DeepSeek-R1 deepseek-ai/DeepSeek-V4-Flash
新用户注册赠送 1000万 token(支持 Reader API、Embedding、Reranker 等搜索基础服务;Reader API 无密钥可免费使用 20 RPM,有密钥后提升至 500 RPM)
jina-embeddings-v3 jina-reranker-v2 jina-reader
免费额度 新用户注册赠送 1000万 token(支持 Reader API、Embedding、Reranker 等搜索基础服务;Reader API 无密钥可免费使用 20 RPM,有密钥后提升至 500 RPM)
接入参数 API 地址 https://api.jina.ai/v1
支持模型(3) jina-embeddings-v3 jina-reranker-v2 jina-reader
新用户注册赠送约 800万 Tokens(此前为15元,已大幅提升);Free Tier:1并发、3 RPM、32K TPM、150万 TPD;可用于 kimi-k2.5(262k超长上下文)、kimi-k2-thinking(超强推理)、k2-fc 等模型;无需实名认证;常有充值返券活动(如充100返300);Kimi估值突破200亿美元
kimi-k2.5 kimi-k2.5-flash kimi-k2 kimi-k2-fc kimi-k2-thinking
Kimi(月之暗面) 一次性注册赠送约800万Tokens(此前为15元,已大幅提升);Free Tier速率限制永久有效 × 免费额度 新用户注册赠送约 800万 Tokens(此前为15元,已大幅提升);Free Tier:1并发、3 RPM、32K TPM、150万 TPD;可用于 kimi-k2.5(262k超长上下文)、kimi-k2-thinking(超强推理)、k2-fc 等模型;无需实名认证;常有充值返券活动(如充100返300);Kimi估值突破200亿美元
接入参数 API 地址 https://api.moonshot.cn/v1
支持模型(5) kimi-k2.5 kimi-k2.5-flash kimi-k2 kimi-k2-fc kimi-k2-thinking
每日 50万 token(支持 Ling-1T、Ring-1T 推理模型及 Ming 多模态模型);2026年5月9日发布万亿级旗舰思考模型Ring-2.6-1T(支持high/xhigh双模式推理,限时一周免费体验,已上线OpenRouter);Ring-2.6-1T面向复杂逻辑/数学证明/多路径探索等高难度任务优化,推理准确率较前代提升23%
ling-2.6-1t ling-1t ring-1t ming-m2
Ling Studio(蚂蚁百灵) 每日重置(永久免费层) × 免费额度 每日 50万 token(支持 Ling-1T、Ring-1T 推理模型及 Ming 多模态模型);2026年5月9日发布万亿级旗舰思考模型Ring-2.6-1T(支持high/xhigh双模式推理,限时一周免费体验,已上线OpenRouter);Ring-2.6-1T面向复杂逻辑/数学证明/多路径探索等高难度任务优化,推理准确率较前代提升23%
接入参数 API 地址 https://openapi.aliyuncs.com/api/v3
支持模型(4) ling-2.6-1t ling-1t ring-1t ming-m2
新用户注册赠送 500万 Tokens(语音、文本模型均可用,此前额度已提升);2026年5月推出 TokenPlan(全球首个支持全模态模型的统一订阅计划);2026年6月1日发布 MiniMax M3(196B参数/11B激活,自研MSA稀疏注意力架构,1M上下文,原生多模态,Apache-2.0开源,SWE-Bench Pro超GPT-5.5);MiniMax M2.5/M3 在 OpenRouter 上可免费调用;支持语音合成等多模态
MiniMax-M3 MiniMax-M2.7 MiniMax-M2.5 MiniMax-M2 abab6.5s-chat abab6.5g-chat
MiniMax 开放平台 一次性注册赠送(约30天有效) × 免费额度 新用户注册赠送 500万 Tokens(语音、文本模型均可用,此前额度已提升);2026年5月推出 TokenPlan(全球首个支持全模态模型的统一订阅计划);2026年6月1日发布 MiniMax M3(196B参数/11B激活,自研MSA稀疏注意力架构,1M上下文,原生多模态,Apache-2.0开源,SWE-Bench Pro超GPT-5.5);MiniMax M2.5/M3 在 OpenRouter 上可免费调用;支持语音合成等多模态
接入参数 API 地址 https://api.minimax.chat/v1
支持模型(6) MiniMax-M3 MiniMax-M2.7 MiniMax-M2.5 MiniMax-M2 abab6.5s-chat abab6.5g-chat
Starter 计划注册即送 $5/月免费计算积分(添加支付方式后升至 $30/月;支持 GPU 推理、Serverless 函数、定时任务;初创公司可申请至 $25,000 积分)
Modal 每月重置(永久免费层,Starter 计划 $0/月,注册送$5/月,添加支付方式后$30/月) × 免费额度 Starter 计划注册即送 $5/月免费计算积分(添加支付方式后升至 $30/月;支持 GPU 推理、Serverless 函数、定时任务;初创公司可申请至 $25,000 积分)
接入参数 API 地址 https://api.modal.com/v1
支持模型(0) 暂无
新用户赠送 $1 免费积分(支持 DeepSeek、Qwen3、Llama、Mistral 等开源模型;提供高速/基础两档端点;批量推理享5折)
deepseek-ai/DeepSeek-V3 deepseek-ai/DeepSeek-R1 Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-V4-Flash
Nebius Token Factory 一次性注册积分(用完为止) × 免费额度 新用户赠送 $1 免费积分(支持 DeepSeek、Qwen3、Llama、Mistral 等开源模型;提供高速/基础两档端点;批量推理享5折)
接入参数 API 地址 https://api.nebius.com/v1
支持模型(4) deepseek-ai/DeepSeek-V3 deepseek-ai/DeepSeek-R1 Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-V4-Flash
新用户赠送 $15 免费积分(支持多种 NLP 模型,需手机验证)
finetuned-llama-3-1-70b finetuned-llama-3-1-8b
免费额度 新用户赠送 $15 免费积分(支持多种 NLP 模型,需手机验证)
接入参数 API 地址 https://api.nlpcloud.io/v1
支持模型(2) finetuned-llama-3-1-70b finetuned-llama-3-1-8b
新用户注册赠送 $0.5 免费积分(支持 Llama 3.3 70B、Qwen2.5 72B、DeepSeek V3、GLM-5、Qwen3 Coder Next 等主流开源模型;同时提供 Stable Diffusion、Flux 等图像生成模型;推荐积分$10起充,价格低至 $0.20/百万token)
meta-llama/llama-3.3-70b-instruct qwen/qwen2.5-72b-instruct deepseek-ai/deepseek-v3 zai-org/glm-5 qwen/qwen3-coder-next stable-diffusion/stable-diffusion-3.5-large +1
免费额度 新用户注册赠送 $0.5 免费积分(支持 Llama 3.3 70B、Qwen2.5 72B、DeepSeek V3、GLM-5、Qwen3 Coder Next 等主流开源模型;同时提供 Stable Diffusion、Flux 等图像生成模型;推荐积分$10起充,价格低至 $0.20/百万token)
接入参数 API 地址 https://api.novita.ai/v3
支持模型(7) meta-llama/llama-3.3-70b-instruct qwen/qwen2.5-72b-instruct deepseek-ai/deepseek-v3 zai-org/glm-5 qwen/qwen3-coder-next stable-diffusion/stable-diffusion-3.5-large deepseek-ai/deepseek-v4-flash
免费层提供轻度云端推理使用量(不限token数,按GPU时间计量);支持33款云端模型+4万+社区本地模型;最多同时运行1个云模型;本地运行完全无限制免费;云端最新模型包括:DeepSeek V4 Flash/Pro(284B参数MoE,1M上下文)、Kimi K2.6(原生多模态Agent)、GLM-5.1(SWE-Bench Pro SOTA)、MiniMax M2.7(编码与Agent)、Gemma 4(前沿性能)、Nemotron-3-Super(120B MoE/12B激活)、Qwen3.5(多模态)、Gemini 3 Flash Preview、Devstral-2(123B代码Agent)、GPT-OSS(OpenAI开放权重)、Mistral Large 3(多模态MoE)等;每5小时/每7天使用量重置
deepseek-v4-flash deepseek-v4-pro deepseek-v3.2 deepseek-v3.1 kimi-k2.6 kimi-k2.5 +27
Ollama Cloud 永久免费层(每5小时/每7天使用量重置;本地运行无限制) × 免费额度 免费层提供轻度云端推理使用量(不限token数,按GPU时间计量);支持33款云端模型+4万+社区本地模型;最多同时运行1个云模型;本地运行完全无限制免费;云端最新模型包括:DeepSeek V4 Flash/Pro(284B参数MoE,1M上下文)、Kimi K2.6(原生多模态Agent)、GLM-5.1(SWE-Bench Pro SOTA)、MiniMax M2.7(编码与Agent)、Gemma 4(前沿性能)、Nemotron-3-Super(120B MoE/12B激活)、Qwen3.5(多模态)、Gemini 3 Flash Preview、Devstral-2(123B代码Agent)、GPT-OSS(OpenAI开放权重)、Mistral Large 3(多模态MoE)等;每5小时/每7天使用量重置
接入参数 API 地址 https://api.ollama.com/v1
支持模型(33) deepseek-v4-flash deepseek-v4-pro deepseek-v3.2 deepseek-v3.1 kimi-k2.6 kimi-k2.5 kimi-k2-thinking kimi-k2 glm-5.1 glm-5 glm-4.7 glm-4.6 minimax-m2.7 minimax-m2.5 minimax-m2.1 minimax-m2 gemma4 gemma3 nemotron-3-super nemotron-3-nano qwen3.5 qwen3-coder-next qwen3-coder qwen3-next qwen3-vl gemini-3-flash-preview devstral-2 devstral-small-2 gpt-oss mistral-large-3 ministral-3 cogito-2.1 rnj-1
新用户注册首个公有云项目赠送 $200 免费信用额度(可用于 AI Endpoints API;支持 Llama 4、Qwen3、DeepSeek-R1、Mistral 等 40+ 模型;匿名用户可直接通过 Playground 免费测试所有模型;需绑定支付方式)
Meta-Llama-3.3-70B-Instruct Qwen/Qwen3-32B deepseek-ai/DeepSeek-R1 mistralai/Mistral-7B-Instruct-v0.3 mistralai/Codestral-22B-v0.1 deepseek-ai/DeepSeek-V4-Flash
OVHcloud AI Endpoints 一次性注册额度(激活后30天有效;每账号仅限一次) × 免费额度 新用户注册首个公有云项目赠送 $200 免费信用额度(可用于 AI Endpoints API;支持 Llama 4、Qwen3、DeepSeek-R1、Mistral 等 40+ 模型;匿名用户可直接通过 Playground 免费测试所有模型;需绑定支付方式)
接入参数 API 地址 https://llm.api.cloud.ovh.net/v1
支持模型(6) Meta-Llama-3.3-70B-Instruct Qwen/Qwen3-32B deepseek-ai/DeepSeek-R1 mistralai/Mistral-7B-Instruct-v0.3 mistralai/Codestral-22B-v0.1 deepseek-ai/DeepSeek-V4-Flash
免费额度$5/3个月;支持DeepSeek V3.1/V3.2、Gemma 3 12B、GPT-OSS-120B、Llama 4 Maverick、Llama 3.3 70B、MiniMax M2.7等模型
deepseek-v3.1 deepseek-v3.2 gemma-3-12b-it gpt-oss-120b llama-4-maverick-17b-128e-instruct meta-llama-3.3-70b-instruct +1
SambaNova Cloud $5 API credits 注册后3个月有效;Free 计划长期可开通(无需信用卡,超额需升级付费) × 免费额度 免费额度$5/3个月;支持DeepSeek V3.1/V3.2、Gemma 3 12B、GPT-OSS-120B、Llama 4 Maverick、Llama 3.3 70B、MiniMax M2.7等模型
接入参数 API 地址 https://api.sambanova.ai/v1
支持模型(7) deepseek-v3.1 deepseek-v3.2 gemma-3-12b-it gpt-oss-120b llama-4-maverick-17b-128e-instruct meta-llama-3.3-70b-instruct minimax-m2.7
新用户赠送 25 积分(约$0.25,可生成约10张图像;SD3.5系列模型)
stable-diffusion-3.5-large stable-diffusion-3.5-medium stable-diffusion-3.5-flash stable-image-ultra stable-image-core stable-diffusion-xl-1.0
Stability AI 一次性注册积分(用完为止) × 免费额度 新用户赠送 25 积分(约$0.25,可生成约10张图像;SD3.5系列模型)
接入参数 API 地址 https://api.stability.ai/v1
支持模型(6) stable-diffusion-3.5-large stable-diffusion-3.5-medium stable-diffusion-3.5-flash stable-image-ultra stable-image-core stable-diffusion-xl-1.0
新用户赠送 $10 免费积分(支持 Solar Pro、Solar Mini 等长上下文模型;Solar Pro 3 输入 $0.15/百万token,输出 $0.6/百万token)
solar-pro-3 solar-pro-2 solar-mini upstage-embed
免费额度 新用户赠送 $10 免费积分(支持 Solar Pro、Solar Mini 等长上下文模型;Solar Pro 3 输入 $0.15/百万token,输出 $0.6/百万token)
接入参数 API 地址 https://api.upstage.ai/v1
支持模型(4) solar-pro-3 solar-pro-2 solar-mini upstage-embed
每月赠送 $5 AI Gateway Credits(可路由至 OpenAI、Anthropic、Google 等多家主流 AI 供应商;支持自定义 API Provider;手续费 3%);免费模型:Big Pickle Stealth、Nemotron 3 Super Free、DeepSeek V4 Flash Free(免费模型可能用于数据训练优化)
openai/gpt-4o openai/gpt-5 anthropic/claude-sonnet-4 anthropic/claude-opus-4-5 google/gemini-2.5-pro google/gemini-2.5-flash +4
Vercel AI Gateway 每月重置(永久免费层,购买额外积分后免费额度失效) × 免费额度 每月赠送 $5 AI Gateway Credits(可路由至 OpenAI、Anthropic、Google 等多家主流 AI 供应商;支持自定义 API Provider;手续费 3%);免费模型:Big Pickle Stealth、Nemotron 3 Super Free、DeepSeek V4 Flash Free(免费模型可能用于数据训练优化)
接入参数 API 地址 https://gateway.vercel.ai
支持模型(10) openai/gpt-4o openai/gpt-5 anthropic/claude-sonnet-4 anthropic/claude-opus-4-5 google/gemini-2.5-pro google/gemini-2.5-flash deepseek-ai/deepseek-v4-flash big-pickle-stealth nvidia/nemotron-3-super-free deepseek/deepseek-v4-flash-free
新用户注册赠送 $25 API 积分;另有数据共享计划:每月额外赠送 $150 免费额度(需先消费至少 $5 后方可在 Billing > Credits 中开启,开启后不可撤销;EU/UK 地区不适用);⚠️ 2026年5月8日 xAI 已正式并入 SpaceX(改名为 SpaceXAI),API免费政策未来可能发生变化,建议密切关注;⚠️ 警告:2026年5月8日 xAI已并入SpaceX(改名SpaceXAI),API政策可能随时变动,建议关注官方公告
grok-4 grok-4-mini grok-3 grok-3-mini grok-2 grok-2-vision-1212
xAI (Grok) 注册$25一次性;数据共享$150每月重置(永久,需满足$5消费门槛后激活) × 免费额度 新用户注册赠送 $25 API 积分;另有数据共享计划:每月额外赠送 $150 免费额度(需先消费至少 $5 后方可在 Billing > Credits 中开启,开启后不可撤销;EU/UK 地区不适用);⚠️ 2026年5月8日 xAI 已正式并入 SpaceX(改名为 SpaceXAI),API免费政策未来可能发生变化,建议密切关注;⚠️ 警告:2026年5月8日 xAI已并入SpaceX(改名SpaceXAI),API政策可能随时变动,建议关注官方公告
接入参数 API 地址 https://api.x.ai/v1
支持模型(6) grok-4 grok-4-mini grok-3 grok-3-mini grok-2 grok-2-vision-1212
新用户注册赠送 $25 免费积分(无需信用卡,用于体验 200+ 开源模型;额度不过期);68+ 个永久免费模型(含 Llama 4 Scout、Gemma 4、Qwen3 全系列、MiniMax M2、Nemotron 3、DeepCoder 等,60 RPM / 100K TPM),另有 Startup Accelerator 可申请 $15K-$50K;新增 openrouter-router 自动路由功能
meta-llama/Llama-4-Scout-17B-16E-Instruct google/gemma-4-26b-a4b-it-instruct google/gemma-3-27b-it Qwen/Qwen3-235B-A22B-Instruct Qwen/Qwen3-Coder-30B-A3B-Instruct Qwen/Qwen3-Next-80B-A3B-Instruct +7
Together AI $25注册积分永不过期;68+个免费模型长期可用(政策可能调整) × 免费额度 新用户注册赠送 $25 免费积分(无需信用卡,用于体验 200+ 开源模型;额度不过期);68+ 个永久免费模型(含 Llama 4 Scout、Gemma 4、Qwen3 全系列、MiniMax M2、Nemotron 3、DeepCoder 等,60 RPM / 100K TPM),另有 Startup Accelerator 可申请 $15K-$50K;新增 openrouter-router 自动路由功能
接入参数 API 地址 https://api.together.xyz/v1
支持模型(13) meta-llama/Llama-4-Scout-17B-16E-Instruct google/gemma-4-26b-a4b-it-instruct google/gemma-3-27b-it Qwen/Qwen3-235B-A22B-Instruct Qwen/Qwen3-Coder-30B-A3B-Instruct Qwen/Qwen3-Next-80B-A3B-Instruct Qwen/Qwen3.5-122B-A10B deepseek-ai/DeepSeek-R1 mini-max/MiniMax-M2 nvidia/Nemotron-3-Super-120B-A12B nvidia/Nemotron-3-Nano-30B-A3B mistralai/Mistral-Small-3.2-24B-Instruct cognitive-cogito/Cogito-v1-Preview-Llama-70B
Serverless 模式免费开放(无需充值即可使用;支持 GLM-5、MiniMax M2.5/M2.7、Qwen3、Llama 4 等近 600 款主流模型;OpenAI 兼容 API;推理速度约55 tokens/秒)
meta-llama/Llama-3.3-70B-Instruct meta-llama/Llama-4-Scout-17B-16E-Instruct Qwen/Qwen3-235B-A22B GLM-5 MiniMax-M2.5 MiniMax-M2.7
Friendli AI 免费(Serverless模式;政策以官方公告为准) × 免费额度 Serverless 模式免费开放(无需充值即可使用;支持 GLM-5、MiniMax M2.5/M2.7、Qwen3、Llama 4 等近 600 款主流模型;OpenAI 兼容 API;推理速度约55 tokens/秒)
接入参数 API 地址 https://api.friendli.ai/serverless/v1
支持模型(6) meta-llama/Llama-3.3-70B-Instruct meta-llama/Llama-4-Scout-17B-16E-Instruct Qwen/Qwen3-235B-A22B GLM-5 MiniMax-M2.5 MiniMax-M2.7
新用户注册赠送 $100 免费试用额度;基于 Ray 的 AI 计算平台
免费额度 新用户注册赠送 $100 免费试用额度;基于 Ray 的 AI 计算平台
接入参数 API 地址 https://api.anyscale.com/v1
支持模型(0) 暂无
提供免费起始额度(具体额度以官网最新公告为准);支持 4万+ 社区模型
black-forest-labs/flux-dev black-forest-labs/flux-schnell meta/meta-llama-3-70b-instruct
免费额度 提供免费起始额度(具体额度以官网最新公告为准);支持 4万+ 社区模型
接入参数 API 地址 https://api.replicate.com/v1
支持模型(3) black-forest-labs/flux-dev black-forest-labs/flux-schnell meta/meta-llama-3-70b-instruct
向全体用户免费发放单人最高 3000万 Tokens 额度(此前为100万,已大幅提升);面向OpenClaw用户免费发放每人限时2周总计1000万Tokens额度;续购价格:0.1元/百万Tokens;支持 Qwen3-30B-A3B 等国产大模型
Qwen3-30B-A3B deepseek-r1 deepseek-v3 qwen3-235b-a22b deepseek-v4-flash
超算互联网 (SCNET) 一次性注册赠送(1个月有效) × 免费额度 向全体用户免费发放单人最高 3000万 Tokens 额度(此前为100万,已大幅提升);面向OpenClaw用户免费发放每人限时2周总计1000万Tokens额度;续购价格:0.1元/百万Tokens;支持 Qwen3-30B-A3B 等国产大模型
接入参数 API 地址 https://api.scnet.cn/v1
支持模型(5) Qwen3-30B-A3B deepseek-r1 deepseek-v3 qwen3-235b-a22b deepseek-v4-flash
全新 MoMA(移动模型服务平台)已于2026年5月8日在移动云大会正式发布;新用户注册即送9000万Tokens体验包(涵盖Ernie 4.5T系列、X1T系列、DeepSeek系列等9款主流模型,各模型独立额度);接入超过300款国内主流AI大模型(九天、豆包、通义千问等),为目前国内最大;首创Token集约化运营模式与「模型联邦+智能路由」技术,可按成本/效果优先自动匹配最优模型,降低约30%单位成本;定位为「国内首个开放普惠的AI模型超级入口」;原新用户2500万tokens免费体验活动(2025年12月31日截止)已被MoMA平台取代
deepseek-v3 deepseek-r1 glm-5 MiniMax-M2.5 kimi-k2.5
移动云(中国移动)一站式模型托管平台 MoMA平台全新上线(2026-05-08发布,具体免费政策以官方公告为准) × 免费额度 全新 MoMA(移动模型服务平台)已于2026年5月8日在移动云大会正式发布;新用户注册即送9000万Tokens体验包(涵盖Ernie 4.5T系列、X1T系列、DeepSeek系列等9款主流模型,各模型独立额度);接入超过300款国内主流AI大模型(九天、豆包、通义千问等),为目前国内最大;首创Token集约化运营模式与「模型联邦+智能路由」技术,可按成本/效果优先自动匹配最优模型,降低约30%单位成本;定位为「国内首个开放普惠的AI模型超级入口」;原新用户2500万tokens免费体验活动(2025年12月31日截止)已被MoMA平台取代
接入参数 API 地址 https://ecloud.10086.cn/api
支持模型(5) deepseek-v3 deepseek-r1 glm-5 MiniMax-M2.5 kimi-k2.5
Qwen3-Coder-Next 模型永久免费无门槛不限量调用(支持代码生成、代码补全、代码解释、Bug修复等场景);Qwen3-1.7B 免费无限量;新客专属礼包赠送千万免费Tokens;DeepSeek-V3.2无门槛5折优惠;平台为科大讯飞面向开发者打造,与讯飞星火为独立平台
Qwen3-Coder-Next Qwen3-1.7B Qwen3.5-35B-A3B GLM-5 MiniMax-M2.5 kimi-k2.5 +1
讯飞星辰MaaS Qwen3-Coder-Next/Qwen3-1.7B永久免费(不限量);新客礼包一次性赠送;政策以官方公告为准 × 免费额度 Qwen3-Coder-Next 模型永久免费无门槛不限量调用(支持代码生成、代码补全、代码解释、Bug修复等场景);Qwen3-1.7B 免费无限量;新客专属礼包赠送千万免费Tokens;DeepSeek-V3.2无门槛5折优惠;平台为科大讯飞面向开发者打造,与讯飞星火为独立平台
接入参数 API 地址 https://maas-coding-api.cn-huabei-1.xf-yun.com/v2
支持模型(7) Qwen3-Coder-Next Qwen3-1.7B Qwen3.5-35B-A3B GLM-5 MiniMax-M2.5 kimi-k2.5 DeepSeek-V3.2
Trinity Large Preview(400B参数/13B激活)在 OpenRouter 上限时免费;Trinity Mini/Nano 可通过官网 Playground 免费体验;Apache 2.0 开源协议,支持工具调用、长上下文(128K-512K)、结构化输出
arcee-ai/trinity-large-preview arcee-ai/trinity-mini arcee-ai/trinity-nano
Arcee AI (Trinity) OpenRouter免费层永久可用;官网Playground免费体验 × 免费额度 Trinity Large Preview(400B参数/13B激活)在 OpenRouter 上限时免费;Trinity Mini/Nano 可通过官网 Playground 免费体验;Apache 2.0 开源协议,支持工具调用、长上下文(128K-512K)、结构化输出
接入参数 API 地址 https://openrouter.ai/api/v1
支持模型(3) arcee-ai/trinity-large-preview arcee-ai/trinity-mini arcee-ai/trinity-nano
每个空间免费额度:QPS=2、QPM=60、QPD=3000;支持创建智能体并远程调用 API;可接入 GPT-5、Claude、Gemini、DeepSeek 等 50+ 大模型;工作流编排、多模态 AI 集成
gpt-5 claude-sonnet-4 gemini-2.5-pro deepseek-v4-flash
扣子 Coze(字节跳动) 永久免费层(有速率限制) × 免费额度 每个空间免费额度:QPS=2、QPM=60、QPD=3000;支持创建智能体并远程调用 API;可接入 GPT-5、Claude、Gemini、DeepSeek 等 50+ 大模型;工作流编排、多模态 AI 集成
接入参数 API 地址 https://api.coze.cn/v1
支持模型(4) gpt-5 claude-sonnet-4 gemini-2.5-pro deepseek-v4-flash
新用户实名注册赠送百亿 Tokens 免费配额(2026-03-31起全量开放注册;支持 DeepSeek-R1 满血版、Qwen3 系列、GLM-4.6、MiniMax-M2 等多模型;兼容 OpenAI 及 Anthropic 协议;基于异构算力底座,推理速度快)
deepseek-r1 deepseek-v3 qwen3-8b qwen3-32b glm-4.5 glm-4.6 +3
无问芯穹 (Infini-AI GenStudio) 体验期免费(额度以注册时平台公告为准,用完后按量计费) × 免费额度 新用户实名注册赠送百亿 Tokens 免费配额(2026-03-31起全量开放注册;支持 DeepSeek-R1 满血版、Qwen3 系列、GLM-4.6、MiniMax-M2 等多模型;兼容 OpenAI 及 Anthropic 协议;基于异构算力底座,推理速度快)
接入参数 API 地址 https://cloud.infini-ai.com/maas/v1
支持模型(9) deepseek-r1 deepseek-v3 qwen3-8b qwen3-32b glm-4.5 glm-4.6 minimax-m2 megrez-3b-instruct deepseek-v4-flash
注册福利(保留):完成注册并实名认证后获得 150元 大模型API代金券;邀新福利(保留):每邀请一位新用户完成注册及实名认证,邀请人获得 200元 代金券(上不封顶);首次调用300元福利已于2026年3月15日到期取消;仍提供多款优质模型的永久免费API(DeepSeek-R1-0528、Qwen3-8B、BAAI/bge-m3等)
DeepSeek-R1-0528 DeepSeek-V3 Qwen3-235B-A22B Qwen3-32B-FP8 Kimi-K2-Instruct GLM-4.5 +2
白山智算 注册150元+邀新200元长期有效;首次调用300元已取消;永久免费模型持续可用 × 免费额度 注册福利(保留):完成注册并实名认证后获得 150元 大模型API代金券;邀新福利(保留):每邀请一位新用户完成注册及实名认证,邀请人获得 200元 代金券(上不封顶);首次调用300元福利已于2026年3月15日到期取消;仍提供多款优质模型的永久免费API(DeepSeek-R1-0528、Qwen3-8B、BAAI/bge-m3等)
接入参数 API 地址 https://api.edgefn.net/v1
支持模型(8) DeepSeek-R1-0528 DeepSeek-V3 Qwen3-235B-A22B Qwen3-32B-FP8 Kimi-K2-Instruct GLM-4.5 BAAI/bge-m3 Qwen3-Coder-480B-A35B-Instruct
免费提供 Intern-S1 系列模型的 OpenAI 兼容 API;支持文本生成、图像分析、工具调用、思考模式等功能;10 RPM 速率限制,密钥有效期6个月
intern-s1 intern-s1-pro
书生 Intern AI(上海人工智能实验室) 永久免费(速率限制 10 RPM,密钥6个月有效,到期可续) × 免费额度 免费提供 Intern-S1 系列模型的 OpenAI 兼容 API;支持文本生成、图像分析、工具调用、思考模式等功能;10 RPM 速率限制,密钥有效期6个月
接入参数 API 地址 https://chat.intern-ai.org.cn/api/v1
支持模型(2) intern-s1 intern-s1-pro
新用户注册赠送 2亿 token 免费额度(大多数嵌入及重排序模型,含 voyage-3.5、voyage-3-large、voyage-4、voyage-4-lite、rerank-2.5 等;专用模型 voyage-finance-2 / law-2 / code-2 免费额度为5000万token;多模态嵌入额度为2亿文本token + 1500亿像素;被 Anthropic 收购,与 Claude 深度集成)
voyage-3.5 voyage-3.5-lite voyage-3-large voyage-4 voyage-4-lite voyage-4-large +5
Voyage AI 一次性注册赠送(用完为止,无需信用卡) × 免费额度 新用户注册赠送 2亿 token 免费额度(大多数嵌入及重排序模型,含 voyage-3.5、voyage-3-large、voyage-4、voyage-4-lite、rerank-2.5 等;专用模型 voyage-finance-2 / law-2 / code-2 免费额度为5000万token;多模态嵌入额度为2亿文本token + 1500亿像素;被 Anthropic 收购,与 Claude 深度集成)
接入参数 API 地址 https://api.voyageai.com/v1
支持模型(11) voyage-3.5 voyage-3.5-lite voyage-3-large voyage-4 voyage-4-lite voyage-4-large voyage-code-3 voyage-context-3 voyage-multimodal-3.5 rerank-2.5 rerank-2.5-lite
新用户获得 1,000 credits(可再申请 4,000,合计 5,000 credits;1 credit≈1K tokens;有效期可选Never Expire永久有效);免费API端点支持225+模型;40 RPM速率限制(可通过NVIDIA开发者论坛申请提升至200 RPM);需手机号验证(中国大陆+86可收验证码);支持 MiniMax M2.7、Kimi K2系列、Qwen3 Coder 480B、Devstral 123B、DeepSeek V4/R1等主流模型;完全兼容OpenAI ChatCompletion格式
minimaxai/minimax-m2.7 moonshotai/kimi-k2-instruct moonshotai/kimi-k2-thinking qwen/qwen3-coder-480b-a35b-instruct mistralai/devstral-2-123b-instruct-2512 deepseek-ai/deepseek-v3 +4
NVIDIA NIM (build.nvidia.com) 每日重置(永久免费层) × 免费额度 新用户获得 1,000 credits(可再申请 4,000,合计 5,000 credits;1 credit≈1K tokens;有效期可选Never Expire永久有效);免费API端点支持225+模型;40 RPM速率限制(可通过NVIDIA开发者论坛申请提升至200 RPM);需手机号验证(中国大陆+86可收验证码);支持 MiniMax M2.7、Kimi K2系列、Qwen3 Coder 480B、Devstral 123B、DeepSeek V4/R1等主流模型;完全兼容OpenAI ChatCompletion格式
接入参数 API 地址 https://integrate.api.nvidia.com/v1
支持模型(10) minimaxai/minimax-m2.7 moonshotai/kimi-k2-instruct moonshotai/kimi-k2-thinking qwen/qwen3-coder-480b-a35b-instruct mistralai/devstral-2-123b-instruct-2512 deepseek-ai/deepseek-v3 deepseek-ai/deepseek-r1 meta/llama-3.3-70b-instruct nvidia/nemotron-3-nano-30b-a3b deepseek-ai/deepseek-v4-flash
基于「花粉(pollen)」积分制的免费计算资源;Seed层:0.15 pollen/小时(免费);Flower层:0.4 pollen/小时(需应用上线并获得使用量);每日150万次请求,500+活跃应用;支持文本、图像、视频、音频生成及LLM推理;OpenAI兼容API;⚠️ 不再是完全无限制免费,但免费层足够个人开发者使用
deepseek-ai/DeepSeek-R1 qwen/qwen2.5-72b-instruct meta-llama/llama-3.3-70b-instruct google/gemini-2.5-pro
Pollinations AI 永久免费层(基于pollen积分制;Seed层免费,Flower层需应用上线) × 免费额度 基于「花粉(pollen)」积分制的免费计算资源;Seed层:0.15 pollen/小时(免费);Flower层:0.4 pollen/小时(需应用上线并获得使用量);每日150万次请求,500+活跃应用;支持文本、图像、视频、音频生成及LLM推理;OpenAI兼容API;⚠️ 不再是完全无限制免费,但免费层足够个人开发者使用
接入参数 API 地址 https://api.pollinations.ai/v1
支持模型(4) deepseek-ai/DeepSeek-R1 qwen/qwen2.5-72b-instruct meta-llama/llama-3.3-70b-instruct google/gemini-2.5-pro
LongCat-Flash-Lite 每日 5000万 token 免费(轻量级高效 MoE 模型);LongCat-2.0-Preview(万亿参数模型)测试期间每天 1000万免费 Token;LongCat-Flash-Chat/Thinking/Omni 等系列每日 50万 token 免费;全程依托国产算力集群完成,英伟达算力占比为零;公测阶段暂不支持付费购买额度;支持 OpenAI 兼容 API 及 Anthropic 协议
LongCat-Flash-Lite LongCat-Flash-Chat LongCat-Flash-Chat-2602-Exp LongCat-Flash-Thinking LongCat-Flash-Thinking-2601 LongCat-Flash-Omni-2603 +1
LongCat(美团) 每日重置(永久免费,公测阶段) × 免费额度 LongCat-Flash-Lite 每日 5000万 token 免费(轻量级高效 MoE 模型);LongCat-2.0-Preview(万亿参数模型)测试期间每天 1000万免费 Token;LongCat-Flash-Chat/Thinking/Omni 等系列每日 50万 token 免费;全程依托国产算力集群完成,英伟达算力占比为零;公测阶段暂不支持付费购买额度;支持 OpenAI 兼容 API 及 Anthropic 协议
接入参数 API 地址 https://api.longcat.chat/openai
支持模型(7) LongCat-Flash-Lite LongCat-Flash-Chat LongCat-Flash-Chat-2602-Exp LongCat-Flash-Thinking LongCat-Flash-Thinking-2601 LongCat-Flash-Omni-2603 LongCat-2.0-Preview
Lite(免费)计划:每月 30万 token 推理额度(2 RPS速率限制);每月 20 CUH 机器学习算力;支持 IBM Granite 3.3/3.2/3.1 系列、Meta Llama 4 Scout/Maverick、Mistral Small 3.1、Granite Embedding 等;Llama 4 Scout 目前为免费预览版;适合企业级合规场景,支持多语言和RAG
ibm/granite-3-3-8b-instruct ibm/granite-3-2-8b-instruct ibm/granite-3-8b-instruct ibm/granite-3-2b-instruct meta-llama/llama-4-scout-17b-16e-instruct meta-llama/llama-3-3-70b-instruct +3
IBM Watsonx.ai 每月重置(永久免费 Lite 计划,无需信用卡) × 免费额度 Lite(免费)计划:每月 30万 token 推理额度(2 RPS速率限制);每月 20 CUH 机器学习算力;支持 IBM Granite 3.3/3.2/3.1 系列、Meta Llama 4 Scout/Maverick、Mistral Small 3.1、Granite Embedding 等;Llama 4 Scout 目前为免费预览版;适合企业级合规场景,支持多语言和RAG
接入参数 API 地址 https://us-south.ml.cloud.ibm.com/ml/v1
支持模型(9) ibm/granite-3-3-8b-instruct ibm/granite-3-2-8b-instruct ibm/granite-3-8b-instruct ibm/granite-3-2b-instruct meta-llama/llama-4-scout-17b-16e-instruct meta-llama/llama-3-3-70b-instruct mistralai/mistral-small-3-1-24b-instruct-2503 ibm/granite-embedding-278m-multilingual meta-llama/llama-4-maverick-17b-128e-instruct
每月50万tokens免费;新用户送20万tokens;华为云开发者认证送50万tokens;支持盘古大模型系列、DeepSeek-V3.2、GLM-5、Kimi-K2、Qwen系列等;9.9元即可获得大量Token抵扣;支持CV计算机视觉等多模态能力
pangu-large deepseek-v3.2 glm-5 kimi-k2 qwen3-235b-a22b
华为云盘古大模型(ModelArts MaaS) 每月重置(永久免费层);新用户20万tokens一次性 × 免费额度 每月50万tokens免费;新用户送20万tokens;华为云开发者认证送50万tokens;支持盘古大模型系列、DeepSeek-V3.2、GLM-5、Kimi-K2、Qwen系列等;9.9元即可获得大量Token抵扣;支持CV计算机视觉等多模态能力
接入参数 API 地址 https://api.modelarts-maas.com/v2/chat/completions
支持模型(5) pangu-large deepseek-v3.2 glm-5 kimi-k2 qwen3-235b-a22b
新用户注册GCP获得 $300 免费试用额度(90天有效,需绑定信用卡但试用期内不扣费);可用于Gemini全系列(2.5 Flash/Pro、3.0、3.1 Pro)、Imagen图像生成等Google最新模型;企业级AI平台,与Google AI Studio不同
gemini-4.0 gemini-2.5-flash gemini-2.5-pro gemini-3.0-flash gemini-3.1-pro imagen-3
Google Vertex AI $300试用额度90天有效(需绑卡,试用期内不扣费) × 免费额度 新用户注册GCP获得 $300 免费试用额度(90天有效,需绑定信用卡但试用期内不扣费);可用于Gemini全系列(2.5 Flash/Pro、3.0、3.1 Pro)、Imagen图像生成等Google最新模型;企业级AI平台,与Google AI Studio不同
接入参数 API 地址 https://{REGION}-aiplatform.googleapis.com/v1
支持模型(6) gemini-4.0 gemini-2.5-flash gemini-2.5-pro gemini-3.0-flash gemini-3.1-pro imagen-3
MiMo-V2.5系列永久降价生效:V2.5输入缓存命中0.02元/百万Tokens(降幅98%),V2.5-Pro输入缓存命中0.025元/百万Tokens(降幅99%);Token Plan计费体系优化,同等价格下用量提升5-8倍(Lite 41亿/Standard 110亿/Pro 380亿/Max 820亿 Credits);MiMo-V2.5-TTS保持限时免费;MiMo-V2-Pro与MiMo-V2-Omni即将下线,引导迁移至V2.5系列;MiMo-V2.5-Pro为旗舰模型(1048576上下文,131072最大输出);OpenAI + Anthropic兼容协议;Token Plan提供cn域名端点;可直接对接Claude Code、Cursor、OpenClaw等编程工具
mimo-v2.5-pro mimo-v2-flash mimo-v2-pro
小米 MiMo V2.5系列永久降价生效;MiMo-V2.5-TTS限时免费;Token Plan按月订阅 × 免费额度 MiMo-V2.5系列永久降价生效:V2.5输入缓存命中0.02元/百万Tokens(降幅98%),V2.5-Pro输入缓存命中0.025元/百万Tokens(降幅99%);Token Plan计费体系优化,同等价格下用量提升5-8倍(Lite 41亿/Standard 110亿/Pro 380亿/Max 820亿 Credits);MiMo-V2.5-TTS保持限时免费;MiMo-V2-Pro与MiMo-V2-Omni即将下线,引导迁移至V2.5系列;MiMo-V2.5-Pro为旗舰模型(1048576上下文,131072最大输出);OpenAI + Anthropic兼容协议;Token Plan提供cn域名端点;可直接对接Claude Code、Cursor、OpenClaw等编程工具
接入参数 API 地址 https://api.xiaomimimo.com/v1
支持模型(3) mimo-v2.5-pro mimo-v2-flash mimo-v2-pro
100万 tokens免费额度;支持Gemma 4 26B、GPT-OSS-120B、Qwen3.5-397B、Mistral Medium 3.5、Devstral 2等最新模型
bge-multilingual-gemma2 gemma-3-27b-it llama-3.3-70b-instruct pixtral-12b-2409 whisper-large-v3 devstral-2-123b-instruct-2512 +11
Scaleway Generative APIs 一次性注册赠送100万tokens(用完为止,不刷新) × 免费额度 100万 tokens免费额度;支持Gemma 4 26B、GPT-OSS-120B、Qwen3.5-397B、Mistral Medium 3.5、Devstral 2等最新模型
接入参数 API 地址 https://api.scaleway.ai/v1
支持模型(17) bge-multilingual-gemma2 gemma-3-27b-it llama-3.3-70b-instruct pixtral-12b-2409 whisper-large-v3 devstral-2-123b-instruct-2512 gemma-4-26b-a4b-it gpt-oss-120b holo2-30b-a3b mistral-medium-3.5-128b mistral-small-3.2-24b-instruct-2506 qwen3-235b-a22b-instruct-2507 qwen3-coder-30b-a3b-instruct qwen3-embedding-8b qwen3.5-397b-a17b qwen3.6-35b-a3b voxtral-small-24b-2507
KAT-Coder-Air V1 永久免费调用;新用户赠送 2000万 tokens KAT-Coder-Pro V1 体验额度;KAT-Coder-Pro V2 已全量上线(SWE-bench Verified 73.4%,超越 GPT-5 与 Claude Sonnet 4);平台集成 DeepSeek、Qwen、Kimi 等主流模型;99.95% SLA 保障;兼容 Claude Code、Cline、Kilo、OpenCode 等10+主流AI编码工具
kat-coder-pro-v2 kat-coder-pro-v1 kat-coder-air-v1
快手万擎 (StreamLake) KAT-Coder-Air V1 永久免费;新用户2000万tokens一次性赠送 × 免费额度 KAT-Coder-Air V1 永久免费调用;新用户赠送 2000万 tokens KAT-Coder-Pro V1 体验额度;KAT-Coder-Pro V2 已全量上线(SWE-bench Verified 73.4%,超越 GPT-5 与 Claude Sonnet 4);平台集成 DeepSeek、Qwen、Kimi 等主流模型;99.95% SLA 保障;兼容 Claude Code、Cline、Kilo、OpenCode 等10+主流AI编码工具
接入参数 API 地址 https://api.streamlake.com/v1
支持模型(3) kat-coder-pro-v2 kat-coder-pro-v1 kat-coder-air-v1
新用户注册赠送多模型免费体验包(各模型独立额度,每个主账号限领一次):Hy3 preview 100万Tokens、DeepSeek-V4-Flash 100万Tokens、DeepSeek-V4-Pro 100万Tokens、GLM-5 100万Tokens、GLM-5.1 50万Tokens、MiniMax-M2.7 100万Tokens、MiniMax-M2.5 100万Tokens、Qwen3.5-Plus 100万Tokens、Qwen3.5-Flash 100万Tokens、Kimi-K2.5 50万Tokens、Kimi-K2.6 50万Tokens、GLM-5V-Turbo 50万Tokens、YT-VITA 100万Tokens等;⚠️ Deepseek-v3.1、Deepseek-v3-0324、Deepseek-r1-0528已于2026-05-25下线;HY 2.0 Think和HY 2.0 Instruct将于2026-06-22下线;视觉模型:HY-Image-V3.0 50次图像生成、生视频50积分、混元生3D 100积分;兼容OpenAI/Anthropic协议;腾讯云旗下大模型服务平台,另有Token Plan/Coding Plan付费订阅;活动时间截至2026年12月31日
hy3-preview deepseek-v4-flash deepseek-v4-pro glm-5 glm-5.1 minimax-m2.7 +8
腾讯云TokenHub 语言模型额度90天有效;视觉/视频/3D额度365天有效;部分模型即将下线 × 免费额度 新用户注册赠送多模型免费体验包(各模型独立额度,每个主账号限领一次):Hy3 preview 100万Tokens、DeepSeek-V4-Flash 100万Tokens、DeepSeek-V4-Pro 100万Tokens、GLM-5 100万Tokens、GLM-5.1 50万Tokens、MiniMax-M2.7 100万Tokens、MiniMax-M2.5 100万Tokens、Qwen3.5-Plus 100万Tokens、Qwen3.5-Flash 100万Tokens、Kimi-K2.5 50万Tokens、Kimi-K2.6 50万Tokens、GLM-5V-Turbo 50万Tokens、YT-VITA 100万Tokens等;⚠️ Deepseek-v3.1、Deepseek-v3-0324、Deepseek-r1-0528已于2026-05-25下线;HY 2.0 Think和HY 2.0 Instruct将于2026-06-22下线;视觉模型:HY-Image-V3.0 50次图像生成、生视频50积分、混元生3D 100积分;兼容OpenAI/Anthropic协议;腾讯云旗下大模型服务平台,另有Token Plan/Coding Plan付费订阅;活动时间截至2026年12月31日
接入参数 API 地址 https://tokenhub.tencentmaas.com/v1
支持模型(14) hy3-preview deepseek-v4-flash deepseek-v4-pro glm-5 glm-5.1 minimax-m2.7 kimi-k2.6 deepseek-v3.2 glm-5-turbo kimi-k2.5 minimax-m2.5 qwen3.5-flash qwen3.5-plus glm-5v-turbo
新用户注册AWS Free Tier可获得最高$200服务抵扣金($100注册赠送 + $100完成5个入门任务);可用于Bedrock API调用Claude系列(Opus/Sonnet/Haiku)、OpenAI GPT-5系列、DeepSeek V4、Llama 4、Mistral Large、Amazon Nova、Cohere、Stability AI等全系列模型;需绑定信用卡($1临时验证,验证后释放);支持Playground免代码测试;另有AWS Activate创业计划可申请更高额度
anthropic.claude-sonnet-4 anthropic.claude-opus-4-5 openai.gpt-5 deepseek.deepseek-v4-pro meta.llama-4-scout mistral.mistral-large +1
AWS Bedrock 免费计划6个月或额度耗尽(以先到者为准);升级付费计划后剩余额度12个月有效 × 免费额度 新用户注册AWS Free Tier可获得最高$200服务抵扣金($100注册赠送 + $100完成5个入门任务);可用于Bedrock API调用Claude系列(Opus/Sonnet/Haiku)、OpenAI GPT-5系列、DeepSeek V4、Llama 4、Mistral Large、Amazon Nova、Cohere、Stability AI等全系列模型;需绑定信用卡($1临时验证,验证后释放);支持Playground免代码测试;另有AWS Activate创业计划可申请更高额度
接入参数 API 地址 https://bedrock-runtime.{region}.amazonaws.com
支持模型(7) anthropic.claude-sonnet-4 anthropic.claude-opus-4-5 openai.gpt-5 deepseek.deepseek-v4-pro meta.llama-4-scout mistral.mistral-large amazon.nova-pro
GLM-4.7-Flash:完全免费(无限制基础对话,1并发,200K上下文,编程能力SOTA SWE-Bench 59.2%);GLM-4.5-Flash:完全免费(128K上下文);GLM-4.6V-Flash:免费视觉模型;Coding Lite计划$3/月(120次/5小时,GLM-5/5.1访问);Coding Pro计划$15/月(不限次,更高速率);全系GLM模型MIT开源可商用;与国内智谱AI(open.bigmodel.cn)账户体系独立,面向国际用户
glm-4.7-flash glm-4.5-flash glm-4.6v-flash glm-5.1 glm-5 glm-5-turbo +3
Z.ai(智谱AI国际版) GLM-4.7-Flash/4.5-Flash/4.6V-Flash永久免费(1并发限制);Coding Plan按月订阅 × 免费额度 GLM-4.7-Flash:完全免费(无限制基础对话,1并发,200K上下文,编程能力SOTA SWE-Bench 59.2%);GLM-4.5-Flash:完全免费(128K上下文);GLM-4.6V-Flash:免费视觉模型;Coding Lite计划$3/月(120次/5小时,GLM-5/5.1访问);Coding Pro计划$15/月(不限次,更高速率);全系GLM模型MIT开源可商用;与国内智谱AI(open.bigmodel.cn)账户体系独立,面向国际用户
接入参数 API 地址 https://api.z.ai/api/paas/v4
支持模型(9) glm-4.7-flash glm-4.5-flash glm-4.6v-flash glm-5.1 glm-5 glm-5-turbo glm-4.7 glm-4.6 glm-4.5
Step 3.5 Flash模型完全免费(无累计用量限制,196B MoE总参数/11B激活,256K上下文,专为Agent场景设计,支持function calling/工具调用);注册即赠送免费额度可用于Step系列全系模型(Step 3.5 Flash、Step 3、Step 2、Step 1、Step 1o系列视觉模型、StepAudio语音模型等);V0免费层:5 RPM/10 QPM/500万TPM;OpenRouter上Step 3.5 Flash也标注为:free可免费调用;2026年2月发布Step 3.5 Flash开源模型,CNCF项目成员,支持昇腾/沐曦/壁仞/燧原等国产芯片适配
step-3.5-flash step-3 step-2 step-1 step-1o-turbo-vision step-r1-v-mini +1
阶跃星辰 (StepFun) Step 3.5 Flash永久免费;新用户注册赠送免费额度一次性;V0免费层级长期有效 × 免费额度 Step 3.5 Flash模型完全免费(无累计用量限制,196B MoE总参数/11B激活,256K上下文,专为Agent场景设计,支持function calling/工具调用);注册即赠送免费额度可用于Step系列全系模型(Step 3.5 Flash、Step 3、Step 2、Step 1、Step 1o系列视觉模型、StepAudio语音模型等);V0免费层:5 RPM/10 QPM/500万TPM;OpenRouter上Step 3.5 Flash也标注为:free可免费调用;2026年2月发布Step 3.5 Flash开源模型,CNCF项目成员,支持昇腾/沐曦/壁仞/燧原等国产芯片适配
接入参数 API 地址 https://api.stepfun.com/v1
支持模型(7) step-3.5-flash step-3 step-2 step-1 step-1o-turbo-vision step-r1-v-mini stepaudio-2.5-realtime
新用户首次开通即赠每模型 100万 tokens 免费额度(新加坡区域International Edition);覆盖 Qwen 全系列文本/代码/视觉/推理模型(qwen-plus、qwen-flash、qwen3-vl-plus、qvq-max、qwen3-coder-plus等);另赠 100张AI生图 + 50秒视频生成 + TTS字符额度;无需信用卡;OpenAI兼容API(DashScope API Key);⚠️ 必须在新加坡区域激活才享免费额度,北京/弗吉尼亚区域无免费额度
qwen-plus qwen-turbo qwen3-coder-plus qwen3-vl-plus qvq-max qwen3.5-omni +2
阿里云百炼国际版 (Alibaba Cloud Model Studio) 激活后90天有效(免费额度从激活时起算,非首次调用) × 免费额度 新用户首次开通即赠每模型 100万 tokens 免费额度(新加坡区域International Edition);覆盖 Qwen 全系列文本/代码/视觉/推理模型(qwen-plus、qwen-flash、qwen3-vl-plus、qvq-max、qwen3-coder-plus等);另赠 100张AI生图 + 50秒视频生成 + TTS字符额度;无需信用卡;OpenAI兼容API(DashScope API Key);⚠️ 必须在新加坡区域激活才享免费额度,北京/弗吉尼亚区域无免费额度
接入参数 API 地址 https://dashscope.ap-southeast-1.aliyuncs.com/compatible-mode/v1
支持模型(8) qwen-plus qwen-turbo qwen3-coder-plus qwen3-vl-plus qvq-max qwen3.5-omni deepseek-r1 deepseek-v3
SkyClaw-v1.0及SkyClaw-v1.0-lite Agent模型限时免费试用(2026年5月26日发布);SkyClaw-v1.0输入0.5元/百万Token、输出4元/百万Token;SkyClaw-v1.0-lite输入0.3元/百万Token、输出2元/百万Token;需通过APIFree平台(www.apifree.ai)注册获取密钥;百万token超长上下文;原生Agent训练(非通用大模型+工具壳);深度适配OpenClaw、Hermes、Claude Code等主流Agent框架;OpenAI兼容API格式;免费期结束后将逐步开源各模型版本;⚠️ 限时免费期进行中,建议关注官方公告确认截止时间
skyclaw-v1.0 skyclaw-v1.0-lite
昆仑万维天工 (SkyWork) 限时免费试用中(2026年5月底起);免费期结束后按量付费+逐步开源 × 免费额度 SkyClaw-v1.0及SkyClaw-v1.0-lite Agent模型限时免费试用(2026年5月26日发布);SkyClaw-v1.0输入0.5元/百万Token、输出4元/百万Token;SkyClaw-v1.0-lite输入0.3元/百万Token、输出2元/百万Token;需通过APIFree平台(www.apifree.ai)注册获取密钥;百万token超长上下文;原生Agent训练(非通用大模型+工具壳);深度适配OpenClaw、Hermes、Claude Code等主流Agent框架;OpenAI兼容API格式;免费期结束后将逐步开源各模型版本;⚠️ 限时免费期进行中,建议关注官方公告确认截止时间
接入参数 API 地址 https://api.skywork.ai/v1
支持模型(2) skyclaw-v1.0 skyclaw-v1.0-lite
免费层:20 RPM / 50 RPD(终身充值$10后提升至1000 RPD);70+ 模型标注:free可免费调用(含 Llama 3.3 70B、Gemma 3/4 全系列、Qwen3 全系列、DeepSeek-R1-Distill/V4-Flash、Mistral Small 3.1/3.2、MiniMax M2.5/M3/M2.7、Nemotron 3 Nano/Super/Content、GPT-OSS 120B/20B、Cogito v1、Poolside Laguna M.1/XS.2、Google Lyria 3 Pro/Clip、Kimi K2.6、Owl Alpha、Nex AGI N2-Pro、Liquid LFM 2.5 1.2B、Z.ai GLM-4.5-Air、Big Pickle Stealth 等);单API Key访问300+模型;OpenAI兼容格式;模型路由与自动故障转移
meta-llama/llama-3.3-70b-instruct:free google/gemma-3-27b-it:free google/gemma-3-12b-it:free google/gemma-3-4b-it:free google/gemma-4-26b-a4b-it:free google/gemma-4-31b-it:free +32
OpenRouter 每日重置(永久免费层;充值$10后速率限制永久提升) × 免费额度 免费层:20 RPM / 50 RPD(终身充值$10后提升至1000 RPD);70+ 模型标注:free可免费调用(含 Llama 3.3 70B、Gemma 3/4 全系列、Qwen3 全系列、DeepSeek-R1-Distill/V4-Flash、Mistral Small 3.1/3.2、MiniMax M2.5/M3/M2.7、Nemotron 3 Nano/Super/Content、GPT-OSS 120B/20B、Cogito v1、Poolside Laguna M.1/XS.2、Google Lyria 3 Pro/Clip、Kimi K2.6、Owl Alpha、Nex AGI N2-Pro、Liquid LFM 2.5 1.2B、Z.ai GLM-4.5-Air、Big Pickle Stealth 等);单API Key访问300+模型;OpenAI兼容格式;模型路由与自动故障转移
接入参数 API 地址 https://openrouter.ai/api/v1
支持模型(38) meta-llama/llama-3.3-70b-instruct:free google/gemma-3-27b-it:free google/gemma-3-12b-it:free google/gemma-3-4b-it:free google/gemma-4-26b-a4b-it:free google/gemma-4-31b-it:free google/lyria-3-pro-preview:free google/lyria-3-clip-preview:free qwen/qwen3-235b-a22b:free qwen/qwen3-32b:free qwen/qwen3-14b:free qwen/qwen3-8b:free qwen/qwen3-4b:free qwen/qwen3-coder:free qwen/qwen3-next-80b-a3b-instruct:free deepseek/deepseek-r1-distill-llama-70b:free deepseek/deepseek-v4-flash:free mistralai/mistral-small-3.1-24b-instruct:free minimax/minimax-m2.5:free minimax/minimax-m3:free nvidia/nemotron-3-nano-30b-a3b:free nvidia/nemotron-3-nano-omni-30b-a3b-reasoning:free nvidia/nemotron-3-super-120b-a12b:free nvidia/nemotron-nano-12b-v2-vl:free nvidia/nemotron-nano-9b-v2:free openai/gpt-oss-120b:free openai/gpt-oss-20b:free moonshotai/kimi-k2.6:free poolside/laguna-m.1:free poolside/laguna-xs.2:free cognitive-cogito/cogito-v1-preview-llama-70b:free openrouter-owl/owl-alpha:free nex-agi/nex-n2-pro:free liquid/lfm-2.5-1.2b-instruct:free liquid/lfm-2.5-1.2b-thinking:free z-ai/glm-4.5-air:free cognitivecomputations/dolphin-mistral-24b-venice-edition:free cognitivecomputations/big-pickle-stealth:free
全球Top 10 AI Lab,2026年6月1日起全模态模型API无限期免费开放(无需绑卡、无试用期);文本模型Agnes-2.0-Flash(1M超长上下文、原生Function Calling、Claw-Eval国际榜单前列、支持thinking模式)、Agnes-1.5-Flash(多模态、即问即答、图片解析);图像模型Agnes-Image-2.1-Flash(纯文生图,中文prompt完全支持)+Agnes-Image-2.0-Flash(图生图/图片编辑/多图合成,Artificial Analysis图像编辑榜单前三);视频模型Agnes-Video-V2.0(音画同步生成);免费后首周调用量超1万亿Token;OpenAI兼容协议,改一行base_url即可接入;单实例TPS 200+,高并发800左右
agnes-2.0-flash agnes-1.5-flash agnes-image-2.1-flash agnes-image-2.0-flash agnes-video-v2.0
Agnes AI 无限期免费(2026年6月1日起永久免费) × 免费额度 全球Top 10 AI Lab,2026年6月1日起全模态模型API无限期免费开放(无需绑卡、无试用期);文本模型Agnes-2.0-Flash(1M超长上下文、原生Function Calling、Claw-Eval国际榜单前列、支持thinking模式)、Agnes-1.5-Flash(多模态、即问即答、图片解析);图像模型Agnes-Image-2.1-Flash(纯文生图,中文prompt完全支持)+Agnes-Image-2.0-Flash(图生图/图片编辑/多图合成,Artificial Analysis图像编辑榜单前三);视频模型Agnes-Video-V2.0(音画同步生成);免费后首周调用量超1万亿Token;OpenAI兼容协议,改一行base_url即可接入;单实例TPS 200+,高并发800左右
接入参数 API 地址 https://apihub.agnes-ai.com/v1
支持模型(5) agnes-2.0-flash agnes-1.5-flash agnes-image-2.1-flash agnes-image-2.0-flash agnes-video-v2.0
公司邮箱注册赠送 $20 免费积分;专注图像/视频/音频AI生成平台;支持 Sora 2、可灵(Kling)、Flux Pro、Stable Diffusion 3.5、Stable Video Diffusion、WAN 2.2 等前沿生成模型;OpenAI兼容API格式;按量计费,积分用完为止
fal-ai/flux-pro/v1.1-ultra fal-ai/flux/dev fal-ai/stable-diffusion-v3.5-large fal-ai/kling-v1.6/pro fal-ai/wan/v2.2 fal-ai/sora-v2
fal.ai $20一次性注册积分(用完为止,公司邮箱验证) × 免费额度 公司邮箱注册赠送 $20 免费积分;专注图像/视频/音频AI生成平台;支持 Sora 2、可灵(Kling)、Flux Pro、Stable Diffusion 3.5、Stable Video Diffusion、WAN 2.2 等前沿生成模型;OpenAI兼容API格式;按量计费,积分用完为止
接入参数 支持模型(6) fal-ai/flux-pro/v1.1-ultra fal-ai/flux/dev fal-ai/stable-diffusion-v3.5-large fal-ai/kling-v1.6/pro fal-ai/wan/v2.2 fal-ai/sora-v2
各模型2500万Tokens免费领取(两周有效);DeepSeek-V4-Pro、DeepSeek-V4-Flash各50万Tokens专属额度;其他模型各100万Tokens体验额度;覆盖GLM-5、GLM-5.1、Qwen3.5-397B-A17B、DeepSeek-V3.2(旗舰版)、DeepSeek-R1、Doubao-Seed-2.0-pro、星辰语义大模型等18+主流大模型;新老用户均可领取(需实名认证);「国模+国芯+国云」全产业链闭环,支持国产芯片适配
glm-5 glm-5.1 qwen3.5-397b-a17b deepseek-v3.2 deepseek-v4-pro deepseek-v4-flash +2
天翼云息壤智算 首次使用模型起两周有效;专属模型额度14天有效 × 免费额度 各模型2500万Tokens免费领取(两周有效);DeepSeek-V4-Pro、DeepSeek-V4-Flash各50万Tokens专属额度;其他模型各100万Tokens体验额度;覆盖GLM-5、GLM-5.1、Qwen3.5-397B-A17B、DeepSeek-V3.2(旗舰版)、DeepSeek-R1、Doubao-Seed-2.0-pro、星辰语义大模型等18+主流大模型;新老用户均可领取(需实名认证);「国模+国芯+国云」全产业链闭环,支持国产芯片适配
接入参数 API 地址 https://api.ctyun.cn/v1
支持模型(8) glm-5 glm-5.1 qwen3.5-397b-a17b deepseek-v3.2 deepseek-v4-pro deepseek-v4-flash doubao-seed-2.0-pro deepseek-r1
新用户注册赠送500万Tokens(支持DeepSeek-R1/V3、Qwen3-235B、Kimi-K2.5、ERNIE-4.5等主流模型);部分轻量级模型提供永久免费调用额度;提供LLM、图像生成、视频生成等多模态API;中国大陆直连,低延迟;中国领先的独立分布式云计算服务商
deepseek/deepseek-r1 deepseek/deepseek-v3 qwen/qwen3-235b-a22b moonshotai/kimi-k2.5 baidu/ernie-4.5
派欧云(PPIO) 注册赠送额度用完为止;部分模型永久免费 × 免费额度 新用户注册赠送500万Tokens(支持DeepSeek-R1/V3、Qwen3-235B、Kimi-K2.5、ERNIE-4.5等主流模型);部分轻量级模型提供永久免费调用额度;提供LLM、图像生成、视频生成等多模态API;中国大陆直连,低延迟;中国领先的独立分布式云计算服务商
接入参数 API 地址 https://api.ppio.com/openai/v1
支持模型(5) deepseek/deepseek-r1 deepseek/deepseek-v3 qwen/qwen3-235b-a22b moonshotai/kimi-k2.5 baidu/ernie-4.5
新客首月1.9元=1.8亿Credits(5款模型一Key通吃);U-Model TokenPlan Lite入门级1.8亿Credits敞开用,文本/视觉/语音共享一个额度池;Unsiound U2(266B MoE原生智能体大模型,SWE-Bench 75分,Claw-Eval 76.9分,GPQA Diamond 87.9分)、U1-OCR(智能文档识别)、U2-ASR(方言+多语语音转写,覆盖100+方言)、U2-TTS(语音合成)、U2-TTS-Clone(音色复刻);兼容Claude Code/Cursor/OpenClaw全主流工具;快慢思考融合架构,自主完成百步工作流
unisound-u2 unisound-u1-ocr unisound-u2-asr unisound-u2-tts unisound-u2-tts-clone
云知声Token Hub(Unisound) TokenPlan按月订阅(首月1.9元特惠,后续Lite/Standard/Pro/Max四档) × 免费额度 新客首月1.9元=1.8亿Credits(5款模型一Key通吃);U-Model TokenPlan Lite入门级1.8亿Credits敞开用,文本/视觉/语音共享一个额度池;Unsiound U2(266B MoE原生智能体大模型,SWE-Bench 75分,Claw-Eval 76.9分,GPQA Diamond 87.9分)、U1-OCR(智能文档识别)、U2-ASR(方言+多语语音转写,覆盖100+方言)、U2-TTS(语音合成)、U2-TTS-Clone(音色复刻);兼容Claude Code/Cursor/OpenClaw全主流工具;快慢思考融合架构,自主完成百步工作流
接入参数 API 地址 https://maas.unisound.com/v1
支持模型(5) unisound-u2 unisound-u1-ocr unisound-u2-asr unisound-u2-tts unisound-u2-tts-clone
Laguna M.1(225B/23B激活)和Laguna XS.2(33B/3B激活)限时免费(通过官方API和OpenRouter均可调用);专注Agentic Coding场景;Laguna M.1:SWE-bench Verified 72.5%、SWE-bench Pro 46.9%、Terminal-Bench 2.0领先;Laguna XS.2:Apache 2.0开源,单GPU可运行,33B参数对标更大模型;256K上下文;支持Function Calling/工具调用;Laguna XS.2开源权重可在HuggingFace下载自行部署
poolside/laguna-m.1 poolside/laguna-xs.2
Poolside(Laguna) 限时免费(M.1限时,XS.2无宣布结束日期;OpenRouter上标注:free) × 免费额度 Laguna M.1(225B/23B激活)和Laguna XS.2(33B/3B激活)限时免费(通过官方API和OpenRouter均可调用);专注Agentic Coding场景;Laguna M.1:SWE-bench Verified 72.5%、SWE-bench Pro 46.9%、Terminal-Bench 2.0领先;Laguna XS.2:Apache 2.0开源,单GPU可运行,33B参数对标更大模型;256K上下文;支持Function Calling/工具调用;Laguna XS.2开源权重可在HuggingFace下载自行部署
接入参数 API 地址 https://api.poolside.ai/v1
支持模型(2) poolside/laguna-m.1 poolside/laguna-xs.2
Token Plan免费公测中:deepseek-v4-flash 每5小时150次调用;SenseNova-U1 每5小时1500次调用(原生统一多模态模型,基于NEO-Unify架构,支持理解与生成);SenseNova-U1-Fast 每5小时1500次调用(U1快速版本,低延迟高并发);SenseNova 6.7 Flash-Lite 每5小时1500次调用(轻量多模态智能体模型,原生多模态架构、Token效率优化);公测期间完全免费,无需绑卡,注册即领API Key;完全兼容OpenAI接口格式;2026年4月推出Token Plan,2026年5月新增DeepSeek V4 Flash支持;可接入OpenClaw、ChatBox、Cherry Studio、Cline等主流AI工具
deepseek-v4-flash sensenova-u1 sensenova-u1-fast sensenova-6.7-flash-lite
商汤日日新 (SenseNova) 每5小时重置(公测免费阶段,政策以官方公告为准) × 免费额度 Token Plan免费公测中:deepseek-v4-flash 每5小时150次调用;SenseNova-U1 每5小时1500次调用(原生统一多模态模型,基于NEO-Unify架构,支持理解与生成);SenseNova-U1-Fast 每5小时1500次调用(U1快速版本,低延迟高并发);SenseNova 6.7 Flash-Lite 每5小时1500次调用(轻量多模态智能体模型,原生多模态架构、Token效率优化);公测期间完全免费,无需绑卡,注册即领API Key;完全兼容OpenAI接口格式;2026年4月推出Token Plan,2026年5月新增DeepSeek V4 Flash支持;可接入OpenClaw、ChatBox、Cherry Studio、Cline等主流AI工具
接入参数 API 地址 https://token.sensenova.cn/v1
支持模型(4) deepseek-v4-flash sensenova-u1 sensenova-u1-fast sensenova-6.7-flash-lite
新用户注册赠送 $5 免费积分(支持 40+ 开源模型推理,含 Llama 3.3 70B、Qwen 2.5 72B、DeepSeek-R1、Mixtral 8x7B、Whisper 等;60 RPM速率限制;2026年5月完成$1.07亿B轮融资);OpenAI兼容API格式;按量计费,积分用完为止
meta-llama/Llama-3.3-70B-Instruct meta-llama/Llama-3.1-8B-Instruct Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-R1 mistralai/Mixtral-8x7B-Instruct-v0.1 openai/whisper-large
DeepInfra 一次性注册积分($5,用完为止) × 免费额度 新用户注册赠送 $5 免费积分(支持 40+ 开源模型推理,含 Llama 3.3 70B、Qwen 2.5 72B、DeepSeek-R1、Mixtral 8x7B、Whisper 等;60 RPM速率限制;2026年5月完成$1.07亿B轮融资);OpenAI兼容API格式;按量计费,积分用完为止
接入参数 API 地址 https://api.deepinfra.com/v1/openai
支持模型(6) meta-llama/Llama-3.3-70B-Instruct meta-llama/Llama-3.1-8B-Instruct Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-R1 mistralai/Mixtral-8x7B-Instruct-v0.1 openai/whisper-large
社区驱动的免费开源模型推理平台(基于去中心化算力);支持 DeepSeek-R1、Llama 3.1 70B、Qwen 2.5 72B 等主流开源模型;无需信用卡;可自行添加模型;Serverless推理按可用性分配资源;部分模型永久在线(Featured模型)
deepseek-ai/DeepSeek-R1 meta-llama/Llama-3.1-70B-Instruct Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-V4-Flash
Chutes.ai 永久免费层(社区驱动,可用性取决于算力供给) × 免费额度 社区驱动的免费开源模型推理平台(基于去中心化算力);支持 DeepSeek-R1、Llama 3.1 70B、Qwen 2.5 72B 等主流开源模型;无需信用卡;可自行添加模型;Serverless推理按可用性分配资源;部分模型永久在线(Featured模型)
接入参数 API 地址 https://chutes.ai/app/api/v1
支持模型(4) deepseek-ai/DeepSeek-R1 meta-llama/Llama-3.1-70B-Instruct Qwen/Qwen2.5-72B-Instruct deepseek-ai/DeepSeek-V4-Flash
4款模型永久免费调用(不扣额度、不限期、无需绑卡):minimax/minimax-m3(MiniMax旗舰模型,1M token上下文,2026年6月发布)、minimax/minimax-m2.5(MiniMax前代旗舰)、xiaomi/mimo-v2.5(小米推理模型)、deepseek/deepseek-v4-flash(DeepSeek快速模型);新用户注册自动赠送$0.5初始额度(免费模型不扣此额度,留作付费模型体验);1M超长上下文(市面免费API中最大);OpenAI兼容API格式;Cline原为VS Code AI编程助手插件(61.8k GitHub Stars),后开设官方API平台
minimax/minimax-m3 minimax/minimax-m2.5 xiaomi/mimo-v2.5 deepseek/deepseek-v4-flash
Cline.bot 永久免费(4款免费模型不扣额度不限期;$0.5注册额度用完为止) × 免费额度 4款模型永久免费调用(不扣额度、不限期、无需绑卡):minimax/minimax-m3(MiniMax旗舰模型,1M token上下文,2026年6月发布)、minimax/minimax-m2.5(MiniMax前代旗舰)、xiaomi/mimo-v2.5(小米推理模型)、deepseek/deepseek-v4-flash(DeepSeek快速模型);新用户注册自动赠送$0.5初始额度(免费模型不扣此额度,留作付费模型体验);1M超长上下文(市面免费API中最大);OpenAI兼容API格式;Cline原为VS Code AI编程助手插件(61.8k GitHub Stars),后开设官方API平台
接入参数 API 地址 https://api.cline.bot/api/v1
支持模型(4) minimax/minimax-m3 minimax/minimax-m2.5 xiaomi/mimo-v2.5 deepseek/deepseek-v4-flash
新用户注册赠送 1000万 tokens(无需信用卡);支持 Mercury 2(128K上下文,最快推理LLM,支持工具调用和结构化输出)、Mercury Edit 2(代码编辑FIM/NextEdit);输入$0.25/百万Tokens,输出$0.75/百万Tokens(缓存命中$0.025/百万Tokens)
mercury-2 mercury-edit-2
Inception AI(Inception Labs) 一次性注册赠送1000万tokens(用完为止) × 免费额度 新用户注册赠送 1000万 tokens(无需信用卡);支持 Mercury 2(128K上下文,最快推理LLM,支持工具调用和结构化输出)、Mercury Edit 2(代码编辑FIM/NextEdit);输入$0.25/百万Tokens,输出$0.75/百万Tokens(缓存命中$0.025/百万Tokens)
接入参数 API 地址 https://api.inceptionlabs.ai/v1
支持模型(2) mercury-2 mercury-edit-2
免费层:dxnt/free模型每天100次免费调用(系统自动优选最优免费模型,每30分钟评估质量/延迟/成功率排序);兼容OpenAI API格式,只需将model改为dxnt/free即可;平台聚合数百个国内外AI模型Token资源(GPT、Claude、Gemini、DeepSeek、Qwen等),支持模型路由、智能轮循、故障转移;API Key每5-7天自动轮换;⚠️ 免费层有每日调用次数限制,付费套餐另购
dxnt/free gpt-5 claude-sonnet-4 gemini-2.5-pro deepseek-v4-flash qwen-plus
TOKEN自由 (dxnt.com) 每日重置(免费层100次/天;API Key 5-7天自动轮换) × 免费额度 免费层:dxnt/free模型每天100次免费调用(系统自动优选最优免费模型,每30分钟评估质量/延迟/成功率排序);兼容OpenAI API格式,只需将model改为dxnt/free即可;平台聚合数百个国内外AI模型Token资源(GPT、Claude、Gemini、DeepSeek、Qwen等),支持模型路由、智能轮循、故障转移;API Key每5-7天自动轮换;⚠️ 免费层有每日调用次数限制,付费套餐另购
接入参数 API 地址 https://www.dxnt.com/api/v1
支持模型(6) dxnt/free gpt-5 claude-sonnet-4 gemini-2.5-pro deepseek-v4-flash qwen-plus
提供经过严格测试与优化的免费编码模型(Big Pickle Stealth、Nemotron 3 Super Free、DeepSeek V4 Flash Free 等);通过 OpenCode 终端/桌面/IDE 工具连接即可使用,无需自备 API Key;免费模型可能使用数据用于模型改进;OpenCode 本身为 MIT 开源项目(GitHub 超109k Stars),支持75+ LLM提供商接入;推荐搭配本地模型实现完全离线使用
deepseek-v4-flash-free nemotron-3-super-free big-pickle-stealth
OpenCode Zen 永久免费层(免费模型长期可用,政策以官方公告为准) × 免费额度 提供经过严格测试与优化的免费编码模型(Big Pickle Stealth、Nemotron 3 Super Free、DeepSeek V4 Flash Free 等);通过 OpenCode 终端/桌面/IDE 工具连接即可使用,无需自备 API Key;免费模型可能使用数据用于模型改进;OpenCode 本身为 MIT 开源项目(GitHub 超109k Stars),支持75+ LLM提供商接入;推荐搭配本地模型实现完全离线使用
接入参数 API 地址 https://api.opencode.ai/v1
支持模型(3) deepseek-v4-flash-free nemotron-3-super-free big-pickle-stealth