免费AI API额度汇总

85 / 85 个平台

收录主流 AI 平台免费 API 额度,支持搜索筛选与导出

数据更新于 2026-06-15* 额度政策可能随时变更,以官网为准
Google AI Studio (Gemini) 每日重置(永久免费层)
Gemini 3.5 Flash:2026年5月19日Google I/O发布(289 tokens/秒,1M上下文,免费层5 RPM/25万TPM/20 RPD);Gemini 4.0:已发布(原生多模态架构,2小时4K视频分析,端云协同,免费层政策待确认);Gemini 3 Flash:输入输出token免费(5 RPM/25万TPM/20 RPD);Gemini 2.5 Flash:输入输出token免费(5 RPM/25万TPM/20 RPD);Gemini 2.5 Flash-Lite:输入输出token免费(10 RPM/25万TPM/20 RPD);Gemini 3.1 Flash-Lite 预览版:输入输出token免费(15 RPM/25万TPM/500 RPD);Gemini 3.1 Flash TTS:文本转语音免费(3 RPM/10K TPM/10 RPD);Gemini 2.5 Flash TTS:文本转语音免费(3 RPM/10K TPM/10 RPD);Gemini Robotics-ER 1.6/1.5:免费预览(5 RPM/25万TPM/20 RPD);Gemma 3/4系列:免费(30 RPM/15K TPM/14400 RPD);Google搜索/地图接地:500 RPD免费;⚠️ Gemini 2.5 Pro及Gemini 3.1 Pro自2026年4月1日起移除免费层(已转为付费);免费层不适用于EU/EEA/UK地区(需同意数据训练)
gemini-3.5-flashgemini-4.0gemini-3-flashgemini-2.5-flashgemini-2.5-flash-litegemini-3.1-flash-lite-preview +11
阿里云百炼 有效期180天(此前为90天);免费额度用完可开启「用完即停」避免扣费
新用户开通即赠 7000万Tokens + 100张AI生图 + 50秒视频生成额度(免费领取、无需绑卡);Qwen-Turbo、Qwen-Plus等模型100万tokens/天内免费调用;另赠200元无门槛代金券;DataWorks API已调整为按量付费(标准版10万次/月、专业版50万次/月);2026年5月20日阿里云峰会宣布全面开放接入第三方大模型:已上架智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、Pixverse-v6、可灵、Vidu Q3、阶跃星辰等;模型列表新增Qwen3.5-Omni、Qwen3-Coder-Plus、DeepSeek-R1-0528等;新推出Coding Plan Lite版(首月7.9元无限调用Qwen3-Coder)
qwen-plusqwen-turboqwen-longqwen2.5-72b-instructqwen2.5-32b-instructdeepseek-r1 +6
百度千帆 Speed/Lite/3.5系列永久免费;主流模型额度3个月有效(自开通起算)
【永久免费不限量】ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny 系列永久免费调用不限量(仅QPS限速50次/秒);ERNIE-3.5-8K 永久免费不限量;ERNIE-4.5-Turbo、DeepSeek(R1/V3系列)、Qwen3、Kimi K2.5 等主流模型每模型 100万 token(3个月有效);新用户注册送150万tokens,企业认证送200万tokens;2026年2月上线千帆Coding Plan;ERNIE-Speed/Lite从有限免费升级为完全免费不限量
ernie-4.5-turbo-128kernie-4.5-turbo-32kernie-x1-turbo-32kernie-3.5-8kernie-speed-8kernie-lite-8k +9
腾讯混元 通用包1年有效;Lite版永久免费;小程序成长计划2026年12月31日前有效
首次开通赠送 100万 token(通用包,1年有效)+ 100万 Embedding token;Hunyuan-lite 永久免费不限量;Hunyuan-T1(超大规模推理)、Hunyuan-TurboS(快思考)、Hunyuan-A13B(混合推理)均在通用包内;【额外】微信「AI小程序成长计划」:开发者可在小程序后台申领1亿混元文生文token + 1万张文生图额度(2026全年有效,至2026年12月31日);⚠️ 混元HY2.0模型输入价格已涨463%(从0.0008元/千Token涨至0.004505元/千Token),第三方模型免费公测已结束;⚠️ 原腾讯混元大模型平台将于2026年9月30日全面停服,建议迁移至TokenHub平台使用hy3-preview替代
hunyuan-t1hunyuan-turbo-shunyuan-a13bhunyuan-litehunyuan-visionhunyuan-7b
火山引擎(豆包) 每日重置(永久免费);新人赠送额度一次性
每日 200万 token(支持豆包系列、DeepSeek-V3.2、Kimi-K2 等主流模型,永久免费);另每个新开通模型赠送 50万 token 新人包+冷启动包;2026年3月新增 Doubao-Seed-2.0 Lite 免费变体
doubao-lite-4kdoubao-lite-32kdoubao-pro-32kdoubao-pro-128kdeepseek-r1deepseek-v3-241226 +3
硅基流动(SiliconFlow) 2000万token永久有效;实名认证代金券一次性赠送
新用户注册即领 2000万 token(永久有效);完成新手任务可额外领取 1000万 token,累计最高 3000万 token;完成实名认证再赠 16元 代金券;支持DeepSeek-V4、Llama、Qwen等主流开源模型,完全兼容OpenAI格式;基础用户QPS=5,TPM=100k;部分轻量级模型提供永久免费调用额度;推理速度比行业领先平台快2.3倍
deepseek-ai/DeepSeek-V3deepseek-ai/DeepSeek-R1deepseek-ai/DeepSeek-V4-FlashQwen/Qwen2.5-72B-InstructQwen/Qwen2.5-32B-Instructmeta-llama/Llama-3.3-70B-Instruct +2
智谱AI 新用户500万token;Flash系列模型永久免费;GLM-4-Air每月100万tokens自动重置;GLM-5系列按量付费
新用户注册赠送 2000万 token(此前为500万,已大幅提升,永久有效);GLM-4-Air:每月100万tokens(长期有效,每月自动重置);GLM-4V(多模态):每月50万tokens(长期有效);GLM-4-Flash、GLM-4.7-Flash 永久免费调用(cost=0,30 QPS);GLM-5-Turbo、GLM-5 等旗舰模型按量付费;每日签到送1万tokens,邀请好友送50万tokens;⚠️ GLM-4.5-Flash已于2026年1月下线,自动路由到GLM-4.7-Flash;GLM-4.6V-Flash免费视觉模型可用;GLM-5.1(744B/40B激活)已发布;2026年内智谱进行了三次API价格上调,GLM-5国内API价格提升约50%;GLM Coding Plan旧套餐已于2026年4月30日关闭迁移
glm-5glm-5-turboglm-4.7-flashglm-4.7-coderglm-4.6vglm-4.5-air +7
Groq 每日重置(永久免费层)
Llama 3.1 8B:30 RPM / 6K TPM / 14,400 RPD(最高频次);Llama 3.3 70B:30 RPM / 12K TPM / 1000 RPD;Llama 4 Scout:30 RPM / 30K TPM / 1000 RPD;Kimi K2 Instruct:60 RPM / 10K TPM / 1000 RPD;Qwen3 32B:30 RPM / 6K TPM / 1000 RPD;Allam 2 7B:7,000 RPD / 6K TPM;Groq Compound:30 RPM / 70K TPM / 250 RPD;Groq Compound-Mini:30 RPM / 70K TPM / 250 RPD;GPT-OSS 120B:8K TPM / 1000 RPD;GPT-OSS 20B:8K TPM / 1000 RPD;GPT-OSS Safeguard 20B:8K TPM / 1000 RPD;Whisper:20 RPM / 2000 RPD;基于自研 LPU 芯片超高速推理(700+ tokens/秒),多模型永久免费层
llama-3.3-70b-versatilellama-3.1-70b-versatilellama-3.1-8b-instantmeta-llama/llama-4-scout-17b-16e-instructmoonshotai/kimi-k2-instructmoonshotai/kimi-k2-instruct-0905 +11
Mistral AI 每月重置(Free Tier,10亿tokens/月;全模型免费;需手机号验证)
Free Tier:每月 10亿 tokens(1 RPS/50万TPM),全模型免费(含 Mistral Large 3、Mistral Medium 3.1、Mistral Small 3.2、Magistral推理系列、Codestral/Devstral代码系列);需手机号验证,需同意数据训练;⚠️ 原 Experiment Plan(10亿token/月)已取消,但新免费层额度更大(从约100 credits/10万tokens大幅升级至10亿tokens/月)
mistral-large-latestmistral-medium-3mistral-small-3.1mistral-nemocodestral-latestcodestral
Cohere Trial Key免费(20 RPM / 1,000次/月)
20 RPM / 1000 RPM/月;模型共享月度配额;支持Command A+ 05-2026(最新)、Command A Reasoning、Command A Vision、Aya Expanse 32B、Aya Vision 32B等
c4ai-aya-expanse-32bc4ai-aya-vision-32bcommand-a-03-2025command-a-plus-05-2026command-a-reasoning-08-2025command-a-translate-08-2025 +4
Cerebras 每日重置(永久免费层,约14,400 RPD)
gpt-oss-120b:30 RPM / 6万TPM / 900 RPH / 100万TPH / 14400 RPD / 100万TPD;Llama 3.1 8B:30 RPM / 6万TPM / 900 RPH / 100万TPH / 14400 RPD / 100万TPD;超高速推理(近3000 tokens/分钟);⚠️ Qwen3-235B/Qwen3-Coder-480B/Llama-4系列等模型可能已移出免费层,建议实测确认
llama-3.3-70bllama-3.1-8bqwen3-32bqwen3-235b-a22bqwen3-coder-480b-a35bllama-4-scout +2
DeepSeek 开放平台 注册赠送500万Tokens(30天有效);网页端永久免费;V3-Lite永久免费
新用户注册赠送500万Tokens(30天有效,无需信用卡);超出后纯按量付费;网页端chat.deepseek.com免费无次数限制;V4-Flash:输入1元/百万(缓存命中0.02元),输出2元/百万;V4-Pro:2026年5月22日宣布永久降价至原价1/4(2.5折优惠永久化),输入缓存命中0.025元/百万,输入未命中3元/百万,输出6元/百万;V4全系开源免费可商用;兼容OpenAI和Anthropic API格式;DeepSeek-V3-Lite:永久免费不限量(200万上下文,支持思维链可视化,QPS限制20,编程能力最强免费API);⚠️ deepseek-chat/deepseek-reasoner将于2026-07-24停用,请迁移至deepseek-v4-pro/deepseek-v4-flash;⚠️ deepseek-chat/deepseek-reasoner将于2026-07-24停用,请尽快迁移至deepseek-v4-pro/deepseek-v4-flash
deepseek-v4-prodeepseek-v4-flashdeepseek-v3-litedeepseek-chatdeepseek-reasoner
零一万物 (Yi) 每日重置(永久免费,1000次/天)
Yi-34B-Chat-Free 永久免费(社区版API被永久捐赠给开发者生态,李开复团队出品,34B参数,性能对标GPT-3.5-Turbo);每天1000次调用,每次最多16K token;中文理解极好,适合内容生成、客服对话、教育类应用;企业版收费,但社区版完全免费;支持OpenAI兼容格式
yi-34b-chat-freeyi-34b-chatyi-34b-chat-200kyi-vl-plus
百川智能 (Baichuan) 每日重置(永久免费,500次/天)
Baichuan4-Air 永久免费(百川最新一代混合专家模型,推理速度极快,首包延迟通常低于300ms);每天500次调用,支持30并发;内置函数调用能力,可直接操作数据库、发邮件、调其他API;适合Agent开发、自动化工作流、实时交互应用;2026年5月22日发布Baichuan 4(国内SuperCLUE评测第一);支持多模态能力
Baichuan4-AirBaichuan4-TurboBaichuan4Baichuan3-TurboBaichuan3-Turbo-128k
魔搭社区(ModelScope) 每日重置(永久免费层,需绑定阿里云账号)
每天 2000 次免费调用(支持 DeepSeek-R1、Qwen2.5-VL、Flux.1 等开源模型)
deepseek-ai/DeepSeek-R1qwen/Qwen2.5-72B-Instructqwen/Qwen2.5-VL-72B-Instructblack-forest-labs/FLUX.1-devdeepseek-ai/DeepSeek-V4-Flash
七牛云 AI 推理 赠送额度2年有效
新用户注册首次体验赠送 600万 token(此前为300万,已大幅提升,无时效限制);邀请活动可额外获得 1000万 token;支持 DeepSeek、Kimi、Claude、Gemini 等 50+ 模型
deepseek-r1qwen-pluskimi-k2.5deepseek-v4-flash
讯飞星火 Lite永久(每月重置);Ultra/Pro体验额度一次性;模型赠送额度短期有效
Lite版约5万 token/月(永久免费层);Ultra版(原Max升级版)赠送体验额度;Pro版免费体验包;新用户注册各模型赠送20万 token(注:Spark Max已于2026年3月10日下线,迁移至Ultra版)
spark-litespark-ultraspark-prospark-pro-128kspark-x1
AI21 Labs 一次性注册积分(3个月有效)
新用户赠送 $10 免费积分(无需信用卡,支持 Jamba Mini、Jamba Large 等长上下文模型)
jamba-minijamba-largejamba-1.5-large
AtomGit AI(开放原子) 1000万Token永久有效;无限Token模型需每24小时手动续期;算力额度每月重置
新用户注册赠送 1000万 Tokens(此前为200万,已大幅提升,永久有效);另有3个指定模型提供「无限Token」独立API Key(GLM-5量化版、Qwen3.5-397B、Qwen3.5-122B),每24小时可免费续期一次,不占用基础额度;另每月赠送 1000核时 免费算力(用于推理/微调,按月刷新不累积)
zai-org/GLM-5Qwen/Qwen3.5-397B-A17BQwen/Qwen3.5-122B-A10B
Azure OpenAI $300试用额度90天有效(需绑卡,试用期内不扣费);GitHub学生包$100信用额度12个月有效
新用户注册GCP可获得 $300 免费试用额度(90天有效,需绑定信用卡但试用期内不扣费;可用于 GPT-4o、GPT-4.1、GPT-5、o3、o4-mini 等全系列模型);⚠️ 原$5积分非通用政策,实际以GCP $300试用额度为准;GitHub Student Developer Pack 可额外获得 $100 Azure 信用额度;2026年4月微软与OpenAI独家云合作终止
gpt-5.5gpt-5gpt-5-minigpt-4ogpt-4o-minigpt-4.1 +4
Baseten 一次性注册积分(用完为止)
新用户注册赠送 $30 免费积分(支持任意 HuggingFace 模型部署,按 GPU 计算时间计费;冷启动快)
Cerebrium 一次性注册积分(需联系销售获取,无信用卡要求)
新用户赠送 $30 免费积分(Serverless GPU 推理平台,支持部署任意 HuggingFace 模型,冷启动低于5秒)
Cloudflare Workers AI 每日重置(永久免费层)
10,000 神经元单位/天(支持 50+ 模型:Llama 3/3.1/3.2/3.3/4 全系列、Qwen 1.5/2.5、DeepSeek R1/Coder、Mistral 7B/Small 3.1、Gemma 2/3、GPT-OSS-20B/120B、FLUX.2等)
@cf/meta/llama-3.2-1b-instruct@cf/meta/llama-3.2-3b-instruct@cf/meta/llama-3.3-70b-instruct@cf/mistral/mistral-7b-instruct-v0.1@cf/deepseek-ai/deepseek-r1-distill-qwen-32b@cf/qwen/qwen2.5-72b-instruct +11
Fireworks AI 一次性注册积分(用完为止)
新用户赠送 $1 免费积分(支持 50+ 开源模型,含 Llama 4、Qwen3、Gemma 3、Mixtral 等,快速推理)
accounts/fireworks/models/llama-4-scoutaccounts/fireworks/models/qwen3-72b-instructaccounts/fireworks/models/gemma-3-27b-itdeepseek-ai/DeepSeek-V4-Flash
GitHub Models 每日重置(永久免费层;不同模型每日请求次数不同,50-150次/天)
50~150 次请求/天(GPT-4o、GPT-4.1、GPT-5/5.5系列、Grok-3、o3/o4系列、Llama 4、DeepSeek-R1-0528、Claude系列、Phi-4 等多模型;限速根据模型类型浮动;依赖Copilot订阅等级)
claude-sonnet-4claude-opus-4-5gpt-5gpt-5-minigpt-5-nanogpt-4o +20
Hugging Face Inference API Serverless 每月重置(永久免费,速率限制);Inference Providers 每月 $0.10 积分(免费用户积分用完后停止)
免费 Serverless 推理(数百次请求/小时,支持 15万+ 开源模型)+ 新 Inference Providers 系统每月 $0.10 积分(支持 200+ 模型、18家推理提供商:Cerebras/Groq/Fireworks/Together等);Serverless推理限10GB以下模型
meta-llama/Llama-3.3-70B-InstructQwen/Qwen2.5-72B-Instructgoogle/gemma-2-27b-it
Hyperbolic 一次性注册积分(用完为止)
新用户赠送 $1 免费积分(支持 DeepSeek V3、Llama 3.1 405B、Qwen 2.5 72B 等开源模型)
meta-llama/Llama-3.1-405B-Basedeepseek-ai/DeepSeek-V3Qwen/Qwen2.5-72B-Instructdeepseek-ai/DeepSeek-V4-Flash
Inference.net 一次性注册积分(用完为止)
新用户赠送 $1 免费积分(回应调查可额外获得 $25;支持多种开源模型推理)
meta-llama/Llama-3.3-70B-Instructdeepseek-ai/DeepSeek-R1deepseek-ai/DeepSeek-V4-Flash
Jina AI 一次性注册赠送(用完为止)
新用户注册赠送 1000万 token(支持 Reader API、Embedding、Reranker 等搜索基础服务;Reader API 无密钥可免费使用 20 RPM,有密钥后提升至 500 RPM)
jina-embeddings-v3jina-reranker-v2jina-reader
Kimi(月之暗面) 一次性注册赠送约800万Tokens(此前为15元,已大幅提升);Free Tier速率限制永久有效
新用户注册赠送约 800万 Tokens(此前为15元,已大幅提升);Free Tier:1并发、3 RPM、32K TPM、150万 TPD;可用于 kimi-k2.5(262k超长上下文)、kimi-k2-thinking(超强推理)、k2-fc 等模型;无需实名认证;常有充值返券活动(如充100返300);Kimi估值突破200亿美元
kimi-k2.5kimi-k2.5-flashkimi-k2kimi-k2-fckimi-k2-thinking
Ling Studio(蚂蚁百灵) 每日重置(永久免费层)
每日 50万 token(支持 Ling-1T、Ring-1T 推理模型及 Ming 多模态模型);2026年5月9日发布万亿级旗舰思考模型Ring-2.6-1T(支持high/xhigh双模式推理,限时一周免费体验,已上线OpenRouter);Ring-2.6-1T面向复杂逻辑/数学证明/多路径探索等高难度任务优化,推理准确率较前代提升23%
ling-2.6-1tling-1tring-1tming-m2
MiniMax 开放平台 一次性注册赠送(约30天有效)
新用户注册赠送 500万 Tokens(语音、文本模型均可用,此前额度已提升);2026年5月推出 TokenPlan(全球首个支持全模态模型的统一订阅计划);2026年6月1日发布 MiniMax M3(196B参数/11B激活,自研MSA稀疏注意力架构,1M上下文,原生多模态,Apache-2.0开源,SWE-Bench Pro超GPT-5.5);MiniMax M2.5/M3 在 OpenRouter 上可免费调用;支持语音合成等多模态
MiniMax-M3MiniMax-M2.7MiniMax-M2.5MiniMax-M2abab6.5s-chatabab6.5g-chat
Modal 每月重置(永久免费层,Starter 计划 $0/月,注册送$5/月,添加支付方式后$30/月)
Starter 计划注册即送 $5/月免费计算积分(添加支付方式后升至 $30/月;支持 GPU 推理、Serverless 函数、定时任务;初创公司可申请至 $25,000 积分)
Nebius Token Factory 一次性注册积分(用完为止)
新用户赠送 $1 免费积分(支持 DeepSeek、Qwen3、Llama、Mistral 等开源模型;提供高速/基础两档端点;批量推理享5折)
deepseek-ai/DeepSeek-V3deepseek-ai/DeepSeek-R1Qwen/Qwen2.5-72B-Instructdeepseek-ai/DeepSeek-V4-Flash
NLP Cloud 一次性注册积分(用完为止)
新用户赠送 $15 免费积分(支持多种 NLP 模型,需手机验证)
finetuned-llama-3-1-70bfinetuned-llama-3-1-8b
Novita AI 一次性注册积分(1年有效)
新用户注册赠送 $0.5 免费积分(支持 Llama 3.3 70B、Qwen2.5 72B、DeepSeek V3、GLM-5、Qwen3 Coder Next 等主流开源模型;同时提供 Stable Diffusion、Flux 等图像生成模型;推荐积分$10起充,价格低至 $0.20/百万token)
meta-llama/llama-3.3-70b-instructqwen/qwen2.5-72b-instructdeepseek-ai/deepseek-v3zai-org/glm-5qwen/qwen3-coder-nextstable-diffusion/stable-diffusion-3.5-large +1
Ollama Cloud 永久免费层(每5小时/每7天使用量重置;本地运行无限制)
免费层提供轻度云端推理使用量(不限token数,按GPU时间计量);支持33款云端模型+4万+社区本地模型;最多同时运行1个云模型;本地运行完全无限制免费;云端最新模型包括:DeepSeek V4 Flash/Pro(284B参数MoE,1M上下文)、Kimi K2.6(原生多模态Agent)、GLM-5.1(SWE-Bench Pro SOTA)、MiniMax M2.7(编码与Agent)、Gemma 4(前沿性能)、Nemotron-3-Super(120B MoE/12B激活)、Qwen3.5(多模态)、Gemini 3 Flash Preview、Devstral-2(123B代码Agent)、GPT-OSS(OpenAI开放权重)、Mistral Large 3(多模态MoE)等;每5小时/每7天使用量重置
deepseek-v4-flashdeepseek-v4-prodeepseek-v3.2deepseek-v3.1kimi-k2.6kimi-k2.5 +27
OVHcloud AI Endpoints 一次性注册额度(激活后30天有效;每账号仅限一次)
新用户注册首个公有云项目赠送 $200 免费信用额度(可用于 AI Endpoints API;支持 Llama 4、Qwen3、DeepSeek-R1、Mistral 等 40+ 模型;匿名用户可直接通过 Playground 免费测试所有模型;需绑定支付方式)
Meta-Llama-3.3-70B-InstructQwen/Qwen3-32Bdeepseek-ai/DeepSeek-R1mistralai/Mistral-7B-Instruct-v0.3mistralai/Codestral-22B-v0.1deepseek-ai/DeepSeek-V4-Flash
SambaNova Cloud $5 API credits 注册后3个月有效;Free 计划长期可开通(无需信用卡,超额需升级付费)
免费额度$5/3个月;支持DeepSeek V3.1/V3.2、Gemma 3 12B、GPT-OSS-120B、Llama 4 Maverick、Llama 3.3 70B、MiniMax M2.7等模型
deepseek-v3.1deepseek-v3.2gemma-3-12b-itgpt-oss-120bllama-4-maverick-17b-128e-instructmeta-llama-3.3-70b-instruct +1
Stability AI 一次性注册积分(用完为止)
新用户赠送 25 积分(约$0.25,可生成约10张图像;SD3.5系列模型)
stable-diffusion-3.5-largestable-diffusion-3.5-mediumstable-diffusion-3.5-flashstable-image-ultrastable-image-corestable-diffusion-xl-1.0
Upstage 一次性注册积分(3个月有效)
新用户赠送 $10 免费积分(支持 Solar Pro、Solar Mini 等长上下文模型;Solar Pro 3 输入 $0.15/百万token,输出 $0.6/百万token)
solar-pro-3solar-pro-2solar-miniupstage-embed
Vercel AI Gateway 每月重置(永久免费层,购买额外积分后免费额度失效)
每月赠送 $5 AI Gateway Credits(可路由至 OpenAI、Anthropic、Google 等多家主流 AI 供应商;支持自定义 API Provider;手续费 3%);免费模型:Big Pickle Stealth、Nemotron 3 Super Free、DeepSeek V4 Flash Free(免费模型可能用于数据训练优化)
openai/gpt-4oopenai/gpt-5anthropic/claude-sonnet-4anthropic/claude-opus-4-5google/gemini-2.5-progoogle/gemini-2.5-flash +4
xAI (Grok) 注册$25一次性;数据共享$150每月重置(永久,需满足$5消费门槛后激活)
新用户注册赠送 $25 API 积分;另有数据共享计划:每月额外赠送 $150 免费额度(需先消费至少 $5 后方可在 Billing > Credits 中开启,开启后不可撤销;EU/UK 地区不适用);⚠️ 2026年5月8日 xAI 已正式并入 SpaceX(改名为 SpaceXAI),API免费政策未来可能发生变化,建议密切关注;⚠️ 警告:2026年5月8日 xAI已并入SpaceX(改名SpaceXAI),API政策可能随时变动,建议关注官方公告
grok-4grok-4-minigrok-3grok-3-minigrok-2grok-2-vision-1212
Together AI $25注册积分永不过期;68+个免费模型长期可用(政策可能调整)
新用户注册赠送 $25 免费积分(无需信用卡,用于体验 200+ 开源模型;额度不过期);68+ 个永久免费模型(含 Llama 4 Scout、Gemma 4、Qwen3 全系列、MiniMax M2、Nemotron 3、DeepCoder 等,60 RPM / 100K TPM),另有 Startup Accelerator 可申请 $15K-$50K;新增 openrouter-router 自动路由功能
meta-llama/Llama-4-Scout-17B-16E-Instructgoogle/gemma-4-26b-a4b-it-instructgoogle/gemma-3-27b-itQwen/Qwen3-235B-A22B-InstructQwen/Qwen3-Coder-30B-A3B-InstructQwen/Qwen3-Next-80B-A3B-Instruct +7
Friendli AI 免费(Serverless模式;政策以官方公告为准)
Serverless 模式免费开放(无需充值即可使用;支持 GLM-5、MiniMax M2.5/M2.7、Qwen3、Llama 4 等近 600 款主流模型;OpenAI 兼容 API;推理速度约55 tokens/秒)
meta-llama/Llama-3.3-70B-Instructmeta-llama/Llama-4-Scout-17B-16E-InstructQwen/Qwen3-235B-A22BGLM-5MiniMax-M2.5MiniMax-M2.7
Anyscale 一次性试用额度(用完为止)
新用户注册赠送 $100 免费试用额度;基于 Ray 的 AI 计算平台
Replicate 免费起始额度(用完为止)
提供免费起始额度(具体额度以官网最新公告为准);支持 4万+ 社区模型
black-forest-labs/flux-devblack-forest-labs/flux-schnellmeta/meta-llama-3-70b-instruct
超算互联网 (SCNET) 一次性注册赠送(1个月有效)
向全体用户免费发放单人最高 3000万 Tokens 额度(此前为100万,已大幅提升);面向OpenClaw用户免费发放每人限时2周总计1000万Tokens额度;续购价格:0.1元/百万Tokens;支持 Qwen3-30B-A3B 等国产大模型
Qwen3-30B-A3Bdeepseek-r1deepseek-v3qwen3-235b-a22bdeepseek-v4-flash
移动云(中国移动)一站式模型托管平台 MoMA平台全新上线(2026-05-08发布,具体免费政策以官方公告为准)
全新 MoMA(移动模型服务平台)已于2026年5月8日在移动云大会正式发布;新用户注册即送9000万Tokens体验包(涵盖Ernie 4.5T系列、X1T系列、DeepSeek系列等9款主流模型,各模型独立额度);接入超过300款国内主流AI大模型(九天、豆包、通义千问等),为目前国内最大;首创Token集约化运营模式与「模型联邦+智能路由」技术,可按成本/效果优先自动匹配最优模型,降低约30%单位成本;定位为「国内首个开放普惠的AI模型超级入口」;原新用户2500万tokens免费体验活动(2025年12月31日截止)已被MoMA平台取代
deepseek-v3deepseek-r1glm-5MiniMax-M2.5kimi-k2.5
讯飞星辰MaaS Qwen3-Coder-Next/Qwen3-1.7B永久免费(不限量);新客礼包一次性赠送;政策以官方公告为准
Qwen3-Coder-Next 模型永久免费无门槛不限量调用(支持代码生成、代码补全、代码解释、Bug修复等场景);Qwen3-1.7B 免费无限量;新客专属礼包赠送千万免费Tokens;DeepSeek-V3.2无门槛5折优惠;平台为科大讯飞面向开发者打造,与讯飞星火为独立平台
Qwen3-Coder-NextQwen3-1.7BQwen3.5-35B-A3BGLM-5MiniMax-M2.5kimi-k2.5 +1
Arcee AI (Trinity) OpenRouter免费层永久可用;官网Playground免费体验
Trinity Large Preview(400B参数/13B激活)在 OpenRouter 上限时免费;Trinity Mini/Nano 可通过官网 Playground 免费体验;Apache 2.0 开源协议,支持工具调用、长上下文(128K-512K)、结构化输出
arcee-ai/trinity-large-previewarcee-ai/trinity-miniarcee-ai/trinity-nano
扣子 Coze(字节跳动) 永久免费层(有速率限制)
每个空间免费额度:QPS=2、QPM=60、QPD=3000;支持创建智能体并远程调用 API;可接入 GPT-5、Claude、Gemini、DeepSeek 等 50+ 大模型;工作流编排、多模态 AI 集成
gpt-5claude-sonnet-4gemini-2.5-prodeepseek-v4-flash
无问芯穹 (Infini-AI GenStudio) 体验期免费(额度以注册时平台公告为准,用完后按量计费)
新用户实名注册赠送百亿 Tokens 免费配额(2026-03-31起全量开放注册;支持 DeepSeek-R1 满血版、Qwen3 系列、GLM-4.6、MiniMax-M2 等多模型;兼容 OpenAI 及 Anthropic 协议;基于异构算力底座,推理速度快)
deepseek-r1deepseek-v3qwen3-8bqwen3-32bglm-4.5glm-4.6 +3
白山智算 注册150元+邀新200元长期有效;首次调用300元已取消;永久免费模型持续可用
注册福利(保留):完成注册并实名认证后获得 150元 大模型API代金券;邀新福利(保留):每邀请一位新用户完成注册及实名认证,邀请人获得 200元 代金券(上不封顶);首次调用300元福利已于2026年3月15日到期取消;仍提供多款优质模型的永久免费API(DeepSeek-R1-0528、Qwen3-8B、BAAI/bge-m3等)
DeepSeek-R1-0528DeepSeek-V3Qwen3-235B-A22BQwen3-32B-FP8Kimi-K2-InstructGLM-4.5 +2
书生 Intern AI(上海人工智能实验室) 永久免费(速率限制 10 RPM,密钥6个月有效,到期可续)
免费提供 Intern-S1 系列模型的 OpenAI 兼容 API;支持文本生成、图像分析、工具调用、思考模式等功能;10 RPM 速率限制,密钥有效期6个月
intern-s1intern-s1-pro
Voyage AI 一次性注册赠送(用完为止,无需信用卡)
新用户注册赠送 2亿 token 免费额度(大多数嵌入及重排序模型,含 voyage-3.5、voyage-3-large、voyage-4、voyage-4-lite、rerank-2.5 等;专用模型 voyage-finance-2 / law-2 / code-2 免费额度为5000万token;多模态嵌入额度为2亿文本token + 1500亿像素;被 Anthropic 收购,与 Claude 深度集成)
voyage-3.5voyage-3.5-litevoyage-3-largevoyage-4voyage-4-litevoyage-4-large +5
NVIDIA NIM (build.nvidia.com) 每日重置(永久免费层)
新用户获得 1,000 credits(可再申请 4,000,合计 5,000 credits;1 credit≈1K tokens;有效期可选Never Expire永久有效);免费API端点支持225+模型;40 RPM速率限制(可通过NVIDIA开发者论坛申请提升至200 RPM);需手机号验证(中国大陆+86可收验证码);支持 MiniMax M2.7、Kimi K2系列、Qwen3 Coder 480B、Devstral 123B、DeepSeek V4/R1等主流模型;完全兼容OpenAI ChatCompletion格式
minimaxai/minimax-m2.7moonshotai/kimi-k2-instructmoonshotai/kimi-k2-thinkingqwen/qwen3-coder-480b-a35b-instructmistralai/devstral-2-123b-instruct-2512deepseek-ai/deepseek-v3 +4
Pollinations AI 永久免费层(基于pollen积分制;Seed层免费,Flower层需应用上线)
基于「花粉(pollen)」积分制的免费计算资源;Seed层:0.15 pollen/小时(免费);Flower层:0.4 pollen/小时(需应用上线并获得使用量);每日150万次请求,500+活跃应用;支持文本、图像、视频、音频生成及LLM推理;OpenAI兼容API;⚠️ 不再是完全无限制免费,但免费层足够个人开发者使用
deepseek-ai/DeepSeek-R1qwen/qwen2.5-72b-instructmeta-llama/llama-3.3-70b-instructgoogle/gemini-2.5-pro
LongCat(美团) 每日重置(永久免费,公测阶段)
LongCat-Flash-Lite 每日 5000万 token 免费(轻量级高效 MoE 模型);LongCat-2.0-Preview(万亿参数模型)测试期间每天 1000万免费 Token;LongCat-Flash-Chat/Thinking/Omni 等系列每日 50万 token 免费;全程依托国产算力集群完成,英伟达算力占比为零;公测阶段暂不支持付费购买额度;支持 OpenAI 兼容 API 及 Anthropic 协议
LongCat-Flash-LiteLongCat-Flash-ChatLongCat-Flash-Chat-2602-ExpLongCat-Flash-ThinkingLongCat-Flash-Thinking-2601LongCat-Flash-Omni-2603 +1
IBM Watsonx.ai 每月重置(永久免费 Lite 计划,无需信用卡)
Lite(免费)计划:每月 30万 token 推理额度(2 RPS速率限制);每月 20 CUH 机器学习算力;支持 IBM Granite 3.3/3.2/3.1 系列、Meta Llama 4 Scout/Maverick、Mistral Small 3.1、Granite Embedding 等;Llama 4 Scout 目前为免费预览版;适合企业级合规场景,支持多语言和RAG
ibm/granite-3-3-8b-instructibm/granite-3-2-8b-instructibm/granite-3-8b-instructibm/granite-3-2b-instructmeta-llama/llama-4-scout-17b-16e-instructmeta-llama/llama-3-3-70b-instruct +3
华为云盘古大模型(ModelArts MaaS) 每月重置(永久免费层);新用户20万tokens一次性
每月50万tokens免费;新用户送20万tokens;华为云开发者认证送50万tokens;支持盘古大模型系列、DeepSeek-V3.2、GLM-5、Kimi-K2、Qwen系列等;9.9元即可获得大量Token抵扣;支持CV计算机视觉等多模态能力
pangu-largedeepseek-v3.2glm-5kimi-k2qwen3-235b-a22b
Google Vertex AI $300试用额度90天有效(需绑卡,试用期内不扣费)
新用户注册GCP获得 $300 免费试用额度(90天有效,需绑定信用卡但试用期内不扣费);可用于Gemini全系列(2.5 Flash/Pro、3.0、3.1 Pro)、Imagen图像生成等Google最新模型;企业级AI平台,与Google AI Studio不同
gemini-4.0gemini-2.5-flashgemini-2.5-progemini-3.0-flashgemini-3.1-proimagen-3
小米 MiMo V2.5系列永久降价生效;MiMo-V2.5-TTS限时免费;Token Plan按月订阅
MiMo-V2.5系列永久降价生效:V2.5输入缓存命中0.02元/百万Tokens(降幅98%),V2.5-Pro输入缓存命中0.025元/百万Tokens(降幅99%);Token Plan计费体系优化,同等价格下用量提升5-8倍(Lite 41亿/Standard 110亿/Pro 380亿/Max 820亿 Credits);MiMo-V2.5-TTS保持限时免费;MiMo-V2-Pro与MiMo-V2-Omni即将下线,引导迁移至V2.5系列;MiMo-V2.5-Pro为旗舰模型(1048576上下文,131072最大输出);OpenAI + Anthropic兼容协议;Token Plan提供cn域名端点;可直接对接Claude Code、Cursor、OpenClaw等编程工具
mimo-v2.5-promimo-v2-flashmimo-v2-pro
Scaleway Generative APIs 一次性注册赠送100万tokens(用完为止,不刷新)
100万 tokens免费额度;支持Gemma 4 26B、GPT-OSS-120B、Qwen3.5-397B、Mistral Medium 3.5、Devstral 2等最新模型
bge-multilingual-gemma2gemma-3-27b-itllama-3.3-70b-instructpixtral-12b-2409whisper-large-v3devstral-2-123b-instruct-2512 +11
快手万擎 (StreamLake) KAT-Coder-Air V1 永久免费;新用户2000万tokens一次性赠送
KAT-Coder-Air V1 永久免费调用;新用户赠送 2000万 tokens KAT-Coder-Pro V1 体验额度;KAT-Coder-Pro V2 已全量上线(SWE-bench Verified 73.4%,超越 GPT-5 与 Claude Sonnet 4);平台集成 DeepSeek、Qwen、Kimi 等主流模型;99.95% SLA 保障;兼容 Claude Code、Cline、Kilo、OpenCode 等10+主流AI编码工具
kat-coder-pro-v2kat-coder-pro-v1kat-coder-air-v1
腾讯云TokenHub 语言模型额度90天有效;视觉/视频/3D额度365天有效;部分模型即将下线
新用户注册赠送多模型免费体验包(各模型独立额度,每个主账号限领一次):Hy3 preview 100万Tokens、DeepSeek-V4-Flash 100万Tokens、DeepSeek-V4-Pro 100万Tokens、GLM-5 100万Tokens、GLM-5.1 50万Tokens、MiniMax-M2.7 100万Tokens、MiniMax-M2.5 100万Tokens、Qwen3.5-Plus 100万Tokens、Qwen3.5-Flash 100万Tokens、Kimi-K2.5 50万Tokens、Kimi-K2.6 50万Tokens、GLM-5V-Turbo 50万Tokens、YT-VITA 100万Tokens等;⚠️ Deepseek-v3.1、Deepseek-v3-0324、Deepseek-r1-0528已于2026-05-25下线;HY 2.0 Think和HY 2.0 Instruct将于2026-06-22下线;视觉模型:HY-Image-V3.0 50次图像生成、生视频50积分、混元生3D 100积分;兼容OpenAI/Anthropic协议;腾讯云旗下大模型服务平台,另有Token Plan/Coding Plan付费订阅;活动时间截至2026年12月31日
hy3-previewdeepseek-v4-flashdeepseek-v4-proglm-5glm-5.1minimax-m2.7 +8
AWS Bedrock 免费计划6个月或额度耗尽(以先到者为准);升级付费计划后剩余额度12个月有效
新用户注册AWS Free Tier可获得最高$200服务抵扣金($100注册赠送 + $100完成5个入门任务);可用于Bedrock API调用Claude系列(Opus/Sonnet/Haiku)、OpenAI GPT-5系列、DeepSeek V4、Llama 4、Mistral Large、Amazon Nova、Cohere、Stability AI等全系列模型;需绑定信用卡($1临时验证,验证后释放);支持Playground免代码测试;另有AWS Activate创业计划可申请更高额度
anthropic.claude-sonnet-4anthropic.claude-opus-4-5openai.gpt-5deepseek.deepseek-v4-prometa.llama-4-scoutmistral.mistral-large +1
Z.ai(智谱AI国际版) GLM-4.7-Flash/4.5-Flash/4.6V-Flash永久免费(1并发限制);Coding Plan按月订阅
GLM-4.7-Flash:完全免费(无限制基础对话,1并发,200K上下文,编程能力SOTA SWE-Bench 59.2%);GLM-4.5-Flash:完全免费(128K上下文);GLM-4.6V-Flash:免费视觉模型;Coding Lite计划$3/月(120次/5小时,GLM-5/5.1访问);Coding Pro计划$15/月(不限次,更高速率);全系GLM模型MIT开源可商用;与国内智谱AI(open.bigmodel.cn)账户体系独立,面向国际用户
glm-4.7-flashglm-4.5-flashglm-4.6v-flashglm-5.1glm-5glm-5-turbo +3
阶跃星辰 (StepFun) Step 3.5 Flash永久免费;新用户注册赠送免费额度一次性;V0免费层级长期有效
Step 3.5 Flash模型完全免费(无累计用量限制,196B MoE总参数/11B激活,256K上下文,专为Agent场景设计,支持function calling/工具调用);注册即赠送免费额度可用于Step系列全系模型(Step 3.5 Flash、Step 3、Step 2、Step 1、Step 1o系列视觉模型、StepAudio语音模型等);V0免费层:5 RPM/10 QPM/500万TPM;OpenRouter上Step 3.5 Flash也标注为:free可免费调用;2026年2月发布Step 3.5 Flash开源模型,CNCF项目成员,支持昇腾/沐曦/壁仞/燧原等国产芯片适配
step-3.5-flashstep-3step-2step-1step-1o-turbo-visionstep-r1-v-mini +1
阿里云百炼国际版 (Alibaba Cloud Model Studio) 激活后90天有效(免费额度从激活时起算,非首次调用)
新用户首次开通即赠每模型 100万 tokens 免费额度(新加坡区域International Edition);覆盖 Qwen 全系列文本/代码/视觉/推理模型(qwen-plus、qwen-flash、qwen3-vl-plus、qvq-max、qwen3-coder-plus等);另赠 100张AI生图 + 50秒视频生成 + TTS字符额度;无需信用卡;OpenAI兼容API(DashScope API Key);⚠️ 必须在新加坡区域激活才享免费额度,北京/弗吉尼亚区域无免费额度
qwen-plusqwen-turboqwen3-coder-plusqwen3-vl-plusqvq-maxqwen3.5-omni +2
昆仑万维天工 (SkyWork) 限时免费试用中(2026年5月底起);免费期结束后按量付费+逐步开源
SkyClaw-v1.0及SkyClaw-v1.0-lite Agent模型限时免费试用(2026年5月26日发布);SkyClaw-v1.0输入0.5元/百万Token、输出4元/百万Token;SkyClaw-v1.0-lite输入0.3元/百万Token、输出2元/百万Token;需通过APIFree平台(www.apifree.ai)注册获取密钥;百万token超长上下文;原生Agent训练(非通用大模型+工具壳);深度适配OpenClaw、Hermes、Claude Code等主流Agent框架;OpenAI兼容API格式;免费期结束后将逐步开源各模型版本;⚠️ 限时免费期进行中,建议关注官方公告确认截止时间
skyclaw-v1.0skyclaw-v1.0-lite
OpenRouter 每日重置(永久免费层;充值$10后速率限制永久提升)
免费层:20 RPM / 50 RPD(终身充值$10后提升至1000 RPD);70+ 模型标注:free可免费调用(含 Llama 3.3 70B、Gemma 3/4 全系列、Qwen3 全系列、DeepSeek-R1-Distill/V4-Flash、Mistral Small 3.1/3.2、MiniMax M2.5/M3/M2.7、Nemotron 3 Nano/Super/Content、GPT-OSS 120B/20B、Cogito v1、Poolside Laguna M.1/XS.2、Google Lyria 3 Pro/Clip、Kimi K2.6、Owl Alpha、Nex AGI N2-Pro、Liquid LFM 2.5 1.2B、Z.ai GLM-4.5-Air、Big Pickle Stealth 等);单API Key访问300+模型;OpenAI兼容格式;模型路由与自动故障转移
meta-llama/llama-3.3-70b-instruct:freegoogle/gemma-3-27b-it:freegoogle/gemma-3-12b-it:freegoogle/gemma-3-4b-it:freegoogle/gemma-4-26b-a4b-it:freegoogle/gemma-4-31b-it:free +32
Agnes AI 无限期免费(2026年6月1日起永久免费)
全球Top 10 AI Lab,2026年6月1日起全模态模型API无限期免费开放(无需绑卡、无试用期);文本模型Agnes-2.0-Flash(1M超长上下文、原生Function Calling、Claw-Eval国际榜单前列、支持thinking模式)、Agnes-1.5-Flash(多模态、即问即答、图片解析);图像模型Agnes-Image-2.1-Flash(纯文生图,中文prompt完全支持)+Agnes-Image-2.0-Flash(图生图/图片编辑/多图合成,Artificial Analysis图像编辑榜单前三);视频模型Agnes-Video-V2.0(音画同步生成);免费后首周调用量超1万亿Token;OpenAI兼容协议,改一行base_url即可接入;单实例TPS 200+,高并发800左右
agnes-2.0-flashagnes-1.5-flashagnes-image-2.1-flashagnes-image-2.0-flashagnes-video-v2.0
fal.ai $20一次性注册积分(用完为止,公司邮箱验证)
公司邮箱注册赠送 $20 免费积分;专注图像/视频/音频AI生成平台;支持 Sora 2、可灵(Kling)、Flux Pro、Stable Diffusion 3.5、Stable Video Diffusion、WAN 2.2 等前沿生成模型;OpenAI兼容API格式;按量计费,积分用完为止
fal-ai/flux-pro/v1.1-ultrafal-ai/flux/devfal-ai/stable-diffusion-v3.5-largefal-ai/kling-v1.6/profal-ai/wan/v2.2fal-ai/sora-v2
天翼云息壤智算 首次使用模型起两周有效;专属模型额度14天有效
各模型2500万Tokens免费领取(两周有效);DeepSeek-V4-Pro、DeepSeek-V4-Flash各50万Tokens专属额度;其他模型各100万Tokens体验额度;覆盖GLM-5、GLM-5.1、Qwen3.5-397B-A17B、DeepSeek-V3.2(旗舰版)、DeepSeek-R1、Doubao-Seed-2.0-pro、星辰语义大模型等18+主流大模型;新老用户均可领取(需实名认证);「国模+国芯+国云」全产业链闭环,支持国产芯片适配
glm-5glm-5.1qwen3.5-397b-a17bdeepseek-v3.2deepseek-v4-prodeepseek-v4-flash +2
派欧云(PPIO) 注册赠送额度用完为止;部分模型永久免费
新用户注册赠送500万Tokens(支持DeepSeek-R1/V3、Qwen3-235B、Kimi-K2.5、ERNIE-4.5等主流模型);部分轻量级模型提供永久免费调用额度;提供LLM、图像生成、视频生成等多模态API;中国大陆直连,低延迟;中国领先的独立分布式云计算服务商
deepseek/deepseek-r1deepseek/deepseek-v3qwen/qwen3-235b-a22bmoonshotai/kimi-k2.5baidu/ernie-4.5
云知声Token Hub(Unisound) TokenPlan按月订阅(首月1.9元特惠,后续Lite/Standard/Pro/Max四档)
新客首月1.9元=1.8亿Credits(5款模型一Key通吃);U-Model TokenPlan Lite入门级1.8亿Credits敞开用,文本/视觉/语音共享一个额度池;Unsiound U2(266B MoE原生智能体大模型,SWE-Bench 75分,Claw-Eval 76.9分,GPQA Diamond 87.9分)、U1-OCR(智能文档识别)、U2-ASR(方言+多语语音转写,覆盖100+方言)、U2-TTS(语音合成)、U2-TTS-Clone(音色复刻);兼容Claude Code/Cursor/OpenClaw全主流工具;快慢思考融合架构,自主完成百步工作流
unisound-u2unisound-u1-ocrunisound-u2-asrunisound-u2-ttsunisound-u2-tts-clone
Poolside(Laguna) 限时免费(M.1限时,XS.2无宣布结束日期;OpenRouter上标注:free)
Laguna M.1(225B/23B激活)和Laguna XS.2(33B/3B激活)限时免费(通过官方API和OpenRouter均可调用);专注Agentic Coding场景;Laguna M.1:SWE-bench Verified 72.5%、SWE-bench Pro 46.9%、Terminal-Bench 2.0领先;Laguna XS.2:Apache 2.0开源,单GPU可运行,33B参数对标更大模型;256K上下文;支持Function Calling/工具调用;Laguna XS.2开源权重可在HuggingFace下载自行部署
poolside/laguna-m.1poolside/laguna-xs.2
商汤日日新 (SenseNova) 每5小时重置(公测免费阶段,政策以官方公告为准)
Token Plan免费公测中:deepseek-v4-flash 每5小时150次调用;SenseNova-U1 每5小时1500次调用(原生统一多模态模型,基于NEO-Unify架构,支持理解与生成);SenseNova-U1-Fast 每5小时1500次调用(U1快速版本,低延迟高并发);SenseNova 6.7 Flash-Lite 每5小时1500次调用(轻量多模态智能体模型,原生多模态架构、Token效率优化);公测期间完全免费,无需绑卡,注册即领API Key;完全兼容OpenAI接口格式;2026年4月推出Token Plan,2026年5月新增DeepSeek V4 Flash支持;可接入OpenClaw、ChatBox、Cherry Studio、Cline等主流AI工具
deepseek-v4-flashsensenova-u1sensenova-u1-fastsensenova-6.7-flash-lite
DeepInfra 一次性注册积分($5,用完为止)
新用户注册赠送 $5 免费积分(支持 40+ 开源模型推理,含 Llama 3.3 70B、Qwen 2.5 72B、DeepSeek-R1、Mixtral 8x7B、Whisper 等;60 RPM速率限制;2026年5月完成$1.07亿B轮融资);OpenAI兼容API格式;按量计费,积分用完为止
meta-llama/Llama-3.3-70B-Instructmeta-llama/Llama-3.1-8B-InstructQwen/Qwen2.5-72B-Instructdeepseek-ai/DeepSeek-R1mistralai/Mixtral-8x7B-Instruct-v0.1openai/whisper-large
Chutes.ai 永久免费层(社区驱动,可用性取决于算力供给)
社区驱动的免费开源模型推理平台(基于去中心化算力);支持 DeepSeek-R1、Llama 3.1 70B、Qwen 2.5 72B 等主流开源模型;无需信用卡;可自行添加模型;Serverless推理按可用性分配资源;部分模型永久在线(Featured模型)
deepseek-ai/DeepSeek-R1meta-llama/Llama-3.1-70B-InstructQwen/Qwen2.5-72B-Instructdeepseek-ai/DeepSeek-V4-Flash
Cline.bot 永久免费(4款免费模型不扣额度不限期;$0.5注册额度用完为止)
4款模型永久免费调用(不扣额度、不限期、无需绑卡):minimax/minimax-m3(MiniMax旗舰模型,1M token上下文,2026年6月发布)、minimax/minimax-m2.5(MiniMax前代旗舰)、xiaomi/mimo-v2.5(小米推理模型)、deepseek/deepseek-v4-flash(DeepSeek快速模型);新用户注册自动赠送$0.5初始额度(免费模型不扣此额度,留作付费模型体验);1M超长上下文(市面免费API中最大);OpenAI兼容API格式;Cline原为VS Code AI编程助手插件(61.8k GitHub Stars),后开设官方API平台
minimax/minimax-m3minimax/minimax-m2.5xiaomi/mimo-v2.5deepseek/deepseek-v4-flash
Inception AI(Inception Labs) 一次性注册赠送1000万tokens(用完为止)
新用户注册赠送 1000万 tokens(无需信用卡);支持 Mercury 2(128K上下文,最快推理LLM,支持工具调用和结构化输出)、Mercury Edit 2(代码编辑FIM/NextEdit);输入$0.25/百万Tokens,输出$0.75/百万Tokens(缓存命中$0.025/百万Tokens)
mercury-2mercury-edit-2
TOKEN自由 (dxnt.com) 每日重置(免费层100次/天;API Key 5-7天自动轮换)
免费层:dxnt/free模型每天100次免费调用(系统自动优选最优免费模型,每30分钟评估质量/延迟/成功率排序);兼容OpenAI API格式,只需将model改为dxnt/free即可;平台聚合数百个国内外AI模型Token资源(GPT、Claude、Gemini、DeepSeek、Qwen等),支持模型路由、智能轮循、故障转移;API Key每5-7天自动轮换;⚠️ 免费层有每日调用次数限制,付费套餐另购
dxnt/freegpt-5claude-sonnet-4gemini-2.5-prodeepseek-v4-flashqwen-plus
OpenCode Zen 永久免费层(免费模型长期可用,政策以官方公告为准)
提供经过严格测试与优化的免费编码模型(Big Pickle Stealth、Nemotron 3 Super Free、DeepSeek V4 Flash Free 等);通过 OpenCode 终端/桌面/IDE 工具连接即可使用,无需自备 API Key;免费模型可能使用数据用于模型改进;OpenCode 本身为 MIT 开源项目(GitHub 超109k Stars),支持75+ LLM提供商接入;推荐搭配本地模型实现完全离线使用
deepseek-v4-flash-freenemotron-3-super-freebig-pickle-stealth

免费 AI Token API 额度完全指南:100 个平台、700 款模型,2026 年最新汇总

2026 年哪些 AI API 可以免费调用?本文汇总 100 个平台的免费 Token 额度信息,涵盖阿里云百炼、百度千帆、腾讯混元、DeepSeek、智谱 AI、Google Gemini、Groq 等主流厂商,支持 GPT、Claude、Qwen 等 700 款大模型。每日更新,帮你找到最适合的免费方案。

哪些 AI API 可以免费调用?2026 年免费 Token 平台一览

截至 2026 年 6 月,国内外已有超过 100 个 AI 平台提供免费 API Token 额度。以下是目前最值得关注的免费 Token 平台:

  • Google Gemini API:永久免费层,Gemini 2.5 Flash 每日百万 Token,支持多模态,无需信用卡
  • 智谱 AI(GLM 系列):GLM-4-Flash 永久免费,128K 上下文,30 并发;新用户送 2000 万 Token
  • 百度千帆(ERNIE 系列):ERNIE-Speed 永久免费不限量,RPM 高达 300
  • 阿里云百炼(Qwen 系列):Qwen-Turbo 每月 100 万 Token 持续免费,注册送 7000 万 Token
  • 火山引擎(豆包):DoubaoLite 永久免费,协作奖励每日 200 万 Token
  • 硅基流动:9B 以下模型永久免费,注册送 2000 万 Token,统一 OpenAI 接口
  • Groq:免费层永久,Llama 3.3 70B 每秒 800 Token,推理速度业界最快
  • 讯飞星火:SparkLite 永久无限 Token,支持联网搜索和多模态
  • DeepSeek:新用户赠送百万免费 Token,推理和数学能力突出
  • 腾讯混元:HunyuanLite 永久免费,通用资源包 100 万 Token/年

以上仅列出部分平台,完整 100 个平台的免费额度详情请查看上方工具区,支持搜索筛选和一键导出 CSV。

永久免费的 AI API 有哪些?

很多开发者最关心的是:哪些平台的免费额度不会过期?以下是提供永久免费 AI API 的平台:

平台免费模型免费额度重置周期
Google GeminiGemini 2.5 Flash / Pro每日百万 Token每日重置
智谱 AIGLM-4-Flash / GLM-4.7-Flash128K-200K 上下文,30 并发永久免费
百度千帆ERNIE-Speed 8K/Lite/Tiny不限量,RPM 300永久免费
火山引擎DoubaoLite永久免费,QPS 2永久免费
讯飞星火SparkLite无限 Token,QPS 2永久免费
硅基流动Qwen2.5-7B / DeepSeek-7B 等9B 以下模型永久免费永久免费
GroqLlama 3.3 70B / Mistral 等每日约 6000 次请求每日重置
腾讯混元HunyuanLite永久免费,并发 5永久免费
CerebrasLlama 3.3 70B每天 100 万 Token每日重置

每月有免费 Token 额度的 AI 平台

除了永久免费的模型,很多平台还提供按月重置的免费 Token 额度,适合有持续开发需求的用户:

平台每月免费额度支持模型额外福利
阿里云百炼Qwen-Turbo 每月 100 万 TokenQwen 全系、DeepSeek、Kimi注册送 7000 万 Token
百度千帆每模型 100 万 TokenERNIE 4.5、DeepSeek、QwenSpeed 系列永久免费
火山引擎每日 200 万 Token豆包全系、GLM、KimiDoubaoLite 永久免费
MiniMax每月免费额度M2.5 系列新用户送代金券
国家超算平台新用户 1000 万 TokenDeepSeek-V3.2、Qwen3-235B一次性注册赠送

不用实名认证的免费 AI API

部分开发者关心注册门槛。以下平台无需实名认证,只需邮箱即可获取免费 Token 额度:

  • Google Gemini API:邮箱注册即可,无需信用卡,永久免费层
  • Groq:邮箱注册,免费层永久可用,OpenAI 兼容接口
  • OpenRouter:邮箱注册,50+ 模型免费调用,新用户送 $1
  • Cerebras:邮箱注册,每天 100 万 Token,推理速度极快
  • Hugging Face:邮箱注册,数千款开源模型免费推理
  • Together AI:邮箱注册,新用户送 $100 额度(限时)

国内平台大多需要手机号注册,但一般不需要身份证实名认证。具体要求以各平台注册页面为准。

免费 Token 额度使用技巧

多平台轮换策略

不要只盯着一个平台。每个平台都有独立的免费额度池,用完一个换下一个。100 个平台轮换使用,个人开发者基本不用担心额度不够。

关注额度重置周期

每日重置的建议每天用完;每月的在月初规划好用量。避免额度过期浪费。本页工具区标注了每个平台的重置周期。

善用轻量模型

Flash/Lite 等轻量模型的免费限制更宽松。日常简单任务优先用轻量模型(如 GLM-4-Flash、ERNIE-Speed),把高配额度留给复杂任务。

关注新模型发布

新模型发布初期往往有更优惠的免费政策(如 Google I/O 后 Gemini 系列大幅开放)。保持关注,及时获取额外额度。

2026 年主流免费大模型对比

以下是当前各大平台提供免费额度的代表性模型及其核心能力:

厂商代表模型免费特点最佳场景
GoogleGemini 2.5 Flash / Pro输入输出全免费,1M 上下文多模态、长文档
阿里云Qwen3.5-Omni / Qwen3-Coder注册送 7000 万 Token + 代金券中文处理、编程
百度ERNIE-Speed / 4.5-TurboSpeed 系列永久免费不限量通用对话、文本处理
DeepSeekR1 / V3通过多家聚合平台免费调用数学推理、代码
智谱 AIGLM-5 / GLM-4-FlashFlash 模型永久免费,200K 上下文中文理解、编程
月之暗面Kimi K2.5 / K2多平台接入,每日免费额度长文本、多模态
GroqLlama 3.3 70B免费层永久,800 Token/秒实时应用、高速推理
讯飞星火SparkLite / SparkUltraLite 永久无限 Token联网搜索、语音

常见问题

哪些 AI API 可以免费调用?

目前可免费调用的 AI API 包括:Google Gemini(永久免费层)、智谱 AI GLM-4-Flash(永久免费)、百度 ERNIE-Speed(永久免费不限量)、阿里云百炼 Qwen-Turbo(每月 100 万 Token 免费)、硅基流动(9B 以下模型永久免费)、Groq(免费层永久)、讯飞星火 SparkLite(永久无限 Token)等。本页收录了 100 个平台的完整免费额度信息。

免费额度用完了怎么办?

可以等下一个周期自动重置,或者切换到其他平台继续使用。目前 100 个平台轮换使用,对于个人开发者来说免费额度通常是够用的。建议采用多平台轮换策略,用完一个换下一个。

有没有不用实名认证的免费 AI API?

部分海外平台无需实名认证即可使用免费额度,如 Google Gemini API、Groq、OpenRouter、Cerebras 等,只需邮箱注册即可。国内平台大多需要手机号注册,但不需要身份证实名。具体要求请查看各平台注册页面。

哪些平台有永久免费的 AI API 额度?

提供永久免费额度的平台包括:Google Gemini(每日重置免费层)、智谱 AI GLM-4-Flash(永久免费 128K 上下文)、百度 ERNIE-Speed(永久免费不限量)、讯飞星火 SparkLite(永久无限 Token)、Groq(免费层永久)、硅基流动 9B 以下模型(永久免费)、腾讯混元 HunyuanLite(永久免费)等。

每个月都有免费 Token 的 AI 平台有哪些?

按月重置免费额度的平台包括:阿里云百炼(Qwen-Turbo 每月 100 万 Token 免费)、百度千帆(ERNIE-Speed 永久免费,其他模型每月重置)、火山引擎豆包(每日 200 万 Token)、MiniMax(每月免费额度)等。本页工具区可查看所有平台的额度周期和具体数量。

免费版和付费版 AI API 有什么区别?

主要区别在于:请求频率限制(RPM/TPM)、响应速度、并发数、以及是否可以使用最新最强的模型。对于日常学习和原型开发,免费版完全够用。付费版适合生产环境和高并发场景。

需要绑定信用卡吗?

大部分平台只需邮箱或手机号注册即可使用免费额度,不需要绑卡。部分平台(如 AWS、Azure)可能需要验证支付方式但不会实际扣费。Google Gemini API、Groq、OpenRouter 等海外平台完全无需信用卡。

额度数据多久更新一次?

我们持续跟踪各平台的政策变化并定期更新。但由于 AI 行业变化很快,具体额度请以各平台官方公告为准。页面顶部会显示最后更新时间。

2026 年的今天,各大 AI 平台都在以空前慷慨的策略推广 AI 能力。从 Google Gemini 到阿里云百炼,从 DeepSeek 到智谱 AI,大部分平台都提供永久免费或每日重置的 API 额度。只要掌握正确的使用方法,普通人完全可以零成本用上最前沿的 AI 技术。

希望这份清单能帮你节省时间、少走弯路。如果发现某个平台的额度信息有变更,欢迎反馈。

现在就去上方工具区查看 100 个平台的免费 Token 额度吧。