MAI-Code-1-Flash 登陆 Copilot,全层级免费
2026年6月2日,微软在 Build 大会上扔出一颗重磅炸弹:MAI-Code-1-Flash 正式登陆 GitHub Copilot。
这不是从 OpenAI 租借的模型,也不是对 GPT 系列的微调包装——完全由微软端到端构建,用干净且合规授权的数据训练,并针对 Copilot 生产环境的工具链做了深度适配。
对开发者来说,这意味着什么?免费编码模型大战又添一员猛将,而且这一次,模型厂商和 IDE 平台是同一个老板。
一、MAI-Code-1-Flash 是什么
MAI-Code-1-Flash 是微软 MAI(Microsoft AI)模型家族 的首个编码成员,定位轻量级、高效率的日常编程助手。
与市面上「先刷榜、再塞进 IDE」的路径不同,微软选择了一条更务实的路:直接在 Copilot 生产环境的工具链(harness)上训练和调优,让模型学会如何与 surrounding tools、agentic coding 工作流协同,而不是只会孤立地吐代码片段。
核心亮点:
| 维度 | 数据 |
|---|---|
| 上下文窗口 | 256K |
| 复杂任务令牌消耗 | 比同类模型减少约 60% |
| 微软对抗性编码基准 | 85.8% |
| 架构 | MoE 架构,约 137B 总参数 / 5B 活跃参数 |
| 训练数据 | 微软自研,非 OpenAI 数据 |
几个关键词值得单独拎出来说:
- Agentic coding:模型针对多轮、多工具的真实开发场景设计,而非单轮问答。
- Adaptive thinking:简单请求保持简洁,复杂任务自动分配更多推理预算。
- Copilot-native:在 Copilot 的生产 harness 上训练,与 surrounding tools 的协同是出厂设置,不是后期补丁。
二、MAI 模型家族全景
Build 2026 上,微软一口气发布了 7 款 MAI 模型,横跨编码、推理、图像、语音、转写五大模态。你在 Copilot 或 Microsoft Foundry 的模型列表里,会看到这样一组选项:
MAI 模型家族:MAI-Image-2.5、MAI-Transcribe-1.5、MAI-Voice-2
下面逐一拆解。
MAI-Image-2.5:图像生成与编辑的新标杆
MAI-Image-2.5 是微软目前最强的图像模型,附带 MAI-Image-2.5-Flash 高速变体,分别面向高保真创作和大规模生产场景。
榜单成绩
- 文生图:Arena 排行榜 第 3
- 图像编辑:Arena Image Edit 排行榜 第 2,超越 Nano Banana 2
核心能力
- 身份与角色一致性:换风格、换姿势、换布局时,仍能保留可辨识的人脸、发型、服装和全身形象——适合品牌角色、代言人、社交营销素材。
- 风格与场景控制:全画面重绘(动漫风、调色、胶片颗粒、减龄等),可增删物体、调整人物姿态与互动关系。
- 文字、图形与版式控制:根据自然语言生成字体、Logo,输出 PPT 级信息图和幻灯片,支持「改成三步流程图」这类精准编辑。
- 图生图编辑:新增完整的 image-to-image 编辑能力,主打「可控且保留品牌身份」。
落地场景
- 已在 PowerPoint 上线,支持高质量图像生成
- 正在向 OneDrive 推送,提供精准图像编辑
- 开发者可通过 Microsoft Foundry 和 OpenRouter 调用 API
定价(Foundry)
| 变体 | 文本输入 | 图像输入 | 图像输出 |
|---|---|---|---|
| MAI-Image-2.5 | $5 / 1M tokens | $8 / 1M tokens | $47 / 1M tokens |
| MAI-Image-2.5-Flash | $1.75 / 1M tokens | $1.75 / 1M tokens | $33 / 1M tokens |
MAI-Transcribe-1.5:43 种语言的 SOTA 语音转写
如果说 MAI-Code-1-Flash 服务开发者,MAI-Transcribe-1.5 则瞄准「把声音变成文字」这条更普适的链路。
核心数据
| 维度 | 数据 |
|---|---|
| 语言覆盖 | 43 种(从上一代 25 种大幅扩展) |
| FLEURS 基准 | 词错误率 3.7%,多语言转写 第 1 |
| 处理速度 | 1 小时音频 15 秒内转写完成 |
| 效率对比 | 比 Gemini 3.1、Scribe v2、GPT-4o-Transcribe 快约 5 倍 |
两大新能力
- 关键词偏置(Keyword Biasing):提前注入人名、品牌词、行业术语,让模型「认识」你的专有词汇,FLEURS 基准上词错误率最高可降低 30%。体育解说、医疗记录、技术会议这类场景终于不用靠猜了。
- 真实环境鲁棒性:多人交叉说话、背景噪音、长时会议——企业日常遇到的「脏音频」,准确率依然稳定。
落地场景
正在集成进 Copilot、Teams、GitHub、Dynamics 365 Contact Centre,同时通过 Azure Speech 和 Microsoft Foundry 向开发者开放。后续还将支持说话人分离(Diarization)和实时流式 API。
定价
Azure Speech 起步价:$0.36 / 小时 音频。
MAI-Voice-2:15+ 语言的语音合成
与 MAI-Transcribe-1.5 配对,MAI-Voice-2 负责反向链路——把文字变成自然、有情感的语音。另有 MAI-Voice-2-Flash 变体,面向低延迟语音 Agent 场景。
核心能力
- 身份保留(Identity Preservation):复刻特定人物的独特声线,让模型「以该人的声音」在多个市场说话。适合品牌统一配音、本地化代言人、个性化数字助手和无障碍方案。
- 语音提示(Voice Prompting):上传一段短音频作为参考,控制语调、情绪、口音、语速和说话风格,无需维护独立的音色库。
- 跨语言统一:克隆音色或参考风格可在所有支持语言间自然迁移,不必为每种语言单独建系统。
语言与品质
- 支持 15+ 种语言,更多语言持续扩展
- 强调自然韵律(prosody)、母语感发音和细粒度情绪控制
落地场景
通过 Azure Speech 向开发者开放,定价起步 $22 / 100 万字符。Flash 变体面向 2026 年最火的 Voice Agent(语音智能体)场景,主打极致速度与性价比。
其他家族成员速览
| 模型 | 定位 | 亮点 |
|---|---|---|
| MAI-Code-1-Flash | 编码 | Copilot 原生,256K 上下文,令牌效率领先 |
| MAI-Thinking-1 | 推理 | 35B 参数,非蒸馏模型,Foundry 私有预览 |
从编码、推理到图像、语音、转写,微软正在搭建一套完整的自研 AI 能力矩阵。听(Transcribe)→ 想(Thinking)→ 写(Code)→ 画(Image)→ 说(Voice),五条链路全部自有模型覆盖。
三、谁能用?怎么收费?
覆盖计划
- Copilot Free ✅
- Copilot Pro ✅
- Copilot Pro+ ✅
- Copilot Max ✅
四个层级全部覆盖,没有人为卡门槛。
关于「免费」需要说清楚
2026年6月1日起,GitHub Copilot 已全面转向 AI Credits 按量计费。各计划包含月度额度,超出部分按模型 API 费率扣减。
MAI-Code-1-Flash 归类为 Lightweight(轻量) 档,费率相对较低:
| 模型 | 类别 | Input / 1M tokens | Cached input | Output / 1M tokens |
|---|---|---|---|---|
| MAI-Code-1-Flash | Lightweight | $0.75 | $0.075 | $4.50 |
| GPT-5 mini | Lightweight | $0.25 | $0.025 | $2.00 |
| Gemini 3 Flash | Lightweight | $0.50 | $0.05 | $3.00 |
| Claude Haiku 4.5 | Versatile | $1.00 | $0.10 | $5.00 |
所以更准确的说法是:所有 Copilot 用户都能选用这款微软自研模型,且因令牌效率高、单价低,日常编码的额度消耗会比同档竞品更省。 不是无限算力白嫖,但对 Free 用户来说,性价比确实拉满了。
rollout 节奏
模型从 6 月 2 日起开始灰度推送,首批覆盖部分 VS Code 用户,随后数周内逐步扩大。如果你暂时在模型列表里看不到,等几天再刷新即可。
四、完整设置指南:GitHub Copilot + MAI-Code-1-Flash
已经装了 Copilot 的老用户,直接跳到 步骤 5。
步骤 1:创建免费 GitHub 账户
前往 github.com/signup,免费注册即可。
步骤 2:启用 GitHub Copilot
前往 github.com/github-copilot/signup,选择 Free 计划——无需信用卡。
步骤 3:安装 VS Code 扩展
- 打开 VS Code
- 按
Ctrl+Shift+X(Windows)或Cmd+Shift+X(Mac)打开扩展市场 - 搜索 GitHub Copilot
- 安装 GitHub 官方出品的扩展(注意认准发布者)
步骤 4:登录授权
VS Code 会弹出「Sign in to GitHub」提示:
- 点击登录按钮
- 在浏览器中完成授权
- 返回 VS Code,确认右下角 Copilot 图标已激活
步骤 5:打开 Copilot Chat
按 Ctrl+Shift+I(Windows)或 Cmd+Shift+I(Mac),右侧会打开 Copilot 聊天面板。
步骤 6:选择 MAI-Code-1-Flash
- 点击聊天面板底部的 模型下拉菜单
- 从列表中选择 MAI-Code-1-Flash
- 完成——现在就可以开始对话了
也可以不手动选模型,交给 Auto picker 自动路由。Copilot 会根据任务复杂度判断是否调用 MAI-Code-1-Flash。
五、和竞品比,它赢在哪
免费编码模型赛道已经卷成红海:Cursor、Windsurf、Codeium、通义灵码……各路人马都在抢开发者桌面。
MAI-Code-1-Flash 的差异化不在「又一个能写代码的模型」,而在三个结构性优势:
1. 平台绑定深度
模型在 Copilot 生产 harness 上训练,天然理解 Copilot 的工具调用、多轮上下文和 agentic 工作流。第三方模型塞进 Copilot,多少有点「借宿」的味道;MAI-Code-1-Flash 是「原住民」。
2. 令牌效率
复杂任务令牌使用量比同类模型减少约 60%。在 AI Credits 计费时代,这直接等于「同样的月度额度,能多干一倍的活」。
3. 微软全栈闭环
从模型(MAI)到平台(GitHub / Foundry)到 IDE(VS Code)到办公套件(PowerPoint、Teams、OneDrive),一条链打通。编码用 MAI-Code-1-Flash,会议转写用 MAI-Transcribe-1.5,配图用 MAI-Image-2.5——全家桶都是自家模型。
当然,局限也摆在那里:目前仅在 VS Code 可用,Copilot CLI 和其他 IDE 的支持还在路上;灰度 rollout 意味着不是所有人立刻能用上。
六、第三方 API 通道
如果你不想等 Copilot 灰度,或者想在自有产品里集成,微软也通过以下渠道开放了 MAI-Code-1-Flash 的 API 访问:
- Fireworks AI
- Baseten
- OpenRouter
- GitHub Models(免费沙盒,无需 Azure 订阅)
开发者可以先在 GitHub Models 里原型验证,再决定是否接入生产环境。
总结
Build 2026 的 MAI 发布,不只是「又出了一个编码模型」,而是微软在 AI 全栈上的一次集体亮相:
- MAI-Code-1-Flash — 让 Copilot 有了自研编码大脑
- MAI-Image-2.5 — 图像编辑冲上榜二,已进 PowerPoint
- MAI-Transcribe-1.5 — 43 语言转写 SOTA,正在接入 Teams 和 Copilot
- MAI-Voice-2 — 15+ 语言语音合成,为 Voice Agent 时代铺路
对开发者来说,编码模型的上手成本极低:注册 GitHub → 开 Copilot Free → 装 VS Code 扩展 → 模型列表里选 MAI-Code-1-Flash。四步到位,零信用卡。
而对更广泛的用户,这套 MAI 家族意味着:开会自动转写、PPT 一键配图、品牌语音跨语言复刻——全部来自同一套微软自研模型,不再依赖 OpenAI 单一供应商。
免费 AI 模型大战,又热闹了一分。
参考链接:
- Introducing MAI-Code-1-Flash | Microsoft AI
- MAI-Image-2.5 launches at No. 2 for image editing | Microsoft AI
- Introducing MAI-Transcribe-1.5 | Microsoft AI
- New MAI models in Microsoft Foundry | Microsoft Community Hub
- MAI-Code-1-Flash is now available for GitHub Copilot - GitHub Changelog
- GitHub Copilot usage-based billing
