发布时间:2025-12-17
点击次数: 小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。

MiMo-V2-Flash 模型整体架构如下:

MiMo-V2-Flash 核心设计亮点:
采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。
通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。
综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾高吞吐、低延迟与极致推理性能。
T
opaz Video AI
一款工业级别的视频增强软件
511
查看详情
Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。

访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。
立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。
源码地址:点击下载
以上就是小米开源 Xiaomi MiMo-V2-Flash:高效推理、代码与 Agent 基座模型的详细内容,更多请关注其它相关文章!
# ai
# win
# claude
# 小米
# 集体建设用地出让网站
# 桂园网站推广方案
# seo 应用哪些标签
# 河南实力网站优化首选
# 海东爱采购关键词排名了解
# 洛阳全网推广营销中心
# 创业小项目网站建设建议
# 衡水营销推广要多少钱
# 稳定seo推广咨询
# 莆田抖音优化seo
# 设为
# 此前
# 北京
# 首家
# 被称为
# 仍是
# 并在
# 徐州
# 基座
# 开源
# red
# 大模型
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
7大探索区域打造沉浸式玩乐“元宇宙” 昆明京东MALL未来科技探索官全城招募中
AYANEO 安卓掌机 Pocket AIR 配置公布:天玑 1200 + 5.5 英寸屏
ChatGPT只讲这25个笑话!实验上千次有90%重复,网友:幽默是人类最后的尊严
微软bing聊天推出AI购物工具 可进行比价并查看历史最低价
微幼科技推出全自动晨检机器人,助力幼儿园校园健康检测
在这里见未来!杭州未来科技城全球AI盛会邀您共探最前沿
调查:过半数艺术家认为 AI 作图无法帮助他们的工作
新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实
AIGC浪潮下,联想集团再加码计算与人工智能
重塑未来生活的五项技术趋势
IBM将模拟计算用于人工智能,重塑AI计算
加强能源消费绿色转型政策引导
揭示经济学论文写作中提高效率与质量的AI助手应用策略
五个出色的人工智能应用实例
人工智能驱动智能建筑会是未来趋势吗?
"探索Meta发布的Quest MR/VR视频录制与拍摄指南"
美的推出 AI 双视精准避障的自动集尘扫拖机器人 V12,售价仅为2999元
丰田汽车研究院推出生成式人工智能汽车设计工具
“痴迷”元宇宙,魔珐科技想做什么?
Unity 内测 Safe Voice 服务,利用 AI 自动识别玩家不当聊天内容
为AI而服务设计:构建以人为本的AI创新方法
湖北科技职业学院举行工业机器人及智能制造技术专精特新产业学院建设启动仪式
世界人工智能大会高合发表演讲,HiPhi Y即将全球上市
能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高
AI会帮我们把活干完吗?
AI技术加速迭代:周鸿祎视角下的大模型战略
世界人工智能大会上,科大讯飞宣布与华为联手
了解 AGI:智能的未来?
昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布
五项人工智能尚未能够实现的任务
华为将于 7 月发布面向 AI 大模型的新款存储产品
人工智能驱动艺术,打开达利的超现实想象
一文读懂自动驾驶的激光雷达与视觉融合感知
张朝阳与陆川谈AI:ChatGPT是鹦鹉学舌思维,不可能取代人类 | 把脉AI大模型
如何利用AI工具写好本科论文:科技助你一臂之力
微软向美国政府提供GPT的大模型,安全性如何保证?
解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能
如布科技发布新产品AI口袋学习机S12
2025VR&AR显示技术峰会视频解析: 歌尔光学展示最新一代VR/AR光学模组
AI连线 | 专访风平智能CEO林洪祥:让AI数字人拥有漂亮的外表和有趣的灵魂,安全问题是重要考量
应对算力挑战,亚马逊云科技发力AI基础设施建设
人工智能颠覆软件测试四大方式
大脚攀爬者车主福利!无人机、运动相机大奖等你来挑战
朝鲜出现国产大型察打一体无人机,实力世界第二,太意外了
测试框架-安全和自动驾驶
Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
“聚智启新,‘蓉’力同行” 成都市人工智能产业融通对接会成功举办
V社谈AI制作游戏被ban:为确保开发者有素材所有权
无人机在电力巡检中的应用:全面解析高效巡检流程
280万条多模态指令-响应对,八种语言通用,首个涵盖视频内容的指令数据集MIMIC-IT来了