您的位置 首页 科技

天才少女罗福莉加入小米后,小米首个开源推理大模型发布

出品|搜狐科技作者|张雅婷天才少女罗福莉加入小米之后,小米交出了首份在大模型领域的成绩单。

出品|搜狐科技

作者|张雅婷

天才少女罗福莉加入小米之后,小米交出了首份在大模型领域的成绩单。

4月30日小米,小米官方宣布开源首个为推理而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

天才少女罗福莉加入小米后,小米首个开源推理大模型发布

随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,小米MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

展开全文

天才少女罗福莉加入小米后,小米首个开源推理大模型发布

小米表示,MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,比如在预训练中,核心是让模型见过更多推理模式,在后训练中,引入了高效稳定的强化学习算法和框架。

去年底,有报道称,罗福莉被小米创始人雷军以千万年薪招募,担任小米AI实验室的大模型团队负责人,她也被外界称为95后AI“天才少女”。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。硕士毕业后,罗福莉进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。

2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

对于小米来说,端侧大模型是其需要重点突破的方向。此前在2023年4月,小米组建了AI大模型的团队,聚焦轻量化和本地部署,这也和很多互联网平台公司的思路是不同的。

从行业来看看,各家品牌厂都在加速布局大模型,加速推动AI落地手机端侧。IDC认为,中国市场AI手机份额也将迅速增长,到2027年将占比超过50%。新一代AI手机将带来存储、屏幕、影像设备的硬件升级和成本提升,会推动智能手机ASP进一步上升。

本文来自网络,不代表天牛新闻网立场,转载请注明出处:http://www.shoesdog.com/17034.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部