一家中国公司,做了苹果AI该做的事。

AIGC动态3天前发布 admin
140 0 0
一家中国公司,做了苹果AI该做的事。

 

文章摘要


【关 键 词】 AI端侧模型隐私开源创新

今年的WWDC主题演讲中,苹果并未推出令人激动的AI新特性,但AI已逐渐融入手机的各个功能,如相册、翻译、电话和搜索,且这些功能大多通过端侧AI实现。端侧模型的计算和推理在本地完成,确保了用户隐私安全,并适用于网络不稳定的场景,如汽车和未来的具身智能设备。国内的面壁智能公司专注于端侧模型,近期完成了数亿元融资,其MiniCPM 4.0版本在端侧长文本处理上取得了突破,标志着端侧模型能力的显著提升。

MiniCPM 4.0有两个开源版本:8B参数的稀疏闪电版和0.5B的小模型。8B版本在长文本和高效推理方面表现优异,而0.5B版本则适合在配置较低的终端设备上运行,推理速度极快。MiniCPM 4.0在速度、精度和资源占用上表现亮眼,成为新一代端侧基础模型的标杆。0.5B模型虽然在参数量上较小,但在实际评测中表现优异,甚至在某些任务上超越了更大的模型。

MiniCPM 4.0的量化技术使模型体积减少了90%,性能几乎不受影响,降低了AI在终端设备上的部署门槛。开源模型、训练算子、推理算子和高质量的预训练数据,进一步推动了端侧模型的普及。MiniCPM 4.0的系统级技术创新包括自研的稀疏注意力架构InfLLM v2、CPM.cu推理框架和BitCPM4三值量化技术,显著提升了模型的计算效率和推理速度。

端侧模型的价值正逐渐从发布会PPT走入日常生活,未来在手机、车机和智能家居设备上的应用将更加广泛。面壁智能的技术创新不仅提升了端侧模型的性能,还降低了开发和部署成本,为AI在终端设备上的广泛应用奠定了基础。未来,无论AGI发展到什么阶段,端侧智能都将不可或缺,只有将“大脑”真正装进终端,AI才能及时响应复杂多变的现实场景。

原文和模型


【原文链接】 阅读原文 [ 2645字 | 11分钟 ]
【原文作者】 AI产品阿颖
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...