标签:端侧部署

CVPR 2026 四篇论文透视:大厂如何靠「算法瘦身」对抗算力涨价?

面对算力封锁与训练成本飙升的挑战,人工智能领域的技术发展重心正从单纯堆叠硬件转向挖掘算法潜力。大厂不再比拼GPU数量,而是较量如何把GPU用得更好,算力...

手机跑多模态也能快到飞起!面壁MiniCPM-V 4.6开源

大模型技术正加速向移动终端演进,实现复杂图文与视频任务的本地化实时处理。MiniCPM-V 4.6作为一款专为端侧部署深度优化的多模态模型,依托视觉编码器与轻量...

清华系团队出手!一张 4090 即可「爆改」,1.3B小钢炮震撼开源

面壁智能联合清华大学及开源社区正式发布了端侧多模态大模型MiniCPM-V 4.6,该模型仅具备约1.3B参数规模,却在多模态性能与运行效率上实现了对同级别主流模型...

腾讯混元最新开源:440M翻译模型手机离线就能用,翻译质量超谷歌

随着跨境办公与本地化阅读的日益频繁,传统依赖云端接口的翻译工具在弱网、断网及高隐私要求场景中表现出明显的体验断层。腾讯混元团队针对智能手机的内存瓶...

MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070 即可实时运行

面壁智能联合清华大学开源九亿参数模型,成功构建业界首个支持端到端全双工全模态交互的智能系统。该系统突破传统轮次对话的时序割裂,依托首创的Omni-Flow流...

MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070即可实时运行

面壁智能联合清华大学与开源社区正式发布MiniCPM-o 4.5,首次公开支撑实时交互的Omni-Flow底层技术。该模型仅依赖9B参数与12GB起显存的消费级显卡,即可在个...

谷歌Gemma 4全系开源:3.8亿激活超越20倍体量模型,手机秒变AI工作站

谷歌正式发布了Gemma 4全系列开源模型,致力于将云端的顶尖AI能力封装至智能手机与轻薄笔记本等移动设备中。新系列包含四个规格的参数模型,其中仅需激活3.8...

iPhone本地跑Gemma 4火了,0 token时代还有多远?

最近谷歌正式推出一款代号为Gemma 4的开源基础模型,这一技术产品采用了与业界前沿的高端产品同源架构体系,原生支持全模态的数据输入处理方式。其在相关评测...

AI能帮忙厨房看火了!面壁智能开源全模态模型MiniCPM-o4.5,边看边听还能主动抢答

面壁智能开源的全模态模型MiniCPM-o4.5标志着AI交互方式的重大突破。该模型首次实现了边看、边听、主动说的全双工交互能力,打破了传统AI'一问一答'的串行模...

微软Fara-7B计算机操作模型,开启端侧智能代理新时代

微软发布了专为计算机操作设计的70亿参数智能代理Fara-7B,该模型通过纯视觉感知和合成数据训练,在端侧实现了高效能与安全性。与传统聊天机器人不同,Fara-7...
1 2