识别1600+种人类语言,支持少样本扩展到5400+种语言,Meta自动语音识别模型开源
Meta AI发布的Omnilingual ASR技术标志着自动语音识别领域的重大突破。该系统首次实现对1600多种语言的转录能力,其中500多种语言是历史上首次被AI系统记录。...
Google量子计算团队最新对话:量子计算已经被验证了|现场实录
Google Quantum AI团队在量子计算领域取得了一系列突破性进展,标志着该技术正从实验室走向实际应用。2019年Sycamore芯片首次实现'量子霸权'后,团队持续突破...
套现415亿!软银回应清仓英伟达:筹钱投OpenAI;李想直管人事,华为系高管淡出理想管理层;Meta首席AI科学家杨立昆将离职
软银集团宣布清仓英伟达股票,套现415亿元人民币,资金将用于追加对OpenAI的投资。根据财报披露,软银此次出售英伟达股票获得58.3亿美元,同时减持T-Mobile股...
给芯片降降温
台积电工程师团队成功开发了一种名为硅集成微型冷却器(IMC-Si)的直接硅基液冷解决方案,并将其集成到3.3倍光刻CoWoS-R封装平台上。该技术通过将液态冷却剂...
机器人的 “实干优等生”:半年3款新品,扎根落地场景应用
机器人行业正面临从概念演示到稳定量产的巨大挑战,而魔法原子通过工程化能力和务实的产品策略,实现了“发布即发售,发售即投入真实场景”的突破。与行业内普...
HBM,太难了
高带宽内存(HBM)作为人工智能领域的关键技术,正面临制造工艺的极限挑战。多层芯片堆叠、硅通孔(TSV)和微凸点尺寸的持续微缩,导致缺陷检测难度呈指数级...
深度复盘:大疆是如何成为影像领域新巨头的?
大疆已从无人机领域的王者转型为影像技术领域的巨头,其成功源于核心技术的持续迭代与跨品类复用。最初以飞控技术和三轴云台系统在无人机市场建立优势,随后...
JanusVLN:双重隐式记忆解耦语义与空间,开创视觉语言导航记忆新范式
JanusVLN框架通过双重隐式神经记忆机制,实现了视觉语言导航(VLN)中语义与空间信息的有效解耦。传统VLN方法依赖显式记忆存储历史观测数据,面临空间信息损...
杨植麟带 Kimi 团队深夜回应:关于 K2 Thinking 爆火后的一切
月之暗面发布的Kimi K2 Thinking模型以其“模型即Agent”的设计理念引发行业震动。该模型通过创新的KDA(Kimi Delta Attention)注意力机制,有效解决了MoE模型...
APP 上线 40 天后,Sora 核心团队分享了他们对于 AI 社交的关键思考
Sora APP在短短5天内实现了100万次下载,速度甚至超过了ChatGPT的早期表现。更引人注目的是,其近200万周活跃用户中,70%参与了内容创作,这一数据远超传统互...