大模型
LLM,VLM,模型
AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
谷歌AI Studio上的一个神秘模型成功识别并修正了200多年前一位商人的「天书」账本,展现出接近人类专家级的手写文本识别能力和隐式推理水平。历史学家Mark Hu...
强化学习 AI 系统的设计实现及未来发展
强化学习作为推动大语言模型智能化的核心手段,其复杂程度体现在算法理论与工程实践的双重挑战中。阿里巴巴算法专家曹宇在AICon 2025的分享中,系统梳理了RLH...
楼下跪了 7 天,大佬终于甩我一份 AI 时代秘籍
极客公园创新大会2026将以“进程由我 On The Loop!”为主题,聚焦AI时代的技术变革与人类应对策略。作为第16届年度盛会,活动将汇聚来自大模型、Agent、AI硬件...
三位AI殿堂级人物罕见同框:LeCun、李飞飞、谢赛宁团队用空间超感知让AI像人一样理解三维世界
研究团队将AI视觉能力发展划分为四个演进阶段:语义感知、流事件认知、隐式3D空间认知和预测性世界建模。诊断测试显示,现有视频基准测试存在严重缺陷——许多...
华为刚投的物理AI:首家国产世界模型公司
华为通过哈勃投资首次押注专注于世界模型的极佳视界,标志着其在自动驾驶和具身智能领域的技术布局进一步深化。这家成立仅两年的公司已完成三轮融资,其核心...
医疗AI质变时刻来临!国产医疗AI率先突破,临床诊疗能力问鼎全球
医疗AI在临床实践中的表现与标准化考试存在显著差距。尽管AI模型在各类医学考试中屡获高分,但在真实医疗场景中却频繁出现推理幻觉、诊断不当等问题。这种落...
Kimi K2 Thinking,是月之暗面的“复仇”
月之暗面发布里程碑式开源大模型Kimi K2 Thinking,在推理能力、智能体性能和量化技术上实现显著突破。该模型以1万亿参数规模采用384个专家混合架构,在HLE、...
这家好莱坞公司提供了全新的影视工业AI解决方案
全球AI视频生成市场在2025年已突破300亿美元规模,年复合增长率超过40%,形成短视频平台与通用大模型厂商分庭抗礼的格局。短视频厂商凭借流量优势和模板化创...
识别1600+种人类语言,支持少样本扩展到5400+种语言,Meta自动语音识别模型开源
Meta AI发布的Omnilingual ASR技术标志着自动语音识别领域的重大突破。该系统首次实现对1600多种语言的转录能力,其中500多种语言是历史上首次被AI系统记录。...
套现415亿!软银回应清仓英伟达:筹钱投OpenAI;李想直管人事,华为系高管淡出理想管理层;Meta首席AI科学家杨立昆将离职
软银集团宣布清仓英伟达股票,套现415亿元人民币,资金将用于追加对OpenAI的投资。根据财报披露,软银此次出售英伟达股票获得58.3亿美元,同时减持T-Mobile股...





