大模型
LLM,VLM,模型
混元OCR模型核心技术揭秘:统一框架、真端到端
腾讯混元大模型团队推出的HunyuanOCR模型是一款商业级开源视觉语言模型,专为OCR任务设计,参数规模仅1B,兼具轻量与高性能特性。该模型在文本检测识别、复杂...
第八届 GAIR 全球人工智能与机器人大会,首批嘉宾公布
2016年夏天,首届GAIR人工智能与机器人大会在深圳举办,标志着人工智能领域的重要里程碑。这场由海内外顶级科学家参与的盛会,见证了AI从低谷走向辉煌的历程...
OpenAI,可能创造了历史上最快的烧钱速度
OpenAI作为历史上最烧钱的初创公司,其运行大语言模型的推理成本正以远超收入增速的态势扩张。根据微软财报反推的数据显示,2025年第三季度推理支出飙升至36....
不用上传数据了!苹果正式开源 Embedding Atlas,用 Rust+WebGPU 在桌面实现科研级数据分析
苹果最新发布的Embedding Atlas是一款开源工具,专为研究人员、数据科学家和开发者设计,用于交互式可视化和探索大规模嵌入向量。该平台完全在浏览器端运行,...
17岁高中辍学,靠ChatGPT手把手教成OpenAI科学家
Gabriel Petersson的故事展现了AI时代对传统教育体系的颠覆性冲击。这位23岁的高中辍学生凭借ChatGPT自学成才,最终成为OpenAI研究科学家和Sora核心技术贡献...
AI产品“增长黑客”的10000种野路子
大模型能力的提升显著降低了AI产品的开发门槛,但同时也将增长难度推至新高。独立开发者与大厂之间的技术差距正在缩小,导致产品功能难以形成壁垒,获客成本...
奥斯卡大师加持,「电影精神」怎么造就AI剧场?
73岁的传奇影人鲍德熹与爱奇艺合作推出“AI剧场”创作营,标志着影视行业对AI技术的一次深度拥抱。作为奥斯卡获奖摄影师,鲍德熹坦言自己“奋不顾身地转型”,决...
80后诺奖得主:AlphaFold下一步融合大模型
正值AlphaFold问世五周年之际,其核心开发者John Jumper公开透露了下一步发展方向:与AI大模型融合。这一技术自2020年发布以来已帮助全球300多万研究人员预测...
华为放出「准万亿级MoE推理」大招,两大杀手级优化技术直接开源
2025年标志着大模型从单点工具向业务系统底层基础设施的转型,其中推理效率成为决定模型能否实际落地的关键因素。超大规模混合专家(MoE)模型面临计算、通信...
微软Fara-7B计算机操作模型,开启端侧智能代理新时代
微软发布了专为计算机操作设计的70亿参数智能代理Fara-7B,该模型通过纯视觉感知和合成数据训练,在端侧实现了高效能与安全性。与传统聊天机器人不同,Fara-7...




