标签:大模型

狂拿大模型明星订单,一家清华系HPC-AI Infra公司浮出水面

93年创始人闫博文带领的是石科技在高性能计算领域展现出独特的发展路径。这家从国家超级计算无锡中心孵化而来的企业,凭借深厚的技术积累,在不盲目囤积算力...

科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶

在2025世界人工智能大会(WAIC 2025)上,上海AI实验室发布了新一代科学多模态大模型Intern-S1,标志着人工智能在科研领域的重大突破。Intern-S1不仅多模态能...

Qwen3 这波更新真猛,一下子成了全球最强编程模型

大模型的演进持续加速,国内外公司之间的竞争态势依然激烈。当前,模型的发展呈现出两个显著趋势:编程能力成为核心关注点,以及开源模型的快速进步。与早期...

李开复:零一万物AI Agent可接入任何开源模型,不要低估DeepSeek的强大能力

李开复博士领导的零一万物公司近期发布了升级后的企业大模型一站式平台“万智”2.0版本,并推出了企业级Agent智能体产品。该产品以“超级员工”为核心定位,具备...

Meta开源创新大模型架构AU-Nets

在大模型领域,文本数据的分解和处理一直是研究的核心问题。传统的分词方法,如Byte Pair Encoding,通常将文本分割成固定粒度的单元,并构建静态词汇表供模...

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型领域近期迎来了显著的技术进展,尤其是中国市场的竞争愈发激烈。Kimi K2作为一款备受关注的模型,其1T的总参数量在短时间内被Qwen3的新版本超越。Q...

大语言模型离“数学证明高手”还有多远?斯坦福、伯克利、MIT 团队提出 IneqMath 评测标准

大语言模型(LLM)在生成看似正确的结论时,往往缺乏严谨的推理过程,尤其是在数学证明领域。不等式问题因其结构简单、逻辑清晰,成为检验模型推理能力的理想...

朱啸虎:大模型会吃掉90%的Agent

朱啸虎在其个人小红书账号上提出“大模型会吃掉90%的Agent”的观点,认为当前的AI Agent创业与互联网早期的个人站长模式有相似之处。他通过对比两者,指出AI Ag...

微软开源2025 ICML获奖框架,终结大模型多轮对话严重缺陷

微软在2025年国际机器学习会议上发布了获奖论文CoLLabLLM,并开源了该创新框架。CoLLabLLM旨在解决大模型在多轮交互中的缺陷,通过多轮对话模拟和多轮感知奖...

2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多

资本兴趣从大模型转向具身智能的趋势愈发明显。2024年上半年,国内具身智能领域共发生130起融资事件,总融资金额预估超过200亿元人民币,远超2023年全年的90...
1 2 3 61