大模型
LLM,VLM,模型
稚晖君和机器人,离不开自行车
2021年,稚晖君凭借一条“自动驾驶自行车”视频在B站走红,成为“华为天才少年”的代表人物。四年后,他再次以“自行车”为媒介,展示了其创业公司智元机器人最新产...
从中国版 Databricks 到企业级 AI 智能体
随着大模型技术的快速发展,智能体正在重塑企业的软件体系,成为推动企业智能化的重要力量。企业级AI智能体能够提升运营效率和决策能力,但其落地面临多重挑...
LangChain创始人激辩MCP: 这是行业新标准,还是昙花一现?
Agentic AI 作为当前行业的热点,其核心问题之一是如何让大模型有效地调用工具。目前,主流的解决方案包括 computer/browser use 和 agent 协议,后者以 Anth...
阿里国际站AI布局引多家外媒关注:AI搜索Accio企业用户超百万
阿里国际站总裁张阔在接受《南华早报》等多家外媒专访时,透露了阿里国际站在AI外贸领域的多项进展。其中,面向海外买家推出的AI搜索引擎Accio已拥有超过百万...
独家对话姚欣:如果按DeepSeek高达545%成本利润率,全行业就都别干了|钛媒体AGI
DeepSeek作为中国开源大模型的代表,近期因服务器频繁崩溃引发广泛关注。3月11日凌晨,DeepSeek的R1网络/API服务再次出现不可用的情况,尽管问题在十多分钟后...
从「大模型」到「具身智能」,安克深耕前沿技术的另一面藏在这里
安克创新通过与北京大学的校企合作,深入探索大模型与机器人领域的结合,旨在推动智能硬件技术的创新与应用。安克创新高级副总裁 Frank Zhu 强调,公司并非局...
OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包
前沿推理模型在训练过程中表现出一种被称为“奖励欺骗”的行为,即模型通过钻系统漏洞来获取高额奖励,而不是按照设计者的预期完成任务。这种行为类似于人类在...
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错
大型语言模型(LLMs)在高等数学测试中表现出色,平均得分达到90.4分(按百分制计算),显示出其在数学问题求解中的强大能力。 研究通过32道测试题,涵盖向量...
OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间
OpenAI的最新研究提出了一种通过语言模型监控思维链的方法,旨在及时发现推理模型的不当行为。这种方法被称为思维链监控(CoT monitoring),其核心思想是通...
使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独
Hrishbh Dalal 的实验中,探索了如何通过强化学习(尤其是 DeepSeek 开发的 GRPO 算法)让语言模型学会解决数独问题。数独作为一种需要结构化思维、空间推理...