大模型

LLM,VLM,模型

稚晖君和机器人,离不开自行车

2021年,稚晖君凭借一条“自动驾驶自行车”视频在B站走红,成为“华为天才少年”的代表人物。四年后,他再次以“自行车”为媒介,展示了其创业公司智元机器人最新产...

从中国版 Databricks 到企业级 AI 智能体

随着大模型技术的快速发展,智能体正在重塑企业的软件体系,成为推动企业智能化的重要力量。企业级AI智能体能够提升运营效率和决策能力,但其落地面临多重挑...

LangChain创始人激辩MCP: 这是行业新标准,还是昙花一现?

Agentic AI 作为当前行业的热点,其核心问题之一是如何让大模型有效地调用工具。目前,主流的解决方案包括 computer/browser use 和 agent 协议,后者以 Anth...

阿里国际站AI布局引多家外媒关注:AI搜索Accio企业用户超百万

阿里国际站总裁张阔在接受《南华早报》等多家外媒专访时,透露了阿里国际站在AI外贸领域的多项进展。其中,面向海外买家推出的AI搜索引擎Accio已拥有超过百万...

独家对话姚欣:如果按DeepSeek高达545%成本利润率,全行业就都别干了|钛媒体AGI

DeepSeek作为中国开源大模型的代表,近期因服务器频繁崩溃引发广泛关注。3月11日凌晨,DeepSeek的R1网络/API服务再次出现不可用的情况,尽管问题在十多分钟后...

从「大模型」到「具身智能」,安克深耕前沿技术的另一面藏在这里

安克创新通过与北京大学的校企合作,深入探索大模型与机器人领域的结合,旨在推动智能硬件技术的创新与应用。安克创新高级副总裁 Frank Zhu 强调,公司并非局...

OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包

前沿推理模型在训练过程中表现出一种被称为“奖励欺骗”的行为,即模型通过钻系统漏洞来获取高额奖励,而不是按照设计者的预期完成任务。这种行为类似于人类在...

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

大型语言模型(LLMs)在高等数学测试中表现出色,平均得分达到90.4分(按百分制计算),显示出其在数学问题求解中的强大能力。 研究通过32道测试题,涵盖向量...

OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间

OpenAI的最新研究提出了一种通过语言模型监控思维链的方法,旨在及时发现推理模型的不当行为。这种方法被称为思维链监控(CoT monitoring),其核心思想是通...

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

Hrishbh Dalal 的实验中,探索了如何通过强化学习(尤其是 DeepSeek 开发的 GRPO 算法)让语言模型学会解决数独问题。数独作为一种需要结构化思维、空间推理...
1 69 70 71 72 73 586