标签:大模型

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

MiniMax新一代大模型M2在轻量级软件工程Agent基准测试mini-SWE-agent中表现最佳,超越了DeepSeek、GLM、Qwen、Kimi等其他竞品。该测试主要评估大模型在真实软...

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

交错思维链(Interleaved Thinking)技术正成为解决大模型在复杂任务中“状态漂移”问题的关键机制。当大模型处理长链条任务(如旅行规划)时,传统ReAct(推理...

豆包官宣手机助手:AI 还能带来哪些新体验?

字节跳动旗下豆包团队近期宣布推出豆包手机助手,标志着大模型技术向用户日常生活场景迈出关键一步。这一产品并非通过自研硬件实现,而是与中兴等手机厂商合...

近期听到关于 GEO 最透彻的认知

随着用户信息获取习惯的快速变化,传统的搜索引擎优化(SEO)正在被生成引擎优化(GEO)所取代。大模型不再依赖单一网页排名,而是通过全网语义理解生成答案...

第八届 GAIR 全球人工智能与机器人大会,首批嘉宾公布

2016年夏天,首届GAIR人工智能与机器人大会在深圳举办,标志着人工智能领域的重要里程碑。这场由海内外顶级科学家参与的盛会,见证了AI从低谷走向辉煌的历程...

华为放出「准万亿级MoE推理」大招,两大杀手级优化技术直接开源

2025年标志着大模型从单点工具向业务系统底层基础设施的转型,其中推理效率成为决定模型能否实际落地的关键因素。超大规模混合专家(MoE)模型面临计算、通信...

AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金

2025年下半年,输入法赛道因大模型技术的爆发迎来新一轮竞争热潮。国内外厂商密集发布新产品:字节的豆包输入法结束内测正式上线,微信输入法持续迭代AI功能...

单卡跑出集群效率!Hugging Face TRL 与 RapidFire AI 的超并行革命

Hugging Face的TRL库与RapidFire AI的集成标志着大模型开发进入超并行时代。单张GPU可同时运行多个微调实验,实验验证速度提升16至24倍,显著降低算力门槛。...

主流开源大模型生态解析

开源生态已成为驱动AI领域发展的核心力量,2025年全球开源大模型形成了由Llama、GLM、Qwen和DeepSeek构成的'四强争霸'格局。Meta的Llama系列作为开源世界的奠...

今年广州车展,一堆“豆包”上车了 | 巴伦精选

今年的广州车展成为智能汽车竞争逻辑转变的重要标志:车企的比拼焦点从硬件算力转向大模型的应用成熟度。火山引擎的豆包大模型成为行业典型样本,已搭载于奔...
1 2 3 68