标签:大模型

华为盘古718B模型最新成绩:开源第二

在最新一期SuperCLUE中文大模型通用基准测评中,华为的openPangu-Ultra-MoE-718B以7180亿参数的体量位列国产大模型第二名。其成功并非依赖数据堆砌,而是通过...

汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力

在 RL China 2025 开幕式的思想对话中,图灵奖得主、“强化学习之父”Richard Sutton 与伦敦大学学院汪军教授共探智能的本质与未来方向。Richard 认为大模型缺...

对话淘宝姜宇宁:如果你只推低价商品,是不需要用大语言模型的

淘宝推荐算法技术团队在电商推荐系统领域取得重要突破,上线的 RecGPT 百亿参数推荐大模型带来了显著变革。- RecGPT 及团队成果:淘宝推荐算法团队是首个用大...

可灵AI升级模型降价30%,视频大模型会卷入价格战吗?

9月23日,可灵AI推出视频生成可灵2.5 Turbo模型,更新文生视频、图生视频两大功能,官方将“相比2.1模型同档位便宜近30%”作为核心卖点,这是其少见地重点提出“...

重磅官宣!Transformer发明者、GPT-5主创领衔,50+顶尖专家揭秘AGI时间表

2025全球机器学习技术大会将于10月16 - 17日在北京威斯汀酒店召开,此次大会是在计算与连接发展呈周期性趋势,当下“计算2.0”进入加速交替阶段,AGI有望在2035...

6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0

蚂蚁百灵大模型团队正式开源最新 MoE 大模型 Ling-flash-2.0,该模型在多个权威评测中表现卓越,为大模型“参数膨胀”趋势提供新路径。从“参数军备”到“效率优先...

SFT远不如RL?永不过时的剃刀原则打开「终身学习」大模型训练的大门

我们已进入大模型时代,大模型成为智能化基础设施核心,支撑多种下游应用,但多数模型是细分领域任务的专家,离通用人工智能(AGI)尚远,且存在“灾难性遗忘”...

文心新出的推理大模型,给了我们信心

当下大语言模型存在“幻觉”问题,OpenAI 研究指出消除幻觉需修正评分机制与开发新技术。而在 WAVE SUMMIT 深度学习开发者大会 2025 上,百度发布的文心大模型 ...

1 亿美元 ARR、不设 AI 硬件产品经理,Plaud 如何拿下全球百万用户?

去年被视为AI硬件元年,但今年部分AI硬件产品表现不佳,如Humane的AI Pin和Rabbit R1,但Plaud AI的产品却取得了不错成绩。Plaud Note推出一年多交付30万台、...

三个月、零基础手搓一块TPU,能推理能训练,还是开源的

大模型技术发展使 AI 专用芯片受关注,谷歌 TPU 是典型例子,其自 2015 年部署后已发展到第 7 代,推动了大模型技术进展。加拿大西安大略大学工程师 Surya Su...
1 2 3 4 5 6 65