标签:大模型

vivo 的 AI 破局之道:给每个用户发一个「专属」大模型

2025年vivo开发者大会的核心焦点是「2025蓝心智能战略」的全面升级,这一战略旨在通过AI技术的深度整合与创新,打造更贴近用户需求的个人化智能体验。OriginO...

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

大模型开源生态近期迎来密集动态,国内外头部团队在国庆期间持续推出重磅产品。阿里、DeepSeek、Anthropic等企业相继发布Qwen3-Max、DeepSeek V3.2-Exp等针对...

蚂蚁十天连发两个万亿参数大模型,获 LeCun 点赞

蚂蚁集团在国庆期间密集发布了两款万亿参数大模型——Ling-1T和Ring-1T-preview,标志着国内万亿参数俱乐部扩容至三位成员。这两款模型基于自研Ling 2.0架构,...

管你模型多大,250份有毒文档统统放倒,Anthropic:LLM比想象中脆弱

黑掉一个大模型似乎比人们预期的要简单得多。传统观点认为,攻击或污染具有庞大参数量的大模型非常困难,通常需要极大量的数据污染。然而,Anthropic与英国人...

听说,大家都在梭后训练?最佳指南来了

在大模型时代,Scaling Law曾被视为AI领域的黄金准则,但随着模型规模扩展到百亿、千亿级,其边际效益开始递减。业界逐渐将重心从预训练转向后训练阶段,这一...

更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA

蚂蚁集团推出的Ling-1T大模型标志着开源大模型领域的重要突破。作为百灵大模型Ling 2.0系列的首款旗舰产品,该模型采用高效的MoE架构,总参数规模达到万亿级...

超越RAG,DRAG让LLM准确率飙升45.5%,问题越复杂能力越强

RAG(检索增强生成)技术通过结合大语言模型(LLM)的记忆能力和外部知识库检索,解决了模型知识“截止日期”的问题。然而,传统RAG在评估文档相关性时存在局限...

AI科学家们在小红书上玩起一场大型问答游戏,这里是我们整理的精华问答实录

最近一个月,小红书上的“Ask me anything”科技问答活动吸引了大量AI领域专家与网友互动。这场活动既涵盖学术问题讲解,也涉及学习经验、科研建议和就业方向分...

开发者狂喜:Thinking Machines发布首款产品Tinker,后训练麻烦全给包了

OpenAI前CTO Mira Murati创立的Thinking Machines公司推出了首款产品Tinker,这是一个旨在简化大模型微调过程的API工具。该工具允许开发者和研究人员专注于训...

节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

智谱AI正式发布新一代旗舰模型GLM-4.6,该模型在多个技术维度实现显著突破。作为GLM系列的最新版本,GLM-4.6不仅延续了开源策略(采用MIT协议),更在编码能...
1 2 3 4 5 65