标签:大模型
管你模型多大,250份有毒文档统统放倒,Anthropic:LLM比想象中脆弱
黑掉一个大模型似乎比人们预期的要简单得多。传统观点认为,攻击或污染具有庞大参数量的大模型非常困难,通常需要极大量的数据污染。然而,Anthropic与英国人...
听说,大家都在梭后训练?最佳指南来了
在大模型时代,Scaling Law曾被视为AI领域的黄金准则,但随着模型规模扩展到百亿、千亿级,其边际效益开始递减。业界逐渐将重心从预训练转向后训练阶段,这一...
更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA
蚂蚁集团推出的Ling-1T大模型标志着开源大模型领域的重要突破。作为百灵大模型Ling 2.0系列的首款旗舰产品,该模型采用高效的MoE架构,总参数规模达到万亿级...
超越RAG,DRAG让LLM准确率飙升45.5%,问题越复杂能力越强
RAG(检索增强生成)技术通过结合大语言模型(LLM)的记忆能力和外部知识库检索,解决了模型知识“截止日期”的问题。然而,传统RAG在评估文档相关性时存在局限...
AI科学家们在小红书上玩起一场大型问答游戏,这里是我们整理的精华问答实录
最近一个月,小红书上的“Ask me anything”科技问答活动吸引了大量AI领域专家与网友互动。这场活动既涵盖学术问题讲解,也涉及学习经验、科研建议和就业方向分...
开发者狂喜:Thinking Machines发布首款产品Tinker,后训练麻烦全给包了
OpenAI前CTO Mira Murati创立的Thinking Machines公司推出了首款产品Tinker,这是一个旨在简化大模型微调过程的API工具。该工具允许开发者和研究人员专注于训...
节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世
智谱AI正式发布新一代旗舰模型GLM-4.6,该模型在多个技术维度实现显著突破。作为GLM系列的最新版本,GLM-4.6不仅延续了开源策略(采用MIT协议),更在编码能...
印奇,志在千里
印奇创立的千里科技(AFARI)承载着他对人工智能与未来出行的深刻思考。品牌名称融合了“FAR”与“AI”的双关,既象征“AI引领未来”,又暗含东方禅意——“遇见未来的...
AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」
千里科技通过高「含模量」的AI智能辅助驾驶解决方案,在重庆复杂路况测试中展现了超越人类驾驶员的性能。其系统采用端到端架构,融合多模态大模型与强化学习...
XTransfer 发布自研外贸金融大模型 TradePilot 2.0,技术架构全面升级
XTransfer于2024年6月推出的外贸金融大模型TradePilot在专业测评中表现优异,综合得分超越GPT-4等知名模型,并在智能风控、智能客服等领域实现快速落地应用。...





