标签:大语言模型
Hugging Face开源顶级模型:双模式推理+128K上下文,最强3B
全球著名大模型开放平台Hugging Face近日开源了顶级小参数模型SmolLM3,该模型仅有30亿参数,但其性能显著超越了Llama-3.2-3B和Qwen2.5-3B等同类开源模型。Sm...
彻底戳穿AI「失忆症」!超越OpenAI全局记忆,中国队开源LLM记忆操作系统
大语言模型在长期知识管理与个性化演进方面存在本质缺陷,主要表现为难以平衡效率、可追溯性与长期适应性。记忆张量团队联合多家顶尖机构研发的MemOS框架,通...
人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破
大语言模型(LLM)的生成能力虽然强大,但其输出是否符合人类偏好需要依赖奖励模型(Reward Model, RM)的精准评判。奖励模型在大模型训练中扮演着关键角色,...
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
最近,来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员提出了一种名为「拖拽式大语言模型」(DnD)的创新方法,能够基于提示词快速生成模型参数...
AI圈纷纷传阅,Andrej Karpathy 的最新演讲全文来了
Andrej Karpathy在首届YC AI创业学校的演讲中,深入探讨了人工智能时代软件的变革及其对未来编程范式的影响。他提出,软件正在经历第三次革命,即“软件3.0”,...
一次集成,减少 80% 适配工作!从 0 到 1 开发一款 MCP Server 难不难?
Base44的8000万美元收购案例展现了小型技术团队在AI领域的巨大潜力,仅用8名员工和180天就完成了从开发到退出的全过程。这一成功案例打破了硅谷传统创业模式...
TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨
在大语言模型(LLMs)竞争日益激烈的背景下,推理能力成为评估模型性能的关键指标。测试时缩放(TTS)作为一种新兴策略,通过优化推理过程(如多数投票、蒙特...
DeepSeek之后,每一家公司都是Agent
以DeepSeek-R1为代表的大型语言模型,在推理方面展现了巨大的进步,这种进步对企业和个人而言是一个重要的发展机遇。尽管这些模型功能强大,但也存在一定的问...
Sam Altman:用户要求,永远别更新GPT-4.5
OpenAI最新发布的GPT-4.5模型在用户群体中引发强烈反响,其核心突破点聚焦于情感智能与自然对话能力的显著提升。该模型首次出现用户主动要求承诺永久保留特定...
大语言模型系统评估新框架:微观指标构建方法论
大语言模型(LLM)的系统化评估面临独特挑战,需通过微观指标体系的构建实现持续优化。将LLM视为系统组件而非独立存在,其性能需结合实时监控、防护机制与业...




