标签:大模型

Karpathy强推,大厂抢着「复古」命令行,Star数全都上千了

近期飞书、钉钉与企业微信在短时间内相继推出 CLI 工具,引发了企业软件对交互模式的新一轮思考,预示着 AI 生态格局面临深刻重塑。命令行界面在此刻的价值体...

Karpathy知识库「LLM Wiki」火爆了,全网围观讨论

系统架构被清晰划分为底层原始数据源、中间生成的维基文档集以及顶层控制工作流的指令规范这三类层级。原始的素材文件始终保持固定以确保真实性,而核心文档...

“AI预测未来”!碾压马斯克Grok-4!国产 AI登顶全球

新式评测摒弃了开放书籍模式,转而每日实时更新来自 195 个全球信源的未知考题。为了消除偶然性导致的虚假繁荣,系统采用了高度差异化的分值结构,其中考查高...

大模型SFT后效果≠RL潜力!港科大、阿里提出自适应冷启动新范式

近年来,强化学习逐步确立为大语言模型后训练的核心领域。虽然有大量实证表明该路径能有效激发模型的复杂推理能力,但在实际操作中直接把普通模型投入使用极...

阿里3天3王炸!全模态、精准控图和智能体编程SOTA,但没开源

阿里巴巴在近三天的时间跨度里密集发布三款战略级人工智能模型,确立了在大模型技术与行业应用中的前沿地位。此次亮相的核心产品涵盖通义千问全域版本、万相...

顶级模型得分低于1%:ARC-AGI-3全新人机较量,揭开智能体真实水平

本文围绕ARC-AGI-3基准测试的发布及其在衡量通用人工智能真实能力方面的作用展开。当前大语言模型虽能在代码编写、考试应答等任务中表现出色,但其“智能”常源...

CLI复兴!命令行搞定一切,大厂纷纷下场

在AI Agent时代,命令行界面(CLI)正迅速崛起为智能体的主流交互语言。这一转变源于图形用户界面(GUI)对AI Agent的效率制约——GUI依赖视觉识别与模拟操作,...

Meta超智能体开源:任意可计算任务中,能自我改进实现无尽演化

DGM-Hyperagents(DGM-H)提出了一种突破性架构,使AI系统首次实现对自身改进机制的动态优化。该系统将任务执行模块与元智能体整合于同一可编辑程序中,支持...

独家丨华为云新加坡总经理胡维琦将加入MiniMax,或向贠烨祎汇报

MiniMax近期迎来关键人事调整,原华为云中国区副总裁、现华为云新加坡总经理胡维琦即将加盟,预计在2026年春节前完成入职。该人事变动被视为公司强化海外业务...

准确率轻松翻倍!不烧钱微调,AI靠“写日记”实现能力跃升

该系统提出一种无需微调模型参数的智能体自我进化新范式——Memento-Skills,核心在于构建一个动态演进的外部技能库,通过读写反思与“写日记”式学习实现持续能...
1 2 3 79