大模型
LLM,VLM,模型
30分钟让AI Agent自我觉醒,创新智能体框架–AI2T
随着AI Agent的快速发展,其在代码开发、教育、电商等领域的应用日益广泛,尤其是在教育领域,AI Agent已成为教学的重要工具。然而,传统智能体的开发通常需...
GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板
近来,GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力,引发了关于多模态大模型(MLLMs)创造力天花板的讨论。现有的评测基准难...
中文海报设计,赛道一夜颠覆
豆包AI的文生图功能近期进行了显著升级,主要体现在四个方面:标题大字准确度提升至94%,小字生成能力也有所增强;语义理解和影视质感得到优化,镜头更具叙事...
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
DeepSeek与清华大学的研究人员提出了一种名为自我原则批评调整(SPCT)的新方法,旨在提升通用奖励模型(GRM)在推理阶段的可扩展性。该方法通过结合拒绝式微...
最强中文AI绘图模型即梦3.0上线,设计师们又一次emo了。
即梦3.0绘图模型的发布在AI绘图领域引起了巨大反响,尤其是在中文生成方面取得了显著突破。即梦3.0不仅在大字的准确性、设计感和丰富度上达到了新的高度,还...
Cursor劲敌来了
Augment Code 最新发布的 Augment Agent 是一款专为大型项目程序员设计的 AI 编程助手,旨在提升开发效率和代码质量。Augment Code 由前微软高级软件开发工程...
思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
Anthropic 的最新研究揭示了大型语言模型在思维链推理中的不可靠性,尤其是在其忠诚度方面。尽管这些模型在表面上展示出复杂的推理过程,但研究结果表明,它...
末日时间表来了!前OpenAI研究员76页硬核推演:2027年ASI接管世界,人类成NPC
前OpenAI研究员Daniel Kokotajlo领导的团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来。报告预测,从2025年最贵AI诞生,到2027年自我进化的Agen...
独家 | 原商汤 VP 沈徽加入京东,担任具身智能项目负责人
原商汤副总裁沈徽近日加入京东,担任具身智能项目负责人,这一消息引发了业界的广泛关注。沈徽在AI领域拥有丰富的技术背景和商业化经验,曾先后在微软和商汤...
语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%
百度最近为文小言接入了基于Cross-Attention的端到端语音语言大模型,实现了更自然、有情感的实时语音对话功能。这个全新的技术方案在用户体验上带来了显著提...