AIGC动态

AIGC,AGI,人工智能

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散模型在推理任务中的表现正逐渐受到关注,尤其是通过强化学习(RL)方法的应用。传统上,自回归大语言模型(LLM)在推理任务中占据主导地位,但离散扩散大...

微软上线两款新模型:增强RAG和AI Agent

微软在Azure AI Foundry上线了Cohere的Embed 4和Command A两款新模型,旨在增强RAG(检索增强生成)和AI Agent的功能。Embed 4是一款多模态嵌入模型,支持超...

AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据

德州大学奥斯汀分校的研究团队通过结合Transformer和离线强化学习技术,成功训练出一个能够在宝可梦对战中表现出色的AI智能体。该智能体完全依赖于人类历史对...

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

OpenAI最新发布的o3和o4-mini模型在编码能力上取得了显著进步,甚至在全球人类选手中位列TOP 200。然而,这些模型在生成内容时存在严重的幻觉问题,o3的幻觉...

抖音公开了他们的推荐算法原理,强烈推荐一读

抖音最近公开了其推荐算法的逻辑,揭示了如何通过机器学习预测用户行为,并实现高效的信息匹配。推荐算法的本质是一个信息过滤系统,通过分析用户的历史行为...

从数据孤岛到全链协同,这份白皮书带你走出半导体供应链困局

近年来,全球半导体市场面临多重挑战,包括晶圆厂产能紧张、车规级MCU断供等问题,导致部分车企被迫停产。供应链中断和数据孤岛成为企业发展的主要障碍,迫使...

清华张亚勤:10年后,机器人将可能比人都多

张亚勤在其新书《智能涌现》中,基于对AI技术的长期思考与实践,提出了对未来技术演进方向的深刻预判。他指出,未来10年内,机器人将逐渐进入工厂、社会,并...

DRAM“危机”

在AI技术迅猛发展的背景下,大模型规模的指数级增长对计算资源提出了前所未有的挑战,尤其是存储带宽的限制,成为了制约高性能计算的关键瓶颈。过去几十年中...

官方出品!OpenAI教你用Agent SDK,10分钟开发智能体

OpenAI发布了首个Agent官方开发指南,旨在帮助开发者通过其SDK快速开发智能体。该指南详细介绍了从大模型选择、工具定义、复杂智能体构建到安全护栏等所有开...

近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结

在20世纪80年代末,数学家Noga Alon和Peter Sarnak就扩展图的性质展开了一场赌局。扩展图是一种边数较少但高度连通的图,广泛应用于大脑建模、统计分析和纠错...
1 30 31 32 33 34 858