标签：算法改进

比人类专家快2倍，斯坦福联合英伟达发布TTT-Discover：用「测试时强化学习」攻克科学难题

在技术快速发展的背景下，如何利用人工智能发现科学问题的新最优解成为业界关注的焦点。传统的「测试时搜索」方法依赖冻结的大语言模型（LLM）通过多次尝试改...

AIGC动态

2个月前

强化学习之父Richard Sutton给出一个简单思路，大幅增强所有RL算法

阿尔伯塔大学教授Richard Sutton及其团队提出了一种名为“奖励聚中”（Reward Centering）的新型强化学习思想，旨在改进现有强化学习方法。该思想通过从奖励中...

AIGC动态

1年前 (2024)

清华姚班本科生连发两作，十年来最大改进：矩阵乘法接近理论最优

通过消除「隐藏的低效」问题，计算机科学家提出了一种比以往更快的大型矩阵相乘新方法。这一进展是在矩阵乘法领域中的重要突破，矩阵乘法不仅是高性能计算中...

AIGC动态

2年前 (2024)