AI大模型

强化学习之父 Rich Sutton 最新演讲：用「去中心化神经网络」应对深度学习局限性

在第六届国际分布式人工智能会议上，现代强化学习奠基人Richard S. Sutton教授提出了深度学习面临的挑战，包括灾难性遗忘、可塑性丧失和模型坍塌等现象，这些...

AI-Agent

2年前 (2024)

英伟达计划在2025年上半年推出专为人形机器人设计的紧凑型计算平台Jetson Thor，标志着公司将重点转移到机器人技术的发展上。英伟达的机器人战略已发展多年，...

AIGC动态

2年前 (2024)

亚太地区企业领导者普遍认为人工智能（AI）已深入融入日常并迅速重塑行业。预计到2025年，亚太地区将成为全球AI创新的领导者。然而，企业在AI转型过程中面临...

AIGC动态

2年前 (2024)

国家发改委新设低空经济发展司，旨在推动低空经济发展战略和规划，对中国飞行机器人、AI机器人产业提供支持和引导。低空经济、AI和机器人产业规模已达千亿规...

AIGC动态

2年前 (2024)

近期，大模型领域出现了两个引人注目的焦点：DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列，包含从0.5B到72B参数的多个版本，覆盖...

AIGC动态

2年前 (2024)

OpenAI的高级研究科学家Andrej Karpathy分享了中国开源大模型DeepSeek-v3的显著成就。该模型以其高效的训练效率和低成本而受到关注，仅用280万小时的GPU算力...

AIGC动态

2年前 (2024)

谷歌CEO劈柴在年度战略会议上强调，2025年将是AI领域的关键一年，谷歌必须加快步伐以应对颠覆性时刻的挑战。谷歌与微软OpenAI的竞争日益激烈，谷歌在追赶Chat...

AIGC动态

2年前 (2024)

近期，DeepSeek V3成为大模型圈的热门话题，但其存在一个bug，即在缺少问号的情况下，DeepSeek V3会错误地自称为ChatGPT。尽管有人怀疑DeepSeek V3可能基于Ch...

AIGC动态

2年前 (2024)

吴恩达最近推出了`aisuite`，这是一个旨在为流行的大型语言模型（LLM）提供统一API的平台，类似于OpenAI的API。这个工具的目的是简化在同一个应用程序中使用...

AIGC动态

2年前 (2024)

最近，一项名为“noise_step”的新技术由Will小哥提出，该技术允许模型在1.58-bit低精度下直接训练，无需反向传播或动量加速，从而大幅降低算力和存储消耗。这...

AIGC动态

2年前 (2024)