AI大模型

LLM,VLM,模型,VLA

强化学习之父 Rich Sutton 最新演讲:用「去中心化神经网络」应对深度学习局限性

在第六届国际分布式人工智能会议上,现代强化学习奠基人Richard S. Sutton教授提出了深度学习面临的挑战,包括灾难性遗忘、可塑性丧失和模型坍塌等现象,这些...

英伟达2025祭出「迷你大脑」,雷神「Thor」剑指千亿机器人市场!

英伟达计划在2025年上半年推出专为人形机器人设计的紧凑型计算平台Jetson Thor,标志着公司将重点转移到机器人技术的发展上。英伟达的机器人战略已发展多年,...

F5 预测:2025年亚太地区企业AI应用的五大趋势

亚太地区企业领导者普遍认为人工智能(AI)已深入融入日常并迅速重塑行业。预计到2025年,亚太地区将成为全球AI创新的领导者。然而,企业在AI转型过程中面临...

当 AI 遇上千亿“低空经济”,智能机器人产业将面临怎样的挑战与机遇?|钛媒体AGI

国家发改委新设低空经济发展司,旨在推动低空经济发展战略和规划,对中国飞行机器人、AI机器人产业提供支持和引导。低空经济、AI和机器人产业规模已达千亿规...

大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?

近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...

OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致!

OpenAI的高级研究科学家Andrej Karpathy分享了中国开源大模型DeepSeek-v3的显著成就。该模型以其高效的训练效率和低成本而受到关注,仅用280万小时的GPU算力...

谷歌劈柴立军令状:必斩OpenAI,夺回第一!

谷歌CEO劈柴在年度战略会议上强调,2025年将是AI领域的关键一年,谷歌必须加快步伐以应对颠覆性时刻的挑战。谷歌与微软OpenAI的竞争日益激烈,谷歌在追赶Chat...

DeepSeek V3“报错家门”:我是ChatGPT

近期,DeepSeek V3成为大模型圈的热门话题,但其存在一个bug,即在缺少问号的情况下,DeepSeek V3会错误地自称为ChatGPT。尽管有人怀疑DeepSeek V3可能基于Ch...

AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API

吴恩达最近推出了`aisuite`,这是一个旨在为流行的大型语言模型(LLM)提供统一API的平台,类似于OpenAI的API。这个工具的目的是简化在同一个应用程序中使用...

算力直降97%,GPT-3存储只用20MB?!这篇直接在1.58-bit下训练模型的新论文火了

最近,一项名为“noise_step”的新技术由Will小哥提出,该技术允许模型在1.58-bit低精度下直接训练,无需反向传播或动量加速,从而大幅降低算力和存储消耗。这...
1 555 556 557 558 559 987