“机器之心”的搜索结果
昨晚的「云计算春晚」,大模型、芯片连发,比OpenAI、谷歌上新都猛
亚马逊云科技在re:Invent大会上展示了其在生成式AI领域的最新进展,推出了性能卓越的Nova系列大模型和算力服务,并对Amazon Bedrock进行...
被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事
AI研究者Andrej Karpathy最近在推特上分享了注意力机制背后的故事,揭示了这一概念的起源和发展。他指出,Dzmitry Bahdanau、Kyunghyun ...
VBench直接干到了第一!这一次,视频生成「压番」全场的是家央企
中国电信人工智能研究院(TeleAI)发布了一款视频生成大模型,展示了中国电信在AI领域与科技巨头竞争的决心。该模型在VBench评测框架中...
扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观
扩散模型与最优传输之间的关系一直是一个复杂且引人入胜的研究领域。在2022年,博科尼大学的Hugo Lavenant和里昂第一大学的Filippo Sant...
DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了
Google DeepMind 的研究团队提出了一种名为“苏格拉底式学习”的人工智能自我完善新方法,该方法通过结构化的“语言游戏”实现AI系统的递归...
美欧亚三洲开发者联手,全球首个组团训练的大模型来了,全流程开源
Prime Intellect在11月22日宣布完成了一个10B参数规模的模型INTELLECT-1的训练,并通过去中心化的方式开源了所有相关资源,包括基础模型...
ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星
在ICLR 2025会议上,张吕敏的新作IC-Light论文获得了四位审稿人一致的满分评价,成为罕见的高分论文。IC-Light是一个基于扩散模型的照明...
Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿
AI领域学者Andrej Karpathy对当前人工智能对话模型的“智能”成分提出了质疑。他认为,人工智能实际上是通过模仿人工标注数据进行训练的语...
三名高中生,为近百年的分形定理带来了新证明
三位高中生Niko Voth、Joshua Broden和Noah Nazareth在多伦多大学数学家Malors Espinosa的指导下,证明了一条关于扭结和分形的新定理。...
流式深度学习终于奏效了!强化学习之父Richard Sutton力荐
阿尔伯塔大学等机构的研究者提出了一种名为stream-x的深度强化学习算法,旨在解决流式深度强化学习中的样本效率问题,即流式障碍。流式...