AI大模型

LLM,VLM,模型,VLA

超越Devin!姚班带队,他们创大模型编程新世界纪录

新入局的StarShip CodeGen Agent表现惊艳,以23.67%的成绩夺得全球第二的位置,这一成绩同时刷新了非GPT-4o基模的全球最高纪录。SWEBench评测被认为高度贴近...

英伟达最新GPU和互联路线图

Nvidia在计算、网络和图形发展史上占据独特地位,目前手握大量资金,并因其架构、工程和供应链优势在生成式人工智能市场处于领先。尽管起初Nvidia并无必要扩...

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

研究人员近日针对大型语言模型处理长文本的能力进行了深入探讨,并提出了名为RULER的新基准测试。该测试包含四大类共13项任务,旨在评估模型的“有效上下文”长...

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

近期,斯坦福大学一个AI团队发布的名为“Llama3V”的模型引发了业界广泛关注。该模型以500美元的低成本,号称能达到与GPT-4V、Gemini Ultra及Claude Opus相媲美...

LLM的「母语」是什么?

在探索多语言大型语言模型(LLM)的内部工作机制时,研究人员好奇这些模型是否真的将英语作为其内部处理语言。来自洛桑联邦理工学院的研究人员对Llama 2家族...

活体脑细胞做成16核芯片,用Python就能编程,9个机构开展实验36所大学排队

瑞士生物计算创业公司FinalSpark推出了首个由16核类人脑器官组成的生物处理器,其功耗仅为传统数字处理器的百万分之一。这些类脑器官能在系统中存活长达100天...

意外!老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦

在台北大学的体育场上,英伟达创始人黄仁勋以其个人的魅力和公司的技术创新,赢得了满场的欢呼声。他不仅在 COMPUTEX 前夜发布了新一代 GPU,而且还预告了英...

谷歌创新框架:从非结构化数据,实现多模态学习

在数据爆炸时代,大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习,特别是处理多种输入和异构数据时,深度神经网络易出现过拟合和泛化不...

麦肯锡:ChatGPT等生成式AI应用激增,大中华区增长最快

生成式人工智能(AI)技术的应用正在激增,并开始为企业创造价值。65%的受访者已在业务中使用生成式AI,相比2023年的33%有显著增长。特别在亚太地区和大中华...

首次解密Claude 3大脑!25岁Anthropic参谋长预言3年内自己将被AI淘汰

这位员工是一位25岁的参谋长,她表达了对于AI通用性增强模型Claude 3的担忧,因为它具备生成连贯内容的能力,可能威胁到她的写作工作。AI将很快取代人类。Ant...
1 789 790 791 792 793 994