大模型

LLM,VLM,模型

一种观点:如何解构 NVidia 的体系?如何取代 Nvidia?

在NVidia股价创纪录的背景下,文章深入探讨了NVidia在芯片产品竞争中的成功之道。文章指出,NVidia的胜利并非依靠单一技术或产品,而是构建了一个以CPU+GPU为...

Anthropic公开Claude 3,像人类一样特殊性格训练方法

Anthropic在其最新大模型Claude 3中引入了一种个性化性格训练方法。该方法名为“Constitutional AI: Harmlessness from AI Feedback”,其核心在于在确保输出安...

腾讯:终于补齐了Muse系列数字人开源框架,感谢阿里!

腾讯音乐娱乐的Lyra Lab团队开发了一个名为Muse的开源系列项目,致力于虚拟人类的生成。其中的最后一个模块MusePose,已于5月27日正式发布,标志着Muse系列数...

张亚勤:Transformer五年内会被逐步重构,15-20年内实现AGI | 清华AIR无锡创新中心成立

在未来的人工智能领域,预计将会有重大的技术突破和重构。张亚勤院士在“太湖对话:人工智能+”论坛上预测,未来5年内,Transformer等当前主流的AI技术架构将被...

329篇图像、视频生成论文,今年CVPR最火的研究主题是这些

计算机视觉和模式识别会议(CVPR)2024年的录用结果显示,共有2719篇论文被接收,录用率为23.6%。当前计算机视觉领域的研究热点分布广泛,涵盖36个主题领域,...

开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危

在人工智能领域,开源大模型Qwen2的亮相引起了广泛关注。这款由阿里巴巴推出的模型在性能上全面超越了同为开源标杆的Llama 3,仅在发布两小时后便登顶Hugging...

原作者带队,LSTM卷土重来之Vision-LSTM出世

近期,由 LSTM之父Sepp Hochreiter领衔的研究团队推出了一种新的计算机视觉骨干网络——Vision-LSTM(ViL)。该网络基于扩展长短期记忆(xLSTM)模型,实现了在...

奥特曼百万年薪挖角谷歌TPU人才,欲砸7万亿实现「芯片自由」?OpenAI自研芯片最新进展曝光

OpenAI在芯片领域的野心日渐显现,其计划扩展芯片研发团队,并从谷歌TPU团队招募顶尖人才。这一举措的背后,反映了全球AI芯片需求激增,以及现有芯片制造商产...

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

北大、UC伯克利和斯坦福的研究人员针对大型语言模型(LLM)在推理任务上的不足,提出了一种名为“思维缓冲区”(Buffer of Thoughts,简称BoT)的新方法。该方...

4000人团队每月发10亿工资!比亚迪豁出去了!

在2023年的业绩发布会上,比亚迪董事长王传福公开质疑自动驾驶的价值,将其比喻为“皇帝的新装”,私下却投入大量资源于自动驾驶研发。据透露,比亚迪的智驾部...
1 567 568 569 570 571 780