大模型
LLM,VLM,模型
一种观点:如何解构 NVidia 的体系?如何取代 Nvidia?
在NVidia股价创纪录的背景下,文章深入探讨了NVidia在芯片产品竞争中的成功之道。文章指出,NVidia的胜利并非依靠单一技术或产品,而是构建了一个以CPU+GPU为...
Anthropic公开Claude 3,像人类一样特殊性格训练方法
Anthropic在其最新大模型Claude 3中引入了一种个性化性格训练方法。该方法名为“Constitutional AI: Harmlessness from AI Feedback”,其核心在于在确保输出安...
腾讯:终于补齐了Muse系列数字人开源框架,感谢阿里!
腾讯音乐娱乐的Lyra Lab团队开发了一个名为Muse的开源系列项目,致力于虚拟人类的生成。其中的最后一个模块MusePose,已于5月27日正式发布,标志着Muse系列数...
张亚勤:Transformer五年内会被逐步重构,15-20年内实现AGI | 清华AIR无锡创新中心成立
在未来的人工智能领域,预计将会有重大的技术突破和重构。张亚勤院士在“太湖对话:人工智能+”论坛上预测,未来5年内,Transformer等当前主流的AI技术架构将被...
329篇图像、视频生成论文,今年CVPR最火的研究主题是这些
计算机视觉和模式识别会议(CVPR)2024年的录用结果显示,共有2719篇论文被接收,录用率为23.6%。当前计算机视觉领域的研究热点分布广泛,涵盖36个主题领域,...
开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危
在人工智能领域,开源大模型Qwen2的亮相引起了广泛关注。这款由阿里巴巴推出的模型在性能上全面超越了同为开源标杆的Llama 3,仅在发布两小时后便登顶Hugging...
原作者带队,LSTM卷土重来之Vision-LSTM出世
近期,由 LSTM之父Sepp Hochreiter领衔的研究团队推出了一种新的计算机视觉骨干网络——Vision-LSTM(ViL)。该网络基于扩展长短期记忆(xLSTM)模型,实现了在...
奥特曼百万年薪挖角谷歌TPU人才,欲砸7万亿实现「芯片自由」?OpenAI自研芯片最新进展曝光
OpenAI在芯片领域的野心日渐显现,其计划扩展芯片研发团队,并从谷歌TPU团队招募顶尖人才。这一举措的背后,反映了全球AI芯片需求激增,以及现有芯片制造商产...
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神
北大、UC伯克利和斯坦福的研究人员针对大型语言模型(LLM)在推理任务上的不足,提出了一种名为“思维缓冲区”(Buffer of Thoughts,简称BoT)的新方法。该方...
4000人团队每月发10亿工资!比亚迪豁出去了!
在2023年的业绩发布会上,比亚迪董事长王传福公开质疑自动驾驶的价值,将其比喻为“皇帝的新装”,私下却投入大量资源于自动驾驶研发。据透露,比亚迪的智驾部...




