大模型
LLM,VLM,模型
我问deepseek,为啥中科院干不出来一个deepseek?它说:专家们在讨论必要性,而他却抵押了房产开干
中科院未能推出类似DeepSeek的突破性人工智能产品,原因涉及科技创新体制、资源配置、激励机制等多方面因素。其问题可从目标定位、资源配置、人才激励、创新...
网上关于DeepSeek的说法,哪些是错误的?
DeepSeek近期通过采用PTX编程优化了跨芯片通信能力,但这并不意味着它绕过了NVIDIA CUDA生态。PTX是CUDA编程模型的一部分,DeepSeek直接使用PTX编写程序,虽...
清华、东大等发布EMAGE,音频自动生成动作丰富的视频
研究人员联合开发了EMAGE模型,这是一种能够根据音频自动生成全身动作、面部表情和手势的创新工具。其主要功能是生成连贯且逼真的共语手势视频,适用于数字人...
DeepSeek无问西东!先行者早已趟平全国产之路
DeepSeek的迅速走红推动了国产AI产业的全面动员,其影响主要体现在平台层、算力层和应用层。在平台层,华为云、阿里云等云厂商快速接入相关服务,提供性能相...
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
通过蒸馏技术,研究团队成功训练出一个性能可媲美DeepSeek-R1和OpenAI o1的推理模型s1,其成本不到150元人民币。这一成果由李飞飞、斯坦福大学、华盛顿大学及...
李飞飞团队50美元训练出DeepSeek R1?
近期,一则关于“50美元蒸馏出DeepSeek R1模型”的新闻引发了广泛关注,甚至被认为对OpenAI和英伟达造成了巨大冲击。然而,深入研究相关论文后发现,这种说法存...
百度点亮自研万卡集群,大模型应用拐点加速到来
DeepSeek是一款以较少GPU芯片和低成本实现高性能的国产大模型,其迅速获得包括百度在内的主流云厂商支持。2月3日,百度智能云千帆平台正式上线DeepSeek-R1和D...
DeepSeek辟谣:任何非官方账号、个人账号发布的信息均不代表公司观点|钛媒体AGI
DeepSeek近期针对仿冒账号和不实信息的传播发布了官方声明,明确指出与DeepSeek有关的信息应以官方账号发布为准,并提醒公众注意甄别。官方账号仅限于微信公...
SemiAnalysis万字解析DeepSeek:训练成本、技术创新点、以及对封闭模型的影响
Semianalysis的分析报告对DeepSeek进行了全面分析,揭示了其在AI领域的多项关键成就和战略布局。报告指出,DeepSeek拥有约5万块Hopper GPU,总投资超过5亿美...
a16z发布2025 AI语音图谱:语音将成为与AI交互的主要模式
语音AI技术的发展正从基础设施层向应用层过渡,为企业和消费者带来革命性的改变。企业通过AI技术替代人工,实现成本效益、速度和可靠性的提升,同时打破传统...