大模型
LLM,VLM,模型
AI算力支出超140亿,DeepSeek遭遇美国OpenAI新模型围剿|钛媒体AGI
美国OpenAI公司近期发布了AI推理模型o3-mini,以回应中国AI模型DeepSeek引发的全球讨论热潮。o3-mini在ChatGPT和API服务中推出,性能响应速度比前代o1-mini提...
台积电硅光平台,深度揭秘!
随着云计算和人工智能需求的增长,数据中心和高性能计算系统的数据流量急剧增加,传统的铜基电气互连已无法满足需求,硅光子技术因其可扩展性、传输带宽、能...
DeepSeek点燃国产大模型斗志,RAG等核心技术被重估
东方的AI技术正在崛起,特别是中国的大模型技术在全球范围内引起了广泛关注。DeepSeek-R1作为一匹黑马,不仅在硅谷产生了震撼,还促使微软、亚马逊等云服务厂...
硅谷巨头要学会接受一个事实:「DeepSeek 现象」只是中国 AI 崛起的开始
2025年春节,DeepSeek的V3与R1成为AI领域的焦点,其技术创新和开源模式对全球AI格局产生深远影响。DeepSeek V3参数规模达6710亿,训练成本和时长远低于GPT-4o...
硅基流动上线DeepSeek R1&V3推理服务!和华为云合作,全国产服务
硅基流动与华为云团队合作,成功在国内推出了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1模型推理服务,作为春节礼物献给国内用户。这两款模型的推出得...
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎,但本地部署可以提供更个性化的服...
DeepSeek+华为芯片!“卷王”硅基流动交出DeepSeek推理国产方案,持平英伟达们
DeepSeek在全球AI市场迅速崛起,上线18天下载量达1600万次,成为140个市场下载量最高的应用。作为首个支持联网的开源推理模型,DeepSeek以免费策略吸引用户,...
为什么说DeepSeek的R1-Zero比R1更值得关注?
DeepSeek发布的R1-Zero和R1两个模型在ARC-AGI-1上的得分与OpenAI的o1系统低计算量版本相当,显示出纯LLM scaling的局限性。R1-Zero特别值得关注,因为它完全...
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
OpenAI的最新模型o3-mini在AI领域取得了显著进展,其性能在多个基准测试中超越了DeepSeek R1。o3-mini在数学代码基准测试中取得了最高成绩,并在物理模拟挑战...
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
2025年初,中国团队DeepSeek在全球AI领域引起广泛关注,他们仅用2048张H800 GPU在两个月内训练出一个与全球顶尖水平相媲美的AI模型,这一成就不仅挑战了英伟...