大模型

LLM,VLM,模型

AI算力支出超140亿,DeepSeek遭遇美国OpenAI新模型围剿|钛媒体AGI

美国OpenAI公司近期发布了AI推理模型o3-mini,以回应中国AI模型DeepSeek引发的全球讨论热潮。o3-mini在ChatGPT和API服务中推出,性能响应速度比前代o1-mini提...

台积电硅光平台,深度揭秘!

随着云计算和人工智能需求的增长,数据中心和高性能计算系统的数据流量急剧增加,传统的铜基电气互连已无法满足需求,硅光子技术因其可扩展性、传输带宽、能...

DeepSeek点燃国产大模型斗志,RAG等核心技术被重估

东方的AI技术正在崛起,特别是中国的大模型技术在全球范围内引起了广泛关注。DeepSeek-R1作为一匹黑马,不仅在硅谷产生了震撼,还促使微软、亚马逊等云服务厂...

硅谷巨头要学会接受一个事实:「DeepSeek 现象」只是中国 AI 崛起的开始

2025年春节,DeepSeek的V3与R1成为AI领域的焦点,其技术创新和开源模式对全球AI格局产生深远影响。DeepSeek V3参数规模达6710亿,训练成本和时长远低于GPT-4o...

硅基流动上线DeepSeek R1&V3推理服务!和华为云合作,全国产服务

硅基流动与华为云团队合作,成功在国内推出了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1模型推理服务,作为春节礼物献给国内用户。这两款模型的推出得...

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎,但本地部署可以提供更个性化的服...

DeepSeek+华为芯片!“卷王”硅基流动交出DeepSeek推理国产方案,持平英伟达们

DeepSeek在全球AI市场迅速崛起,上线18天下载量达1600万次,成为140个市场下载量最高的应用。作为首个支持联网的开源推理模型,DeepSeek以免费策略吸引用户,...

为什么说DeepSeek的R1-Zero比R1更值得关注?

DeepSeek发布的R1-Zero和R1两个模型在ARC-AGI-1上的得分与OpenAI的o1系统低计算量版本相当,显示出纯LLM scaling的局限性。R1-Zero特别值得关注,因为它完全...

o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

OpenAI的最新模型o3-mini在AI领域取得了显著进展,其性能在多个基准测试中超越了DeepSeek R1。o3-mini在数学代码基准测试中取得了最高成绩,并在物理模拟挑战...

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025年初,中国团队DeepSeek在全球AI领域引起广泛关注,他们仅用2048张H800 GPU在两个月内训练出一个与全球顶尖水平相媲美的AI模型,这一成就不仅挑战了英伟...
1 130 131 132 133 134 592