大模型

LLM,VLM,模型

DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...

Ilya的神秘公司SSI估值将达200亿美元,5个月翻四倍,却没有任何产品

近期,前OpenAI联合创始人Ilya Sutskever的创业公司Safe Superintelligence Inc.(简称SSI)因正在洽谈200亿美元估值的新一轮融资而引发广泛关注。尽管SSI目...

DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页

随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...

关于 DeepSeek 的几点深度思考(推荐收藏)

---DeepSeek的崛起标志着全球AI领域权力天平的倾斜,中国大模型技术进入战略反攻阶段。 自2022年ChatGPT发布以来,中国在大模型领域经历了从战略防御到相持的...

DeepSeek为什么采用与主流大模型不一样的MoE架构?一文搞懂什么是MoE模型

混合专家模型(MoE)通过选择性激活子模型的方式显著提升计算效率,与传统Transformer架构形成鲜明对比。MoE模型每次计算仅激活5.5%的总参数量,而Qwen、LLam...

第四届终身学习智能体会议(CoLLAs)主题征稿中

CoLLAs 2025将关注持续学习领域的核心问题,推动人工智能系统在其生命周期中不断适应和进化。会议探讨的关键主题包括终身学习的理论研究、持续学习范式(如增...

「鲶鱼」DeepSeek 正在搅动上下游

DeepSeek的出现引发了AI领域的剧烈震荡,其低成本、高效能的大模型训练和推理方式推动了开源潮流,并给整个行业带来了深远影响。通过引入MoE架构和FP8混合精...

全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁

许主洪的加入标志着阿里在AI To C业务上的重要布局。作为一名IEEE Fellow和新加坡管理大学终身教授,他凭借深厚的学术积累与产业实践经验,将推动阿里的多模...

满血版DeepSeek-R1,五大平台白嫖攻略!

由于访问量激增和网络攻击,DeepSeek官网及其相关服务近期频繁出现不稳定状况,包括官网、APP和API在内的多项服务均受到不同程度的影响。作为替代方案,各大...

3秒变导演!DeepSeek生成AI视频堪比大片

利用AI生成高质量视频内容正在成为现实,填空式提问法为初学者提供了一种简单有效的入门方式。通过向AI工具如DeepSeek输入基础描述,并借助身份特征、环境氛...
1 120 121 122 123 124 590