AIGC动态
AIGC,AGI,人工智能
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...
火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持
火山引擎近期发布的AI一体机-DeepSeek版旨在帮助企业解决大模型应用落地的核心难题。该产品通过软硬件协同优化和全链路能力覆盖,支持DeepSeek R1/V3全系列模...
一文看懂DeepSeek开源第四弹,梁文锋亲自下场开发
DeepSeek在OpenSourceWeek期间开源了DualPipe和EPLB两项关键技术,为解决大模型训练中存在的资源浪费与效率瓶颈提供了创新方案。DualPipe通过双向并行处理机...
DeepSeek开源打碎了谁的饭碗
DeepSeek的开源策略正在重塑中国AI产业生态,中腰部AI应用公司、芯片企业和硬件厂商成为首批受益者。53AI创始人杨芳贤透露,其半数存量客户已将基座模型切换...
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
Inception Labs推出了首个商业级扩散大型语言模型Mercury,标志着Transformer与扩散模型的融合进入实际应用阶段。该模型在英伟达H100上实现每秒超过1000个tok...
没想到,我轻松干预了 DeepSeek 的搜索结果
当用户向DeepSeek提出「好用的AI耳机」查询时,系统通过分析50个网页并整合3个核心文献形成答案,其中两个文献均为作者本人撰写的极客公园文章。这篇探讨AI翻...
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类
斯坦福和普林斯顿研究团队开发的KernelBench框架揭示了大型语言模型在生成优化CUDA内核方面的潜力与局限。DeepSeek-R1在自动生成GPU内核任务中超越OpenAI o1...
推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025年1月20日发布的Kimi k1.5因实现多模态推理性能引发关注,但一个月后技术博主Yue Wu公开质疑其核心算法SPPO借鉴了自己2024年5月提出的研究成果。这场争议...
黄仁勋:感谢DeepSeek!英伟达财报破纪录,Blackwell开卖血赚800亿老黄笑疯
英伟达2025财年第四季度及全年财报表现远超市场预期,创下多项历史纪录。第四季度营收达393亿美元,同比增长78%,环比增长12%;全年营收突破1305亿美元,同比...
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...






