AIGC动态

AIGC,AGI,人工智能

微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队

微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...

火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持

火山引擎近期发布的AI一体机-DeepSeek版旨在帮助企业解决大模型应用落地的核心难题。该产品通过软硬件协同优化和全链路能力覆盖,支持DeepSeek R1/V3全系列模...

一文看懂DeepSeek开源第四弹,梁文锋亲自下场开发

DeepSeek在OpenSourceWeek期间开源了DualPipe和EPLB两项关键技术,为解决大模型训练中存在的资源浪费与效率瓶颈提供了创新方案。DualPipe通过双向并行处理机...

DeepSeek开源打碎了谁的饭碗

DeepSeek的开源策略正在重塑中国AI产业生态,中腰部AI应用公司、芯片企业和硬件厂商成为首批受益者。53AI创始人杨芳贤透露,其半数存量客户已将基座模型切换...

不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

Inception Labs推出了首个商业级扩散大型语言模型Mercury,标志着Transformer与扩散模型的融合进入实际应用阶段。该模型在英伟达H100上实现每秒超过1000个tok...

没想到,我轻松干预了 DeepSeek 的搜索结果

当用户向DeepSeek提出「好用的AI耳机」查询时,系统通过分析50个网页并整合3个核心文献形成答案,其中两个文献均为作者本人撰写的极客公园文章。这篇探讨AI翻...

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿研究团队开发的KernelBench框架揭示了大型语言模型在生成优化CUDA内核方面的潜力与局限。DeepSeek-R1在自动生成GPU内核任务中超越OpenAI o1...

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

2025年1月20日发布的Kimi k1.5因实现多模态推理性能引发关注,但一个月后技术博主Yue Wu公开质疑其核心算法SPPO借鉴了自己2024年5月提出的研究成果。这场争议...

黄仁勋:感谢DeepSeek!英伟达财报破纪录,Blackwell开卖血赚800亿老黄笑疯

英伟达2025财年第四季度及全年财报表现远超市场预期,创下多项历史纪录。第四季度营收达393亿美元,同比增长78%,环比增长12%;全年营收突破1305亿美元,同比...

微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...
1 387 388 389 390 391 1,126