标签:开源模型

DeepSeek开源打碎了谁的饭碗

DeepSeek的开源策略正在重塑中国AI产业生态,中腰部AI应用公司、芯片企业和硬件厂商成为首批受益者。53AI创始人杨芳贤透露,其半数存量客户已将基座模型切换...

国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型

Huggingface平台最新数据显示,中国开源大模型DeepSeek-R1以超过1万点赞量和1000万次下载量,成为该平台有史以来最受欢迎的开源模型。这一成绩仅用数周时间便...

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

阶跃星辰与清华大学联合发布的Open Reasoner Zero(ORZ)模型在强化学习训练方法上取得突破性进展。该研究采用极简主义方法,仅使用带有GAE的原版PPO算法和基...

一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI

阶跃星辰与吉利汽车集团联合宣布开源两款多模态大模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互模型Step-Audio。Step-...

百度决定背叛闭源大模型,李彦宏重新拥抱开源

百度宣布将于2024年6月30日起逐步开源文心大模型4.5系列,标志着其战略从闭源收费向开源开放的转变。这一决策发生在DeepSeek引发行业冲击的背景下,距离百度...

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B,其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据(相...

淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1

淘宝和拼多多等平台上出现大量倒卖DeepSeek模型资源的商家,将本可免费获取的安装包、教程等资料以10-100元不等的价格出售,部分商品成交量达上千单。这种现...

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

一种名为Huginn的新型开源推理大模型架构通过在连续高维潜空间中直接操作隐藏状态,突破了传统长思维链推理范式的限制。该模型由马克思普朗克研究所和马里兰...

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

DeepSeek-R1模型的开源引发了全球技术社区对模型复现的热潮,其中Hugging Face主导的Open R1项目成为焦点。该项目通过公开训练代码、评估工具和合成数据集,...

2月15日,探讨DeepSeek开源模型引发的AI最新趋势!蒸馏经验/开源生态/工程能力提升|嘉程创业流水席第249期

DeepSeek开源模型通过技术创新与生态合作,正在重塑AI行业格局。其核心突破源于2024年12月发布的DeepSeek-V3版本,创新性融合FP8运算、MLA注意力机制与MoE架...
1 2 3 4 5 6