AIGC动态

OpenAI怀疑DeepSeek使用其模型，蒸馏R1

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手，违反服务条款。大模型蒸馏是行业普遍训练方法，将知识从复杂教师模型转移到简单学生模型。教师模...

AIGC动态

1年前 (2025)

DeeSeek R1的问世在硅谷引起了巨大震动，其技术突破得到了奥特曼和OpenAI首席研究官Mark Chen的认可。DeeSeek R1以其低成本和高性能的特点，挑战了硅谷对AI的...

AIGC动态

1年前 (2025)

Heyboss AI公司推出了世界首个“0代码”AI工程师工具Heyboss，这一工具的诞生标志着非编码人员也能轻松开发应用程序。Heyboss允许用户通过简单的一句话指令，在...

AIGC动态

1年前 (2025)

阿里云首次作为春晚的云计算和AI独家服务商，在北京和杭州设立项目作战室，并在春晚现场安排工程师支持节目制作。技术支持包括云转播技术让全球华人云上看春...

AIGC动态

1年前 (2025)

英伟达近期面临新的竞争压力，源自DeepSeek-V3技术的最新进展。DeepSeek-V3通过深度优化，硬件效率显著超越Meta等竞争对手，主要得益于其从头开始重建的策略...

AIGC动态

1年前 (2025)

DeepSeek的横空出世在中国春节前给美国的应用商店、科技公司乃至股市带来了巨大冲击。这款应用不仅在中美两地App Store免费榜上登顶，还导致英伟达股价暴跌近...

AIGC动态

1年前 (2025)

阿里通义Qwen发布了新春节礼Qwen2.5-Max，这是一个超大规模的MoE模型，经过超过20万亿token的预训练数据和SFT+RLHF后训练方案的训练。在多个基准测试中，Qwen...

AIGC动态

1年前 (2025)

春节作为中国传统节日，已成为互联网产品实现用户破圈的重要时刻。2015年春晚“摇一摇”使微信支付用户激增，2016年支付宝“集五福”普及数字支付，2018年抖音通...

AIGC动态

1年前 (2025)

中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在新论文《Distillation Quantification for Large Language Models》中探讨了大型语言模型（LL...

AIGC动态

1年前 (2025)

近期，AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引，这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能，引发了市场对AI硬件需求...

AIGC动态

1年前 (2025)