AIGC动态

AIGC,AGI,人工智能

OpenAI怀疑DeepSeek使用其模型,蒸馏R1

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手,违反服务条款。大模型蒸馏是行业普遍训练方法,将知识从复杂教师模型转移到简单学生模型。教师模...

DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声

DeeSeek R1的问世在硅谷引起了巨大震动,其技术突破得到了奥特曼和OpenAI首席研究官Mark Chen的认可。DeeSeek R1以其低成本和高性能的特点,挑战了硅谷对AI的...

斯坦福女神辍学再创业,获OpenAI力挺!全球首个0代码AI工程师出世

Heyboss AI公司推出了世界首个“0代码”AI工程师工具Heyboss,这一工具的诞生标志着非编码人员也能轻松开发应用程序。Heyboss允许用户通过简单的一句话指令,在...

这届春晚开始拼技术了!AI大模型绝美定格、机器人扭秧歌,云使用量达历年之最

阿里云首次作为春晚的云计算和AI独家服务商,在北京和杭州设立项目作战室,并在春晚现场安排工程师支持节目制作。技术支持包括云转播技术让全球华人云上看春...

“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

英伟达近期面临新的竞争压力,源自DeepSeek-V3技术的最新进展。DeepSeek-V3通过深度优化,硬件效率显著超越Meta等竞争对手,主要得益于其从头开始重建的策略...

DeepSeek 的爆红,指出了当下 AI 最大困境

DeepSeek的横空出世在中国春节前给美国的应用商店、科技公司乃至股市带来了巨大冲击。这款应用不仅在中美两地App Store免费榜上登顶,还导致英伟达股价暴跌近...

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里通义Qwen发布了新春节礼Qwen2.5-Max,这是一个超大规模的MoE模型,经过超过20万亿token的预训练数据和SFT+RLHF后训练方案的训练。在多个基准测试中,Qwen...

大妈跳上“赛博广场舞”?AI迎来春节破圈时刻

春节作为中国传统节日,已成为互联网产品实现用户破圈的重要时刻。2015年春晚“摇一摇”使微信支付用户激增,2016年支付宝“集五福”普及数字支付,2018年抖音通...

原来,这些顶级大模型都是蒸馏的

中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在新论文《Distillation Quantification for Large Language Models》中探讨了大型语言模型(LL...

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求...
1 561 562 563 564 565 1,247