标签:开源模型
开源和闭源模型的差距在拉大:这是 DeepSeek 论文揭示的残酷真相
DeepSeek近期发布的V3.2技术报告揭示了一个关键趋势:开源与闭源大模型的性能差距正在扩大而非缩小。基于大量实测数据,报告明确指出,尽管开源社区持续进步...
Flux 2开源即结束:阿里通义Z-Image用6B参数,实现超高性能和生图速度,荣登开源榜首
阿里通义实验室最新开源的Z-Image模型在图像生成领域实现了重大突破,以仅6B参数的轻量级设计挑战了传统大模型的性能极限。该模型采用创新的单流扩散Transfor...
我MiniMax,用实习生处理数据,照样屠榜开源大模型
MiniMax M2开源大模型凭借其独特的技术路径和出色的实际表现成为社区焦点。该模型在香港大学AI-Trader模拟A股大赛中以10万本金20天盈利近3000元的成绩夺冠,...
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
北京智源人工智能研究院最新发布的悟界·Emu3.5标志着开源原生多模态世界模型的重大突破。该模型以34B参数量实现图、文、视频任务的统一处理,其核心突破在于...
DeepSeek 团队真是鬼才啊。
DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...
打败 Qwen2.5-VL,完全开源可复现LLaVA-OneVision-1.5 的多模态模型
LLaVA(大型语言与视觉助手)的发展历程展现了开源社区在多模态模型领域的突破性进展。从2023年4月首次提出视觉指令微调方法,到2024年8月推出功能全面的LLaV...
蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌
蚂蚁集团近期密集开源多款大模型,其中万亿级思考模型Ring-1T的发布尤为引人注目。该模型在多项高难度基准测试中展现出与闭源巨头正面对话的实力,成为开源体...
现在全世界最好的开源模型,是 Kimi、DeepSeek 和 Qwen
Kimi K2 作为中国开源模型的最新代表,在全球范围内引发了广泛关注和讨论。Anthropic 的联合创始人 Jack Clark 公开称赞 K2 为“伟大的模型”,并将其视为中国...
OpenAI推迟开源大模型发布
OpenAI联合创始人兼首席执行官Sam Altman在官网宣布,原计划本周发布的开源模型将推迟发布,主要原因是需要进行更多的安全测试和审查高风险领域。Sam Altman...
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
Hugging Face最新推出的30亿参数模型SmolLM3,以其全面开源和卓越性能成为小模型领域的标杆。该模型支持128k长上下文处理,并在多语言任务中展现出色表现,同...



