标签:开源模型

Mistral再开源!发布代码模型Devstral 2及原生CLI,但大公司被限制商用

Mistral AI近期发布了其新一代代码模型系列Devstral 2,包含123B参数的Devstral 2和24B参数的Devstral Small 2两个版本。这些模型可通过官方API免费使用,同...

美团开源LongCat-Image,6B参数挑战80B效果,中英双语理解、图像逼真度及复杂指令编辑新突破

美团开源了6B参数的图像模型LongCat-Image,该模型在双语文本理解、图像逼真度以及复杂指令编辑任务中展现出卓越性能。通过轻量化设计和深度优化架构,LongCa...

开源和闭源模型的差距在拉大:这是 DeepSeek 论文揭示的残酷真相

DeepSeek近期发布的V3.2技术报告揭示了一个关键趋势:开源与闭源大模型的性能差距正在扩大而非缩小。基于大量实测数据,报告明确指出,尽管开源社区持续进步...

Flux 2开源即结束:阿里通义Z-Image用6B参数,实现超高性能和生图速度,荣登开源榜首

阿里通义实验室最新开源的Z-Image模型在图像生成领域实现了重大突破,以仅6B参数的轻量级设计挑战了传统大模型的性能极限。该模型采用创新的单流扩散Transfor...

我MiniMax,用实习生处理数据,照样屠榜开源大模型

MiniMax M2开源大模型凭借其独特的技术路径和出色的实际表现成为社区焦点。该模型在香港大学AI-Trader模拟A股大赛中以10万本金20天盈利近3000元的成绩夺冠,...

世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

北京智源人工智能研究院最新发布的悟界·Emu3.5标志着开源原生多模态世界模型的重大突破。该模型以34B参数量实现图、文、视频任务的统一处理,其核心突破在于...

DeepSeek 团队真是鬼才啊。

DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...

打败 Qwen2.5-VL,完全开源可复现LLaVA-OneVision-1.5 的多模态模型

LLaVA(大型语言与视觉助手)的发展历程展现了开源社区在多模态模型领域的突破性进展。从2023年4月首次提出视觉指令微调方法,到2024年8月推出功能全面的LLaV...

蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

蚂蚁集团近期密集开源多款大模型,其中万亿级思考模型Ring-1T的发布尤为引人注目。该模型在多项高难度基准测试中展现出与闭源巨头正面对话的实力,成为开源体...

现在全世界最好的开源模型,是 Kimi、DeepSeek 和 Qwen

Kimi K2 作为中国开源模型的最新代表,在全球范围内引发了广泛关注和讨论。Anthropic 的联合创始人 Jack Clark 公开称赞 K2 为“伟大的模型”,并将其视为中国...
1 2 3 5