标签:开源模型

我MiniMax,用实习生处理数据,照样屠榜开源大模型

MiniMax M2开源大模型凭借其独特的技术路径和出色的实际表现成为社区焦点。该模型在香港大学AI-Trader模拟A股大赛中以10万本金20天盈利近3000元的成绩夺冠,...

世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

北京智源人工智能研究院最新发布的悟界·Emu3.5标志着开源原生多模态世界模型的重大突破。该模型以34B参数量实现图、文、视频任务的统一处理,其核心突破在于...

DeepSeek 团队真是鬼才啊。

DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...

打败 Qwen2.5-VL,完全开源可复现LLaVA-OneVision-1.5 的多模态模型

LLaVA(大型语言与视觉助手)的发展历程展现了开源社区在多模态模型领域的突破性进展。从2023年4月首次提出视觉指令微调方法,到2024年8月推出功能全面的LLaV...

蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

蚂蚁集团近期密集开源多款大模型,其中万亿级思考模型Ring-1T的发布尤为引人注目。该模型在多项高难度基准测试中展现出与闭源巨头正面对话的实力,成为开源体...

现在全世界最好的开源模型,是 Kimi、DeepSeek 和 Qwen

Kimi K2 作为中国开源模型的最新代表,在全球范围内引发了广泛关注和讨论。Anthropic 的联合创始人 Jack Clark 公开称赞 K2 为“伟大的模型”,并将其视为中国...

OpenAI推迟开源大模型发布

OpenAI联合创始人兼首席执行官Sam Altman在官网宣布,原计划本周发布的开源模型将推迟发布,主要原因是需要进行更多的安全测试和审查高风险领域。Sam Altman...

最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文

Hugging Face最新推出的30亿参数模型SmolLM3,以其全面开源和卓越性能成为小模型领域的标杆。该模型支持128k长上下文处理,并在多语言任务中展现出色表现,同...

DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨

全球著名开源大模型平台DeepSeek发布了其最新开源模型V3的论文,重点探讨了在不牺牲性能的前提下,如何通过硬件架构和模型设计的创新突破硬件瓶颈。随着OpenA...

阿里通义 Qwen3 上线 ,开源大军再添一名猛将

阿里新一代通义千问开源模型 Qwen3 于4月29日正式上线,用户可通过通义App和网页版体验其强大的智能能力。Qwen3 包含8款不同尺寸的模型,均为全新的“混合推理...
1 2 3 5