标签:模型

刚刚,Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型,标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型,支持超长上下文,并首次采用了混合专...

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

在训练细节方面,Meta采用了全新的训练技术MetaP,通过设置关键模型超参数,实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...

Meta推出Llama 4:MoE构架、原生多模态、10M上下文,没有发布推理模型

Meta 创始人兼首席执行官马克·扎克伯格宣布推出全新 Llama 4 系列模型,包括两款即时可用的模型——Llama 4 Maverick 和 Llama 4 Scout,以及一款仍在训练中的...

中文海报设计,赛道一夜颠覆

豆包AI的文生图功能近期进行了显著升级,主要体现在四个方面:标题大字准确度提升至94%,小字生成能力也有所增强;语义理解和影视质感得到优化,镜头更具叙事...

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

最近,针对国内外7款大模型进行了一场数学能力测试,测试题目主要来自“阿里巴巴全球数学竞赛”和“中国数学奥林匹克(CMO)”的真题,涵盖了多个数学领域,包括...

比R1快8倍、价格仅3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有Scaling Law

智谱公司近期发布了最新的AutoGLM沉思模型,该模型不仅具备深度研究能力,还能执行实际操作任务,展示了AI智能体的全新发展方向。AutoGLM沉思模型的核心在于...

独家|对话蚂蚁 Ling 团队:聊聊用国产卡降本这回事儿

蚂蚁团队近期开源了两个MoE模型——Ling-Lite和Ling-Plus,并发布了技术论文《Every Flop Counts》。Ling-Lite拥有168亿参数,激活了27.5亿参数;Ling-Plus则拥...

网上晒图要当心!AI六成可能知道你在哪儿

AI在图像地理识别任务中表现出色,准确率远超人类,但也暴露了显著的偏差和隐私问题。 研究表明,视觉语言模型(VLMs)能够通过图像细节推断地理位置,表现最...

OpenAI破大防,拒绝率从98%骤降2%!陈怡然团队提出全新思维链劫持攻击

随着大型推理模型(LRMs)的快速发展,其推理能力和安全性之间的平衡成为关键问题。近期研究表明,模型的安全审查透明化反而成为其弱点,攻击者可以通过「思...

OpenAI 宣布采用竞对 Anthropic 协议,一夜将 MCP 送上热搜!Karpathy:赶紧歇了吧

OpenAI CEO Sam Altman 确认将在其产品中集成 Anthropic 的模型上下文协议(MCP),这一协议旨在通过标准化接口连接数据源与 AI 应用,从而提升 AI 系统的灵...
1 4 5 6 7 8 13