标签:大模型

卷疯了!这个清华系Agent框架开源后迅速斩获1.9k stars,还要“消灭”Prompt?

随着大模型能力的突破,“可调用工具的智能体”已经从实验室概念迅速走向应用落地,成为继大模型之后的又一技术爆发点。围绕智能体(Agent)构建的开发框架和基...

2G 内存跑 Gemma 3n 完整版!全球首个 10B 内模型杀疯 LMArena:1300 分碾压记录

谷歌正式发布了Gemma 3n完整版,这是一款面向开发者的开源大模型,具备输入图像、音频和视频的能力,并支持文本输出。Gemma 3n的设计亮点在于其天生多模态和...

AI Infra 工程师们如何应对大模型流水线里的“暗涌”?

在大模型基础设施(Infra)领域,工程师们面临着诸多挑战和需求,尤其是在训练和推理环节的稳定性、性能优化以及资源调度方面。并行策略兼容性、工程流水线管...

5款大模型考「山东卷」,Gemini、豆包分别获文理第一名

近期,5款主流大模型参与了2025年山东高考全科闭卷测评,结果显示AI的应试能力已实现质的飞跃。字节跳动Seed团队组织的测评采用750分制,未进行任何提示工程...

重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练

过去几年,基于人类偏好的强化学习(RLHF)成为大语言模型(LLM)后训练阶段的关键技术,显著提升了模型的对齐能力,并拓展了其在推理增强、智能体交互等场景...

讲得了课、押得中题、学习规划还能量身定制,真卷到点子上的只有它

讯飞星火大模型X1在高考测试中表现卓越,语文作文、数学和英语分别获得国产AI中的高分排名。该模型作为科大讯飞推出的深度推理大模型,不仅支持多模态教学功...

冠军队独享200w?这波是冲大学生来的,超千支队伍已组队报名

生成式AI在广告领域的应用正在迅速崛起,成为大模型变现的重要途径。Meta和谷歌等科技巨头已经通过AI优化广告系统,实现了显著的营收增长。Meta在2024年第四...

月之暗面刚开源多模态Kimi-2506:智能体、视觉理解,重磅大升级

月之暗面(MoonshotAI)近期对其开源的多模态模型Kimi-VL-A3B-Thinking进行了重大升级,发布了2506版本。这一版本在多个方面实现了显著提升,尤其是在性能表...

杨植麟和闫俊杰首次“撞车”,MiniMax视频模型价格一年超万元

月之暗面发布首款面向软件工程任务的开源代码大模型Kimi-Dev-72B,基于720亿参数的Qwen2.5-72B模型训练,采用大规模强化学习优化,在SWE-bench Verified基准...

假老罗打败真老罗?618一夜爆卖5500万!真相揭穿网友傻眼

罗永浩数字人直播间在618期间创下惊人纪录,观看人次突破1300万,成交额超过5500万元,超越了其本人5月的首秀数据。这一成绩引发广泛关注,其核心在于百度研...
1 2 3 4 60