大模型
LLM,VLM,模型
谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
谷歌CEO Sundar Pichai宣布开源最新多模态大模型Gemma-3,该模型主打低成本高性能,共有10亿、40亿、120亿和270亿四种参数版本。即便最大的270亿参数版本,仅...
小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化
随着大模型技术从技术变革转向产业变革,传统基础设施技术已无法满足大模型应用的快速发展需求,整个基础设施技术和产业链正在向大模型基础设施技术转型。多...
OpenAI新Agent套件全解析,以及发布会没说的30+要点
OpenAI在凌晨1点发布了全新的Agent开发套件,旨在简化复杂Agent系统的构建和管理。该套件包含四个核心组件:Responses API、内置工具、Agents SDK和监控工具...
总结下我的Cursor使用经验
高效使用 Cursor 构建 Golang 项目的关键在于建立良好的编辑和测试循环。这一循环的核心在于让 AI 生成代码、编写测试用例并执行测试,根据测试结果修正错误...
多智能体协作,DrugAgent重塑药物研发新范式
南加州大学、卡内基梅隆大学和伦斯勒理工学院的研究人员联合开发了一个专用于医药领域的AI Agent——DrugAgent。该智能体能够将复杂的药物发现任务分解为可管理...
刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!
谷歌近日发布了Gemma 3,这是一组轻量级的开源AI模型,旨在减少能源消耗和成本,同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建,...
字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露
字节跳动旗下的豆包大模型团队近期在 arXiv 上发布了一篇技术报告,详细介绍了其文生图模型 Seedream 2.0 的技术细节。该模型于去年 12 月上线至豆包 APP 和...
20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭
DeepSeek 的风甚至吹到了美妆区,一位小红书博主根据 DeepSeek 的指示上妆,意外打造出「石矶娘娘」妆效,引发全网围观。这一看似无厘头的跨界实验,实则揭示...
我花了2天,找到了我觉得翻译质量最好的AI大模型。
在AI自媒体的领域中,阅读前沿学术论文是提升知识体系的重要途径。然而,对于英语水平有限的从业者来说,即便借助大模型翻译工具,阅读英文文献仍然充满挑战...
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
大型语言模型(LLMs)在处理复杂任务时面临挑战,尤其是在需要多步推理、特定领域知识或外部工具集成的场景中。现有的方法通常需要对模型进行微调或额外训练...