大模型
LLM,VLM,模型
【 ICLR 2025 】Adam 有了 mini 版:内存减半,吞吐量可提升 50%
在大语言模型训练中,内存开销是一个关键挑战,尤其是Adam优化器的高内存需求。为了解决这一问题,研究团队提出了一种轻量化优化器Adam-mini,通过分析Transf...
Anthropic工程师教你怎么做AI Agent:不做全场景、保持简单,像Agent一样思考
Anthropic 工程师 Barry Zhang 在 AI Engineer 工作坊上分享了关于如何构建有效 Agent 的见解。他强调,并非所有任务都需要构建 Agent,尤其是在任务决策路径...
福布斯2025 AI 50榜单:AI Agent全面崛起,应用层才是2025真正的主战场
2025年《福布斯》AI公司50强榜单揭示了人工智能领域的重大转变,标志着AI从简单的聊天工具向实际执行任务的转变。红杉资本的核心观察指出,AI正从“聊天”走向“...
GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!
近日,一款名为“Quasar Alpha”的神秘AI模型悄然上线,迅速成为OpenRouter平台上使用率排名第一的编程类AI模型。该模型拥有100万token的上下文窗口,能够处理...
AI看柯南2分钟揪真凶,商汤600B多模态MoE推理封神!交互记忆全线升级
商汤科技最新发布的第六代大模型SenseNova V6,标志着多模态大模型技术的重大突破。该模型不仅在文本、图像和视频的原生融合上实现了全面升级,还展现了强大...
谷歌Veo 2震撼升级,一键get好莱坞级视觉盛宴!全网实测,帧帧丝滑
谷歌在Next 2025大会上发布了Veo 2,这是一款功能强大的视频创作和编辑工具,能够将用户的创意点子转化为高质量的视频内容。Veo 2不仅具备视频生成能力,还提...
AI医学影像通用大模型硬核突围!重压之下打破进口垄断,引领国产替代
中国医疗行业正面临前所未有的挑战,尤其是在关税壁垒和供应链风险的双重夹击下,国产替代已成为大势所趋。2025年4月,美国政府宣布对中国输美商品征收的关税...
面向营销人员的8大国外AI Agent
数字化营销领域正面临巨大的变革,AI技术的融入为营销人员提供了前所未有的支持。根据Blind的调查数据,高达83%的营销和市场专业人员对数字化销售感到疲惫,...
OPPO:用户说我们的手机像 iPhone,这不是一件坏事
4月10日晚,OPPO在西安举行了全新Find X8系列新品发布会,正式推出了三款全新机型,其中最受关注的是Find X8 Ultra和Find X8s。Find X8 Ultra作为本次发布会...
上手实测:阿里云百炼上线「全周期 MCP 服务」,AI工具一站式托管
阿里云百炼正式上线了MCP(Model Context Protocol)服务的完整平台能力,覆盖从服务注册、云托管到Agent调用、流程组合的全生命周期。这一转变标志着工具调...