大模型

世界首个！李飞飞团队推出物理推理基准，大模型统统不及格？

斯坦福大学与中国科学技术大学的研究团队开发了首个定量评估视觉语言模型（VLMs）物理理解能力的基准测试QuantiPhy。该测试包含超过3355个视频-文本问答对，...

AIGC动态

2个月前

2025年标志着消费级AI技术从实验室大规模进入日常生活场景，但市场竞争格局呈现高度集中化特征。ChatGPT以8-9亿周活跃用户数保持绝对优势，90%的用户仅使用单...

AIGC动态

2个月前

Meta宣布以数十亿美元收购通用人工智能代理公司Manus，成为其历史上金额第三大的收购案，仅次于WhatsApp和Scale.ai的交易。此次收购标志着Meta在人工智能领域...

AI-Agent

2个月前

上下文图谱（Context Graph）的兴起正在重新定义企业软件的未来。近期围绕这一概念的讨论集中在AI Agent与传统记录系统（Systems of Record）的关系上。SaaS...

AI-Agent

2个月前

近年来，自动驾驶技术的高速发展正在重塑全球出行市场格局，Robotaxi（自动驾驶出租车）作为新兴物种已进入爆发前夜。2013至2016年中国网约车市场的补贴大战...

AIGC动态

2个月前

AI技术正在深刻重塑程序员的工作方式，传统编程模式面临根本性变革。近期行业讨论显示，AI已从辅助工具转变为开发流程的核心参与者，这种转变在短短一年内就...

AIGC动态

2个月前

AI情感陪伴类应用的崛起正引发广泛讨论。以MiniMax旗下产品星野为例，这类应用通过多模态技术模拟真实情感互动，让用户获得沉浸式体验。星野会根据用户习惯主...

AIGC动态

2个月前

Salesforce作为全球领先的企业级软件公司，曾大力推行AI技术，特别是其核心产品Agentforce，旨在通过大语言模型实现工作流程自动化以降低成本。然而，近期该...

AI-Agent

2个月前

王佳佳（化名）是一名来自安徽阜阳的初三女生，性格内向，害怕与老师互动，课堂上几乎从不举手，遇到难题宁愿空着也不敢提问。数学和英语成为她最不愿面对的...

AIGC动态

2个月前

蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个专病循证能力评测框架GAPS（Grounding, Adequacy, Perturbation, Safety），旨在解决现有医疗AI评...

AIGC动态

2个月前