大模型

LLM,VLM,模型

聊几句百度和阿里的 AI 局面

温榆河公园团建期间临时起意讨论百度AI战略,指出外界对其认知存在表面化偏见。观察发现,百度搜索已深度整合AI功能,成为超级AI应用,其进展甚至快于谷歌。C...

Sora天才辍学生归来!OpenAI组建3人神秘小队,豪赌超级人工智能

Will Depue,这位00后的天才辍学生和Sora背后的核心贡献者之一,宣布重返OpenAI并组建了一个三人小组,目标是实现超级人工智能(ASI)。他与Troy Luhman和Eri...

Cursor2.0:再强的 AI Coding,也要拼尽全力补模型的课

Cursor 2.0的发布标志着AI编程工具进入新阶段。其核心转变是从“以文件为核心的编辑器”升级为“以Agent为中枢的开发平台”,通过智能体并行处理任务,开发者仅需...

AI看不到的爱心,成了最棒的AI检测器。

一张看似简单的视觉错觉图引发了关于AI与人类视觉差异的深度思考。当人们能够轻易识别出图中'左右横跳'的爱心时,主流AI模型却无一例外地将其误判为静态噪点...

英伟达市值破5万亿美元:黄仁勋要做的不只是AI,还要接管方向盘

在GTC2025大会上,英伟达发布了迄今为止最接近“完全体”的自动驾驶平台NVIDIA DRIVE AGX Hyperion 10,标志着其从硬件供应商向全栈方案提供者的战略转型。Hype...

对话VideoTutor:用AI打造一个理科版多邻国

硅谷学生创业团队VideoTutor凭借'一句话生成AI视频讲解'技术,在AI教育赛道创下1100万美元种子轮融资纪录。这个仅6人的团队由辍学生Kai Zhao和前谷歌工程师Ja...

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

AI视频技术从极客专属到全民可用的跨越,标志着生成式AI进入新阶段。2025年第四季度,OpenAI的Sora 2与阿里的Wan2.5-Preview两大模型引发全球热潮,前者通过'...

Wan2.2-Animate又火了,5分钟让抠脚大汉秒变高冷女神。

阿里开源模型Wan2.2 Animate近期因生成高精度换脸视频引发广泛关注。该技术通过结合静态人物图像与动态参考视频,能精准复刻表情和动作,甚至支持声音替换,...

AI百科全书SciencePedia:当马斯克Grokipedia遭遇滑铁卢,有个中国团队默默把活儿干了

在信息爆炸的时代,获取可靠的科学知识面临多重挑战。传统知识平台如维基百科和ArXiv存在内容碎片化、跨学科关联不足等问题,而AI助手往往停留在浅层信息检索...

中科院联合清华等发布视觉语言行动推理模型VLA-R1,让机器人先思考再行动

中科院自动化所、清华大学与GigaAI联合发布了视觉-语言-行动(VLA)模型的R1推理版本,该模型通过引入思维链机制和强化学习策略,显著提升了机器人在复杂环境...
1 124 125 126 127 128 849