大模型

LLM,VLM,模型

智谱开源OCR!测完我把手机里的扫描软件都卸了……

GLM-OCR开源模型在OCR领域展现出显著的技术突破与应用潜力。该模型虽仅0.9B参数,却在OmniDocBench V1.5榜单上达到SOTA水平,性能超越Gemini-3-Pro和GPT5.2等...

谷歌Chrome深夜爆更,Agent不用「装」人了!前端最后防线崩了?

谷歌Chrome团队近日发布了WebMCP(Web模型上下文协议),这一技术标志着AI与网页交互方式的重大变革。WebMCP允许AI智能体绕过传统的人类用户界面,直接与网站...

马斯克都忍不住转发的 AI 应用,是怎么做出来的?

当世界变得 Playable:互动内容平台的创新探索涌跃智能推出的Loopit产品,代表了AI时代内容形态的一次重要变革。其核心理念在于将传统被动消费的内容转化为可...

千问发布最新图像模型 Qwen-Image-2.0,支持 1K token 超长文字输入和 2K 高分辨率

阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0,该模型在AI Arena文生图评测中以1029分位列第三,仅次于谷歌Nano Banana Pro和GPT Image1.5。Qwen...

过劳病倒、职权被削、联创跑路:xAI 48小时内上演最惨烈人才地震

马斯克旗下人工智能公司xAI在48小时内连续失去两位联合创始人——吴宇怀(Tony Wu)和深度学习专家Jimmy Ba,引发外界对Grok模型开发进展的猜测。吴宇怀在离职...

北京,杀出第二家估值百亿的具身智能独角兽

星海图完成10亿元B轮融资,估值达百亿元,成为国内具身智能领域又一只独角兽。本轮投资方包括金鼎资本、北汽产投等产业资本,以及正心谷资本等PE基金,老股东...

Game over!视频GPT-4o时刻!字节Seedance 2.0引爆全球

字节跳动推出的多模态AI视频生成模型Seedance 2.0引发全球热议,其突破性技术被认为将彻底改变影视内容生产模式。该模型支持文本、图像、视频和音频四模态输...

旷视众神归位之原力觉醒?

原力灵机在成立330天之际首次公开亮相,CEO唐文斌阐述了公司“打造智能、有用、可信赖的机器人”的使命。与行业普遍强调“具身智能”不同,该公司提出“具身原生”...

中国也有了世界第一的模型,他的名字,叫Seedance 2.0。

Seedance 2.0的爆火标志着AI视频生成技术进入全新阶段。这款产品在导演思维、分镜复刻、二创内容、现实编辑等领域的突破性表现,正在重塑内容创作生态。其核...

李飞飞团队新作:无需修改架构,重组数据即显著提升AI对视频理解能力

斯坦福大学、微软研究院和威斯康辛大学团队提出了一种名为VideoWeave的数据中心化方法,通过重组短视频素材显著提升了AI对长视频的理解能力,且无需增加计算...
1 11 12 13 14 15 841