大模型

LLM,VLM,模型

锁死一致性!Vidu Q2「参考生」可算来了,新功能强到离谱,APP全面进化

Vidu Q2「参考生」功能正式上线,标志着AI视频生成技术迈入新阶段。该功能在保持高一致性的基础上,实现了生成速度提升3倍和价格优化,同时首次推出「视频延...

字节用LLaVA + SAM-2抢先实现了SAM-3,用概念分割,无需位置标注

加州大学默塞德分校、字节跳动Seed团队、武汉大学和北京大学的研究人员成功将LLaVA和SAM-2两个AI模型整合,创造出名为Sa2VA的新型多模态系统。这一突破性成果...

DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

DeepSeek近期发布的《DeepSeek-OCR》技术方案突破了传统OCR工具的局限,其核心价值在于通过视觉压缩解决大模型长上下文处理的瓶颈问题。当前主流大模型受限于...

ROBOT PHONE登场:荣耀为AI终端开了“自进化”的未来新局

AlphaEvolve的突破性进展揭示了AI技术从被动计算向主动学习的范式转变。Google DeepMind开发的这一自进化系统通过结合创造性问题解决与反馈学习机制,实现了...

全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

DeepSeek团队最新发布的DeepSeek-OCR模型突破了传统OCR的局限,将文字识别与结构化信息生成结合,实现了从图片到可编辑Markdown文档的端到端转换。该模型不仅...

MagicOS已成世界「第三极」,荣耀拿下AI大战叙事权

全球智能手机市场正迎来一场由AI驱动的革命性变革。Counterpoint报告预测,2025年全球生成式AI手机出货量将突破4亿部,占市场份额的三分之一。这一趋势标志着...

甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心

甲骨文在AI World 2025大会上发布了全球最大规模的云端AI超级计算机OCI Zettascale10,该系统由80万块NVIDIA GPU组成,峰值算力高达16 ZettaFLOPS。这一算力...

字节这款 AI 应用,在海外悄悄「爆了」

字节跳动旗下的AI应用「豆包」在国内市场表现稳定,但其海外版本「Cici」近期在国际市场上取得了显著增长。Cici在印度尼西亚、马来西亚、菲律宾、墨西哥和英...

Andrej Karpathy 的访谈刷屏了,确实醍醐灌顶

Andrej Karpathy作为深度学习领域的先驱者,对当前AI技术的发展现状与未来路径提出了独到见解。他认为当前被广泛讨论的Agent技术仍处于'婴儿期',距离成熟可...

小红书RecSys 2025最佳论文提名背后:破解视频时长预测难题

小红书推荐算法团队在推荐系统顶会RecSys 2025上凭借论文《Multi-Granularity Distribution Modeling for Video Watch Time Prediction via Exponential-Gaus...
1 134 135 136 137 138 849