图像生成

DeepSeek 团队真是鬼才啊。

DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文，提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...

AIGC动态

6个月前

DeepSeek团队推出的DeepSeek-OCR模型通过视觉token压缩技术实现了文本处理效率的突破性提升。该模型将1000字文本压缩为100个视觉token，在保持97%精度的同时...

AIGC动态

6个月前

Vidu Q2「参考生」功能正式上线，标志着AI视频生成技术迈入新阶段。该功能在保持高一致性的基础上，实现了生成速度提升3倍和价格优化，同时首次推出「视频延...

AIGC动态

6个月前

加州大学默塞德分校、字节跳动Seed团队、武汉大学和北京大学的研究人员成功将LLaVA和SAM-2两个AI模型整合，创造出名为Sa2VA的新型多模态系统。这一突破性成果...

AIGC动态

6个月前

DeepSeek近期发布的《DeepSeek-OCR》技术方案突破了传统OCR工具的局限，其核心价值在于通过视觉压缩解决大模型长上下文处理的瓶颈问题。当前主流大模型受限于...

AIGC动态

6个月前

DeepSeek团队最新发布的DeepSeek-OCR模型突破了传统OCR的局限，将文字识别与结构化信息生成结合，实现了从图片到可编辑Markdown文档的端到端转换。该模型不仅...

AIGC动态

6个月前

全球智能手机市场正迎来一场由AI驱动的革命性变革。Counterpoint报告预测，2025年全球生成式AI手机出货量将突破4亿部，占市场份额的三分之一。这一趋势标志着...

AI-Agent

6个月前

字节跳动旗下的AI应用「豆包」在国内市场表现稳定，但其海外版本「Cici」近期在国际市场上取得了显著增长。Cici在印度尼西亚、马来西亚、菲律宾、墨西哥和英...

AIGC动态

6个月前

全球AI发展呈现出大厂与创业公司截然不同的发展路径。数据显示，在海外市场，AI产品Top50中仅有5个来自大厂，而国内Top20应用中大厂占比高达70%，字节、百度...

AIGC动态

6个月前

Meta最新的SAM 3模型在计算机视觉领域实现了重大突破，将分割模型从简单的视觉交互工具升级为能理解语义概念的视觉-语言多模态模型。该模型通过可提示概念分...

AIGC动态

6个月前