标签:文本识别

智谱开源OCR!测完我把手机里的扫描软件都卸了……

GLM-OCR开源模型在OCR领域展现出显著的技术突破与应用潜力。该模型虽仅0.9B参数,却在OmniDocBench V1.5榜单上达到SOTA水平,性能超越Gemini-3-Pro和GPT5.2等...

腾讯开源 HunyuanOCR,用纯粹视觉语言模型架构,仅1B参数刷新多项高阶任务SOTA

腾讯HunyuanOCR通过创新的端到端视觉语言模型架构,仅用10亿参数便解决了传统OCR系统的级联误差与通用大模型效率低下的双重难题。该系统摒弃了传统多模块串联...