标签:高效推理
与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本
在 NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in LL...
突发!DeepSeek刚刚开源V3.1-Base
全球著名大模型开源平台DeepSeek于今天凌晨开源了Deepseek V3.1 - Base版本。该模型发布时非常低调,未作任何介绍,仅将其放置在平台上,但在Hugging Face的...
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...






