标签:高效推理

入围CVPR 2026最佳论文决选,ViT³用「测试时训练」突破Transformer复杂度瓶颈

阿里巴巴与清华大学合作的研究提出了ViT³模型,旨在解决视觉Transformer在处理高分辨率图像和复杂多模态输入时计算与显存成本急剧增加的问题。该研究将测试时...

清华系团队出手!一张 4090 即可「爆改」,1.3B小钢炮震撼开源

面壁智能联合清华大学及开源社区正式发布了端侧多模态大模型MiniCPM-V 4.6,该模型仅具备约1.3B参数规模,却在多模态性能与运行效率上实现了对同级别主流模型...

开源音视频同步SOTA基座:极简的单流架构,2秒出片

daVinci-MagiHuman是由上海创智学院(SII)生成式人工智能研究实验室(GAIR)与Sand.ai联合发布的开源音视频生成基础模型,旨在解决当前开源生态中生成质量、...

硅谷豪赌算力烧到停电,中国团队反向出击!这一刀,直接砍碎Scaling Law

硅谷的算力竞争已从GPU数量转向电力资源的争夺,OpenAI和马斯克的xAI等巨头正投入万亿级资金建设超大规模算力集群。然而,Anthropic的研究揭示了一个关键问题...

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in LL...

突发!DeepSeek刚刚开源V3.1-Base

全球著名大模型开源平台DeepSeek于今天凌晨开源了Deepseek V3.1 - Base版本。该模型发布时非常低调,未作任何介绍,仅将其放置在平台上,但在Hugging Face的...

微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...