标签:推理框架

北大开源统一世界模型框架:多类合成推理任务一套搞定

在架构设计上,系统以Pipeline模块为核心调度中枢,统筹管理单轮推理与多轮交互流程。底层采用模型抽象规范,配合Operator模块完成多模态原始信号的校验与标...

小米小爱同学:资源受限下,实现端侧大模型的高性能推理

随着大模型能力的持续提升,端侧设备部署成为产业界的重要工程挑战。手机、车载、IoT等设备对模型体积、推理时延、功耗和更新机制提出了极高要求,使得端侧推...