标签:微轮次

OpenAI前CTO做的新模型,在硅谷刷屏了。

为调和即时响应与复杂计算的底层冲突,该架构拆分出前台交互层与后台推理层,前者维持低延迟在线感知,后者专注长周期任务规划。两组模型共享动态上下文记忆...