文章摘要
【关 键 词】 人机协同、双入口设计、技能集成、专业创作、Agent生态
LibTV作为一款面向AI时代的视频创作工具,展现出同时服务人类创作者与AI Agent的独特架构。产品核心分为两大交互路径:一是为专业用户设计的无限节点画布,二是为Agent调用而构建的Skills接口体系。无限画布支持剧本、图像、音频、视频全链路处理,集成高清扩图、多角度生成、灯光控制、摄像机参数调节等深度功能,节点化工作流允许用户精细操控模型调用、分镜生成与后期剪辑;其中脚本节点可依据文本或角色设定自动生成分镜,音频节点支持驱动数字人或生成配乐,整体构成高度工程化的创作环境。值得注意的是,该画布目前尚未接入Seedance 2.0模型,但已兼容主流视频生成模型,并提供超分、解析等视频增强能力,积分与会员体系与Liblib平台打通,降低用户迁移成本。
在Agent侧,LibTV通过Access Key机制授权第三方Agent(如Claude Code、Codex)调用其Skills,安装流程仅需一句指令,使用时用户只需提交自然语言Prompt,后续任务由后端专属Agent完成——包括分镜策划、模型选择、参数优化等关键环节,前端Skills仅承担触发与通信职责。这种“轻前端、重后端”的设计保护了核心Prompt策略与模型调度逻辑,避免技术裸奔,为商业化留出空间。实际运行中,Agent可实现生图→生视频→本地下载→项目自动归档的闭环,生成结果同步回传至画布项目中,形成人机协作的工作流:Agent输出初稿(约70分水准),人类在画布中进一步精修至100分。例如,输入“根据坂本龙一《Rain》音乐做MV”即可启动全流程生成,虽成品尚有提升余地,但已具备实用基础。
同一套底层能力通过双入口分发:专业用户依赖画布的复杂性获取控制权,普通用户则借助Skills实现“言出法随”的零门槛操作。 这种设计并非替代关系,而是并行共存——UI与Skills各自适配目标人群,最终统一于原子化能力模块的重组之上。 产品验证了“人类与Agent共生”的创作范式:Agent负责效率与广度,人类聚焦审美与精度,二者通过无缝衔接的项目体系实现协同进化。 当前形态表明,AI原生产品的成功不在于单一交互形式的胜利,而在于能否以统一内核支撑差异化入口,从而真正弥合专业与大众之间的鸿沟。
原文和模型
【原文链接】 阅读原文 [ 3193字 | 13分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★★★☆☆



