
Jockey
对话式视频代理,结合大型语言模型与视频处理API。
- 结合大型语言模型与视频处理API进行复杂视频工作流程的负载分配。
- 使用LangGraph进行任务分配,提高视频处理效率。
- 通过LLMs逻辑规划执行步骤,增强用户交互体验。
- 无需中介表示,直接利用视频基础模型处理视频任务。
- 支持自定义和扩展,以适应不同的视频相关用例。
- 提供终端和LangGraph API服务器部署选项,灵活适应开发和测试需求。
产品详情
Jockey是一个基于Twelve Labs API和LangGraph构建的对话式视频代理。它将现有的大型语言模型(Large Language Models, LLMs)的能力与Twelve Labs的API结合使用,通过LangGraph进行任务分配,将复杂视频工作流程的负载分配给适当的基础模型。LLMs用于逻辑规划执行步骤并与用户交互,而与视频相关的任务则传递给由视频基础模型(Video Foundation Models, VFMs)支持的Twelve Labs API,以原生方式处理视频,无需像预先生成的字幕这样的中介表示。