SEED-Story

SEED-Story

多模态长篇故事生成模型

生成多模态长篇故事：结合文本和图片生成连贯的故事。
基于用户输入的图片和文本：作为故事的起点。
支持最多25个多模态序列的故事生成：尽管训练时最多使用10个序列。
图像风格和角色一致性：确保生成的图片在风格和角色上与故事文本一致。
大规模数据集StoryStream：为训练和基准测试多模态故事生成而设计。
模型权重和训练代码的发布：提供预训练的Tokenizer、De-Tokenizer和基础模型SEED-X。
支持指令调整：通过指令调整进一步优化模型性能。

产品详情

SEED-Story是一个基于大型语言模型（MLLM）的多模态长篇故事生成模型，能够根据用户提供的图片和文本生成丰富、连贯的叙事文本和风格一致的图片。它代表了人工智能在创意写作和视觉艺术领域的前沿技术，具有生成高质量、多模态故事内容的能力，为创意产业提供了新的可能性。

相关项目

知了zKnown

知了zKnown

MBox AI Meet

MBox AI Meet

Klee

Klee

CrossPrism for MacOS

CrossPrism for MacOS