Kolors

Kolors

基于潜在扩散模型的大规模文本到图像生成模型

  • 支持中英文双语输入,理解并生成高质量的图像。
  • 提供Inference、Checkpoints、LoRA、ControlNet和IP-Adapter等多种功能模块。
  • 拥有超过1000个prompts的全面评估数据集KolorsPrompts,用于模型性能比较。
  • 在人类评估和机器评估中均取得行业领先标准。
  • 提供了详细的技术报告和使用文档,方便用户和研究者理解和应用。
  • 完全开源,促进与开源社区的协作发展。

产品详情

Kolors是由快手Kolors团队开发的大规模文本到图像生成模型,基于潜在扩散模型,训练于数十亿文本-图像对。它在视觉质量、复杂语义准确性以及中英文文本渲染方面,均优于开源和闭源模型。Kolors支持中英文输入,尤其在理解及生成中文特定内容方面表现突出。