Kolors

Kolors

基于潜在扩散模型的大规模文本到图像生成模型

支持中英文双语输入，理解并生成高质量的图像。
提供Inference、Checkpoints、LoRA、ControlNet和IP-Adapter等多种功能模块。
拥有超过1000个prompts的全面评估数据集KolorsPrompts，用于模型性能比较。
在人类评估和机器评估中均取得行业领先标准。
提供了详细的技术报告和使用文档，方便用户和研究者理解和应用。
完全开源，促进与开源社区的协作发展。

产品详情

Kolors是由快手Kolors团队开发的大规模文本到图像生成模型，基于潜在扩散模型，训练于数十亿文本-图像对。它在视觉质量、复杂语义准确性以及中英文文本渲染方面，均优于开源和闭源模型。Kolors支持中英文输入，尤其在理解及生成中文特定内容方面表现突出。

相关项目

CrossPrism for MacOS

CrossPrism for MacOS

Kerqu.Ai

Kerqu.Ai

Free AI Image Extender

Free AI Image Extender

ComfyUI-LivePortraitKJ

ComfyUI-LivePortraitKJ