HoloDreamer

从文本描述生成全息3D全景世界

风格化等矩形全景生成：结合多个扩散模型，从复杂的文本提示生成风格化和详细的等矩形全景图。
增强两阶段全景重建：进行深度估计并投影RGBD数据以获取点云，使用基础相机和辅助相机在不同场景下进行投影和渲染。
3D高斯散射（3D-GS）：快速重建3D场景，增强场景的完整性。
多视图监督：利用2D扩散模型生成初始局部图像，然后逐步生成场景，提高全局一致性。
全景图旋转无裂缝：应用圆形混合技术，避免在旋转全景图时出现裂缝。
两阶段优化：在传递优化阶段对重建场景的渲染图像进行内绘，优化3D-GS，生成最终重建场景。
高清晰度全景初始化：生成高清晰度全景图作为3D场景的整体初始化，提高重建的质量和一致性。

产品详情

HoloDreamer是一个文本驱动的3D场景生成框架，能够生成沉浸式且视角一致的全封闭3D场景。它由两个基本模块组成：风格化等矩形全景生成和增强两阶段全景重建。该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化，然后利用3D高斯散射（3D-GS）技术快速重建3D场景，从而实现视角一致和完全封闭的3D场景生成。HoloDreamer的主要优点包括高视觉一致性、和谐性以及重建质量和渲染的鲁棒性。

HoloDreamer

产品详情

相关项目

清影 AI 视频生成服务

Viral Insight

ComfyUI-LivePortraitKJ

RoboflowSports