高质量 3D 生成大模型 Direct3D,基于3D-DiT,可以直接使用文本生成3D对象,不需要再进行2D升维

2024-06-18 14:28:56 浏览数 (1)

DreamTech 最近宣布了其创新的 3D 生成模型 Direct3D 的发布,这是一个原生的三维生成模型,采用了 3D Diffusion Transformer(3D-DiT)技术。该模型在处理高质量三维内容生成的长期难题方面展现了显著的技术优势,特别是在解决从 2D 图像到 3D 模型转换过程中常见的几何扭曲和细节丢失问题。

Direct3D 的技术核心在于其采用的 3D-DiT 架构。与传统的 2D-to-3D 转换技术不同,如 Google 的 DreamFusion 和 Adobe 的 Instant3D,这些技术往往需要依赖于 2D 图像并通过算法“提升”到三维结构。而 Direct3D 采用的是一种原生的三维方法,直接从三维数据进行学习和生成,这使得生成的 3D 模型能够保持更高的几何精确度和视觉真实感。

从技术细节上看,Direct3D 利用了名为 3D VAE(Variational Auto-Encoder)的技术,这种技术能够将复杂的 3D 数据压缩成更低维度的潜在空间表征。通过这种方式,模型可以有效地学习和表征 3D 对象的内在特性,同时大幅减少所需的计算资源。Direct3D 的 VAE 设计允许它在生成过程中几乎无损地恢复原始 3D mesh,这一点在传统的 2D 升维技术中是很难实现的。

此外,Direct3D 进一步优化了 Diffusion Transformer 架构,引入了针对输入图像的语义级与像素级对齐模块。这一设计使得模型不仅能够生成与输入图像在视觉上高度一致的 3D 输出,而且能够更好地控制生成过程中的细节表达,从而提高生成质量和真实性。

在数据处理方面,Direct3D 利用了 DreamTech 自研的数据合成引擎生成大量高贬三维训练数据。这些数据覆盖了广泛的物体类型和场景,为模型的训练提供了丰富的学习材料。此外,通过自动化的数据清洗和标注流程,DreamTech 能够确保数据的质量和一致性,这对于训练复杂的 3D 生成模型至关重要。

应用方面,Direct3D 已经在多个领域展示了其潜力,包括但不限于 3D 打印、动画制作和游戏开发。特别是在 3D 打印领域,Direct3D 生成的模型准确度和细节层次已经超过了许多现有的商业级打印机的处理能力。同时,DreamTech 还推出了面向 C 端用户的 Animeit! 产品,该产品能够将用户的图片或文字输入转换成高质量的 3D 二次元角色模型。

总体来看,Direct3D 的开发不仅标志着 3D 内容生成技术的一大进步,也为相关行业带来了新的解决方案和商业可能。随着技术的不断进步和应用范围的扩展,Direct3D 预计将在未来几年内在多个领域实现广泛应用,进一步推动 3D 生成技术的发展和创新。

0 人点赞