整理:AI算法与图像处理
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
ECCV2022论文和代码整理:https://github.com/DWCTOD/ECCV2022-Papers-with-Code-Demo
最新成果demo展示:
标题:Magic3D: High-Resolution Text-to-3D Content Creation
论文:https://arxiv.org/abs/2211.10440
主页:https://deepimagination.cc/Magic3D/
摘要:
DreamFusion 最近展示了使用预训练的文本到图像扩散模型来优化神经辐射场 (NeRF) 的实用性,实现了显着的文本到 3D 合成结果。然而,该方法有两个固有的局限性:(a)NeRF 的优化极慢和(b)NeRF 上的低分辨率图像空间监督,导致处理时间长的低质量 3D 模型。在本文中,我们通过利用两阶段优化框架来解决这些限制。首先,我们使用低分辨率扩散先验获得粗略模型,并使用稀疏 3D 哈希网格结构进行加速。使用粗略表示作为初始化,我们进一步优化了纹理 3D 网格模型,该模型具有与高分辨率潜在扩散模型交互的高效可微渲染器。我们的方法被称为 Magic3D,可以在 40 分钟内创建高质量的 3D 网格模型,比 DreamFusion 快 2 倍(据报道平均需要 1.5 小时),同时还实现了更高的分辨率。用户研究显示 61.7% 的评分者更喜欢我们的方法而不是 DreamFusion。结合图像条件生成功能,我们为用户提供了控制 3D 合成的新方法,为各种创意应用开辟了新途径。
最新论文整理
ECCV2022
CVPR2022
NeurIPS
Updated on : 23 Nov 2022
total number : 5
Touch and Go: Learning from Human-Collected Vision and Touch
- 论文/Paper: http://arxiv.org/pdf/2211.12498
- 代码/Code: None
Videogenic: Video Highlights via Photogenic Moments
- 论文/Paper: http://arxiv.org/pdf/2211.12493
- 代码/Code: None
Human Evaluation of Text-to-Image Models on a Multi-Task Benchmark
- 论文/Paper: http://arxiv.org/pdf/2211.12112
- 代码/Code: None
VideoMap: Video Editing in Latent Space
- 论文/Paper: http://arxiv.org/pdf/2211.12492
- 代码/Code: None
AdaFocal: Calibration-aware Adaptive Focal Loss
- 论文/Paper: http://arxiv.org/pdf/2211.11838
- 代码/Code: None