每日学术速递11.19

2023-11-19 15:20:20 浏览数 (1)

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理

点击下方卡片,关注「AiCharm」公众号

Subjects: cs.CV

1.Instant3D: Instant Text-to-3D Generation

标题:Instant3D:即时文本到 3D 生成

作者:Ming Li, Pan Zhou, Jia-Wei Liu, Jussi Keppo, Min Lin, Shuicheng Yan, Xiangyu Xu

文章链接:https://arxiv.org/abs/2311.08403

项目代码:https://ming1993li.github.io/Instant3DProj/

摘要:

文本到 3D 生成旨在根据文本提示合成生动的 3D 对象,引起了计算机视觉界的广泛关注。虽然现有的一些工作在这项任务上取得了令人印象深刻的结果,但它们主要依赖于耗时的优化范例。具体来说,这些方法从头开始针对每个文本提示优化神经场,大约需要一小时或更长时间才能生成一个对象。这种繁重且重复的培训成本阻碍了它们的实际部署。在本文中,我们提出了一种用于快速文本到 3D 生成的新颖框架,称为 Instant3D。经过训练后,Instant3D 能够通过一次前馈网络运行,在不到一秒的时间内为看不见的文本提示创建 3D 对象。我们通过设计一种新的网络来实现这种惊人的速度,该网络可以根据文本提示直接构建 3D 三平面。我们Instant3D的核心创新在于我们探索有效地将文本条件注入网络的策略。此外,我们提出了一种简单而有效的激活函数,scaled-sigmoid,来代替原来的 sigmoid 函数,将训练收敛速度加快了十倍以上。最后,为了解决3D生成中的Janus(多头)问题,我们提出了一种自适应Perp-Neg算法,该算法可以在训练过程中根据Janus问题的严重程度动态调整其概念否定尺度,有效减少多头效应。对各种基准数据集的大量实验表明,所提出的算法在定性和定量上都优于最先进的方法,同时实现了显着更高的效率。

2.Polarimetric PatchMatch Multi-View Stereo

标题:偏振 PatchMatch 多视图立体

作者:Jinyu Zhao, Jumpei Oishi, Yusuke Monno, Masatoshi Okutomi

文章链接:https://arxiv.org/abs/2311.07600

项目代码:http://www.ok.sc.e.titech.ac.jp/res/PolarPMS/

摘要:

PatchMatch 多视图立体 (PatchMatch MVS) 因其平衡的精度和效率而成为流行的 MVS 方法之一。在本文中,我们提出了偏振 PatchMatch 多视图立体 (PolarPMS),这是第一个利用偏振线索进行 PatchMatch MVS 的方法。PatchMatch MVS 的关键是生成深度和法线假设,形成局部 3D 平面和倾斜立体匹配窗口,并根据多视图图像之间的一致性有效地搜索最佳假设。除了标准光度一致性之外,我们的 PolarPMS 还评估偏振一致性,以评估深度和法线假设的有效性,其动机是偏振信息与物体表面法线相关的物理特性。实验结果表明,与最先进的 PatchMatch MVS 方法相比,我们的 PolarPMS 可以提高重建 3D 模型的准确性和完整性,特别是对于无纹理表面。

3.Routing to the Expert: Efficient Reward-guided Ensemble of Large Language Models

标题:路由到专家:高效的奖励引导的大型语言模型集成

作者:Keming Lu, Hongyi Yuan, Runji Lin, Junyang Lin, Zheng Yuan, Chang Zhou, Jingren Zhou

文章链接:https://arxiv.org/abs/2311.08692

摘要:

大型语言模型 (LLM) 的互补潜力假设现成的法学硕士在广泛的领域和任务中拥有异构专业知识,因此法学硕士的集合可以持续获得更好的性能。现有的法学硕士集成方法主要关注输出的奖励模型排名,导致大量的计算开销。为了解决这个问题,我们重新审视了法学硕士的互补潜力,并通过利用现成的奖励模型挖掘潜在的专业知识来进一步阐述它。我们提出了 Zooter,一种奖励引导的路由方法,在训练查询上提取奖励来训练路由功能,该功能可以将每个查询精确地分配给具有相关专业知识的法学硕士。我们还集成了基于标签的标签增强功能,以减轻使用奖励作为白银监督时不确定性带来的噪音。Zooter 在推理中显示出计算效率,因为与奖励模型排序方法相比,它仅引入了路由函数的较小计算开销。我们在一个全面的基准集合上评估了 Zooter,该基准集合包含不同领域和任务的 26 个子集。Zooter 平均表现优于最好的单一模型,在 44% 的任务上排名第一,甚至超越了多种奖励模型排名方法。

0 人点赞