点击上方蓝字关注我们
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理
点击下方卡片,关注「AiCharm」公众号
Subjects: cs.CV
1.NOIR: Neural Signal Operated Intelligent Robots for Everyday Activities
标题:NOIR: Neural Signal Operated Intelligent Robots for Everyday Activities
作者:Ruohan Zhang, Sharon Lee, Minjune Hwang, Ayano Hiranaka, Chen Wang, Wensi Ai, Jin Jie Ryan Tan, Shreya Gupta, Yilun Hao, Gabrael Levine, Ruohan Gao, Anthony Norcia, Li Fei-Fei, Jiajun Wu
文章链接:https://arxiv.org/abs/2311.01454
项目代码:https://noir-corl.github.io/
摘要:
我们推出了神经信号操作智能机器人(NOIR),这是一种通用的智能大脑-机器人接口系统,使人类能够通过大脑信号命令机器人执行日常活动。通过这个界面,人类使用脑电图(EEG)将他们想要的兴趣对象和动作传达给机器人。我们的新颖系统在 20 种具有挑战性的日常家庭活动中取得了成功,包括烹饪、清洁、个人护理和娱乐。该系统的有效性通过机器人学习算法的协同集成得到提高,使 NOIR 能够适应个人用户并预测他们的意图。我们的工作增强了人类与机器人交互的方式,用直接的神经通信取代了传统的交互渠道。
2.Idempotent Generative Network
标题:幂等生成网络
作者:Assaf Shocher, Amil Dravid, Yossi Gandelsman, Inbar Mosseri, Michael Rubinstein, Alexei A. Efros
文章链接:https://arxiv.org/abs/2311.01462
摘要:
我们提出了一种基于训练幂等神经网络的生成建模新方法。幂等运算符是一种可以连续应用而不改变初始应用之外的结果的运算符,即 f(f(z))=f(z) 。所提出的模型 f 经过训练,可以使用以下目标将源分布(例如高斯噪声)映射到目标分布(例如真实图像):(1)目标分布中的实例应映射到自身,即 f(x)=x 。我们将目标流形定义为 f 映射到自身的所有实例的集合。(2) 形成源分布的实例应映射到定义的目标流形上。这是通过优化幂等项 f(f(z))=f(z) 来实现的,它鼓励 f(z) 的范围位于目标流形上。在理想假设下,这样的过程可证明收敛于目标分布。这一策略产生的模型能够一步生成输出,保持一致的潜在空间,同时还允许顺序应用进行细化。此外,我们发现通过处理来自目标分布和源分布的输入,该模型能够熟练地将损坏或修改的数据投影回目标流形。这项工作是迈向“全局投影仪”的第一步,该投影仪可以将任何输入投影到目标数据分布中。
3.Equivariant Matrix Function Neural Networks
标题:等变矩阵函数神经网络
作者:Ilyes Batatia, Lars L. Schaaf, Huajie Chen, Gábor Csányi, Christoph Ortner, Felix A. Faber
文章链接:https://arxiv.org/abs/2310.10434
摘要:
图神经网络(GNN),特别是消息传递神经网络(MPNN),已经成为各种应用中图学习的强大架构。然而,MPNN 在对大共轭分子、金属或非晶材料等系统中的非局部相互作用进行建模时面临挑战。尽管谱 GNN 和传统神经网络(例如循环神经网络和 Transformer)缓解了这些挑战,但它们通常缺乏扩展性、适应性、泛化性、计算效率,或者无法捕获数据中的详细结构关系或对称性。为了解决这些问题,我们引入了矩阵函数神经网络(MFN),这是一种通过解析矩阵等变函数参数化非局部交互的新颖架构。采用解析扩展提供了一种简单的实现方式以及随系统规模线性扩展的潜力。MFN 架构在标准图基准(例如 ZINC 和 TU 数据集)中实现了最先进的性能,并且能够捕获量子系统中复杂的非局部交互,为新的最先进技术铺平了道路。
推荐阅读
点击卡片,关注「AiCharm」公众号
喜欢的话,请给我个在看吧!