代码语言:javascript复制
来源:专知本文为教程,建议阅读5分钟我们计划涵盖交互式代理的理论和实践基础。
开发智能和自主学习代理的关键挑战之一是它们与人类有效互动的能力。在本教程中,我们计划涵盖交互式代理的理论和实践基础。具体而言,在本教程的第一部分中,我们将侧重于单独的人类行为模型,如何使用这些模型进行有效的协调,以及如何优化它们以影响伙伴。在本教程的第二部分,我们将继续介绍共同适应的环境,在这种环境中,人类的偏好是不稳定的,他们会适应,我们将讨论这如何导致新的规范、惯例和平衡的出现。最后,我们将介绍一些方法来推断人类伴侣的偏好,这些方法使用交互式领域中呈现的一系列离线和在线数据源。在本教程中,我们还将讨论自动驾驶、混合自主交通网络、个人机器人和多智能体游戏中的应用实例。
https://icml.cc/Conferences/2022/Schedule?showEvent=18436