会议概况
ACM SIGKDD(Conference on Knowledge Discovery and Data Mining, KDD)是世界数据挖掘领域的最高级别的国际会议,由 ACM(Association of Computing Machinery,计算机学会)的数据挖掘及知识发现专委会(SIGKDD)负责协调筹办,被中国计算机协会荐为A类会议。
自 1995 年以来,KDD 已经以大会的形式连续举办了二十余届全球峰会,作为数据挖掘领域最顶级的学术会议,KDD 大会以论文接收严格闻名,每年的接收率不超过 20%,因此颇受行业关注。
今年KDD发布论文接收结果:KDD 2020 总接受论文数 338 篇,其中 Research Track 共 1279 篇论文参与投稿,接收率约为 16.9%;Applied Data Science track 共 756 篇论文投稿,接收率约为 16.0%。接收论文列表可以访问原文获取。
本文梳理KDD2020时间序列领域的最新研究成果,供大家阅读。
直接研究时间序列问题的论文有:
Research Track
01
论文标题:Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403118
论文源码:https://github.com/nnzhan/MTGNN
论文摘要:该文提出了专门为多元时间序列数据设计的通用图神经网络框架,用于显性地捕获多元时序之间的关联性。该方法通过图学习模块自动提取变量之间的单向关系,可以轻松地将诸如变量属性之类的外部知识整合到其中。该文提出了一种新颖的混合跳跃传播层和一个可扩张的初始层来捕获时间序列内的空间和时间依赖性。
02
论文标题:Deep State-Space Generative Model For Correlated Time-to-Event Predictions
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403206
论文源码:https://github.com/Google-Health/records-research/state-space-model
论文摘要:该文提出了一个深度状态空间生成模型,旨在捕捉患者潜在状态的时间动态性与不同类型临床事件(例如,肾衰竭,死亡率)之间的关联关系。基于这些学习到的患者状态,该文进一步开发了一种通用的模型以提高预估患者生存期的准确率。同时,该论文还发现了关于死亡率和不同类型器官衰竭之间的潜在关系。
03
论文标题:Fast RobustSTL: Efficient and Robust Seasonal-Trend Decomposition for Time Series with Complex Patterns
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403271
论文源码:-
论文摘要:许多真实世界的时间序列数据具有趋势、季节性、离群值和噪声等复杂的模式。稳健而准确地分解这些模式将对时间序列分析很有帮助。RobustSTL可以对复杂模式下的时间序列数据进行分解,但它不能同时处理多个季节性因素,且计算复杂度较高。该文扩展了RobustSTL以处理多个季节性。为了加快计算速度,该文提出了一种广义ADMM算法来进行高效地分解。
04
论文标题:Matrix Profile XXI: A Geometric Approach to Time Series Chains Improves Robustness
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403164
论文源码:https://sites.google.com/site/timeserieschains
论文摘要:探寻时间序列的主题已成为时序表征中的基本方法。最近,很多方法引入时序链以表示时间序列中的演化模式。时序链是一个非常有前途的原始方法,但是,从时间序列的微小波动可能会“切断”一条链条的意义上说,最初的定义可能比较脆弱。此外,原始定义没有提供对链“重要性”的度量,因此无法支持对链的top-k搜索。受到动力学系统理论观察的启发,该文介绍了时序链的两个新颖度量,即方向性和渐进性,以提高时序链的鲁棒性并启用top-K搜索。
05
论文标题:Multi-Source Deep Domain Adaptation with Weak Supervision for Time-Series Sensor Data
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403228
论文源码:https://github.com/floft/codats
论文摘要:该文针对时序数据提出了一种新颖的卷积深度域适应模型(CoDATS),该模型大大提高了DA策略的准确性,缩短了训练时间。通过组合多源数据,进一步提高了以前的单源方法的准确性,尤其是在域之间具有关联的复杂时间序列。其次,该文利用弱监督,提出了一种新的带有弱监督的域自适应方法(DA-WS)。
Applied Data Science Track
06
论文标题:Attention based multi-modal new product sales time-series forecasting
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403362
论文源码:-
论文摘要:诸如时装等趋势驱动型的零售行业,每个季节都会推出大量新产品。在这种情况下,对这些新推出产品的需求进行准确的预测对于制定有效的下游供应计划(例如分类计划,库存分配等)至关重要。虽然经典的时间序列预测算法可用现有产品来预测销售,但是新产品没有任何历史数据可作为预测的基础。该文提出并评估了几种新颖的基于注意力的“多模式编码器-解码器”模型,这些模型可以纯粹基于产品信息,任何可用的产品属性以及外部因素(例如节假日,事件,天气,和折扣)进行预测。
07
论文标题:Fitbit for Chickens? Time Series Data Mining Can Increase the Productivity of Poultry Farms
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403385
论文源码:https://sites.google.com/site/chickenkdd
论文摘要:鸡是世界上最重要的家禽种类,工业界对家禽福利有越来越多的关注。传感器技术的最新进展使人们有机会记录鸡的行为模式,一些研究小组已经表明可以利用这些数据来提高鸡的福利。但是,对鸡的行为进行分类带来了一些独特的挑战,特别是,某些行为表现为子序列的形状,而其他行为则表现为更抽象的特征。大多数算法仅适用于捕捉某一种模态。这项工作提出了一个通用框架,用于从鸡行为数据集中稳健地学习和分类。
08
论文标题:USAD : UnSupervised Anomaly Detection on multivariate time series
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403392
论文源码:-
论文摘要:IT系统的自动监管是Orange的当前挑战。该文提出了一种基于无监督训练的自动编码器方法,称为多元时间序列的无监督异常检测(USAD)。它使用对抗训练使得在提供快速训练的同时隔离异常。
除了以上论文,与时间有关的研究还包括:
09
论文标题:BusTr: predicting bus travel times from real-time traffic
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403376
论文源码:-
论文摘要:BusTr是一种机器学习的模型,用于将道路交通预测转化为公交车延误的预测,由Google Maps用于服务于世界上大多数未提供官方实时公交车追踪的公共交通系统。
10
论文标题:ConSTGAT: Contextual Spatial-Temporal Graph Attention Network for Travel Time Estimation at Baidu Maps
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403320
论文源码:-
论文摘要:给定路线和出发时间,预估旅行时间的任务(TTE)在智能交通系统中发挥重要作用,现有工作主要采用时空图神经网络来提高交通预测的准确性,其中时空信息是分开使用的;其次,路线的上下文信息,即路线中相邻路段的连接,是影响行驶速度的重要因素。先前的工作主要使用顺序编码模型来解决此问题。该文提出了一个名为ConSTGAT的端到端神经框架,该框架集成了流量预测和上下文信息以解决这两个问题。具体来说,该文首先提出一种时空图神经网络,该网络采用一种新颖的图注意力机制,旨在充分利用时空信息的联合关系。然后,为了有效利用上下文信息,该模型在局部窗口上应用卷积以捕获路线的上下文信息,并进一步采用多任务学习来提高性能。
11
论文标题:Prediction of Hourly Earnings and Completion Time on a Crowdsourcing Platform
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403369
论文源码:-
论文摘要:该文研究了预测众包平台用户未来每小时收入和任务完成时间的问题。该文进行了一些调研发现:金钱激励的优势对用户每小时收入很重要;预测问题具有挑战性:用户和项目高度异构,用户选择新任务需要学习; 该文发布了此数据集。
12
论文标题:CompactETA: A Fast Inference System for Travel Time Prediction
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403386
论文源码:-
论文摘要:预计到达时间(ETA)是DiDi和Uber等在线乘车平台最重要的服务之一。该文开发了一种名为CompactETA的新型ETA学习系统,该系统可在100微秒内提供准确的在线旅行时间推断。在提出的方法中,该文通过在时空加权路网图上应用图注意力网络,将高阶时空相关性编码为复杂的表示形式。该文还通过位置编码对行进路线的顺序信息进行编码,以避免循环网络结构。
13
论文标题:Doing in One Go: Delivered Time Inference Based on Coueriers' Trajectories
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403332
论文源码:-
论文摘要:电子商务的飞速发展需要高效可靠的物流服务。通常要求快递员手动记录每个包裹的准确交付时间,这为诸如交付保险,交付绩效评估和客户可用时间发现之类的应用程序提供了重要信息。该文提出了交货时间推断模型(DTInf),以根据快递员的轨迹自动推断运单的交货时间。该解决方案包括三个步骤:1)数据预处理,可从轨迹中检测停留点,并根据交货行程将停留点和运单分开;2)交货位置更正,它可以通过挖掘历史交货来推断货运单的真实交货位置, 3)基于交付事件的匹配,它为在同一交付位置的运单选择最匹配的停留点,以推断交付时间。
14
论文标题:Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403307
论文源码:-
论文摘要:通过为客户提供便利,例如方便地访问各种餐厅,轻松订购食物和快速交付,按需交付食物(OFD)平台近年来取得了爆炸性的增长。在OFD平台上执行的一项重要的机器学习任务是订单履行周期时间(OFCT)的预测,该时间指的是客户下订单与他/她接收餐食之间经过的时间。OFCT的准确性对于客户满意度很重要,该文介绍了目前在饿了么上部署的OFCT预测模型,该模型是全球最大的OFD平台之一,每天在200多个中国城市提供超过1000万份餐点。通过剖析膳食订单的订单履行周期,该文确定了OFCT背后的关键因素,被输入到深度神经网络(DNN)中。该网络进一步合并了快递公司,餐厅和送货目的地的表示,以增强预测效果。
15
论文标题:HetETA: Heterogeneous Information Network Embedding for Estimating Time of Arrival
论文地址:https://dl.acm.org/doi/10.1145/3394486.3403294
论文源码:https://github.com/didi/heteta
论文摘要:估计到达时间(ETA)是智能运输系统中的一项关键任务,它涉及时空数据。该文提出HetETA在ETA任务中利用异构信息图。具体来说,该文将路线图转换为多关系网络,并引入基于车辆轨迹的网络来共同考虑交通行为模式。此外,该文采用三个组件来分别模拟来自最近时期,每日时期和每周时期的时间信息。每个组件都包含时间卷积和图卷积,以学习ETA任务的时空异构信息表示。
往期推荐
01● AAAI 2020 | 时序转化为图用于可解释可推理的异常检测► 点击阅读 | 01 | ● AAAI 2020 | 时序转化为图用于可解释可推理的异常检测 | ► 点击阅读 |
---|---|---|---|
01 | ● AAAI 2020 | 时序转化为图用于可解释可推理的异常检测 | ||
► 点击阅读 | |||
02● WWW 2020 | 多源时序数据驱动用于窃电行为识别► 点击阅读 | 02 | ● WWW 2020 | 多源时序数据驱动用于窃电行为识别 | ► 点击阅读 |
02 | ● WWW 2020 | 多源时序数据驱动用于窃电行为识别 | ||
► 点击阅读 | |||
03● 【TS技术课堂】时间序列统计分析► 点击阅读 | 03 | ● 【TS技术课堂】时间序列统计分析 | ► 点击阅读 |
03 | ● 【TS技术课堂】时间序列统计分析 | ||
► 点击阅读 | |||
04● 【TS技术课堂】时间序列聚类► 点击阅读 | 04 | ● 【TS技术课堂】时间序列聚类 | ► 点击阅读 |
04 | ● 【TS技术课堂】时间序列聚类 | ||
► 点击阅读 |