概况
SIGCOMM(ACM Special Interest Group on Data Communications,ACM数据通信专业组)、MobiCom(ACM International Conference on Mobile Computing and Networking,ACM移动计算和网络国际会议)、INFOCOM(IEEE International Conference on Computer Communications,IEEE计算机通信国际会议)是通讯网络领域的三大顶级会议,长期以来被中国计算机学会(CCF)推荐为A类国际学术会议。
学术界的相关学者对这三大会议每年的热点和发展趋势都有自己的估计和预期。然而这些估计大多是基于表层的信息统计,缺乏规范、系统化的深层分析,致使科研人员无法从中获得更加精确的结果和更有用的信息。
上海交通大学AceMap学术搜索组收集整理了过去近10年间发表在上述三大会议上的论文,通过抽取、分析论文关键词,发掘出许多有价值的信息。相关学者可以对这些会议的侧重点、每年的热点、未来的趋势有一个更清晰的理解,进而帮助学者决定研究方向和向目标会议投稿。
会议对比
三大会议2007~2014年接收的论文数与接收率如图1所示。每个会议每年接收的论文数量基本持平,INFOCOM接收的论文数远远超过另外两个会议。在接收率方面,MobiCom和SIGCOMM比INFOCOM平均低5个百分点,接收难度较大。
论文中的关键词蕴含着有价值的信息。我们收集整理了2003~2014年发表在三大会议上的论文的关键词和摘要,并做了进一步统计与分析:每4年视作一个周期,统计了三大会议论文中在每个周期内出现次数最多的5个关键词(如表1~3所示)。
在SIGCOMM中,三个周期内出现最多的关键词分别是routing(路由),routing和wireless(无线)。BGP(Border Gateway Protocol,边界网关协议)也频繁出现。而在2011年之后,论文的关键词出现了无线网络、数据中心、软件定义网络等,反映了当前学术界关注的热点的变化。
在MobiCom中,三个周期内出现最多的关键词分别是wireless networks(无线网络),wireless和wireless。Wireless连续占据第一的位置,表明该会议侧重于移动及无线方向。
在INFOCOM中,三个周期内出现最多的关键词分别是telecommunication traffic(远程通信量),peer to peer computing(对等计算)和throughput(吞吐率)。
为了更直观地区分会议的侧重点,我们挑选了8个关键词,将这8个关键词在SIGCOMM和MobiCom中出现的频数用雷达图的形式表现出来(如图2所示)。选取这两个会议比较的原因是因为它们的规模相近。在雷达图中,尺度进行了取模的变换。通过雷达图可以观察到,SIGCOMM中peer, BGP及data出现的次数远超MobiCom,而MobiCom有许多论文涉及到wireless, mobile, localization和ad hoc。这进一步证明了两个会议的侧重点不同。
论文摘要所蕴含的信息也有助于对三大会议进行解读。通过预处理去除摘要中常见的词之后,每个会议所构建出的词云如图3所示。
从总体看,词云中出现的词大多与网络方向紧密相关,且“network”这个词在三大会议中均占据很大的比重,说明三个会均是网络方向的会议。在MobiCom中,wireless和mobile均十分重要,与MobiCom的会议名称和主旨相吻合。SIGCOMM中有一定量的论文讨论traffic及routing,表明该会议对路由及通信方面的兴趣。而INFOCOM中并没有特别突出的词汇,各个关键词相对平均,关注点比较分散。
关键词统计
SIGCOMM和MobiCom每年接收的论文数量较少,关键词总量并不多,不能清晰地通过关键词获取领域发展趋势等信息。因此,我们对2003~2014年的INFOCOM论文中出现次数最多的15个关键词进行了汇总分析,结果如图4~6所示。
INFOCOM 2013年的论文中,routing, delay和protocols分别出现57, 55和44次,即INFOCOM在2013年接收的所有论文中,有57篇论文的关键词有routing,55篇提到了delay,有44篇与protocol相关。
在2010年的INFOCOM中,排名第一的关键词是出现了140次的peer to peer computing,第二是telecommunication traffic,出现了115次,throughput出现了94次,位列第三。在2011年的关键词中,delay出现了60次,排名第一,routing以59次紧随其后,排名第三的是throughput,出现了54次。
由此看出,对等计算是2010年的一大热点。而在2011年,对等计算从第一名降至10名之外,退出了通讯网络领域的主舞台。Mobile communication(移动通信)在2010年并不是研究热点,被排除在15个最热关键词之外,而到了2011年,mobile communication赫然出现在15个最热关键词列表中。随着移动互联网的快速发展,学术界越来越重视移动通信领域。
由于社会需求不断变化、技术不断发展以及研究的透彻程度不一,一些关键词存在兴盛期和衰弱期,随着时间的变化而起伏。而有一些关键词相对较为平稳,每年出现的频数保持在某个值左右,方差较小,这些关键词往往应用范围较宽泛,并且是领域内长期关注的问题。
关键词趋势分析
我们挑选了INFOCOM中一些有代表性的、在论文中出现次数较多的关键词进行了趋势分析。其中peer to peer computing, mobile communication, ad hoc networks的趋势变化如图7所示。
Peer to peer computing这个关键词在2010年的INFOCOM论文中出现了140次,在2011年和2012年分别出现了29次和22次,而在随后两年INFOCOM的论文中并未出现此关键词。
一些关键词以前不为人知,而近年来成为热点。例如2010年之前,每年只有不超过10篇论文提到mobile communication。而在2010年之后,关于mobile communication的论文数稳步增长,并在近两年超过了30篇。
另一些关键词则经历了从高峰跌落到低谷的过程。例如peer to peer computing 和telecommunication traffic,这两个关键词在2006~2010年之间每年都会在INFOCOM中各出现50次以上。而在2010年之后,它们经历了一个较大的滑坡,近两年更是无人问津。随着与这两个关键词相关的研究逐步深入和透彻,加上新技术带来的吸引力,学术界逐渐放弃了对陈旧问题的研究,而转向一些更新、更有潜力的技术。
还有一些关键词在论文中出现的频率相对比较稳定,每年只有较小的浮动,并没有明显的兴盛时期。这类关键词一般比较普遍,并且是领域内相对基础和重要的元素。如routing和throughput,作为通信领域的两个基础元素,它们每年在INFOCOM的论文中都会出现几十次,波动不明显,可谓经久不衰。
我们在关键词趋势分析的基础上,以3年为一个周期,进一步计算了相邻周期中所有涉及特定词的关键词频率(例如关键词wireless communication和wireless networks都包含特定词“wireless”),结果如图8所示。
与之前结果类似,涉及“peer”, “ad hoc”的关键词出现的频率表现为下降趋势,涉及“data”, “mobile”的关键词出现的频率表现为上升趋势。涉及“wireless”的关键词出现的次数虽然每年都很大,但趋势是下降的。
展望
在对SIGCOMM, MobiCom, INFOCOM这三个通讯网络领域的顶级会议进行分析之后,发现许多有价值的信息值得去挖掘。
基于上海交通大学AceMap学术搜索组的数据,可以对更多领域、级别的会议和期刊进行数据收集和分析,并得出分析结果,为广大学者提供帮助和便利。例如,可以在展现技术发展趋势之余,尝试构建模型预测下一届会议的热点关键词和主题。此外,构建学者在不同会议上的画像也是值得探索的方向。■
图:
表: