计算所国重实验室斩获2篇SIGCOMM论文

  ACM SIGCOMM 是计算机网络领域最具影响力的顶级国际会议,多项重大网络技术突破如软件定义网络(SDN)等均最先在此会议上发表。每年ACM SIGCOMM录用论文一般不超过40篇,是计算机科学领域竞争最激烈的会议之一。1987年迄今,以国内研究所、高校(不包括微软亚洲研究院)为第一单位发表的论文不超过10篇。本届会议收到稿件共220篇,经过严格的同行评审,最终录用40篇,录用率在18%左右,竞争非常激烈。

  中科院计算所计算机体系结构国家重点实验室在ACM SIGCOMM 2018上收获了2篇论文。此次以第一单位被录用的论文为“SketchLearn: Relieving User Burdens in Approximate Measurement with Automated Statistical Inference”。作者包括实验室黄群副研究员、香港中文大学李柏晴(Patrick P. C. Lee)教授与实验室包云岗研究员。这篇论文也是计算所历史上第三篇ACM SIGCOMM论文。

  这篇论文重点解决了计算机网络测量中近似算法的可用性问题。近似算法是网络测量的核心技术。由于资源开销小、能有有效处理海量的网络数据,长期以来近似算法一直是网络测量领域的研究热点之一。然而,近似算法在实际部署时,需要用户深入理解内部数学、统计原理并由此进行正确配置,才能达到良好应用效果,由此造成了极大的用户负担。本文首先从根本上分析了用户负担的根源:近似算法的本质在于用有限的资源处理海量数据,因此需要合理资源配置来减少不可避免的资源冲突。而本文提出的SketchLearn框架,提出了一种全新的方法论来处理近似算法中的资源冲突:SketchLearn的目的不是通过先验的配置消除冲突,而是试图后验地刻画冲突性质来提升网络测量效果。


SketchLearn架构

  基于该思想,SketchLearn设计了一个全新的多级数据结构(图1左半部分),并对该数据结构中的资源冲突建立了一个统计模型。结合该模型,SketchLearn提出了一个完全自动化的统计推断算法(图1右半部分),可以将网络数据分解成两个独立的部分,从而消除两部分之间的资源冲突。由于该统计推断过程完全自动化执行,由此极大程度的减轻了用户的使用负担。SketchLearn还扩展了网络测量查询接口,统计推断结果实现了通用的全网统计信息查询能力。SketchLearn目前已经在OpenVSwtich DPDK与P4硬件交换机两个平台上实现。实验显示,SketchLearn在减轻用户负担的同时,在吞吐率、内存开销、测量精度、通用性等各项指标上对比现有方法均有显著提升。

  另一篇被录用论文“Elastic Sketch: Adaptive and Fast Network-wide Measurements”由实验室黄群副研究员与北京大学杨仝助理研究员(第一作者,2013年-2014年间在计算所从事访问研究)团队合作发表。计算所与北京大学有着悠久的渊源与合作,这篇论文是建立良好合作交流关系的又一体现。

  作者介绍:

  黄群,中科院计算所副研究员。2011年本科毕业于北京大学计算机系,2015于香港中文大学取得博士学位。2015年至2017年间,任职华为(香港)未来网络理论实验室,带领团队研究设计的SketchVisor网络测量框架发表于ACM SIGCOMM 2017,是华为历史上首篇SIGCOMM论文,获华为公司“总裁奖”。2017年加入计算所后,继续在网络测量、分布式流式处理、网络功能虚拟化、区块链/闪电网络等领域展开研究,2018年ACM SIGCOMM再次有2篇论文被录用。