报告题目:持续项元素挖掘
报告人姓名:戴海鹏 副教授
报告人单位:南京大学计算机科学与技术系
报告时间: 10月29日9 :00-11 :00 ,
报告地点:计算机楼212会议室
报告人简介:
戴海鹏,博士,副教授。 2007年获上海交通大学电子系(教改联读班)学士学位,2010年获上海交通大学电力电子与电力传动专业工学硕士学位,2014年获南京大学计算机科学与技术系工学博士。曾获ACM中国新星奖(全国2人入选),江苏省计算机学会优秀博士学位论文,全国高校物联网创新大赛一等奖及最佳指导教师奖等荣誉称号。主要研究方向为物联网,移动计算,数据挖掘等。发表和接收论文120余篇(含CCF A类40篇),包括ACM SIGMETRICS ,ACM MobiHoc ,ACM MobiSys ,ACM Ubi C omp ,IEEE INFOCOM ,VLDB ,IEEE ICDCS ,ACM / IEEE TON ,IEEE JSAC ,IEEE TPDS ,IEEE TMC等国际一流会议期刊。曾获CCF A类会议INFOCOM最佳论文提名奖、CCF B类会议ICNP最佳论文奖及SECON最佳论文奖亚军。主持和参与国家自然科学基金面上项目、国家重点研发项目在内的项目十余项。担任中国计算机学会物联网专委会、网络与数据通信专委会委员;YOCSEF南京分论坛主席等职务。担任重要国际学术会议如ACM MobiHoc、IEEE INFOCOM、IEEE ICNP、IEEE ICDCS、IEEE/ACM IWQoS、IEEE IPDPS等程序委员会委员。担任ICNP、ICCCN等近十次会议主席职务。担任五十多个国际一流刊物如ACM/IEEE TON、IEEE JSAC、IEEE TPDS、IEEE TMC、IEEE TKDE审稿人。
报告摘要:
随着移动互联网、物联网等技术不断发展,全球数据量呈爆炸性增长趋势,数据形态亦由传统静态数据向海量动态数据转变,针对性的流式数据挖掘已成为学术界研究热点。报告将首先介绍持续项元素挖掘问题。不同于传统频繁项元素挖掘寻找出现频率较高的元素,持续项元素挖掘旨在寻找在时间维度上持续出现的元素。该问题应用广泛,如检测隐蔽DDOS攻击或点击欺诈检测等。然后,将重点介绍在集中式和分布式场景中持续项元素挖掘系列工作。主要涉及如何设计sketch数据结构,及利用Raptor Code编码等关键技术设计具有性能保障的概率型算法。最后,将阐述对未来工作的展望。