记者 | 周翔
8 月 13 日至 8 月 17 日,国际数据挖掘领域的顶级会议 ACM SIGKDD 2017 在加拿大的 Halifax 召开。此次大会共有 1144 篇提交论文(中国占 13%),但最终只有 216 篇被收录。
根据官网信息,此次课程的主题为:Convolutional Neural Networks for Visual
据AI科技大本营了解,SIGKDD 是美国计算机学会 ACM 旗下数据挖掘和知识发现的专业组织,KDD 的英文全称就是 Knowledge Discovery and Data Mining。SIGKDD 每年主办的 KDD 大会,是该领域的最高学术会议,每年都吸引两千多与会者,大部分来自产业界,学术论文的接收比例不超过 20%。
在今天的开幕式上,备受瞩目的三项论文大奖终于揭晓。这三项大奖分别是 Best Paper & Best Student Paper Award(最佳论文 / 最佳学生论文奖 )、Applied Data Science Best Paper Award(最佳应用论文奖)、以及 Doctoral Dissertation Award(博士论文奖)。
论文标题:Accelerating Innovation Through Analogy Mining
论文作者:Tom Hope,Joel Chan,Aniket Kittur,Dafna Shahaf
论文摘要:
大型点子存储库(例如美国专利数据库)可以通过向人们提供类似问题解决方案的灵感,来加速创新和发现过程。然而,想要在这些大型、凌乱的现实世界资源库中发现有用的类似信息,对于任何人或者自动化技术来说仍然是一个持续的挑战。以前的方法包括,具有高度关联结构(例如谓词演算表征)但是非常稀疏,且成本高昂的人工创建的数据库。更简单的机器学习 / 信息检索相似性度量可以扩展到大型的自然语言数据集,但是它很难解释结构相似性,而这是类比的核心。
在本文中,我们探讨了学习更简单的结构表征的可行性和价值,特别是“问题模式”,它规定了产品的目的,以及实现该目的的机制。我们的方法结合了众包和循证神经网络,以此来提取产品描述中的目的和机制向量表示。我们证明,这些学习到的向量比传统的信息检索方法有着更高的精度,而且能更快地找到类比。
在一个思想过程的实验中,与传统方法相比,我们模型检索的类比显着提高了人们产生创意的可能性。我们的研究结果表明,学习和利用较弱的结构表征,是一个有前途的大规模计算的方法。
论文作者:David Hallac, Sagar Vare, Stephen Boyd, Jure Leskovec
最佳应用论文奖
Winner
论文标题:HinDroid: An Intelligent Android Malware Detection System Based on Structured Heterogeneous Information Network
论文作者:Yanfang Ye,Shifu Hou,Yangqiu Song
随着 Android 系统恶意软件数量的爆炸性增长,Android 恶意软件的检测在网络安全领域已经变得越来越重要。Android 恶意软件越来越复杂,我们需要采取新的防御技术,来抵御这些威胁。
在本文中,为了检测 Android恶意软件,而不是仅使用应用程序编程接口(API)调用,我们进一步分析它们之间的不同,并创造了更高层次的语义,这让攻击者逃避检测更加困难。
我们将 Android 应用程序、相关的 API、及其与结构化异构信息网络(HIN)的丰富关系作为代表,然后我们使用基于 metapath 的方法来表征应用和 API 的语义相关性。我们使用每个元路径来制定 Android 应用程序的相似性度量,并使用多内核学习聚合不同的相似之处,再然后,每个元路径都由学习算法自动加权来进行预测。据我们所知,这是第一个使用结构化 HIN 进行 Android 恶意软件检测的工作。我们对来自 Comodo Cloud Security Center 的实体样本收集进行综合实验,比较了各种恶意软件检测方法。实验结果表明,我们开发的系统 HinDroid 优于其他 Android 恶意软件检测技术。
论文作者:Thomas Vandal, Evan Kodra, Sangram Ganguly, Andrew Michaelis, Ramakrishna Nemani, Auroop R Ganguly
博士论文奖
Winner
论文作者:Bryan Perozzi
论文作者:Alex Beutel
论文作者:Evangelos Papalexakis
论文作者:Yuxiao Dong
任务1:Travel Time Prediction
Hengxing Cai, Sun Yat-sen University, Guangdong Key Laboratory of Intelligent Transportation Systems (Team Leader)
Runxing Zhong, Beihang University
Chaohe Wang, Southwest Jiaotong University, Intel
Ruihuan Zhou, Southwest Jiaotong University
Kejie Zhou, University of Chinese Academy of Sciences
Hongyun Lee, University of Chinese Academy of Sciences
Kele Xu, National University of Defense Technology
Zhifeng Gao, Peking University
Renxin Zhong, Sun Yat-sen University, Guangdong Key Laboratory of Intelligent Transportation Systems
Jiachen Luo, Sun Yat-sen University, Guangdong Key Laboratory of Intelligent Transportation Systems
Yao Zhou, Chongqing University of Posts and Telecommunications, Tencent
Ming Ding, Beijing China-Power Information Technology Co. Ltd
Lang Li, ChinaTelecom Bestpay Co. Ltd
Qiang Li, Fudan University
Da Li, Beihang University
Nan Jiang, Beihang University
Xu Cheng, China Mobile Communications Corporation
Shiwen Cui, Harbin Engineering University
Hongfei Ye, Shanghai Jiao Tong University
Jiawei Shen, Shanghai China-Cubee Information Technology Co. Ltd
任务2: Volume Prediction