报告题目:大规模多源异构数据非线性建模与量化检索
报告时间:2020年9月20日 上午8:30-10:00
报告地点:铁道学院电子楼206
报告人:杨展
报告摘要:
近年来,随着互联网,物联网,虚拟现实以及脑机接口等技术快速发展,数据呈指数趋势增长,为人类社会迈向“人-机-物”融合一体化智能时代提供基础资源,然而,异构性、多源性、跨网络、非一致性、非完整性已经成为当今跨网络多源数据的主要特征,在丰富对客观世界描述的同时也给数据挖掘领域带来了巨大的挑战。因此,如何有效的对大规模多源异构数据中蕴含的知识进行挖掘和检索是当前信息检索领域研究中的重要技术之一。本报告主要围绕面向大规模异构数据难以组织、难以建模、难以融合、难以检索等问题,提出了一个新颖的非线性鲁棒离散哈希方法。模型背后的主要思想源于神经网络(即非线性描述符)在表征学习领域的成功,而用非线性描述子代替简单的线性变换,更符合现实世界中常见的潜在表示与异构多媒体数据之间存在的复杂关系。在提出的模型中,我们首先通过非线性描述符学习一种常见的潜在表示,以编码异构多媒体数据的互补性和一致性信息。实验结果表明了提出方法的有效性。