报告题目:知识图谱协同的实体关系抽取
报告时间:2021年3月13日 上午8:30-10:30
报告地点:铁道学院电子楼206
报 告 人:黄文体博士
报告摘要:
关系抽取是信息抽取和自然语言处理领域的一个重要分支任务,旨在从非结构化的文本数据中获取实体间的语义关系。目前,关系抽取已经取得了长足发展,其性能提升的方法主要分为两个主流方向:一方面是使用结构更加复杂的神经网络模型来获取更加精确的文本关系特征,例如强化学习、生成对抗网络以及BERT模型。利用高性能的神经网络模型可以取得非常显著的关系抽取效果,但是复杂的神经网络模型结构设计困难,并且需要消耗巨大的计算资源完成模型训练。另一方面,利用现有的外部词汇资源,例如知识图谱、实体描述、关系别名等信息都是提升关系抽取性能的增补信息,因为这些信息是模型的训练语料中无法直接提供的。远程监督就是一个典型的利用外部资源促进关系抽取的方法,它引入知识图谱中的关系类型当作标注文本数据的标签,并为关系抽取模型产生大量的训练数据。这些外部资源获取方便,并且其有效性大多得到了人类知识的验证。因此,如何利用外部资源中丰富的人类先验知识提升关系抽取的性能,是目前关系抽取领域的主流研究方向。