论文检索
期刊
全部知识仓储预印本开放期刊机构
高级检索

基于自适应损失函数的句子级远程监督关系抽取OA北大核心CSTPCD

中文摘要

远程监督关系抽取是一种关系抽取方法,现有方法主要采用多实例学习,在具有相同实体对的样例包上进行关系抽取。但是,包级方法只能缓解却并不能完全解决错误标签问题。基于此,文中首先分析了干净数据和噪声数据的分布,提出了一种新的自适应损失函数;在此基础上,提出了一种基于自适应损失函数的句子级远程监督关系抽取方法。在公开数据集NYT-10以及基于TACRED的合成数据集上的实验结果表明:文中提出的方法优于对比文献中的方法,能够更有效地区分错误标签噪声样例和干净样例,提高了句子级远程监督关系抽取的准确率。

胡峰;杨新瑞;汤成富;邓维斌;刘群;

重庆邮电大学计算智能重庆市重点实验室,重庆400065

计算机与自动化

自然语言处理;信息抽取;关系抽取;远程监督;噪声分离;噪声标注;负训练;自适应损失函数

《智能系统学报》 2024 (003)

P.697-706 / 10

国家重点研发计划项目(2018YFC0832102);重庆市教委重点合作项目(HZ2021008);重庆市自然科学基金项目(cstc2021jcyj-msxmX0849).

10.11992/tis.202205034

评论

下载量:0
点击量:2