利用海量知识库实现实体标注的一种方法
【出 处】:
【作 者】:
汤效琴
[1] ;
刘立波
[1] ;
周涛
[2]
【摘 要】
互联网上聚集了大量的文本、图像等非结构化信息,RDF作为W3C提出的互联网上的资源描述框架,非常适合于描述网络上的非结构化信息,因此形成了大量的RDF知识库,如Freebase、Yago、DBPedia等。RDF知识库中包含丰富的语义信息,可以对来自网页的名字实体进行标注,实现语义扩充。将网页上的名字实体映射到知识库中对应实体上称作实体标注。实体标注包括两个主要部分:实体间的映射和标注去歧义。利用海量RDF知识库的特性,提出了一种有效的实体标注方法。该方法采用简单的图加权及计算解决实体标注的去歧义问题。该方法已在云平台上实现,并通过实验验证了其准确度和可扩展性。
相关热词搜索: RDF知识库 实体标注 图加权 去岐义 RDF knowledge bases entity linking graph weighting entity disambiguation
上一篇:一种改进的GPU虚拟化实施方法
下一篇:分布式系统下的DAG任务调度研究综述