领域知识图谱构建

核心提示领域知识图是面向特定领域的知识图谱,如电商、金融、医疗等。相比较而言,领域知识图谱的知识来源更多、规模化扩展要求更迅速、知识结构更加复杂、知识质量要求更高、知识的应用形式也更加广泛。从多个方面对通用知识图谱和领域知识图谱进行了比较分析。下面

知识图谱是针对特定领域的知识图谱,如电子商务、金融、医疗等。相比较而言,领域知识地图的知识来源更多,规模扩张更快,知识结构更复杂,对知识质量的要求更高,应用形式更广泛。从多个方面对通用知识地图和领域知识地图进行了比较和分析。以电子商务、医疗、金融知识地图为例,介绍了领域知识地图的主要特点和技术难点。

电子商务领域知识地图

以阿里巴巴的电商知识图谱为例。最新的知识图谱已经达到了百亿。知识数据主要基于阿里巴巴现有的结构化商品数据,并与行业合作伙伴数据、政府业务管理数据和外部开放数据进行整合和扩展。在知识表示方面,除了简单的三元组之外,还包含了更复杂的层次化电子商务本体和大量用于业务控制的常规知识。

在知识质量方面,对知识的覆盖面和准确性有更高的要求。在应用形式上,支持广泛的应用场景,如商品搜索、商品导购、天猫精灵等商品智能问答、平台治理与管理、销售趋势预测与分析等。电子商务知识还具有高度动态的特点,例如,交易知识和销售趋势相关的知识具有很强的时效性和时效性。

2.医学领域知识地图

医学领域存在大量大规模领域知识库。例如,链接的LifeData项目包含RDF三元组,规模为102亿,包括基因、蛋白质、疾病、化学、神经科学和医学等多个领域的知识。

再比如中国构建的中医知识图谱,通常需要整合基础医学、文献、医院门诊等各种来源的数据。医学领域的知识结构更加复杂,如医学语义网UMLS包含大量复杂的语义关系,而GeneOnto包含复杂的类层次结构。在知识质量方面,特别是与临床决策相关的知识库通常要求完全避免错误的知识。

3.金融领域的知识地图

金融领域的典型例子,如Kensho,利用知识图谱辅助投资顾问和投资研究。以恒生电子为代表的国内金融科技机构以及众多银行、证券机构也在构建金融领域的知识图谱。金融知识图谱的构建主要来源于机构已有的结构化数据和对公开公报、研究报告、新闻的联合提取。

在知识表示方面,金融概念具有较高的复杂性和层次结构,它更多地依赖常规知识来对投资因素进行相关分析。就申请表而言,主要是以财经问答和投资、投资、投研决策分析为主的申请程序。金融知识图谱的一个显著特点是高度动态化,需要考虑知识的时效性,对金融知识的时间维度进行建模。

 
友情链接
鄂ICP备19019357号-22