主页 > imtoken下载链接 > 查看知识图谱在5大智能领域的应用

查看知识图谱在5大智能领域的应用

imtoken下载链接 2023-03-29 07:12:39

简介:知识图谱工程实践只是迈向智能的第一步。丰富的结构化知识是有用的,但如何将这些符号知识融合到计算框架中仍然是一个挑战。通过与各种自然语言处理算法或模型、知识驱动的显性事实知识和隐性语言表示相结合,整合语言知识,可以发挥认知智能的力量,促进常识理解和推理能力的进步。

01 语义匹配

语义匹配是搜索推荐、智能问答和决策辅助的基础。在没有知识图谱之前,文本匹配主要依靠文字匹配,通过数据库搜索得到匹配结果。但是,这种方法存在两个问题。一方面,文本输入本身的限制导致检索的遗漏;另一方面,检索结果的评价缺乏可解释性,排名受到质疑,往往找不到想要的结果。

知识图谱的出现有效地解决了以上两个问题。一方面,通过关键词扩展获得更多的输入效果。结果的解释和描述,进一步扩展输入。如果输入的是句子文本,结合角色标注也可以获得语义理解的效果。

在语义匹配方面,知识图谱从几个方面增强智能,如图4-12所示。

▲图 4-12 知识图谱增强语义匹配智能

1.关键字增强

首先定义一组词,如同义词、下义词等词。当检索到一个关键字时,也通过图搜索来检索与该关键字相关的其他词,用于扩展或约束搜索。全面准确地找到您需要的信息。

2. 实体链接(对齐)

对用自然语言描述的问题进行语法和语义分析,然后将其转换为结构化的查询语句。直接在图表中查询甚至点击答案,而不是召回大量的网络链接。例如,搜索“茶圣的工作是什么?”将返回答案“茶经典”。其中茶圣链接到陆羽,然后从陆羽的知识卡中找到作品的标题。

3.概念匹配

基于已建立的知识库,通过图形用户界面(可视化本体概念树)或关键词提交查询,系统、快速、有效。检索概念的所有实例。在地图中搜索“机器人”可以查看与概念相关的实例(如软体机器人、码垛机器人等),即概念的下义词。

通过概念关系,也可以得到上下游链中的概念,从而帮助我们细化知识选择,提高概念检索的范围。实现从网页链接到概念链接的过渡,支持以概念主题代替字符串检索。以图形方式向用户展示分类的结构化知识,让人们无需手动过滤网页来寻找答案。

4. 句间关系匹配

句间关系匹配是对两个短语或句子之间的关系进行分类,常见的句间关系匹配如自然语言推理(Natural Language Inference,NLI)、语义文本相似度(Semantic Textual Similarity,STS)等. 通过关系分类或预测,可以从句子层面计算语义匹配,提高语义分析能力。

02 搜索推荐

在大数据时代,每天都在产生海量的信息,快速准确地获取感兴趣的文本变得越来越困难。没有机会被发现或注意到。从自然语言输入输出的角度来看,搜索可以看成是被动推荐,推荐也可以看成是自发搜索,所以在一定程度上可以一起讨论。

早期基于用户输入进行搜索,通过索引和输入文字匹配获得结果召回,无法获得准确答案,有很强的局限性。依靠知识图谱实现语义扩展区块链通俗易懂的图片解释,可以获得更好的排序和召回结果。图 4-13 所示的搜索过程的几个方面反映了知识图谱智能的力量。

1.实体和概念识别

对于用户输入的自然句,通过预处理、查询纠错、分词、词向量模型、句法分析和模式进一步实现挖掘。将搜索推荐的查询语句映射到词向量空间,并建立合适的向量表示学习模型来识别概念模式、实体类型和实体。

▲图4-13搜索推荐的主要内容

2. 查询意图理解

执行以上实体和概念查询,在知识图谱中完成实体链接和概念模式匹配。实体理解是通过计算本地实体链接、短文本链接和跨语言链接来获得的。进一步配合多案例归纳,实现概念理解。综合查询扩展内容、意图分类或匹配,完成对搜索意图的判断。

3.查询语句生成

根据意图分析或模板匹配,进一步根据查询位置或查询重要性,生成SQL查询语句或SPAQRL语句。

4.回答推荐和评价

对上述查询得到的召回答案进行排序,然后评估搜索效果,改进搜索逻辑。得益于知识图谱的加持,通过基于知识图谱注入辅助信息(如实体、关系、属性),我们可以对用户、产品、行为进行详细的画像。

例如,用户信息可能包括用户 ID、用户属性(性别、年龄、地区)或以前查看过的文本。项目是推荐的实体,例如视频、歌曲或书籍。行为可以包括查询/上下文、点击、浏览、收藏、交易等。这些信息有助于查询排序。

推荐可以看作是主动搜索,但它往往不能解决交互稀疏和冷启动的问题。基于约束和实例的推荐引入外部信息,赋予推荐系统常识推理的能力。在一定程度上可以看成是一种推理,可以解决冷启动问题。针对交互稀疏的问题,可以利用知识图谱的图结构,将搜索推荐交互视为“实体-关系”路径,从而基于路径计算预测文本偏好。

03 问答对话

近年来,问答对话受到了广泛的关注,尤其是借助知识图谱,使得知识图谱问答有了很大的发展。由于对话可以看成是多轮问答,所以只简单描述为问答。知识图谱问答直接根据用户问题的语义在知识图谱上进行搜索推断,并将知识图谱作为先验知识融入问答中,得到匹配的答案。

优点包括:处理后的数据质量高,所以图问答的答案更准确,检索效率更高,可以支持推理。这种问答方式是自动的、准确的和直接的。它是一种新型的搜索引擎,其智能如图4-14所示。

▲图4-14问答对话的智能

1. 问题意图识别

将用户意图分为关系查询、属性查询、比较、判断等不同类别。设计句子模板,进行匹配判断,或通过实体链接和属性匹配进行识别。例如,如果实体和属性直接匹配,则返回属性值或关系名称;或者根据图计算方法标注意图。目前比较流行的基于深度学习的方法,通过输入句表示学习,完成意图分类。

2.实体识别与连接

意图识别完成后,需要进行实体识别和连接,识别问题中的实体,并对应知识图谱实体。如果存在多个候选链接结果,则执行消歧。基于第三章介绍的文本标注、文本匹配、图计算方法,最终返回最佳识别或链接结果。

3.槽位和关系识别

识别问题中的实体、约束和关系,并从候选关系中选择语义匹配最高的关系路径。这主要通过槽填充或关系识别来完成。通过实体约束判断主实体和约束关系,通过实体链接和排序模型给出问题关系路径识别。

4.疑问句改写

在关系路径识别的基础上,对输入的疑问句进行同义改写。需要判断改写后的查询语句与原输入问题的语义一致性,只有语义相同的问题的改写对才能生效。在不改变用户意图的情况下,尽可能多地召回满足用户意图的搜索结果。

5.答案排序与评价

调用排序模块对召回结果进行合并过滤。基于关键词串、知识扩展、场景匹配等综合评分。在验证评估方面,通过语义验证集和日志采样标注集分析,对离线和在线问答模型进行优化评估。

语义验证集通过对同义业务记录的抽样得到,日志抽样标注集通过对用户历史日志的直接匹配、推荐或标注得到。同时,通过与文本问答的数据融合,进一步逆向补充和更新知识图谱,从而完成知识生命周期的闭环。

04 推理决策

推理决策是知识图谱智能输出的主要方法,一般用于知识发现、冲突和异常检测,是知识细化工作和决策分析的主要实现方式。知识推理的常用方法包括本体推理、规则挖掘推理和表示学习推理。针对不同的应用场景,选择不同的推理方法。

在实际应用中,基于本体结构和定义的规则进行确定性推理。通常需要根据已知事实反复迭代和使用规则。如下图4-15所示,要推理杨宗宝和杨金华的关系,需要进行规则的构建和迭代。可以推断出如下关系:hasChild(杨宗宝,杨金华)。

根据图中已知的关系路径构建推理路径。通过快速加载增量知识和规则,推理产生新的数据和更多的实体链接和关系,这需要知识图谱推理引擎的支持。

在时间序列知识图谱条件下,粒度较大、动态演化的事件图主要描述两个方面:一是事件识别,二是事件影响分析。

事件识别可以理解为对事件的建模,也可以理解为对事件本体的构建。例如,诉讼事件可以简单地建模为{事件类型:诉讼事件;影响对象:公司;情绪分析:-0.5;活动热度:0.8;事件影响程度:0.@ >5};还可以进行更复杂的建模,识别原告、被告、诉讼金额、诉讼地点等,从而更准确地描述事件。

▲图 4-15 基于规则的直接推理

事件的影响分析有两个维度,一是事件回测,二是事件传播的影响。事件回测就是对历史上类似事件的发生情况做一个统计分析,目的是看看历史上类似事件发生后对相关公司会产生什么样的影响。

通过事件识别出击中某事件主体的企业链信息、股权链信息、产业链信息。事件本身的正反面、影响力和流行度会沿着知识图谱实体的关系网络传播,对这种传播的影响进行定性或定量分析。对于行业数据的实时查询和联动分析,通过学习上述文本的表示,可以预测事件之间的关系,帮助企业实现因果逻辑推理和决策。

比如原材料价格上涨,对行业上下游企业会产生什么影响?从生产的角度,通过对市场前景的预估,分析自己和竞争对手的产量、成本和利润率。例如,从供求关系出发,计算市场容量、供求关系,减少定价政策的盲目性。这类问题的出发点是一个具体的事件,要寻求的答案是对事件影响的分析。

05 区块链合作

从知识到价值,如何确认知识所有权和定价以实现数字价值?知识图谱是信息沉淀的最终形式,从知识定价衡量价值是最合适的定价方法。由于区块链最大的优势在于数据的一致性、不变性和透明性,将知识图谱与区块链结合可以生成知识认证或知识令牌。

Knowledge Token 是一种权益证明和使用权证,具有可交换性和可计量性,允许在使用过程中为知识付费。通过区块链促进知识的价值传播,让任何具有传播价值的行业都可能被重塑。例如,属于用户的行为知识和画像知识可以通过区块链确认,通过流通实现,为用户的权益赋予价值,进一步激发用户对知识贡献的积极性。这就是未来知识价值生态系统的发展模式。

那么区块链如何与知识图谱配合?事实上,语义网的早期概念包括知识互联、去中心化架构和知识可信。如今,知识图谱在一定程度上实现了“知识互联”的概念,进一步可以从知识认证和去中心化架构两个层面思考解决方案。

1.知识一致性验证

众筹和知识验证是当前许多知识图谱项目面临的挑战。由于数据来源广泛,知识的可信度测量需要在实体层面进行。如何对海量事实进行有效的管理、跟踪和认证,成为区块链技术在知识图谱领域的重要应用方向。

如互联网法院电子证据存储区块链平台,通过时间、地点、人、事前、事中、事后六个维度解决数据鉴权问题,允许生产、存储、存储的电子数据。传播和使用实现了整个过程的可信度。

从链接上看,互联网上的案件信息是互通的,任何链接的电子证据都可以被抓取。比如网购案例中的淘宝订单,通过实名认证、时间戳、加密、隐私保护、风控、信用评估等,使分布在多个节点的证据一一对应,使诉讼信息能够被积累、挖掘和应用。为了验证知识的一致性,完成认证工作。

2.去中心化价值图

过去,由于知识分散,知识发布者很难完全控制。近年来,区块链技术正在实现去中心化实体ID管理、基于分布式账本的术语和实体名称管理、基于分布式账本的知识溯源、知识签名和权限管理等功能。面对传统产业链生态区块链通俗易懂的图片解释,需要重新分配商业价值,实现价值共享。

去中心化的基于区块链的确权就是为此而生,让每个个人和每个组织都可以根据自己的劳动和生产力发行代币,形成群体协作,可以公平分享价值,促进自组织价值的构建生态系统。因此,通过区块链的共识机制,在分布式条件下实现价值分配,将知识图谱转化为价值图谱。