知识图谱(知识图谱是什么意思)没想到
说到人工智能技术,人们首先会联想到深度学习、机器学习技术;谈到人工智能应用,人们很可能会马上想起语音助理、自动驾驶等等,各行各业都在研发底层技术
说到人工智能技术,人们首先会联想到深度学习、机器学习技术;谈到人工智能应用,人们很可能会马上想起语音助理、自动驾驶等等,各行各业都在研发底层技术和寻求AI场景,却忽视了当下最时髦也很重要的AI技术:知识图谱。
知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量比如在Google的搜索框里输入科比的时候,搜索结果页面的右侧还会出现科比相关的信息比如出生年月,家庭情况等等。
在知识图谱里,我们通常用“实体(Entity)”来表达图里的节点、用“关系(Relation)”来表达图里的“边”实体指的是现实世界中的事物比如人、地名、概念、公司等,关系则用来表达不同实体之间的某种联系,比如人-“居住在”-北京、张三和李四是“朋友”等等。
通过上面这个例子,大家对知识图谱有了一个初步的印象,其本质是为了表示知识,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图
知识图谱的典型应用包括语义搜索、智能问答以及可视化决策支持三种1、语义搜索当前基于关键词的搜索技术在知识图谱的知识支持下可以上升到基于实体和关系的检索,称之为语义搜索语义搜索可以利用知识图谱可以准确地捕捉用户搜索意图,进而基于知识图谱中的知识解决传统搜索中遇到的关键字语义多样性及语义消歧的难题,通过实体链接实现知识与文档的混合检索。
语义检索需要考虑如何解决自然语言输入带来的表达多样性问题,同时需要解决语言中实体的歧义性问题同时借助于知识图谱,语义检索需要直接给出满足用户搜索意图的答案,而不是包含关键词的相关网页的链接2、智能问答问答系统是信息服务的一种高级形式,能够让计算机自动回答用户所提出的问题。
不同于现有的搜索引擎,问答系统返回用户的不再是基于关键词匹配的相关文档排序,而是精准的自然语言形式的答案智能问答系统被看作是未来信息服务的颠覆性技术之一,亦被认为是机器具备语言理解能力的主要验证手段之一。
智能问答需要针对用户输入的自然语言进行理解,从知识图谱中或目标数据中给出用户问题的答案,其关键技术及难点包括准确的语义解析、正确理解用户的真实意图、以及对返回答案的评分评定以确定优先级顺序3、可视化决策支持。
可视化决策支持是指通过提供统一的图形接口,结合可视化、推理、检索等,为用户提供信息获取的入口例如,决策支持可以通过图谱可视化技术对创投图谱中的初创公司发展情况、投资机构投资偏好等信息进行解读,通过节点探索、路径发现、关联探寻等可视化分析技术展示公司的全方位信息。
可视化决策支持需要考虑的关键问题包括通过可视化方式辅助用户快速发现业务模式、提升可视化组件的交互友好程度、以及大规模图环境下底层算法的效率等那相比传统数据存储和计算方式,知识图谱的优势显现在哪里呢?传统数据库通常通过表格、字段等方式进行读取,而关系的层级及表达方式多种多样,且基于图论和概率图模型,可以处理复杂多样的关联分析,满足企业各种角色关系的分析和管理需要。
知识图谱的应用场景很多,除了搜索、问答和个可视化决策支持外,在不同行业不同领域也有广泛应用,以下列举几个目前比较常见的客户落地场景金融领域的反欺诈场景反欺诈是风控中非常重要的一道环节基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化,非结构)整合在一起,并构建反欺诈引擎,从而有效地识别出欺诈案件(比如身份造假,团体欺诈,代办包装等)。
而且不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题首先,知识图谱提供非常便捷的方式来添加新的数据源,这一点在前面提到过其次,知识图谱本身就是用来表示关系的,这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。
反欺诈的核心是人,首先需要把与借款人相关的所有的数据源打通,并构建包含多数据源的知识图谱,从而整合成为一台机器可以理解的结构化的知识在这里,我们不仅可以整合借款人的基本信息(比如申请时填写的信息),还可以把借款人的消费记录、行为记录、网上的浏览记录等整合到整个知识图谱里,从而进行分析和预测。
这里的一个难点是很多的数据都是从网络上获取的非结构化数据,需要利用机器学习、自然语言处理技术把这些数据变成结构化的数据不一致性验证不一致性验证可以用来判断一个借款人的欺诈风险,这个跟交叉验证类似比如借款人张三和借款人李四填写的是同一个公司电话,但张三填写的公司和李四填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。
再比如,借款人说跟张三是朋友关系,跟李四是父子关系当我们试图把借款人的信息添加到知识图谱里的时候,“一致性验证”引擎会触发引擎首先会去读取张三和李四的关系,从而去验证这个“三角关系”是否正确很显然,朋友的朋友不是父子关系,所以存在着明显的不一致性。
不一致性验证涉及到知识的推理通俗地讲,知识的推理可以理解成“链接预测”,也就是从已有的关系图谱里推导出新的关系或链接比如在上面的例子,假设张三和李四是朋友关系,而且张三和借款人也是朋友关系,那我们可以推理出借款人和李四也是朋友关系。
组团欺诈相比虚假身份的识别,组团欺诈的挖掘难度更大这种组织在非常复杂的关系网络里隐藏着,不容易被发现当我们只有把其中隐含的关系网络梳理清楚,才有可能去分析并发现其中潜在的风险知识图谱,作为天然的关系网络的分析工具,可以帮助我们更容易地去识别这种潜在的风险。
举一个简单的例子,有些组团欺诈的成员会用虚假的身份去申请贷款,但部分信息是共享的张三、李四和王五之间没有直接的关系,但通过关系网络我们很容易看出这三者之间都共享着某一部分信息,这就让我们马上联想到欺诈风险。
虽然组团欺诈的形式众多,但有一点值得肯定的是知识图谱一定会比其他任何的工具提供更佳便捷的分析手段失联客户管理除了贷前的风险控制,知识图谱也可以在贷后发挥其强大的作用比如在贷后失联客户管理的问题上,知识图谱可以帮助我们挖掘出更多潜在的新的联系人,从而提高催收的成功率。
现实中,不少借款人在借款成功后出现不还款现象,而且玩“捉迷藏”,联系不上本人即便试图去联系借款人曾经提供过的其他联系人,但还是没有办法联系到本人这就进入了所谓的“失联”状态,使得催收人员也无从下手那接下来的问题是,在失联的情况下,我们有没有办法去挖掘跟借款人有关系的新的联系人?而且这部分人群并没有以关联联系人的身份出现在我们的知识图谱里。
如果我们能够挖掘出更多潜在的新的联系人,就会大大地提高催收成功率比如借款人跟李四有直接的关系,但我们却联系不上李四那有没有可能通过2度关系的分析,预测并判断哪些李四的联系人可能会认识借款人这样就可以更有效的找到借款人。
知识图谱是一个既充满挑战而且非常有趣的领域。只要有正确的应用场景,对于知识图谱所能发挥的价值还是可以期待的。而且一定会普及到各个领域当中。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186