www.teandq.com
晓安科普

知识库管理员(知识库管理员简称)一篇读懂

2023-10-23Aix XinLe

点击蓝字 关注我们广电领域知识图谱构建方案介绍侯 越,周 亮江苏省广电有线信息网络股份有限公司,江苏 南京

知识库管理员(知识库管理员简称)一篇读懂

 

点击蓝字  关注我们

广电领域知识图谱构建方案介绍侯 越,周 亮江苏省广电有线信息网络股份有限公司,江苏 南京 2100461 现状为了向一线人员提供灵活高效的支撑服务,保障日常培训效果,江苏省广电有线信息网络股份有限公司(以下简称江苏有线)以建立健全涵盖各项业务、分类科学规范、解释权威明确、内容及时有效、维护统筹兼顾、利于操作运用为原则,建设了知识库管理系统(以下简称知识库)。

知识库管理系统目前主要面向公司客服人员和一线工作人员,其功能主要包括知识发布、知识审核、知识纠错、知识补充、历史知识管理等1)知识发布指知识库使用人员(培训专员)将各种渠道获得的知识按照一定的规则分类,归集到相应的知识模块,通过业务知识库管理系统提交审核。

[1]2)知识审核知识库管理员在收到使用人员申请后,审核内容是否正确,审核无误后进行知识的正式发布3)知识纠错当知识库的使用者发现知识库的知识内容存在问题时,如表述不清、内容不全、回答前后矛盾、新旧法规的冲突、或者知识已经失效,说明知识库需要对相关内容进行修订,应提交相关依据和修改方法。

知识库管理员审核无误后进行知识的正式发布知识的纠错是针对原有知识上进行修改,要注意原题的系统性和时效性以及新老政策的衔接     4)知识补充知识库使用人员在查询知识时发现知识库内容存在缺漏或有其他建议时,经与相关部门确认核实后,通过知识库管理系统提交至知识库管理员。

知识库管理员审核无误后进行知识的正式发布知识补充在原有问题上进行补充(包括总部补充和各地补充)时,同时要注重问题的连续和系统性,防止前后补充的问题产生矛盾     5)历史知识管理[2]对于知识库的失效文档统一编辑存放。

知识库管理员对知识库中已失效的知识内容进行失效标记,一方面保证有效信息查询的高效性,另一方面方便后期用户咨询时对历史业务情况的查询2 挑战江苏有线知识库管理系统是基于自上而下的传统知识工程体系建设的,数据存储在关系数据库中。

在应用过程中,发现有如下问题:1)知识冗余[3]随着知识库的知识体量不断增加,知识库会出现知识冗余的现象,即出现本质相同,表述不同的重复知识而且这种现象会随着知识数量增加,不断加剧这种现象不仅对一线人员使用知识库造成了不便,而且影响基于知识库的应用系统的使用效率,如自动对话、智能推荐等。

使用人工审核的方式消除知识冗余现象,费时费力,效率低下2)知识表达不够完备知识表达有缺漏会造成使用者难以找到自己需要的知识及解释,会让对话系统出现“答非所问”的现象例如,一线人员提问“通用帐本欠费,是否影响用户正常收看”,知识库管理系统推送的回答为“数字基本业务需连续欠费达30天之后才会被停机”。

知识库推送的答案并不是一线人员需要的实际上这个问题包含了业务信控规则,账本销账优先级等知识点,但由于传统知识工程架构下,答案在知识库里主要以知识点的形式存在,难以形成知识链,无法产生“以点概面”的效应,所以无法为使用者提供准确的答案。

对使用者来说,知识库中零散的知识点不利于一线人员对相关知识融会贯通,而“答非所问”的现象频频出现,也会让一线人员失去使用知识库的信心和兴趣3)知识更新不及时公司新业务开展和市场政策的调整,都会造成业务知识的更新。

然而目前的知识库管理系统新知识主要还是依赖管理员人工审核发布,有时甚至还要一线人员提醒管理员有关知识已经不能适用于当前业务的最新情况,这样的知识更新方式不仅不能保证时效性,还容易造成疏漏3 探索面对业务知识库管理系统使用过程中遇到的这些问题,除了加强系统的日常运营管理,对知识库的知识进行经常性梳理等管理层面的方法,本文介绍一种从技术架构层面对知识库进行优化改造的方法。

知识图谱(Knowledge Graph)[4]的概念于2012年由Google正式提出,旨在实现更智能的搜索引擎目前,知识图谱在智能搜索、智能问答、个性化推荐、情报分析等领域已经得到了广泛的应用知识图谱,是结构化的语义知识库,其基本组成单位是“实体(Entity)——关系(Relationship)——实体(Entity)”三元组,也就是实体之间通过相互联系的关系,构成知识的网状结构。

如图1,使用了三元组表达方式展示了有线用户,客户、终端以及资源的关系

图1 客户——终端实体关系图随着通信运营商转型过程的逐步推进,广电行业领域知识体系愈发呈现出开放化、动态化、边界模糊的发展趋势,进一步增加了广电领域知识认知的复杂性广电领域急需引入知识图谱这一新兴技术,将有线电视传输行业中的概念、实体、事件以及其间的关系用结构化的方式表达出来,促进人工智能在有线电视传输行业的有序发展。

3.1 知识图谱的构建知识图谱的构建一般包括数据获取、信息抽取、知识整合、知识加工等4个步骤[5]1)数据获取获取对象包括结构化数据、半结构化数据及非结构化数据3大类2)信息抽取江苏有线广电领域知识来源广泛,有来自广电的传统知识工程系统等的结构化数据,还有相关政策法规、行业标准、公司制度以及专家、一线人员的经验等半结构化数据或非结构化数据。

信息抽取就是利用自然语言处理技术将信息中的实体和关系抽取出来3)知识整合简单理解就是把不同知识库的实体描述融会贯通,从而获得实体的完整描述如对有线电视业务来说,“自然人”和“参与人”都是指向同一个实体4)知识加工。

知识加工主要包括本体构造、知识推理和质量评估等3个方面的内容常用的本体构造方法有企业建模法、骨架法、循环获取法、七步法等 本文采用七步法构建本体,七步法构建本体流程图如图2所示

图2 七步法构建本体流程图七步法包括:①确定知识图谱的专业领域和专业范围明确构造的语义本体所覆盖的专业领域、构造目的、作用;②考虑现有语义本体被复用的可能性;③ 列出语义本体中的专有术语有线业务本体建立前,先按专业知识中的重要术语(有线电视行业术语)列出词汇表;④定义类和类的层级体系;⑤定义类的属性。

即对类的内部结构进行描述任意一个类除了本身的属性,还继承其父类的属性;⑥定义属性的限制如赋值类型、赋值范围等;⑦创建实例根据类的属性和知识,创建实例本体构造完成之后,知识图谱的框架便搭建好了,但很多实体之间的关系还是不完整的,需要进一步完善实体间的关系,实体的属性值等,这一过程即知识推理。

知识推理可以从知识库中已有的实体关系资料出发,通过算法推理建立新的实体之间的关联,从而使知识图谱得到扩展和充实例如,在江苏有线业务中,一次性费用不进账本,而时间量商品资费是一次性费用的一种,所以时间量商品资费也不进账本。

最后,质量评估用于量化知识的可信度从而保证了知识图谱的质量和可信度通过以上4个步骤,江苏有线业务领域的知识图谱构建完成,江苏有线业务领域知识图谱也可以划分为订单、客户、商品、账户、服务等5个子领域江苏有线业务领域知识图谱概况如表1所示。

3.2 知识图谱的存储知识图谱主要有两种存储方式:一种是基于RDF语言的存储;另一种是存储于图数据库中RDF存储亦称三元组存储(triplestore),它是专为存储三元组形式的数据而设计的专用数据库,RDF优势在于其语义表达能力强,特别是对本体描述的应用最为广泛。

缺点是空间开销大,而且更新维护代价大图数据库以图模型为基本的展现形式,图中的节点表示知识图谱的实体对象,图中的边表示知识图谱的对象关系图数据库的优点是在查询速度上要优于关系型数据库缺点是图数据库的更新比较复杂,分布式存储实现代价高,数据更新慢,大节点的处理开销很高。

考虑到江苏有线广电领域业务场景较为复杂,多跳查询应用场景较多,本文采用了开源的图数据库软件Neo4j作为知识图谱的存储工具Neo4j由Java实现它根据节点,关系和属性存储应用程序的数据就像关系型数据库以表的“行,列”形式存储数据,Neo4j以“图”的形式存储数据。

知识图谱在Neo4j的存储形式如图3所示

图3 Neo4j数据库存储示例为方便与关系型数据库对接,Neo4j还支持CSV格式文件的导入与导出功能。CSV格式文件示例如表2所示。

4 结果本文以基于知识库的自动问答系统为工具,对传统知识工程和知识图谱技术在业务知识库的应用效率、查询精度、可扩展性等方面进行了比较通过实验发现,知识图谱技术不仅提高了答案推送的准确度,而且提升了答案查询的速度,尤其对于一些复杂的多跳问题。

这是由于关系型数据库只对单个Join操作进行优化查询,而多重Join操作查询的性能显著下降而图数据库由于图形遍历的局部性,无论图中包含多少节点和关系,根据遍历规则,图数据库只访问与遍历相关的节点,不受总数据量大小的影响,从而保持性能。

自动问答系统使用示例图如图4所示

图4 自动问答系统使用示例图此外,知识图谱还支持自动构建技术,可以动态更新和扩充问答知识库,相比较传统知识工程节省了运营成本5 结语通过比较,广电领域拥有知识图谱,不仅提高了知识库的使用效率,在可扩展性和运营成本上也优于传统知识工程,且随着知识数量级的增加,这种优势还会随之扩大。

广电领域知识图谱利用三元组结构来表达广电领域中复杂的实体间关系,最终目的是为了提升多来源、跨平台的数据整合管理和认知能力参考文献[1]代文韬,林诗璐,朱小燕,等.基于知识图谱的保险领域对话系统构建[J].电子技术应用,2019,45(9):18—21,27.

[2]肖仰华.知识图谱与认知智能[EB/OL].(2021—03—25)[2022—06—15].https://mp.weixin.qq.com/s?src.[3]王昊奋,胡芳槐.行业知识图谱构建与应用[EB/OL].(2018—05—11)[2022—05

—20].https://blog.csdn.net/omnispace/article/details/80267609.[4]张帜,庞国明,胡佳辉,等.Neo4j 权威指南[M].北京:清华大学出版社,2017.

[5]谈元鹏.电力领域知识图谱技术进展与应用实践[EB/OL].(2022—05—12)[2022—06—25].https://zhuanlan.zhihu.com/p/513263958.来源:侯越,周亮.广电领域知识图谱构建方案介绍[J].中国有线电视,2022(9):76-79.

有你想看的精彩内容《中国有线电视》杂志征稿启事

扫码关注我们编辑:钟小编审核:赵斌伟

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186

知识知识库管理员(知识库管理员简称)一篇读懂

2023-10-23Aix XinLe69

知识库管理员(知识库管理员简称)一篇读懂点击蓝字 关注我们广电领域知识图谱构建方案介绍侯 越,周 亮江苏省广电有线信息网络股份有限公司,江苏 南京…

百科阿根廷克罗地亚历史战绩(阿根廷克罗地亚历史战绩预测)快来看

2023-10-23Aix XinLe188

阿根廷克罗地亚历史战绩(阿根廷克罗地亚历史战绩预测)快来看本场比赛将是两队历史上的第6次交手,在前5次对阵中,阿根廷和克罗地亚各赢两场,另有一场平局,战绩平分秋色。1994年6月4日 友谊赛 克罗地亚0…

历史历史学家说树林是(历史学家说树林是人类的什么)居然可以这样

2023-10-23Aix XinLe30

历史学家说树林是(历史学家说树林是人类的什么)居然可以这样直立人有很多后代,比如北京人,元谋人,蓝田人,但这些人后来都在历史的长河中灭绝了,只有智人生存了下来,也就是今天的人类。…

探索怎样摄影(怎样摄影人被打飞的场景)一看就会

2023-10-23Aix XinLe57

怎样摄影(怎样摄影人被打飞的场景)一看就会有多少人是因为看到标题进来的,举个手,让我数数多有少人?我说的打飞机不是那种,也不是以下这种。…

科普怎样摄影(怎样摄影人被打飞的场景)干货分享

2023-10-23Aix XinLe172

怎样摄影(怎样摄影人被打飞的场景)干货分享Alpha9+SEL400F28GM+SEL20TC, F6.3, 1/800, ISO 320Alpha 9+SEL400F28GM, F7.…