www.teandq.com
晓安科普

科学知识图谱方法(科学知识图谱方法与应用 电子版)速看

2023-09-19Aix XinLe

知识表示就是研究怎样用计算机符号表示人脑中的知识以及怎样通过符号之间的运算来模拟人脑的推理过程。

科学知识图谱方法(科学知识图谱方法与应用 电子版)速看

 

随着信息技术的发展,人工智能现在成为了计算机科学中一个重要的研究领域,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等人工智能的本质是让机器理解人类的知识,并借助机器强大的运算能力将运算结果以人类可理解的形式呈现出来。

应用人工智能技术解决实际问题,就要将人类的知识以计算机可理解的形式表示出来知识表示就是研究怎样用计算机符号表示人脑中的知识以及怎样通过符号之间的运算来模拟人脑的推理过程一、常见的知识表示方式[1-3]知识表示一直是人工智能领域研究的核心问题之一,学者们针对不同类型的知识,提出不同的表示方式,下面介绍四种常见的知识表示方式。

1.一阶谓词逻辑为了更好的解释一阶谓词逻辑,先介绍命题逻辑命题逻辑又称零阶逻辑,在命题逻辑中,每个字母就代表一个命题, 所以命题逻辑只能表达句子之间的关系, 比如“p&q”, “if p then q”等等的真值如何从p和q的真值中计算出来。

相较于命题逻辑,一阶谓词逻辑补充了谓词和量词例如下列句子:“刘翔是运动员”,“姚明是运动员”在命题逻辑中,它们是两个无关的命题,可以表示为p和q但是在一阶逻辑中,这两个句子将由同一个性质联系起来:Player(x),这里的Player(x) 意味着x是个运动员。

在谓词逻辑中,谓词可分为谓词名和个体两个部分,其中个体是命题中的主语,用来表示某个独立存在的事物或者某个抽象的概念,谓词名是命题的谓语,用来表示个体的性质、状态或个体之间的关系等谓词的一般形式是“P(x1,x2,…xn)”,其中P是谓词名,通常用首字母大写开头的字母字符串表示,x1,x2,…xn是个体,通常用小写字母来表示。

个体变元的取值范围称为个体域(或称论域),个体域可以是有限的也可以是无限的在一阶谓词演算中,合法的表达式称为合式公式,也称为谓词公式谓词公式一般包括联接词和量词如“姚明是运动员,他不喜欢唱歌“,可以用谓词公示表示为:Player(Yaoming)^﹁like(Yaoming, singing)。

一阶谓词逻辑是一种接近自然语言的形式语言,用它表示的知识容易被接受,而且谓词逻辑是二值逻辑,只有真假之分,可以利用它表达精确知识但与之相对应的,一阶谓词逻辑无法表达不确定的知识,同时随着事实性知识和规则的累加,也会造成组合爆炸。

2. 产生式表示产生式表示法由美国数学家E.L.Post于1943年首先提出,他根据符号串替代规则提出了一种称为Post机的计算模型,模型中的每一条规则称为产生式规则产生式表示法的依据是人类大脑记忆模式中各种知识之间大量存在的因果关系,常见的形式为“P—>Q”或”If P Then Q”,有时也写作WHEN-THEN。

其中P一般作为这条规则是否触发的前提条件,Q是一组结论或操作,用于指出当前提P所指示的条件被满足时,应该得出的结论或应该执行的操作,所以整个产生式的含义是:如果前提P被满足,则可推出结论Q或执行Q所规定的操作。

每一条产生式规则可以拥有可信度(CF),可信度使得产生式规则可以用来表示概率性的不确定知识如“有翅膀且会飞的动物80%都是鸟”可以表示为:If “动物有翅膀“ and “动物会飞”, then “该动物是鸟”;CF=0.8

多数较为简单的专家系统都是以产生式表示法表达知识,相应的系统称作产生式系统产生式系统可以分为知识库和推理机两个部分,其中知识库可以分为数据库和规则库数据库往往包括存储的一些事实,多以陈述的形式存在,陈述性的事实通常用三元组来储存。

规则库则是一系列产生式知识的合集,是专家系统的核心,包含了如何将问题从初始状态转换到解的状态推理机是一个控制规则库和数据库协调运行的程序,可包含多种推理方式,如正向推理,反向推理和双向推理等产生式表示法用“IF-THEN”的形式表示知识,这种表示与人类的判断性知识基本一致,直观,自然,便于理解和推理,且知识格式统一便于管理。

同时,产生式表示法既可以表示确定的知识单元,又可以表示不确定性知识但产生的规则在推理过程中每次必须遍历全部规则库,推理是一种反复进行的“匹配--冲突消除--执行”的过程,所以容易降低推理效率,甚至会出现组合爆炸问题。

3. 框架表示框架理论是明斯基于1975年在《A Framework for Representing Knowledge》中提出框架是一种描述固定情况的数据结构,一般可以把框架看成是一个节点和关系组成的网络。

一个框架中有许多终端-被称为槽(Slots)在槽中填入具体值,就可以得到一个描述具体事务的框架,每一个槽都可以有一些附加说明-被称为侧面(Facet),其作用是指出槽的取值范围和求值方法等一个框架中可以包含各种信息:描述事物的信息,如何使用框架的信息,关于下一步将发生什么情况的期望及如果期望的事件没有发生应该怎么办的信息等等,这些信息包含在框架的各个槽或侧面中。

框架之间可以通过类属关系联系,同时在一些情况下,一个框架也可以作为另一个框架槽的槽值例如,描述“教师”的框架中,“教师”属于“知识分子”的子框架,“工作”、“性别”、“学历”等信息都为“教师”框架的槽,其中“性别”的取值范围“(男,女)”就是槽的侧面,“小学教师”“中学教师”“大学教师”框架作为“教师”框架类型槽的槽值。

“教师”框架见图1框架名:类  属:工  作:(教学,科研)缺省:教学性  别:(男,女)学  历:(学士,硕士,博士)类  型:(,,)图1:“教师”框架

框架式结构可以表示结构性知识,表达能力强,层次结构丰富,对于知识的描述非常完整和全面,而且基于框架的知识库质量非常高但框架的构建成本非常高,对知识库的质量要求非常高,表达形式不灵活,很难同其它形式的知识库相互关联使用。

4. 语义网络语义网络也称为联想网络,是由Quilian等人1968年提出用于表达人类的语义知识并且支持推理语义网络利用节点和带标记的边构成有向图描述事件、概念、状况、动作及客体之间的关系节点表示概念、事物、时间、情况等,弧是有方向和有标注的,方向体现主次,表示各种语义联系,指明它所连接的节点间某种语义关系,节点1为主,节点2为辅。

弧上的标注表示节点的属性或节点之间的关系节点和弧都必须带有标识,以便区分各种不同对象以及对象间各种不同的语义联系最简单的语义网络是一个三元组:(节点1,弧,节点2)例如,“鸵鸟是一种鸟”的语义网络见图2。

图2:“鸵鸟是一种鸟”的语义网络不同语义网络的语义关系往往差别较大,但一般都含有层级关系,层级关系中的子代可以继承父代的所有属性,从而可以实现关系推理同时对于复杂的多元关系,语义网络可以通过构建中间节点的方式来辅助构建,如“李雷送给韩梅梅一块巧克力”,可以通过构建“送给”这一事件节点作为桥梁来辅助构建,见图3。

图3:事件为中间节点的语义网络示例语义网络最初是作为人类联想记忆模型提出来的,因此它具有联想性,可以进行知识推理而且语义网络是一种结构化的知识表示方法,可以直观地把事物的属性及其语义联系表示出来,自然语言与语义网络的转换比较容易实现,因此语义网络在自然语言理解系统中的应用最为广泛。

但由于语义网络表示形式的多样性,使得对其处理的复杂性提高,对知识的检索也相对复杂与一阶谓词逻辑相比,语义网络也没有公认的形式表示体系二、医学知识表示通过前文可以看出不同的知识表示方式有着不同的优缺点,适合表达的知识类型也不尽相同。

对于特定领域而言,一个全面和专业的知识库需要融合多种知识表示方式,医学领域也是如此产生式适合表示过程型的动态知识,例如病人的长期护理和照护过程中相关指标的监测会对治疗或用药方案产生影响,这类知识就适合使用产生式来表示。

框架型可以将知识表达得非常完整和全面,可以用来表达医疗领域内的一些相较复杂的知识,例如疾病的治疗方案一般包括相关检查项目,手术方式,选择用药,药物的用法用量等,这些可以通过建立“治疗方案”的框架,把相关检查、手术方式和选择用药等定义成框架中的槽来完善对治疗方案的完整表达。

语义网络可以表示的知识类型较广,可以作为医学知识库的基础知识表示方式,对医学中大部分基础性的事实型知识进行表达例如可以从医学中最关键的几个概念出发,如疾病、症状、检验检查、手术操作和药品等,不断建立他们自身的属性,以及这些概念之间的关系,从而能够形成一整张表达医学基础知识的语义网络,这张网就是医学知识图谱。

鉴于知识图谱作为医学知识库中最基础的部分,下面将对用知识图谱来表示医学知识进一步阐述三、医学知识图谱OMAHA从2019年开始医学知识图谱的构建工作,目前已发布了知识图谱的Schema模型,“药品适应证”和“临床路径治疗相关检查”两个领域的知识图谱数据。

在构建知识图谱的过程当中,我们发现医学知识相较于其他领域的知识有一些特殊之处,这也使得用知识图谱表示医学知识时有一些值得注意的地方,例如:1.医学名称多样性医学实体名称不规范和医学规范命名不统一,导致一个实体可以有多种名称表示,例如“艾滋病”和“获得性免疫缺陷综合征”表示同一个实体。

所以医学知识图谱构建过程中,实体对齐显得十分关键,实体对齐可以将指代相同的实体融合,使得实体和关系定义的更加完整和准确OMAHA在知识图谱的构建过程中充分借助了七巧板医学术语集,来完成实体对齐七巧板医学术语集采用本体的形式构建,对概念的定义十分清晰,知识图谱中的实体与术语集中的概念建立映射关系可以充分完善实体的定义和丰富实体的表达方式。

2.医学知识精确度要求高医学是关乎生命健康的科学,所以医学知识在应用过程中对精确度要求非常高,特别是应用于临床辅助决策过程当中的知识,必须在实践中充分得到验证因此我们在医学知识图谱的构建过程中,应该优先选取质量较高的知识来源,如临床路径、临床指南、医学教材、药品说明书等,并通过自动抽取+人工审核的方式来保证知识的正确性。

3.医学知识复杂程度高医学是经验总结性的科学,医学知识大多比较复杂,这也使得一些医学知识很难用简单的三元组表达准确所以需要一些特殊的方法来辅助完善知识表达例如:(1)建立中间节点,辅助多元关系的表达例如《梅克尔憩室临床路径》中含有知识“梅克尔憩室在用憩室切除+小肠吻合术治疗前需要进行血常规检查”,可以通过“梅克尔憩室临床路径”作为中间节点,并建立三条关系:适用对象-“梅克尔憩室”,治疗方式-“憩室切除+小肠吻合术”,治疗前检查-“血常规”,来完成对该条知识的完整表达。

具体示例见图4:

图4:“梅克尔憩室临床路径”关系展示(2)增加属性组的定义,完善知识的表达例如药品说明术中有知识“阿司匹林片可以用于预防心肌梗塞,治疗发热”,可以通过药品两条关系“适应证”与“用药目的”联合成组来充分表示这条知识。

适应证“心肌梗塞”与用药目的“预防用药”成一组,适应证“发热”与用药目的“治疗用药”成另一组,详见图5

图5:“阿司匹林片”的关系展示四、结语医学知识库的构建是一项十分复杂的工程,而知识图谱又是其中底层的部分用知识图谱来表示医学知识不仅要考虑到知识表示本身的准确性和完整性,也要考虑到表示出来的知识的易用性和易解释性。

OMAHA在知识图谱的构建过程中也在不断学习和总结,您可以通过OMAHA官网(www.omaha.org.cn)HiTA服务平台(hita.omaha.org.cn)关注我们的知识图谱,如果您有好的经验也欢迎来与我们交流。

联系我们HiTA服务:hita@omaha.org.cn                                                数字医学知识中心负责人徐美兰:meilan.xu@omaha.org.cn

参考文献[1]   王昊奋;漆桂林;陈华钧. 知识图谱:方法、实践与应用 [M]. 47ed.: 电子工业出版社, 2019.[2]   HTTPS://BLOG.CSDN.NET/LHY2014/ARTICLE/DETAILS/86470565

. 知识表示发展史:从一阶谓词逻辑到知识图谱再到事理图谱 [M]. 2019.[3]   NORVING S J R P. 人工智能 一种现代的方式(第3版) [M]. 清华大学出版社, 2013.推荐阅读

深度解析|卫健委新发布的224篇临床路径都有哪些更新OMAHA“临床路径-疾病治疗相关检查”知识图谱发布!HiTA知识图谱 “药品-适应证”图谱数据发布!

OMAHA HiTA:元数据 | 术语 | 知识图谱为了治愈,我们选择开放和共享

点击“阅读原文”,立即加入我们,一起开启个人健康医疗数据的归还运动吧!

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186

科学科学知识图谱方法(科学知识图谱方法与应用 电子版)速看

2023-09-19Aix XinLe6

科学知识图谱方法(科学知识图谱方法与应用 电子版)速看知识表示就是研究怎样用计算机符号表示人脑中的知识以及怎样通过符号之间的运算来模拟人脑的推理过程。…

知识知识产权保护措施(知识产权保护措施制度与措施)快来看

2023-09-19Aix XinLe162

知识产权保护措施(知识产权保护措施制度与措施)快来看深圳市知识产权局、深圳市商务局、中国国际贸易促进委员会深圳市委员会日前联合印发《关于进一步加强海外知识产权纠纷应对指导工作的若干措施》(以下简称…

科学科学知识图谱方法(科学知识图谱方法与应用 电子版)一篇读懂

2023-09-19Aix XinLe118

科学知识图谱方法(科学知识图谱方法与应用 电子版)一篇读懂这次的分享主要从以下四个部分:知识图谱概述、知识图谱构造、转转二手电商知识图谱、在价格模型中的应用。…

知识知识产权保护措施(知识产权保护措施工作总结)新鲜出炉

2023-09-19Aix XinLe110

知识产权保护措施(知识产权保护措施工作总结)新鲜出炉上海市知识产权局关于印发《2023年上海市知识产权行政保护工作实施方案》的通知沪知局保〔2023〕4号各区知…

趣闻墙裂推荐趣闻轶事英文翻译怎么写(姨妈巾的英文翻译怎么写)

2023-09-19Aix XinLe65

墙裂推荐趣闻轶事英文翻译怎么写(姨妈巾的英文翻译怎么写)卫生巾是进入新世纪以来提高女性生活质量的一项伟大发明,解决了几千年来女性最难以启齿的卫生难题。但是现在看来司空见惯的卫生巾在地球上存在了才不到一…