知识库管理体系包括哪些(实验室管理体系包括哪些内容)快来看
知识图谱场景需求知识图谱始于20 世纪 50 年代,至今大致分为三个发展阶段:第一阶段(1955 年— 1977 年) 是知识图谱的起源阶段,在这一阶段中引文网络分析开始成为一种研究
知识图谱场景需求知识图谱始于20 世纪 50 年代,至今大致分为三个发展阶段:第一阶段(1955 年— 1977 年) 是知识图谱的起源阶段,在这一阶段中引文网络分析开始成为一种研究当代科学发展脉络的常 用方法;第二阶段(1977 年-2012 年)是知识图谱的发展阶段,语义网得到快速发展,“ 知识本 体” 的研究开始成为计算机科学的一个重要领域,知识图谱吸收了语义网、本体在知识组织和表 达方面的理念,使得知识更易于在计算机之间和计算机与人之间交换、流通和加工;第三阶段 (2012 年—至今)是知识图谱繁荣阶段, 2012 年谷歌提出 Google Knowledge Graph,知识图谱 正式得名,谷歌通过知识图谱技术改善了搜索引擎性能。
在人工智能的蓬勃发展下,知识图谱 涉及到的知识抽取、表示、融合、推理、问答等关键问题得到一定程度的解决和突破,知识图 谱成为知识服务领域的一个新热点,受到国内外学者和工业界广泛关注知识图谱具体的发展历程如下图所示。
图 1.1 知识图谱发展历史随着人工智能的发展, 知识图谱开始应用于更多的场景,关注度不断攀升,成为认知智能 领域的核心技术之一,同时,知识图谱逐渐成为人工智能应用的强大助力知识图谱,通过节点和关系把所有不同种类的信息(Heterogeneous Information)连接在一起得到一个关系网络,为真实世界的各个场景直观建模, 不需要中间转换的处理方式就能够把复杂的自然与社会关系 直观地教授给人工智能应用,能够更加便利、有效的帮助客户组织领域知识,为流程优化、辅 助决策、预测分析等下游应用提供基础服务。
目前常见的知识图谱应用场景有:公共安全领域、 数字经济领域、金融科技领域、资源优化方向、科学研究领域、制造业转型、公众健康领域、人文发展及政府管理领域等公共安全领域信息化以现代通信、网络、数据库技术为基础,将所研究对象各要素汇总至 数据库,并针对各个业务领域进行定制化开发,以满足公共安全实战需求。
近年来,违法犯罪 活动呈现复杂化、动态化、智能化的特征,由于公安信息庞大而且实体关系复杂,海量数据快 速检索与理解需求难以满足为了提升整体效能,在打击违法犯罪活动中占据信息主导权,充 分利用现代信息技术和信息资源,对现有的警务组织、机制、模式、装备等警务实践进行信息 化改造。
使用知识图谱技术将数量巨大的公安信息通过概念实体、 属性以及多样化的关联关系 进行直观准确的描述,同时能从时间序列维度、类别维度对图谱知识进行统计分析,能公安业务需求实现定制化的智能应用,为公共安全部门提供准确、高效的技术工具和辅助决策支撑。
数字经济领域是指以使用数字化的知识和信息作为关键生产要素、以现代信息网络作为重 要载体、以信息通信技术的有效使用作为重要推动力的一系列经济活动数字经济是继农业经 济、工业经济之后的一种新的经济社会发展形态,更容易实现规模经济和范围经济,日益成为 全球经济发展的新动能。
数字经济占我国经济发展规模的比重接近三分之一,对经济增长具有显著拉动效应由于数字经济也是一个全新的社会政治与经济系统,其中所有的信息和商务活 动是以数字化的方式进行,企业、消费者和政府之间进行的网络交易量迅速增长。
数字经济的发展离不开大规模有效数据的关联,将“数据中心” 向“知识中心”过渡是数字经济升级发展的重要需求知识图谱可以为数字经济背景下所面临的一些具体问题提供有效的解决方案,成为推动数字经济创新场景下智能应用的重要力量。
金融科技领域作为数字经济转型中最先应用的行业之一,金融生态的数字化、智能化转型过程中,业务应用场景化、数据垄断化特征成为金融科技不断优化金融生态环境的必要条件 知识图谱在金融科技领域是语义理解和知识搜索基础,可以为金融行业的风险评估、预测、反欺诈、精准营销、智能搜索等提供技术支撑。
例如:知识图谱能促进金融科技信息技术与开放 知识领域的融合,进而为金融机构的数据治理提供设计思路; 可以为金融科技服务于实体经济 提供了深度技术,能够加强各知识领域多维度数据的关联性,解决长尾信贷中小企业客户的信 贷供给不足问题;通过知识进行进行上市公司、拟上市公司和中央监管私募机构画像, 帮助践 行金融科技的风险管理创新机制。
正是这些优点,让越来越多的金融机构及企业在探索构建金融领域知识图谱,为金融领域应用决策提供更精准可靠的依据资源优化领域主要包括企业资源优化和社会资源优化前者利用知识图谱技术,实现有效 的语义化数据治理和知识获取,可以帮助一线人员互相沟通知识信息,打破“企业知识孤岛” ; 关于后者农业资源和电力资源作为紧缺且重要的社会资源,在农业资源优化方面,以往受限于人员分布广泛、高质量知识获取难度大、数据积累多以非结构化为主等因素,从业者通常以 经验作为重要的操作考虑因素,存在部分情况下误操作、漏操作等风险。
如由于农业从业者对病虫害缺乏了解,往往凭借经验诊断已发作的农作物病虫害进行盲目用药,造成防治用药难以有的放矢通过建设病虫害知识图谱,搭建知识获取及应用、推广平台可以提供更加科学的用药和栽培辅导,进而提升整体农业土地资源的利用效率。
电力资源优化也存在类似的现象科学研究领域的各个学科之间存在非常高的壁垒,资源整合困难,学科知识服务有待提高, 此外,学术网络信息分散,专业群体建设不足也是目前科学研究领域存在的问题利用知识图谱,可以描绘出学者们之间通过合作进行课题研究,共同发表文献形成的复杂的科研合作关系 网络,这种科研合作关系网络,包含了学者和学者之间、学者和科学研究领域之间、各个科学 研究领域之间等多种类型的复杂关系。
此外,利用知识图谱强大的语义处理能力可以实现学者的影响力分析、领域研究热点之间的关联关系发现、未来研究热点的趋势预测等多类应用制造业转型领域目前还存在缺乏发达的产业分工体系、未形成强大的产业链、自主创新能 力弱、产业结构不合理等问题。
现阶段大部分企业的信息自动化基础还都比较弱,数据粗放采 集管理,智能化应用的水平无法满足工业需求,而知识图谱技术可能为精益的数字化智能化升 级提供解决方案;人力成本增加、人员流动率大,可以利用知识图谱技术去沉淀经验,培训和 赋能员工;制造业经过几十年的发展,已经到了发展的瓶颈,技术瓶颈、人才断层,导致创新能力不足,加强知识图谱建设,增强技术流通,将有助于减缓人力和研发成本压力,提升行业创新能力,从而赋能制造业转型升级。
公众健康领域存在医疗资源不足、分布不均衡以及效率低下的问题, 以医疗知识图谱为支 撑的知识系统,可以一定程度上将医生从繁重的重复性知识工作中解放出来,专注于治病救人 和疑难病症突破,进而提升医疗服务的效率、扩大医疗服务的供给、提供基于知识服务的患者 院内院外高效服务,所以医疗健康知识图谱技术可以在医学辅助诊疗、知识推荐、医院管理、 医疗控费等环节体现出强大的降本增效能力。
此外,分级诊疗政策难以有效落实;医疗行业诊 疗规范分散;医疗资源浪费现象严重,医疗服务效率有待提高;医疗保险监督管理问题等问题都可以通过知识图谱在一定程度上获得解决在人文发展领域,知识图谱有助于提升传统文化数据知识化治理水平,拓展传播渠道,有 助于提升休闲娱乐消费体验和发展水平,助力破解教育资源不平衡。
在政府管理领域,知识图 谱技术在数字政府领域的应用需求表现在如下几个方面: 政府数据碎片化导致“ 信息孤岛”现象 严重,政府数据共享开放缺乏统一标准,政府决策缺乏有效数据支撑,政府数据应用模式单一 等,利用知识图谱技术进一步推动我国“互联网+政务服务”深化发展,各级政府依托网上政务服务平台,推动线上线下集成融合,实时汇聚网上申报、排队预约、审批审查结果等信息,实现“数据多跑路,群众少跑腿”。
知识图谱核心技术知识图谱主要技术包括知识获取、知识表示、知识存储、知识建模、知识融合、知识理解、 知识运维等七个方面,通过面向结构化、半结构化和非结构化数据构建知识图谱为不同领域的应用提供支持,具体的技术架构图如图 2.1 所示。
关于知识获取,知识图谱中的知识来源于结构化、半结构化和非结构化的信息资源,通过 知识抽取技术从这些不同结构和类型的数据中提取出计算机可理解和计算的结构化数据,以供 进一步的分析和利用知识获取即是从不同来源、不同结构的数据中进行知识提取,形成结构 化的知识并存入到知识图谱中。
当前,知识获取主要针对文本数据进行,需要解决的抽取问题 包括:实体抽取、关系抽取、属性抽取和事件抽取知识获取作为构建知识图谱的第一步,通 常有众包法、爬虫、机器学习、专家法等方式 为了进一步扩大知识图谱的应用领域,资源缺乏、面向开放域、跨语言及跨媒体等方向的知识抽取成为未来的研究方向。
图 2.1 知识图谱技术架构图关于知识表示,知识是人类在认识和改造客观世界的过程中总结出的客观事实、概念、定理和公理的集合知识表示是将现实世界中存在的知识转换成计算机可识别和处理的内容,是一种描述知识的数据结构,用于对知识的一种描述或约定。
知识表示在人工智能的构建中具有 关键作用,通过适当的方式表示知识,形成尽可能全面的知识表达,使机器通过学习这些知识,表现出类似于人类的行为知识表示是知识工程中一个重要的研究课题,也是知识图谱研究中知识获取、融合、建模、计算与应用的基础。
知识表示方法主要分为基于符号的知识表示方法 与基于表示学习的知识表示方法,前者主要包括一阶谓词逻辑表示法、产生式规则表示法、框 架表示法与语义网络表示法,后者常见的表示模型有 TransE ,TransH ,TransR ,TransD 等。
由于针对知识图谱的语义增强在未来依旧是知识表示重要任务,因此符号与表示学习的融合统一、 面向事理逻辑的知识表示、融合时空间维度的知识表示及融合跨媒体元素的知识表示依然是重点的研究方向知识存储是针对知识图谱的知识表示形式设计底层存储方式,完成各类知识的存储,以支 持对大规模图数据的有效管理和计算。
知识存储的对象包括基本属性知识、关联知识、事件知 识、时序知识和资源类知识等知识存储方式的质量直接影响到知识图谱中知识查询、知识计 算及知识更新的效率从存储结构划分,知识存储分为基于表结构的存储和基于图结构的存储。
知识图谱的存储并不依赖特定的底层结构, 一般的做法是按数据和应用的需求采用不同的底层 存储,甚至可以基于现有关系数据库或 NoSQL 数据库进行构建知识存储相关技术发展趋势包括以下几个方面:基于RDF 知识表示的分布式存储;设计高适应性的知识存储;基于 LOD (Linked Open Data)的知识存储及超图的进一步研究和应用。
关于知识融合,其是一个不断发展变化的概念,但总的来说,是面向知识服务和决策问题, 以多源异构数据为基础,在本体库和规则库的支持下,通过知识抽取和转换获得隐藏在数据资源中的知识因子及其关联关系,进而在语义层次上组合、推理、创造出新知识的过程,并且这 个过程需要根据数据源的变化和用户反馈进行实时动态调整。
知识融合从融合层面划分可以分为数据层知识融合与概念层知识融合,数据层知识融合主要研究实体链接、实体消解,是面向 知识图谱实例层的知识融合;概念层知识融合主要研究本体对齐、跨语言融合等技术随着网 络社会数据特征、跨语言融合、知识规模增加等带来挑战越发紧迫,针对短文本及资源缺乏环境下的实体链接方法、融合先验知识的深度学习端到端实体链接方法、大规模本体的高效匹配 方法将成为未来研究的重要趋势。
知识建模是指建立知识图谱的数据模型,即采用什么样的方式来表达知识,构建一个本体模型对知识进行描述在本体模型中需要构建本体的概念,属性以及概念之间的关系知识建模的过程是知识图谱构建的基础,高质量的数据模型能避免许多不必要、重复性的知识获取工 作,有效提高知识图谱构建的效率,降低领域数据融合的成本。
知识图谱目前的实际操作过程, 可分为手工建模方式和半自动建模方式手工建模方式适用于对知识建模容量小、质量高的要求,但是无法满足大规模的知构建,是一个耗时、昂贵、需要专业知识的任务;混合方式将自 然语言处理与手工方式结合,适于规模大且语义复杂的图谱。
对知识建模质量评价也是知识建 模的重要组成部分,通常与实体对齐任务一起进行的一个合理的本体模型宜满足以下标准:明确性和客观性;完全性; 一致性;最大单调可扩展性;最小承诺;易用性知识计算是基于已构建的知识图谱进行能力输出的过程,是知识图谱能力输出的主要方式。
主要包括知识统计与图挖掘、知识推理两大部分内容,知识统计与图挖掘重点研究的是知识查 询、指标统计和图挖掘,主要包括:图查询检索、图特征统计、关联分析、时序分析、节点分类、异常检测、预测推理等;知识推理重点研究的是基于图谱的逻辑推理算法,主要包括基于符号的推理和基于统计的推理,其典型应用主要包括智能搜索、智能推荐、智能问答等 。
如何解决小样本量场景的知识计算、 一致性动态变化下的知识计算以及面向多元关系和多源信息等方面的知识计算将成为未来重要且亟待突破的方向知识运维包括两个方面的关注点: 一个是从数据源方面的基于增量数据的知识图谱的构建 过程监控,另一个是通过知识图谱的应用层发现的知识错误和新的业务需求:例如错误的实体
属性值、缺失的实体间关系、未识别的实体、重复实体等问题现有的知识运维内容主要包括:基于增量数据的知识运维、图谱内容统计监控、知识审核与修正、知识版本管理、知识安 全管理、知识容灾备份等知识运维是知识图谱可以持续健康发展并且支持业务的关键,实现 知识图谱构建过程的全生命周期管理,加快知识图谱的构建速度,降低知识运维难度,同时对知识图谱的质量和扩展可控可管理是现有的知识运维的重要研究目标。
知识图谱技术挑战当前数据图谱的研究确实取得了一定的进展, 但也带来了相应的挑战,比如:数据相关的挑战、算法相关的挑战、基础知识库相关的挑战、开发工具相关的挑战、隐私、安全和伦理相关的挑战、测试认证相关的挑战、商业模式相关的挑战以及人才相关的挑战等。
关于数据挑战,由于数据来源多样性造成数据标准不统一、数据质量差,导致多源数据歧义、噪声大、数据间关联关系不明确等问题数据歧义和关系不明确对知识图谱构建和推理形 成了巨大的阻碍,对知识图谱应用成效的提升和技术的进步提出了巨大的挑战。
关于算法挑战,知识图谱中的知识抽取、知识融合及知识计算等技术依然面临着许多困难 与挑战,亟待学术界与工业界协力去解决例如:基于大规模开放域的知识抽取研究仍处于起步阶段;现有的知识推理实现方式,可以解决大部分领域和业务场景的复杂计算需求,但对于 计算资源和存储资源的占用较大,且现有算法效率存在瓶颈,应用到大规模数据集时往往需要 较长时间,无法满足许多领域实时、准实时或及时的计算决策要求。
此外,在算法的性能上,算法泛化能力差、鲁棒性差,算法多样化,缺乏统一的评测指标都是亟待解决的问题关于基础知识库挑战,其包括基础知识库融合挑战、垂直领域知识库构建挑战、基础知识 库不愿开放的挑战,上述问题都将影响基础知识库的构建和开放利用,进而影响知识图谱的构 建,如何去克服这些问题,打造在百科知识库的基础上建立各垂直领域知识库,形成开放的知识库生态,是知识库构建及知识图谱深远发展面临的重要挑战。
关于开发工具挑战,随着业内构建知识图谱的需求增多,很多信息化厂商和大学开始通过抽象知识图谱构建过程,总结归纳图谱构建相关方法学,尝试搭建图谱构建工具,但由于知识 图谱本身属于人工智能领域较为新兴的技术方向,使得该领域内目前市场上各类知识图谱开发 工具的水平参差不齐。
对于如何构建出完整、易用、高效的知识图谱构建工具还存在诸多挑战 例如:贯穿知识图谱全生命周期的平台缺失;算法、工具、专家间人机协同有待提升;基于文本的知识图谱构建工具性能弱;跨语言语系的知识图谱构建工具有待突破以及知识图谱中间件有待建设等。
关于隐私、安全和伦理相关的挑战,由于知识图谱多采用单机、云平台、集群及其组合的部署方式,结合大数据平台、云平台、业务系统、灾备、网络系统及其与知识图谱之间的通信 接口,保障知识图谱的安全,也是一个非常重要的内容。
主要包括应用/接口数据安全风险管理、 敏感数据发现和风险评估、数据安全异常行为分析、数据安全事件溯源取证、知识图谱的 4A 安全管理、模型与图谱内容质量安全等关于测试认证相关的挑战,由于知识图谱的测试认证相关研究仍处于起步阶段,其依然面 临以下挑战:知识图谱测试与评估涉及环节众多、知识图谱测试与评估方法缺失、知识图谱测 试与评估标准空白、标准测试集建设迟滞以及测试人员及机构资质要求不明确等问题。
关于商业模式相关的挑战,对于知识图谱领域的创业公司,其在商业模式主要为以定制化解决方案的形式与金融、医疗、工业等领域的客户进行深度绑定,建设知识图谱并积累与客户 磨合中的行业经验,不断完善和提高所建立知识图谱的广度与深度,逐步建立技术壁垒并完成 项目交付。
这样的模式存在客户内生驱动力不足,大规模盈利模式不清晰、知识图谱构建与应用标准化模块推广受限、数据获取受法规约束加大等问题关于人才相关的挑战,目前人工智能领域的人才需求存在巨大的缺口,而知识领域和行业 紧密结合需要有一定领域知识的专家共同构建垂直领域的知识图谱,这对人才提出了更高的要 求和挑战,不仅需要有人工智能相关人才,还需要多技术交叉复合型人才以及具备深厚行业背 景的人才。
知识图谱在会议系统的应用策略研究知识图谱在会议系统的应用主要包括语义搜索(基于实体链接)以及可视化决策支持 (D3.js 、ECharts)等,主要通过构建知识库来进行检索推理,通过可视化的方式提供更友好的服务。
在语义搜索方面,知识图谱技术可以帮助深刻理解会议流程和会议中涉及的各个对象的 关系搜索某个关键词可以展示出相关联文档,搭建统一搜索平台实现内外网信息互补;展示 搜索内容涉及会议内容、会议文件以及相关部门的关键信息或流程链接,打破信息孤岛; 员工可以把握全局进度,补全信息漏洞, 打造知识管理平台,构建生态管理体系,语义搜索的整体示意图如图 4.1 所示。
图 4.1 会议系统知识库语义搜索示意图此外,基于以及构建好的知识图谱,还可以对检索的内容进行可视化的决策支持比如: 在搜索某会议时,可以展示出某会议及其相关会议的内容,如下图所示类似的,相关文件会 展示文件的摘要,与会人员会展示相关人员的用户画像和任务进度分配等情况。
通过基于知识图谱的语义搜索和可视化支持, 有助于联通内部信息, 打通会议系统协同办公,消除信息孤岛,使得会议内容和会后实施情况更加透明,充分发挥会议系统的作用知识图谱在问答系统的应用策略研究知识问答介绍。
知识问答系统是一个拟人化的智能系统,它接收使用自然语言表达的问题,理解用户的意 图,获取相关的知识,最终通过推理计算形成自然语言表达的答案并反馈给用户。
上图给出了一个最典型的基于符号表示的问答系统的整体流程,其具备四大要素:问题,作为问答系统的输入,通常以问句的形式出现(问答题),也可能采用选择题、多选题、列举答案提和填空题等形式;答案,是问答系统的输出,除了文本表示的答案(问答题或填空题) ,有时也需要数出一组
答案(列举问答题)、候选答案的选择(选择题)、甚至是多媒体信息;智能体,是问答系统的执行者,需要理解问题的语义,掌握并使用知识库解答问题, 并最终 生成人可读的答案;知识库,存储了问答系统的知识,其形态可以是文本、知识库或知识图谱等。
如上图所示,问答系统的主流研究方法可以分为:基于信息检索(Information Retrieval,或者又称为信息抽取)的方法,这类方法通过提取问 题中的关键信息,通过检索知识图谱得到一系列候选答案,然后分别对问句和候选答案进行 特征抽取得到特征向量,建立分类器对候选答案进行筛选。
随着网络社区中出现大量的常见问题, 形成的基于问答对的研究,其基本思想是当前问题是否在以前被其他用户回答过,如果是,则之前被采纳的优质回答作为当前问题的答案基于语义解析(Semantic Parsing)的方法,这类方法的主体思想是将自然语言转化为格式化 的逻辑形式,将问题的语义信息生成对应的逻辑形式。
不过大部分先进的知识问答方法还是基于语义解析的,目的是将自然语言问句解析成结构 化查询语句,进而在知识库上执行查询得到答案基于知识图谱的问答(Knowledge-based Question Answering,KBQA ,一般简称“知识问答” ) 是智能问答系统的核心功能,属于基于语义解析的方法,是一种人机交互的自然方式。
知识问 答依托一个大型知识库(知识图谱、结构化数据库等),将用户的自然语言问题转化成结构化查询语句(如 SPARQL 、SQL 等),直接从知识库中导出用户所需的答案近几年,知识问答聚焦于解决事实型问答,比如:” 中国的首都是哪个城市?北京”。
事实型问题按照问题类型可以分为单知识点(Single-hop Questions )问题和多知识点 (Multi-hop Questions)问题;按照问题的领域可以分为垂直领域问题和通用领域问题相对于通用领域或开放领域,垂直领域下的知识图谱规模更小、精度更高,知识问答的质量更容易提 升,例如:生物医学问答系统[1],地理领域问答系统[2]。
对于事实型问题,宜采用基于知识图谱的问答系统方式来进行,但是从获取知识的便利性角度而言,基于常见问答对 FQA 的问答系统是最受欢迎,也是已经广泛使用的一种方式。
上图展示了问答系统的发展历程基于知识库的问答系统(Knowledge-Based Question Answering ,KBQA)特指使用基于知识 图谱解答问题的问答系统KBQA 实际上是 20 世界七八十年代对NLIDB 工作的延续,其中很多 技术都借鉴和沿用了以前的研究成果。
主要的差异在于:采用了相对统一的基于 RDF 表示的知 识图谱,并且把语义理解的结果映射到知识图谱的本体后生成 SPARQL 查询解答问题通过本 体可以将用户问题映射到基于概念拓扑图表示的查询表达式,也就对应了知识图谱中某种子图。
KBQA 的核心问题 Question2Query,是找到用户问题到知识图谱子图最合理的映射问题知识问答与信息检索和数据库检索的区别知识问答与信息检索和数据库查询有一些相似之处,但是三者在使用场景等方面依然存在。
重大差异,三者的比较如下表所示:
具体来说,信息检索(Information Retrieval ,IR)与知识问答相比:搜索以文档来承载答案,用户需要自己阅读搜索返回的文档来找到答案;而问答直接将答案 交给用户,同时答案通常来自已经结构化的数据或抽取后结构化的数据,结构化的数据支持 列表形式返回,也可以帮助进行进一步的数据统计分析
搜索侧重于更简单的用户体验,用户检索是通过关键词而不是完整的句子,这需要用户掌握一定的搜索技巧当用户的问题比较复杂,需要通过多个页面的知识来回答时,搜索是无法完成的例如:要 搜索”这附近的麻辣香锅店在哪里? ℽ ,单纯的搜索引擎无法对“这附近”进行语义解析, 只能返回麻辣香锅店的搜索信息。
另外,数据库查询(Database Query)与知识问答相比:数据库查询需要用户熟悉数据库的结构,掌握基本的数据库查询语言语法;而知识问答降低了这些要求,其允许用户使用自然语言进行查询数据库对知识库有严格的限制,要求数据必须进行结构化储存;然而,大量知识存在于文本。
中而非数据库中,知识问答并不限制知识库的类型;数据库查询的结果并不一定是用户可以使用的最终答案常见开源问答系统百度开源 FAQ 问答系统(AnyQ)AnyQ(ANswer Your Questions) 开源项目主要包含面向 FAQ 集合的问答系统框架、文本语义 匹配工具 SimNet。
问答系统框架采用了配置化、插件化的设计,各功能均通过插件形式加入, 当前共开放了 20+种插件开发者可以使用 AnyQ 系统快速构建和定制适用于特定业务场景的 FAQ 问答系统,并加速迭代和升级
项目 star 数:2.2k,项目地址:https://github.com/baidu/AnyQ 多轮对话管理系统 Opendial. Opendial 是 2016 年发布的一款 pipeline 方式的对话系统开发工具箱
. 最近一次的发布时间是 05.04.2016 ,v 1.5,java 实现, gradle 编译. 支持语音输入(通过调用 API),独立域(支持单域,不能跨域),通过配置文件实现. pipeline 方式,也支持端到端。
. 最初是由挪威奥斯陆大学的语言技术小组开发的, Pierre Lison 是主要开发人员 项目 star 数:180 个, 项目地址:https://github.com/plison/opendial。
QuestionAnsweringSystemQuestionAnsweringSystem 是一个 Java 实现的人机问答系统,能够自动分析问题并给出候选 答案IBM 人工智能计算机系统"沃森"(Watson)在 2011 年 2 月美国热门的电视智力问答节目" 危险边缘"(Jeopardy!)中战胜了两位人类冠军选手, QuestionAnsweringSystem 就是 IBM Watson 的 Java 开源实现。
项目 star 数:1.8k,项目地址:https://github.com/ysc/QuestionAnsweringSystemgAnswerGAnswer 系统是由北京大学计算机技术研究所数据管理实验室邹磊老师牵头开发的自然 语言问答系统。
gAnswer 能够将自然语言问题转化成包含语义信息的查询图,然后, 将查询图转 化成标准的 SPARQL 查询,并将这些查询在图数据库中执行,最终得到用户的答案我们使用 数据驱动的消歧方式,具体来讲,在生成查询图的阶段保留多种实体和谓词的链接方案,在查询执行的阶段根据匹配情况消除歧义(错误链接)。
项目 star 数:261 个, 项目地址:https://github.com/pkumod/gAnswer以下对上述开源问答系统进行一个简单的比较。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186