中医知识库下载(中医知识库查询)奔走相告
引言中国工程院于2012年3月26日正式启动了“中国工程科技知识中心”(以下简称“知识中心”)建设。经过7年
引言
中国工程院于2012年3月26日正式启动了“中国工程科技知识中心”(以下简称“知识中心”)建设经过7年发展,知识中心已建立了广泛的资源获取渠道,资源总量达63亿条(80多TB),一级学科覆盖率达87%,二级学科覆盖率达80%。
然而,知识中心仍然缺乏中医学领域的大量数据资源为此,知识中心项目办(以下简称“项目办”)于2018年经过调研,选择中国中医科学院中医药信息研究所作为中医学领域的联盟单位双方经过2018年的研讨和筹备,于2019年开始正式合作开展。
“中医学专业知识服务系统”建设项目,成立中国工程科技知识中心的中医学专业分中心经过两年多的努力,项目组在平台建设方面取得了显著进展,完成了系统顶层设计,搭建了软硬件基础设施,目前已经基本完成了中医学专业知识服务系统的研发及迭代优化,基本完成了特色知识应用的研发及封装,完成了系统的部署并开始了系统的试运行。
正在进行系统内部试用、评估和整改工作,配合第三方评测公司完成上线前的评测工作,根据用户反馈意见对系统进行完善和改进该系统预计将于今年上线,并在未来3年持续建设和提供服务资源建设按计划进行,正在进行历史数据的汇交工作。
设有专职工程师负责系统日常运维、安全管理通过会议、论坛、培训班、微信公众号等形式宣传推介服务系统线下服务中医领域院士、课题组及协建单位承担的国家重点研发计划项目等在下文中,回顾总结项目总体建设情况以及近期完成的工作,并提出下一阶段的工作计划。
项目中期目标
深入汇聚中医领域资源深入汇聚中医领域资源,建成一个权威、高端的“中医智库”,建立一支专业化、高效的数据资源建设队伍,建立稳定、可靠的网络化工作平台持续提升数据资源体量、质量与特色建成中医学专业知识服务系统。
建立稳定可靠的软硬件基础设施保障,建成开放性、协作性的中医学专业知识服务系统,完善和拓展专业知识服务系统功能和性能研发中医医案、临床辅助、知识图谱等若干特色应用具备“线上+线下”综合服务能力能够面向工程院院士、国家工程科技思想库、工程科教人员、政府和企业管理决策部门、卫生专业人员及公众提供服务,得到中国工程院院士和专家认可。
总体建设情况
一、大力推动中医药资源建设与汇聚整合
建立了数十名科研人员和学生、四家委托数据加工单位构成的数据资源建设队伍,建立了网络化的文献大数据工作平台,实现了机器自动知识抽取与众包相结合的高效加工技术,完成领域通用资源建设、中医药特色资源建设、元数据标准制定、数据汇交、知识组织体系建设等工作。
累计建设中医学基础及特色数据资源数据集共计30个,数据总量115万余条(年底将达123万余条)在知识中心统一部署下建设精品专家库、机构库等领域通用资源完成中医特色数据资源的建设,对本单位已有的数据资源进行增量更新、完善。
完善中医学领域知识组织体系,加强分类体系、词表和知识图谱建设。制定“中药”、“方剂” 等14个中医药领域元数据规范,协助数据规范汇交。
二、持续研发及优化中医学专业知识服务系统
在单位内部搭建了基础软硬件环境,研发并优化了中医学专业知识服务系统平台,部署必要的安全审计设备和系统安全机制,进行了单位内测并配合完成工程院组织的评测,进行了认真的整改完成了项目总体规划和系统顶层设计,定义了平台系统的功能结构。
完成了网站设计和系统界面设计,编制了详细的网站设计方案,构建了demo系统,完成了46张页面设计图完成了平台系统和知识应用产品的开发与优化系统已部署并安排了系统运维人员,进行了系统性测试、专家评审和系统改造,完成了上线准备。
三、面向院士等重点目标用户提供综合性知识服务
以分中心名义面向中医药领域院士及重大咨询课题提供服务:面向中医学领域的黄璐琦和张伯礼2位院士提供文献数据主动推送服务;面向重大战略咨询课题(5个)提供信息参考、数据服务及深度报告(4项)服务;面向协建单位承担的国家重点研发计划项目提供资料调研、数据分析与挖掘服务;
通过协建单位网站、微信公众号等向工程科技知识人员、社会大众推送中医药知识。
2021年度工作进展
资源建设进展
资源建设思路
我们的资源建设,是以自建资源为主,采购和联盟的第三方资源为补充其中,自建资源是指协建单位通过纸本资源数字化、网络资源采集以及其他已有数字资源整合构建的资源库,在此基础上进一步对资源深度加工、标引、组织和关联,形成专业知识资源库。
第三方资源是指通过联盟或采购方式整合的其他单位资源知识组织系统是一类特殊资源,主要是指词表、词系统、本体、术语名词等资源,分中心建好本领域的知识组织系统后汇交到总平台的知识组织系统
数据资源加工平台
我们面向中医特色资源建设,建立了面向中医文献大数据加工的网络化数据资源加工平台,它通过文献扫描、知识抽取、数据录入、众包加工、审校、平台发布和更新等一系列环节完成特色资源建设它支持图书、期刊等文献,以及各种结构化数据库(如医案、养生、中医循证、中医临床等)等资源加工。
从技术上看,它采用MySQL、Neo4j等开源技术实现文献、数据库、知识图谱等各类数据资源存储,实现文献存储、元数据管理、快速检索、文献标引、数据录入、数据审校、任务管理、工作组管理等功能它支持数十名加工人员在网络平台上协同工作,通过数据审校环节保证了数据质量。
与本单位其他数据资源采集和加工系统进行了系统整合,实现了数据交互和数据汇交该平台收录中医文献的题录信息和原文重点支持文献的主题标引和知识抽取通过文献知识抽取,已建成医案、方药、中医临床、养生等大规模知识库。
目前,正在研究知识图谱自动构建目前,该平台已较为成熟,但我们仍在对其进行改进包括研发智能化的知识抽取技术工具,提高了数据加工效率;解决医案任务列表筛选、结构化bug及服务器问题等;开发、完善统计报表功能;开发养生数据加工模块,对养生期刊文献、图书进行高质量数据加工;开发消化领域优势病种循证文献加工,加工临床实验类文献、医案类文献,系统评价、流行病学、个案报道等文献,形成面向循证的临床知识库。
资源建设成果
本项目中,我们侧重加强具有较强专业特点和专业分中心特有数据资源的建设按照任务书及《中医学专业知识服务系统建设总体规划》,截至2021年5月,累计建设中医学基础(6个)及特色(24个)数据资源数据集共计30个,数据总量115万余条。
基础资源包括期刊、统计、循证、战略决策、专家、机构等资源库,共538,206条数据;特色资源包括:方药、养生、医案、临床、名医经验、各种专病等等,共617860条数据
资源汇交
在本年度,我们重点开展了协建单位内部的资源汇交与平台发布,也就是把单位内部各部门数据汇交起来,在系统上补充发布已经完成的:方药、循证、诊疗技术、指南与规范、语料库、名医经验、文献等16个数据集;正在汇交的:养生、中医临床、医案、本体、中英双语、智能问答、病例样例、中医皮肤科等数据集。
经过资源建设和汇交工作,本平台已具备了资源系统性、权威性和稀缺性等核心优势,具备了范围广、数据规模大、内容权威、形式丰富等特点我们正在做而接下来要完成的一项工作就是面向总中心的数据汇交首先,在总中心指导下编制了14个特色资源元数据规范;2020-2021年共编制5个。
已经梳理通顺数据汇交流程、掌握汇交工具使用,并编制了供内部使用的汇交文档,制定了资源汇交实施计划,正在按计划开展数据汇交工作
平台建设进展
2019年至今,项目团队在充分调研论证的基础上,提出了中医学专业知识服务系统的顶层设计,制定了平台建设的总体规划在单位内部搭建了基础软硬件环境,研发了中医学专业知识服务系统系统平台,包括:前台知识服务子系统、后台管理子系统、数据资源加工子系统、安全保障子系统、知识应用封装和系统交互对接。
项目组完成的系统开发工作如下:
知识服务子系统
完成了网站的设计和开发(包括移动端适配),初步实现知识浏览、知识检索、知识编审、知识可视化等面向最终用户的基本知识服务功能基于Apache Solr建立统一的搜索引擎,构建数据索引,支持百万级数据的在线快速检索。
初步实现了智能问答、智能推荐等高级知识服务功能平台基础服务功能实现传统的信息类网站提供的信息服务:资源检索、高级检索;资源导航、资源在线浏览、资源下载、原文传递;新闻公告和文章平台高级服务功能面向中医药和工程科技领域提供的高级知识服务:智能问答、智能推荐;专题服务(疾病专题、养生专题、院士专题)、健康管理云平台、网络药理学子系统、脾胃病循证大数据子系统、国际版。
后台管理子系统
实现面向管理员的后台管理功能,包括内容管理、数据资源管理、用户管理、网站监控、日志审计、数据库审计、线下原文传递管理等。
数据资源加工子系统
初步设计并实现面向数据加工人员的网络化数据加工平台,实现文献标引、数据录入、数据审校、工作组管理等功能。采用MySQL、Neo4j等开源技术实现文献、数据库、知识图谱等各类数据资源存储。
安全保障子系统
面向系统安全提供保障功能:开发了安全保障子系统;完善了系统安全保障机制;购置部署必要的安全设备并在相关硬件上安装安全软件;建立完整、可靠的系统安全保障机制(包括数据安全、网络安全等内容)通过近期的第三方测评和信息所内部的系统漏洞扫描,我们发现系统仍然存在很多安全漏洞,系统代码存在许多不规范的地方,近期开展大量工作,完成系统漏洞修补,完成频繁操作监管、后台封帐号,日志监测,系统攻击防范等安全保障功能。
系统交互对接功能
开发系统交互对接功能,包括统一认证、数据汇交、访问统计、知识应用接入等,从而更好地实现总平台和分平台的对接实现网络服务接口、数据交互和元数据交互功能,支持中医药专业知识服务系统与知识中心总平台实现系统对接和数据交互。
完成数据资源汇交、搜索服务接口开发与接入、统一认证、访问统计、知识应用接入以及工具共享等任务,更好地实现总平台和分平台的一体化
知识应用产品开发
根据需求调研,初步开发了古今医案、临床辅助、中医养生、名医经验、专科专病、国际交流、国医典藏、健康管理云平台、网络药理学等中医药特色知识应用和专题服务中医医案【平台定位】该平台是在40万医案数据积累的基础上研发的,集成诸多大数据、云计算等应用模式及智能信息处理技术,挖掘病、症、方、药、穴位、治法、疗效等多角度之间的关系,是为名医传承与经验总结中的方法学问题提供便利的分析工具。
【特点优势】集成中医古代、现代、名医医案;实现医案检索、医案采集、医案挖掘与大数据分析等功能;解决名中医经验学习、传承与挖掘工作中面临的数据采集、管理、分析、利用等问题【工作原理】通过知识抽取技术与众包相结合,从期刊和医案集中提取结构化医案,实现了医案检索以及关联分析、复杂网络分析等大量医案挖掘算法,服务于名医传承和中医临床研究。
辅助决策【平台特色和亮点】基于知识图谱、深度学习和规则引擎等多种AI技术,以及中医临床指南、专家经验、医案等大量的中医临床知识,开发了中医临床辅助决策系统,实现了中医疾病诊断、中成药推荐、处方优化、医案推荐、指南推荐等多种功能。
【技术原理】该系统通过本体表达将中医临床指南、专家经验等知识结合,构建起神经知识网络的数据知识模型,通过医生临床情景的识别和模拟,通过Agent技术将临床思维人工智能化,并通过机器学习中的大量算法实现系统自主决策能力。
中医药知识图谱【系统介绍】将中医药领域现有的术语资源和数据库资源融合起来,构成大规模知识图谱,集成了中医临床、中医特色疗法、中医名家、中医养生、中成药知识图谱等知识图谱模块该知识图谱内容丰富,基于知识图谱实现中医药知识体系的可视化,对中医药知识体系进行系统梳理和展示,建立知识点之间的有机联系,对于中医药工作者和大众都具有参考和服务价值。
【开发进度】1. 初步开发了中医药知识图谱的存储、查询和可视化系统,将其嵌入中医学专业知识服务系统之中2. 正在继续补充数据,并研究基于机器学习的知识图谱自动构建方法,扩充图谱规模;3. 研发基于知识图谱的智能化知识服务方法。
专科专病【产品定位】面向中医临床研究分析需求,针对专病,提供知识检索、文献检索、数据统计与分析、科研热点分析、知识挖掘等服务;有助于研究人员挖掘出潜藏于海量临床数据之中隐含的规律,促进中医学术的持续成长。
【技术功能】1. 为用户提供学科分类导航与常见病导航,便于浏览;2. 以知识图谱和文献分析作为核心技术,构建中医专科专病文献挖掘分析服务;3.以文字、表格、图形、数据相结合的形式展示,为研究人员提供直观、可视化的知识展示和分析挖掘结果展示。
中医养生【系统介绍】采用互联网平台和移动APP形式面向大众提供养生知识服务,提供中医养生知识检索与浏览、知识导航、知识问答、古今文献检索、名医经验分享等服务【工作进展】系统梳理中医养生学知识体系,构建知识图谱;根据用户的特点和偏好,向用户提供个性化知识推荐服务。
名医传承【系统介绍】构建中医名家师承知识库:整理中医名家的师承关系、临证经验、名医医案、名医代表性方药、名医理论等知识;开发中医名家知识图谱;为有需要的中医药工作者提供知识检索、知识浏览等服务;辅助科研人员系统梳理中医名家和代表流派的学术思想源流。
【进展】以赵炳南流派为例,构建中医名家师承知识库:整理中医名家的师承关系、临证经验、名医医案、名医代表性方药、名医理论等知识;开发中医名家知识图谱;未来扩展到朱仁康、余瀛鳌等其他名医。
系统上线准备
近期,正在进一步研发及优化中医学专业知识服务系统,实现稳定运行,配合中国工程院上线前的系统评测,计划于近期正式上线,并接入中国工程科技知识中心1.系统测评:单位内部对系统功能进行了测评,收集整理修改意见;工程院组织专家进行评审,委托第三方公司进行测评,形成了大量的测评报告和反馈意见,暴露出系统的许多问题,包括代码层面的问题、系统安全性问题和资源内容的问题。
2. 系统改造:针对软件开发方面的问题,我们开展了第三期的系统改造项目,根据专家意见、第三方测评结果和内部评测结果进行系统改造,解决系统功能和代码层面的许多问题我们单位的开发部和委托开发的几家公司(如九瑞、棱镜)之间组成联合项目开发小组,加强交流、培训与合作,互派人员驻场工作,较好解决了子系统对接和集成的问题,使系统风格更加统一。
3. 资源汇交与发布:专家评审指出平台上数据资源仍然不足,本单位内部还有许多资源存量没有在平台发布,但这些资源分散与不同部门没有汇交集成近期就开展了单位内部的资源汇交工作,以及数据资源的平台发布工作,使平台上的资源量更加丰富、全面。
4. 系统安全加固:通过安全扫描发现了许多问题本单位信息技术室近期就致力于全所网络信息系统的安全加固,通过安全扫描发现问题的系统就不允许上线这样,就导致许多子系统和功能模块无法上线最近几个月,我们根据扫描结果,完成了大量的系统代码修改工作,使得工程院系统主体部分重新上线,但一些子系统和功能仍在进行安全加固改造,争取尽快重新上线。
运营服务及宣传推广
分中心采用线上服务+线下服务,其中按要求50%以上在线免费服务建立包括服务协同、服务支持、服务评估与完善在内的服务机制除上述的线上服务之外,线下服务包括:信息推送服务、战略咨询课题支撑服务、协建单位承担课题支撑服务、微信公众号服务和协办知领论坛等。
通过总平台、知领论坛、行业会议、学术论坛、新媒体平台等进行宣传推广具体工作包括:服务黄璐琦、张伯礼2位中医药领域院士(8期,1期/月) 面向4个重大战略咨询课题信息参考服务和数据服务编写新版信息参考和2项深度报告。
通过行业学术论坛、专家研讨会、科技培训班、新媒体平台进行宣传在本单位组织的第二届学术周上交流了本项目的成果原计划在世界中医药学会上宣传成果,但因疫情原因暂停举办通过微信公众号发布数据资源建设情况、系统开发升级情况、开通试用情况、学术应用情况等,截至6月30日前,共计完成54篇相关文章。
完善系统运维管理,包括软硬件维护、数据资源管理与更新、系统平台监控管理、系统安全管理、故障与突发事件处理等。
2021年下半年工作计划
中医学专业知识服务系统于9月上线在下半年,将对系统进行部署、测试和优化,完成系统正式上线并对外提供服务;对平台进行升级改造,研发知识图谱自动构建、智能推荐、智能问答等智能方法,新增一些高级服务功能;采用人工编辑和自动化技术相结合的方法进一步加工数据并扩充平台数据规模;大力开展平台运营和宣传推广工作,形成核心用户群和一定的业内影响力。
下面具体阐述:
平台和产品研发
下阶段平台系统开发工作主要包括:系统上线:修改专家和第三方测评发现的问题,重新申请系统上线系统安全加固:继续修改系统安全问题,完成子系统和系统模块上线,完善系统安全保障机制完成任务书中的开发计划,重点研发专科专病(脾胃病、肾病等)知识发现、基于文献的研究热点分析和知识问答等高级知识服务。
在上线后,继续根据专家和用户反馈改进系统。
资源建设
中医药资讯动态采集:借助信息技术,动态采集中医药资讯,分析筛选并推送到平台中医药资源汇聚整合:单位内部资源汇交与发布(养生、临床等等);工程院数据汇交研发中医药文献大数据平台和技术:广泛收集和处理文献,研发文本抽取技术,建立语料库,研发知识图谱自动构建方法。
1万条知识组织资源建设完毕,待核对确认后导入工程院的知识组织系统。
系统运营与服务
通过本单位运营的公众号、网站、平台和信息产品进行引流加强系统运维工作,保证系统稳定运行;继续加强系统安全保障工作,修改系统安全问题,完成子系统和系统模块的安全加固与上线继续按时按需为黄璐琦、张伯礼2位院士提供主动推送服务,共计提供6期。
通过平台和微信公众号扩展用户群体并提升服务内容质量,编写平台介绍材料及使用手册,推送原创推文,丰富推文形式。
总结
中医学专业知识服务系统自2019年立项,在过去的两年半时间,按照项目总体方案要求完成了平台建设任务,也积累了一定的项目经验目前已经基本完成了中医学专业知识服务系统的研发及迭代优化,基本完成了特色知识应用的研发及封装。
在近期的工作中,继续推进中医学专业知识服务系统的研发工作,对平台页面设计、后台功能进行改进,实施系统安全监测与加固,使平台在稳定性、安全性和用户友好性等方面得到了提升下一步,将继续开展数据资源建设、特色服务模式研发、系统开发、系统运维服务、宣传推广等工作,重点建设权威性高、规模化、质量高的中医学专业特色资源;完成中医学专业知识服务系统上线服务,探索知识服务模式,提升知识服务能力,提升系统的服务水平和用户满意度,扩大社会影响力。
推荐阅读:国家药监局药审中心关于发布《按古代经典名方目录管理的中药复方制剂药学研究技术指导原则(试行)》的通告(2021年第36号)为健康中国建设提供人才保障 大力培养中医药人才(有的放矢)“5G智能+国医智慧”国医智谷综合体项目获正式立项
本文作者:于彤;编辑:柳迪;图片来源:Bing images。转载请注明出处。获取更多中医药知识,快速访问中医药知识服务平台,点击下方阅读原文搜索↓↓↓
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186