www.teandq.com
晓安科普

知识库系统开发步骤(结构化系统开发方法的步骤)太疯狂了

2023-10-27Aix XinLe

以场景需求为导向,补强实践短板,使办案系统后期具备深度学习能力

知识库系统开发步骤(结构化系统开发方法的步骤)太疯狂了

 

点击上方↑“上海市法学会"关注我们

蔡一博上海市高级人民法院研究室法官助理内容摘要目前AI与法律结合的研究处于蹒跚起步阶段,该领域文献综述与研究滞后于系统研发,为更好地对司法科技进行有效的能动回应,立足实证研究,总结现有系统研发的瓶颈问题,并站位于法院系统内的开发者、裁判者、使用者的三重身份提出以法官的裁判思维与要件标注的方法来审视现阶段的应用成果。

以场景需求为导向,在法学、计算机的理论支撑下构建AI下民商事办案系统,并补强实践短板,使办案系统后期具备深度学习能力在路径依赖上,运用“开放结构”法学理论对类案场景模式下的裁判思维进行建模其次,采用专家经验提取案件要素和证据规则,通过大量的人工化的要素标注建立起标签体系夯实数据基础,提高案件自动标注能力。

最后,通过数据的机器学习、优化、迭代,最终实现机器对法律各领域的自主学习功能,实现民商事办案系统的智能化关 键 词:人工智能 民商事系统 裁判思维 要件标注一现象观察:系统的实证分析

信息化、智能化建设系智慧法院建设中牵一发而动全身的“牛鼻子工程”,是进一步推进和落实司法体制综合配套改革精神的“现代”助推器虽然S市和G省模式下的刑事领域已进行系统性的研发,但是民商事领域因覆盖面广、类型复合高、类案差异性大等特点鲜有深入研发,目前呈碎片化、分散式研发态势。

比如S市高级人民法院开发的知识产权民事侵权案件赔偿数额专题分析系统、G省研发的道路交通事故损害赔偿系统等我们通过实证分析、走访调研和理论分析三个角度对已有系统进行述评以明确研发难点和重点,为下一步大范围、深度化研究指明方向。

一宏观视角:系统述评1.供给层面的述评目前而言,法院系统内部的S市模式和G省模式在办案系统方面最具代表性,但是两个系统的特色各有不同,S市偏向于办案系统在贯彻证据规则,统一法律适用上起到智能辅助作用,而G省偏向于办案流程智能化管控。

G省刑事模式的优势在于各单位专网整合早,数据利用的整合能力强,但是系统适用范围相对较窄,仅针对十余类刑事案件的裁判文书进行梳理分析,并且主要提取量刑要素分析处理;应用效果和部门协调应用有待提升;辅助法官制作裁判文书方面功能较弱。

2.需求层面的问题(1)开发应用与实际需求存在偏差的主要原因系需求分析的产品负责人对于法律和一线办案人员所需不甚了解(2)关于研发数据的数量和质量问题系事关AI能否有效开展研究的基础性工作,因为现有法律数据大多是非结构化数据,将此类数据有效的转化为准确和可理解的数据需要标注工作科学化。

二微观聚焦:运行问题现阶段各项办案系统的运行远没有达到人们预想的实用结果,从法律角度看其主要原因是系统的开发者对法律问题还不太熟悉,没有将法学理论的方法引入这些系统开发同时对数据未进行有效法标化、推理建模算法不成熟等问题是给我们法律工作者和技术研发者提出的棘手课题。

1.系统数据表达的非标准化2.系统逻辑建构的不确定性二理论支撑:AI系统的建构路径

笔者认为在研发技术载体上应坚持专家系统和人工神经网络技术并存发展的路径,这对民商事案件智能辅助办案系统的初期建构非常必要在初期的研发路径上分三步:第一步是仿照裁判方法成果进行树状结构图梳理,再通过排除选项和人工提取法律文本中的审判要件进行建构。

第二步是立足审判要件、庭审笔录和裁判文书(非结构化文本)等,对案件进行要件提取与数据标注,进而归纳各种可能出现的情形进行模块化建构第三步是将裁判思维提取与审判要件标注通过技术领域的算法进行研发整合,并在数据跑测下完善对大量案例和文档的深度学习和分析。

一民商事专家系统的破题基础1.研发对象的选择原则AI下的民商事智能辅助办案系统的研发按照对象类别可分为简易型和复杂型,初期研究对象的选取上应考虑简易类型为主,复杂案件为辅,但是最好两类案件可以在体系上一脉相承。

研究对象的选取一定要科学论证,通过大量的试错与有益尝试,初期研究对象的选取最好满足以下原则:第一,选择的领域应是一个相对自我完备的法学分支领域;第二,该法律领域的确需要法律专业知识;第三,最好选择一个窄而深的领域;

第四,最好选择法律专家争论较少的领域;第五,选择的领域不需要大量知识性常识2.研发建模的法理基础民商事案件智能辅助办案系统的模型建构需要提出关于法律推理性质的假设,该假设不仅需要基础性的法律知识,更需要法律推理的完整理论,即法学规范理论、法学推理理论、描述法律科学的理论。

尽管法律推理十分复杂,但它具有相对稳定对象(案件)、相对明确的前提(法律规则、法律事实)及严格的程序规则,且须得出确定的判决结论,这为人工智能模拟提供了极为有利的条件 法律形式主义遵循三段论的推理逻辑模式,最基本的两个要素为机械的演绎推理和封闭的规则体系,其认为将法律化成简单的几何公式是完全可能的。

同时以图尔敏和佩雷尔曼为代表的逻辑学家们开始把注意力转向实践推理特别是法律推理领域,开辟了法律逻辑研究的新领域该法律逻辑理论的进一步发展为人工智能的司法应用提供了可能的理论前提但法官所从事的法律活动不可能不受到其社会体验和思维结构的影响,尤其是民商事案件夹杂了大量社会利益的衡量问题。

因此,法律形式主义忽视了推理主体的社会性,造成系统设计僵化性的致命弱点此时法律现实主义的理论运用促使人工智能研究从模拟法律推理的外在逻辑形式,进一步转向通过探求法官的内在思维结构,总结裁判经验中的规律性和普适性问题。

在此背景下,大规模知识库系统(KBS)开发就注意了思维结构的整合作用,又通过联想程序被有机联系起来,构成具有法律推理整体功能的系统“开放结构”理论为人工智能在司法领域的深度学习应用提供了理论基础,打开了疑难案件自下而上的法律推理模拟的思路。

在这一理论的指导下,人工智能在司法领域可以进行更具深度和广度的应用,一方面是将简易问题从疑难问题中筛选出来,运用基于规则的技术来解决;另一方面是将疑难问题先用非案例知识,如规则、控辩双方的陈述、社会常识来获得初步答案,再运用案例来比对,检查案件的正确性。

上海市高级人民法院目前承担研发“推进以审判为中心的诉讼制度改革软件”的任务正是对这一理论最好的实践和诠释3.研发路径的技术支持早期的法律智能辅助系统研发路径主要依靠专家系统理论来构建,如国外具有代表性的美国D.沃特曼和M.皮特森1981年研发的法律判决辅助系统、1993年武汉大学开发《实用刑法专家系统》等均是通过大量“如果-就”(If-Then)规则定义进行“自上而下”的设计。

专家系统理论是在产生式系统的基础上发展起来的,通过知识库和推理机两部分来描述从一个基本概念演绎出的系统虽然专家系统存在欠缺自我学习的能力等缺点,但现阶段关于利用人工智能进行法律推理、建立司法裁量模式,专家系统仍是人工智能与法律结合研究的重点之一。

目前,人工神经网络是AI研究的另一个重要方向,属于“自下而上”的机器学习思路它的基本特点是试图模仿大脑的神经元之间传递、处理信息的模式来解构法律问题其技术研发的路径和步骤:通过小样本数据进行对偶研究,然后经过监督学习、人工打标签、强化学习、交叉验证、原型开发、模型测试、业务试用、模型调整等阶段完成初期研发任务。

根据上述两个技术研发路径和理论支持,民商事案件智能辅助办案系统的架构建设在技术开发角度看具有较高的同质性,基本均采用依靠专家经验提取案件要素和证据规则,通过大量的人工化的要素标签建立起办案系统的标签体系,再通过逻辑建模、物理建模等对数据进行机器学习训练,同时形成数据支撑下的神经网络再造和发育,通过数据的优化、迭代最终实现机器对法律各领域的自主学习功能,实现民商事办案系统的智能化。

综上所述,根据需求正确地引入不同的研发技术路径可以有效地将审判要件进行系统归类和裁判思维的构建进行有机契合,使其达到研发目标4.研发步骤的注意事项细节决定成败,蹄疾步稳中坚持法律问题标准化、技术问题简单化的原则。

法律问题标准化建设包括术语表达统一内涵、裁判依据的归纳概括具有明确性等,为解决好此方面的问题,需要经验丰富的法官在实践的过程中有计划地逐渐统一术语表述,并通过完善类案制度统一裁判依据涉及技术问题简单化方面,主要针对法律工作者与技术人员的知识嫁接“鸿沟”问题,该内容的清障是各环节工作开展的基础,通过总结优化各机构的研发经验,涉及审判逻辑方面的内容可以通过思维导图方式进行图示化展示,可尽可能的将双方沟通的内容精准化。

涉及技术语言的理解方面,首先,要确定文本语义相似度比较的对象,并实现语义相似度计算讨论的对象包括篇幅划分(如词组,段落还是全文)和结构划分(如证据、法院认定和法律依据)两个方面其次,采用何种自然语言描述推理规则的提取关系到规则库、领域库和法律库(例如储蓄存款合同纠纷案由相关的法律)的设计和构建技术。

最后,输入系统的语义概念和逻辑体系必须自洽,不能含糊不清甚至互相矛盾二民商事案件智能辅助办案系统建构的方法初探民商事案件办案系统的智能化是个宏观而复杂的问题主要以裁判思维的成果整理和类案要件提取标准化建设作为逻辑起点的两个方面进行办案系统建构初探。

1.裁判思维的整理与提取——数据结构树的逻辑起点按照诉讼请求、法律关系、法律规范、案件事实、法律结论的逻辑思路建构裁判思维(1)诉讼请求表达固定化诉请基础的固定事关整个诉讼,所以要在系统建构中先决的预设完整、精准的请求权词语表达。

在这方面,S市某中级人民法院已卓有成效的构建了诉讼请求主题词库和裁判文书主题词库,在诉讼请求主题词库方面进行全面的、标准化的整理编撰,细分300项案由,1483项诉讼请求这项诉请的整理基于最高人民法院关于案由的规定,但又创新的结合司法实践中常用术语表达进行升华。

同时对提出各项诉请所依据的请求权基础及法条的原文进行整理和编纂这一步的跨出实质地解决了诉讼中请求权基础词语混杂、机器学习难以识别的问题,增强了案件信息间的聚合度,有效回应了案件信息的非结构化难题,为办案系统的建构提供了标准化、体系化的审判数据模型。

(2)推理模型选择与场景深化设计诉请固定后如何选用适合的裁判方法或者要件方法系办案系统设计中的核心问题目前而言,实证表明所谓的逻辑三段论在实践中套用情形并不足以支撑细化的案件事实,所以三段论只能作为检验模型设计是否合理的工具或者语言编写的程序,但不适宜作为案件推理模型进行整体设计。

如果能够将所有的法律论证置于演绎论证框架之内,就可以将所有的法律推理和论证交给计算机处理但是司法实践中的法律概念、规则往往可以作不同解释,而且往往是诉诸例外的,如果遵循演绎主义,每增加一次例外就重写一次公式,无疑会增加一阶公式表达的复杂性,因此需要另寻途径和方法。

法律实践表明,将法律推理处理为一种非单调推理是有效的解决办法目前,从实践中看案例法律推理和规则法律推理现在已聚合了,这个框架提供了一个能够组合规则推理和案例推理的语境人脑的逻辑基础是非形式逻辑,而电脑的逻辑基础是形式逻辑。

如果说形式逻辑对论证的分析与评价仅仅是建立在语义和句法维度之上的话,那么非形式逻辑显然在形式逻辑框架基础上引入了一个语用维度在场景模型的选择上,笔者认为有两种进路选择可供参考一种是以引入德国成熟的裁判模型,即法律适用方法中常用的归入法或者相关性分析法。

优势在于裁判思维模式成熟,简单案件适用归入法,复杂案件适用相关性分析法,同时技术层面的树状图制作也不复杂劣势在于模型较简单和我国实践中较少应用此方法,需要一线法官逐渐在案件中丰富并进行深化设计,但受限于目前我国法官队伍掌握此裁判方法的人并不多,制约了该方法的快速系统地应用。

另一种是尝试直接试用我国理论学界或者法院实证已受关注的民商事裁判思维其优势在于裁判规则逆向总结贴合司法实践,同时丰富的类案模型设计可以满足基本的案件需要并方便机器深度学习,尤其现阶段的研发进展使研发者越来越清晰地认识到不同类型的法律问题要求不同的推理形式,如证据推理不同于法律解释,而法律解释又不同于法律规则适用或立法辩论。

在这样的法学理论和技术要求的背景下,通常场景模式下的特定化场景构建就是一个非常重要的内容以上两种进路无论选择哪种作为模型基础都是初步的框架性逻辑设定,需要在数据跑测中逐渐丰富和完善,更离不开我们审判实务部门在日常的审判活动中积极整理各种疑难案例的裁判思路。

(3)思维导图的充分运用思维导图是一种将放射性思考具体化的表达方法,优势在于清晰展现案件全部裁判思维流程,具有点线面结合的特点,易于将复杂的问题简单化,在数据建模的始端概念建模阶段通过思维导图易于明确产品需求以及业务规则,避免法律人口述或者文字表达后技术人员理解偏差的问题。

然后落实到实体,这些信息将来会成为数据字典中非常重要的一部分,也就是所谓的元数据2.要件标准化和标注化建设——数据标准化的建构过程 (1)要件提取“标准”化国外在进行应用之前,通常将已有的类案研究成果进行标准化提取,然后再根据各类案常用的不同审判思维进行模拟编程,这种将理论研究成果与法律科技创新相结合的方式已得到绝大部分实务人士和技术人员的认可。

但是问题就在于一般的标准化提取要件如何实现结构化和科学性从宏观上看,法官的智慧是最核心的财富,审判业务部门应配合好要件提取工作,通过类案审判要件的大数据分析总结案件具体特征、事实情况、诉请与抗辩内容等填充到树状结构图,通过样本的机器学习最终有效得出所需结果。

笔者正在尝试利用审判要件标准化的提取来构建AI知识图谱如当事人的诉讼请求为“查阅、复制会计账簿”可以快速定位其请求权基础及其构成要件,并且通过对应被告的主要抗辩理由,可以快速对案件法律关系予以整体性的把握。

从微观实证上看,每类案件具有其特殊性,需要分类整理证据内容与证明目的、通常争议点及对应的法律依据比如,德国Hollatz教授采用高斯发散神经网络的方法对200个非物质损害案例进行类案提炼,利用数学模糊性的评价系统将数据推理具体化为:伤害类型、持续时间长短、造成的后果的严重性、性别、职业的损害、特别严重情节和医疗损害,最终获取非物质损害的裁量模式,该模型良好地运用于非物质损害的赔偿系统软件中。

目前,S市民事、行政案件智能辅助办案系统通过人工提取大量卷宗和整理各类材料,已建立包括证据规则、证据指引库、办案要件(六类八个案由)、立案审查关键要素库、诉请库、抗辩库,案例库等12项大数据库,为办案提供信息支撑和保障。

(2)类案“标注”科学化标注系技术用语,应用于模型和复杂神经网络建构,如标注的数据越准确、数量越多,模型的效果越好所以类案标准化确定后标注内容表达要素提取要全面化、科学化,S市某中级人民法院在两库建设中的做法值得我们关注。

运用技术手段对裁判文书主题库方面中各类案由所含的高频词汇,关涉事实认定和法律适用难点的关键词,以及文书中所含的包括但不限于行业经济发展、社会综合治理人员结构等重要要素高亮提示,以“贴标签”的形式予以设置标注,共梳理2654个主题词。

(3)类案“问答式”交互化深度学习技术将改革人们与技术的交互方式,同样智能辅助办案系统如何在设计应用中体现这种交互性非常重要,也事关能否实现法律AI化的关键笔者也正在尝试利用在类案“庭审笔录”整理与“思维导图”的指引下,通过EXCEL表格细化法官审理思维,实现当事人求问思维和技术人员程序思维的问答交互,进而在程序编写过程中可初步跑测数据的合理性。

三实务指南:AI示范模本的应用

在上述问题意识的指引下,下面以银行借记卡被盗刷的储蓄存款合同纠纷为例进行标准化的审判要件提取和裁判结构树的建构,做到智能深度学习与服务诉讼当事人的作用以下内容系S市M法院与H省某大学机构按照数据的来源侧、数据的处理侧、数据的产业侧暨挖掘、分析、应用等三个方面进行共同研发的微观展示。

一研究对象的选取与破题技术的基础1.研究对象的符合性借记卡盗刷类案件在研究对象上具有限缩性特征,避免出现研究面过大的易遗漏问题 2.技术性目标的设定第一步,以“伪卡盗刷”类型为案由的判决书收集和分析(法律研习者为主);。

第二步,研究基于结构和语义的判决书文本提取和语义匹配方法(高频词汇整理外以技术人员为主);第三步,研究基于规则的判决结果诊断方法,设计和实现基于规则的判决结果推理服务;第四步,研究基于模板的判决书生成方法,设计和实现基于模板的判决书生成向导服务。

上述第三、四步主要以技术人员为主导二裁判思维的整理与提取1.诉讼请求表达的确定系源泉的固定设定程序后电脑自动下载1600份伪卡盗刷案件的判决后对诉请部分进行结构化文本的提取、理解和分析2.模型选择与思维导图深化表达。

 在模型设计上即对已有书面材料或者问题的审查完成后,很大程度上对结论的形成起了决定性作用庭审查明或者问题互答只是为了排除例外事实以及法律规范的寻觅,主要作用则在对于预设结论的进一步验证按照以上的“逆向式民事思维”检索顺序制作逻辑树和思维导图。

步骤演示:第一步:诉请与证据类型;第二步:得出预设结论;第三步:排除例外事实;第四步:寻找法律规范;第五步:作出裁判最终通过制作思维导图,暨与技术人员沟通较为流畅的导图化表达三要件标准化提取和标注科学化建设。

按照要件标准化提取伪卡盗刷类案件,首先审查原告请求权基础并将其固定化;其次审查被告的抗辩权基础;同时进一步归纳争议焦点;再次根据规则分配举证责任,最后明确归责原则同时要件标准化下关键词提取系重要任务,即高频词汇整理。

第一步,选取200份借记卡盗刷案件的裁判文书,即“伪卡盗刷”类型案件的判决书大范围采样,采样过程中需注意判决书采样的审理地区、审理审级等问题,建议采用法律发达地区或者该类型分布较密集地区为主第二步,对高频有用词汇进行标注细化,涉及的技术问题如分词、词典建立、词性标注和相似度计算(文本匹配)内容等由技术人员根据大数据自动高频检索进行分析。

在此过程中除却传统类案研究的书面报告整理外,笔者整理出一套行之有效的新方法在第一步的基础上,先挑选200份相关案由的判决,全部下载下来然后阅读3-5份判决,寻找20个左右大概出现的特殊词,接下来将所有文档进行合并,创建一个文档,word中有插入文档选项进行批量(多选)插入文档。

最后在合并后的文档对20个词进行分别查找,统计每个词出现的频率(一般100次),并按照频率进行排序四人机对话的互动基础设计立足当事人咨询、法官询问和银行抗辩三者的角度构建智能辅助化的咨询系统或者类案结果智推系统。

选取大样本的庭审笔录是先行之举,通过对庭审笔录的充分整理和高度概括明晰审理此类案件的事由和问题比如,笔者通过庭审笔录为基础,结合判决书等材料标准提取和裁判树状设计问题取得良好效果只有以持续不断的数据记录,数据分析模型形成支持事实还原的证据;以用户为中心的司法流程设计依靠高度结构化的改造,才能大大降低当事人进入司法通道的成本,方便法律服务的获取和起到智能交互作用。

(市法学会编辑部供稿)本文为原文节选,原文刊登在《东方法学》2018年第3期。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186

知识知识库系统开发步骤(结构化系统开发方法的步骤)太疯狂了

2023-10-27Aix XinLe121

知识库系统开发步骤(结构化系统开发方法的步骤)太疯狂了以场景需求为导向,补强实践短板,使办案系统后期具备深度学习能力…

艺术春分吃什么传统食物?(春分时节吃什么食物)学到了

2023-10-27Aix XinLe80

春分吃什么传统食物?(春分时节吃什么食物)学到了一年有二十四个节气,每个节气都有对应的食俗。春分是万物苏醒的节气,代表着气温将逐步上升,冬天也就…

历史春分吃什么传统食物?(春分宜吃什么食物)居然可以这样

2023-10-27Aix XinLe75

春分吃什么传统食物?(春分宜吃什么食物)居然可以这样昔日四邑的开平苍城镇的谢姓,有个不成节的习俗,叫做“春分吃春菜”。“春菜”是一种野苋菜,乡人称之为“春碧蒿”。…

历史历史学科简介(历史学科趣味活动)原创

2023-10-27Aix XinLe169

历史学科简介(历史学科趣味活动)原创学习可以很高效…

历史历史学科简介(历史学科趣味活动)难以置信

2023-10-27Aix XinLe195

历史学科简介(历史学科趣味活动)难以置信读历史可以带来以下好处:1. 增加知识:历史记录了过去的事件、人物和文化,通过阅读历史可以增加自己的知识储备。2. 了解过去:历史可以帮助我们了…