演绎式知识萃取技术

创新的经验萃取方法论

· 知识萃取专题

1 ​什么是知识萃取?

通俗地说,梳理知识点的内容并用一定的结构表达出来的过程,就是知识萃取。

举一个例子。

知乎上有一个提问:如何在聚会上得体地发言?

课程开发是知识萃取最重要的一个应用场景

有人总结了应景式聚会发言的万能公式:感谢+回顾+未来愿景,并且用一个谐音表示:赶回来

这三个方面应该具体怎么做呢?

1、“赶”:感谢在座的听众。


① 要有全体或大部分听众

② 要有1-3个具体的关键听众。

2、“回”:回顾过去的经历、经验、成绩、教训等。

① 以具体的小故事的方式呈现

② 如果和听众关联更好

3、“来”:对未来的希望、祝福、梦想等。

① 提出具体的目标和期待

② 表达信心

这就是知识萃取成果的三个内容要素。

  1. 知识点名称:聚会发言万能公式

  2. 知识结构:三个发言点 - “赶回来”

  3. 知识结构的具体内容:每个发言点都有2个要点


关于知识萃取成果,可能有人会问:知识萃取的成果需要包含案例吗?一般来说,是需要的。也就是说,一个知识点的萃取成果需要包含典型例证

知道了知识萃取及其成果,那么,知识成果是怎么萃取出来的呢?

一般有两类方法,一类叫归纳法,另一类叫演绎法。

下面逐一介绍一下。

2 归纳式知识萃取方法

归纳法,就是从具体的事例中总结出一般方法的过程。也就是从事例、案例或经验中归纳总结出知识。

比如,铁轨常规故障检查中,有一种方法就是“敲打铁轨判断故障方法”。这种方法就是总结出异常声音和潜在故障之间对照关系。这就是从经验中总结归纳出来的知识。

broken image

归纳法是知识萃取的基础方法,现在应用很广,常见的大体是以下形式:

比如:

张老师在四川眉山观察一位川菜厨子加工一个猪肘子,将他做菜的过程总结为若干个步骤,与此同时,观察厨师每个步骤的操作要点,记录为动作的方法,这个提取的过程就是归纳式知识萃取方法。

这个过程可以归纳为一个流程步骤的结构,而每个流程步骤还可以总结出具体的操作要点。这个整体作为一个知识点,名叫“东坡肘子料理秘笈”。

归纳式知识萃取的关键字是:事例 + 抽象总结

按这个逻辑,要得到知识,首先需要大量的实践事例或案例,然后才能进行归纳总结。

所以,归纳法其实就是复盘,复盘的方法不少,比如经验反馈系统,还比如美军AAR流程:

broken image

3​ 演绎式知识萃取

归纳法比较适合即时复盘的这种情形,也就是干完一项工作或解决一个问题之后,马上进行的经验总结活动。

课程开发时,业务部门的知识萃取往往都不是和业务事件一起进行的。典型事例发生在很久之前,或者业务人员频繁处理一项业务工作,工作的相关技能已经熟练,内化为自己的隐性技能了。

这种情况下,业务专家其实已经可以做直接进行总结归纳了,如果先找典型案例,然后再进行知识的总结归纳反而不自然,也特别费劲。

除了萃取情境的差异之外,归纳式知识萃取也有一些先天的缺陷,那就是归纳法从一个个事例中总结出来的知识,比较碎片化,不够系统完整,而且还无法验证其准确性。

一般这样的知识,作为经验反馈问题不大,如果作为规模复制的知识,存在比较大的风险。

这也是归纳式知识萃取往往得到的是一个个“妙招”的结构性原因。

归纳法是从具体到一般的过程。

演绎法知识萃取,是从一般来具体的过程。两者的过程是相反的。

核心是:知识分类+知识点一般结构 +事例验证。

其中,知识分类和知识点一般结构,这是知识的结构规律。也是演绎的前提,事例验证是对知识结构的证伪。

这也是科学思维的一般过程,也就是说,知识萃取的科学方法就是演绎法。

演绎式知识萃取方法,是这么工作的:
  1. 绘制知识框架,简称为绘制课程的知识图谱

  2. 按照知识点类别的一般结构,归纳提取知识点内容,并以合适的方式呈现出知识点的内容

  3. 编写案例或示例,优化1~2

4 一个演绎法的案例

下面以一个实际例子进行说明:

这是一个钻井勘探相关的一个知识萃取主题,关联的工作任务是解除卡钻(钻具不能自由活动)。场景大概类似下图这样:

(1)课程知识图谱。

一门合格的课程选题,都应该有且仅有一个知识主线。

比如说解除卡钻这个课程,是解决一个具体问题,所需要的知识往往应该包含一个流程步骤、一些动作要领/操作策略/条件参数、一组需要辨认的概念或分类、以及完成动作或辨认所需要的一些关键信息和清单模板。

以上知识点,按照知识分类进行提取组合,形成一个结构化的知识点集合,就是课程知识图谱。

【解除卡钻】是一个工作任务,其核心步骤主要有三个:(1)判断是否发生卡钻;(2)判断卡钻的类型;(3)解除卡钻

对这个一级结构进行分解,就可以得到如下知识图谱(7个知识点):

broken image

(2)知识点内容萃取并表达

也就是提取知识图谱中各个知识点的内容。

演绎式知识萃取,在提取知识内容方面,并不是由萃取者按自己喜好归纳,而是在知识内在结构规律的基础上进行归纳。

演绎法知识萃取中,知识分为四类,知识点的一般结构大约有11种。

知识类型知识点的一般结构
过程流程步骤
信息工具信息清单
句式模板
表单
概念名词术语
分类
原理原则
条件要素
公式
分类情境策略
单一情境方法

萃取知识点内容,就是按照每一种类型的知识的一般结构,归纳提取内容。下面就是一个原则类知识点的内容萃取示意图(点击可放大)。

萃取出来的知识点内容,可以按各种方式呈现表达出来。比如下图就是将知识点内容表达为PPT的方式。

broken image

(3)编写案例,并验证。

演绎法中,提取的知识图谱和知识点内容,可以作为知识的假设,是否准确和全面系统,需要使用案例或事例进行验证。

所以,编写案例一方面是为了以后方便理解和学习,另一方面是为了对萃取的知识进行验证和优化。

比如,《解除卡钻》这个主题,业务专家编写了如下这样一个案例。

broken image

这个案例基本符合1~2步的知识成果,但讨论验证过程中,业务专家认为这个案例仅仅适合一种卡钻情境 - 坍塌卡钻的处理。所以,这门课程需要加上坍塌卡钻的识别,同时,在各个步骤过程中,还需要增加一些细微但关键的作业条件和作业要点。

编写案例和案例验证,在一些比较关键的业务知识萃取时,经常需要梳理多个有差别情境的案例,以保证萃取的知识具备多数场景的可复制性。

总结一下:

1、知识萃取就是找到一个主题的知识结构和知识点内容的过程

2、知识萃取有两类方法,一类是归纳法,常见的经验反馈、复盘等方法都属于归纳法,另一类是演绎法。

3、归纳法是总结某个点的经验,适合即时场景的复盘,演绎法是根据分类知识的一般结构,先梳理出知识内容,再使用案例验证优化的方法,适合系统准确提炼岗位业务经验。