原创 | 知识萃取的基石 - 知识内容分类方法

作者:江焕勇

· 知识分类,知识萃取专题

1

为什么需要对知识进行分类?

主要是两个原因。

1、知识与知识之间,天然就有差异,这种差异决定了学习方法不同。

一个人要学会游泳,最好的方法是什么?当然是不断地练习,在游泳池游,在江河池塘中游都可以,就是不能总在教室上课学理论。

因为游泳是一种肌肉技能,必须通过身体练习,才能得到肌肉记忆。

案例开发

古巴比伦贵族,从小要学习各种法典,最好的办法是什么?除了在集中式环境中(教室、寺院等)变换背诵之外,没有其他什么好办法。不要觉得现在有什么进步,现在的律师学习法律条文和判例,也得这么办。

因为,这是一种信息,主要的学习目标就是记忆重现。

教学设计

知识的差异,意味着教学设计必须差异化,否则没什么效果。

2、不同的知识,内容结构也是不同的,这种差异决定了不同知识点,其内容萃取也不同。

知识怎么教,固然很重要,但更重要的是,知识是什么- 知识的内容。

很多时候,教不明白,其实是知识本身的内容就不明不白。比如下面这段话,是解释一个概念:内卷化。

你理解“内卷化”是什么意思了吗?

光凭这段解释,你很难理解这个概念。因为这个概念没有解释内卷化是什么,只是解释了一种特征。

一个概念,要想让受众理解,内容上就需要有区别特征和实体两个部分。首先是实体,内卷化是社会某个领域的一种状态。其次是关键(区别)特征,内卷化的关键特征有两个:外部增量逐渐衰减、内部竞争不断加剧、前两者不断重复循环激化。

所以,可以将内卷化定义为:社会某个领域外部增量逐渐衰减、转为内部竞争,这个过程不断循环激化的状态。

教学案例

概念的例证,也需要和这个定义相吻合,比较完整的,需要有正例和反例。如下:

内卷化的例证(事例 -正例和反例):手工业领域的内卷化现象

正例:清朝的手工业就是一个内卷化的例子。清朝的时候,农业人口很多,手工业者都是由农民组成,所以,手工业的人力成本低。由于人口繁衍的惯性,农业人口越来越多,于是,在手工业领域,农民和农民之间相互竞争,人力成本就越来越低,作坊如果需要增加产能,只需要增加人手即可,没有改进技术的动力,如此循环下去,手工业者之间竞争加剧,其处境呈现出一种不断螺旋式下降的状态,而手工作坊的技术和效率一直处于一种停滞的状态。

反例:英国的手工业发展是一个反例。英国的农业人口比较少,大航海之后,纺织业需求比较大,英国织布厂就需要扩大产能,但人工很贵,资本家没有采用增加人手的方式,而是利用工业革命的成果,研发机器设备和纺纱技术,最终利用蒸汽动力和珍妮纺纱机,大规模提升了效率和产能,纺织行业的工人的薪酬收入也不断得到提升。

以上的事例说明:要想有效萃取知识、准确表达知识内容,就需要对知识进行内容分类。换句话讲,知识分类是演绎式知识萃取的基石。

2

按内容进行知识分类的方法

知识分类,主要有两种分类方法:

  1. 按学习结果分类
  2. 按学习内容分类

按学习结果分类,就是根据学习后的产出进行分类。常见的分类方法有KSA(知识、技能和态度)、加涅5分类法(言语信息、智慧技能、认知策略、动作技能和态度)。

按学习内容分类。就是根据知识点的内容进行分类。常见的主要是梅瑞尔的5分类法(事实、组成成分、过程、概念和原理)。

有人说,这不是差不多嘛?你细品一下,差别还是很大的,因为分类的依据不同,咔嚓的位置不同。

教学设计

学习结果分类主要适合用于教学设计,因为人家本来就是瞄准学员学习结束后的目标结果嘛。

学习内容分类,既适合知识萃取,也适合教学设计。因为人家就是从知识内容出发的做分类的。

3

改进型梅氏知识分类法的要点

演绎式知识萃取技术,使用学习内容分类法,从梅瑞尔分类方法改进而来的。

要点有这么几个:

(1)知识可以按照内容进行分类,分别是过程、原理、概念和信息工具。每一类知识都有自己的结构。

(2)四类知识之间也是有层次关联的,过程是第一层,原理是第二层,概念是三层,信息工具1~3层的附属。

(3)一门课程或一个知识主题,都可以绘制出一个知识点图谱出来,组成课程或主题的知识框架。

知识图谱

4

4种知识内容分类

改进型知识内容分类,经过多年的实践和应用迭代,证明这种分类方法有以下好处:

  • 很好辨认,经过10分钟左右的讲解,80%的学员可以对知识点进行正确分类和辨认
  • 每种知识可以再进行细分,提炼出一般性的知识结构模板,可以用于知识萃取。
  • 非常方便地进行课程知识图谱的绘制。

1、信息工具。包含不要解释的信息和作业工具。是过程、概念或原理的附属知识类型。

一般包含:

  • 清单表格

  • 作业指示图

  • 信息结构图

  • 操作模板或表单

比如:深圳梧桐山的顶峰海拔高度是902米,就是一个信息数据,包含了三个信息字段和三个对应的数据(地点、山峰名称、海拔高度)。

在课程开发中,信息工具经常表现为工具。如下图就是一个速查表(清单),是计算个税的信息工具,这样的清单非常多,比如空调维修故障清单:

课程案例

还比如:XXX风机的结构示意图,也是一个结构图,包含结构部件及位置数据。信息结构图,也可能是信息图标,也就是信息数据的图形化呈现形式。如下图,实际包含大量的二维表格数据。

课程案例

实际的业务知识萃取时:

  1. 概念类知识点可能包含有清单表格、信息结构图

  2. 原理类知识点可能包含模板

  3. 过程类知识点可能包含作业指示图、操作表单。

2、概念。指需要解释和辨认的名称术语、分类。

比如,对于一般成人来说,苹果是不需要理解和辨认的,它是一个信息,但对于小孩来说,这是一个概念,因为需要解释“什么是苹果?”,“苹果和其他水果,怎么分辨?”

课程设计

内训课程中,很多学习内容实际是对各种概念的解释和辨认。比如,店铺选址中涉及店铺的分类和辨认,一个初级店铺拓展专员,要学会的第一件事,就是辨认CBD店铺、社区型店铺等的区别特征,在此基础上对候选店铺进行分类,以此判断候选店铺的选址价值。

3、原理。是指探究条件要素和结果之间关系的知识,也就是解释“为什么”的知识。

通常来说,原理类的知识包括以下几种:

  • 原则。是做事或达到一个结果时的行为规范。

     

  • 条件要素。是指达成结果所需要的条件,比如,SMART原则,实际是好目标(结果)写作的五个条件。

     

    很多时候,XXX模型,就是条件要素。比如案例编写的STORY模型,就是编写案例的5个组成要素。

     

  • 情境处理策略。包含在什么情况下,应该怎么做的知识。比如门店销售课程中,客户分类接待策略 -不同类型客户的不同接待策略:A类客户XXX接待,B类客户XXX接待

     

    注意下图,其实是包含了分类和分类情境处理策略的两个知识。

案例开发
  • 公式。这个和条件要素比较相似,都有条件因子,但公式还包含结果和公式关系。

    在所有的知识分类中,原理类知识,结构最为复杂,也是最为核心。一门内训课程知识萃取的成功程度,与这门课程对原理类知识的萃取程度正相关。

4、过程。是指关于“如何做”的知识。就是完成任务或解决问题的流程、步骤和动作。

比如:烹制红烧鱼,就是一个过程类的知识。

大部分的内训课程,如果是基于工作任务完成和问题处理解决,那么,第一个要找到的知识一定是过程类知识。

知识图谱
总结一下:

1、知识需要分类,分类方法有基于结果的分类法和基于内容的分类法

2、知识萃取,最好使用基于内容的分类法。

3、演绎式知识萃取方法,知识分类为改进型梅氏分类法,包含过程、信息工具、概念和原理。可以应用在知识萃取和知识图谱的绘制上面。是知识萃取的基础技术。