六、机器学习
1. 概述
机器学习就是计算机自动获取知识。
首先谈了什么是机器学习。机器学习的研究目标有三个:
1)人类学习过程的认知模型。
2)通用学习算法。
3)构造面向任务的专用学习系统(工程目标)。
然后谈了研究机器学习的意义。机器学习速度快、便于知识积累、学习结果易于传播。
接着谈了机器学习的发展史。自20世纪50年代以来,可以分为四个阶段,研究内容分别为:
1)神经元模型和决策理论的研究。
2)符号概念获取研究。
3)知识增强和论域专用学习系统。
4)连接学习研究。
最后谈了机器学习的主要策略及研究现状。学习中使用的推理方法称为学习策略。几种基本策略是:
1)机械学习。又称记忆学习,是最简单的学习策略。
2)传授学习。又称指导式学习或指点学习。
3)演绎学习。
4)归纳学习。按其有无教师指导,又可分为实例学习(又称概念获取,给出一组正例和反例)和观察与发现学习(又称描述的一般化)。
5)类比学习。
2. 机器学习系统的基本模型
在这个基本模型中,包含了4个基本组成环节。
1)环境。指系统外部信息的来源,为学习系统提供获取知识所需的相关对象的素材或信息。
2)学习环节。从环境提供的和所需的差异中获取相关对象的知识,将这些知识存入知识库中。
3)知识库。存放由学习环节所学到的知识。在选择知识表示方法时,要考虑的准则有:表达能力的强弱;推理难度的大小;修改的难易;是否便于扩充。
4)执行环节。是整个学习系统的核心。应用知识库中所学到的知识求解问题,并对执行效果评价,将评价结果反馈学习环节,便于系统进一步学习。影响学习环节的因素有:问题的复杂性;反馈信息;执行过程的透明度。
3. 机械学习
首先谈了机械学习的过程。即执行机构每解决一个问题,系统就记住这个问题和它的解。
然后谈了机械学习系统要考虑的问题。
1)存储结构。
2)环境的稳定性和存储信息的适用性。
3)存储于计算的权衡。两种方法:代价效益分析法;最近未用代替法(有选择的放弃法)。
4. 传授式学习
是一种比较使用的学习方法,可用于专家系统的知识获取。包括下列5个步骤:
1)要求。请求专家提出建议。
2)解释。把专家建议转成内部表示形式,属知识表示问题。
3)实用化。信息变换过程,把抽象的建议转成具体的知识。是核心的一步。
4)加入知识库。把得到的新知识加入知识库。
5)评价。
5. 类比学习
首先谈了学习新概念。要注意三个问题:
1)学习者必须要有一定的知识,否则就达不到学习效果。
2)用来类比的失误之间必然具有相似的属性。
3)属性及其值之间的直接比较往往不能说明问题,只有经过抽象以后的属性才能反映类比的本质。
然后谈了学习问题的求解方法。有两种:变化类比法和推导类比法。转换类比学习主要有两个过程组成:回忆过程与转换过程。
6. 归纳学习
按其有无教师指导可分为实例学习和观察与发现学习两种形式。
首先谈了实例学习。又称为示例学习或通过示例学习。给出的实例事先由教师分为正例和反例。给出的一般性知识应能解释所有给定的正例,并排除所有给定的反例。一般情况下,正例和反例是由信息源提供的。信息源分为:已经知道概念的教师、学习者本身、学习者以外的外部环境。实例学习是在机器学习领域中研究最充分、成果最丰富的一个分支。实例学习中的两个空间模型:
1)例子空间:向系统提供的训练例子集合。要考虑的问题是:示教例子的质量;例子空间的组织与搜索方法。
2)规则空间:事物所具有的某种规律。与此有关的两个问题是对规则空间的要求和规则空间的搜索方法。
常用的几种归纳推理方法:
1)把常量化为变量。由具体到一般的演变或归纳。
2)去掉条件。去掉无关子条件(部分约束)。
3)增加选择。增加析取项,扩大范围。常用的方法有:前件析取法和内部析取法。
4)曲线拟合。
搜索规则空间的方法有:
1)变形空间法。一种数据驱动方法。
2)改进假设方法。一种数据驱动方法。
3)产生于测试方法。一种模型驱动方法。
4)方案示例方法。一种模型驱动方法。
数据驱动方法的优点是可以逐步接受示教例子逐步学习。模型驱动方法的优点是抗干扰性好。
然后谈了观察与发现学习。无教师指导的归纳学习,分为:
1)观察学习。用于对示例进行概念聚类,形成概念描述。
2)发现学习。可分为经验发现(从经验数据中发现规律和定律)和知识发现(从已观察的示例中发现新的知识)。
7. 基于解释的学习
属于演绎学习方法的一种。一般描述性框架是:
1)给定:领域知识DT;目标概念TC;训练实例TE;操作性准则OC。
2)找出:满足OC的关于TC的充分条件。
首先谈了基于解释学习的工作原理。
1)构造解释结构。要证明提供给系统的实例为什么是满足目标概念的一个实例。
2)对得到的解释结构进行一般化处理,获取一般性知识。
然后是举例。
最后是领域知识的完善性。要尽量提供完善的领域知识。
8. ID3判定树算法
ID3(Interative Dichotomic Version3)算法是一种示例学习方法,前身是概念学习系统(CLS)。
首先谈了ID3算法。说明了主算法的流程和建树子过程。
然后谈了实例计算。
最后是ID3算法的特点。适用于非增量式学习任务,不适用于接受增量学习任务。
版权声明:本文为博主原创文章,未经博主允许不得转载。
原文地址:http://blog.csdn.net/u012421846/article/details/47753219