Concept Learning
- supervised, eager learning
- target problem: whether something belongs to the target concept or not
Find-S Algorithm
这个算法得到的是对于数据集最贴切的描述。
优点:
- 这个算法的 output 一定是最符合 positive 的训练数据集,只要训练数据都正确,output 也同样符合 negative 的训练数据集。
缺点:
- 对于训练数据中的噪音十分敏感,如果训练数据中含有错误数据,最后得出的 output 会受到很大的影响。
- 不能保证只有这一种 output 符合训练数据。可能有很多种描述都符合,但这个算法只会得出一种。
Candidate-Elimination Algorithm
相对于 Find-S,这个算法得出两个假设,一个是最贴近数据集的,一个是最 general 的。