标签:
给出一个算法,需要部分数据集已经有正确答案。比如给定房价数据集。监督学习又叫回归问题
例子:房价预测,癌症预测
样本集未作标记,把一组未标记的数据分成多个聚类
例子:组织计算机集群,社交网络分析
从背景噪声中提取有效信息。
[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x‘);
比如房价如下:
$x_{1}^{(i)}$表示第i个房子的居住面积,$x_{2}^{(i)}$表示第i个房子的卧室数目,因此x是一个二维向量。
定义假设函数:$h_{\theta }(x)$=$\theta_{ 0}$+$\theta_{ 1}$$x_{ 1}$+$\theta_{ 2}$$x_{ 2}$
$h(x)=\sum_{i=0}^{n}\theta_{i}x_{i}$ = $\theta ^{T}x$
接下来的问题就是如何求解$\theta$的值
定义如下损失函数,以表示$h(x^{i})$与$y^{i}$的接近程度
$J(\theta)=\frac{1}{2}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{{i}})^{2}$
标签:
原文地址:http://www.cnblogs.com/wuchaodzxx/p/5720153.html