标签:blog http 使用 ar sp log html amp ef
样本个数m,x为n维向量。h_theta(x) = theta^t * x梯度下降需要把m个样本全部带入计算,迭代一次计算量为m*n^2随机梯度下降每次只使用一个样本,迭代一次计算量为n^2,当m很大的时候,随机梯度下降迭代一次的速度要远高于梯度下降
梯度下降VS随机梯度下降
原文地址:http://www.cnblogs.com/alexanderkun/p/4025584.html