上一节当中,为了能够训练logistic回归模型的参数w和b,需要定义一个成本函数 使用logistic回归训练的成本函数 为了让模型通过学习来调整参数,要给出一个含有m和训练样本的训练集很自然的,希望通过训练集找到参数w和b,来得到自己得输出对训练集当中的值进行预测,将他写成y^(I)我们希望他会... ...
分类:
其他好文 时间:
2017-09-08 23:58:47
阅读次数:
568
线性逼近: 相比较于非线性逼近,线性逼近的好处是只有一个最优值,因此可以收敛到全局最优。其中为状态s处的特征函数,或者称为基函数。 常用的基函数的类型为: 增量式方法参数更新过程随机性比较大,尽管计算简单,但样本数据的利用效率并不高。而批的方法,尽管计算复杂,但计算效率高。 批处理方法: 深度强化学... ...
分类:
其他好文 时间:
2017-08-26 13:43:49
阅读次数:
221
结论: 1.遗传算法本质上是一种启发式的随机搜索算法,所以由遗传算法得出的结果每次都不相同。 2.自变量在给定的约束条件下进行了无缝编码(即这种编码方式能够表达解空间中的所以可行解), 所以从理论上讲,遗传算法总有很多机会得到全局最优结果而不是局部最优解。 ...
分类:
编程语言 时间:
2017-08-19 14:22:37
阅读次数:
233
聚类根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。 谱聚类可以在任意形状的样本空间聚类,且收敛于全局最优解,因此在处理高维数据方面存在着明显优势。总的来说,该算法存在一些不足之处。算法在聚类之前需要设置具体应 ...
分类:
其他好文 时间:
2017-08-18 18:36:12
阅读次数:
158
1、value based方法/policy based方法优劣 学生指出:因为value based需要更多的存储 silver:why? silver:(自问自答)因为策略值比值函数更有效 PPT总结: 优势: 更好的收敛特性 在高维或者连续的action空间里面有效 可以学习随机策略 劣势: ...
分类:
编程语言 时间:
2017-08-17 12:40:01
阅读次数:
203
一、贪心算法的基本概念 1.贪心算法,即期望通过一系列相对孤立却满足局部最优性的决策,得到整体意义上的全局最优解。2.贪心算法仅取决于当前决策的最优性,而不考虑对整体利益的影响。3.贪心算法通常以迭代的方式进行,决策之间不宜相互制约。 二、从局部最优到全局最优 例1:noip2004合并果子:传送门 ...
分类:
其他好文 时间:
2017-08-14 00:30:59
阅读次数:
277
状态方程时题意的转化, 通常要if, 遍历到当前状态时, 最后一个字母的情况与上一个或者上多个状态的关系 结果是最后的状态还是只是遍历到最后的状态求全局最优 如Longest Increasing Subsequence ...
分类:
其他好文 时间:
2017-08-05 19:44:35
阅读次数:
135
拉格朗日乘子法 那些年学过的高数 关键词:高数课本 拉格朗日乘子法如何理解? 关键词:解释形象 关于凸优化的一些简单概念 关键词: 为什么凸优化这么重要 关键词:显示不是凸函数,我们这能假设是凸函数,这样我们求得的局部最优才是全局最优 支持向量机 系列教程 关键词: 拉格朗日乘子法如何理解? 关键词 ...
分类:
其他好文 时间:
2017-08-04 20:37:57
阅读次数:
132
最优子结构。局部可达全局最优。 重叠子问题。 不做重复工作。 ...
分类:
其他好文 时间:
2017-06-04 18:23:29
阅读次数:
98
模拟退火基本知识 其伪代码例如以下: Let s = s0 For k = 0 through k_max (exclusive): T := temperature(k / k_max) Pick a random neighbour, s_new := neighbour(s) If P(E(s ...
分类:
其他好文 时间:
2017-05-27 17:03:57
阅读次数:
159