k-means应该是原来级别的聚类方法了,这整理下一个使用后验概率准确评测其精度的方法—高斯混合模型。 我们谈到了用 k-means 进行聚类的方法,这次我们来说一下另一个很流行的算法:Gaussian Mixture Model (GMM)。事实上,GMM 和 k-means 很像,不过 GMM ...
分类:
其他好文 时间:
2020-05-14 19:24:26
阅读次数:
64
线性模型可以拟合线性问题,这是毋庸置疑的,但实际中处理的数据往往比直线更加复杂的非线性数据。这时,依然可以尝试使用线性模型来解决这个问题。 对每个特征进行加权后作为新的特征,然后在这个扩展的数据集上训练线性模型 啥意思呢,举个例子: 假设函数为: $$h_\theta(x)=\theta_0+\th ...
分类:
其他好文 时间:
2020-05-13 23:12:17
阅读次数:
70
em,是一种含有隐含变量的概率模型参数的极大似然估计法。主要应用在机器学习以及计算机视觉的数据聚类领域。 lr,逻辑回归,本质也是线性回归,通过拟合拟合样本的某个曲线,然后使用逻辑函数进行区间缩放,但是一般用来分类,主要用在点击率预估、推荐系统等; svm,支撑向量机,通过找到样本空间中的一个超平面 ...
分类:
编程语言 时间:
2020-05-13 19:44:45
阅读次数:
114
https://datawhalechina.github.io/pms50/#/chapter3/chapter3 如果你想了解两个变量如何相互改变,那么最佳拟合线就是常用的方法。 下图显示了数据中各组之间最佳拟合线的差异。 要禁用分组并仅为整个数据集绘制一条最佳拟合线,请从下面的 sns.lmp ...
分类:
其他好文 时间:
2020-05-11 23:47:07
阅读次数:
402
博主是高中生,前几天学到了初级的线性回归方程。总用卡西欧敲然后带入公式实在有些麻烦。于是心血来潮用Python实现了一下~ 原理:求线性回归方程: 求决定系数: 代码: # -*- coding:UTF-8 -*- import numpy as np #输入开始 li = list(input(" ...
分类:
编程语言 时间:
2020-05-09 21:44:22
阅读次数:
75
之前证明了整个回归方程,或者说梯度下降法的表达式, 现在来看看计量经济学里的回归表达式 y=ax+b, 出于对关系的不确定, 在计量经济学里,式子多了一个u作为随机干扰项 干扰项 u 我们认为是不可观测的值 我自己的理解是这样_不是很严谨的粗糙理解: y=ax+b+u,我们改写成 y-u=ax+b, ...
分类:
其他好文 时间:
2020-05-07 09:20:29
阅读次数:
161
1.多项式回归(Polynomial Regression). "一元多项式回归": 自变量只有一个 ;"多元多项式回归": 自变量有多个。 一元n次多项式:$\hat{y}=w_{0}+w_{1} x_{1}+ w_{2} x^{2}+\cdots+w_{n} x^{n}$ 多元多次多项式(二元二 ...
分类:
其他好文 时间:
2020-05-05 23:28:54
阅读次数:
76
多元线性回归问题求解使用的数据集是经典的boston房价数据。一共506个数据,后面56个数据我将其划了出来作为测试集。比较的简单,主要是学习步骤与算法。该数据集每一个样本包括12个特征变量和该地区的平均房价。 1 import tensorflow as tf 2 import matplotli ...
分类:
其他好文 时间:
2020-05-04 15:34:02
阅读次数:
82
一:为什么需要神经网络 (一)案例 为了很好的拟合数据,我们需要保留较多的相关参数,虽然可以使用正则化进行优化。但是无论是线性回归还是逻辑回归都有这样一个缺点,即:当特征太多时,计算的负荷会非常大。 之前我们已经看到过,使用非线性的多项式项,能够帮助我们建立更好的分类模型。假设我们有非常多的特征,例 ...
分类:
其他好文 时间:
2020-05-02 22:37:21
阅读次数:
208
实验目的: 1、学会使用SPSS的简单操作。 2、掌握回归分析。 实验内容: 1.相关分析。线性回归相关关系指一一对应的确定关系。设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y ...
分类:
其他好文 时间:
2020-05-02 19:24:58
阅读次数:
463