1 前言 线性回归形式简单、易于建模,但却蕴涵着机器学习中一些重要的基本思想。许多功能更为强大的非线性模型可在线性模型的基础上通过引入层级结构或高维映射而得。此外,由于线性回归的解直观表达了各属性在预测中的重要性,因此线性回归有很好的可解释性。 1.1 什么是回归分析 回归分析是一种预测性的建模技术 ...
分类:
其他好文 时间:
2021-06-02 18:59:23
阅读次数:
0
机器学习中非均衡数据集的处理方法? 主要包括四大类方法,1Sampling 2Cost Sensitive Methods 3Kernal-Based Methods and Active Learning Methods 4One-Class Learning or Novelty Detecti ...
分类:
其他好文 时间:
2021-06-02 18:45:33
阅读次数:
0
? Python作为一种编程语言近年来越来越受欢迎,它为什么这么火? 其中一个重要原因就是因为Python的库丰富——Python语言提供超过15万个第三方库,Python库之间广泛联系、逐层封装。几乎覆盖信息技术所有领域,下面简单介绍下数据分析与可视化、网络爬虫、自动化、WEB开发、机器学习常用的 ...
分类:
编程语言 时间:
2021-06-02 16:28:33
阅读次数:
0
我去年出了一本Python书,基于股票大数据分析的Python入门实战,在这本书里,我是用股票范例讲述Pythorn的爬虫,数据分析和机器学习知识点,如下是京东的连接。 https://item.jd.com/71486761859.html 结果前几天出版社告诉我,我的书被台湾的出版社买去版权,然 ...
分类:
编程语言 时间:
2021-06-02 15:34:50
阅读次数:
0
一、大数据分析工具——Hadoop Hadoop是一个能够对大量数据进行分布式处理的软件框架。但是Hadoop是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop是高效的,因为它 ...
分类:
其他好文 时间:
2021-06-02 13:17:23
阅读次数:
0
MLE(极大似然估计)与MAP(最大后验估计)在机器学习中是经常用到的参数估计的方法。都属于频率学派的参数估计。 一、极大释然估计(MLE) MLE在构造目标函数过程中非常常见。已知了观测的样本值为$D$,MLE核心思想是:假设我们已知了该样本内定的一个参数$\theta$,这个参数$\theta$ ...
分类:
其他好文 时间:
2021-06-02 11:21:36
阅读次数:
0
1、什么是 softmax 机器学习总归是要接触到 softmax 的,那么这个东东倒底是怎么来的呢?实际上 softmax 可能指两种相似但不相同的东东。 1.1. softmax function 这函数定义比较符合 softmax 这个名字: 可见 softmax function 是从一个输 ...
分类:
其他好文 时间:
2021-06-02 11:05:28
阅读次数:
0
人工智能(AI)是一个广泛而复杂的概念,已经存在了数十年。AI是用于描述模仿人脑认知功能的概念或系统。它可以用来描述机器可以模仿人类行为的方式行动或表现的情况。AI通常用于描述一个可以从经验中学习,可以使用知识来执行任务,推理和做出决策的系统,例如,专家系统,神经网络和模糊逻辑。 机器学习是AI的子 ...
分类:
其他好文 时间:
2021-05-25 18:11:15
阅读次数:
0
班级 机器学习实验-计算机18级 实验内容 K-近邻算法及应用 姓名 程王宇 学号 3180701339 ##【实验目的】 1、理解K-近邻算法原理,能实现算法K近邻算法; 2、掌握常见的距离度量方法; 3、掌握K近邻树实现算法; 4、针对特定应用场景及数据,能应用K近邻解决实际问题。 ##【实验内 ...
分类:
编程语言 时间:
2021-05-24 15:46:26
阅读次数:
0
前言 机器学习中,我们不能将全部数据用于模型训练,否则将没有数据集对模型进行验证,从而无法评估模型的预测效果。 验证集方法 整个数据集分成两部分:一部分用于训练,一部分用于验证,即训练集(training set)和测试集(test set)。 如上图所示,将左侧数据作为训练集(包含7、22、13等 ...
分类:
其他好文 时间:
2021-05-24 15:36:16
阅读次数:
0