数据科学职位的典型面试过程会有很多轮,其中通常会涉及理论概念,目的是确定应聘者是否了解机器学习的基础知识。 在这篇文章中,我想总结一下我所有的面试经历(面试or被面试)并提出了160多个数据科学理论问题的清单。 其中包括以下主题: 线性回归 模型验证 分类和逻辑回归 正则化 决策树 随机森林 GBD ...
分类:
其他好文 时间:
2020-03-06 11:23:59
阅读次数:
95
J=0;dw1=0;dw2=0;db=0; for i = 1 to m z(i) = wx(i)+b; a(i) = sigmoid(z(i)); J += -[y(i)log(a(i))+(1-y(i))log(1-a(i)); dz(i) = a(i)-y(i); dw1 += x1(i)dz ...
分类:
其他好文 时间:
2020-03-04 18:50:11
阅读次数:
52
概念: 一种常用于解决分类问题的机器学习方法,通俗地说就是推测一件事情发生的概率有多大。 例如判断某病人身上的肿瘤是良性还是恶性,结合肿瘤大小,厚度,位置等变量来预测,如果Y=0代表良性,Y=1代表恶性,这里的因变量Y只会是0或者1,就是最常见的二分类问题,逻辑回归也可用于多分类问题。 从之前的学习 ...
分类:
其他好文 时间:
2020-02-26 12:49:22
阅读次数:
60
这篇博文主要是解释偏差和方差,以及如何利用偏差和方差理解机器学习算法的泛化性能 综述 在有监督学习中,对于任何学习算法而言,他们的预测误差可分解为三部分 偏差 方差 噪声 噪声属于不可约减误差,无论使用哪种算法,都无法减少噪声。 通常噪声是从问题的选定框架中引入的错误,也可能是由诸如未知变量之类的因 ...
分类:
其他好文 时间:
2020-02-23 22:09:21
阅读次数:
202
逻辑回归(Logistic Regression)6.1 分类问题参考文档: 6 - 1 - Classification (8 min).mkv在这个以及接下来的几个视频中,开始介绍分类问题。在分类问题中,你要预测的变量 y 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regres ...
分类:
其他好文 时间:
2020-02-20 21:56:18
阅读次数:
62
如何成为一名AI工程师 step 1. 前端:js,html,找准方向开始累积知识! 2. 计算机/数学专业 3. python anaconda IDE pycharm/jupyter 4. 熟悉基础语法,了解数据结构 刷leetcode,剑指offer 5. 熟悉基础数学知识 6. 机器学习入门 ...
分类:
其他好文 时间:
2020-02-20 20:07:42
阅读次数:
73
虽然名字里带回归,但实际上是一种分类方法,主要用于两分类问题,即只有两种分类 优点:计算代价不高,易于理解和实现 缺点:容易欠拟合,分类精度可能不高 原理 线性回归函数 $\small z = f(X) = XW$ 其中 X 是特征值 W 是回归系数 X 和 W 都是向量,可展开为 $\small ...
分类:
其他好文 时间:
2020-02-19 00:49:46
阅读次数:
89
网络结构 输入层、隐含层(多层)、输出层 单个神经元结构,g(z)为激励函数,线性组合,非线性处理 逻辑回归 正向传播预测结果,反向传播调整w和b 激励函数 作用:提供规模化的非线性化能力 常用: 损失函数 单次训练损失: 全部训练损失: 梯度下降 逻辑回归梯度下降 同步更新 网络向量化 网络梯度下 ...
分类:
其他好文 时间:
2020-02-17 20:11:10
阅读次数:
111
进行数学推导 逻辑回顾与线性回顾的差异 为什么logistic Regression 不能用square error Discriminative vs Generative 逻辑回归的方法称为Discriminative(判别) 方法;上一篇中用高斯来描述后验概率,称为 Generative(生成 ...
分类:
其他好文 时间:
2020-02-17 20:00:21
阅读次数:
76
liner classifiers 1.logistic 逻辑回归其实是一个分类算法而不是回归算法。通常是利用已知的自变量来预测一个离散型因变量的值(像二进制值0/1,是/否,真/假)。简单来说,它就是通过拟合一个逻辑函数(logit fuction)来预测一个事件发生的概率。所以它预测的是一个概率 ...
分类:
其他好文 时间:
2020-02-17 13:55:40
阅读次数:
73