作用域 LHS RHS 区别 1. 如果 RHS 查询在所有嵌套的作用域中遍寻不到所需的变量,引擎就会抛出 ReferenceError 异常。值得注意的是,ReferenceError 是非常重要的异常类型。 相较之下,当引擎执行 LHS 查询时,如果在顶层(全局作用域)中也无法找到目标变量, 全 ...
分类:
Web程序 时间:
2018-11-17 10:34:37
阅读次数:
170
目标 变量定义 变量的类型 变量的命名 标识符和关键字 变量的命名规则 01. 变量定义 在 Python 中,每个变量 在使用前都必须赋值,变量 赋值以后 该变量 才会被创建 等号(=)用来给变量赋值 = 左边是一个变量名 = 右边是存储在变量中的值 变量名 = 值 变量定义之后,后续就可以直接使 ...
分类:
编程语言 时间:
2018-11-16 01:12:26
阅读次数:
276
数据挖掘主要有两大类: 预测任务:根据其他属性的值,预测特定属性的值 描述任务:导出概括数据中潜在联系的模式(相关,趋势,聚类,轨迹和异常) 4种主要的数据挖掘任务: 预测建模: 预测建模: 分类:用于预测离散的目标变量(如预测web与用户是否会在网上买书,预测花类型)。 回归:用于预测连续的目标变 ...
分类:
其他好文 时间:
2018-11-14 19:48:20
阅读次数:
169
变量进阶(理解) 目标 变量的引用 可变和不可变类型 局部变量和全局变量 01. 变量的引用 变量 和 数据 都是保存在 内存 中的 在 中 函数 的 参数传递 以及 返回值 都是靠 引用 传递的 1.1 引用的概念 在 中 变量 和 数据 是分开存储的 数据 保存在内存中的一个位置 变量 中保存着 ...
分类:
编程语言 时间:
2018-11-08 00:18:23
阅读次数:
169
虽然叫做“回归”,但是这个算法是用来解决分类问题的。回归与分类的区别在于:回归所预测的目标量的取值是连续的(例如房屋的价格);而分类所预测的目标变量的取值是离散的(例如判断邮件是否为垃圾邮件)。当然,为了便于理解,我们从二值分类(binary classification)开始,在这类分类问题中,y ...
分类:
其他好文 时间:
2018-11-07 15:28:24
阅读次数:
175
【译】提升树算法的介绍(Introduction to Boosted Trees) 1. 有监督学习的要素 XGBoost 适用于 有监督学习 问题。在此类问题中,我们使用多特征的训练数据集 $x_i$ 去预测一个目标变量 $y_i$ 。在专门学习树模型前,我们先回顾一下有监督学习的基本要素。 E ...
分类:
编程语言 时间:
2018-10-27 21:14:56
阅读次数:
188
6.1项目背景和业务分析需求的提出 ...... 6.2数据分析师参与需求讨论 针对需求收集相关的背景数据和指标,熟悉业务相关逻辑 从数据分析的专业角度评价初步的业务分析需求是否合理,是否可行 6.3制定需求分析框架和分析计划 确定项目目标变量的定义 分析思路的大致描述 分析样本的数据抽取规则 潜在 ...
分类:
其他好文 时间:
2018-10-14 11:42:58
阅读次数:
151
贝叶斯定理(Bayes Theorem) 朴素贝叶斯分类(Naive Bayes Classifier) 贝叶斯分类算法(NB),是统计学的一种分类方法,它是利用贝叶斯定理的概率统计知识,对离散型数据进行分类的算法。 朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出 ...
分类:
编程语言 时间:
2018-10-13 02:34:04
阅读次数:
255
导入类库 小知识 获取波士顿房价数据 多变量图 热点图 回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例; 回归任务的特点是标注的数据集具有数值型的目标变量。也就是说,每一个观察样本都有一个数值型的标注真值以监督算法。 线性 ...
分类:
其他好文 时间:
2018-10-06 12:02:50
阅读次数:
220
1. 用于执行分类,回归,聚类和密度估计的机器学习方法: a. 监督学习的用途: b. 无监督学习的用途: 2. 选择合适的算法: 如果是想要预测目标变量的值,则可以选择监督学习算法,否则选择无监督学习算法。 确定监督学习算法之后,进一步确定目标变量类型,如果目标变量是离散型,如1/2/3,A/B/ ...
分类:
其他好文 时间:
2018-10-01 22:35:31
阅读次数:
174