递归最重要的两点: 1.base case(递归出口)。必须有某些基本情形,它无需递归就能解出。 2.分解 或者 分类。分解成子问题,或者每层递归分叉,也就是一个N叉树模型。 例题: 打印一个字符串的所有子串 打印一个字符串的所有子串 分解:按顺序每个字母是否打印,分解。 base case: 当 ...
分类:
其他好文 时间:
2019-02-10 14:57:13
阅读次数:
190
BIRCH:是一种使用树分类的算法,适用的范围是样本数大,特征数小的算法,因为特征数大的话,那么树模型结构就会要复杂很多 DBSCAN:基于概率密度的聚类方法:速度相对较慢,不适用于大型的数据,输入参数有r和k k-means:是通过不断更新聚类中心所进行的一种参数变化,需要输入的参数是需要聚成几类 ...
分类:
数据库 时间:
2019-01-21 12:13:15
阅读次数:
871
分类算法非常适合预测或描述标签为二元或标称类型的数据集,对于标签为序数类型的数据集,分类技术则不太有效,因为分类技术不考虑隐藏在序数中的“序”关系,对于标签其他形式的联系如子类与超类(包含的关系),分类技术也不太适合。 本文是分类模型系列的初篇,先介绍最基本的分类/回归模型——决策树模型。决策树分类 ...
分类:
其他好文 时间:
2019-01-19 21:16:39
阅读次数:
178
一、决策树 决策树(decision tree)是一种基本的分类与回归方法,本篇主要讨论用于分类的决策树。 1.决策树模型 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点(node)和有向边(directed edge)组成。结点有两种类型:内部结点(internal node)和叶 ...
分类:
其他好文 时间:
2019-01-17 13:57:10
阅读次数:
231
决策树 概述决策树(Decision Tree)算法是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。我们这章节只讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-then 规则的集合,也可以认为是定义在特征空间与类空间上的条件... ...
分类:
其他好文 时间:
2019-01-16 23:22:15
阅读次数:
244
1、算法介绍决策树是一种基本的分类和回归方法,决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。决策树学习通常包括三个步骤:特征选择、决策树的生成和决策树的修剪。决策树的本质是从训练数据集中归纳出一组分类规则。本文主要是对决策树的ID3算法的介绍,后文会介绍C4.5和CART算法。2、算法优缺点优点:计算复杂度不高,结果易于理解,对于中间值的缺失不敏感,可以处理不相关特征。缺点
分类:
其他好文 时间:
2019-01-13 00:25:16
阅读次数:
191
题目描述 VRI(Voltron 机器人学会)的工程师建造了 n 个机器人。任意两个兼容的机 器人站在同一个格子时可以合并为一个复合机器人。 我们把机器人用 1 至 n 编号(n ≤ 9)。如果两个机器人的编号是连续的,那 么它们是兼容的,可以合并成一个复合机器人。最初这 n 个机器人各自都只有唯 ...
算法概述 随机森林,顾名思义就是由很多决策树融合在一起的算法,它属于Bagging框架的一种算法。 随机森林的“森林”,它的弱模型是由决策树算法训练的(CART算法),CART算法即能做回归也能做分类,“随机”是指构造的模型有一定的随机性。 每一颗决策树模型的训练是通过自助采样法(Boostrap抽 ...
分类:
编程语言 时间:
2019-01-06 11:55:32
阅读次数:
355
1. 过拟合 1.1 产生原因 训练集中的数据抽取错误,太少,或者不均衡,不足以有效代表业务逻辑或场景; 训练集中的数据噪音(异常值)干扰过大; 训练模型的“逻辑假设“到了模型应用时已经不能成立 参数太多,模型复杂度太高; 特征量太多,模型训练过度,比如决策树模型,神经网络模型 1.2 解决方法 减 ...
分类:
其他好文 时间:
2019-01-02 00:04:48
阅读次数:
221
LightGBM的并行优化 LightGBM的并行优化 LightGBM的并行优化 LightGBM的并行优化 上一篇文章介绍了LightGBM算法的特点,总结起来LightGBM采用Histogram算法进行特征选择以及采用Leaf-wise的决策树生长策略,使其在一批以树模型为基模型的boost ...
分类:
其他好文 时间:
2019-01-01 23:56:15
阅读次数:
306