NumPy中提供了各种排序相关的函数。这些排序函数实现了不同的排序算法,每个算法的特点是执行速度、最坏情况性能、所需的工作空间和算法的稳定性。下表为三种排序算法的比较。 种类速度最差情况工作区稳定性 ‘quicksort’ 1 O(n^2) 0 no ‘mergesort’ 2 O(n*log(n) ...
分类:
编程语言 时间:
2020-06-19 12:00:05
阅读次数:
52
NumPy包含一个矩阵库NumPy.matlib,这个模块的函数用于处理矩阵而不是ndarray对象。 NumPy中,ndarray数组可以是n维的,与此不同,矩阵总是二维的,但这两种对象可以相互转换。 matlib.empty() empty()函数返回一个新的矩阵,但不会初始化矩阵元素。 num ...
分类:
编程语言 时间:
2020-06-19 11:58:01
阅读次数:
62
NumPy中,可以通过指定数值范围创建ndarray数组。 numpy.arange 要使用指定区间均匀分布的数值创建数组,可以使用arange函数。 语法如下所示: numpy.arange(start, stop, step, dtype) 参数: start: 区间开始值。默认值是0。 sto ...
分类:
编程语言 时间:
2020-06-19 10:26:47
阅读次数:
78
NumPy中最重要的类是ndarray,ndarray是存储单一数据类型的多维数组。 可以使用索引(从0开始)访问ndarray对象中的元素。 ndarray的内存结构 标准的Python列表(list)中,元素是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费 ...
分类:
编程语言 时间:
2020-06-18 19:28:01
阅读次数:
62
NumPy提供的数值类型,数值范围比Python提供的数值类型更大。NumPy的数值类型,如下表所示: SN数据类型描述 1 bool_ 布尔值,取值ture/false,占用一个字节 2 int_ 是integer的默认类型。与C语言中的long类型相同,有可能是64位或32位。 3 intc 类 ...
分类:
编程语言 时间:
2020-06-18 19:26:57
阅读次数:
64
Numpy代表numeric python,是一个用于计算、处理多维数组的python包。 NumPy包由Travis Oliphant在2005年创建,基于原来的Numeric模块与Numarray模块,大部分是用c语言编写的。 NumPy提供各种强大的数据结构(多维数组和矩阵),以及对这些数据结 ...
分类:
编程语言 时间:
2020-06-18 19:03:21
阅读次数:
52
一、随机森林算法简介: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin ...
分类:
编程语言 时间:
2020-06-18 10:24:12
阅读次数:
57
ID3算法缺点 它一般会优先选择有较多属性值的Feature,因为属性值多的特征会有相对较大的信息增益,信息增益反映的是,在给定一个条件以后,不确定性减少的程度, 这必然是分得越细的数据集确定性更高,也就是条件熵越小,信息增益越大。为了解决这个问题,C4.5就应运而生,它采用信息增益率来作为选择分支 ...
分类:
编程语言 时间:
2020-06-17 20:38:48
阅读次数:
68
1. KNN原理 KNN(k-Nearest Neighbour):K-近邻算法,主要思想可以归结为一个成语:物以类聚 1.1 工作原理 给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的 k (k <= 20)个实例,这 k 个实例的多数属于某个类, 就把该输入实例分为这个类。 ...
分类:
编程语言 时间:
2020-06-17 20:30:15
阅读次数:
92
ID3,C4.5算法缺点 ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。 在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分, 也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中, 将不再起作用, ...
分类:
编程语言 时间:
2020-06-17 20:29:17
阅读次数:
57