码迷,mamicode.com
首页 >  
搜索关键字:人工智能 机器学习 资源分享    ( 12648个结果
Python机器学习(三十五)NumPy ndarray
NumPy中最重要的类是ndarray,ndarray是存储单一数据类型的多维数组。 可以使用索引(从0开始)访问ndarray对象中的元素。 ndarray的内存结构 标准的Python列表(list)中,元素是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费 ...
分类:编程语言   时间:2020-06-18 19:28:01    阅读次数:62
Python机器学习(三十六)NumPy 数据类型
NumPy提供的数值类型,数值范围比Python提供的数值类型更大。NumPy的数值类型,如下表所示: SN数据类型描述 1 bool_ 布尔值,取值ture/false,占用一个字节 2 int_ 是integer的默认类型。与C语言中的long类型相同,有可能是64位或32位。 3 intc 类 ...
分类:编程语言   时间:2020-06-18 19:26:57    阅读次数:64
【机器学习】word2vec
在NLP中,对于把词转为向量的操作,最朴素的想法是one-hot独热编码形式,即一个词占一维向量。但这样有两个缺点: 1)不考虑词与词之间的顺序(文本中词的顺序也很重要) 2)假设词是独立的。例如猫和狗、床和沙发,词之间原本是有不同的亲疏远近关系的 3)得到的特征是稀疏的。如果所有的词各占一维,那么 ...
分类:其他好文   时间:2020-06-18 19:26:08    阅读次数:59
Python机器学习(三十四)Numpy 介绍
Numpy代表numeric python,是一个用于计算、处理多维数组的python包。 NumPy包由Travis Oliphant在2005年创建,基于原来的Numeric模块与Numarray模块,大部分是用c语言编写的。 NumPy提供各种强大的数据结构(多维数组和矩阵),以及对这些数据结 ...
分类:编程语言   时间:2020-06-18 19:03:21    阅读次数:52
关于python,你知道它的优缺点吗?
如果选择一门最适合初学者学习的编程语言,绝对是python。python是一门非常不错的编程语言,随着人工智能与数据科学普及,python增长速度非常快,成为大家进入互联网的首选语言。那么python有什么优缺点呢?
分类:编程语言   时间:2020-06-18 12:37:23    阅读次数:63
Python机器学习(二十一)随机森林算法
一、随机森林算法简介: 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin ...
分类:编程语言   时间:2020-06-18 10:24:12    阅读次数:57
ch1-数据科学概述
数据科学概述 一、挑战 (一)工程实现 特征提取:对于原始数据进行处理:数据清洗、数据整合、变量归一化等,转换成能被模型使用的特征; 矩阵运算:使用算法来估算算法的模型参数;模型越复杂,需要估计的参数越多,在数学上对应着矩阵运算; 分布式机器学习:将原本在一台机器上运行的模型,改写成能在多台机器上并 ...
分类:其他好文   时间:2020-06-18 01:08:35    阅读次数:87
Python机器学习(十九)决策树之系列二—C4.5原理与代码实现
ID3算法缺点 它一般会优先选择有较多属性值的Feature,因为属性值多的特征会有相对较大的信息增益,信息增益反映的是,在给定一个条件以后,不确定性减少的程度, 这必然是分得越细的数据集确定性更高,也就是条件熵越小,信息增益越大。为了解决这个问题,C4.5就应运而生,它采用信息增益率来作为选择分支 ...
分类:编程语言   时间:2020-06-17 20:38:48    阅读次数:68
Python机器学习(十六)KNN原理与代码实现
1. KNN原理 KNN(k-Nearest Neighbour):K-近邻算法,主要思想可以归结为一个成语:物以类聚 1.1 工作原理 给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的 k (k <= 20)个实例,这 k 个实例的多数属于某个类, 就把该输入实例分为这个类。 ...
分类:编程语言   时间:2020-06-17 20:30:15    阅读次数:92
Python机器学习(二十)决策树系列三—CART原理与代码实现
ID3,C4.5算法缺点 ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。 在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分, 也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中, 将不再起作用, ...
分类:编程语言   时间:2020-06-17 20:29:17    阅读次数:57
12648条   上一页 1 ... 59 60 61 62 63 ... 1265 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!