码迷,mamicode.com
首页 >  
搜索关键字:anaconda 数据挖掘 机器学习    ( 12837个结果
经典的十个机器学习算法
1、C4.5机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的 属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输 出。...
分类:其他好文   时间:2014-07-22 22:49:55    阅读次数:228
机器学习算法的代码实现之第四章节:回归之梯度上升法
二种类别的点在平面上分布,我想找到一条直线,将平面划为两半边,每一边的点类别尽可能的统一,如何找到效果最佳的分界线,这就是最佳拟合问题,也叫作回归问题。 这次,代码很少。logRegres.py #?coding:utf-...
分类:其他好文   时间:2014-07-21 10:24:21    阅读次数:321
A Byte of Python之安装python / 配置vim
从今天开始学习python,学习的目的:国外的都是以python做编程入门,去英国前要把课补上今天买了一本机器学习实战,是用python写的,虽然大部分代码能够看懂,但是系统的学习还是很有必要知乎上的大牛很推崇python,一定有道理,学学也无妨在知乎上找了一些python入门的经验,这篇比较中意。...
分类:编程语言   时间:2014-07-21 09:31:57    阅读次数:357
基于最大最小距离的分类数目上限K确定的聚类方法
一篇基于最大最小分类算法的好文章.简单明了.有所改进...
分类:其他好文   时间:2014-07-20 22:12:43    阅读次数:265
用python将文本转图片字库
前一篇博文提到怎么得到汉字字库,这篇文章讲怎么把一个一个的字转成图片,这在机器学习中会有用处。 一句话,用pygame渲染文字到图片上。 下面上代码。 import os import pygame chinese_dir = 'chinese' if not os.path.exists(chinese_dir): os.mkdir(chinese_dir) pygame.ini...
分类:编程语言   时间:2014-07-20 11:43:38    阅读次数:334
机器学习实战笔记2(k-近邻算法)
1:算法简单描述        给定训练数据样本和标签,对于某测试的一个样本数据,选择距离其最近的k个训练样本,这k个训练样本中所属类别最多的类即为该测试样本的预测标签。简称kNN。通常k是不大于20的整数,这里的距离一般是欧式距离。 2:python代码实现 创建一个kNN.py文件,将核心代码放在里面了。 (1)   创建数据 #创造数据集 def createDataSet(): ...
分类:其他好文   时间:2014-07-19 23:24:39    阅读次数:300
机器学习书籍资料推荐
机器学习书籍资料推荐本文为转载,源地址为:http://blog.chinaunix.net/uid-10314004-id-3594337.html机器学习的资料较多,初学者可能会不知道怎样去有效的学习,所以对这方面的资料进行了一个...
分类:其他好文   时间:2014-07-19 23:11:51    阅读次数:283
文本分类之情感分析– 准确率和召回率
Accuracy不是评估分类器的有效性的唯一度量。另外两个有用的指标是precision和recall。这两个度量可提供二元分类器的性能特征的更多视角。 分类器的 Precision Precision度量一个分类器的正确性。较高的精确度意味着更少的误报,而较低精度意味着更多的误报。这是经常与recall相反,作为一种简单的方法来提高精度,以减少召回。 分类器的 Re...
分类:其他好文   时间:2014-07-19 11:26:04    阅读次数:1829
文本分类之情感分析– 去除低信息量的特征
当你的分类模型有数百个或数千个特征,由于是文本分类的情况下,许多(如果不是大多数)的特点是低信息量的,这是一个不错的选择。这些特征对所有类都是通用的,因此在分类过程中作出很小贡献。个别是无害的,但汇总的话,低信息量的特征会降低性能。 通过消除噪声数据给你的模型清晰度,这样就去除了低信息量特征。它可以把你从过拟合和维数灾难中救出来。当你只使用更高的信息特征,可以提高性能,同时也降低了模型的大小...
分类:其他好文   时间:2014-07-19 11:22:54    阅读次数:507
为什么文件系统没有标签分类方式?
不论是做数据挖掘也好,数据分析,数据可视化也罢,就是把混乱杂糅的数据理清给人看。我经常觉得,如果不能把自己身边的数据“整理清楚”,又怎敢去折腾什么大数据呢?由于一直以来的习惯,我特别热衷于对知识、文件分类整理。例如电脑桌面一定要用fences整理;一定要建立文件夹归纳chrome浏览器的书签;收藏的...
分类:其他好文   时间:2014-07-18 17:35:42    阅读次数:236
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!