码迷,mamicode.com
首页 >  
搜索关键字:数据集    ( 7694个结果
Redis学习手册(持久化)
一、Redis提供了哪些持久化机制: 1). RDB持久化: 该机制是指在指定的时间间隔内将内存中的数据集快照写入磁盘。 2). AOF持久化: 该机制将以日志的形式记录服务器所处理的每一个写操作,在Redis服务器启动之初会读取该文件来重新构建数据库,以保证启动后数据库中的数据是完整的。 3).....
分类:其他好文   时间:2015-01-05 14:48:16    阅读次数:167
RDD与DSM的区别
RDD(Resilient Distributed DataSet)弹性分布式数据集,是Spark的核心数据结构。 DSM(Distributed Shared Memory)分布式共享内存,它是一种通用的内存数据抽象。在DSM中,应用可以向全局地址空间的任意位置进行读写操作。 RDD与DSM主要区别在于,不仅可以通过批量转换创建(即“写”)RDD,还可以对任意内存位置对写。RDD限制应用执行...
分类:其他好文   时间:2015-01-05 13:09:07    阅读次数:188
AP聚类算法(Affinity propagation Clustering Algorithm )
AP聚类算法是基于数据点间的"信息传递"的一种聚类算法。与k-均值算法或k中心点算法不同,AP算法不需要在运行算法之前确定聚类的个数。AP算法寻找的"examplars"即聚类中心点是数据集合中实际存在的点,作为每类的代表。算法描述: 假设$\{ {x_1},{x_2}, \cdots ,{x_.....
分类:编程语言   时间:2015-01-05 00:21:46    阅读次数:1414
C#学习-EF在三层中使用
1.搭建普通三层 DAL层,BLL层,Model层,Web层; DAL层引用Model层 BLL层引用DAL层和Model层 Web层引用BLL层和Model层 2.实现EF三层的搭建(添加引用,修改配置信息) 2.1添加EF对象 在Model中添加一个ADO.NET实体数据集 2.2添加引用信息 ...
分类:Windows程序   时间:2015-01-04 06:22:07    阅读次数:402
[Example of Sklearn] - Example
reference :http://my.oschina.net/u/175377/blog/84420目录[-]Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集...
分类:其他好文   时间:2015-01-03 17:05:35    阅读次数:694
[Example of Sklearn] - 分类对比
refrence :http://cloga.info/python/2014/02/07/classify_use_Sklearn/加载数据集这里我使用pandas来加载数据集,数据集采用kaggle的titanic的数据集,下载train.csv。import pandas as pddf = ...
分类:其他好文   时间:2015-01-03 15:50:22    阅读次数:483
10.3 连续(continuations)
10.3 连续(continuations)   从本章开始,我们讨论递归调用。我们已经看到过尾递归(tail recursion),这是进行递归调用的重要技术,不需要在栈分配任何空间。由于有了尾递归,写出的函数式列表处理函数,能够处理大型数据集,而不需要出一身汗。 我们已经使用尾递归重写了许多函数,利用累加器参数,但并不是每个函数都能这样重写。如果函数需要执行两个递归调用,那么,很显然不能...
分类:其他好文   时间:2015-01-03 14:40:31    阅读次数:104
[Scikit-Learn] - 数据预处理 - 缺失值(Missing Value)处理
reference :http://www.cnblogs.com/chaosimple/p/4153158.html关于缺失值(missing value)的处理在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。首先需要说明的是,nu...
分类:其他好文   时间:2015-01-03 14:31:39    阅读次数:221
位图排序
第一次听说位图排序是在上操作系统课的时候, 当时也没太在意, 就是觉得存储挺方便。 最近看《编程珠玑》开篇就将到位图排序, 那么有缘就来实现下。 优势: 在数据集集中分布的情况下, 运行时间比一般的排序快挺多。 是一个典型的空间换时间的算法。 劣势: 在数据集稀疏分布的情况下, 运行时间不会差太多。 而且得事先知道要处理的数据最大值, 才好定义辅助属性的大小。...
分类:编程语言   时间:2015-01-03 11:59:26    阅读次数:189
聚类算法小结
一、聚类:聚类也称之为自动分类,是一种无监督的学习方法。算法的原则是基于度量数据对象之间的相似性或相异性,将数据对象集划分为多个簇;相比较于分类技术,聚类只需要较少的专家知识(领域知识),就可以自动发掘数据集中的群组。 二、基本的聚类方法包括: 1、划分方法:该方法通常基于距离使用迭代重定位技术,通过将一个对象移入另外一个簇并更新簇心,典型的算法有K-均值算法和K-中心点算法(二者的主要区别在...
分类:编程语言   时间:2015-01-02 17:37:52    阅读次数:193
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!