什么是sklearn? sklearn全名是Scikit-Learn,是基于Python的机器学习模块,基于BSD开源许可证,官方网址是:http://scikit-learn.org/stable Scikit-Learn的数据结构基于Numpy和Pandas模块,数据计算基于Scipy模块,数据 ...
分类:
其他好文 时间:
2018-09-25 01:16:32
阅读次数:
233
图片和表不方便复制 详情请阅读原文http://c.raqsoft.com.cn/article/1536633176729?r=niu JSON作为一种轻量级的数据交换格式,因其易于读写和交互的特点,已逐渐成为主流的数据类型之一。常见的编程语言大多都对 JSON 的读取与解析提供了接口,但是接下来 ...
分类:
Web程序 时间:
2018-09-25 01:10:20
阅读次数:
210
FusionInsightHD是华为开发的完全开放的大数据计算平台,是一个分布式数据处理系统。对外提供大容量的数据存储、查询和分析能力,可解决各大企业的以下需求:快速地整合和管理不同类型的大容量数据对原生形式的信息提供高级分析可视化所有的可用数据,供特殊分析使用为构建新的分析应用程序提供了开发环境工作负荷的优化和调度1、安装前准备1.1环境介绍本文使用的服务器都是基于VMware虚拟化平台,具体信
分类:
其他好文 时间:
2018-09-19 17:17:33
阅读次数:
246
一、平台基本功能 1. 数据接入 2. 数据存储和查询,存储模型应包括关系型模型,非关系型模型,文档模型等。 3. 数据计算,包括离线批处理,实时计算,机器学习,多维分析和全文检索。 4. 平台安全与管理,解决用户管理,数据隔离,访问授权,访问控制和集群服务安全等问题。 5. 平台辅助工具,如程序开 ...
分类:
其他好文 时间:
2018-09-18 00:29:33
阅读次数:
185
1主要步骤:从文件中读初始数据------计算目标点到已归类点的距离------根据距离最近原则判断目标点归属于哪一类别importcsvimportrandomimportmathimportoperatordefloadDataset(filename,split,trainingSet=[],testSet=[]):withopen(filename,‘rb‘)ascsvfile:lines
分类:
编程语言 时间:
2018-09-11 12:15:18
阅读次数:
150
MD5算法(摘要算法、哈希算法) 1.MD5算法特点 压缩性:任意长度的数据,算出的MD5值长度都是固定的 容易计算:从原数据计算出MD5值很容易 抗修改性:对原数据进行任何改动,哪怕只修改1个字节,所得到的MD5值都有很大区别 弱抗碰撞:已知原数据和其MD5值,想找到一个具有相同MD5值的数据(即 ...
分类:
其他好文 时间:
2018-09-04 00:13:57
阅读次数:
167
最近,接到一个需求,在数据计算之前,根据需求的具体内容对数据进行过滤,保留下需要计算的那部分。 对于职场小白没经验的我来说,拿到需求,在确定于什么位置过滤数据以后,就开始义无反顾地码代码!! 怎么码呢?当然是建立需要过滤的接口及实现类,然后在里面进行过滤的具体操作。 由于过滤数据的两部分是对同一内容... ...
分类:
其他好文 时间:
2018-09-03 02:23:31
阅读次数:
180
MD5功能 输入任意长度的信息,经过处理,输出为128位的信息(数字指纹);不同的输入得到的不同的结果(唯一性); MD5算法的特点 ...
分类:
其他好文 时间:
2018-09-02 20:55:49
阅读次数:
135
Shell编程一.程序简介程序程序:算法+数据结构数据结构:数据在计算机中的类型和组织方式算法:处理数据的方式面向过程:以指令为中心,数据服务于指令面向对象:以数据为中心,指令服务于数据计算机:二进制执行高级编程语言:编译:高级语言->编译器->机器代码->执行解释:高级语言->执行->解释器->机器代码shell三大逻辑顺序、循环、选择二.shell脚本1.格
分类:
系统相关 时间:
2018-09-02 17:13:25
阅读次数:
175
tensorflow数据读取机制 tensorflow中为了充分利用GPU,减少GPU等待数据的空闲时间,使用了两个线程分别执行数据读入和数据计算。 具体来说就是使用一个线程源源不断的将硬盘中的图片数据读入到一个内存队列中,另一个线程负责计算任务,所需数据直接从内存队列中获取。 tf在内存队列之前, ...
分类:
其他好文 时间:
2018-08-30 16:42:34
阅读次数:
178