[Toc] 一、spark基本常识 1、spark中的RDD是什么,有哪些特性? RDD(Resilient Distributed Dataset)叫做分布式数据集模式spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合。 Resilient:表示弹性的,弹性表示 ...
分类:
其他好文 时间:
2020-02-01 16:09:42
阅读次数:
85
1 from sklearn.model_selection import train_test_split 2 from sklearn.datasets import load_diabetes 3 X,y=load_diabetes().data,load_diabetes().target ...
分类:
其他好文 时间:
2020-02-01 14:29:36
阅读次数:
89
Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图。这里实例采用的数据集都是seaborn提供的几个经典数据集,dataset文件可见于Github。本博客只总结了一些,方便博主自己查询,详细介绍 ...
分类:
编程语言 时间:
2020-02-01 12:28:10
阅读次数:
83
代码: import numpy as npimport cv2from sklearn import datasetsfrom sklearn import model_selectionfrom sklearn import metricsimport matplotlib.pyplot as ...
分类:
其他好文 时间:
2020-02-01 00:24:49
阅读次数:
435
From: Stanford University; Jure Leskovec, citation 6w+; Problem: subsequence clustering. Challenging: discover patterns is challenging because it requ ...
分类:
其他好文 时间:
2020-01-31 10:28:33
阅读次数:
101
TensorFlow是咱们机器学习领域非常常用的一个组件,它在数据处理,模型建立,模型验证等等关于机器学习方面的领域都有很好的表现,前面的一节我已经简单介绍了一下TensorFlow里面基础的数据结构即:Tensor和Dataset; 这里咱们开始介绍TensorFlow的建模过程以及验证模型的一些 ...
分类:
其他好文 时间:
2020-01-29 21:34:51
阅读次数:
88
subset() 函数: subset(dataset , subset , select ) dataset 是 要进行操作的数据集 subset 是对数据的某些字段进行操作 select 选取要显示的字段 Example : ```{r spdep} hightech aa = subset(h ...
分类:
编程语言 时间:
2020-01-29 12:42:10
阅读次数:
774
RDD、DataFrame与DataSet三者有许多的共性,都有各自使用的场景,常常需要在三者之间进行转换DataFrame/Dataset 转 RDD:val rdd1=testDF.rddval rdd2=testDS.rdd RDD 转 DataFrame:// 一般用元组把一行的数据写在一起... ...
分类:
其他好文 时间:
2020-01-28 23:32:20
阅读次数:
99
1 #include <iostream> 2 #include <cstdio> 3 #include <queue> 4 #include <cstring> 5 using namespace std; 6 7 int w, h, n, s[3], t[3]; 8 char dataset[2 ...
分类:
其他好文 时间:
2020-01-28 22:57:58
阅读次数:
64
好了,咱们今天终于进入了现阶段机器学习领域内最流行的一个框架啦——TensorFlow。对的,这款由谷歌开发的机器学习框架非常的简单易用并且得到了几乎所有主流的认可,谷歌为了推广它的这个框架甚至单独开辟了免费学习这个框架的视频教程,可惜这些教程都是基于TensorFlow1.0版本的,一直没有更新。 ...
分类:
其他好文 时间:
2020-01-28 19:17:36
阅读次数:
70