import java.awt.Font; import java.awt.GridLayout; import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; import javax.s... ...
分类:
其他好文 时间:
2018-03-13 10:24:03
阅读次数:
332
背景与目标 Youzan 是一家SAAS公司,服务于数百万商家,帮助互联网时代的生意人私有化顾客资产、拓展互联网客群、提高经营效率。现在,该公司希望能够从商家的交易数据中,挖掘出有强烈续费倾向的商家,并提供更优质更有针对性的服务。 目标: 从商家交易数据中识别有强烈续费倾向的商家。 思路与建模 kN ...
分类:
编程语言 时间:
2018-03-11 14:46:14
阅读次数:
202
DataFrame不是Spark SQL提出,而是在Pandas就有 DataSet:分布式的数据集 DataFrame:以列的形式构成的分布式数据集(RDD with schema) 可以从各种source转换成,如RDD、SQL、noSQL等 做了抽象的处理 DataFrame对比RDD Dat ...
分类:
其他好文 时间:
2018-03-11 12:08:40
阅读次数:
3112
UNIGUI下载文件 procedure exportXLS(dataset: TDataSet);var xls: TDataset2Excel; f: string;begin if dataset = nil then Exit; f := '1.xls'; xls := TDataset2E ...
分类:
其他好文 时间:
2018-03-11 11:47:48
阅读次数:
559
一个HDF5文件是一种存放两类对象的容器:dataset和group. Dataset是类似于数组的数据集,而group是类似文件夹一样的容器,存放dataset和其他group。在使用h5py的时候需要牢记一句话:groups类比词典,dataset类比Numpy中的数组。 HDF5的datase ...
分类:
编程语言 时间:
2018-03-10 15:58:47
阅读次数:
269
<wijmo:C1TreeView ID="C1TreeView1" runat="server" ShowCheckBoxes="true" ShowExpandCollapse="true" Width="300px"></wijmo:C1TreeView> <asp:Button ID="Bu ...
DAG:Directed Acyclic Graph,有向无环图 RDD:Resilient Distributed Dataset 弹性分布式数据集,一种分布式的内存抽象,将工作集缓存到内存中,实现了复用。 用户使用交互接口(Driver)与Spark集群的Cluster Manager进行交互, ...
分类:
其他好文 时间:
2018-03-06 23:09:20
阅读次数:
154
Josephina is a clever girl and addicted to Machine Learning recently. She pays much attention to a method called Linear Discriminant Analysis, which h ...
分类:
其他好文 时间:
2018-03-06 14:41:06
阅读次数:
199
seaborn使用(绘图函数) 数据集分布的可视化 分类数据的绘图 线性关系可视化 一.数据集分布的可视化 1. 2. 3. 1. "distplot()" 灵活的绘制 单变量 的分布,传入一组一维数据 默认kde为True,纵坐标为在横坐标区域内分布的概率,曲线表示概率密度函数,在区间上积分值为1 ...
分类:
其他好文 时间:
2018-03-03 15:32:18
阅读次数:
3013
为了让大家理解structured stream的运行流程,我将根据一个代码例子,讲述structured stream的基本运行流程和原理。 下面是一段简单的代码: 这段代码就是单词计数。先从一个socket数据源读入数据,然后以" " 为分隔符把一行文本转换成单词的DataSet,然后转换成有标 ...
分类:
其他好文 时间:
2018-03-02 20:54:32
阅读次数:
265