摘抄自:https://www.cnblogs.com/qingyunzong/p/8946637.html 前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型 ...
分类:
其他好文 时间:
2019-03-03 16:23:20
阅读次数:
168
/// /// 这是Knut重排算法的实现 /// /// /// private int[] ShuffeArray(int[] number) { int[] newArray = number.Clone() as int[]; for (int i = 0; i < newArray.Len... ...
分类:
编程语言 时间:
2019-02-27 13:06:10
阅读次数:
151
python-随机函数 random.sample()可以从指定的序列中,随机的截取指定长度的片断,不作原地修改。 random.random()函数是这个模块中最常用的方法了,它会生成一个随机的浮点数,范围是在0.0~1.0之间。 random.uniform()正好弥补了上面函数的不足,它可以设 ...
分类:
编程语言 时间:
2019-02-13 17:01:49
阅读次数:
239
__author__ = "jocket2333"import randomprint(random.random())# (0, 1) floatprint(random.randint(1, 3))# [1, 3]print(random.randrange(1, 3))# [1, 3)prin ...
分类:
编程语言 时间:
2019-02-09 15:18:30
阅读次数:
252
https://leetcode.com/tag/greedy/ ...
分类:
其他好文 时间:
2019-01-27 22:10:06
阅读次数:
373
序列化 我们今天学习下序列化,什么是序列化呢? 将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化。 为什么要有序列化模块: 比如,我们在python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给? 现在我们能想到的方法就是存在文件里,然后另一个python程序再从文件里读出来。 ...
分类:
其他好文 时间:
2019-01-16 16:37:30
阅读次数:
214
import randomimport string# dt = random.randint(1,2) # 从1-2间取随机数,包括1、2# dt = random.randrange(1,3) # 从1-2间取随机数,不包括3# dt = random.random() # 随机浮点数# dt ...
分类:
其他好文 时间:
2019-01-05 19:49:15
阅读次数:
163
hadoop的核心思想是MapReduce,但shuffle又是MapReduce的核心。shuffle的主要工作是从Map结束到Reduce开始之间的过程。Hadoop不仅仅是大数据技术的核心重点,还是我们面试官面试的时候经常会问道的问题,本文将详细介绍Hadoop的运行原理。 ...
分类:
其他好文 时间:
2019-01-03 19:25:12
阅读次数:
145
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention ...
分类:
其他好文 时间:
2019-01-02 15:08:14
阅读次数:
1378
1.信用卡欺诈预测案例 这是一道kaggle上的题目。 我们都知道信用卡,能够透支一大笔钱来供自己消费,正因为这一点,不法分子就利用信用卡进一特... ...
分类:
编程语言 时间:
2018-12-31 20:20:51
阅读次数:
243