大数据日知录:架构与算法
跳转至:
导航、
搜索
目录
1
当谈论大数据时我们在谈论什么2
数据分片与路由3
数据复制与一致性4
大数据常用算法与数据结构5
集群资源管理与调度6
分布式协调系统7
分布式通信8
数据通道9
分布式文件系统10
内存KV11
列式数据库12
大规模批处理13
流式计算14
交互式数据分...
分类:
编程语言 时间:
2014-10-27 21:24:29
阅读次数:
341
简介: 计算方法又称“数值分析”。是为各种数学问题的数值解答研究提供最有效的算法。笔记:1误差与原则(1)误差种类:模型误差、观测误差、截断误差和舍入误差。(2)法则: (a)加减运算:近似数加减时,把其中小数位数较多的数四舍五入,使其比小数位数最少的数多一位小数,计算保留的小数位数与原近似数...
分类:
其他好文 时间:
2014-10-27 12:26:42
阅读次数:
234
K~近邻算法是最简单的机器学习算法。工作原理就是:将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似的数据的分类标签。一般来说,只提取样本数据集中前K个最相似的数据。通常K不大于20,最后选择K个最相似数据中出现次数最多的分类,最为新的数据分类。
但是K~近邻算法必须保存全部的数据集,如果训练数据集很大,必须使用打量的存储空间。此外,由于必须对数据集中每个...
分类:
编程语言 时间:
2014-10-22 18:24:18
阅读次数:
192
1.题目Find the contiguous subarray within an array (containing at least one number) which has the largest product.For example, given the array[2,3,-2,4]...
分类:
编程语言 时间:
2014-10-15 19:29:41
阅读次数:
228
注意:只是个人理解,可能有不正确的地方 DSA(Digital Signature Algorithm)签名算法是由美国国家标准与技术研究院(NIST,?National Institute of Standards and Technology)提出的一个关于数字签名的美国联邦信息...
分类:
编程语言 时间:
2014-10-15 00:51:19
阅读次数:
445
ElGamal加密算法是一种非对称加密算法,基于Diffie-Hellman密钥交换算法,由Taher Elgamal在1985年提出。 ElGamal加密算法可以应用在任意一个循环群(cyclic group)上。在群中有的运算求解很困难,这些运算通常与求...
分类:
编程语言 时间:
2014-10-14 21:55:39
阅读次数:
472
注意:只是笔记,可能有不正确的地方 ?下文中^代表乘方运算,例如2^3=2*2*2=6,参考:http://zh.wikipedia.org/wiki/%E5%86%AA %代表模运算,例如5%3=2,参考:http://zh.wikipedia.org/wiki/%E6%A8%A1%E9%99%A4...
分类:
编程语言 时间:
2014-10-14 17:03:40
阅读次数:
476
注意:只是笔记,可能有不正确的地方 RSA是目前用的最广泛的不对称加密算法,即采用公钥、密钥两部分,公钥用来加密,私钥用来解密。公钥是公开的。 RSA算法的可靠性基于数学难题:对大数做因式分解很难。 目前还...
分类:
编程语言 时间:
2014-10-13 15:51:10
阅读次数:
388
1.问题描述 给定n种物品和一个背包,物品i的重量是wi,其价值为vi,背包的容量为C。问:应该如何选择装入背包的物品,使得装入背包中物品的总价值最大?2.问题分析 上述问题可以抽象为一个整数规划问题,即求满足 (a)Σwixi≤ C;(b)xi ∈(0,1), 1≤i≤n;条件下,∑vixi最.....
分类:
其他好文 时间:
2014-10-09 01:50:58
阅读次数:
209
高二了,离知道NOIP已经过去一年了,感觉很彷徨,毕竟是第一次参加noip,有点担心连初赛都过不了,泉州这种神犇云集的地方ORZ;曾经想过如果自己但是不考108将而去考泉五会是什么结果,不过那样可能我就不会知道noip了吧233。感觉自己超级颓废,去年说好的刷500题的,到现在只刷了40几题,还有....
分类:
其他好文 时间:
2014-09-13 18:31:55
阅读次数:
179