秉承bagging; 构造多颗相互独立CART决策树,形成一个森林,共同决策输出; 两个随机: 1)输入数据随机:从全体数据中又放回的选取部分数据; 2)每颗决策树构建的特征是从全体特征中随机选取;(从M个特征中选m个,再从这m个选取最优特征作为节点) 优点: 1)不易过拟合,抗噪能力强; 2)高度 ...
分类:
其他好文 时间:
2019-09-01 15:06:41
阅读次数:
112
MapReduce案例 1.单词计数--wordcount 首先准备好文件 开始编写程序 2.计算每个人的钱数 文件1 文件2 代码编写 3.求出共同好友 准备文件 编写代码 上面的程序输出的结果 最终结果展示 4.读取JSON数据 5.分区解决数据倾斜 准备一个文件里面一个单词非常多别的很少 5. ...
分类:
其他好文 时间:
2019-08-29 16:04:43
阅读次数:
62
数据库,俗称数据的仓库。方便管理数据的软件(或程序)。 数据保存到内存: 优点: 1)读写非常快 缺点: 1)程序关闭导致数据丢失 数据保存到文件: 优点: 1)数据可以永久保存 缺点: 1)频繁地IO操作,效率不高! 2)数据管理不方便。例如查询某个数据需要全部读取出来,再匹配。 数据保存到数据库 ...
分类:
数据库 时间:
2019-08-27 17:30:49
阅读次数:
85
在设计数据库和备份数据的时候是否使用外键一直很纠结。先说一下外键的优缺点吧 优点:保证数据的完整性和一致性和可靠性,能做到一次修改所有使用外键的数据对应的信息都改变的作用 缺点:数据表增多,增加开发难度。降低(Insert、Update、Delete)速度 取代外键的方法:触发器、程序 订单一般是我 ...
分类:
数据库 时间:
2019-08-27 12:33:03
阅读次数:
81
数据库 1、关系型数据库 架构、索引、锁、语法、理论范式 2、如何设计一个关系型数据库 3、索引模块 3.1、为什么要用索引? 1、加快查询数据速度(在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据 ...
分类:
数据库 时间:
2019-08-26 22:40:39
阅读次数:
151
RAID5RAID5是一种存储性能、数据安全与储存成本兼顾的储存解决方案,可以理解为RAID0与RAID1的折中方案。RAID5的作用是为系统提供数据安全保障。把数据和与其相对应的奇偶校验信息存储到组成RAID5的各个磁盘上。当RAID5的一个磁盘数据损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。优点:数据安全、读写速度快,空间利用率高,存储成本相对较低;能够支持在一块盘离线的情况
分类:
其他好文 时间:
2019-08-23 17:32:24
阅读次数:
235
整理了最近几年看过的互联网运营相关的书,共17本。按书评发布时间倒排序,这基本也是按这些书的出版时间倒排序。 整理了最近几年看过的互联网运营相关的书,共17本。按书评发布时间倒排序,这基本也是按这些书的出版时间倒排序。 最新的《私域流量》是一本烂书,我评2星。 西贝莜面村的运营是微商负责的?2星《私 ...
分类:
其他好文 时间:
2019-08-23 00:16:34
阅读次数:
1123
行业领先的.NET界面控件DevExpress 发布了v19.1版本,本文将以系列文章的方式为大家介绍DevExpress ASP.NET Core Controls v19.1中新增的一些控件及增强的控件功能,欢迎下载v19.1试用,点击立即下载>> 数据网格和树列表 此版本包含了新的键盘操作选项 ...
分类:
Web程序 时间:
2019-08-21 11:46:09
阅读次数:
118
索引是帮助MySQL高效获取数据的排好序的数据结构 索引数据结构对比 二叉树 左边子节点的数据小于父节点数据,右边子节点的数据大于父节点数据。 如果col2是索引,查找索引为89的行元素,那么只需要查找两次,就可以获取到行元素所在的磁盘指针地址。 如果col1是索引,查找索引为6的行元素,那么需要查 ...
分类:
数据库 时间:
2019-08-21 00:09:13
阅读次数:
99
# UDP协议通信## 一、特点- 数据报协议(自带报头)- 没有双向通道,通信类似于发短信,而TCP协议类似于打电话## 二、简易版```python# 服务端import socketserver = socket.socket(type=socket.SOCK_DGRAM) # UDP协议se... ...
分类:
其他好文 时间:
2019-08-20 00:31:07
阅读次数:
72