转自穆晨 阅读目录 前言 准备数据:切分文本 训练并测试 小结 转自穆晨 阅读目录 前言 准备数据:切分文本 训练并测试 小结 回到顶部 前言 朴素贝叶斯算法最为广泛而经典的应用毫无疑问是文档分类,更具体的情形是邮件过滤系统。 本文详细地讲解一个基于朴素贝叶斯分类算法的邮件过滤系统的具体实现。 本文 ...
分类:
编程语言 时间:
2017-09-20 23:25:07
阅读次数:
230
第1章 引言 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的互联网应用,每天几十亿的PV无疑对数据库造成了相当高的负载。对于系统的稳定性和扩展性造成了极大的问题。通过数据切分来提高网站性能,横向扩展数据层已经成为架构研发人员首选的方式。 水平切分数据库:可以降 ...
分类:
数据库 时间:
2017-08-29 19:43:44
阅读次数:
201
分片规则概述 在数据切分处理中,特别是水平切分中,中间件最终要的两个处理过程就是数据的切分、数据的聚合。 选择 合适的切分规则,至关重要,因为它决定了后续数据聚合的难易程度,甚至可以避免跨库的数据聚合处理。 前面讲了数据切分中重要的几条原则,其中有几条是数据冗余,表分组(Table Group), ...
分类:
其他好文 时间:
2017-08-26 13:40:41
阅读次数:
296
第1章 引言 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的互联网应用,每天几十亿的PV无疑对数据库造成了相当高的负载。对于系统的稳定性和扩展性造成了极大的问题。通过数据切分来提高网站性能,横向扩展数据层已经成为架构研发人员首选的方式。 水平切分数据库:可以降 ...
分类:
数据库 时间:
2017-08-23 10:44:29
阅读次数:
244
第1章 引言 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的互联网应用,每天几十亿的PV无疑对数据库造成了相当高的负载。对于系统的稳定性和扩展性造成了极大的问题。通过数据切分来提高网站性能,横向扩展数据层已经成为架构研发人员首选的方式。 水平切分数据库:可以降 ...
分类:
数据库 时间:
2017-07-24 13:13:03
阅读次数:
214
第1章 引言 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的互联网应用,每天几十亿的PV无疑对数据库造成了相当 高的负载。对于系统的稳定性和扩展性造成了极大的问题。通过数据切分来提高网站性能,横向扩展数据层已经成为架构研发人员首选的方式。水平切分数据库,可 以 ...
分类:
数据库 时间:
2017-06-24 13:56:43
阅读次数:
198
声明:本系列教程參考资料《Mysql性能调优与架构设计》 Why Mysql? 大家可能怀疑。数据库有好多种,为什么选择Mysql作为数据切分的案例,为什么不选择Oracle、MS SqlServer或者DB2等等。原因是大家都知道,淘宝网最開始选择LAMP的架构设计。即Linux+Apache+M ...
分类:
其他好文 时间:
2017-05-30 20:44:35
阅读次数:
217
第1章 引言 随着互联网应用的广泛普及,海量数据的存储和訪问成为了系统设计的瓶颈问题。对于一个大型的互联网应用。每天几十亿的PV无疑对数据库造成了相当高的负载。对于系统的稳定性和扩展性造成了极大的问题。通过数据切分来提高站点性能,横向扩展数据层已经成为架构研发人员首选的方式。水平切分数据库。能够减少 ...
分类:
数据库 时间:
2017-05-27 10:37:49
阅读次数:
272
http://zhengdl126.iteye.com/blog/419850 第1章 引言 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的 互联网应用,每天几十亿的PV无疑对数据库造成了相当高的负载。对于系统的稳定性和扩展性造成了极大的问题。通过数据切分来提 ...
分类:
数据库 时间:
2017-05-06 11:47:40
阅读次数:
240
数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显,我们究竟应该如何对MySQL数据库进行优化? 下面我就从MySQL对硬件的选择、MySQL的安装、my.cnf的优化、MySQL如何进行架构设计及数据切分,查询与索引优化分析等方面来说明这个问题。 (一)服务器物理硬件的优化 在 ...
分类:
数据库 时间:
2017-04-29 18:53:17
阅读次数:
320