2.6字典dict。 2.6.1 字典的初识 1. 列表可以存储大量的数据类型,但是如果数据量大的话,他的查询速度比较慢。 2. 列表只能按照顺序存储,数据与数据之间关联性不强。 所以针对于上的缺点,说咱们需要引入另一种容器型的数据类型,解决上面的问题,这就需要dict字典。 数据类型可以按照多种角 ...
分类:
编程语言 时间:
2019-07-22 13:30:12
阅读次数:
115
谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法... ...
分类:
其他好文 时间:
2019-07-19 18:55:16
阅读次数:
98
redis官方声称可以达到10万/秒,每秒执行10万条命令,假如业务需要每秒100万的执行命令呢?一台服务器内存正常是16~256G,假如你的业务需要500G内存,新浪微博作为世界上最大的redis存储,就超过1TB的数据,去哪买这么大的内存条?各大公司有自己的解决方案,推出各自的集群功能,核心思想 ...
分类:
其他好文 时间:
2019-07-07 17:33:47
阅读次数:
112
迁移学习概述背景随着越来越多的机器学习应用场景的出现,而现有表现比较好的监督学习需要大量的标注数据,标注数据是一项枯燥无味且花费巨大的任务,所以迁移学习受到越来越多的关注。传统机器学习(主要指监督学习) 基于同分布假设 需要大量标注数据 然而实际使用过程中不同数据集可能存在一些问题,比如 数据分布差 ...
分类:
其他好文 时间:
2019-07-07 16:09:50
阅读次数:
1106
3.切分 水平切分 水平切分又称为 sharding ,它是将同一个表的记录拆分到多个结构相同的表中。当一个表的数据不断的增加的时候,sharding是必然的选择,它可以 将数据分布到集群的不同节点上,从而缓存单个数据库的压力 。 垂直切分 垂直切分是 ...
分类:
数据库 时间:
2019-07-04 17:42:04
阅读次数:
131
一、简介 seaborn是Python中基于matplotlib的具有更多可视化功能和更优美绘图风格的绘图模块,当我们想要探索单个或一对数据分布上的特征时,可以使用到seaborn中内置的若干函数对数据的分布进行多种多样的可视化,本文以jupyter notebook为编辑工具,针对seaborn中 ...
分类:
其他好文 时间:
2019-07-03 22:46:29
阅读次数:
140
atplotlib绘制柱状图柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。柱状图亦可横向排列,或用多维方式表达。 准备impor ...
分类:
其他好文 时间:
2019-06-26 13:42:35
阅读次数:
127
1.K-Means聚类算法属于无监督学习算法。 2.原理:先随机选择K个质心,根据样本到质心的距离将样本分配到最近的簇中,然后根据簇中的样本更新质心,再次计算距离重新分配簇,直到质心不再发生变化,迭代结束。 3.簇内平方和Inertia:采用欧几里得距离,则一个簇中所有样本点到质心的距离的平方和。追 ...
分类:
其他好文 时间:
2019-06-21 21:07:03
阅读次数:
239
选择用于桥接模式下的虚拟交换机,并且要选择对应的有线或者无线的网卡,如果主机是插网线联网的,那就选择有线网卡,如果主机是连无线网络的就选择无线网卡。 什么是桥接模式?桥接模式就是将主机网卡与虚拟机虚拟的网卡利用虚拟网桥进行通信。在桥接的作用下,类似于把物理主机虚拟为一个交换机,所有桥接设置的虚拟机连... ...
分类:
其他好文 时间:
2019-06-21 13:05:56
阅读次数:
112