码迷,mamicode.com
首页 >  
搜索关键字:数据分布    ( 607个结果
【ML-7】聚类算法-实例代码
目录 K-Means算法和Mini Batch K-Means算法比较 层次聚类(BIRCH)算法参数比较 DBSCAN算法 一、K-Means算法和Mini Batch K-Means算法比较 1 2 3 4 5 6 7 ... ...
分类:编程语言   时间:2020-02-24 00:51:18    阅读次数:86
kaggle——贷款信用评估介绍
介绍 对于金融机构的贷款业务来说,一个顾客的信用信息是极其重要的。因为只有了解客户的信用情况,才能决定是否通过客户的贷款申请。本次将会介绍如何根据用户的一些基本信息来判断顾客的信用或贷款偿还能力。 知识点 数据导入与预览 数据可视化 plotly 特征工程 预测模型的选择 贷款信用评估介绍 本次的内 ...
分类:其他好文   时间:2020-02-23 18:10:20    阅读次数:68
分布式数据存储之哈希和一致性哈希
数据分布设计原则 数据均匀:不同存储节点中存储的数据要尽量均衡,用户访问也要做到均衡 数据稳定:当存储节点出现故障需要移除或者扩增时,数据按照分布规则得到的结果应该尽量保持稳定,不要出现大规模的数据迁移 节点异构性:不同存储节点的硬件配置可能差别较大 隔离故障域:保证数据的可用和可靠性 性能稳定性: ...
分类:其他好文   时间:2020-02-17 11:58:45    阅读次数:77
初识Redis,看这一篇就够了
原文:初识Redis,看这一篇就够了 环境的搭建和安装网上有很多教程,在这里就不再重复了。 1. Redis是什么? Redis(全称:Remote Dictionary Server 远程字典服务)是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据... ...
分类:其他好文   时间:2020-02-12 22:20:34    阅读次数:76
MachineLearning入门-4
查看数据本身也是一个很好理解数据的方法,通过查看数据可以直观的看到数据的特征,数据的类型以及大概的数据分布范围。 1 #查看数据的前10行 2 print(dataset.head(10)) separ-length separ-width petal-length petal-width clas ...
分类:系统相关   时间:2020-02-08 11:23:23    阅读次数:102
【基础组件11】hdfs与hbase
一、Hbase 简介 hdfs 是分布式文件系统, 只支持在文件层面的增、删除、改(需要把文件下载下来,改完,再上传上去)、查 hbase 是支持海量数据存储的NoSql数据库,基于hdfs的,支持数据的增、删、改、查,支持随机写数据(改指定的某一条数据) hbase 查询数据只能根据rowkey进 ...
分类:其他好文   时间:2020-01-30 19:24:15    阅读次数:78
机器学习- Sklearn (交叉验证和Pipeline)
前面一节咱们已经介绍了决策树的原理已经在sklearn中的应用。那么这里还有两个数据处理和sklearn应用中的小知识点咱们还没有讲,但是在实践中却会经常要用到的,那就是交叉验证cross_validation和Pipeline。cross_validation是保证了咱们的模型不受数据分布的影响, ...
分类:其他好文   时间:2020-01-26 22:21:38    阅读次数:96
[转帖]数据库主从复制,读写分离,分库分表,分区讲解
数据库主从复制,读写分离,分库分表,分区讲解 https://database.51cto.com/art/202001/608852.htm讲解的挺好的 需要仔细学习一下呢. 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题。对于一个大型的互联网应用,每天几十亿的PV无疑对数 ...
分类:数据库   时间:2020-01-14 09:23:35    阅读次数:101
磁盘阵列
磁盘阵列 与 分布式存储 简单理解 磁盘阵列将多个磁盘组合成一个大磁盘, 并通过编码, 冗余等方式使它带有容错功能(防止数据丢失), 从而提高了存储可靠性。 而分布式存储则是将数据分布在不同物理位置, 并通过网络把它连接起来。 磁盘阵列可以应用于分布式存储系统中, 也可以集中式存储系统中。 打个比方 ...
分类:其他好文   时间:2020-01-04 20:42:46    阅读次数:92
大数据(5)---分布式任务资源调度Yarn
前面也说到过的Yarn是hadoop体系中的资源调度平台。所以在整个hadoop的包里面自然也是有它的。这里我们就简单介绍下,并配置搭建yarn集群。 首先来说Yarn中有两大核心角色Resource Manager和Node Manager。 Resource Manager负责接收用户提交的分布 ...
分类:其他好文   时间:2020-01-04 01:18:41    阅读次数:76
607条   上一页 1 ... 5 6 7 8 9 ... 61 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!