案例1:使用逻辑回归模型,预测客户的信用评级 数据集中采用defect为因变量,其余变量为自变量 1.加载包和数据集 2.查看数据集, 结论:一共有10000行数据,56个变量,其数据集中没有空值,但是有极大值存在 3,数据清洗 修改前 修改后 结论:visit_cnt不再有不符合业务的极大值出现 ...
分类:
编程语言 时间:
2018-03-30 12:14:30
阅读次数:
379
钻孔机是完成钻进施工的主机,它带动钻具和钻头向地层深部钻进,并通过钻机上的升降机来完成起下钻具和套管、提取岩心、更换钻头等辅助工作。泵的主要功能则是向孔内输送冲洗液以清洗孔底、冷却钻头和润滑钻具。岩土钻掘工程的目的与施工对象各异,因而钻机种类较多。钻机可按用途分类,如岩心钻机、石油钻机、水文地质调查 ...
分类:
其他好文 时间:
2018-03-28 10:28:19
阅读次数:
174
恢复内容开始 案例1:对主席的新年致辞进行分词,绘制出词云 掌握jieba分词的用法 1.加载包 2.导入数据 3.清洗数据 4.移除感叹词 5.绘制词云 案例2:通过拉勾网的数据进行分析,找出数据分析师相关的城市,薪水,工作年限等信息 数据集下载:链接:https://pan.baidu.com/ ...
分类:
编程语言 时间:
2018-03-27 02:01:09
阅读次数:
957
在室内定位过程中,无论是使用wifi定位,地磁定位,只要定位不是使用了自己搭建的信源,就不得不面临采集的工作。而指纹采集是一个复杂的工作,极其费人费力。因此现在也就火起来了众包采集指纹的方法。众包采集指纹一般经过种子制作,数据采集,数据清洗,指纹处理的工作步骤。 通常的指纹库建立都需要一条相对精确的 ...
分类:
其他好文 时间:
2018-03-21 19:53:32
阅读次数:
162
精密空调RT:现在的温度SP:设置的温度RH:现在的湿度SH:设置的湿度“风车图标”:表示风机工作正常回风温度:22度送风温度:18度温湿度设定:45%rh另外,尽量不要关机半年清洗一次水垢半年换一次发动机皮带三个月至半年清洗一次过滤网配电柜:开关都不要碰强电输入电压(V): a:217.1 b:217.8 c:217.5&
分类:
其他好文 时间:
2018-03-19 19:02:37
阅读次数:
480
企业实战案例一:自建出口流量清洗服务器 原创心的哲学2017-09-03 16:48:36评论(0)201人阅读 自制异常流量清洗设备 目录: 1.环境介绍 2.网络结构 3.清洗原理 4.脚本实现 4.1 脚本结构介绍 4.2 awk获取异常IP地址 4.3 tcpdump获取异常协议 4.4 反 ...
分类:
其他好文 时间:
2018-03-18 10:29:41
阅读次数:
157
dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;tidyr包的作者是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。 dplyr、tid ...
分类:
编程语言 时间:
2018-03-10 01:25:25
阅读次数:
4450
1. 数据采集:Python爬取淘宝网商品数据 2. 对数据进行清洗和处理 3. 文本分析:jieba分词、wordcloud可视化 4. 数据柱形图可视化 barh 5. 数据直方图可视化 hist 6. 数据散点图可视化 scatter 7. 数据回归分析可视化 regplot ...
分类:
编程语言 时间:
2018-03-09 13:18:55
阅读次数:
290
我们在使用沥青保温泵的时候一定要制定严格的技术维护保养规范,燃油滤清器工作100小时,油箱工作500小时各清洗一次,若发现滤芯破损失效应及时更换,不得将其拆除而采用直流式供油。偶件在正常工作条件下工作500小时应拆卸检查一次。在拆卸检查沥青保温泵时要保证场所、手、工具和清洗油清洁,以免偶件受污染。在 ...
分类:
其他好文 时间:
2018-02-27 10:56:42
阅读次数:
151
本项目中虽然数据量不大,用Excel自带的替换功能也能实现,但是针对上几千条字段去匹配数据的话,Python就明显高效的多,现在开始讲解: 要清洗的是Excel文档中所有字段的地名, 需要清洗数据: 首先,需要导入xlrd和re包,前者是用来读写Excel文档,后者是正则表达式的包 结果: ...
分类:
编程语言 时间:
2018-02-17 11:05:58
阅读次数:
551