码迷,mamicode.com
首页 >  
搜索关键字:清洗    ( 781个结果
利用正则表达式对网络日志数据进行数据清洗
原数据: 183.49.46.228 - - [18/Sep/2013:06:49:23 +0000] "-" 400 0 "-" "-"163.177.71.12 - - [18/Sep/2013:06:49:33 +0000] "HEAD / HTTP/1.1" 200 20 "-" "DNSP ...
分类:其他好文   时间:2020-06-25 23:42:05    阅读次数:72
4-业务数据分析思维
今日默写 '''1 常用的图表有哪些,都适用哪些场景 2 数据分析的流程 3 数据清洗的流程 ''' 今日内容 常见业务指标 什么是指标 以电商数据为例分析常用的指标 如何选择业务指标 电商指标体系详细介绍 业务指标 一个衡量业务好坏的标准 了解业务: 1 公司是做什么,卖什么产品,服务对象,有哪些 ...
分类:其他好文   时间:2020-06-21 11:44:14    阅读次数:60
ch1-数据科学概述
数据科学概述 一、挑战 (一)工程实现 特征提取:对于原始数据进行处理:数据清洗、数据整合、变量归一化等,转换成能被模型使用的特征; 矩阵运算:使用算法来估算算法的模型参数;模型越复杂,需要估计的参数越多,在数学上对应着矩阵运算; 分布式机器学习:将原本在一台机器上运行的模型,改写成能在多台机器上并 ...
分类:其他好文   时间:2020-06-18 01:08:35    阅读次数:87
python学习方法总结(内附python全套学习资料)
不要再问我python好不好学了一个小学四年级的小孩子都能在科学的教学下独立完成python游戏,植物大战僵尸简单版,如果要肯花时间,接下来的网络开发也不是问题,人工智能也可以学个调包也没啥问题。。。。。所以python真的是想学就一定能学会的!!!!先聊聊互联网转行那些事儿很多人是小白,想从事或转行互联网,想以python为切入口,那么恭喜你,这可能是你离互联网工作最捷径的一条道路了,毕竟pyt
分类:编程语言   时间:2020-06-17 10:50:36    阅读次数:81
基于MySQL分析线上充值留存率
1.数据清洗 步骤: 1.查询charge_record表业务类型为充值且订单状态为成功的数据 2.将上述数据转移到本地数据库 使用如下脚本: # coding=utf-8import pymysql# 原数据库链接db1 = pymysql.connect( host='***', port=33 ...
分类:数据库   时间:2020-06-12 19:54:51    阅读次数:89
大数据标准管理体系流程
完成数据治理体系的整体规划后,需要针对体系内的六大环节开始逐个突破。作为数据治理体系最前端的两个环节,数据标准管理体系和数据质量管理体系可谓整个数据治理工作中的“基础支撑”。  数据标准化的过程其实就是在数据整合平台实现数据标准,并将各个系统产生的数据通过清洗、转换加载到整合平台的数据模型中,实现数据标准化的过程。一个企业内部的数据标准化方式如此,一个行业监管机构在采集全行业数据时的数据标准化
分类:其他好文   时间:2020-06-12 12:27:07    阅读次数:325
数据清洗要点
缺失值清洗: 1. 确定缺失值范围:根据缺失值范围来选择下一步操作; 2. 去除不需要的字段:直接删除该字段数据; 3. 填充:根据经验、建模预测等填充缺失值; 4. 重新获取:若信息很重要,确实率很高,可重新获取; 格式内容清洗 1. 时间、日期等,统一其格式; 2. 内容中不该存在的字符:如空格 ...
分类:其他好文   时间:2020-06-09 19:02:51    阅读次数:82
织梦被挂了黑链的可能原因和排查清除办法
家电清洗经常听一些身边的朋友说,织梦的安全性太差了,网站刚上线就被黑了。其实我要说的是,并不是织梦的安全性差,大部分被黑的网站很大一部分是自身没有做好安全的设置。就比如之前有一些客户,跟版网小编帮客户装好网站后,还特意提示要及时修改账户密码,客户不听,还是用默认的账户密码,结果没几天被黑了。下面跟版 ...
分类:其他好文   时间:2020-06-03 12:10:04    阅读次数:75
织梦cms手机站首页不更新的解决办法
家电清洗一些新手朋友,经常会遇到修改了织梦后台的文档和栏目,pc站已经改变了,为什么我的手机站还是原来的数据呢?这其实是织梦官方的一个小bug,如果你pc站首页的生成方式为生成静态(如下图),那么你第一次访问手机网站时候,会在/m/目录下生成一个index.html文件,这个生成的文件默认只生成一次 ...
分类:移动开发   时间:2020-06-03 12:07:03    阅读次数:164
第53天: Python 线程池
by 豆豆 大家都知道当任务过多,任务量过大时如果想提高效率的一个最简单的方法就是用多线程去处理,比如爬取上万个网页中的特定数据,以及将爬取数据和清洗数据的工作交给不同的线程去处理,也就是生产者消费者模式,都是典型的多线程使用场景。 那是不是意味着线程数量越多,程序的执行效率就越快呢。 显然不是。线 ...
分类:编程语言   时间:2020-05-31 16:10:26    阅读次数:63
781条   上一页 1 ... 3 4 5 6 7 ... 79 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!