码迷,mamicode.com
首页 >  
搜索关键字:数据脱敏 datamasker 数据漂白 数据清洗    ( 383个结果
R语言- 实验报告 - 数据清洗
一、 实训内容 能对基本的开发环境进行检验和错误排查,以及对新语言软件进行安装。 能使用Navicat for MySQL对MySQL数据库进行基本的连接测试,同时,在mysql中新建student数据库。能利用外部SQL脚本文件对数据库进行数据集的导入和初始化。 熟悉利用eclipse编程工具,新 ...
分类:编程语言   时间:2020-01-06 11:10:11    阅读次数:153
《美团 R 语言数据运营实战》
美团 R 语言数据运营实战 2018年08月02日 作者: 喻灿 刘强 文章链接 3689字 8分钟阅读 一、引言 近年来,随着分布式数据处理技术的不断革新,Hive、Spark、Kylin、Impala、Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益 ...
分类:编程语言   时间:2020-01-05 11:29:38    阅读次数:115
Pandas的使用
一、Pandas基础 Pandas是基于NumPy的一套数据分析工具,该工具是为了解决数据分析任务而创建的,所以它至少有以下特点或用途: 基于NumPy,提供了矩阵运算 强大的分析结构化数据的工具集 提供数据清洗功能 (一)数据结构 1、Series 是带标签的一维数组,可存储整数、浮点数、字符串、 ...
分类:其他好文   时间:2020-01-04 20:32:49    阅读次数:87
链家北京二手房数据分析
环境: R 研究对象: 1. 二手房数据的区域特征 2. 二手房数据的面积特征 1. 导入原始数据 setwd("/Users/mac/Desktop/lianjia/") d = read.csv("/Users/mac/Desktop/lianjia/Lianjia.csv") 2. 数据清洗 ...
分类:其他好文   时间:2020-01-04 10:57:11    阅读次数:313
【机器学习】k-means——航空用户聚类分析案例
1 import pandas as pd 2 import numpy as np 3 from sklearn.cluster import KMeans 4 import matplotlib.pyplot as plt 5 6 7 def stand_sca(data): 8 """ 9 标 ...
分类:其他好文   时间:2019-12-29 20:10:30    阅读次数:201
淘宝APP用户行为数据分析之二 —— 数据清洗
由于源数据量较大(3.41G),本文只对 300万 条数据进行处理 处理时间戳 异常日期处理 生成本地CSV文件 ...
分类:移动开发   时间:2019-12-28 21:18:30    阅读次数:116
Java 数据脱敏
数据脱敏 数据脱敏又称数据去隐私化或数据变形,是在给定的规则、策略下对敏感数据进行变换、修改的技术机制,能够在很大程度上解决敏感数据在非可信环境中使用的问题。根据数据保护规范和脱敏策略.对业务数据中的敏感信息实施自动变形.实现对敏感信息的隐藏。 脱敏方法 项目是在controller层进行脱敏,查阅 ...
分类:编程语言   时间:2019-12-18 13:16:57    阅读次数:81
课程成绩数据可视化分析
1.1项目完成的功能与特色 (1)功能:对2016—2018课程的平时、期中、期末三个不同的分数进行数据清洗和分析,最后以合适的柱状图、折线图、饼图等方式表示出来并在网页上渲染 (2)特色:图表能够清晰得呈现不同分数得高低,一目了然得看出最高分、最低分、平均分,观察图表的人能够迅速得获取自己所想要的 ...
分类:其他好文   时间:2019-12-17 22:03:56    阅读次数:217
数据分析03 /基于pandas的数据清洗、级联、合并
数据分析03 /基于pandas的数据清洗、级联、合并 [TOC] 1. 处理丢失的数据 两种丢失的数据: 1. 种类 None:None是对象类型,type(None):NoneType np.nan(NaN):是浮点型,type(np.nan):float 2. 两种丢失数据的区别: objec ...
分类:其他好文   时间:2019-12-12 18:04:03    阅读次数:125
如何评估数据质量?
数据质量评估 在做了近一个多月的数据质量评估方案工作,基本实现了从产出原始数据、数据清洗、入库有效数据等阶段,从对质量没有任何概念到实现基本的指标展示,也算是从设计到代码到展示的流程跑通,在一定程度已经能体现公司目前的数据质量 1.为什么做数据质量? 公司数据是从Excel挖掘出来的,不确定性与未知 ...
分类:其他好文   时间:2019-12-07 01:04:35    阅读次数:506
383条   上一页 1 ... 7 8 9 10 11 ... 39 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!