码迷,mamicode.com
首页 >  
搜索关键字:清洗    ( 781个结果
数据清洗(添加省市区)
利用python为地名匹配省市区, 设计思想:利用百度api实现定位经纬度,然后再通过经纬度匹配省市区 1.从文本中读取地点名称 #提取地区 def diqu(): f = codecs.open('kjcg.txt', mode='r', encoding='utf-8') # 打开txt文件,以 ...
分类:其他好文   时间:2020-03-13 01:14:43    阅读次数:226
日月累积的整理!140种Python标准库、第三方库和外部工具都有了
Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方库和工具。读者福利,想要了解python人工智能可直接点击链接即可领取相关学习福利包:石墨文档是安全网站放心,继续访问就可以领取了哦这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度
分类:编程语言   时间:2020-03-11 09:11:36    阅读次数:83
文本清洗总结
转自:https://www.zhihu.com/question/268849350/answer/486543276 https://zhuanlan.zhihu.com/p/33925599 1.Normalization 小写和去标点 ...
分类:其他好文   时间:2020-03-09 22:27:52    阅读次数:96
大数据分析处理基本流程
大数据分析处理基本流程 数据准备 数据获取(爬虫,统计) 数据清洗(获得想要的数据,去除无用的相关数据) 特征工程 特征提取 比如我爬下网页,网页中有图片,视频,文本信息,url等等之类的特征消息 特征选择 网页保存这学生的信息,我想要计算每个学生的BMI(身体质量指数),而这类信息是在网页中的文本 ...
分类:其他好文   时间:2020-03-07 09:34:06    阅读次数:186
Kettle的使用——大数据清洗技术
参考德拓视频学习:http://113.31.104.47/portal/#/course/courseDetail/b34d160db64624732ef152a1118af11a?courseId=1b7e84f4eb8552536e2267093dbd7972 kettle安装:下载包直接解压 ...
分类:其他好文   时间:2020-03-02 00:35:39    阅读次数:798
数据清洗 | 通过 Z-Score 方法判断异常值
判断异常值方法:Z-Score 计算公式 Z = (X-μ)/σ 其中μ为总体平均值,X-μ为离均差,σ表示标准差。z的绝对值表示在标准差范围内的原始分数与总体均值之间的距离。当原始分数低于平均值时,z为负,以上为正。 代码演示 1 生成一个 df 1 import pandas as pd # 导 ...
分类:其他好文   时间:2020-02-27 13:15:49    阅读次数:675
正则之利用元素属性进行匹配
当爬虫或者数据清洗时,会遇到知道id、class以及name属性 来匹配信息,获取数据的时候。 以下即可,自己自行替换属性以及添加url最后改成符合自己 需求的匹配模板和匹配对象即可。需要注意的一点是,记得查看匹配对象的类型。 html = requests.get(url).texthtml = ...
分类:其他好文   时间:2020-02-24 14:56:15    阅读次数:42
DDoS防护实现概述
这一篇文章描述DDoS流量清洗实现的一些思路。 假设有这样一种场景:一个武林高手和一个基本没有功底的人切磋武艺,胜负如何是无需多言;换另一种场景,如果是十个普通人和武功高手对招,虽然可能费点力气,但是武功高手还是可以再拿下一城;更进一步假设,一百个毫无底子的成年人一拥而上,和这名高手对打,如果高手的 ...
分类:其他好文   时间:2020-02-21 00:09:03    阅读次数:63
数据清洗&模型调优
数据清洗来源:https://www.cnblogs.com/charlotte77/p/5606926.html 模型调优来源:https://www.cnblogs.com/zackstang/p/12313789.html ...
分类:其他好文   时间:2020-02-20 12:57:52    阅读次数:65
Task 04 打卡
机器翻译及相关技术 翻译前准备 清洗(大小写转换 标点符号) 分词(每个单词分开,生成一一对应的列表) 建立词典(根据词频进行统计 单词对应唯一id) Encoder Decoder encoder将输入转化为隐藏状态,再由decoder将隐藏状态输出为翻译后语言。 sequence to sequ ...
分类:其他好文   时间:2020-02-19 20:57:50    阅读次数:62
781条   上一页 1 ... 9 10 11 12 13 ... 79 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!