1 案例背景 2 任务说明 3 准备工作 4 数据集描述 5 时序分析流程 ...
分类:
其他好文 时间:
2021-02-18 12:54:17
阅读次数:
0
2.EDA/探索性数据分析 2.1 周一到周日每天购买情况 # 导入相关包 %matplotlib inline # 绘图包 import matplotlib import matplotlib.pyplot as plt import numpy as np import pandas as p ...
分类:
其他好文 时间:
2021-02-17 14:01:56
阅读次数:
0
scrapy框架学习 初识 一、概述 Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 二、安装 安装:pip install scrapy 因为安装scrapy需要相 ...
分类:
其他好文 时间:
2021-01-26 12:21:50
阅读次数:
0
一个重要的闭环: 机器学习-数据挖掘的流程(CRISP-DM):围绕数据进行如下6个活动进行闭环式地探索活动 商业理解 数据理解 数据准备 建立模型 模型评估 方案实施 一个重要的概念: 特征工程:最大限度地从原始数据中提取特征以供算法和模型使用,包括如下几个主要部分: 数据预处理:标准化、缩放、缺 ...
分类:
其他好文 时间:
2021-01-06 11:47:45
阅读次数:
0
WEKA的全名是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。如果想自己实现数据挖掘算法的话,可以参考weka的接
分类:
其他好文 时间:
2021-01-02 11:36:56
阅读次数:
0
【导读】在给大家分享基础入门知识的同时,我们也会带领大家去阅读一些相关领域的书籍。以做阅读理解的态度为大家剖析书中知识点,相信你如果能够跟上我们的节奏一起学习,一定会有所收获。今天给大家分享的这本书是机械工业出版社出版的《数据挖掘概念与技术》(作者:Jiawei Han;Micheline Kamb ...
分类:
其他好文 时间:
2021-01-02 10:47:04
阅读次数:
0
原创:数据臭皮匠 【导读】Kaggle ,作为听说它很牛X但从未接触过的同学,可能仅仅了解这是一个参加数据挖掘比赛的网站,殊不知Kaggle也会有赛题相关的数据集, 比如我们熟知的房价预测、泰坦尼克号乘客生存预测、手写数字识别等,并且每个比赛下面都会有大神分享自己的思路和代码,如果能利用好这些资源, ...
分类:
其他好文 时间:
2021-01-02 10:41:22
阅读次数:
0
程序员书库(ID:OpenSourceTop)编译l链接:https://www.kdnuggets.com/2014/04/9-free-books-learning-data-mining-data-analysis.html数据挖掘,数据分析,这两个名词经常给人的感觉就是高深莫测的,其实,并非如此,再难的知识只要我们花时间去学习和时间,就会发现实际上并没有那么难这个世界上最不缺的就是聪明的人
分类:
其他好文 时间:
2020-12-23 12:09:08
阅读次数:
0
图源:unsplash有人认为,数据科学就是创建可用来预测的模型。这句话可以这样理解:我们有了数据,探测发展模式,把这些再应用于预测未来,获得结果。这个逻辑说得通,其背后的理论,我们称之为统计。整个历史长河中,有关预测的代名词先后涌现,比如数据挖掘、分析、商业智能、运筹学、新兴的数据科学。不过在这里我们没必要深究统计与数据科学之间是否能划等号,也大可不必对数据信息获取的无数流行词吹毛求疵。今天笔者
分类:
其他好文 时间:
2020-12-22 11:40:10
阅读次数:
0
目录 学习 数据挖掘的流程 数据预处理->数据探索->模型训练->模型选择->模型评估 模型选择 模型选择是对超参数的选择,通过校验集,来看看模型那一组超参数有更好的效果 模型评估 参考资料 分类:分类问题的常用评估指标有准确率(accuracy)、精确率(precision)、召回率(recall ...
分类:
其他好文 时间:
2020-12-18 13:19:35
阅读次数:
4