码迷,mamicode.com
首页 >  
搜索关键字:r语言 数据分析 数据挖掘    ( 7783个结果
Python pandas.DataFrame.add_prefix函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:编程语言   时间:2021-06-11 18:33:01    阅读次数:0
Python pandas.DataFrame.add_suffix函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:编程语言   时间:2021-06-11 18:29:37    阅读次数:0
[数据库/数据分析/数据工程]数据工程的学习资源【待续】
本文所指之数据工程,限定于: 数据分析、数据采集(集成) 1 网站 spider-flow - 智能高效的在线爬虫 spider-flow 是一个无需写代码的爬虫平台,以图形化方式定义爬虫流程,无需代码即可实现一个爬虫 superset.workerindata.com - 账号: bilibili ...
分类:数据库   时间:2021-06-11 18:27:40    阅读次数:0
这个数据可视化软件我用一次就爱上了
我是一名数据分析师,常常需要处理大量的数据,苦于找不到合适的工具,一直用的excel做数据分析,但是大家都知道,excel的可视化能力有限,一行行的黑白文字我看到两眼发黑,效率还很低,后来我了解到一款数据可视化工具——思迈特软件Smartbi。 用了它之后,不仅效率提高了很多,界面也十分高大上,获得 ...
分类:其他好文   时间:2021-06-11 17:31:21    阅读次数:0
大数据开发-Spark Join原理详解
数据分析中将两个数据集进行 Join 操作是很常见的场景。在 Spark 的物理计划阶段,Spark 的 Join Selection 类会根 据 Join hints 策略、Join 表的大小、 Join 是等值 Join 还是不等值以及参与 Join 的 key 是否可以排序等条件来选择最 终的 ...
分类:其他好文   时间:2021-06-10 18:28:12    阅读次数:0
Python pandas.DataFrame.xs函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:编程语言   时间:2021-06-10 18:22:48    阅读次数:0
Python pandas.DataFrame.iloc函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:编程语言   时间:2021-06-09 10:41:05    阅读次数:0
Python pandas.DataFrame.iat函数方法的使用
Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素 ...
分类:编程语言   时间:2021-06-09 10:38:41    阅读次数:0
5-pandans之数据离散化
1 为什么要离散化 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具。 2 什么是数据的离散化 连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值。 离散 ...
分类:其他好文   时间:2021-06-08 23:30:04    阅读次数:0
08学生课程分数的Spark SQL分析
读学生课程分数文件chapter4-data01.txt,创建DataFrame。 一、用DataFrame的操作完成以下数据分析要求 每个分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大于95分的学生人数? Tom选修了几门课?每 ...
分类:数据库   时间:2021-06-07 19:58:41    阅读次数:0
7783条   上一页 1 ... 3 4 5 6 7 ... 779 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!