本此博客对自己第三周主学习进行一些总结,本周主要学习了关于python以及大型数据的一些操作,学习的主要内容基本是关于数据的获取以及对数据进行一些分析。前面的博客已经介绍过对DataX的使用了,本次介绍一下另一种数据分析工具Kettle的使用,以下是自己的实际操作例子: 一、安装 链接: https ...
分类:
其他好文 时间:
2020-03-09 00:59:34
阅读次数:
127
在head标签之间,加上如下代码: <!-- GrowingIO Analytics code version 2.1 --> <!-- Copyright 2015-2018 GrowingIO, Inc. More info available at http://www.growingio.c ...
前言 Python 是常用是数据分析工具,常用的数据分析库有很多,下面主要介绍如下五个分析库:NumPy、Pandas、SciPy、StatsModels、Matplotlib。 "NumPy" NumPy 是一个非常常用的数据分析库,更准确点说是一个数学计算库,包括下面的 Pandas 也依赖于 ...
分类:
编程语言 时间:
2020-01-21 18:23:19
阅读次数:
72
1 背景 用户本地有一份txt或者csv文件,无论是从业务数据库导出、还是其他途径获取,当需要使用蚂蚁的大数据分析工具进行数据加工、挖掘和共创应用的时候,首先要将本地文件上传至ODPS,普通的小文件通过浏览器上传至服务器,做一层中转便可以实现,但当这份文件非常大到了10GB级别,我们就需要思考另一种 ...
分类:
Web程序 时间:
2020-01-10 15:18:38
阅读次数:
116
大数据价值的体现离不开数据挖掘,它的主要目的是从各种各样的数据来源中,提取出隐藏的信息,然后将这些信息合并发现其内在关系。数据挖掘任务除了专门的一些工具外,实际上BI工具也可以进行数据挖掘,市面上的一些BI工具不单单是数据分析工具,而且内置了很多模型算法,无需分析人员自己建模就可以完成数据挖掘,探索数据之间的关系。文章主要围绕数据挖掘方法和BI工具做数据挖掘的实例进行讲解。数据挖掘的主要方法数据挖
分类:
其他好文 时间:
2020-01-10 00:25:58
阅读次数:
162
一、Pandas基础 Pandas是基于NumPy的一套数据分析工具,该工具是为了解决数据分析任务而创建的,所以它至少有以下特点或用途: 基于NumPy,提供了矩阵运算 强大的分析结构化数据的工具集 提供数据清洗功能 (一)数据结构 1、Series 是带标签的一维数组,可存储整数、浮点数、字符串、 ...
分类:
其他好文 时间:
2020-01-04 20:32:49
阅读次数:
87
1 背景 用户本地有一份txt或者csv文件,无论是从业务数据库导出、还是其他途径获取,当需要使用蚂蚁的大数据分析工具进行数据加工、挖掘和共创应用的时候,首先要将本地文件上传至ODPS,普通的小文件通过浏览器上传至服务器,做一层中转便可以实现,但当这份文件非常大到了10GB级别,我们就需要思考另一种 ...
分类:
Web程序 时间:
2019-12-31 10:38:04
阅读次数:
88
写在前面:圣诞刚过,弥留者节日气息的大家是否还在继续学习呐~在匆忙之际也不忘给自己找几首好听的歌曲放松一下,缠绕着音乐一起来看看关于2019年流行音乐趋势是如何用Python分析的吧! 昨天下午没事儿,随便听了下音乐,结果搜到了一份数据比较好玩,所以拿了来做个数据分享案例。 这份数据是由国外比较火的 ...
分类:
编程语言 时间:
2019-12-26 22:55:03
阅读次数:
154
前言大数据、人工智能正在改变或颠覆各行各业,包括我们的生活。大数据、人工智能方面的人才已经供不应求,但作为人工智能的核心一机器学习,因涉及的知识和技能比较多,除了需要具备一定的数学基础、相关业务知识外,还要求有比较全面的技术储备,如操作系统、数据库、开发语言、数据分析工具、大数据计算平台等,无形中提高了机器学习的门槛。如何降低机器学习的门槛,让更多有志于机器学习、人工智能的人能更方便或顺畅地使用、
分类:
其他好文 时间:
2019-12-12 01:32:52
阅读次数:
100
jupyter notebook 是基于ipthony 要是用jupyter notebook首先需要安装ipyhon ipython首先安装方法: pip3 install ipython jupyter notebook 的安装有两种方式: 1:命令行安装 pip3 install jupyte ...
分类:
其他好文 时间:
2019-12-04 22:14:36
阅读次数:
189