1、pandas数据结构之DataFrame DataFrame生成方式:1、从另一个DataFrame创建。2、从具有二维形状的NumPy数组或数组的复合结构生成。3、使用Series创建。4、从CSV之类文件生成。下面介绍DataFrame的简单用法: a):读取文件 代码: from pand ...
分类:
编程语言 时间:
2021-07-02 15:40:00
阅读次数:
0
# Python数据分析:pandas数据操作和分析案例 ###### 项目介绍: * [ https://www.kaggle.com/openfoodfacts/world-food-facts ](https://www.kaggle.com/openfoodfacts/world-food- ...
分类:
编程语言 时间:
2021-07-02 15:39:04
阅读次数:
0
任务调度: 是指系统在某个时间执行的特定的命令或程序。 任务调度分类: 1.系统任务调度: 有些重要的工作必须周而复始地执行。如病毒扫描、日志清理等。在/etc目录下有一个crontab文件,这个就是系统任务调度的配置文件。 2.用户任务调度: 个别用户可能希望执行某些程序,比如对mysql数据库的 ...
分类:
系统相关 时间:
2021-07-02 15:38:49
阅读次数:
0
1 5个MySQL使用问题 1)关于count(*) 知识点:MyISAM会直接存储总行数,InnoDB则不会,需要按行扫描。 潜台词是,对于select count(*) from t; 如果数据量大,MyISAM会瞬间返回,而InnoDB则会一行行扫描。 实践:数据量大的表,InnoDB不要轻易 ...
分类:
数据库 时间:
2021-07-02 15:38:31
阅读次数:
0
好久没发博客了,今天来发一篇分析股价相关度的。╮ ( ╯ ▽ ╰ ) ╭ 为什么要分析股价相关度呢,我们来引入一个概念——配对交易 所谓的配对交易,是基于统计套利的配对交易策略是一种市场中性策略,具体的说,是指从市场上找出历史股价走势相近的股票进行配对,当配对的股票价格差偏离历史均值时,则做空股价较 ...
分类:
编程语言 时间:
2021-07-02 15:37:28
阅读次数:
0
7.1MongoDB之索引 MongoDB读取数据的方法 MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。 什么是索引 索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构 createIndex()方法 M ...
分类:
数据库 时间:
2021-07-02 15:36:45
阅读次数:
0
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析 如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark- ...
分类:
编程语言 时间:
2021-07-02 15:35:46
阅读次数:
0
1、 https://www.cnblogs.com/zhaoyingjie/p/6160363.html 开始以为是这个样子: [python] view plain copy class BlogForm(forms.Form): title = forms.CharField(required ...
分类:
其他好文 时间:
2021-07-02 15:30:38
阅读次数:
0
threading模块 Python中提供了threading模块来实现线程并发编程,官方文档如下: 官方文档 添加子线程 实例化Thread类 使用该方式新增子线程任务是比较常见的,也是推荐使用的。 简单的代码示例如下,创建3个子线程并向其添加任务,然后运行并打印它们的线程ID和线程名字: imp ...
分类:
编程语言 时间:
2021-07-02 15:28:27
阅读次数:
0
# pandas 查出全部的重复的数据 duplicate = res[res.duplicated(subset=[col])][col].tolist() fin_res = res[res[col].isin(duplicate)]# 当使用dupilcated方法查重时 只会查重重复的数据, ...
分类:
其他好文 时间:
2021-07-02 15:27:25
阅读次数:
0