1. 使用 drop_duplicates 去重 1.1 初始化数据 df = pd.DataFrame({'stu_name': ['Tom', 'Tony', 'Jack', 'Jack', np.nan], 'stu_age': [16, 16, 15, np.nan, 21]}) stu_n ...
分类:
其他好文 时间:
2021-06-06 19:31:16
阅读次数:
0
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 http://www.lining0806.com/spark%E4%B8%8E ...
分类:
其他好文 时间:
2021-06-06 19:08:07
阅读次数:
0
用python在一个图中显示画两个hist图: import random import numpy from matplotlib import pyplot x = [random.gauss(3,1) for _ in range(400)] y = [random.gauss(4,2) fo ...
分类:
编程语言 时间:
2021-06-06 19:01:54
阅读次数:
0
Python3 pandas DataFrame 基本功能讲解 import pandas as pd 导入库 df = pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 创建一个DataFrame 代 ...
分类:
编程语言 时间:
2021-06-06 18:58:17
阅读次数:
0
#### 基于Douglas-Peucker算法对矢量数据简化 #### # 当原始的矢量数据因为形状复杂,包含的点较多时,会导致其文件体积较大, # 如果我们需要在在线地图上叠加它们,太大体积的矢量数据不仅会拖慢网络传输速度, # 也会给图形的渲染带来更大的压力,这时对矢量数据进行简化就非常有必要 ...
分类:
编程语言 时间:
2021-06-06 18:53:49
阅读次数:
0
八爪鱼 ——自动抓取进行数据采集 如何进行数据可视化呢? 有两种方法。 第一种就是使用 Python。在 Python 对数据进行清洗、挖掘的过程中,我们可以使用 Matplotlib、Seaborn 等第三方库进行呈现。 第二种就是使用第三方工具。如果你已经生成了 csv 格式文件,想要采用所见即 ...
分类:
其他好文 时间:
2021-06-04 18:52:21
阅读次数:
0
part1数据探索及数据处理 数据处理 # 复制原数据 df3 = df.copy() df3.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 3004 entries, 0 to 3003 Data columns (total 7 ...
分类:
其他好文 时间:
2021-06-02 20:25:18
阅读次数:
0
import pandas as pd 1 创建空Dataframe df = pd.DataFrame(columns=('a', 'b', 'c')) df a b c 2 添加一行Series数据 先创建Series s1 = pd.Series({'a': 1, 'b': 2, 'c': 3 ...
分类:
其他好文 时间:
2021-06-02 19:52:27
阅读次数:
0
中国地图 基本地图 import pandas as pd from matplotlib.colors import rgb2hex from mpl_toolkits.basemap import Basemap import matplotlib.pyplot as plt ### 1. 中国 ...
分类:
其他好文 时间:
2021-06-02 19:40:47
阅读次数:
0
from flask import Flask import pandas as pd app = Flask(__name__) @app.route('/') def show_excel(): df = pd.read_excel("./学生信息表.xlsx") table_html = df ...
分类:
其他好文 时间:
2021-06-02 18:31:14
阅读次数:
0