# -*- coding: utf-8 -*- import bs4 import requests from bs4 import BeautifulSoup import pandas as pd import matplotlib.pyplot as plt def getHTMLText(u ...
分类:
Web程序 时间:
2020-12-19 13:08:52
阅读次数:
2
今天照着阿里云天池指南抄代码熟悉第一个蒸汽预测项目的时候,用pd.read_csv读入数据集文件: 1 train_data = pd.read_csv('D:/360MoveData/Users/dell/Desktop/Data Science/skypool_practise/zhengqi_ ...
分类:
其他好文 时间:
2020-12-17 12:29:09
阅读次数:
2
import numpy as np import pandas as pd PATH_DES = '/Users/linxianli/Desktop/' df = pd.read_excel(PATH_DES + '工作簿1.xlsx') df.head() # 使用 sklearn 进行分层抽样 ...
分类:
编程语言 时间:
2020-12-17 12:01:00
阅读次数:
1
删除DataFrame指定列有空值的行 1. `mydf.dropna(subset=['col1', 'col2'], inplace = True)` 2. ``` mydf = pd.DataFrame({ 'name' : ['Tom','Amy','John','George'], 'se ...
分类:
其他好文 时间:
2020-12-09 12:04:52
阅读次数:
4
# 设置输出结果列对齐 pd.set_option('display.unicode.ambiguous_as_wide',True) pd.set_option('display.unicode.east_asian_width',True) #用来正常显示中文标签 plt.rcParams['f ...
分类:
其他好文 时间:
2020-12-05 10:54:19
阅读次数:
8
import pandas as pd import plotly_express as px 查看原始数据情况 df=pd.read_excel('leyoujia.xlsx') zone = pd.DataFrame(df["zone"].value_counts()).reset_index( ...
分类:
其他好文 时间:
2020-12-01 12:03:42
阅读次数:
3
1.环境准备 pip3 install pymysql pip3 install sqlalchemy 2.连接数据库 import pymysql import numpy as np import pandas as pd from sqlalchemy import create_engine ...
分类:
数据库 时间:
2020-11-17 12:37:02
阅读次数:
14
df_org = pd.read_csv(path) print(df_org.head(5)) df_org.columns = ["UserID", "Gender", "Age", "Attribution", "Type", "StartTime", "EndTime", "Log", "L ...
分类:
编程语言 时间:
2020-11-16 14:00:41
阅读次数:
21
外部数据的读取 文本文件的读取 Example # 文本文件的读取 import pandas as pd text = pd.read_csv('data_test01.txt', sep=',', names=['序号', '出生年', '月份', '日期', '性别', '职位', '薪资'] ...
分类:
编程语言 时间:
2020-11-06 01:56:39
阅读次数:
33
Pandas 数据清洗常见方法 01 读取数据 df=pd.read_csv('文件名称') 02 查看数据特征 df.info() 03 查看数据量 df.shape 04 查看各数字类型的统计量 df.describe() 05 去除重复值 df.drop_duplicates(inplace= ...
分类:
其他好文 时间:
2020-10-21 21:22:59
阅读次数:
31