import pandas as pd def get_data(): q1 = [] q2 = [] p1 = input("list 1:") p2 = input("list 2:") q1=p1.split(',') q2=p2.split(',') for i,j in zip(range ...
分类:
其他好文 时间:
2020-05-29 23:23:28
阅读次数:
86
###概述 Structured Streaming 是 Spark 2.0 引入的功能,有以下特点 基于 Spark SQL engine 可以直接使用 DataSet/DataFrame API,就像处理离线的批数据一样 Spark SQL engine 持续地、增量地处理流数据 支持 stre ...
分类:
其他好文 时间:
2020-05-29 21:22:01
阅读次数:
77
tradingview月K线数据统计月涨幅遇到的一些问题及解决方法 # 以下为部分截取的代码# 设置dataframe数字显示格式 pd.set_option('display.float_format',lambda x : '%.4f' % x) # 在导包的时候全局设置成保留四位小数 data ...
分类:
其他好文 时间:
2020-05-25 15:45:18
阅读次数:
61
#代码设计:步骤一:获取网页信息。步骤二:对数据进行帅选。部署三对数据进行打印import requestsimport reimport pandas as pddef GetHtml(url): try: r=requests.get(url) r.raise_for_status() r.en ...
分类:
其他好文 时间:
2020-05-24 13:44:33
阅读次数:
74
1.自定义聚合函数,结合agg使用 2. 同时使用多个聚合函数 3. 指定某一列使用某些聚合函数 4.merge与transform使用 import pandas as pd import numpy as np np.random.seed(1) dict_data = { 'k1': ['a' ...
分类:
编程语言 时间:
2020-05-23 13:21:08
阅读次数:
60
一、应用pandas # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import re def rule(item_str): """ 对内容的规则 :param item_str: str :retu ...
分类:
其他好文 时间:
2020-05-22 19:17:08
阅读次数:
48
api代码示例入下 object DataFrameCase { def main(args: Array[String]): Unit = { val sparksession = SparkSession.builder().appName("DataFrameCase").master("lo ...
第一题:请利用pandas来生成一个三行一列的列向量(series),列向量的行标是a,b,c,每列的值是1,2,3。 第二题:请利用pandas来把两个三行一列的列向量合并成一个六行一列的列向量。 第三题:请利用pandas生成一个三行三列的单位矩阵(dataframe),矩阵的行标是a,b,c, ...
分类:
其他好文 时间:
2020-05-17 13:02:53
阅读次数:
196
1.df6 = pd.DataFrame(data,index=行名,columns=列名)# 构成一个表格print(df6.index) # 查看行名print(df6.columns) # 查看列名print(df6.values) # 查看数据值print(df6['B'].values) ...
分类:
其他好文 时间:
2020-05-16 20:39:10
阅读次数:
60
例子1:精确指定条件 df_mots[(df_mots['time'] < 25320)&(df_mots['time'] >= 25270)] 例子2:模糊条件,包含指定字符串(包含变量) .str.contains方法 df_new = df_mots[(df_mots["HOUR_ID"] = ...
分类:
其他好文 时间:
2020-05-16 17:04:49
阅读次数:
616