Pandas 概述 Pandas是python中运用很广泛的统计分析库,用于各种金融、工业、等等统计分析,适用于各种时间序列和面板数据等。而对应于Pandas库,最主要的两个类分别是Series和DataFrame。Pandas是numpy的一种扩展,因此很多高级的数据计算方法也是来源numpy。 ...
分类:
其他好文 时间:
2020-07-05 15:53:25
阅读次数:
74
1 绪论 1.1 项目概述 该系统使用Java语言,意义可概括为以下几点: 学生信息管理系统,首先由管理员增加、删除、修改、查找、导入教师信息,再有教师界面登录不同的教师类别,辅导员老师负责增加、删除、查找、学生的相关信息、教务老师负责增加、删除、修改、查找、有哪些课程的相关信息、授课教师负责增加、 ...
分类:
其他好文 时间:
2020-07-03 23:49:57
阅读次数:
170
1.数据分析概要 基础概念,matplotlib,numpy,pandas 2.为什么要学习数据分析? 对大量的数据进行统计分析,总结我们感兴趣的规律,用于生产。 从一堆数据中寻找经验规律 岗位需求,python数据科学的基础,机器学习课程的基础 3.什么是数据分析 数据分析是用适当的方法对手机来的 ...
分类:
其他好文 时间:
2020-07-03 10:54:36
阅读次数:
82
为什么需要用户行为宽表?把每个用户单日的行为聚合起来组成一张多列宽表,以便之后关联用户维度信息后,进行不同角度的统计分析。 创建用户行为宽表: 这张宽表整合了下单、支付和评论3种行为。 drop table if exists dws_user_action; create external tab ...
分类:
其他好文 时间:
2020-07-02 16:41:55
阅读次数:
137
项目响应速度要求比较高,全部使用Redis缓存这也导致缓存。需要分析各种键占用内存情况进行优化。 redisclient虽然可以很方便的对redis进行操作,但不能查看对应key占用的内存情况,也无法对占用内存的key进行统计分析。我简单的了解一下市面上的可以查看redis中的key的占用的开源中间 ...
分类:
其他好文 时间:
2020-06-30 12:59:09
阅读次数:
56
推断统计 是研究如何利用样本数据来推断总体特征的统计方法 从样本信息外推到总体,以最终获得对总体问题的解答 今日内容 统计学的几个概念 概率分布 抽样分布 参数估计 假设检验 统计学的几个概念 变量 1 分类变量 无序分类变量 说明事物类别的一个名称,如性别有男女两种,二者无大小之分,无顺序之分,还 ...
分类:
其他好文 时间:
2020-06-26 14:33:05
阅读次数:
99
Numpy提供各种统计函数,用于数据统计分析。 从数组中找出最小和最大元素 函数numpy.amin()和numpy.amax()分别用于查找指定轴上,数组元素的最小值和最大值。 示例 import numpy as np a = np.array([[2,10,20],[80,43,31],[22 ...
分类:
编程语言 时间:
2020-06-19 12:03:36
阅读次数:
53
随着科学技术的发展,用户对频率计也提出了新的要求。除通常的频率计所具有的功能外,还要有数据处理功能,统计分析功能,时域分析功能等等,或者包含电压测量等其他功能。这些要求有的已经实现或者部分实现,但要真正完美的实现这些目标,对于生产厂家来说,还有许多工作要做,而不是表面看来似乎发展到头了。测量仪器的准确度的选择仪器的频率测量准确度取决于时基。大多数仪器使用的10MHz参考振荡器具有10-7或10-8
分类:
其他好文 时间:
2020-06-16 20:09:42
阅读次数:
100
TF-IDF算法原理及其使用详解 感觉之前学的不是很清晰,最主要理论和实践没有结合,这回结合一下~ TF-IDF(Term Frequency-inverse Document Frequency)是一种针对关键词的统计分析方法,用于评估一个词对一个文件集或者一个语料库的重要程度。一个词的重要程度跟 ...
分类:
编程语言 时间:
2020-06-13 12:35:30
阅读次数:
113