量化投资与Python——NumPy 为什么选择Python 如何使用Python进行量化投资 NumPy - 数据分析基础包 简介 - NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、 ...
分类:
编程语言 时间:
2021-05-24 04:02:20
阅读次数:
0
pandas:数据分析 pandas是一个强大的Python数据分析的工具包。pandas是基于NumPy构建的。 pandas的主要功能具备对其功能的数据结构DataFrame、Series集成时间序列功能提供丰富的数学运算和操作灵活处理缺失数据 安装方法:pip install pandas引用 ...
分类:
其他好文 时间:
2021-05-24 03:59:52
阅读次数:
0
1.Spark SQL出现的 原因是什么? 随着Spark的发展,对于野心勃勃的Spark团队来说,Shark对于Hive的太多依赖(如采用Hive的语法解析器、查询优化器等等),制约了Spark的One Stack Rule Them All的既定方针,制约了Spark各个组件的相互集成,所以提出 ...
分类:
数据库 时间:
2021-05-24 03:53:49
阅读次数:
0
前言 Elastic自身设计了集群分片的负载平衡机制,当有新数据节点加入集群或者离开集群,集群会自动平衡分片的负载分布。 需求背景 公司原有大数据平台基于公有云构建,由于种种原因,现在需要迁移到自建机房,Elasticsearch集群承担了大数据平台主要的对外查询需求,也有部分实时计算需求基于Ela ...
分类:
其他好文 时间:
2021-05-24 03:46:38
阅读次数:
0
1. Glue与Hudi简介 AWS Glue AWS Glue是Amazon Web Services(AWS)云平台推出的一款无服务器(Serverless)的大数据分析服务。对于不了解该产品的读者来说,可以用一句话概括其实质:Glue是一个无服务器的全托管的Spark运行环境,只需提供Spar ...
分类:
Web程序 时间:
2021-05-24 03:46:26
阅读次数:
0
Spark SQL出现的 原因是什么? Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个叫作Data Frame的编程抽象结构数据模型(即带有Schema信息的RDD),Spark SQL的前身是 Shark,由于 Shark过于依赖Hive,因此在版本迭代时很难添加新的优化 ...
分类:
数据库 时间:
2021-05-24 03:08:56
阅读次数:
0
? 今天,大家就请跟着数栈君一起,和申杭聊聊他从青铜到星耀的大数据之路。 数栈君:申杭,你是07年从华中科技大学软件工程专业毕业的,能说说你当时为什么选择这个专业吗? 申杭:当时会计、师范、机械制造、土木类专业比较热门,一般家人都会让报这些专业,出来好就业。而电子、计算机、软件工程类的专业刚刚兴起, ...
分类:
其他好文 时间:
2021-05-24 00:46:57
阅读次数:
0
解决RuntimeError: you must first build vocabulary before training the model错误 查找解决方案,意思就是说你的数据集中的数量过少,解决方案有两种,扩大数据集的数量、另一个就是更改min_count的值例如:如果太少的话可以更改为 ...
分类:
其他好文 时间:
2021-05-23 23:49:16
阅读次数:
0
DolphinScheduler之最美好的遇见 主人翁介绍 hello,大家好,我是郭强,目前是Apache DolphinScheduler的Commiter。擅长大数据olap、大数据调度、RPC开发等。目前专注于大数据领域核心技术研发。 我也是一名开源爱好者,我要讲的是我从起始给 Dolphi ...
分类:
其他好文 时间:
2021-05-04 16:34:22
阅读次数:
0
今日分享开始啦,请大家多多指教~ 今天分享这种常识型的东西,觉得自己太菜了,所以决定还是回到Java基础学习里,花几天时间快速过一遍,我想应该有很多是我遗漏的点,毕竟学习的目标是大数据开发,基础不牢,地动山摇! 01 概述 计算机包括硬件和软件两部分。硬件包括计算机中可以看得见的物理部分。而软件提供 ...
分类:
编程语言 时间:
2021-05-04 16:11:36
阅读次数:
0