需求:通过页面点击完成简单的投票系统功能。 相关文件: 设计思路: 1、前端:提供可以投票的入口。查询的入口。(前端不做数据处理,只做展示) 使用<a> </a> 完成超链接的接收数据 设置超链接的按钮:提供投票和查询功能 2、后端:数据存储:可以通过txt文件做简单的数据存储。提供新增数据的接口, ...
分类:
其他好文 时间:
2020-05-04 15:23:14
阅读次数:
74
零、目的: 掌握爬虫的使用方法,在B站上爬取出有用的信息来节省流量(bushi) 一、实现: 首先,进行了最初级的实验,将数据“爬”出来 代码如下: 结果令人眼花缭乱》》》 二、改进: 于是乎,尝试将那些多余的标签什么的去掉,结果(= =) 不出所料,之前我掌握的数据处理技巧对这个数据类型“束手无策 ...
分类:
其他好文 时间:
2020-05-03 23:06:35
阅读次数:
157
##################################### 1.首先说下为什么要encode,python里面bool值是True和False,json里面bool值是true和false,并且区分大小写,这就尴尬了,明明都是bool值。 在python里面写的代码,传到json里, ...
分类:
编程语言 时间:
2020-05-03 18:51:46
阅读次数:
64
简介 bitmap在很多海量数据处理的情况下会用到。一些典型的情况包括数据过滤,数据位设置和统计等。 它的引入和应用通常是考虑到海量数据的情况下,用普通的数组会超出数据保存的范围。使用这种位图的方式虽然不能在根本上解决海量数据处理的问题,但是在一定的数据范围内,它是一种有效的方法。bitmap在ja ...
分类:
编程语言 时间:
2020-05-03 18:43:44
阅读次数:
82
数据预处理的主要内容包括数据清洗、数据集成、数据变换、数据规约。 数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值和异常值。 数据质量分析是检查数据中是否存在一些脏数据,例如:缺失值、异常值和不一致的值等。 数据缺失有很多原因,例如数据无法获得 ...
分类:
其他好文 时间:
2020-05-03 16:39:32
阅读次数:
136
https://zhuanlan.zhihu.com/p/96823622 ?开始半累加的计算之前,我们先看看什么是累加、半累加以及不可累加数据。 在含有大量行的数据表中,各种数据处理语言,包括DAX,为了性能考虑,不太可能总是检索表的每一行,更常见的情形是,一次性检索成千上万行,处理如此多行数据的 ...
分类:
其他好文 时间:
2020-05-03 12:17:37
阅读次数:
70
//使用kafka+sparkStreaming进行数据处理 //从kafka拉取数据 package com.swust.predict import org.apache.kafka.clients.consumer.ConsumerRecord import org.apache.kafka. ...
分类:
其他好文 时间:
2020-05-02 23:22:17
阅读次数:
114
一、用xlrd可打开文件、读取数据,但是用put_cell()写数据,不能修改excel文件(补充:可修改内存中的文件)。 二、用xlwt可创建文件、创建SHEET,可写入数据,保存文件。但是不能修改已创建的文件,没有open_workbook 方法。 三、若要打开一个已有的excel文件,并对其数 ...
分类:
编程语言 时间:
2020-05-02 17:03:01
阅读次数:
105
mogodb:client = pymongo.MongoClient('localhost', 27017) # 连接数据库mydb = client['mydb'] # 新建mysb数据库test = mydb['test'] # 新建test数据集合/表# mongoDB数据库只有插入数据才会 ...
分类:
编程语言 时间:
2020-05-02 16:52:30
阅读次数:
54
上一篇简介了ZipkinServer的搭建,但是从Springboot2.x版本后,Zipkin官网已经不再推荐自己搭建定制Zipkin,而是直接提供了编译好的jar包。详情可以查看官网:https://zipkin.io/pages/quickstart.html有了ZipkinServer还不能对微服务的调用链路进行人祸监控,ZipkinServer可以被认为是一个数据处理和展示中心,那它的数
分类:
编程语言 时间:
2020-05-02 09:26:30
阅读次数:
68