KNN算法分析iris种类 数据集iris_dataset.txt, 首先加载数据 查看种类有哪些 将iris种类,类别型数据转为数值型 构建训练集,测试集数据,数据量比值 4:1 自实现knn算法预测iris种类准确率 结果可视化 knn算法特点, k值不同,预测结果不同。 ...
分类:
编程语言 时间:
2019-11-16 12:53:48
阅读次数:
67
数据采集过程包括集成、导入、格式化。数据采集过程中首先集成来自不同来源的数据。数据集成要考虑存储架构、采集方式、接口方式、采集周期等。在存储架构方面,可以考虑在数据源侧设置数据暂存区(StagingArea),也可以考虑在采集平台侧设置的暂存区。靠根据数据量和累计速度来设置合理大小的数据暂存区,防止数据溢出。在存取方式方面,可以根据应用的需要采用不同的存取方式。采集方式包括单个采集和批量采集两种类
分类:
其他好文 时间:
2019-11-09 00:04:23
阅读次数:
173
数据库分类 关系型数据库:maridb, MySQL, SqlServer,Oracle 非关系型数据库:mongodb, redis 区别: 关系型数据库每列中数据类型是固定的,把数据存在硬盘中;非关系型数据库,可存多种类型数据,数据存在内存中 基本操作 数据库操作 ...
分类:
数据库 时间:
2019-10-29 09:43:02
阅读次数:
71
题目传送门(内部题91) 输入格式 第一行一个正整数$N$,表示颜色种类数。 第二行$N$个正整数$k[i],k[i]$表示第$i$种颜色的数量$(1\leqslant k[i]\leqslant 3)$。 输出格式 一个整数,表示相同颜色的小球不相邻的方案数。 样例 样例输入1: 31 2 3 样 ...
分类:
其他好文 时间:
2019-10-27 13:04:48
阅读次数:
68
分块算法总结 分块,就是一种暴力算法,不过复杂度优于暴力,是基于足够的预处理和合理可行的维护操作进行优化时间, 在预处理+维护的耗时上与暴力处理的耗时上找到一种平衡,于是出了这个优美的算法 标志:查询某一区间内元素种类数,查询某一区间大于等于某一元素的数的个数(即排名 模板:LuoguP2801 教 ...
分类:
编程语言 时间:
2019-10-09 19:19:06
阅读次数:
118
数据结构、数据类型 在看Java的HashMap之前,插播一点重要的数据结构要点。 1. 数据结构(data structure) 数据结构表达的是:用什么样的结构,组织一类数据。 分为逻辑结构和物理结构: 基本的逻辑结构有:集合、线性结构、树形结构、图; 物理结构:顺序存储、链式存储; 2. 数据 ...
分类:
其他好文 时间:
2019-10-03 17:55:52
阅读次数:
91
https://nanti.jisuanke.com/t/41415 因为对于询问$\sum |s|<=1e5$,因此$|s|$的种类数$<=\sqrt{1e5}$ 我们分组标记,就变成了$\sqrt{1e5}$次询问了,我们暴力去跑, 复杂度$1e5\sqrt{1e5}*hashmap$ 暴力+哈 ...
分类:
其他好文 时间:
2019-09-16 10:04:19
阅读次数:
79
先离线,将询问按照时间排序,维护商店出现和消失 对于每一个询问,先二分枚举答案,假设是ans, 即要求对于区间[l-ans,l+ans],商店的种类数是k(l是询问的位置) (当然需要先将所有位置离散一下,l-ans和l+ans找到等价的位置) 那个条件并不是很好处理,但可以转化成另一个条件: l+ ...
分类:
其他好文 时间:
2019-09-15 19:11:43
阅读次数:
91
After inventing Turing Tree, 3xian always felt boring when solving problems about intervals, because Turing Tree could easily have the solution. As we ...
分类:
编程语言 时间:
2019-08-06 21:27:24
阅读次数:
172
题目链接:https://ac.nowcoder.com/acm/contest/885/G 题意: 两个串,s t,求s的所有子串中大于 t 的数目 题解: dp[i][j] 表示 s的前i个,匹配 t 的前 j 个的种类数, 那么 if(s[i] == t[j]) dp[i][j] = dp[i ...
分类:
其他好文 时间:
2019-08-04 13:10:24
阅读次数:
81