原文链接:https://blog.csdn.net/jiaoyangwm/article/details/79525237 3.1.1 信息增益划分数据集的大原则是:将无序数据变得更加有序,但是各种方法都有各自的优缺点,信息论是量化处理信息的分支科学,在划分数据集前后信息发生的变化称为信息增益,获 ...
分类:
其他好文 时间:
2020-06-17 01:42:28
阅读次数:
70
1. Reids内存的划分 数据 内存统计在used_memory中 进程本身运行需要内存 Redis主进程本身运行需要的内存占用,代码、常量池等 缓冲内存,客户端缓冲区、复制积压缓冲区、AOF缓冲区。有jemalloc分配内存,会统计在used_memory中 内存碎片 Redis在分配、回收物理 ...
分类:
其他好文 时间:
2020-06-12 14:49:11
阅读次数:
61
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 ...
分类:
其他好文 时间:
2020-06-09 20:13:10
阅读次数:
79
题目大意: 将n个数分为m段,每段权值为数值相同的数对数量。求最小权值和。 题目解法: 还是一道分治优化dp。分治优化的具体内容详见划分数组1的题解。这里直接考虑怎么算w(a,b)。 用数组cnt记录一个区间内各个数字出现的次数。显然如果我们知道了一个区间[a,b]的cnt和权值,我们就可以O(1) ...
分类:
编程语言 时间:
2020-05-23 00:32:24
阅读次数:
50
98 数的划分 作者: Turbo时间限制: 1S章节: 动态规划 问题描述 : 将整数n分成k份,且每份不能为空,任意两份不能相同(不考虑顺序)。 例如:n=7,k=3,下面三种分法被认为是相同的。 1,1,5; 1,5,1; 5,1,1; 问有多少种不同的分法。 样例输入 7 3 样例输出 4 ...
分类:
其他好文 时间:
2020-05-11 23:17:24
阅读次数:
95
处理大数据量数据访问速度缓慢的问题 方案1 水平分库分表,比如根据年份划分, 数据库、 数据库等等 查询的时候根据查询时间,去不同的数据库查询,然后组合结果返回 示例代码 "HistoricalDataManage" 方案2 建立 和`实时数据库`,历史数据库存储所有数据,实时数据库仅保留常用数据 ...
分类:
其他好文 时间:
2020-05-06 21:35:33
阅读次数:
89
题意描述 输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。 解题思路 一、冒泡排序/选择排序 对数组进行排序,从数组中取出最小的k个数。不需要对数组全部排序,只需要找出前k个数即可。 二、快速排序 利用快速排序 划分 的思想, ...
分类:
其他好文 时间:
2020-04-18 22:49:10
阅读次数:
54
算法描述: 快速排序也使用分治思想,其过程为: 分解:将原数组划分为两个子数组,但要求左边数组的每个元素都小于右边数组的每个元素。 解决:通过递归调用快速排序,对子数组进行排序。 合并:因为子数组是原址排序,所以不需要合并操作。 快速排序划分数组的方法: 1. 单方向遍历 选择最后一个元素为基准元素 ...
分类:
编程语言 时间:
2020-04-11 15:50:08
阅读次数:
85
"题目链接" 数据范围: $1≤H≤10$ $1≤W≤1000$ $1≤K≤H×W$ 分析: 先观察数据,发现行数特别小,那么我们就可以枚举行的分法,对于每一种分法,求出列的划分数,取最小。 先用二维前缀和,预处理整个图。 复杂度:$O(2^H H W)$ 代码: ...
分类:
其他好文 时间:
2020-03-23 20:36:35
阅读次数:
110
最简单的机器学习流程 1读取数据 import pandas as pd data = pd.read_csv 2切分数据与标签 datax = data.iloc[] datay = data.iloc[] 3划分数据集 from sklearn.model_selection import tr ...
分类:
其他好文 时间:
2020-03-03 14:30:31
阅读次数:
97