一、数据集切割 我们通常将数据及切割成两部分:训练数据集(Training Dataset);测试数据集(Testing Dataset). 注意:可采用分层抽样的方式进行,以保持数据在目标字段上分布的一致性。 1.数据分割 ? 80%训练数据→在训练数据上可以做任何的分析? 20%测试数据→在测试 ...
分类:
其他好文 时间:
2020-06-29 09:15:40
阅读次数:
58
什么是外键,外键能干啥? 什么是外键? 保持数据一致性,完整性,主要目的是控制存储在外键表中的数据。使两张表形成关联,外键只能引用外表中列的值! 外键能干啥? 创建学生表 CREATE TABLE `student` ( `id` int(10) NOT NULL AUTO_INCREMENT, ` ...
分类:
数据库 时间:
2020-06-14 18:43:56
阅读次数:
83
1. 什么是分布式锁? 分布式锁:进程锁(可以在查询和更新数据库的时候都加锁) 分布式就是SOA,面向分布式对象的架构 2. 为什么使用分布式锁:数据安全 保持数据一致性的是分布式事务 3.应用分布式的场景: 3.1 redis 3.2 redis客户端,StackExchange Redis 3. ...
分类:
其他好文 时间:
2020-06-02 23:01:36
阅读次数:
53
1、接口测试的测试点以及优先级 无论是app测试还是web测试,又或者是纯服务端测试,接口测试都是必须要掌握的。接口无处不在,无论你测试时看到的界面是什么,其内涵都是要靠接口进行连通。 1.1、什么是接口 百度百科的专业解释: 接口测试是测试系统组件间接口的一种测试。接口测试主要用于检测外部系统与系 ...
分类:
其他好文 时间:
2020-05-26 12:25:17
阅读次数:
322
张国英,毛燕琴.一种基于区块链的去中心化数据溯源方法[J].南京邮电大学学报(自然科学版),2019,39(02):91 98. 摘要 为了避免数据欺诈(如数据被篡改)等情况发生,必须保持数据创建、修改和转移的历史记录,即溯源。传统的数据溯源系统大多采用中心化的存储模式,存在易遭受内部、外部攻击,且 ...
分类:
其他好文 时间:
2020-05-15 22:58:09
阅读次数:
159
事务分为三个主要知识点,分别是基本属性,并发事务处理带来的问题,以及事务的隔离级别。 一、事务的基本属性 1. 原子性(Atomicity) 事务是一个原子操作单元,其对数据的修改,要么全都执行,要么全不执行 2. 一致性(Consistent) 在事务开始和完成时,数据都必须保持一致状态,这意味着 ...
分类:
数据库 时间:
2020-05-10 13:11:48
阅读次数:
66
一开始我就以为 oplog 应该就类似于 mysql bin-log 而事实上,确实差不多。oplog 也是用于复制集间由 Primary 记录,Secondary 用来同步。从而保持数据一致。 最近遇到了误删db(删库不能跑路)的事情,所以,实验了N多次的 oplog 恢复数据。 特地记录一下,以 ...
分类:
数据库 时间:
2020-05-06 13:52:34
阅读次数:
90
一、用自己的话描述出其本身的含义: 1、特征选择:从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。 2、PCA:主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差贡献 ...
分类:
其他好文 时间:
2020-05-01 18:49:16
阅读次数:
66
一、用自己的话描述出其本身的含义: 1、特征选择 根据需求,选择具有价值的样本特征,即减少不必要的样本特征。 减少特征具有重要的现实意义,不仅减少过拟合、减少特征数量(降维)、提高模型泛化能力,而且还可以使模型获得更好的解释性,增强对特征和特征值之间的理解,加快模型的训练速度,一般的,还会获得更好的 ...
分类:
其他好文 时间:
2020-04-29 13:03:24
阅读次数:
302
一、用自己的话描述出其本身的含义: 1、特征选择 ①特征选择就是特征降维中进行人工选择的方式,主观性剔除不要的特征。 2、PCA ②主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。 二、并用自己的话阐述出两者的主要区别 特征选择是从 ...
分类:
其他好文 时间:
2020-04-28 23:27:35
阅读次数:
102