XML内容 概念 可扩展标记语言(Extensible Markup Language) 可扩展:标签都是自定义的 Xml与html的区别:都产自W3C(万维网联盟) 语法 第一行必须定义为文档申明。 文档中有且仅有一个根标签 属性必须用引号(单双都可以)引起来 标签必须正确关闭 Xml的标签名称区... ...
分类:
其他好文 时间:
2019-10-28 21:13:34
阅读次数:
156
pytorch数据读取机制: sampler生成索引index,根据索引从DataSet中获取图片和标签 1.torch.utils.data.DataLoader 功能:构建可迭代的数据装在器 dataset:Dataset类,决定数据从哪读取及如何读取 batchsize:批大小 num_wor ...
分类:
其他好文 时间:
2019-10-27 22:41:09
阅读次数:
291
一、简介 定义: RAID 5是RAID 0和RAID 1的折中方案。RAID 5具有和RAID0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID5的磁盘空间利用率要比RAID 1高,存储成本相对较低,是目前运 ...
分类:
其他好文 时间:
2019-10-25 00:04:01
阅读次数:
121
XGBoost作为一个非常常用的算法,我觉得很有必要了解一下它的来龙去脉,于是抽空找了一些资料,主要包括陈天奇大佬的论文以及演讲PPT,以及网络上的一些博客文章,今天在这里对这些知识点进行整理归纳,论文中的一些专业术语尽可能保留不翻译,但会在下面写出自己的理解与解释。 资料下载:公众号(SAMsha ...
分类:
编程语言 时间:
2019-10-23 00:07:33
阅读次数:
129
一、人民币二分类 描述:输入人民币,通过模型判定类别并输出。 数据:四个子模块 数据收集 -> img,label 原始数据和标签 数据划分 -> train训练集 valid验证集 test测试集 数据读取 -> DataLoader ->(1)Sampler(生成index) (2)Datase ...
分类:
其他好文 时间:
2019-10-21 19:18:53
阅读次数:
127
data.xlsx 数据如下: import xlrd#1.读取Excel数据# table = xlrd.open_workbook("data.xlsx","r")# print("获取excel的所有标签:",table.sheets())# for sheet in table.sheets... ...
分类:
编程语言 时间:
2019-10-20 16:08:08
阅读次数:
73
运维必读:Linux 的内存分页管理 https://cloud.tencent.com/developer/article/1356431 内存是计算机的主存储器。内存为进程开辟出进程空间,让进程在其中保存数据。我将从内存的物理特性出发,深入到内存管理的细节,特别是了解虚拟内存和内存分页的概念。 ...
分类:
系统相关 时间:
2019-10-20 11:01:26
阅读次数:
88
一、tensorflow读取机制图解 首先需要思考的一个问题是,什么是数据读取?以图像数据为例,读取的过程可以用下图来表示 假设我们的硬盘中有一个图片数据集0001.jpg,0002.jpg,0003.jpg……我们只需要把它们读取到内存中,然后提供给GPU或是CPU进行计算就可以了。这听起来很容易 ...
分类:
其他好文 时间:
2019-10-19 00:32:14
阅读次数:
93
为什么分区后还要进行格式化呢? 所谓的分区就是指定分区的起始柱面和结尾柱面,将将分区的信息记录到磁盘的第个扇区当中,也就是说分区只是指定了某个分区在磁盘上可以使用哪些区域而已。系统想要将数据存放在分区当中,需要按照一定的格式,因为只有按照一定的格式存放,我们在读取的时候才方便,这就像书架一样,我们按 ...
分类:
其他好文 时间:
2019-10-16 21:32:18
阅读次数:
87
一、数据读取Load Data 二、数据分析EDA 三、特征工程Feature engineering 四、modeling 五、Tuning 六、Result 一、数据读取Load Data 二、数据分析EDA import matplotlib.pyplot as plt import seab ...
分类:
其他好文 时间:
2019-10-13 15:23:33
阅读次数:
106