对于dataframe格式的数据: 1、data.value_counts():统计数据出现的次数 2、data.query("label==0"):按指定条件查询数据 3、data.plot():可视化dataframe格式的数据 4、pandas.get_dummies(data):将某列数据用 ...
分类:
其他好文 时间:
2020-04-05 18:32:18
阅读次数:
78
02 字符编码 核心 一、知识储备 1、三大核心硬件 2、文本编辑器读取文件内存的流程 3、python解释器解释执行文件的流程 总结:python解释器与文件本编辑的异同 二、字符编码介绍 1、什么是字符编码表? 就是一张字符与数字对应的关系表。 ??字符编码表的发展史?? 1、阶段一:一家独大 ...
分类:
其他好文 时间:
2020-03-12 23:40:51
阅读次数:
71
一.三大核心硬件 所有软件都是运行硬件之上的,与运行软件相关的三大核心硬件为cpu、内存、硬盘,我们需要明确三点 二.文本编辑器读取文件内容的流程 三.python解释器执行文件的流程 四.总结 字符编码介绍 一.什么是字符编码? 字符: 二.字符编码表的发展史 (了解) python 现代计算机起 ...
分类:
其他好文 时间:
2020-03-12 21:45:22
阅读次数:
80
1.什么是字符编码 人类在与计算机交互时,用的都是人类能读懂的字符,如中文字符、英文字符、日文字符等 而计算机只能识别二进制数,详解如下 毫无疑问,由人类的字符到计算机中的数字,必须经历一个过程,字符—— 翻译—— 数字。 翻译的过程必须参照一个特定的标准,该标准称之为字符编码表,该表上存放的就是字 ...
分类:
其他好文 时间:
2020-03-11 20:57:18
阅读次数:
64
写在前面:本文要求对浮点的编码表示已有一定基础,如果对「IEEE 754」这一个词组不熟悉,请勿继续阅读,以免浪费时间。 重温 ICS,又学习了一遍计算机中的浮点数的编码表示,似乎又有了一些新的理解。 先来复习一下基本知识:对于一个浮点数,计算机采用「科学计数法」去表示: $$ value = ( ...
分类:
其他好文 时间:
2020-03-02 00:57:50
阅读次数:
98
一.Huffman树 定义: 给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径达到最小,这样的二叉树称为最优二叉树,也称为霍夫曼树(Huffman树). 特点: Huffman树是带权路径长度最短的树,权值较大的节点离根节点较近 权值 = 当前节点的值 * 层数,wpl最小的值,就是H ...
分类:
其他好文 时间:
2020-02-13 16:32:33
阅读次数:
104
转换流原理:字节流+编码表 原理图 OutputStreamWriter 是字符流通向字节流的桥梁 package com.oracle.demo01; import java.io.FileNotFoundException; import java.io.FileOutputStream; im ...
分类:
其他好文 时间:
2020-02-12 13:05:37
阅读次数:
68
Unicode介绍 Unicode是一张编码表格,包含了世界上每个国家所有的字符对应的二进制数据 计算机只能识别二进制,例如010101001这种二进制数据(计算机使用高低电平表示0和1)。 但是这些二进制人是难以看懂的,于是美国人就用ASCII码制作了一张表,包含了从a,b,c,.....@%$等 ...
分类:
其他好文 时间:
2020-02-08 17:21:07
阅读次数:
127
pandas从0.15版开始提供分类数据类型,用于表示统计学里有限且唯一性数据集,例如描述个人信息的性别一般就男和女两个数据常用'm'和'f'来描述,有时也能对应编码映射为0和1。血型A、B、O和AB型等选择可以映射为0、1、2、3这四个数字分别代表各个血型。pandas里直接就有categoric ...
分类:
其他好文 时间:
2020-02-01 16:08:27
阅读次数:
82
字符编码 字符编码:字符 编码(字符编码表) 二进制 目前内存中使用的统一是unicode,编码和解码对应了相应的字符集 保证不乱码的关键: 1.字符当初以什么编码存放的, 就应该以什么编码解码。 2.在python2中解释器默认使用的编码是ASCII码,python3默认使用的是UTF 8 3.目 ...
分类:
编程语言 时间:
2020-01-21 16:34:34
阅读次数:
97