标签:占用 ted file 修改 lan 文件中 memory into 异常
在大多数介绍Buffer的文章中,主要是围绕数据拼接和内存分配这两方面的。比如我们使用fs
模块来读取文件内容的时候,返回的就是一个Buffer:
fs.readFile(‘filename‘, function (err, buf) {
// <Buffer 2f 2a 2a 0a 20 2a 20 53 75 ... >
});
在使用net
或http
模块来接收网络数据时,data
事件的参数也是一个Buffer,这时我们还需要使用Buffer.concat()
来做数据拼接:
var bufs = [];
conn.on(‘data‘, function (buf) {
bufs.push(buf);
});
conn.on(‘end‘, function () {
// 接收数据结束后,拼接所有收到的Buffer对象
var buf = Buffer.concat(bufs);
});
还可以利用Buffer.toString()
来做转换base64
或十六进制字符的转换,比如:
console.log(new Buffer(‘hello, world!‘).toString(‘base64‘));
// 转换成base64字符串:aGVsbG8sIHdvcmxkIQ==
console.log(new Buffer(‘aGVsbG8sIHdvcmxkIQ==‘, ‘base64‘).toString());
// 还原base64字符串:hello, world!
console.log(new Buffer(‘hello, world!‘).toString(‘hex‘));
// 转换成十六进制字符串:68656c6c6f2c20776f726c6421
console.log(new Buffer(‘68656c6c6f2c20776f726c6421‘, ‘hex‘).toString());
// 还原十六进制字符串:hello, world!
一般情况下,单个Node.js进程是有最大内存限制的,以下是来自官方文档中的说明:
What is the memory limit on a node process?
Currently, by default v8 has a memory limit of 512MB on 32-bit systems, and 1.4GB on 64-bit systems. The limit can be raised by setting --max_old_space_size to a maximum of ~1024 (~1 GB) (32-bit) and ~4096 (~4GB) (64-bit), but it is recommended that you split your single process into several workers if you are hitting memory limits.
由于Buffer对象占用的内存空间是不计算在Node.js进程内存空间限制上的,因此,我们也常常会使用Buffer来存储需要占用大量内存的数据:
// 分配一个2G-1字节的数据
// 单次分配内存超过此值会抛出异常 RangeError: Invalid typed array length
var buf = new Buffer(1024 * 1024 * 1024 - 1);
以上便是Buffer的几种常见用法。然而,阅读Buffer的API文档时,我们会发现更多的是readXXX()
和writeXXX()
开头的API,具体如下:
这些API为在Node.js中操作数据提供了极大的便利。假设我们要将一个整形数值存储到文件中,比如当前时间戳为1447656645380
,如果将其当作一个字符串存储时,需要占用11字节的空间,而将其转换为二进制存储时仅需6字节空间即可:
var buf = new Buffer(6);
buf.writeUIntBE(1447656645380, 0, 6);
// <Buffer 01 51 0f 0f 63 04>
buf.readUIntBE(0, 6);
// 1447656645380
在使用Node.js编写一些底层功能时,比如一个网络通信模块、某个数据库的客户端模块,或者需要从文件中操作大量结构化数据时,以上Buffer对象提供的API都是必不可少的。
接下来将演示一个使用Buffer对象操作结构化数据的例子。
假设有一个学生考试成绩数据库,每条记录结构如下:
学号 | 课程代码 | 分数 |
---|---|---|
XXXXXX | XXXX | XX |
其中学号是一个6位的数字,课程代码是一个4位数字,分数最高分为100分。
在使用文本来存储这些数据时,比如使用CSV格式存储可能是这样的:
100001,1001,99
100002,1001,67
100003,1001,88
其中每条记录占用15字节的空间,而使用二进制存储时其结构将会是这样:
学号 | 课程代码 | 分数 |
---|---|---|
3字节 | 2字节 | 1字节 |
每一条记录仅需要6字节的空间即可,仅仅是使用文本存储的40%!下面是用来操作这些记录的程序:
// 读取一条记录
// buf Buffer对象
// offset 本条记录在Buffer对象的开始位置
// data {number, lesson, score}
function writeRecord (buf, offset, data) {
buf.writeUIntBE(data.number, offset, 3);
buf.writeUInt16BE(data.lesson, offset + 3);
buf.writeInt8(data.score, offset + 5);
}
// 写入一条记录
// buf Buffer对象
// offset 本条记录在Buffer对象的开始位置
function readRecord (buf, offset) {
return {
number: buf.readUIntBE(offset, 3),
lesson: buf.readUInt16BE(offset + 3),
score: buf.readInt8(offset + 5)
};
}
// 写入记录列表
// list 记录列表,每一条包含 {number, lesson, score}
function writeList (list) {
var buf = new Buffer(list.length * 6);
var offset = 0;
for (var i = 0; i < list.length; i++) {
writeRecord(buf, offset, list[i]);
offset += 6;
}
return buf;
}
// 读取记录列表
// buf Buffer对象
function readList (buf) {
var offset = 0;
var list = [];
while (offset < buf.length) {
list.push(readRecord(buf, offset));
offset += 6;