标签:
如下的程序,将一个行数为fileLines的文本文件平均分为splitNum个小文本文件,其中换行符‘r‘是linux上的,windows的java换行符是‘\r\n‘:
以上程序处理大文本文件只需要30MB左右的内存空间(这和所设的读取缓冲大小有关),但是速度不是很快,在磁盘没有其他程序占用的情况下,将200MB文件分割为112份需要20秒(机器配置:Centrino2 P7450 CPU,2GB DDR3内存,Ubuntu 11.10系统,硬盘最大读写速度大约60MB/S)。
另外,对于几百兆到2GB大小的文件,使用内存映射文件的话,速度会块一些,但是内存映射由于映射的文件长度不能超过java中int类型的最大值,所以只能处理2GB以下的文件。
标签:
原文地址:http://www.cnblogs.com/firstdream/p/5535977.html