码迷,mamicode.com
首页 > 编程语言 > 详细

解决python字典结构内存暴涨问题

时间:2016-12-15 14:28:01      阅读:259      评论:0      收藏:0      [点我收藏+]

标签:img   步骤   训练   背景   log   blog   index   word2vec   val   

背景:当读取一个key value数据的时候,python的字典结构会造成内存使用扩10倍左右,无可容忍。此文解决这个问题

数据:word2vec训练的结果,word对应400维的词向量。词表共1.6G左右

解决方案:利用python的class array进行解决。

步骤:1、将原始数据,转化成key,index和 二进制的value数据块文件,其中二进制的value数据块大小为750M

技术分享

 

2、array加载后按照索引进行查询  效果:只占用了800M左右内存,大大缩小了内存的使用。查询采用:vec[i] += word2vec_array[index*word2vec_dim + i]

技术分享

 

 

 

培治

解决python字典结构内存暴涨问题

标签:img   步骤   训练   背景   log   blog   index   word2vec   val   

原文地址:http://www.cnblogs.com/xupeizhi/p/6182838.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!