Python27中Json对中文的处理

时间：2017-05-27 10:50:53 阅读：219 评论：0 收藏：0 [点我收藏+]

标签：文件夹 inpu sci customize 编码问题系统 pac 需要 val

应用场景如下：从api下载数据，json解析，存入字典，定期保存。重启程序需要加载保存的文本。

问题1：json中都是unicode串，存到文本里都是些\u***

解决：关闭ensure_ascii开关

json.dump(pub.listData,fp,ensure_ascii=False)

问题2：字典关键字用的数字，从文本load后变为unicode串

解决：

走了一点弯路，网上的解决方法，都是转换，把串转回utf-8，方法是

def byteify(input):
    if isinstance(input, dict):
        return {byteify(key):byteify(value) for key,value in input.iteritems()}
    elif isinstance(input, list):
        return [byteify(element) for element in input]
    elif isinstance(input, unicode):
        return input.encode(‘utf-8‘)
    else:
        return input

但发现，json相关的都是unicode，转不胜转。

最后解决方法，还是用unicode存，但是load后，加一个处理，把key转换为数值就行

pub.listData=json.load(fp)
pub.listData={int(k):v for k,v in pub.listData.items()}

问题3：编码问题

解决：

    默认情况下，用sys.getdefaultencoding()查看是utf-8
    decode（code）：把code转换为unicode
    encode（code）：把unicode转换为code

如果对一个非unicode格式的串，调用encode的话，则会用默认编码转化为unicode，再进行encode。系统默认编码为ascii，所以常常出错

设置默认编码：

在python的Lib\site-packages文件夹下新建一个sitecustomize.py，内容为：

# encoding=utf8

import sys

reload(sys)

sys.setdefaultencoding(‘utf8‘)

Python27中Json对中文的处理

标签：文件夹 inpu sci customize 编码问题系统 pac 需要 val

原文地址：http://www.cnblogs.com/jetz/p/6911063.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行