码迷,mamicode.com
首页 > 其他好文 > 详细

chardet 模块

时间:2015-11-05 18:27:07      阅读:247      评论:0      收藏:0      [点我收藏+]

标签:

#coding:utf-8
#指定本文件编码为utf-8
#python 27
#xiaodeng
#chardet模块

#chardet模块下载地址:
#1)http://pan.baidu.com/s/1gdfOH95
#2)登录python官网下载


import os,chardet
filename=rD:\测试文件.txt

#怎么判断文件/string的编码格式?
#在处理字符串时,常常会遇到不知道字符串是何种编码,如果不知道字符串的编码就不能将字符串转换成需要的编码,
#如此,chardet产生,是一个非常优秀的编码识别模块。


#1)chardet.detect()方法判断编码格式
#chardet可以直接用detect函数来检测所给字符的编码。
print chardet.detect(filename)              #{‘confidence‘: 0.938125, ‘encoding‘: ‘utf-8‘}
fp=open(filename.decode(utf-8),r)
fp=fp.read()



#2)detect()方法返回值:
#chardet.detect()方法返回一个字典,confidence是精确度,encoding是编码格式
#如:
##{‘confidence‘: 0.938125, ‘encoding‘: ‘utf-8‘},confidence表示编码为utf-8的概率为93.81%

 

chardet 模块

标签:

原文地址:http://www.cnblogs.com/dengyg200891/p/4940090.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!