标签:utf-8 无法 文本 格式 comm 输出 nbsp encoding 转化
comment = “物流很快,昨晚下的单今天下午就到了??个人觉得特别百搭的一个颜色。”
str不具有decode属性,必须先将其转换为bytes,转化为bytes要制定其编码,然后将其utf8解码,然后再编码成gbk,同时备注‘ignore’属性,忽视无法编码的emoji,最后解码然后转换成str,便可输出到txt。
把其转化为gbk(方便txt保存)的编码格式,同时去除??。
comment = str(bytes(comment, encoding=‘utf-8‘).decode(‘utf-8‘).encode(‘gbk‘, ‘ignore‘).decode(‘gbk‘))
标签:utf-8 无法 文本 格式 comm 输出 nbsp encoding 转化
原文地址:https://www.cnblogs.com/qilin20/p/12609628.html