|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
如果您觉得本篇CentOSLinux教程讲得好,请记得点击右边漂浮的分享程序,把好文章分享给你的小伙伴们!一样的步伐在WIN下跑一般,在Linux下跑读取一般文件会提醒“UnicodeDecodeError:gbkcodeccantdecodebytesinposition30664-30665:illegalmultibytesequence”
这是由于碰到了不法字符——特别是在某些用C/C++编写的步伐中,全角空格常常有多种分歧的完成体例,好比xa3xa0,大概xa4x57,这些字符,看起来都是全角空格,但它们并非“正当”的全角空格(真实的全角空格是xa1xa1),因而在转码的过程当中呈现了非常。
按网上的***是如许办理:
s.decode(gbk,ignore).encode(utf-8)
由于decode的函数原型是decode([encoding],[errors=strict]),能够用第二个参数把持毛病处置的战略,默许的参数就是strict,代表碰到不法字符时抛出非常;
假如设置为ignore,则会疏忽不法字符;
假如设置为replace,则会用?代替不法字符;
假如设置为xmlcharrefreplace,则利用XML的字符援用。
我的办理***是间接疏忽不法字符:
s.decode(gbk,ignore)欢迎大家来到仓酷云论坛! |
|