CentOS教程之python中文decode和encode转码
小知识:CentOS(CommunityEnterpriseOperatingSystem,中文意思是:社区企业操作系统)是Linux发行版之一。字符串在Python外部的表现是unicode编码,是以,在做编码转换时,平日须要以unicode作为中央编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另外一种编码。
decode的感化是将其他编码的字符串转换成unicode编码,如str1.decode(gb2312),表现将gb2312编码的字符串str1转换成unicode编码。
encode的感化是将unicode编码转换成其他编码的字符串,如str2.encode(gb2312),表现将unicode编码的字符串str2转换成gb2312编码。
是以,转码的时刻必定要先弄明确,字符串str是甚么编码,然后decode成unicode,然后再encode成其他编码。
转码的时刻不由要看代码自己的编码、文件的编码,还要看掌握台的编码,这就是为何异样是一段代码,在分歧的体系(编码分歧的)中会涌现乱码的缘由,如:
我的eclipse外面代码为utf-8编码的。然后我如许写代码
s="你好"
s=s.decode(gb2312).encode(utf-8)
prints
报错:
UnicodeDecodeError:gb2312codeccantdecodebytesinposition2-3:illegalmultibytesequence
缘由:由于我的文件为UTF-8编码的。所以你想用gb2312将其转成unicode是弗成能的。
所以准确的写法应该是:
s="你好"
prints
s=s.decode(utf-8).encode(utf-8)要用UTF-8来做编码
prints
发明打印出来的是乱码那只能解释一件工作就是我的eclipse掌握台是GB2312的编码!
小知识:Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。 Windows?是图形界面的,Linux类似以前的?DOS,是文本界面的,如果你运行了图形界面程序X-WINDOWS后,Linux?也能显示图形界面,也有开始菜单、桌面、图标等。 随着Linux应用的扩展,出现了不少Linux社区。有一些非常优秀的社区往往是Linux高手的舞台,如果在探讨高级技巧的论坛张贴非常初级的问题经常会没有结果。 其次,Linux简单易学,因为我们初学者只是学的基础部分,Linux的结构体系非常清晰,再加上老师循序渐进的教学以及耐心的讲解,使我们理解起来很快,短期内就基本掌握了操作和运行模式。 其次,Linux简单易学,因为我们初学者只是学的基础部分,Linux的结构体系非常清晰,再加上老师循序渐进的教学以及耐心的讲解,使我们理解起来很快,短期内就基本掌握了操作和运行模式。 现在的linux操作系统如redhat,难点,红旗等,都是用这么一个内核,加上其它的用程序(包括X)构成的。 可以说自己收获很大,基本上完成了老师布置的任务,对于拔高的题目没有去做,因为我了解我的水平,没有时间和精力去做。? 尽量不要提问纯属是扯蛋.学习Linux特别是自己一个人初学入手的时候没人教很困难.当然如果可以的话平时多去买些Linux书...对学习Linux很有帮助. 生成新的unispimsp.ksc。”另外得到回复后如果问题解决,向帮助过你的人发个说明,让他们知道问题是怎样解决的。
页:
[1]