科普：Python编码的前世今生-系统动态-天下网吧

科普：Python编码的前世今生

2016-12-8不详佚名

【大中小】

e只是规定如何编码，并没有规定如何传输、保存这个编码。例如“汉”字的Unicode编码是 6C49，我可以用4个 ASCII 数字来传输、保存这个编码；也可以用UTF-8编码的3个连续的字节 E6 B1 89来表示它。关键在于通信双方都要认可。因此Unicode编码有不同的实现方式，比如：UTF-8、UTF-16等等。这里的Unicode就像英语一样，做为国与国之间交流世界通用的标准，每个国家有自己的语言，他们把标准的英文文档翻译成自己国家的文字，这是实现方式，就像UTF-8。

UTF-8

UTF-8（Unicode Transformation Format）作为Unicode的一种实现方式，广泛应用于互联网，它是一种变长的字符编码，可以根据具体情况用1-4个字节来表示一个字符。比如英文字符这些原本就可以用ASCII码表示的字符用UTF-8表示时就只需要一个字节的空间，和ASCII是一样的。对于多字节（n个字节）的字符，第一个字节的前n为都设为1，第n+1位设为0，后面字节的前两位都设为10。剩下的二进制位全部用该字符的UNICODE码填充。

科普：Python编码的前世今生

以汉字“好”为例，“好”对应的Unicode是 597D，对应的区间是 0000 0800--0000 FFFF，因此它用UTF-8表示时需要用3个字节来存储，597D 用二进制表示是： 0101100101111101，填充到 1110xxxx 10xxxxxx 10xxxxxx 得到11100101 10100101 10111101，转换成16进制：E5A5BD，因此“好”的Unicode“597D”对应的UTF-8编码是“E5A5BD”。

中文好 unicode 0101 100101 111101 编码规则 1110xxxx 10xxxxxx 10xxxxxx -------------------------- utf-8 11100101 10100101 10111101 -------------------------- 16进制utf-8 e 5 a 5 b d

Python字符编码

注：以下代码和概念都是基于Python 2.x。

现在总算把理论说完了。再来说说Python中的编码问题。Python的诞生时间比Unicode要早很多，Python的默认编码是ASCII。

>>> import sys

>>> sys.getdefaultencoding()

'ascii'

所以在Python源代码文件中如果不显式地指定编码的话，将出现语法错误

#test.py

print "你好"

上面是test.py脚本，运行 python test.py 就会包如下错误：

File “test.py”, line 1 yntaxError: Non-ASCII character ‘\xe4′ in file test.py on line 1, but

no encoding declared; see http://www.python.org/ ps/pep-0263.html for details

为了在源代码中支持非ASCII字符，必须在源文件的第一行或者第二行显示地指定编码格式：

# coding=utf-8

或者是：

#!/usr/bin/python

# -*- coding: utf-8 -*-

在Python中和字符串相关的数据类型，分别是 str、unicode 两种，他们都是 basestring 的子类，可见str与unicode是两种不同类型的字符串对象。

basestring

/ \

str unicode

对于同一个汉字“好”，用str表示时，它对应的就是UTF-8编码'\xe5\xa5\xbd'，而用 Unicode表示时，它对应的符号就是 u'\u597d'，与u"好"是等同的。需要补充一点的是，str类型的字符其具体的编码格式是UTF-8还是GBK，还是其它格式，根据操作系统相关。比如在Windows系统中，cmd命令行中显示的：

# windows终端

>>>&nb

本文来源：不详作者：佚名

上一个文章：《黑客帝国》技术成真：科学家实现人脑与虚拟世界直接交互

下一个文章：硅谷明星创业公司的14条经验：如何做好Growth？

相关文章

没有相关文章

聚合推荐

网吧管理系统 Win11 网吧网管呼叫系统网吧语音系统网吧母盘系统

声明

声明：本站所发表的文章、评论及图片仅代表作者本人观点，与本站立场无关。若文章侵犯了您的相关权益，请及时与我们联系，我们会及时处理，感谢您对本站的支持！联系Email：support@txwb.com，系统开号，技术支持，服务联系QQ：1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品，各位转载时请注明来源链接！

天下网吧·网吧天下

推荐文章

新手网维安装网吧、电竞酒店系统教程

本教程适合新手网维、网吧技术网管、有电脑基础技术的网吧老板安装网吧系统、电竞酒店系统，涉足技术领域的初级教程。本教程有任

网吧系统免费用、有好礼送

2022年，网吧行业低迷，为网吧节约成本，天下网吧开展「网吧无盘免费用，还有好礼送！」的活动，活动时间2022-2-1……

· 新手网维安装网吧、电竞酒店系统教
· 网吧系统免费用、有好礼送
· 网吧系统教程
· 网吧游戏异常/突发预警系统
· 推荐天下网吧小程序
· 网吧老铁必备的APP
· 目前比较全的网吧系统视频教程
· 新手开网咖的实用建议
· 网吧技术类视频教程大全
· 万象网管教程最全版

最新文章

顺网科技加盟商后台「代办事宜」点击提示跨域。测试不影响正常功

天下网吧消息，2022年6月7日晚，登陆顺网科技加盟商后台处理txwber加盟顺网科技的事宜时发现，「代办事宜」功能无法

易乐游乾坤版 2.3.7.0 免费下载，官方下载链接公布，网

天下网吧消息，易乐游近日发布乾坤版 2.3.7.0 ，更新了大量的实用功能，其中比较亮点的功能是全面适配 2.5 G网络

· 顺网科技加盟商后台「代办事宜」点击提
· 易乐游乾坤版 2.3.7.0 免费下
· 易乐游发布乾坤版 2.3.7.0 ，
· Win11 22H2新的开始菜单将支持分组
· 新手网维安装网吧、电竞酒店系统教程
· 国产深度操作系统deepin发布20.6版本，
· LOL探险家连招玩法雷柏VT30电竞网咖游戏
· 家里电脑变成网吧模式，家庭电脑系统升
· 《网维大师》9190可以升级吗？网吧升级
· 爆款机械键盘低至79元，雷柏京东618开门

本周热门

本月热门

阅读排行

· 顺网科技加盟商后台「代办事宜」点
· 易乐游乾坤版 2.3.7.0 免
· 易乐游发布乾坤版 2.3.7.0
· Win11 22H2新的开始菜单将支持

· 一套网吧系统多少钱？网吧系统可以
· 顺网科技加盟商后台「代办事宜」点
· 易乐游乾坤版 2.3.7.0 免
· 易乐游发布乾坤版 2.3.7.0
· Win11 22H2新的开始菜单将支持
· 新手网维安装网吧、电竞酒店系统教
· 国产深度操作系统deepin发布20.6版
· LOL探险家连招玩法雷柏VT30电竞网咖
· 爆款机械键盘低至79元，雷柏京东61
· 家里电脑变成网吧模式，家庭电脑系

· 目前比较全的网吧系统视频教程
· 一套网吧系统多少钱？网吧系统可以
· Win11在网吧开始实际应用了吗？好用
· 顺网科技加盟商后台「代办事宜」点
· 易乐游乾坤版 2.3.7.0 免
· 易乐游发布乾坤版 2.3.7.0
· Win11 22H2新的开始菜单将支持
· 新手网维安装网吧、电竞酒店系统教
· 国产深度操作系统deepin发布20.6版
· LOL探险家连招玩法雷柏VT30电竞网咖