python下默认的编码方式是ASCII编码,如果是对中文进行处理就要采用其他的编码方式例如utf-8,这一般会在代码的第二行指定。
(推荐教程:python基础教程)
python内部使用的是Unicode编码,所以如果涉及到搜索匹配判断中文字符串时要转换成unicode编码形式
print type('你好')? ?这个会打印出来是‘str’类型 print type(u'你好')? 打印出来是unicode类型
用repr()可以看到这两种情况下的输出,print repr('你好')? 会输出'\xe4\xbd\xa0\xe5\xa5\xbd',这个是utf-8编码;print repr(u'你好') 输出的是u'\u4f60\u597d'。?
由于python内部只能处理unicode编码,所以如果操作中文字符串时如果不转换成unicode编码那么会遇到问题,例如下面代码并不能输出想要的'你好',这是因为s和t全部都是utf-8编码,遍历的时候也是按照utf-8编码中的元素进行。
相关教程推荐:python爬虫视频教程
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 找不到素材资源介绍文章里的示例图片?
- 模板不会安装或需要功能定制以及二次开发?
发表评论
还没有评论,快来抢沙发吧!