从报错讲起:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence
出现这个错误一般是由于打开文件时,没有指定编码引起的,比如下面代码
with open('../corpus.txt', mode = 'r') as f:
解决方法很简单,为其指定编码就行了
with open('../corpus.txt', encoding='utf-8', mode = 'r') as f:
还有一个常见的问题就是,生成txt文件,查看内容时发现乱码,这可能与你在打开文件时没有指定编码方式有关
代码就像这样
output = open('context.txt', 'w')
解决的方式也很简单,只要在打开文件时,指定文件编码就行了
output = open('context.txt', 'w', encoding="utf-8")
推荐学习《Python教程》!
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 找不到素材资源介绍文章里的示例图片?
- 模板不会安装或需要功能定制以及二次开发?
发表评论
还没有评论,快来抢沙发吧!