参考:http://www.jb51.net/article/16104.htm
Python遇到转码问题,有时候非常难解决,尤其遇到一些异常字符,比如下面:
UnicodeDecodeError: 'gb18030' codec can't decode byte 0xaa in position 0: illegal multibyte sequence
经分析是因为如下异常编码导致:
data = b'\xaa*'
执行decode就会报错。
解决办法,
decode('gbk', 'ignore')
如下所示:
文章的脚注信息由WordPress的wp-posturl插件自动生成