1 问题
UnicodeDecodeError: ‘gb2312’ codec can’t decode byte 0x87 in position 16144: illegal multibyte sequence
2 分析
解码错误,我们在用python爬虫爬取网页信息时,通常会遇到编码问题,这是其中的一种,中文编码问题更多。中文编码有如下几种,字符数以次增多:gb2312<gbk<gb18030
,如果使用gb2312
不能解码,那么可以使用gb18030
解码试试
写在最后
欢迎大家关注鄙人的公众号【麦田里的守望者zhg】,让我们一起成长,谢谢。
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
Comment