1 问题

UnicodeDecodeError: ‘gb2312’ codec can’t decode byte 0x87 in position 16144: illegal multibyte sequence

gb2312 error

2 分析

解码错误,我们在用python爬虫爬取网页信息时,通常会遇到编码问题,这是其中的一种,中文编码问题更多。中文编码有如下几种,字符数以次增多:gb2312<gbk<gb18030,如果使用gb2312不能解码,那么可以使用gb18030解码试试

gn18030

写在最后

欢迎大家关注鄙人的公众号【麦田里的守望者zhg】,让我们一起成长,谢谢。
微信公众号