解决python报错 UnicodeDecodeError: gbk codec cant decode bytepython在读取文件时遇到报错提示UnicodeDecodeError: gbk codec cant decode byte 0xba in position 106: illegal multibyte sequence,这个是因为当前指定的解码规则无法解析当前文件遇到这种情况有三种解决方式修改要读取的文件编码方式修改根据文件编码方式指定解码规则考虑项目过程中读取的文件通常由三方提供建议采用此方法如果事先拿不到要读取的文件无法确定编码方式可以使用内置函数第三库来获取文件编码方式部分网上的解决方式是读取文件时设置errors参数为ignore注意这种方式不能解决根本问题依旧无法读取文件内容十分不推荐这个报错是我在读取文件的时候已经指定了gbk编码不能读取说明超出gbk编码的范围这个时切换gb18030编码即可简单说一下gb2312,gbk,和gb18030的关系gb2312是我国发布了第一个汉字编码标准收录了 6763 个常用的汉字和字符gbk是在gb2312的基础上增加了一些人名、繁体字、日语和朝鲜语中的汉字以及一些在gb2312发布之后的简体字共收录了两万多个汉字和字符gb18030在 GBK 的基础上增加了中日韩语中的汉字 和 少数名族的文字及字符共有三个版本GB18030-2000GB18030-2005GB18030-2022以上编码按照先后顺序向下兼容。此处仅举例gbk编码其他字符集也是类似处理方式