解决Python报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte

张

张建站

2026/7/23 16:12:42

10分钟阅读

解决Python报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte

解决python报错 UnicodeDecodeError: gbk codec cant decode bytepython在读取文件时遇到报错提示UnicodeDecodeError: gbk codec cant decode byte 0xba in position 106: illegal multibyte sequence,这个是因为当前指定的解码规则无法解析当前文件遇到这种情况有三种解决方式修改要读取的文件编码方式修改根据文件编码方式指定解码规则考虑项目过程中读取的文件通常由三方提供建议采用此方法如果事先拿不到要读取的文件无法确定编码方式可以使用内置函数第三库来获取文件编码方式部分网上的解决方式是读取文件时设置errors参数为ignore注意这种方式不能解决根本问题依旧无法读取文件内容十分不推荐这个报错是我在读取文件的时候已经指定了gbk编码不能读取说明超出gbk编码的范围这个时切换gb18030编码即可简单说一下gb2312,gbk,和gb18030的关系gb2312是我国发布了第一个汉字编码标准收录了 6763 个常用的汉字和字符gbk是在gb2312的基础上增加了一些人名、繁体字、日语和朝鲜语中的汉字以及一些在gb2312发布之后的简体字共收录了两万多个汉字和字符gb18030在 GBK 的基础上增加了中日韩语中的汉字和少数名族的文字及字符共有三个版本GB18030-2000GB18030-2005GB18030-2022以上编码按照先后顺序向下兼容。此处仅举例gbk编码其他字符集也是类似处理方式

GitHub site-policy内容移除政策完全指南：DMCA与商标侵权处理流程

GitHub site-policy内容移除政策完全指南：DMCA与商标侵权处理流程

GitHub site-policy内容移除政策完全指南：DMCA与商标侵权处理流程【免费下载链接】site-policy Collaborative development on GitHubs site policies, procedures, and guidelines 项目地址: https://gitcode.com/gh_mirrors/si/site-policy GitHub site-p…...

2026/7/19 10:53:54 阅读更多 →

GME多模态向量-Qwen2-VL-2B效果对比：Qwen2-VL-2B vs CLIP在细粒度文档检索表现

GME多模态向量-Qwen2-VL-2B效果对比：Qwen2-VL-2B vs CLIP在细粒度文档检索表现

GME多模态向量-Qwen2-VL-2B效果对比：Qwen2-VL-2B vs CLIP在细粒度文档检索表现 1. 多模态检索技术的新突破在信息爆炸的时代，如何快速准确地从海量文档中找到所需内容，一直是企业和个人面临的挑战。传统的文本检索技术已经难以满足复杂场景…...

2026/7/19 10:58:09 阅读更多 →

【SITS官方未明说的AISMM红线】：从证据链断裂到场景覆盖盲区，6步构建不可驳回的评估基线

【SITS官方未明说的AISMM红线】：从证据链断裂到场景覆盖盲区，6步构建不可驳回的评估基线

更多请点击： https://intelliparadigm.com 第一章：SITS2026圆桌：AISMM评估的挑战在SITS2026国际安全技术峰会上，AISMM（AI系统成熟度模型）评估成为圆桌讨论的核心议题。与会专家一致指出，当前A…...

2026/7/19 10:55:35 阅读更多 →

Go语言静态资源打包方案对比与实践指南

Go语言静态资源打包方案对比与实践指南

1. 项目背景与核心需求在Go语言开发中，我们经常需要处理静态资源文件的打包问题。无论是Web应用的模板文件、前端资源，还是配置文件、证书等，都需要随程序一起分发。传统做法是将这些文件与编译后的二进制文件放在同一目录下，但这…...

2026/7/22 11:05:18 阅读更多 →

盘点16个把自己做成Skills的国民级App、网站，Agent 工具一键调用

盘点16个把自己做成Skills的国民级App、网站，Agent 工具一键调用

前几天跟朋友聊天，我说现在的 AI 越来越像个“只会敲键盘的实习生”——你让它写个文案、做个表格还行，但真要让它帮你在现实里点杯咖啡、打个车，它就抓瞎了。不过，这事儿最近正在悄悄起变化。我注意到一个挺有意思的现象&#xf…...

2026/7/22 13:31:10 阅读更多 →

CSRSS 系统分析

CSRSS 系统分析概述 CSRSS（Client Server Runtime Subsystem，客户端/服务器运行时子系统）是 ReactOS 中实现 Win32 子系统服务器端的关键进程。它通过 LPC（本地过程调用）接收用户态应用程序的 Win32 API 调用&#xf…...

2026/7/22 12:02:15 阅读更多 →

多级缓存架构：推理结果缓存、特征缓存和模型缓存分层设计

多级缓存架构：推理结果缓存、特征缓存和模型缓存分层设计

多级缓存架构：推理结果缓存、特征缓存和模型缓存分层设计基础设施不需要漂亮话。当一个用户重复问同一个问题时，回答不该消耗昂贵的 GPU 算力。一、从一次 3 秒的推理看缓存的层级用户在一个知识库问答产品中输入问题"Kubernetes Pod 的 QoS 类型有…...

2026/7/23 3:01:17 阅读更多 →