问题：

python3.x - win11上跑 scrapy爬虫脚本，一直报错 'gbk' codec can't decode byte 0xae in position 324:？

松正阳

2024-12-15

之前一直是好好的，代码也没变过，突然就报这个错误，并且在mac上是好的，我把win11上的代码移除重新从仓库里拉代码下拉也是一样的错误，
是不是win上文件编码必须是gbk格式的。我用vscode编辑器右下角显示所有的文件都是UTF-8的，是不是都要把它转成gbk？

共有1个答案

公孙志

2024-12-15

打开文件（open）的时候加个参数，encoding="utf-8"：open("foo.far", encoding="utf-8")

类似资料：

Python Scrapy爬虫框架

主要内容：Scrapy下载安装,创建Scrapy爬虫项目,Scrapy爬虫工作流程,settings配置文件Scrapy 是一个基于 Twisted 实现的异步处理爬虫框架，该框架使用纯 Python 语言编写。Scrapy 框架应用广泛，常用于数据采集、网络监测，以及自动化测试等。提示：Twisted 是一个基于事件驱动的网络引擎框架，同样采用 Python 实现。 Scrapy下载安装 Scrapy 支持常见的主流平台，比如 Linux、Mac、Windows 等，因此你可以很方便的安装它
详解python3 + Scrapy爬虫学习之创建项目

本文向大家介绍详解python3 + Scrapy爬虫学习之创建项目，包括了详解python3 + Scrapy爬虫学习之创建项目的使用技巧和注意事项，需要的朋友参考一下最近准备做一个关于scrapy框架的实战，爬取腾讯社招信息并存储，这篇博客记录一下创建项目的步骤 pycharm是无法创建一个scrapy项目的因此，我们需要用命令行的方法新建一个scrapy项目请确保已经安装了scrapy
python3 Scrapy爬虫框架ip代理配置的方法

本文向大家介绍python3 Scrapy爬虫框架ip代理配置的方法，包括了python3 Scrapy爬虫框架ip代理配置的方法的使用技巧和注意事项，需要的朋友参考一下什么是Scrapy？　　Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，非常出名，非常强悍。所谓的框架就是一个已经被集成了各种功能（高性能异步下载，队列，分布式，解析，持久化等）的具有很强通用性的项目模板。
Scrapy爬虫提取URL，但错过了一半回调

我在尝试刮取此URL时遇到了一个奇怪的问题：为了执行爬行，我设计了这个：我从命令行启动spider，我可以看到URL通常被删除，但是，对于其中一些URL，回调不起作用（大约一半的URL通常被删除）。由于此页面上有150多个链接，这可能解释了爬虫程序缺少回调（太多作业）的原因。你们中的一些人对此有什么想法吗？这是日志： 2015-12-25 09:02:55[scrapy]信息：存储在中的c
8. Scrapy爬虫案例实战

任务：爬取腾讯网中关于指定条件的所有社会招聘信息，搜索条件为北京地区，Python关键字的就业岗位,并将信息存储到MySql数据库中。网址：https://hr.tencent.com/position.php?keywords=python&lid=2156 实现思路：首先爬取每页的招聘信息列表，再爬取对应的招聘详情信息 ① 创建项目在命令行编写下面命令，创建项目tencent scrapy
python3.x - 怎么解决python 爬虫运行多进程报错:TypeError: cannot pickle '_thread.lock' object?

python 爬虫运行多进程报错:TypeError: cannot pickle '_thread.lock' object 怎么解决python 爬虫运行多进程报错:TypeError: cannot pickle '_thread.lock' object
python3.x - python mitmproxy高级爬虫问题,求解决?

我要把downstream_port传到tiktok_response_interceptor.py脚本，我目前的方法是 tiktok_response_interceptor-9092.py tiktok_response_interceptor-9093.py tiktok_response_interceptor-9094.py 然后文件中也写死这大概不是最好的方法
一则python3的简单爬虫代码

本文向大家介绍一则python3的简单爬虫代码，包括了一则python3的简单爬虫代码的使用技巧和注意事项，需要的朋友参考一下不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

python3.x - win11上跑 scrapy爬虫脚本，一直报错 'gbk' codec can't decode byte 0xae in position 324:？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档