当前位置：首页 > 编程笔记 >

详解python3 + Scrapy爬虫学习之创建项目

袁青青

2023-03-14

本文向大家介绍详解python3 + Scrapy爬虫学习之创建项目，包括了详解python3 + Scrapy爬虫学习之创建项目的使用技巧和注意事项，需要的朋友参考一下

最近准备做一个关于scrapy框架的实战，爬取腾讯社招信息并存储，这篇博客记录一下创建项目的步骤

pycharm是无法创建一个scrapy项目的

因此，我们需要用命令行的方法新建一个scrapy项目

请确保已经安装了scrapy，twisted，pypiwin32

一：进入你所需要的路径，这个路径存储你创建的项目

我的将放在E盘的Scrapy目录下

二：创建项目：scrapy startproject ***(这个是项目名)

这样就创建好了一个名为tencent的项目

三：进入项目新建一个爬虫：scrapy genspider tencent_spider hr.tencent.com

这里我们要注意，上面的命令，加黑的是爬虫名称，斜体是域名

这样，我们就新建了一个爬虫项目，打开文件夹查看

打开spiders

然后我们用pycharm打开

点击File —>open，找到项目所在文件夹，打开即可

这样，我们就新建了一个scrapy项目，如果安装了所需要的库，scrapy飘红，记得去切换解释器

在File—>settings的标红的地方

另外推荐大家，在根目录下新建一个start.py的文件并写入

from scrapy import cmdline
 
cmdline.execute("scrapy crawl tencent_spider".split())

这样，我们每次运行，运行start.py，即可，不用到命令行执行运行命令

鼠标右键tencent，新建python文件，即可创建。

以上所述是小编给大家介绍的python3 Scrapy爬虫创建项目详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对小牛知识库网站的支持！

类似资料：

Python的Scrapy爬虫框架简单学习笔记

本文向大家介绍Python的Scrapy爬虫框架简单学习笔记，包括了Python的Scrapy爬虫框架简单学习笔记的使用技巧和注意事项，需要的朋友参考一下一、简单配置，获取单个网页上的内容。（1）创建scrapy项目（2）编辑 items.py （3）在 spiders 文件夹下，创建 blog_spider.py 需要熟悉下xpath选择，感觉跟JQuery选择器差不多，但是不如
Python爬虫学习之翻译小程序

本文向大家介绍Python爬虫学习之翻译小程序，包括了Python爬虫学习之翻译小程序的使用技巧和注意事项，需要的朋友参考一下本次博客分享的内容为基于有道在线翻译实现一个实时翻译小程序，本次任务是参考小甲鱼的书《零基础入门学习Python》完成的，书中代码对于当前的有道词典并不适用，使用后无法实现翻译功能，在网上进行学习之后解决了这一问题。 2、前置工作 1）由于有道在线翻译是“反爬虫”的，所以
Python Scrapy爬虫框架

主要内容：Scrapy下载安装,创建Scrapy爬虫项目,Scrapy爬虫工作流程,settings配置文件Scrapy 是一个基于 Twisted 实现的异步处理爬虫框架，该框架使用纯 Python 语言编写。Scrapy 框架应用广泛，常用于数据采集、网络监测，以及自动化测试等。提示：Twisted 是一个基于事件驱动的网络引擎框架，同样采用 Python 实现。 Scrapy下载安装 Scrapy 支持常见的主流平台，比如 Linux、Mac、Windows 等，因此你可以很方便的安装它
python3之微信文章爬虫实例讲解

本文向大家介绍python3之微信文章爬虫实例讲解，包括了python3之微信文章爬虫实例讲解的使用技巧和注意事项，需要的朋友参考一下前提： python3.4 windows 作用：通过搜狗的微信搜索接口http://weixin.sogou.com/来搜索相关微信文章，并将标题及相关链接导入Excel表格中说明：需xlsxwriter模块，另程序编写时间为2017/7/11，以免之后程序无
Python的爬虫程序编写框架Scrapy入门学习教程

本文向大家介绍Python的爬虫程序编写框架Scrapy入门学习教程，包括了Python的爬虫程序编写框架Scrapy入门学习教程的使用技巧和注意事项，需要的朋友参考一下 1. Scrapy简介 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以
爬虫项

爬虫项是什么呢？比如采集文章列表、文章详情页，他们都是不同的采集项。定义示例：继承Yurun\Crawler\Module\Crawler\Contract\BaseCrawlerItem类。 <?php namespace Yurun\CrawlerApp\Module\YurunBlog\Article; use Imi\Bean\Annotation\Bean; use Yurun\C

相关阅读

python3 Scrapy爬虫框架ip代理配置的方法用python3 urllib破解有道翻译反爬虫机制详解 python爬虫之xpath的基本使用详解 Python爬虫学习之获取指定网页源码从零学习node.js之简易的网络爬虫（四）

相关文章

[实例]爬虫下载小说 [实例]爬虫抓取网页第一个Python爬虫程序 Vue3 创建项目创建Maven项目

相关问答

网络爬虫 - 如何解决爬虫切片时只能获取单个数据项的问题?使用基于python scrapy的爬虫程序，但出现错误 Azure机器学习实验创建 python爬虫 - Python爬虫WinError 10061连接拒绝问题？最佳爬虫确定与技术构建？

相关工具

神箭手云爬虫百度云分享爬虫 Scrapy 围棋学习 Scrapy-Python

相关文档

Python 爬虫学习系列教程爬虫课件 React 学习之道 Qt 学习之路 Python 原生爬虫教程