当前位置：首页 > 软件库 > 应用工具 > 网络爬虫 >

crawl-me

轻量级网页图片下载工具

授权协议 MIT

开发语言 Python

所属分类应用工具、网络爬虫

软件类型开源软件

地区国产

投递者农永宁

操作系统跨平台

开源组织无

适用人群未知

软件概览

crawl-me是一个基于plugin的轻量级快速网页图片下载工具。crawl-me通过简单的命令行就可以用你想要的方式下载各个网站下的图片。目前暂时只支持gamersky(游明星空), pixiv（P站），更多plugin尽请期待，欢迎为它添加新的plugin。

特性

支持Http range-headers 并发分段下载，速度更快
支持添加plugin自定义新的行为，例如添加对微博用户相册下载的支持

现有的插件

pixiv : P站图片下载插件，支持下载某P主所有作品
gamersky : 游明星空图库下载插件，支持下载游民星空图库中的某一个专题的所有图片

如何使用？

下载gamersky下的http://www.gamersky.com/ent/201404/352055.shtml 的第1页到第10页的所有图片到当前目录的gamersky-crawl文件夹下
```
crawl-me gamersky http://www.gamersky.com/ent/201404/352055.shtml ./gamersky-crawl 1 10
```
一键下载P站藤原桑的所有作品到pixiv-crawl文件夹（藤原桑的id是27517）
```
crawl-me pixiv 27517 ./pixiv-crawl <your pixiv loginid> <your password>
```

使用案例

crawl.py

#!/usr/bin/env python from sys import argv from os import makedirs, unlink, sep from os.path import isdir, exists, dirname, splitext from string import replace, find, lower from htmllib import
Scrapy中CrawlSpider

Scrapy中CrawlSpider 引入之前的代码中，我们有很大一部分时间在寻找下一页的URL地址或者内容的URL地址上面，这个过程能够更简单一些吗？思路 1、从response中提取所有的a标签对应的URL地中 2、自动的构造自己resquests请求，发送给引擎生成crawlspider的命令 scrapy genspidr -t crawl 爬虫名字域名 LinkExtractor
python crawl

python爬虫下载页面代码备用。 # -*- coding:utf-8 -*- import requests import re import random class download: def __init__(self): self.user_agent_list = [ "Mozilla/5.0 (Windows NT 6.1; WO
scrapy 中没有 crawl 命令

确保两点：　　1、把爬虫.py 复制到 spider 文件夹里　　　　如执行 scrapy crawl demo.py （spiders 中就要有 demo.py 文件）　　2、在项目文件夹内执行命令　　　　在 scrapy.cfg 所在文件夹里执行命令转载于:https://www.cnblogs.com/jcjc/p/10875574.html

相关资料

利用Python2下载单张图片与爬取网页图片实例代码

本文向大家介绍利用Python2下载单张图片与爬取网页图片实例代码，包括了利用Python2下载单张图片与爬取网页图片实例代码的使用技巧和注意事项，需要的朋友参考一下前言一直想好好学习一下Python爬虫，之前断断续续的把Python基础学了一下，悲剧的是学的没有忘的快。只能再次拿出来滤了一遍，趁热打铁，通过实例来实践下，下面这篇文章主要介绍了关于Python2下载单张图片与爬取网页的相关内容
Python3.x爬虫下载网页图片的实例讲解

本文向大家介绍Python3.x爬虫下载网页图片的实例讲解，包括了Python3.x爬虫下载网页图片的实例讲解的使用技巧和注意事项，需要的朋友参考一下一、选取网址进行爬虫本次我们选取pixabay图片网站二、选择图片右键选择查看元素来寻找图片链接的规则通过查看多个图片路径我们发现取src路径都含有 https://cdn.pixabay.com/photo/ 公共部分且图片格式都为.jpg
下载图片asp.netmvc

您好，我有一个按钮，当我单击它时，此函数称为：这里是CreateQrLink函数这是我想通过点击下载QrCode按钮从这个视图下载图像的视图，我如何实现它？我不在数据库中保存QrLink我应该保存它还是其他什么？我想从src=Model获取照片。QrUrl
Java的轻量级工作流引擎

问题内容：编写新的工作流引擎还是使用现有的BPM引擎更好吗：jBPM 5，Activiti 5？我的应用程序是基于Web的应用程序，性能非常重要。我的疑问是，与编写简单的工作流引擎相比，使用jBPM / Activiti是否会增加性能开销。如果我采用自我实现，我会错过工作流程的可视化。为了性能，可以进行交易。问题答案：这确实取决于您的要求。首先，查看您是否真的需要工作流引擎（此资源或其他
python3 下载网络图片代码实例

本文向大家介绍python3 下载网络图片代码实例，包括了python3 下载网络图片代码实例的使用技巧和注意事项，需要的朋友参考一下说明：这里仅展示在已经获取图片链接后的下载方式，对于爬虫获取链接部分参考前面的文章 1、利用文件读写的方式下载图片 2、urlretrieve()方法以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持呐喊教程。
php中使用gd库实现下载网页中所有图片

本文向大家介绍php中使用gd库实现下载网页中所有图片，包括了php中使用gd库实现下载网页中所有图片的使用技巧和注意事项，需要的朋友参考一下在前期的php教程就讲了php gd库可以实现远程图片的下载，但是那只是下载了一张图片，原理是一样的，要想下载一个网页的所有图片只要使用正则表达式进行判断，找出所有的图片url就可以进行循环下载了，我特地参照网络资源编写了gd库图片下载类! php代码如下

crawl-me

同类工具

相关阅读

相关文章

相关问答

相关文档