当前位置: 首页 > 软件库 > 应用工具 > 网络爬虫 >

crawl-me

轻量级网页图片下载工具
授权协议 MIT
开发语言 Python
所属分类 应用工具、 网络爬虫
软件类型 开源软件
地区 国产
投 递 者 农永宁
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

crawl-me是一个基于plugin的轻量级快速网页图片下载工具。crawl-me通过简单的命令行就可以用你想要的方式下载各个网站下的图片。目前暂时只支持gamersky(游明星空), pixiv(P站),更多plugin尽请期待,欢迎为它添加新的plugin。

特性

 

  • 支持Http range-headers 并发分段下载,速度更快
  • 支持添加plugin自定义新的行为,例如添加对微博用户相册下载的支持

现有的插件

 

  • pixiv : P站图片下载插件,支持下载某P主所有作品
  • gamersky : 游明星空图库下载插件,支持下载游民星空图库中的某一个专题的所有图片

如何使用

  1. 下载gamersky下的http://www.gamersky.com/ent/201404/352055.shtml 的第1页到第10页的所有图片到当前目录的gamersky-crawl文件夹下

    crawl-me gamersky http://www.gamersky.com/ent/201404/352055.shtml ./gamersky-crawl 1 10
  2. 一键下载P站藤原桑的所有作品到pixiv-crawl文件夹(藤原桑的id是27517)

    crawl-me pixiv 27517 ./pixiv-crawl <your pixiv loginid> <your password>

 

 

 

 

  • #!/usr/bin/env python from sys import argv from os import makedirs, unlink, sep from os.path import isdir, exists, dirname, splitext from string import replace, find, lower from htmllib import

  • Scrapy中CrawlSpider 引入 之前的代码中,我们有很大一部分时间在寻找下一页的URL地址或者内容的URL地址上面,这个过程能够更简单一些吗? 思路 1、从response中提取所有的a标签对应的URL地中 2、自动的构造自己resquests请求,发送给引擎 生成crawlspider的命令 scrapy genspidr -t crawl 爬虫名字 域名 LinkExtractor

  • python爬虫下载页面代码备用。 # -*- coding:utf-8 -*- import requests import re import random class download: def __init__(self): self.user_agent_list = [ "Mozilla/5.0 (Windows NT 6.1; WO

  • 确保两点:   1、把爬虫.py 复制到 spider 文件夹里     如 执行 scrapy crawl demo.py (spiders 中就要有 demo.py 文件)   2、在项目文件夹内执行命令     在 scrapy.cfg 所在文件夹里执行命令   转载于:https://www.cnblogs.com/jcjc/p/10875574.html

 相关资料
  • 本文向大家介绍利用Python2下载单张图片与爬取网页图片实例代码,包括了利用Python2下载单张图片与爬取网页图片实例代码的使用技巧和注意事项,需要的朋友参考一下 前言 一直想好好学习一下Python爬虫,之前断断续续的把Python基础学了一下,悲剧的是学的没有忘的快。只能再次拿出来滤了一遍,趁热打铁,通过实例来实践下,下面这篇文章主要介绍了关于Python2下载单张图片与爬取网页的相关内容

  • 本文向大家介绍Python3.x爬虫下载网页图片的实例讲解,包括了Python3.x爬虫下载网页图片的实例讲解的使用技巧和注意事项,需要的朋友参考一下 一、选取网址进行爬虫 本次我们选取pixabay图片网站 二、选择图片右键选择查看元素来寻找图片链接的规则 通过查看多个图片路径我们发现取src路径都含有 https://cdn.pixabay.com/photo/ 公共部分且图片格式都为.jpg

  • 您好,我有一个按钮,当我单击它时,此函数称为: 这里是CreateQrLink函数 这是我想通过点击下载QrCode按钮从这个视图下载图像的视图,我如何实现它?我不在数据库中保存QrLink我应该保存它还是其他什么?我想从src=Model获取照片。QrUrl

  • 问题内容: 编写新的工作流引擎还是使用现有的BPM引擎更好吗:jBPM 5,Activiti 5? 我的应用程序是基于Web的应用程序,性能非常重要。我的疑问是,与编写简单的工作流引擎相比,使用jBPM / Activiti是否会增加性能开销。 如果我采用自我实现,我会错过工作流程的可视化。为了性能,可以进行交易。 问题答案: 这确实取决于您的要求。首先,查看您是否真的需要工作流引擎(此资源或其他

  • 本文向大家介绍python3 下载网络图片代码实例,包括了python3 下载网络图片代码实例的使用技巧和注意事项,需要的朋友参考一下 说明:这里仅展示在已经获取图片链接后的下载方式,对于爬虫获取链接部分参考前面的文章 1、利用文件读写的方式下载图片 2、urlretrieve()方法 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持呐喊教程。

  • 本文向大家介绍php中使用gd库实现下载网页中所有图片,包括了php中使用gd库实现下载网页中所有图片的使用技巧和注意事项,需要的朋友参考一下 在前期的php教程就讲了php gd库可以实现远程图片的下载,但是那只是下载了一张图片,原理是一样的,要想下载一个网页的所有图片只要使用正则表达式进行判断,找出所有的图片url就可以进行循环下载了,我特地参照网络资源编写了gd库图片下载类! php代码如下