当前位置: 首页 > 编程笔记 >

Java中使用正则表达式获取网页中所有图片的路径

王彭薄
2023-03-14
本文向大家介绍Java中使用正则表达式获取网页中所有图片的路径,包括了Java中使用正则表达式获取网页中所有图片的路径的使用技巧和注意事项,需要的朋友参考一下
/**
	 * 从HTML源码中提取图片路径,最后以一个 String 类型的 List 返回,如果不包含任何图片,则返回一个 size=0 的List
	 * 需要注意的是,此方法只会提取以下格式的图片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic
	 * @param htmlCode HTML源码
	 * @return <img>标签 src 属性指向的图片地址的List集合
	 * @author Carl He
	 */
	public static List<String> getImageSrc(String htmlCode) {
		List<String> imageSrcList = new ArrayList<String>();
		Pattern p = Pattern.compile("<img//b[^>]*//bsrc//b//s*=//s*('|/")?([^'/"/n/r/f>]+(//.jpg|//.bmp|//.eps|//.gif|//.mif|//.miff|//.png|//.tif|//.tiff|//.svg|//.wmf|//.jpe|//.jpeg|//.dib|//.ico|//.tga|//.cut|//.pic)//b)[^>]*>", Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher(htmlCode);
		String quote = null;
		String src = null;
		while (m.find()) {
			quote = m.group(1);
			src = (quote == null || quote.trim().length() == 0) ? m.group(2).split("//s+")[0] : m.group(2);
			imageSrcList.add(src);
		}
		return imageSrcList;
	}
 类似资料:
  • 本文向大家介绍详解JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片,包括了详解JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片的使用技巧和注意事项,需要的朋友参考一下 利用Java抓取网页上的所有图片: 用两个正则表达式: 1、匹配html中img标签的正则:<img.*src=(.*?)[^>]*?> 2、匹配img标签中得src中http路径的正则:http:\"?(.*?

  • 本文向大家介绍node.js正则表达式获取网页中所有链接的代码实例,包括了node.js正则表达式获取网页中所有链接的代码实例的使用技巧和注意事项,需要的朋友参考一下 实现代码

  • 输入某个网址url,可以提取对应网页的所有图片,并以缩略图展示出来,点击缩略图可查看原图。 [Code4App.com]

  • 本文向大家介绍php使用正则表达式获取图片url的方法,包括了php使用正则表达式获取图片url的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了php使用正则表达式获取图片url的方法。分享给大家供大家参考。 具体实现方法如下: 希望本文所述对大家的php程序设计有所帮助。

  • 正则表达式来提取URL路径。我有这个URL,我只想提取它的一个路径,我该如何获取它? 我想要的路径是从 完整的网址可以分为3部分 https://myurl.nl/apps/ 我只需要中间的部分。如何在Java中使用regex获得它?

  • 问题内容: 我有一些粗略的字符串: 我想使用Java Regex类提取[some number]中的文本。 我大致知道我想使用什么正则表达式(尽管欢迎所有建议)。我真正感兴趣的是Java调用以获取正则表达式字符串并将其用于源数据以产生[some number]的值。 编辑:我应该补充一点,我只对单个[一些数字](基本上是第一个实例)感兴趣。源字符串很短,我不会寻找[some number]的多次出