当前位置: 首页 > 知识库问答 >
问题:

无法使用Selenium网络驱动程序从网页读取文本

谈旺
2023-03-14

我无法从以下网页中读取电子邮件id:

网址:https://targetstudy.com/university/2/acharya-ng-ranga-agricultural-university/

这是我的代码

driver.navigate().to(URL);
String Email = driver.findElement(By.xpath("//*[@id="site-canvas"]/div[6]/div[2]/div[1]/div/div[1]/div/table/tbody/tr/td[2]/table/tbody/tr[4]/td[2]/img")).getText();
System.out.println(Email);

共有1个答案

扶开诚
2023-03-14

在这种情况下,单靠硒并不能帮助您,尽管您的绑定语言可以帮助您。

您需要Java Tesseract API。

提取文本的代码:

 public String getImgText(String imageLocation) {
      ITesseract instance = new Tesseract();
      try 
      {
         String imgText = instance.doOCR(new File(imageLocation));
         return imgText;
      } 
      catch (TesseractException e) 
      {
         e.getMessage();
         return "Error while reading image";
      }
   }

如果您在项目中使用maven,只需添加此依赖项:

<dependency> 
 <groupId>net.sourceforge.tess4j</groupId> 
 <artifactId>tess4j</artifactId> 
 <version>3.2.1</version> 
</dependency>   

更多参考:从图像中提取文本

 类似资料:
  • 在升级到firefox 26.0之前,我在firefox的早期版本中使用了selenium 2.35。以前我的测试运行得很好,但现在我得到了以下错误。 我试图降级火狐的版本,但无法从mozilla网站获得任何以前的版本。 我还尝试了所有的selenium版本2.36,2.37,2.38,2.39但似乎没有一个与火狐26.0兼容。一旦我试图用2.36到2.39替换selenium 2.35,代码中就

  • 我试图使用Selenium Webdriver python单击网站上的一个按钮,我看到该按钮高亮显示,但没有使用函数单击。 下面是我尝试单击的按钮的html代码 我正在尝试使用id单击按钮 我还尝试了xpath,得到了相同的结果

  • 我正在使用Chrome Webdriver执行Salesforce页面流的脚本。这些流用Selenium JUnit代码编写,在JMeter 5.4.1中作为JAR (JUnit请求采样器)导出和执行。该页面有一个带有文本框的弹出窗口。它应该从一个CSV文件(当前保存在Selenium项目中)中逐个读取所有值[例如,value1,value2...值n] (1列,“n”行),直到所有值都结束。输入

  • 我在用蟒蛇2。7带有。现在在我的webautomation脚本中,我将打开链接或URL并进入主页。现在我需要点击一些锚定标签来浏览其他页面。我一直到现在。现在,当我要进入一个新页面时,我需要从浏览器中获取新的,因为我需要将其传递给,以便进行网页抓取。所以现在我关心的是如何以动态的方式获得这样的URL? 如果有,请咨询!

  • 我正在抓取这个网页的用户名,在滚动后加载用户 指向页面的Url:“http://www.quora.com/Kevin-Rose/followers" 我知道页面上的用户数(本例中的用户数为43812),如何滚动页面直到加载所有用户?我在互联网上搜索过同样的代码,在任何地方我都能找到几乎相同的代码行: driver.execute_script("window.scroll至(0)") 如何确定垂

  • 我的目标是使用硒为Python自动在线账单支付。 使用以下代码使用 Web 驱动程序登录成功: 登录后,一个新的页面加载,我的下一步是点击一个链接。代码: 什么也没发生。没有导航到该法案 但仍然没有。我还应该尝试其他什么? 错误: Traceback(最近调用的最后一次):File"/home/队长/. PyCharmEdu30/config/划痕/scratch_1.py",第12行,在clic