问题：

无法使用Selenium网络驱动程序从网页读取文本

谈旺

2023-03-14

我无法从以下网页中读取电子邮件id：

网址：https://targetstudy.com/university/2/acharya-ng-ranga-agricultural-university/

这是我的代码

driver.navigate().to(URL);
String Email = driver.findElement(By.xpath("//*[@id="site-canvas"]/div[6]/div[2]/div[1]/div/div[1]/div/table/tbody/tr/td[2]/table/tbody/tr[4]/td[2]/img")).getText();
System.out.println(Email);

共有1个答案

扶开诚

2023-03-14

在这种情况下，单靠硒并不能帮助您，尽管您的绑定语言可以帮助您。

您需要Java Tesseract API。

提取文本的代码：

 public String getImgText(String imageLocation) {
      ITesseract instance = new Tesseract();
      try 
      {
         String imgText = instance.doOCR(new File(imageLocation));
         return imgText;
      } 
      catch (TesseractException e) 
      {
         e.getMessage();
         return "Error while reading image";
      }
   }

如果您在项目中使用maven，只需添加此依赖项：

<dependency> 
 <groupId>net.sourceforge.tess4j</groupId> 
 <artifactId>tess4j</artifactId> 
 <version>3.2.1</version> 
</dependency>

更多参考：从图像中提取文本

类似资料：

Selenium网络驱动程序无法启动Firefox 26

在升级到firefox 26.0之前，我在firefox的早期版本中使用了selenium 2.35。以前我的测试运行得很好，但现在我得到了以下错误。我试图降级火狐的版本，但无法从mozilla网站获得任何以前的版本。我还尝试了所有的selenium版本2.36,2.37,2.38,2.39但似乎没有一个与火狐26.0兼容。一旦我试图用2.36到2.39替换selenium 2.35，代码中就
无法点击按钮使用selenium Python网络驱动程序

我试图使用Selenium Webdriver python单击网站上的一个按钮，我看到该按钮高亮显示，但没有使用函数单击。下面是我尝试单击的按钮的html代码我正在尝试使用id单击按钮我还尝试了xpath，得到了相同的结果
硒网络驱动程序不读取 CSV 文件使用 CSVReader

我正在使用Chrome Webdriver执行Salesforce页面流的脚本。这些流用Selenium JUnit代码编写，在JMeter 5.4.1中作为JAR (JUnit请求采样器)导出和执行。该页面有一个带有文本框的弹出窗口。它应该从一个CSV文件(当前保存在Selenium项目中)中逐个读取所有值[例如，value1，value2...值n] (1列，“n”行)，直到所有值都结束。输入
我可以读取浏览器URL使用selenium网络驱动程序？

我在用蟒蛇2。7带有。现在在我的webautomation脚本中，我将打开链接或URL并进入主页。现在我需要点击一些锚定标签来浏览其他页面。我一直到现在。现在，当我要进入一个新页面时，我需要从浏览器中获取新的，因为我需要将其传递给，以便进行网页抓取。所以现在我关心的是如何以动态的方式获得这样的URL？如果有，请咨询！
使用selenium python网页驱动滚动网页

我正在抓取这个网页的用户名，在滚动后加载用户指向页面的Url:“http://www.quora.com/Kevin-Rose/followers" 我知道页面上的用户数（本例中的用户数为43812），如何滚动页面直到加载所有用户？我在互联网上搜索过同样的代码，在任何地方我都能找到几乎相同的代码行： driver.execute_script（"window.scroll至（0）"）如何确定垂
使用硒网络驱动程序导航网站

我的目标是使用硒为Python自动在线账单支付。使用以下代码使用 Web 驱动程序登录成功：登录后，一个新的页面加载，我的下一步是点击一个链接。代码: 什么也没发生。没有导航到该法案但仍然没有。我还应该尝试其他什么？错误： Traceback（最近调用的最后一次）：File"/home/队长/. PyCharmEdu30/config/划痕/scratch_1.py"，第12行，在clic

无法使用Selenium网络驱动程序从网页读取文本

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档