我无法从以下网页中读取电子邮件id:
网址:https://targetstudy.com/university/2/acharya-ng-ranga-agricultural-university/
这是我的代码
driver.navigate().to(URL);
String Email = driver.findElement(By.xpath("//*[@id="site-canvas"]/div[6]/div[2]/div[1]/div/div[1]/div/table/tbody/tr/td[2]/table/tbody/tr[4]/td[2]/img")).getText();
System.out.println(Email);
在这种情况下,单靠硒并不能帮助您,尽管您的绑定语言可以帮助您。
您需要Java Tesseract API。
提取文本的代码:
public String getImgText(String imageLocation) {
ITesseract instance = new Tesseract();
try
{
String imgText = instance.doOCR(new File(imageLocation));
return imgText;
}
catch (TesseractException e)
{
e.getMessage();
return "Error while reading image";
}
}
如果您在项目中使用maven,只需添加此依赖项:
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.2.1</version>
</dependency>
更多参考:从图像中提取文本
在升级到firefox 26.0之前,我在firefox的早期版本中使用了selenium 2.35。以前我的测试运行得很好,但现在我得到了以下错误。 我试图降级火狐的版本,但无法从mozilla网站获得任何以前的版本。 我还尝试了所有的selenium版本2.36,2.37,2.38,2.39但似乎没有一个与火狐26.0兼容。一旦我试图用2.36到2.39替换selenium 2.35,代码中就
我试图使用Selenium Webdriver python单击网站上的一个按钮,我看到该按钮高亮显示,但没有使用函数单击。 下面是我尝试单击的按钮的html代码 我正在尝试使用id单击按钮 我还尝试了xpath,得到了相同的结果
我正在使用Chrome Webdriver执行Salesforce页面流的脚本。这些流用Selenium JUnit代码编写,在JMeter 5.4.1中作为JAR (JUnit请求采样器)导出和执行。该页面有一个带有文本框的弹出窗口。它应该从一个CSV文件(当前保存在Selenium项目中)中逐个读取所有值[例如,value1,value2...值n] (1列,“n”行),直到所有值都结束。输入
我在用蟒蛇2。7带有。现在在我的webautomation脚本中,我将打开链接或URL并进入主页。现在我需要点击一些锚定标签来浏览其他页面。我一直到现在。现在,当我要进入一个新页面时,我需要从浏览器中获取新的,因为我需要将其传递给,以便进行网页抓取。所以现在我关心的是如何以动态的方式获得这样的URL? 如果有,请咨询!
我正在抓取这个网页的用户名,在滚动后加载用户 指向页面的Url:“http://www.quora.com/Kevin-Rose/followers" 我知道页面上的用户数(本例中的用户数为43812),如何滚动页面直到加载所有用户?我在互联网上搜索过同样的代码,在任何地方我都能找到几乎相同的代码行: driver.execute_script("window.scroll至(0)") 如何确定垂
我的目标是使用硒为Python自动在线账单支付。 使用以下代码使用 Web 驱动程序登录成功: 登录后,一个新的页面加载,我的下一步是点击一个链接。代码: 什么也没发生。没有导航到该法案 但仍然没有。我还应该尝试其他什么? 错误: Traceback(最近调用的最后一次):File"/home/队长/. PyCharmEdu30/config/划痕/scratch_1.py",第12行,在clic