当前位置: 首页 > 面试题库 >

如何从HTML表格的每个单元格中获取文本?

封德华
2023-03-14
问题内容

在Selenium 2.0中,我不知道如何遍历网页中的HTML表。在selenium2.0 javadoc中,我找到了两个类“ TableFinder”和“
TableCellFinder”,但找不到任何示例。

我想做这样的事情:

RowCount=Get how many rows are there in the html table

for each row of the table
{
   column_count=Get column count
   for each column
   {
      cell_value=get_text_from(row,col);
      Do something with cell_value
   }
}

如何从每个表格单元格中获取文本?


问题答案:

感谢您的早日答复。

我找出了使用硒2.0类的解决方案。

import java.util.List;

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.ie.InternetExplorerDriver;

public class WebTableExample 
{
    public static void main(String[] args) 
    {
        WebDriver driver = new InternetExplorerDriver();
        driver.get("http://localhost/test/test.html");

        WebElement table_element = driver.findElement(By.id("testTable"));
        List<WebElement> tr_collection=table_element.findElements(By.xpath("id('testTable')/tbody/tr"));

        System.out.println("NUMBER OF ROWS IN THIS TABLE = "+tr_collection.size());
        int row_num,col_num;
        row_num=1;
        for(WebElement trElement : tr_collection)
        {
            List<WebElement> td_collection=trElement.findElements(By.xpath("td"));
            System.out.println("NUMBER OF COLUMNS="+td_collection.size());
            col_num=1;
            for(WebElement tdElement : td_collection)
            {
                System.out.println("row # "+row_num+", col # "+col_num+ "text="+tdElement.getText());
                col_num++;
            }
            row_num++;
        } 
    }
}


 类似资料:
  • 我构造了一个从数据帧中提取一行条件: 现在我想从一个特定列中取一个值:

  • 我有一个名为“DocumentContent”的富文本框,我将使用以下代码将其内容添加到pdf中: 问题是,当我打开PDF文件时,内容显示为HTML,而不是如下所示的文本: 但它应该如下所示 我要做的是保留用户应用于富文本的所有样式,并将字体系列更改为Arial。 我可以更改字体系列,但我需要将此内容从超文本标记语言解码为文本。 你能给个建议吗?谢谢

  • 在Java中,我应该得到的输出是

  • 我使用测试框架-https://devexpress.github.io/testcafe. 我编写了以下代码: 如何使用testcafe获取表中所有单元格的文本?

  • 问题内容: 我正在使用apache POI读取Excel文档。至少可以说,到目前为止,它已经可以满足我的目的。但是令我震惊的一件事是将单元格的值提取为HTML。 我有一个单元格,用户将在其中输入一些字符串并应用某种 格式(例如,项目符号/数字/粗体/斜体) 等。 因此,当我阅读它时,内容应为 HTML 格式,而不是POI给出的纯字符串格式。 我几乎遍历了整个POI API,但找不到任何人。我只想保

  • 有人能给我一个解决方案,我可以在单元格为空时读取应用到单元格的样式吗? 谢了。