当前位置：首页 > 面试题库 >

在HTML页面中查找所有文本节点

拓拔谭三

2023-03-14

问题内容：

我可以这样做：

function textNodesUnder(root){
  var textNodes = [];
  addTextNodes(root);
  [].forEach.call(root.querySelectorAll('*'),addTextNodes);
  return textNodes;

  function addTextNodes(el){
    textNodes = textNodes.concat(
      [].filter.call(el.childNodes,function(k){
        return k.nodeType==Node.TEXT_NODE;
      })
    );
  }
}

但是，鉴于使用XPath可以简单地查询.//text()并完成它的事实，这似乎是微不足道的。

在IE9 +，Safari5 +，Chrome19+，Firefox12+，Opera11+上运行的HTML文档中，在特定元素下获取所有文本节点的最简单方法是什么？

“最简单”被粗略地定义为“高效而又短，没有打高尔夫球”。

问题答案：

根据@kennebec的回答，该逻辑的实现略为严格：

function textNodesUnder(node){
  var all = [];
  for (node=node.firstChild;node;node=node.nextSibling){
    if (node.nodeType==3) all.push(node);
    else all = all.concat(textNodesUnder(node));
  }
  return all;
}

但是，使用的速度更快，更紧密，更美观createTreeWalker，因此浏览器会为您过滤掉除文本节点以外的所有内容：

function textNodesUnder(el){
  var n, a=[], walk=document.createTreeWalker(el,NodeFilter.SHOW_TEXT,null,false);
  while(n=walk.nextNode()) a.push(n);
  return a;
}

类似资料：

使用Selenium 2在页面上查找文本

问题内容：如何使用Selenium检查当前页面上是否存在给定的文本字符串？问题答案：代码是这样的：
递归查找目录中的所有文本文件

问题内容：我正在尝试获取目录中所有文本文件的名称。如果目录中包含子目录，那么我也想在这些子目录中获取任何文本文件。我不确定如何继续执行任意数量的子目录。现在，下面的代码仅获取当前目录中的所有文本文件以及该目录中的子目录。对于找到的每个子目录，它还会找到任何文本文件和更深的子目录。问题是，如果那些更深的子目录还有更深的子目录，那么我找不到所有的文本文件。这似乎是一个需要递归的问题，因为我不知道它
使用BeautifulSoup在confluence HTML中查找文本标记

我正试图用漂亮的汤刮一个汇合页的身体。当使用Confluence API时，我会得到以下正文（这只是其中的一部分）：我已经搜索了我的屁股，但不知何故，我似乎不明白如何搜索一个段落与特定的文本。另一件我认识但不明白的事情是：当我使用:搜索所有段落时，我会找到该段落，但它包含了所有子元素的所有文本，因此段落文本如下所示：“System Status：GreenIN Operation”
preg_match和RegEx从HTML页面中查找数字

使用preg_match函数，我想从下面的html字符串中找到数字30899。我使用了下面一行代码: 它没有返回任何匹配的字符串，尽管$data在这里有30899。 $data变量如下: 虽然我早些时候解决了这类问题，但我找不到如何从这个字符串中找到这些数字的方法。我相信专家能很快找到解决办法。
所有HTML节点到XPATH

我正在尝试将所有超文本标记语言节点转换为XPATH这是一个示例输入。基于超文本标记语言，我正在寻找所有子节点的所有XPATH 我想要的输出我目前拥有的代码如果你们能给我指出正确的方向，任何帮助都会很好我确实研究了Lxml bs4和硒，但不幸的是没有运气
在Elasticsearch中查找并替换所有文档

问题内容：我想替换所有我的Elasticsearch索引文档中的单个用户名。是否有API查询？我尝试搜索多个但找不到。有人知道吗？我的情况：我在名为“ test”的索引中具有上述数据，并键入“ movies”。在这里，我想用“ alice”代替所有的“ bob”名称。谢谢问题答案：通过查询更新是解决之道。注意：请确保启用动态脚本，以使其起作用。

相关阅读

单击时选择HTML文本输入中的所有文本如何在Linux上查找所有包含特定文本的文件？在当前目录中查找所有可写文件使用.htaccess使所有.html页面作为.php文件运行？在Java类中查找所有依赖项

相关文章

中金所技术有限公司（Java一面）HTML 速查列表面试从此Easy：一文帮你搞定所有的HR面和主管面中金所java面试中金所java一面

相关问答

Java regex，在里面查找文本使用python查找pdf文档中搜索字符串所在的页面在文档的页面上查找单词在运行脚本的页面上查找XPath Xcode在所有项目文件中查找和替换

相关工具

获取网页的所有图片点击查看网页中图片解析html网页的数据 Marlin 中文版本 LCD ios所支持的所有字体

相关文档

好用的中文速查表 Python 文本处理 LCUI 图形界面开发库中文帮助文档小能在线客服官方中文文档 HTML 宝典