当前位置：首页 > 面试题库 >

在php中解析极大的XML文件

郎永福

2023-03-14

问题内容：

我需要解析大小为40GB的XML文件，然后进行规范化，然后插入到MySQL数据库中。我尚不清楚需要在数据库中存储多少文件，我也不知道XML结构。

我应该使用哪个解析器，您将如何进行呢？

问题答案：

在PHP中，您可以使用XMLReader Docs 读取超大型XML文件：

$reader = new XMLReader();
$reader->open($xmlfile);

特大XML文件应以压缩格式存储在磁盘上。至少这是有道理的，因为XML文件具有很高的压缩率。例如，像gzip一样large.xml.gz。

PHP XMLReader通过压缩包装器
Docs
很好地支持了这一点：

$xmlfile = 'compress.zlib://path/to/large.xml.gz';

$reader = new XMLReader();
$reader->open($xmlfile);

将XMLReader允许您将当前元素“唯一”上运行。这意味着它仅向前。如果需要保持解析器状态，则需要自己构建它。

我经常发现将基本动作包装到一组迭代器中很有帮助，这些迭代器知道如何XMLReader像仅通过元素或子元素进行迭代那样进行操作。您可以在使用PHP和XMLReader解析XML中找到概述。

另请参阅：

PHP打开压缩的XML

类似资料：

用PHP解析巨大的XML文件

问题内容：我正在尝试将DMOZ内容/结构XML文件解析为MySQL，但是所有现有的脚本都已经很老了并且不能很好地工作。如何在PHP中打开大型（+ 1GB）XML文件进行解析？问题答案：只有两个php API真正适合处理大文件。第一个是旧的expatapi，第二个是较新的XMLreader函数。这些api读取连续流，而不是将整个树加载到内存中（这是simplexml和DOM所做的）。例如，您
在JAVA中解析大型XML文档

问题内容：我有以下问题：我有一个XML文件（大约1GB），并且必须上下迭代（即不连续；一个接一个），以便获取所需的数据并对其进行一些操作。最初，我使用了DOM Java包，但是很显然，在解析XML文件时，JVM达到了其最大堆空间并停止了运行。为了解决这个问题，我想到的解决方案之一是找到另一个解析器，该解析器迭代XML中的每个元素，然后将其内容存储在硬盘上的临时SQLite数据库中。因此，通过
使用VTD-XML解析巨大的XML文件

为了在巨大的xml文件中执行XPATH查询，我阅读了许多喜欢VTD-xml的文章，因此我复制了这些文章中的代码：但当我运行它时没有结果，所以这意味着XML文件没有映射到内存中。。。我的问题是如何在VTD-xml中强制映射xml文件？
大型文件的Java XML解析器

问题内容：我需要一个XML解析器来解析大约1.8 GB的文件。因此，解析器不应将所有文件加载到内存中。有什么建议？问题答案：除了推荐的SAX解析之外，您还可以使用JDK（包javax.xml.stream）中包含的StAX API（一种SAX演进）。 StAX项目主页：http：//stax.codehaus.org/Home 简介：http : //www.xml.com/pub/a/
如何在Java中解析大（50 GB）XML文件

问题内容：目前，我正在尝试使用SAX解析器，但是通过文件它大约3/4完全冻结了，我尝试分配更多的内存等，但没有得到任何改善。有什么办法可以加快速度吗？更好的方法？剥开它的骨头，所以我现在有了以下代码，并且在命令行中运行时，它的运行速度还没有达到我想要的速度。使用“ java -Xms-4096m -Xmx8192m -jar reader.jar”运行它，得到的GC开销限制超出了文章700
解析极大的Excel 2007文件的最佳语言

问题内容：我的老板习惯于对我们的数据库执行查询，该查询返回数万行并将其保存到excel文件中。作为实习生，我经常不得不编写脚本来处理这些文件中的信息。到目前为止，我已经为满足脚本需求尝试了VBScript和Powershell。这两个过程都可能需要几分钟才能执行，即使是最简单的任务，这也意味着该脚本完成后将需要8小时的大部分时间。我现在的解决方法是编写一个PowerShell脚本，该脚本从xl

相关阅读

解析极大的Excel 2007文件的最佳语言用PHP解析XML 在Jenkins管道中解析XML文件在Java中使用SAX解析大型XML 使用vtd-xml解析xml文件

相关文章

Java DOM解析器解析XML文档 XML 解析器 Java XML解析器 Java DOM4J解析器修改XML文档 Java DOM4J解析器创建XML文档

相关问答

解析Junit xml文件使用vtd-xml解析xml文件 php解析xml格式的数据 PHP在解析XML时缺少属性复杂XML文件的解析器

相关工具

简单xml解析demo IOS中解析并显示Gif文件极点CMS 极致CMS 太极语言

相关文档

Java XML 中文文档 XML 中文教程 Elasticsearch-PHP 中文文档 PHP-X 中文文档资源大全中文版