当前位置: 首页 > 面试题库 >

file_get_contents => PHP致命错误:允许的内存耗尽

郤浩慨
2023-03-14
问题内容

我没有处理大文件的经验,所以我不确定该怎么办。我试图使用 file_get_contents 读取几个大文件;任务是使用
preg_replace() 清洁和修补它们。

我的代码在小文件上运行良好;但是,大文件(40 MB)触发内存耗尽错误:

PHP Fatal error:  Allowed memory size of 16777216 bytes exhausted (tried to allocate 41390283 bytes)

我当时在考虑使用 fread(), 但是我不确定那也行。有解决此问题的方法吗?

感谢您的输入。

这是我的代码:

<?php
error_reporting(E_ALL);

##get find() results and remove DOS carriage returns.
##The error is thrown on the next line for large files!
$myData = file_get_contents("tmp11");
$newData = str_replace("^M", "", $myData);

##cleanup Model-Manufacturer field.
$pattern = '/(Model-Manufacturer:)(\n)(\w+)/i';
$replacement = '$1$3';
$newData = preg_replace($pattern, $replacement, $newData);

##cleanup Test_Version field and create comma delimited layout.
$pattern = '/(Test_Version=)(\d).(\d).(\d)(\n+)/';
$replacement = '$1$2.$3.$4      ';
$newData = preg_replace($pattern, $replacement, $newData);

##cleanup occasional empty Model-Manufacturer field.
$pattern = '/(Test_Version=)(\d).(\d).(\d)      (Test_Version=)/';
$replacement = '$1$2.$3.$4      Model-Manufacturer:N/A--$5';
$newData = preg_replace($pattern, $replacement, $newData);

##fix occasional Model-Manufacturer being incorrectly wrapped.
$newData = str_replace("--","\n",$newData);

##fix 'Binary file' message when find() utility cannot id file.
$pattern = '/(Binary file).*/';
$replacement = '';
$newData = preg_replace($pattern, $replacement, $newData);
$newData = removeEmptyLines($newData);

##replace colon with equal sign
$newData = str_replace("Model-Manufacturer:","Model-Manufacturer=",$newData);

##file stuff
$fh2 = fopen("tmp2","w");
fwrite($fh2, $newData);
fclose($fh2);

### Functions.

##Data cleanup
function removeEmptyLines($string)
{
        return preg_replace("/(^[\r\n]*|[\r\n]+)[\s\t]*[\r\n]+/", "\n", $string);
}
?>

问题答案:

首先,您应该了解,在使用file_get_contents时,您将整个数据字符串提取到一个 变量中 ,该 变量 存储在主机内存中。

如果该字符串大于专用于PHP进程的大小,则PHP将停止并显示上面的错误消息。

解决此问题的方法是将文件作为指针打开,然后一次取一个块。这样,如果您有一个500MB的文件,则可以读取前1MB的数据,对其进行处理,然后从系统内存中删除该1MB,然后用下一个MB替换它。这使您可以管理要在内存中放入多少数据。

如果可以在下面看到一个示例,我将创建一个类似于node.js的函数

function file_get_contents_chunked($file,$chunk_size,$callback)
{
    try
    {
        $handle = fopen($file, "r");
        $i = 0;
        while (!feof($handle))
        {
            call_user_func_array($callback,array(fread($handle,$chunk_size),&$handle,$i));
            $i++;
        }

        fclose($handle);

    }
    catch(Exception $e)
    {
         trigger_error("file_get_contents_chunked::" . $e->getMessage(),E_USER_NOTICE);
         return false;
    }

    return true;
}

然后像这样使用:

$success = file_get_contents_chunked("my/large/file",4096,function($chunk,&$handle,$iteration){
    /*
        * Do what you will with the {$chunk} here
        * {$handle} is passed in case you want to seek
        ** to different parts of the file
        * {$iteration} is the section of the file that has been read so
        * ($i * 4096) is your current offset within the file.
    */

});

if(!$success)
{
    //It Failed
}

您会发现的问题之一是,您试图对非常大的数据执行几次正则表达式。不仅如此,您的正则表达式还可以匹配整个文件。

使用上述方法,您的正则表达式可能会变得无用,因为您可能只匹配一半的数据。您应该做的就是还原为本地字符串函数,例如

  • strpos
  • substr
  • trim
  • explode

为了匹配字符串,我在回调中添加了支持,以便传递句柄和当前迭代。这将允许您与档案工作直接在回调中,让您使用类似功能fseekftruncatefwrite实例

构建字符串操作的方式无论如何都不是很有效,而使用上面提出的方法到目前为止是一种更好的方法。

希望这可以帮助。



 类似资料:
  • 我有并且有函数,此函数返回视图名称。 此视图包含大量详细信息,通常会有10到15组(行)详细信息显示在页面上(详细信息来自使用table的数据库)。 它的工作正常,但在某些情况下,当用户详细信息去30到35套(行),我得到下面的错误在error_log文件 PHP致命错误:允许内存大小为33554432字节耗尽(尝试分配5896720字节)在 /laravel/framework/src/Illu

  • 以下是完整的错误: 致命错误:允许内存大小为134217728字节耗尽(尝试分配131072字节) /sites/apps/seller/www/application/libraries/Excel/PHPExcel/CachedObjectStorage/CacheBase.php行173 这是mu代码: 我使用codeigniter框架和phpexcel库。非常感谢。

  • 问题内容: 我目前在设置AS400(iseries V6R1)和Debian之间的odbc链接时遇到一些问题,我使用iseriesAccess7.1 odbc驱动程序64位,unixODBC2.3.1和php5.4以及unixODBC支持。 我的链接似乎很好,因为我可以使用isql命令(它是unixODBC的一部分)连接到我的数据库,并执行一些SQL查询,但是使用php脚本无法读取数据库中的记录。

  • 我正在使用PHPExcel库读写excel文件excel2007格式。这些不是很大的excel文件,只有大约120行和20列。当我运行在我的专用服务器它显示错误如下... 这是我的代码...我正在使用内存缓存技术... 我已经检查了PHPExcel_设置的返回值。。这是真的。。 请帮我解决这个问题。。。我已经尝试了这里所有的答案。。。没什么能帮我解决的。。

  • 我正在使用phpspreadsheet,我想修改一个有4张表的xlsx文件。我只想在2张表中插入数据,但我想将所有4张表复制到新的xlsx文件中。当我这样做时,我会得到以下错误: 编辑:我已经尝试用下面的代码复制我不需要编辑的工作表: 但现在我得到另一个错误: 致命错误:未捕获错误:调用C:\xampp\htdocs\offerconfigurator\vendor\phpoffice\phpsp

  • 我正在尝试运行artisan make:controller。 我有一个问题: 我试图增加