解决preg_match匹配过多字符长度的限制的思路分析

网络编程 2021-07-05 10:07www.168986.cn编程入门
今天在写采集程序的时候,使用到了preg_match,有几个页面始终采集不下来。反复看了N遍的正则,没有发现有问题。于是开始怀疑preg_match是否对匹配的字符串有长度限制
官方的文档里面没有说明这一点。

于是开始测试将要匹配的字串不断缩短,直到缩为原来1/5的时候可以正常匹配了,所以更加确定了。

到google里一搜,终于找到了解决方案在php.ini中加入(随便放到哪里,我是直接放第一行的)

pcre.backtrack_limit=-1

使用preg_match函数测试一下,大概1300多行上万个字符的字符串也能够匹配了。

项目中,用preg_match正则提取目标内容,死活有问题,代码测得死去活来。

后来发现“pcre.backtrack_limit ”的值默认只设了100000。

解决办法ini_set(‘pcre.backtrack_limit', 999999999);

注这个参数在php 5.2.0版本之后可用。

说说关于pcre.recursion_limit

pcre.recursion_limit是PCRE的递归限制,这个项如果设很大的值,会消耗所有进程的可用堆栈,导致PHP崩溃。

也可以通过修改配置来限制ini_set(‘pcre.recursion_limit', 99999);

实际项目应用中,最好也对内存进行限定设置ini_set(‘memory_limit', '64M'); , 这样就比较稳妥妥嘎。

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by