解决preg_match匹配过多字符长度的限制的思路分析
网络编程 2021-07-05 10:07www.168986.cn编程入门
今天在写采集程序的时候,使用到了preg_match,有几个页面始终采集不下来。反复看了N遍的正则,没有发现有问题。于是开始怀疑preg_match是否对匹配的字符串有长度限制
官方的文档里面没有说明这一点。
于是开始测试将要匹配的字串不断缩短,直到缩为原来1/5的时候可以正常匹配了,所以更加确定了。
到google里一搜,终于找到了解决方案在php.ini中加入(随便放到哪里,我是直接放第一行的)
pcre.backtrack_limit=-1
使用preg_match函数测试一下,大概1300多行上万个字符的字符串也能够匹配了。
项目中,用preg_match正则提取目标内容,死活有问题,代码测得死去活来。
后来发现“pcre.backtrack_limit ”的值默认只设了100000。
解决办法ini_set(‘pcre.backtrack_limit', 999999999);
注这个参数在php 5.2.0版本之后可用。
说说关于pcre.recursion_limit
pcre.recursion_limit是PCRE的递归限制,这个项如果设很大的值,会消耗所有进程的可用堆栈,导致PHP崩溃。
也可以通过修改配置来限制ini_set(‘pcre.recursion_limit', 99999);
实际项目应用中,最好也对内存进行限定设置ini_set(‘memory_limit', '64M'); , 这样就比较稳妥妥嘎。
于是开始测试将要匹配的字串不断缩短,直到缩为原来1/5的时候可以正常匹配了,所以更加确定了。
到google里一搜,终于找到了解决方案在php.ini中加入(随便放到哪里,我是直接放第一行的)
pcre.backtrack_limit=-1
使用preg_match函数测试一下,大概1300多行上万个字符的字符串也能够匹配了。
项目中,用preg_match正则提取目标内容,死活有问题,代码测得死去活来。
后来发现“pcre.backtrack_limit ”的值默认只设了100000。
解决办法ini_set(‘pcre.backtrack_limit', 999999999);
注这个参数在php 5.2.0版本之后可用。
说说关于pcre.recursion_limit
pcre.recursion_limit是PCRE的递归限制,这个项如果设很大的值,会消耗所有进程的可用堆栈,导致PHP崩溃。
也可以通过修改配置来限制ini_set(‘pcre.recursion_limit', 99999);
实际项目应用中,最好也对内存进行限定设置ini_set(‘memory_limit', '64M'); , 这样就比较稳妥妥嘎。
编程语言
- 宿迁百度关键词排名指南:实现精准营销的关键
- 四川SEO优化怎么做网络推广
- 立昂技术备案老域名收购:如何为您的业务赋能
- 安徽百度关键词seo贵不贵,一般需要多少钱
- 吉林百度快照排名怎么做电话营销
- 多伦新手做SEO怎么做
- 甘肃优化关键词排名推广怎么做论坛营销
- 沙雅SEO网站推广:提升您的在线可见性
- 四川SEO优化如何提升销售额和销售量
- 聂荣网站排名优化:提升网站可见性的全方位指
- 涞水SEO:提升地方企业在线可见性的策略
- 辽宁百度seo排名怎样做网站排名
- 临湘哪有关键词排名优化:提升网站可见度的关
- 黑龙江百度网站优化有没有优惠
- 凉城优化关键词排名推广:提升您的网络可见性
- 萝北整站优化:提升您网站流量和排名的全面指