php读取远程gzip压缩网页的方法

网络编程 2021-07-05 09:50www.168986.cn编程入门
这篇文章主要介绍了php读取远程gzip压缩网页的方法,当站点使用gzip压缩时,使用常规的远程获取方法会得到乱码结果,使用本文方法即可解决这个问题,需要的朋友可以参考下

今天在调取一家商城的页面信息时候,使用file_get_contents抑或curl


代码如下:

$url = 'http://.xxx./21/?type=23′; 
$temp = file_get_contents($url); 
echo $temp;


都得到一片乱码,查看了许多内容,包括页面的header信息,发现原来页面使用了。

 

 

类似的信息,即Content-Encoding为gzip,即该站点开启了gzip压缩。这里的解决方案有多种,如果你使用file_get_contents的话,可以这样修改

 

代码如下:

file_get_contents("press.zlib://".$url);

或者使用curl来完成


代码如下:

function curl_get($url, $gzip=false){  
        $curl = curl_init($url);  
        curl_set($curl, CURLOPT_RETURNTRANSFER, 1);  
        curl_set($curl, CURLOPT_CONNECTTIMEOUT, 10);  
        if($gzip) curl_set($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里  
        $content = curl_exec($curl);  
        curl_close($curl);  
        return $content;  

,参考手册上面的解法,还可以对保存gzip类型的字符串进行处理如下

代码如下:

function gzdecode($data){  
    $g=tempnam(‘/tmp','ff');  
    @file_put_contents($g,$data);  
    ob_start();  
    readgzfile($g);  
    $d=ob_get_clean();  
    return $d;  
}

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by