php用正则表达式匹配URL的简单方法

网络编程 2021-07-05 09:49www.168986.cn编程入门
使用正则表达式匹配URL的简单方法,提供测试代码

在PHP的官网上看到的parse_url()函数的替代方案。结果和parse_url()函数差不多,是使用正则实现的。URI 是 Web上可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通用资源标志符(Uniform Resource Identifier, 简称"URI")进行定位。 对象分组

代码如下:

^(([^:/?#]+):)?(//([^/?#]))?([^?#])(\?([^#]))?(#(.))?
12            3  4       

测试代码如下
代码如下:

<?php
$search = '~^(([^:/?#]+):)?(//([^/?#]))?([^?#])(\?([^#]))?(#(.))?~i';
$url = 'https://.jb51./pub/ietf/uri/#Gonn';
$url = trim($url);
preg_match_all($search, $url ,$rr);
printf("<p>输出URL数据为</p><pre>%s</pre>\n",var_export( $rr ,TRUE));

/
各分组如下
      $1 = http:
      $2 = http
      $3 = //.nowamagic.
      $4 = .nowamagic.
      $5 = /pub/ietf/uri/
      $6 = <undefined>
      $7 = <undefined>
      $8 = #Gonn
      $9 = Gonn
/
?>


上面的正则表达式可以获取URL中的任何一部分,狼蚁网站SEO优化的代码则简单一些
代码如下:

<?php
// 从 URL 中取得主机名
preg_match("/^(http:\/\/)?([^\/]+)/i", "https://.jb51./index.html", $matches);
$host = $matches[2];
// 从主机名中取得后面两段
preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
echo "domain name is: {$matches[0]}\n";
?>

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by