如何取得中文字符串中出现次数最多的子串

网络编程 2021-07-05 09:49www.168986.cn编程入门
以下是对取得中文字符串中出现次数最多的子串的实现代码进行了详细的分析介绍,需要的朋友可以过来参考下

直接上代码,子串的长度可自己设置(比如连续4个字符的或5个字符的)。

代码如下:

$str ='我是中国人我是外国人我是韩国人我是美国人我是中国人我是英国人我是中国人我是外国人';
Count_string($str,5);
function Count_string($sstr,$length)
{
 $t_tmp = 0;
 $t = 0;
 $str = '';
 $str_tmp = array();
 $str_arr = array();
 mb_internal_encoding("gb2312");
 $max_length = (mb_strlen($sstr)-$length);

 //取得子串集
 for($i=0;$i<=$max_length;$i++)
 {
  $str_tmp[] =  mb_substr($sstr, $i, $length);
 }
 //去除重复子串
 $str_tmp = array_unique($str_tmp);

 //计算出现次数
 foreach($str_tmp as $key=>$value)
 {
  $t_tmp = mb_substr_count($sstr,$value);
  if($t_tmp>=$t)
  {
   $t = $t_tmp;
   $str_arr[$value] = $t;   
  }
 }

 //处理出现多重结果
 foreach($str_arr as $key=>$value)
 {
  if($value == $t)
  {$str .=$key."<br>";}
 }

 echo '出现最多的子串是:<br>'.$str.'<br>出现次数:'.$t;
}

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by