js正则匹配table,img及去除各种标签问题

网络编程 2021-07-05 10:07www.168986.cn编程入门
这篇文章主要介绍了js正则匹配table,img及去除各种标签问题,需要的朋友可以参考下

核心代码

//获取公示栏内容
     s = "$row.detail$";
     mainContent =s;
     
     //如果有多个table使用狼蚁网站SEO优化注释的正则只会匹配成一个table
     //var tabReg = /<table[^>]>((?!table).)<\/table>/gi;
    //匹配单个table
     var tabReg = /<table[^>]>\s(<tbody[^>]>)?(\s<tr[^>]>[\s\S]?<\/tr>\s)(<\/tbody>)?\s<\/table>/gi;
     var tabMatch = tabReg.test(s);
     
     var tabMatchContentArray = s.match(tabReg);
 
     if(tabMatch)
     {
      
      mainContent = s.replace(tabReg,"#");
     }
     
     //对img标签进行匹配
     var imgReg = /<img.?(?:>|\/>)/gi;
     
     imgMatchContentArray = s.match(imgReg);
    
     if(imgReg.test(s))
     {
      //将img标签替换为
      mainContent = mainContent.replace(imgReg,"");
     }
     //处理html标签
     mainContent = mainContent.replace(/&nbsp;/gi," ");
     var pReg1 = /<p>/gi;
     var pReg2 = /<\/p>/gi;
     mainContent = mainContent.replace(pReg1,"").replace(pReg2,"<br />");
     //狼蚁网站SEO优化的htmlReg1 ,htmlReg2可以匹配任意标签
//     var htmlReg1 =/<[^>]+>/gi;
//     var htmlReg2 =/<(.+?)[\s]\/?[\s]>/gi;
//     
//     mainContent = mainContent.replace(htmlReg1,"").replace(htmlReg2,"");
     //mainContent = mainContent.replace(/&/gi,"<p>").replace(/@/gi,"</p>");
    var pageIndex = 1;
    var size = 500;
    var tableContentArray = mainContent.split("#");
    var array = []; //存放以table分割后的数组中每个数组可以分作几页
    
    var arrayIndex = []; //存放table在内容中的索引
    
    var len =0;
    for(var i=0;i<tableContentArray.length;i++)
    {
      var con = tableContentArray[i];
      
      len += con.length;
      
      arrayIndex[i] = len;
      
      array[i] = Math.ceil(con.length /size);
    }
    
    
    var tableIndexArray = [];//存放table内容页码数
    
    var sum = 1;
    
    for(var j=0;j<array.length-1;j++)
    {
      
      sum += array[j];
      tableIndexArray[j] = sum;
    }
    
    
    var currentPageContent = mainContent.substr((pageIndex-1)size,size);
    
    
    if(tableIndexArray.indexOf(pageIndex) >= 0)
    {
      currentPageContent = tabMatchContentArray[tableIndexArray.indexOf(pageIndex)];
    }
    
    
    if(currentPageContent.indexOf("#")!= -1)
    {
      
      var beginToCurrentPageContent = mainContent.substr(0,pageIndexsize);      
      var tabLastIndex = beginToCurrentPageContent.lastIndexOf("#");
      currentPageContent = currentPageContent.substr(0,tabLastIndex-(pageIndex-1)size);
 
      //当前页是否有  获取一个  的位置 
      var indexOf = currentPageContent.indexOf("");
      
      if(indexOf >= 0)
      {         
         //获取开始到当前页位置的内容 中的  的的下标 
         var reCount = beginToCurrentPageContent.split("").length - 1;
          
         var contentArray = currentPageContent.split("");
         
         currentPageContent = replaceImgContent(contentArray,reCount,imgMatchContentArray);  
      }
        
    }
    else
    {
      
      //当前页是否有  获取一个  的位置 
      var indexOf = currentPageContent.indexOf("");
      
      if(indexOf >= 0)
      {
         //获取从开始位置到当前页位置的内容
         var beginToCurrentPageContent = mainContent.substr(0,pageIndexsize);
         
         //获取开始到当前页位置的内容 中的  的的下标 
         var reCount = beginToCurrentPageContent.split("").length - 1;
          
         var contentArray = currentPageContent.split("");
         
         currentPageContent = replaceImgContent(contentArray,reCount,imgMatchContentArray);
         
      }
      
    }
    
    if(currentPageContent=="")
    {
      alert("页码数超过范围");
    }
    else
    { 
      document.getElementById("annouContent").innerHTML= currentPageContent;
    }
    
    / currentArray:当前页以  分割后的数组
      replaceCount:从开始内容到当前页的内容  的个数
      matchArray  img标签的匹配的内容
    /
    function replaceImgContent(currentArray,replaceCount,matchArray)
    {      
      var result = "";
      for(var i=currentArray.length -1,j = replaceCount-1 ;i>=1; i--)
      {        
        var temp = (matchArray[j] + currentArray[i]);
        result = temp + result;
        j--;
      }      
      result = currentArray[0] + result ;      
      return result;
    }    
  </script>

狼蚁网站SEO优化是一些补充

js正则匹配删除table

var reg = /<[\/](table|td|tr)[ a-zA-z=''""]>|123/g

一个JAVASCRIPT正则表达式,Table中只保留ColSpan和RowSpan

html = html.replace(/<(TBODY|THEAD|TFOOT|TH|TR|TD)[^>]?(ColSpan\s=\s["']?[^"'>\s]["']?[^>]?)?(RowSpan\s=\s["']?[^"'>\s]["']?[^>]?)?>/gi,"<$1 $2 $3>");

以上就是js正则匹配table,img及去除各种标签问题的详细内容,更多关于js正则匹配table,img的资料请关注狼蚁SEO其它相关文章!

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by