asp只采集网站可见文本的正则

网络编程 2021-07-05 10:07www.168986.cn编程入门
它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
 
我写的是这样:
Function ClearHTMLCode(originCode)
Dim reg
set reg = new RegExp
reg.IgnoreCase = True
reg.Global = True
reg.Pattern = "(<s+cript(.+?)<\/s+cript>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "(<s+tyle(.+?)<\/s+tyle>)"
originCode= reg.Replace(originCode, "")
reg.Pattern = "<[^>]>"
originCode= reg.Replace(originCode, "")
ClearHTMLCode = originCode
End Function

不过有一些过滤不了!而且速度太慢!

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by