过滤script 代码和HTML代码的正则表达式

下面介绍如何利用正则表达式来过滤Html代码中的JavaScript脚本和Html标记,防止恶意代码执行,获取干净的网页内容。

1、过滤替换内容中的JS (Javascript)代码
这个代码的作用是去掉用<script  和</script>标记之间包含的所有内容。根据实际需要,它也许不能满足要求。如果用在屏蔽客户提交代码的地方,应保证这一步在最后执行。有些人还会拼凑这样的标记,应小心。

<%
Function ClearJSCode(StrCon)
Dim reg
set reg = New RegExp
reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
reg.IgnoreCase = True
reg.Global = True
clearJSCode = reg.Replace(StrCon, "")
End Function
%>


2、过滤替换内容中的HTML代码
这个代码的作用是过滤< 和 >之间的HTML标记
<%
Function ClearHTMLCode(StrCon)
Dim reg
set reg = new RegExp
reg.Pattern = "<[^>]*>"
reg.IgnoreCase = True
reg.Global = True
ClearHTMLCode = reg.Replace(StrCon, "")
End Function
%>


[本日志由 cnfgg 于 2009-07-28 02:36 PM 编辑]
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: script 代码 正则表达式
相关日志:
评论: 0 | 引用: 0 | 查看次数: -
发表评论
昵 称:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.