使用正则表达式去除html文本中的的所有js脚本
转载声明:
本文为摘录自“csdn博客”,版权归原作者所有。
温馨提示:
为了更好的体验,请点击原文链接进行浏览
摘录时间:
2020-04-15 10:49:31
代码如下:
<?php
$html = <<<LABLE
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>使用HTML5 clearRect()擦除指定的矩形区域的入门示例</title>
</head>
<body>
<!-- 添加canvas标签,并加上红色边框以便于在页面上查看 -->
<canvas id="myCanvas" width="400px" height="300px" style="border: 1px solid red;">
您的浏览器不支持canvas标签。
</canvas>
<script type="text/javascript">
//获取Canvas对象(画布)
var canvas = document.getElementById("myCanvas");
//简单地检测当前浏览器是否支持Canvas对象,以免在一些不支持html5的浏览器中提示语法错误
if(canvas.getContext){
//获取对应的CanvasRenderingContext2D对象(画笔)
var ctx = canvas.getContext("2d");
//绘制一个以坐标点(100,10)为圆心、半径为50px的圆形
ctx.arc(100, 100, 50, 0, Math.PI * 2, false);
//绘制并填充圆形内部
ctx.fill();
ctx.clearRect(90, 90, 20, 20);
}
</script>
</body>
</html>
LABLE;
//$html = 'HHHHHHHHHHHHHH<script>jjjjjjjjjjjjjj</script>';
$pattern = '/<script.*>(\n.*)+<\/script>/';
preg_match($pattern, $html, $matches);
print_r($matches);
$res = preg_replace($pattern, '', $html);
print_r($res);
输出结果如下:
Array
(
[0] => <script type="text/javascript">
//获取Canvas对象(画布)
var canvas = document.getElementById("myCanvas");
//简单地检测当前浏览器是否支持Canvas对象,以免在一些不支持html5的浏览器中提示语法错误
if(canvas.getContext){
//获取对应的CanvasRenderingContext2D对象(画笔)
var ctx = canvas.getContext("2d");
//绘制一个以坐标点(100,10)为圆心、半径为50px的圆形
ctx.arc(100, 100, 50, 0, Math.PI * 2, false);
//绘制并填充圆形内部
ctx.fill();
ctx.clearRect(90, 90, 20, 20);
}
</script>
[1] =>
)
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>使用HTML5 clearRect()擦除指定的矩形区域的入门示例</title>
</head>
<body>
<!-- 添加canvas标签,并加上红色边框以便于在页面上查看 -->
<canvas id="myCanvas" width="400px" height="300px" style="border: 1px solid red;">
您的浏览器不支持canvas标签。
</canvas>
</body>
</html>
使用正则表达式匹配的技巧是:由简到难,先匹配到其中比较简单的字符串,然后在不断的完善正则表达式,知道完全匹配需要的字符。