使用正则表达式去除html文本中的的所有js脚本

来源:csdn博客 分类: 文章浏览史 发布时间:2020-04-15 10:49:31 最后更新:2020-04-15 浏览:146
转载声明:
本文为摘录自“csdn博客”,版权归原作者所有。
温馨提示:
为了更好的体验,请点击原文链接进行浏览
摘录时间:
2020-04-15 10:49:31

代码如下:

<?php

$html = <<<LABLE
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>使用HTML5 clearRect()擦除指定的矩形区域的入门示例</title>
</head>
<body>

<!-- 添加canvas标签,并加上红色边框以便于在页面上查看 -->
<canvas id="myCanvas" width="400px" height="300px" style="border: 1px solid red;">
您的浏览器不支持canvas标签。
</canvas>

<script type="text/javascript">
//获取Canvas对象(画布)
var canvas = document.getElementById("myCanvas");
//简单地检测当前浏览器是否支持Canvas对象,以免在一些不支持html5的浏览器中提示语法错误
if(canvas.getContext){
    //获取对应的CanvasRenderingContext2D对象(画笔)
    var ctx = canvas.getContext("2d");

    //绘制一个以坐标点(100,10)为圆心、半径为50px的圆形
    ctx.arc(100, 100, 50, 0, Math.PI * 2, false);

    //绘制并填充圆形内部
    ctx.fill();

    ctx.clearRect(90, 90, 20, 20);
}
</script>
</body>
</html>
LABLE;

//$html = 'HHHHHHHHHHHHHH<script>jjjjjjjjjjjjjj</script>';

$pattern = '/<script.*>(\n.*)+<\/script>/';

preg_match($pattern, $html, $matches);

print_r($matches);

$res = preg_replace($pattern, '', $html);

print_r($res);

输出结果如下:


Array
(
    [0] => <script type="text/javascript">
//获取Canvas对象(画布)
var canvas = document.getElementById("myCanvas");
//简单地检测当前浏览器是否支持Canvas对象,以免在一些不支持html5的浏览器中提示语法错误
if(canvas.getContext){
    //获取对应的CanvasRenderingContext2D对象(画笔)
    var ctx = canvas.getContext("2d");

    //绘制一个以坐标点(100,10)为圆心、半径为50px的圆形
    ctx.arc(100, 100, 50, 0, Math.PI * 2, false);

    //绘制并填充圆形内部
    ctx.fill();

    ctx.clearRect(90, 90, 20, 20);
}
</script>
    [1] => 

)



<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>使用HTML5 clearRect()擦除指定的矩形区域的入门示例</title>
</head>
<body>

<!-- 添加canvas标签,并加上红色边框以便于在页面上查看 -->
<canvas id="myCanvas" width="400px" height="300px" style="border: 1px solid red;">
您的浏览器不支持canvas标签。
</canvas>


</body>
</html>

 

 

使用正则表达式匹配的技巧是:由简到难,先匹配到其中比较简单的字符串,然后在不断的完善正则表达式,知道完全匹配需要的字符。

php技术微信