0

0

html标签闭合检测与修复

php中文网

php中文网

发布时间:2016-07-25 09:01:09

|

1831人浏览过

|

来源于php中文网

原创

html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整
  1. $str = '
  2. html标签闭合检测与修复
  3. content
    • ExcelFormulaBot
      ExcelFormulaBot

      在AI帮助下将文本指令转换为Excel函数公式

      下载
    • content full
    • this is content
    • this is content
    • This is cont
    • This is content
  4. this is content';
  5. $str_len = strlen($str);
  6. //记录起始标签
  7. $pre_data = array();
  8. //记录起始标签位置
  9. $pre_pos = array();
  10. $last_data = array();
  11. $error_data = array();
  12. $error_pos = array();
  13. $i = 0;
  14. //标记为
  15. $start_flag = false;
  16. while( $i
  17. if($str[$i]=="
  18. $i++;
  19. $_tmp_str = '';
  20. //标记为
  21. $start_flag = true;
  22. //标记空白
  23. $space_flag = false;
  24. while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='"' && $str[$i] !='/' && $i
  25. if($str[$i]==' ') {
  26. $space_flag = true;
  27. }
  28. if(!$space_flag) {
  29. $_tmp_str .= $str[$i];
  30. }
  31. $i++;
  32. }
  33. $pre_data[] = $_tmp_str;
  34. $pre_pos[] = $i;
  35. } else if ($str[$i]=="
  36. $i += 2;
  37. $_tmp_str = '';
  38. while($str[$i]!=">" && $i
  39. $_tmp_str .= $str[$i];
  40. $i++;
  41. }
  42. $last_data[] = $_tmp_str;
  43. //查看开始标签的上一个值
  44. if(count($pre_data)>0) {
  45. $last_pre_node = getLastNode($pre_data, 1);
  46. if($last_pre_node == $_tmp_str) {
  47. //配对上, 删除对应位置的值
  48. array_pop($pre_data);
  49. array_pop($pre_pos);
  50. array_pop($last_data);
  51. } else {
  52. //没有配对上, 有两种情况
  53. //情况一: 只有闭合标签, 没有开始标签
  54. //情况二:只有开始标签, 没有闭合标签
  55. array_pop($last_data);
  56. $error_data[] = $_tmp_str;
  57. $error_pos[] = $i;
  58. }
  59. } else {
  60. array_pop($last_data);
  61. $error_data[] = $_tmp_str;
  62. $error_pos[] = $i;
  63. }
  64. }else if ($str[$i]=="
  65. $i++;
  66. while($i
  67. if($str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") {
  68. $i++;
  69. break;
  70. } else {
  71. $i++;
  72. }
  73. }
  74. $i++;
  75. }else if($str[$i]=='/' && $str[$i+1]=='>') {
  76. //跳过自动单个闭合标签
  77. if($start_flag) {
  78. array_pop($pre_data);
  79. array_pop($pre_pos);
  80. $i+=2;
  81. }
  82. }else if($str[$i]=="/" && $str[$i+1]=="*"){
  83. $i++;
  84. while($i
  85. if($str[$i]=="*" && $str[$i+1]=="/") {
  86. $i++;
  87. break;
  88. } else {
  89. $i++;
  90. }
  91. $i++;
  92. }
  93. }else if($str[$i]=="'"){
  94. $i++;
  95. while($str[$i]!="'" && $i
  96. $i++;
  97. }
  98. $i++;
  99. } else if($str[$i]=='"'){
  100. $i++;
  101. while($str[$i]!='"' && $i
  102. $i++;
  103. }
  104. $i++;
  105. } else {
  106. $i++;
  107. }
  108. }
  109. //确定起始标签的位置
  110. function confirm_pre_pos($str, $pre_pos){
  111. $str_len = strlen($str);
  112. $j=$pre_pos;
  113. while($j
  114. if($str[$j] == '"') {
  115. $j++;
  116. while ($j
  117. if($str[$j]=='"') {
  118. $j++;
  119. break;
  120. }
  121. $j++;
  122. }
  123. }
  124. else if($str[$j] == "'") {
  125. $j++;
  126. while ($j
  127. if($str[$j]=="'") {
  128. $j++;
  129. break;
  130. }
  131. $j++;
  132. }
  133. }
  134. else if($str[$j]==">") {
  135. $j++;
  136. while ($j
  137. if($str[$j]=="
  138. //退回到原有内容位置
  139. $j--;
  140. break;
  141. }
  142. $j++;
  143. }
  144. break;
  145. }
  146. else {
  147. $j++;
  148. }
  149. }
  150. return $j;
  151. }
  152. //确定起始标签的位置
  153. function confirm_err_pos($str, $err_pos){
  154. $j=$err_pos;
  155. $j--;
  156. while($j > 0) {
  157. if($str[$j] == '"') {
  158. $j--;
  159. while ($j
  160. if($str[$j]=='"') {
  161. $j--;
  162. break;
  163. }
  164. $j--;
  165. }
  166. }
  167. else if($str[$j] == "'") {
  168. $j--;
  169. while ($j
  170. if($str[$j]=="'") {
  171. $j--;
  172. break;
  173. }
  174. $j--;
  175. }
  176. }
  177. else if($str[$j]==">") {
  178. $j++;
  179. break;
  180. }
  181. else {
  182. $j--;
  183. }
  184. }
  185. return $j;
  186. }
  187. //获取数组的倒数第num个值
  188. function getLastNode(array $arr, $num){
  189. $len = count($arr);
  190. if($len > $num) {
  191. return $arr[$len-$num];
  192. } else {
  193. return $arr[0];
  194. }
  195. }
  196. //整理数据, 主要是向后看, 进一步进行检查
  197. function sort_data(&$pre_data, &$pre_pos, &$error_data, &$error_pos){
  198. $rem_key_array = array();
  199. $rem_i_array = array();
  200. //获取需要删除的值
  201. foreach($error_data as $key=>$value){
  202. $count = count($pre_data);
  203. for($i=($count-1) ; $i>=0; $i--) {
  204. if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
  205. $rem_key_array[] = $key;
  206. $rem_i_array[] = $i;
  207. break;
  208. }
  209. }
  210. }
  211. //删除起始标签相应的值
  212. foreach($rem_key_array as $_item) {
  213. unset($error_pos[$_item]);
  214. unset($error_data[$_item]);
  215. }
  216. //删除结束标签相应的值
  217. foreach($rem_i_array as $_item) {
  218. unset($pre_data[$_item]);
  219. unset($pre_pos[$_item]);
  220. }
  221. }
  222. //整理数据, 闭合标签
  223. function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
  224. $move_log = array();
  225. //只有闭合标签的数据
  226. foreach ($error_data as $key => $value) {
  227. # code...
  228. $_tmp_move_count = 0;
  229. foreach ($move_log as $pos_key => $move_value) {
  230. # code...
  231. if($error_pos[$key]>=$pos_key) {
  232. $_tmp_move_count += $move_value;
  233. }
  234. }
  235. $data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);
  236. $str = $data['str'];
  237. $move_log[$data['pos']] = $data['move_count'];
  238. }
  239. //只有起始标签的数据
  240. foreach ($pre_data as $key => $value) {
  241. # code...
  242. $_tmp_move_count = 0;
  243. foreach ($move_log as $pos_key => $move_value) {
  244. # code...
  245. if($pre_pos[$key]>=$pos_key) {
  246. $_tmp_move_count += $move_value;
  247. }
  248. }
  249. $data = insert_data($str, $value, $pre_pos[$key]+$_tmp_move_count, true);
  250. $str = $data['str'];
  251. $move_log[$data['pos']] = $data['move_count'];
  252. }
  253. return $str;
  254. }
  255. //插入数据, $type 表示插入数据的方式
  256. function insert_data($str, $insert_data, $pos, $type) {
  257. $len = strlen($str);
  258. //起始标签类型
  259. if($type==true) {
  260. $move_count = strlen($insert_data)+3;
  261. $pos = confirm_pre_pos($str, $pos);
  262. $pre_str = substr($str, 0, $pos);
  263. $end_str = substr($str, $pos);
  264. $mid_str = "" . $insert_data . ">";
  265. //闭合标签类型
  266. } else {
  267. $pos = confirm_err_pos($str, $pos);
  268. $move_count = strlen($insert_data) + 2;
  269. $pre_str = substr($str, 0, $pos);
  270. $end_str = substr($str, $pos);
  271. $mid_str = "";
  272. }
  273. $str = $pre_str.$mid_str.$end_str;
  274. return array('str'=>$str, 'pos'=>$pos, 'move_count'=>$move_count);
  275. }
  276. sort_data($pre_data, $pre_pos, $error_data, $error_pos);
  277. $new_str = modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos);
  278. echo $new_str;
  279. // print_r($pre_data);
  280. // print_r($pre_pos);
  281. // print_r($error_data);
  282. // print_r($error_pos);
  283. // echo strlen($str);
  284. // foreach($pre_pos as $value){
  285. // $value = confirm_pre_pos($str, $value);
  286. // for($i=$value-5; $i
  287. // echo $str[$i];
  288. // }
  289. // echo "\n";
  290. // }
  291. // foreach($error_pos as $value){
  292. // for($i=$value-5; $i
  293. // echo $str[$i];
  294. // }
  295. // echo "\n";
  296. // }
  297. ?>
  298. 复制代码


    相关文章

    HTML速学教程(入门课程)
    HTML速学教程(入门课程)

    HTML怎么学习?HTML怎么入门?HTML在哪学?HTML怎么学才快?不用担心,这里为大家提供了HTML速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!

    下载

    本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

    热门AI工具

    更多
    DeepSeek
    DeepSeek

    幻方量化公司旗下的开源大模型平台

    豆包大模型
    豆包大模型

    字节跳动自主研发的一系列大型语言模型

    通义千问
    通义千问

    阿里巴巴推出的全能AI助手

    腾讯元宝
    腾讯元宝

    腾讯混元平台推出的AI助手

    文心一言
    文心一言

    文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

    讯飞写作
    讯飞写作

    基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

    即梦AI
    即梦AI

    一站式AI创作平台,免费AI图片和视频生成。

    ChatGPT
    ChatGPT

    最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

    相关专题

    更多
    batoto漫画官网入口与网页版访问指南
    batoto漫画官网入口与网页版访问指南

    本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

    127

    2026.02.25

    Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法
    Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

    本专题系统整理Steam官网最新可用入口,涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明,帮助新手玩家快速进入Steam平台,完成注册登录并管理个人游戏库。

    18

    2026.02.25

    TypeScript全栈项目架构与接口规范设计
    TypeScript全栈项目架构与接口规范设计

    本专题面向全栈开发者,系统讲解基于 TypeScript 构建前后端统一技术栈的工程化实践。内容涵盖项目分层设计、接口协议规范、类型共享机制、错误码体系设计、接口自动化生成与文档维护方案。通过完整项目示例,帮助开发者构建结构清晰、类型安全、易维护的现代全栈应用架构。

    15

    2026.02.25

    Python数据处理流水线与ETL工程实战
    Python数据处理流水线与ETL工程实战

    本专题聚焦 Python 在数据工程场景下的实际应用,系统讲解 ETL 流程设计、数据抽取与清洗、批处理与增量处理方案,以及数据质量校验与异常处理机制。通过构建完整的数据处理流水线案例,帮助开发者掌握数据工程中的性能优化思路与工程化规范,为后续数据分析与机器学习提供稳定可靠的数据基础。

    1

    2026.02.25

    Java领域驱动设计(DDD)与复杂业务建模实战
    Java领域驱动设计(DDD)与复杂业务建模实战

    本专题围绕 Java 在复杂业务系统中的建模与架构设计展开,深入讲解领域驱动设计(DDD)的核心思想与落地实践。内容涵盖领域划分、聚合根设计、限界上下文、领域事件、贫血模型与充血模型对比,并结合实际业务案例,讲解如何在 Spring 体系中实现可演进的领域模型架构,帮助开发者应对复杂业务带来的系统演化挑战。

    1

    2026.02.25

    Golang 生态工具与框架:扩展开发能力
    Golang 生态工具与框架:扩展开发能力

    《Golang 生态工具与框架》系统梳理 Go 语言在实际工程中的主流工具链与框架选型思路,涵盖 Web 框架、RPC 通信、依赖管理、测试工具、代码生成与项目结构设计等内容。通过真实项目场景解析不同工具的适用边界与组合方式,帮助开发者构建高效、可维护的 Go 工程体系,并提升团队协作与交付效率。

    18

    2026.02.24

    Golang 性能优化专题:提升应用效率
    Golang 性能优化专题:提升应用效率

    《Golang 性能优化专题》聚焦 Go 应用在高并发与大规模服务中的性能问题,从 profiling、内存分配、Goroutine 调度、GC 机制到 I/O 与锁竞争逐层分析。结合真实案例讲解定位瓶颈的方法与优化策略,帮助开发者建立系统化性能调优思维,在保证代码可维护性的同时显著提升服务吞吐与稳定性。

    9

    2026.02.24

    Golang 面试题精选:高频问题与解答
    Golang 面试题精选:高频问题与解答

    Golang 面试题精选》系统整理企业常见 Go 技术面试问题,覆盖语言基础、并发模型、内存与调度机制、网络编程、工程实践与性能优化等核心知识点。每道题不仅给出答案,还拆解背后的设计原理与考察思路,帮助读者建立完整知识结构,在面试与实际开发中都能更从容应对复杂问题。

    6

    2026.02.24

    Golang 运行与部署实战:从本地到云端
    Golang 运行与部署实战:从本地到云端

    《Golang 运行与部署实战》围绕 Go 应用从开发完成到稳定上线的完整流程展开,系统讲解编译构建、环境配置、日志与配置管理、容器化部署以及常见运维问题处理。结合真实项目场景,拆解自动化构建与持续部署思路,帮助开发者建立可靠的发布流程,提升服务稳定性与可维护性。

    5

    2026.02.24

    热门下载

    更多
    网站特效
    /
    网站源码
    /
    网站素材
    /
    前端模板

    精品课程

    更多
    相关推荐
    /
    热门推荐
    /
    最新课程
    关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
    php中文网:公益在线php培训,帮助PHP学习者快速成长!
    关注服务号 技术交流群
    PHP中文网订阅号
    每天精选资源文章推送

    Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号