0

0

QueryList递归采集时,Range方法如何避免数据合并?

心靈之曲

心靈之曲

发布时间:2025-03-08 08:02:10

|

988人浏览过

|

来源于php中文网

原创

querylist递归采集时,range方法避免数据合并详解

使用QueryList进行多级数据采集时,递归调用querydata函数容易导致range()方法出现数据合并问题。本文通过一个案例分析range()方法在递归调用中的作用,并解释文档示例与实际运行结果的差异。

问题描述:

以下代码尝试从HTML结构中提取标题(h3)和列表(.list)信息,列表中包含多个子项(.item)。递归调用querydata函数提取子项时,item字段数据却合并了,而非预期的独立列表。

代码示例:

$html = <<
item1
item2
- ### xxx2
item12
item22
str; $data = querylist::html($html) ->rules([ 'title' => ['h3', 'text'], 'list' => ['.list', 'html'] ]) ->range('#demo li') // 这里假设存在
  • ...
结构,否则range无效 ->querydata(function ($item) { $item['list'] = querylist::html($item['list']) ->rules([ 'item' => ['.item', 'text'] ]) ->range('') // 清空range,避免继承外部range ->querydata(); return $item; }); dump($data);

运行结果(预期与实际结果差异):

如果代码中range('')被省略,则item字段内容会合并:

Array ( 
    [0] => Array ( [title] => xxx [list] => Array ( [item] => item1item2 ) ) 
    [1] => Array ( [title] => xxx2 [list] => Array ( [item] => item12item22 ) ) 
)

添加range('')后,结果将正确地显示为独立列表:

PicWish
PicWish

推荐!专业的AI抠图修图,支持格式转化

下载
Array ( 
    [0] => Array ( [title] => xxx [list] => Array ( [0] => Array ( [item] => item1 ) [1] => Array ( [item] => item2 ) ) ) 
    [1] => Array ( [title] => xxx2 [list] => Array ( [0] => Array ( [item] => item12 ) [1] => Array ( [item] => item22 ) ) ) 
)

问题分析:

range('#demo li') 指定了外层循环选择#demo下的li元素。 如果内部querydata函数忽略range(''),内部querylist对象会继承外层range('#demo li')设置。这导致内部循环仍然作用于所有li元素,而非当前li元素下的.item元素,从而造成item字段内容合并。range('')清空范围选择,确保内部循环只处理传入的$item['list'] HTML片段。

解决方法:

在内部querydata函数中使用range('')重置范围选择,强制querylist对象仅处理当前$item['list'] HTML片段,避免范围继承问题。

结论:

理解range()方法在QueryList递归调用中的作用至关重要。 在递归调用中,务必在每个querydata函数中根据实际需求设置或重置range()参数,以避免数据合并或其他意外结果。 本例中,range('')的运用有效地解决了数据合并问题,确保了递归采集的准确性。 需要注意的是,示例代码中的range('#demo li')需要对应的HTML结构存在,否则该range将无效。 QueryList递归采集时,Range方法如何避免数据合并?

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
html版权符号
html版权符号

html版权符号是“©”,可以在html源文件中直接输入或者从word中复制粘贴过来,php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

611

2023.06.14

html在线编辑器
html在线编辑器

html在线编辑器是用于在线编辑的工具,编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方,是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容,供大家免费下载使用。

646

2023.06.21

html网页制作
html网页制作

html网页制作是指使用超文本标记语言来设计和创建网页的过程,html是一种标记语言,它使用标记来描述文档结构和语义,并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容,供大家免费下载体验。

466

2023.07.31

html空格
html空格

html空格是一种用于在网页中添加间隔和对齐文本的特殊字符,被用于在网页中插入额外的空间,以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容,供大家免费下载体验。

245

2023.08.01

html是什么
html是什么

HTML是一种标准标记语言,用于创建和呈现网页的结构和内容,是互联网发展的基石,为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

2889

2023.08.11

html字体大小怎么设置
html字体大小怎么设置

在网页设计中,字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性,还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧,帮助您在HTML中设置合适的字体大小。

505

2023.08.11

html转txt
html转txt

html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容,供大家免费下载体验。

311

2023.08.31

html文本框代码怎么写
html文本框代码怎么写

html文本框代码:1、单行文本框【<input type="text" style="height:..;width:..;" />】;2、多行文本框【textarea style=";height:;"></textare】。

423

2023.09.01

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

3

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号