您的位置:首页 > 科技 > 能源 > 北京网站建设公司哪个最好_邯郸优企网络_企业网站建设报价表_百度一下网页搜索

北京网站建设公司哪个最好_邯郸优企网络_企业网站建设报价表_百度一下网页搜索

2025/4/3 8:57:13 来源:https://blog.csdn.net/lewell789/article/details/145493833  浏览:    关键词:北京网站建设公司哪个最好_邯郸优企网络_企业网站建设报价表_百度一下网页搜索
北京网站建设公司哪个最好_邯郸优企网络_企业网站建设报价表_百度一下网页搜索

🚩【组件功能】:根据配置获取源HTML代码中a标签、img标签内的链接或图片地址

配置预览

alt 网址/图片地址获取

配置说明

源HTML文本 支持T或# 默认FLOW输入项

提取处理的对象,若为空,以上一个组件的输出做为源HTML文本,支持文本或表达式输入。

提取方式

支持“自动识别、通配符参数组合、正则匹配”3种提取方式。

提取规则 支持T或#

使用[参数]代表最终所需的指定结果字符串,用指定结果字符串的前后字符来定位参数。若前后字符串中包含可能变化的字符串,使用通配符[*]替代。

拼接地址 支持T或#

[参数1] [参数2] [参数N]等参数中对应的值是按照提取规则中的[参数]的位置顺序来匹配。

匹配正则 支持T或#

使用正则表达式匹配最终所需的指定结果字符串,匹配的内容用分组模式匹配,以便对匹配结果进行分组组合。

组合结果 支持T或#

$1、$2、$N替代正则分组来组合匹配结果。

网址补全

支持“不补全、相对网址补全、base href补全”3种方式。

当前源码URL 支持T或#

填写源HTML文本所属页面URL,用于分析自动补全网址所需的网址前缀。

base href地址 支持T或#

填写base href地址。

忽略大小写

在执行提取方式时,通过此项确定是否忽略大小写。

示例

base href补全

描述

通过http请求组件获取https://www.huoyuyan.com/help/demo-pages/spider/demo.html的源码html,自动识别网址并以base href补全,base href地址:https://www.huoyuyan.com/help/demo-pages/spider/demo.html

配置

alt 网址/图片地址获取

输出结果

alt 网址/图片地址获取

通配符参数组合

描述

通过http请求组件获取https://www.huoyuyan.com/help/demo-pages/spider/demo.html的源码html,以“通配符参数组合”方式获取网址且不补全,提取规则:img src=".[参数]",拼接地址:[参数1]

配置

alt 网址/图片地址获取

输出结果

因为未补全,所以获取的是源码中的地址

alt 网址/图片地址获取

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com