前提
爬与防爬就是一场“道高一尺,魔高一丈”的拉力赛,双方都在见招拆招。时至今日,较为常见的防爬手段有手机短信验证、滑块验证、按顺序点击图片验证等。
本文主要介绍滑块验证的应对之法。
验证实现
关键点在于获取滑块到滑动背景缺口图的横向距离,这里通过OpenCV的模板匹配技术matchTemplate,然后再通过selenium的Actions类完成滑动(拖动轨迹算法本文不予过多介绍,请自行查找相关资料)。
//获取滑块到滑动背景缺口图的横向距离
double slideDistance = getSlideDistance(System.getProperty("user.dir")+"\\slideBlock.png", System.getProperty("user.dir")+"\\slideBg.png");
Actions actions = new Actions(driver);
WebElement dragElement = driver.findElement(By.id("tcaptcha_drag_button"));
//获取style属性值,其中设置了滑块初始偏离值 style=left: 23px;
//需要注意的是网页前端图片和本地图片比例是不同的,需要进行换算
slideDistance = slideDistance * 280 / 680 - 23;
actions.clickAndHold(dragElement).perform();
//根据滑动距离生成滑动轨迹,约定规则:开始慢->中间快->最后慢
List<Integer> moveTrack = getMoveTrack(slideDistance);
for (Integer index : moveTrack) {//Thread.sleep(20);actions.moveByOffset(index, 0).perform();
}
actions.release().perform();
getSlideDistance方法实现
对滑块进行处理
- 灰度化
- 去除图片黑边
- inRange二值化转黑白图
代码实现:
// 加载OpenCV本地库
System.loadLibrary(Core.NATIVE_LIBRARY_NAME);
//对滑块进行处理
Mat slideBlockMat = Imgcodecs.imread(slideBlockPicPath);
//1、灰度化图片
Imgproc.cvtColor(slideBlockMat, slideBlockMat, Imgproc.COLOR_BGR2GRAY);
//2、去除周围黑边
for (int row = 0; row < slideBlockMat.height(); row++) {for (int col = 0; col < slideBlockMat.width(); col++) {if (slideBlockMat.get(row, col)[0] == 0) {slideBlockMat.put(row, col, 96);}}
}
//3、inRange二值化转黑白图
Core.inRange(slideBlockMat, Scalar.all(96), Scalar.all(96), slideBlockMat);
对滑动背景图进行处理
- 灰度化
- 二值化转黑白图
代码如下:
//对滑动背景图进行处理
Mat slideBgMat = Imgcodecs.imread(slideBgPicPath);
//1、灰度化图片
Imgproc.cvtColor(slideBgMat, slideBgMat, Imgproc.COLOR_BGR2GRAY);
//2、二值化
Imgproc.threshold(slideBgMat, slideBgMat, 127, 255, Imgproc.THRESH_BINARY);
Mat g_result = new Mat();
/** matchTemplate:在模板和输入图像之间寻找匹配,获得匹配结果图像* result:保存匹配的结果矩阵* TM_CCOEFF_NORMED标准相关匹配算法*/
Imgproc.matchTemplate(slideBgMat, slideBlockMat, g_result, Imgproc.TM_CCOEFF_NORMED);
/* minMaxLoc:在给定的结果矩阵中寻找最大和最小值,并给出它们的位置* maxLoc最大值*/
Point matchLocation = Core.minMaxLoc(g_result).maxLoc;
//返回匹配点的横向距离
return matchLocation.x;