【次世代系统教程】(二)验证码图像下载链接的设置

作者: 天涯龙腾 分类: 软件帮助 发布时间: 2012-02-15 20:08 ė 61条评论 编辑

当我们建立了一个验证码识别工程,接下来我们所要做的就是验证码图像
下载链接的设置。这要分两种情况。

1)如果该链接是固定的,那么很简单,把链接填入最上面的那个长条形的
编辑框即可。如下图所示。

 

2)如果链接不固定,也就是链接需要先在某个网页里面获取,则需要设置
“获取图形高级设置”区域的内容。


该区域的各项设置解释如下:


地址:验证码所在的网页的地址。这个地址应该是固定的。
来路:有些网站需要检验网页的”Referer”,也就是这个网页是从哪个网页
转入的,通常这里可以不填。

正则表达匹配网址:本软件内部用正则表达式提取验证码地址,这里填写的
就是所需要的正则表达式。

匹配结果重新组合:如果用正则表达式获取的结果并非最终结果(通常都不是)
那么这里可以将结果与其他文本重新组合以得到最终的验证码下载链接地址。
用 [参数1]、
 [参数2]等表示第几个正则表达式的匹配结果。


设置这里的内容需要一些正则表达式的基础。如果你懂得火车头采集器的使用
方法,相信这对你不会造成困难,如果确实不会呢,你也完全可以自己手动把
验证码图像下载回来,然后用本软件的“读入图像”功能载入,效果是一样的。

PS:你可以在地址栏直接输入本地文件目录,即可让软件读取本地图片。点击
“下载图像”时,软件会自动按顺序读入指定目录内的图片,并可循环读取。
切记输入的必须是目录,这个目录内最好不要有除图片之外的其他格式的文件。

本文出自 天涯软件园,转载时请注明出处及相应链接。

本文永久链接: http://antiyzm.sinaapp.com/archives/50

Ɣ回顶部