【次世代系统教程】之项目选项设置
项目设置可分为”项目选项设置“、”地址分析设置“、”下载参数设置“、”附加信息设置“四部分。
项目选项设置区如图所示
让我们逐个解释。
【设定识别相似度(百分比)】:这个是指验证码的某个部分被识别为某个字模,则两者之间必须满足的相似程度。如果有多个字模满足条件,相似度最高的那个被视为最终选择。
【设定图像识别模式】:这个是指系统识别时采取的哪种识别算法。目前有四种识别模式:分割识别、混合识别、整体识别、快速识别。它们之间的区别和应用场合请阅读博文:【次世代系统教程】之识别模式详解。
【设定图像分割方式】:这个是指图像处理完成后,采用哪种方式分割图像。目前有四种分割方式:自动分割、垂直分割、平均分割、过盈分割。它们之间的区别和应用场合请阅读博文:【次世代系统教程】之分割模式详解。
【设定加速级别】:这里跟2.4以前的”启用识别加速“功能类似。设为0即不启用加速,设为1为启用加速。启用加速功能可以加快图像识别速度,但可能会减低识别率。1以上参数为未来版本预留。
【设定字符个数】:这里可以指定验证码中字符的个数。如果验证码字符个数不定,请设定为字符最多的那种情况。
【设定分割参数】:启用平均分割和过盈分割时,这里可以输入分割参数。自动分割和垂直分割不需要。
【分割后图像处理滤镜】:验证码图像被分割后,可以启用这里的滤镜进一步进行处理。请注意滤镜的处理是有顺序的。滤镜名称的第一个字符就是滤镜处理的顺序。其中的”去除杂点“、”去除毛刺“、”去除白边“在识别过程中依然会起作用,选中它们可能影响识别速度和识别率。
地址分析设置区如图所示
正则表达匹配网址:本软件内部用正则表达式提取验证码地址,这里填写的
就是所需要的正则表达式。
匹配结果重新组合:如果用正则表达式获取的结果并非最终结果(通常都不是)
那么这里可以将结果与其他文本重新组合以得到最终的验证码下载链接地址。
设置这里的内容需要一些正则表达式的基础。如果你懂得火车头采集器的使用
方法,相信这对你不会造成困难,如果确实不会呢,你也完全可以自己手动把
验证码图像下载回来,然后用本软件的“读入图像”功能载入,效果是一样的。
下载参数设置区如图所示
这里可以指定验证码下载地址的参数,比如某些验证码会验证访问来源,就可以在这里设定”Referer“。
如果你知道验证码下载链接的Cookie,也可以在这里设定。对于某些下载有困难的验证码可以试下。
附加信息设置区如图所示
这里可以输入验证码所在网站地址,项目作者和说明。这里的内容只对项目开发者有意义。
本文出自 天涯软件园,转载时请注明出处及相应链接。
本文永久链接: https://antiyzm.sinaapp.com/archives/272