首页 > 后端开发 > 正文

Python有什么好的库可以识别验证码

2024-01-12 22:26:01 | 我爱编程网

今天我爱编程网小编为大家带来了Python有什么好的库可以识别验证码,希望能帮助到大家,一起来看看吧!

本文目录一览:

Python有什么好的库可以识别验证码

Python有什么好的库可以识别验证码

要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。

pytesseract安装

直接使用pip install pytesseract安装即可,或者使用easy_install pytesseract

Python验证码识别代码:

import pytesseract

from PIL import Image

image = Image.open('vcode.png')

vcode = pytesseract.image_to_string(image)

print (vcode)

Python有什么好的库可以识别验证码

python selenium 获取短信验证码是字符和数字怎么读取数字

读取短信需要在相应的手机上读取呀

由于工作需要,登录网站需要用到验证码。最初是研究过验证码识别的,但是总是不能获取到我需要的那个验证码。直到这周五,才想起这事来,昨天顺利的解决了。

下面正题:

Python版本:3.4.3

所需要的代码库:PIL,selenium,tesseract

先上代码:

#coding:utf-8

import subprocess

from PIL import Image

from PIL import ImageOps

from selenium import webdriver

import time,os,sys

def cleanImage(imagePath):

image = Image.open(imagePath) #打开图片

image = image.point(lambda x: 0 if x<143 else 255) #处理图片上的每个像素点,使图片上每个点“非黑即白”

borderImage = ImageOps.expand(image,border=20,fill='white')

borderImage.save(imagePath)

def getAuthCode(driver, url="

"):

captchaUrl = url + "common/random"

driver.get(captchaUrl)

time.sleep(0.5)

driver.save_screenshot("captcha.jpg") #截屏,并保存图片

#urlretrieve(captchaUrl, "captcha.jpg")

time.sleep(0.5)

cleanImage("captcha.jpg")

p = subprocess.Popen(["tesseract", "captcha.jpg", "captcha"], stdout=\

subprocess.PIPE,stderr=subprocess.PIPE)

p.wait()

f = open("captcha.txt", "r")

#Clean any whitespace characters

captchaResponse = f.read().replace(" ", "").replace("\n", "")

print("Captcha solution attempt: " + captchaResponse)

if len(captchaResponse) == 4:

return captchaResponse

else:

return False

def withoutCookieLogin(url=""):

driver = webdriver.Chrome()我爱编程网

driver.maximize_window()

driver.get(url)

while True:

authCode = getAuthCode(driver, url)

if authCode:

driver.back()

driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").clear()

driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").send_keys("orgCode")

driver.find_element_by_xpath("//input[@id='account' and @name='username']").clear()

driver.find_element_by_xpath("//input[@id='account' and @name='username']").send_keys("username")

driver.find_element_by_xpath("//input[@type='password' and @name='password']").clear()

driver.find_element_by_xpath("//input[@type='password' and @name='password']").send_keys("password")

driver.find_element_by_xpath("//input[@type='text' and @name='authCode']").send_keys(authCode)

driver.find_element_by_xpath("//button[@type='submit']").click()

try:

time.sleep(3)

driver.find_element_by_xpath("//*[@id='side-menu']/li[2]/ul/li/a").click()

return driver

except:

print("authCode Error:", authCode)

driver.refresh()

return driver

driver = withoutCookieLogin("

")

driver.get("

enterprise/add/")

怎么获取我们需要的验证码

在这获取验证码的道路上,我掉了太多的坑,看过太多的文章,很多都是教你验证码的识别方法,但是没有说明,怎么获取你当前需要的验证码图片。

我的处理方法是:

1.先用selenium打开你需要的登录的页面地址url1

2.通过审核元素获取验证码的地址url2(其实最简单的是右键打开新页面)

3:在url1页面,输入地址url2进入url2页面,然后截屏保存验证码页面

4:处理验证码得到验证码字符串。然后点击浏览器后退按钮,返回url1登录页面

5:输入登录需要的信息和验证码

6:点击登录

7:验证登录后的页面,判断是否成功,若不成功则需要重新1-7的操作。

为了保护公司的信息,这个页面是我本地搭的服务,我在伯乐在线注册页面进行测试过这个验证码获得方法,可以通过。(这个验证码的处理方法,仅限验证码背景是像素点,若验证码有横线需额外处理。)

第一篇博文,不喜勿喷。

验证码处理方法参考文献:

Web Scraping with python.pdf

Python有什么好的库可以识别验证码

Python开发文字点选验证码,有什么推荐的方法?

我爱编程网(https://www.52biancheng.com)小编还为大家带来Python开发文字点选验证码,有什么推荐的方法?的相关内容。

文字点选验证码(Click Captcha)是一种常见的验证码形式,通常由若干个字符或单词组成,要求用户点击其中指定的字符或单词,以验证用户身份。

在Python开发中实现文字点选验证码,一种常用的方法是使用图像处理库和机器学习库,以下是一些常用的库和方法:

PIL库:Python Imaging Library(PIL)是一个Python图像处理库,提供了丰富的图像处理功能,包括图像读写、缩放、旋转、裁剪、滤波等。可以使用PIL库生成包含随机字符的验证码图片,并将其保存为本地文件。

OpenCV库:OpenCV是一个计算机视觉库,提供了大量的图像处理和计算机视觉算法,包括图像读写、滤波、边缘检测、特征提取等。可以使用OpenCV库对验证码图片进行预处理,提取出验证码中的字符或单词,以便后续的识别。

PyTesseract库:PyTesseract是一个Python的OCR库,基于Google的Tesseract-OCR引擎,可以对图像中的文字进行识别。可以使用PyTesseract库对验证码图片中的字符或单词进行识别和分类。

KNN算法:KNN是一种常用的机器学习算法,可以用于对验证码图片中的字符或单词进行分类。可以使用KNN算法对预处理后的验证码图片进行特征提取和分类,以识别出验证码中的正确字符或单词。

综合使用以上方法,可以实现一个较为稳定和准确的文字点选验证码。具体实现细节需要根据具体情况进行调整和优化。

以上就是我爱编程网整理的Python有什么好的库可以识别验证码相关内容,想要了解更多信息,敬请查阅我爱编程网。更多相关文章关注我爱编程网:www.52biancheng.com

免责声明:文章内容来自网络,如有侵权请及时联系删除。
与“Python有什么好的库可以识别验证码”相关推荐
Python开发文字点选验证码,有什么推荐的方法?
Python开发文字点选验证码,有什么推荐的方法?

Python开发文字点选验证码,有什么推荐的方法?文字点选验证码(ClickCaptcha)是一种常见的验证码形式,通常由若干个字符或单词组成,要求用户点击其中指定的字符或单词,以验证用户身份。在Python开发中实现文字点选验证码,一种常用的方法是使用图像处理库和机器学习库,以下是一些常用的库和方法:PIL库:PythonImagingLibrary(PIL)是一个Pyt

2024-01-06 09:35:40
学好Python可以做什么兼职
学好Python可以做什么兼职

学好Python可以做什么兼职学会python可以做的兼职:1、爬虫首先,除了Python的语法基础的之外的必修课就是web开发和爬虫的内容了。如果是想依靠这两个方向来赚钱的话,就必须要清楚的知道开发什么或者爬什么数据才能赚钱。如果你都不知道的话,你可以开个网店,或者去猪八戒做服务的外包。不管是web开发还是爬虫,都需要找到好的项目。最好的就是帮一些证券的人员抓一些财经的新闻或

2023-12-16 10:57:18
thinkphp 验证码怎么调用
thinkphp 验证码怎么调用

thinkphp验证码怎么调用一、首先需要在控制器中加入验证码方法admin/Lib/Action/LoginAction.class.php知识点:1、ob_clean函数用途2、import方法调用think默认类库3、Image类buildImageVerify方法使用代码如下:.代码如下:Publicfunctionverify(){ob_clean

2024-08-18 17:42:35
有什么软件可以写python
有什么软件可以写python

有什么软件可以写python编写python源代码的软件.首推的Pycharm。PyCharm用于bai一般IDE具备的功能,比如,调试、语法高亮、Project管理、du代码跳转、智能提示、自动完zhi成、单元测试、版本控制另外,PyCharm还提供了一些很好的功能用于Django开发,同时支持GoogleAppEngine,更酷的是,PyCharm支持IronPython

2024-02-05 14:07:27
python有什么游戏可以玩玩?
python有什么游戏可以玩玩?

python有什么游戏可以玩玩?ant蚂蚁2.bagels百吉饼另外贪吃蛇,吃豆子都是可以的,直接代码就可以玩。Python包括随您的安装一起分发的大量标准库。标准库有一个称为Turtle的模块,这是一种向普通人介绍python编程的流行方法。今天介绍的所有游戏都是使用Python及其Turtle模块实现的。每个游戏都完全独立于其他游戏,不试一试您永远都不知道最喜欢哪种游戏

2024-01-24 00:13:52
php生成图片验证码?为什么是张黑色的?
php生成图片验证码?为什么是张黑色的?

php生成图片验证码?为什么是张黑色的?你的底图设置为黑色的,然后文字设置为白色的//$bg=imagecolorallocate($im,0,0,0);//第一次使用调色板时候的背景颜色//$te=imagecolorallocate($im,255,255,255);//文字颜色看看这个代码for($i=0;$i&lt;4;$i++){$rand.=dechex(r

2024-12-23 23:10:08
Python可以用来做什么有趣的事情?
Python可以用来做什么有趣的事情?

Python可以用来做什么有趣的事情?1、处理数据Excel整理数据功能虽然很强大,但在Python面前,曾经统治职场的它也的败下阵来。因为Python在搜集数据整理分析数据的过程中更加便捷,通过几行代码还可以实现自动化操作。如果你学会Python,便可以从网上找一些数据筛选、汇总的兼职工作来赚点小钱。2、查询资料学会Python之后,很容易通过几行代码在网络上爬取各种各样的资源

2024-02-08 03:56:38
如何用PHP生成验证码
如何用PHP生成验证码

如何用PHP生成验证码PHP生成验证码的原理:使用PHP的GD库,生成一张带验证码的图片,并将验证码保存在Session中。PHP生成验证码的大致流程有:1、产生一张png的图片;2、为图片设置背景色;3、设置字体颜色和样式;4、产生4位数的随机的验证码;5、把产生的每个字符调整旋转角度和位置画到png图片上;6、加入噪点和干扰线防止注册机器分析原图片来

2024-08-07 20:37:54