2024-01-12 22:26:01 | 我爱编程网
要安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎。
pytesseract安装
直接使用pip install pytesseract安装即可,或者使用easy_install pytesseract
Python验证码识别代码:
import pytesseract
from PIL import Image
image = Image.open('vcode.png')
vcode = pytesseract.image_to_string(image)
print (vcode)
读取短信需要在相应的手机上读取呀
由于工作需要,登录网站需要用到验证码。最初是研究过验证码识别的,但是总是不能获取到我需要的那个验证码。直到这周五,才想起这事来,昨天顺利的解决了。
下面正题:
Python版本:3.4.3
所需要的代码库:PIL,selenium,tesseract
先上代码:
#coding:utf-8
import subprocess
from PIL import Image
from PIL import ImageOps
from selenium import webdriver
import time,os,sys
def cleanImage(imagePath):
image = Image.open(imagePath) #打开图片
image = image.point(lambda x: 0 if x<143 else 255) #处理图片上的每个像素点,使图片上每个点“非黑即白”
borderImage = ImageOps.expand(image,border=20,fill='white')
borderImage.save(imagePath)
def getAuthCode(driver, url="
"):
captchaUrl = url + "common/random"
driver.get(captchaUrl)
time.sleep(0.5)
driver.save_screenshot("captcha.jpg") #截屏,并保存图片
#urlretrieve(captchaUrl, "captcha.jpg")我爱编程网
time.sleep(0.5)
cleanImage("captcha.jpg")
p = subprocess.Popen(["tesseract", "captcha.jpg", "captcha"], stdout=\
subprocess.PIPE,stderr=subprocess.PIPE)
p.wait()
f = open("captcha.txt", "r")
#Clean any whitespace characters
captchaResponse = f.read().replace(" ", "").replace("\n", "")
print("Captcha solution attempt: " + captchaResponse)
if len(captchaResponse) == 4:
return captchaResponse
else:
return False
def withoutCookieLogin(url=""):
driver = webdriver.Chrome()
driver.maximize_window()
driver.get(url)
while True:
authCode = getAuthCode(driver, url)
if authCode:
driver.back()
driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").clear()
driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").send_keys("orgCode")
driver.find_element_by_xpath("//input[@id='account' and @name='username']").clear()
driver.find_element_by_xpath("//input[@id='account' and @name='username']").send_keys("username")
driver.find_element_by_xpath("//input[@type='password' and @name='password']").clear()
driver.find_element_by_xpath("//input[@type='password' and @name='password']").send_keys("password")
driver.find_element_by_xpath("//input[@type='text' and @name='authCode']").send_keys(authCode)
driver.find_element_by_xpath("//button[@type='submit']").click()
try:
time.sleep(3)
driver.find_element_by_xpath("//*[@id='side-menu']/li[2]/ul/li/a").click()
return driver
except:
print("authCode Error:", authCode)
driver.refresh()
return driver
driver = withoutCookieLogin("
")
driver.get("
enterprise/add/")
怎么获取我们需要的验证码
在这获取验证码的道路上,我掉了太多的坑,看过太多的文章,很多都是教你验证码的识别方法,但是没有说明,怎么获取你当前需要的验证码图片。
我的处理方法是:
1.先用selenium打开你需要的登录的页面地址url1
2.通过审核元素获取验证码的地址url2(其实最简单的是右键打开新页面)
3:在url1页面,输入地址url2进入url2页面,然后截屏保存验证码页面
4:处理验证码得到验证码字符串。然后点击浏览器后退按钮,返回url1登录页面
5:输入登录需要的信息和验证码
6:点击登录
7:验证登录后的页面,判断是否成功,若不成功则需要重新1-7的操作。
为了保护公司的信息,这个页面是我本地搭的服务,我在伯乐在线注册页面进行测试过这个验证码获得方法,可以通过。(这个验证码的处理方法,仅限验证码背景是像素点,若验证码有横线需额外处理。)
第一篇博文,不喜勿喷。
验证码处理方法参考文献:
Web Scraping with python.pdf
文字点选验证码(Click Captcha)是一种常见的验证码形式,通常由若干个字符或单词组成,要求用户点击其中指定的字符或单词,以验证用户身份。
在Python开发中实现文字点选验证码,一种常用的方法是使用图像处理库和机器学习库,以下是一些常用的库和方法:
PIL库:Python Imaging Library(PIL)是一个Python图像处理库,提供了丰富的图像处理功能,包括图像读写、缩放、旋转、裁剪、滤波等。可以使用PIL库生成包含随机字符的验证码图片,并将其保存为本地文件。
OpenCV库:OpenCV是一个计算机视觉库,提供了大量的图像处理和计算机视觉算法,包括图像读写、滤波、边缘检测、特征提取等。可以使用OpenCV库对验证码图片进行预处理,提取出验证码中的字符或单词,以便后续的识别。
PyTesseract库:PyTesseract是一个Python的OCR库,基于Google的Tesseract-OCR引擎,可以对图像中的文字进行识别。可以使用PyTesseract库对验证码图片中的字符或单词进行识别和分类。
KNN算法:KNN是一种常用的机器学习算法,可以用于对验证码图片中的字符或单词进行分类。可以使用KNN算法对预处理后的验证码图片进行特征提取和分类,以识别出验证码中的正确字符或单词。
综合使用以上方法,可以实现一个较为稳定和准确的文字点选验证码。具体实现细节需要根据具体情况进行调整和优化。
Python开发文字点选验证码,有什么推荐的方法?文字点选验证码(ClickCaptcha)是一种常见的验证码形式,通常由若干个字符或单词组成,要求用户点击其中指定的字符或单词,以验证用户身份。在Python开发中实现文字点选验证码,一种常用的方法是使用图像处理库和机器学习库,以下是一些常用的库和方法:PIL库:PythonImagingLibrary(PIL)是一个Pyt
学好Python可以做什么兼职学会python可以做的兼职:1、爬虫首先,除了Python的语法基础的之外的必修课就是web开发和爬虫的内容了。如果是想依靠这两个方向来赚钱的话,就必须要清楚的知道开发什么或者爬什么数据才能赚钱。如果你都不知道的话,你可以开个网店,或者去猪八戒做服务的外包。不管是web开发还是爬虫,都需要找到好的项目。最好的就是帮一些证券的人员抓一些财经的新闻或
python怎么生成随机图形验证码1.安装pillow模块pipinstallpillow2.pillow模块的基本使用1.创建图片fromPILimportImage#定义使用Image类实例化一个长为400px,宽为400px,基于RGB的(255,255,255)颜色的图片img1=Image.new(mode="RGB",size=(400,400),colo
Python可以做哪些有趣的事情?一、制作游戏Python可以用来制作各种类型的游戏,从简单的文字游戏到复杂的图形游戏都可以实现。使用Pygame等游戏开发库,你可以编写自己的游戏逻辑、设计游戏关卡和角色,并为游戏增加声音和图形效果。通过制作游戏,你不仅可以锻炼编程能力,还可以享受游戏创作的乐趣。二、创建艺术作品Python可以用来创建各种艺术作品,包括图像生成、
自学python可以做什么兼职很多朋友都会说,我身边有朋友或者同学是做程序员的。但是他们具体的工作内容,其实很多人是不了解的,这几年随着一些影视作品的出现,里面的主演有的从事开发工程师,大家初步有了一个印象。如果我不想去公司坐班,自己通过这个技能怎么来赚钱。(推荐学习:Python视频教程)首先在web领域,你可以用Python来做开发,网站,APP,小程序Python都可以用来做。可以
如何线上部署用python基于dlib写的人脸识别算法python使用dlib进行人脸检测与人脸关键点标记Dlib简介:首先给大家介绍一下DlibDlib是一个跨平台的C++公共库,除了线程支持,网络支持,提供测试以及大量工具等等优点,Dlib还是一个强大的机器学习的C++库,包含了许多机器学习常用的算法。同时支持大量的数值算法如矩阵、大整数、随机数运算等等。Dli
python计算圆的面积,周长及过程是怎样?Python计算圆的面积和周长及过程如下:python复制代码importmath,defcalculate_circle(radius):计算圆的面积area=math.pi*(radius**2)。计算圆的周长circumference=2*math.pi*radius,returnarea,circumference。
没有pytho手机可以运行py文件吗不可以。运行py必须在手机上安装python3,接着我们可以直接选择终端。在这里面我们可以直接一行一行输入执行代码。也可以选择进入编辑器。直接输入我们的python脚本代码。然后点击底部的执行按钮,就可以运行脚本了,也可以选择进入程序,点击后选择Run就可以执行程序,选择open可以查看案例的代码方便学习。手机编译器如何运行pyautogu
2024-01-01 09:58:48
2024-01-02 22:06:16
2023-12-23 12:08:32
2023-09-13 13:02:53
2024-01-08 06:28:32
2024-01-02 14:08:02