自动化选课(Python + selenium

WtcSky 2023-04-16 原文

前几天听到朋友说自己选课事情，突发奇想想要搞这样一个东西，但是由于各种原因只做到以下的完成度，具体的情况也会在解释的最后留下。这个只适用于曲师大的教务系统，因为用的这个系统来进行的一个调试，对于其他的系统，思路都是一样的，代码也只适用于学习，请不要用以其他用途！代码放在最后。

工具

Python3
selenium库(浏览器自动化操作)
ddddocr库(OCR图片文字识别)
time库(定时操作)

思路

对于想要做到的这个需求呢，我选择的是python + selenium库进行一个浏览器自动化操作，在写的过程中因为发现了一个验证码的问题所以又用到了一个ddddocr库，如果想要定时操作的话再加上一个time库。之后就是理清操作的顺序就好了，想到于人工操作一遍的过程。

进入系统登录界面
进入用户界面
进入选课界面
开始选课

大的一个方向、思路就是上面这四步，具体的细化之后再谈及。

过程

进入系统登录界面

这一步就很简单，直接用selenium库打开chormedriver就好了

        self.driver = webdriver.Chrome() 
        self.driver.maximize_window()  # 最大化

进入用户界面

这一步就是登录，要完成的就是把账号，密码输入对应的框，然后输入验证码，点击登录。

首先把账号密码输入到框里很简单

        self.driver.find_element(By.ID, 'userAccount').send_keys(self.user_account)
        self.driver.find_element(By.ID, 'userPassword').send_keys(self.user_password)

直接调用selenium库中的函数就可以进行该操作

接下来是这一步骤的一个问题，就是如何过验证码，因为该系统的验证码图片并不复杂，我想到的一个解决措施就是把验证码截图，然后识别图片上的信息，然后重复上述操作就好了。

如何截图，我首先想到的是指定位置然后用某个库截图或者是打开图片的链接保存图片，后来发现每次点开链接图片都是不一样的(应该是JS的原因)，最后发现原来selenium库自带一个元素截图的函数。

	    ocr = ddddocr.DdddOcr()
        img = self.driver.find_element(By.ID, 'SafeCodeImg')  # 定位到验证码图片
        img.screenshot('code.png')  # 给验证码元素截图并保存
        with open('code.png', 'rb') as f:
            img_bytes = f.read()  # 读取图片编码
        return ocr.classification(img_bytes)  # 返回图片中的验证码

这样的话只需要定位到这个图片元素，然后保存下来，再读取编码信息，使用ddddocr库来进行一个文字识别，返回图片的验证码模拟登陆就好了

最后登录也就是找到元素然后调用函数模拟点击就好了

self.driver.find_element(By.XPATH, "//*[@class='btn btn-primary login_btn']").click()

进入选课界面

这一部分本来难度不算很高，但是因为JS的原因，有一些地方需要注意。

首先就是模拟点击一些摁扭可以转到选课界面的地方。因为这个选课系统转到一个页面以后会产生一些新的东西(框架)，这时候我们要再找上面的元素就要分清楚在哪一个框架上。

    self.driver.switch_to.frame("Frame1")  # !!

通过F12开发者选项可以找到这个元素所在的框架不是初始的框架(frame)而是在JS产生的一个新框架中，那么就需要用这个函数来转到新的框架Frame1(通过开发者选项找到的frame id)

只有这一点需要特别注意！！！

开始选课

首先一点，进入这个界面的时候，浏览器的界面是切换了的，因此我们也需要将selenium的定位切换到我们所看到的界面上。

        new_window = self.driver.window_handles[-1]
        self.driver.switch_to.window(new_window)

之后通过点击又转产生了一个新的框架，因此在进行一个转框架的操作。

最后就是通过课程id、上课老师名字、上课是星期几三个来作为键确定唯一的课程，进行一个选择，并重复上述操作直到完成全部选课。

        for my_course in self.user_course:
            self.driver.find_element(By.ID, 'kcxx').send_keys(my_course[1])  # 通过课程信息查找
            self.driver.find_element(By.ID, 'skls').send_keys(my_course[2])  # 通过上课老师查找
            self.driver.find_element(By.XPATH, f"//*[@id='skxq']/option[{my_course[3]+1}]").click()
            # 选择星期(一 - 2, 二 - 3, 三 - 4, 四 - 5, 五 - 6)
            self.driver.find_element(By.XPATH, "html/body/div[3]/input[6]").click()
            self.driver.find_element(By.ID, 'kcxx').clear()  # 清空课程查询框
            self.driver.find_element(By.ID, 'skls').clear()  # 清空上课老师框
            time.sleep(1)
            """
                没刷新出来加一个等待1秒
            """
            course_remain = self.driver.find_element(By.XPATH, "//*[@class='odd']/td[9]").text  # 查看课余量
            if int(course_remain) > 0:
                self.driver.find_element(By.XPATH, "//*[@class='odd']/td[11]/div/a").click()
                """
                    这里缺少了一部分确定的代码
                """
            else:
                print(f'{my_course[1]}选课失败')
            time.sleep(3)  # 3秒的暂停

附加功能

定时功能

使用time库来进行一个定时开始执行

   run_time_h = 9  # 定时小时
    run_time_m = 0  # 定时分钟
    while True:
        current_time = time.localtime(time.time())
        print(str(current_time.tm_hour) + '-' + str(current_time.tm_min) + '-' + str(current_time.tm_sec))
        if current_time.tm_hour == run_time_h and current_time.tm_min == run_time_m:
            break

一些操作的解释

selenium库的使用可以查一下其他博主的介绍
关于元素的定位，一般我习惯于使用通过ID和XPATH来定位(XPATH 就是 "//*[@xx='abc']/li[1]/")这个也可以看看如何去使用。
ddddocr库是看图片的编码来转换成文本

此代码可能出现的问题(完成度不是很高)：

因为我本身不是曲师大的校友所以说我没有进行一个完全的操作，对系统的认识也不是很充分这样写出来的代码当然也完成度也不能说是很高的，下面我就大概说一下这个代码可能产生的问题。

如果系统崩溃(加载不出页面……)，程序应该是不能执行命令。
最后的选课部分只进行了一个点击，并没有确认，因此实际上这段代码是无法完成选课的！
可能图片识别有一定的误差，导致不能登陆成功(ddddocr库可能出的问题)
操作过快以至于元素没有加载出来，这一点我通过time.sleep()函数来进行了一个优化，每次选课间隙也添加一个3秒的一个等待。
可能通过ID、上课老师、上课星期几三个限制无法确定唯一的课程
……

import time
import ddddocr
from selenium import webdriver
from selenium.webdriver.common.by import By


class CClassSelect:
    def __init__(self, i_account, i_password, i_course):
        self.user_account = i_account
        self.user_password = i_password
        self.user_course = i_course
        self.login_url = 'http://202.194.188.38/'
        self.account_url = 'http://202.194.188.38/jsxsd/framework/xsMain.jsp'
        self.driver = webdriver.Chrome()
        self.driver.maximize_window()

    def LoginAccount(self):
        self.driver.get(self.login_url)
        self.driver.find_element(By.ID, 'userAccount').send_keys(self.user_account)
        self.driver.find_element(By.ID, 'userPassword').send_keys(self.user_password)
        identify_code = self.Ocr()
        self.driver.find_element(By.ID, 'RANDOMCODE').send_keys(identify_code)
        self.driver.find_element(By.XPATH, "//*[@class='btn btn-primary login_btn']").click()

    def LoginClassSelect(self):
        time.sleep(1)
        self.driver.find_element(By.XPATH, "//*[@id='onesidebar']/div/ul/li[3]/span").click()
        self.driver.find_element(By.XPATH, "//*[@class='sidebar-menu']/li[7]/a").click()
        time.sleep(1)
        self.driver.find_element(By.XPATH, "//*[@class='treeview-menu menu-open']/li[1]/a").click()
        self.driver.switch_to.frame("Frame1")  # !!
        """
            iframe问题,卡了一段时间这个地方,可以百度到是不在一个frame的原因
            定位不到这个‘进入选课’元素，
        """
        self.driver.find_element(By.ID, "jrxk").click()
        self.driver.find_element(By.XPATH, "//*[@class='Nsb_pw']/div/center/input[1]").click()

    def ClassSelect(self):
        new_window = self.driver.window_handles[-1]
        self.driver.switch_to.window(new_window)
        """
            切换到新的窗口
        """
        self.driver.find_element(By.XPATH, "//*[@id='topmenu']/li[4]/a").click()
        self.driver.switch_to.frame("mainFrame")  # 换frame

        """
            选课代码 ↓
        """
        for my_course in self.user_course:
            self.driver.find_element(By.ID, 'kcxx').send_keys(my_course[1])  # 通过课程信息查找
            self.driver.find_element(By.ID, 'skls').send_keys(my_course[2])  # 通过上课老师查找
            self.driver.find_element(By.XPATH, f"//*[@id='skxq']/option[{my_course[3]+1}]").click()
            # 选择星期(一 - 2, 二 - 3, 三 - 4, 四 - 5, 五 - 6)
            self.driver.find_element(By.XPATH, "html/body/div[3]/input[6]").click()
            self.driver.find_element(By.ID, 'kcxx').clear()  # 清空课程查询框
            self.driver.find_element(By.ID, 'skls').clear()  # 清空上课老师框
            time.sleep(1)
            """
                没刷新出来加一个等待1秒
            """
            course_remain = self.driver.find_element(By.XPATH, "//*[@class='odd']/td[9]").text  # 查看课余量
            if int(course_remain) > 0:
                self.driver.find_element(By.XPATH, "//*[@class='odd']/td[11]/div/a").click()
                """
                    这里缺少了一部分确定的代码
                """
            else:
                print(f'{my_course[1]}选课失败')
            time.sleep(3)  # 3秒的暂停

    def Ocr(self):
        ocr = ddddocr.DdddOcr()
        img = self.driver.find_element(By.ID, 'SafeCodeImg')  # 定位到验证码图片
        img.screenshot('code.png')  # 给验证码元素截图并保存
        with open('code.png', 'rb') as f:
            img_bytes = f.read()  # 读取图片编码
        return ocr.classification(img_bytes)  # 返回图片中的验证码

    def Run(self):
        self.LoginAccount()
        self.LoginClassSelect()
        self.ClassSelect()
        self.driver.quit()


if __name__ == '__main__':
    # 定时运行
    run_time_h = 9  # 定时小时
    run_time_m = 0  # 定时分钟
    while True:
        current_time = time.localtime(time.time())
        print(str(current_time.tm_hour) + '-' + str(current_time.tm_min) + '-' + str(current_time.tm_sec))
        if current_time.tm_hour == run_time_h and current_time.tm_min == run_time_m:
            break

    # 主程序
    input_account = "12345"  # 用户账号
    input_password = "abcde"  # 用户密码
    input_course = [['12345', '张三', 3], ['54321', '李四', 5]]  # 要选的课(ID,上课老师,星期)
    app = CClassSelect(input_account, input_password, input_course)
    app.Run()

选课 selenium self driver find_element Python

有关自动化选课(Python + selenium的更多相关文章

ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2
很好奇，就使用rubyonrails自动化单元测试而言，你们正在做什么？您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您？git中的预提交Hook？只是手动调用？我完全理解测试，但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的，并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您？最佳答案不确定您到底想听什么，但是有几个级别的自动代码库控制:在处理某项功能时，您可以使用类似autotest的内容获得关于哪些有效，哪些无效的即时反馈。要确保您的提
python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样？我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用，需要1秒才能返回，我有100,000多个页面要访问，所以我试图运行多个线程来解决这个问题。有更好的方法吗？classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
Python 相当于 Perl/Ruby ||= - 2
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Pythonconditionalassignmentoperator对于这样一个简单的问题表示歉意，但是谷歌搜索||=并不是很有帮助；)Python中是否有与Ruby和Perl中的||=语句等效的语句？例如:foo="hey"foo||="what"#assignfooifit'sundefined#fooisstill"hey"bar||="yeah"#baris"yeah"另外，类似这样的东西的通用术语是什么？条件分配是我的第一个猜测，但Wikipediapage跟我想的不太一样。
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2
华为OD机试题本篇题目：明明的随机数题目输入描述输出描述：示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o
python - 如何读取 MIDI 文件、更改其乐器并将其写回？ - 2
我想解析一个已经存在的.mid文件，改变它的乐器，例如从“acousticgrandpiano”到“violin”，然后将它保存回去或作为另一个.mid文件。根据我在文档中看到的内容，该乐器通过program_change或patch_change指令进行了更改，但我找不到任何在已经存在的MIDI文件中执行此操作的库.他们似乎都只支持从头开始创建的MIDI文件。最佳答案 MIDIpackage会为您完成此操作，但具体方法取决于midi文件的原始内容。一个MIDI文件由一个或多个音轨组成，每个音轨是十六个channel中任何一个上的
ruby-on-rails - 从应用程序中自定义文件夹内的命名空间自动加载 - 2
我们目前正在为ROR3.2开发自定义cms引擎。在这个过程中，我们希望成为我们的rails应用程序中的一等公民的几个类类型起源，这意味着它们应该驻留在应用程序的app文件夹下，它是插件。目前我们有以下类型:数据源数据类型查看我在app文件夹下创建了多个目录来保存这些:应用/数据源应用/数据类型应用/View更多类型将随之而来，我有点担心应用程序文件夹被这么多目录污染。因此，我想将它们移动到一个子目录/模块中，该子目录/模块包含cms定义的所有类型。所有类都应位于MyCms命名空间内，目录布局应如下所示:应用程序/my_cms/data_source应用程序/my_cms/data_ty
「Python｜Selenium｜场景案例」如何定位iframe中的元素？ - 2
本文主要介绍在使用Selenium进行自动化测试或者任务时，对于使用了iframe的页面，如何定位iframe中的元素文章目录场景描述解决方案具体代码场景描述当我们在使用Selenium进行自动化测试的时候，可能会遇到一些界面或者窗体是使用HTML的iframe标签进行承载的。对于iframe中的标签，如果直接查找是无法找到的，会抛出没有找到元素的异常。比如近在咫尺的例子就是，CSDN的登录窗体就是使用的iframe，大家可以尝试通过F12开发者模式查看到的tag_name,class_name,id或者xpath来定位中的页面元素，会抛出NoSuchElementException异常。解决
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p