码迷,mamicode.com
首页 > 编程语言 > 详细

用 Python 实现武科大教务处自动抢课

时间:2018-02-25 13:16:19      阅读:1634      评论:0      收藏:0      [点我收藏+]

标签:正则表达式   image   inf   slist   匹配   函数   jsm   ppa   username   

首先分析网页,找到教务处登录的验证码
技术分享图片

然后用 Python 直接把验证码下载到本地(整个程序通过 requests 库实现):

def GetRandCode():
    url = r‘http://jwxt.wust.edu.cn/whkjdx/verifycode.servlet‘
    ans = foo.get(url)
    with open(‘randcode.jpg‘, ‘wb‘) as file:
        file.write(ans.content)

找到验证码之后继续找到登录的api,我们可以发现网页发出了一个 post 请求,还有相关参数:
技术分享图片

接着要实现登录就非常简单了,我先简单写了个登录的实现:

foo = foo = requests.session()
headers = {
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.110 Safari/537.36",
}

def Login(username, password, randcode):
    url = r‘http://jwxt.wust.edu.cn/whkjdx/Logon.do?method=logon‘
    information = {‘USERNAME‘: username, ‘PASSWORD‘: password, ‘RANDOMCODE‘: randcode}
    ans = foo.post(url, data = information, headers = headers)
    ans.raise_for_status()
    ans.encoding = ans.apparent_encoding
    if ans.text.find(r‘http://jwxt.wust.edu.cn/whkjdx/framework/main.jsp‘) != -1:
        return True
    else:
        return False

测试了一下发现是可以正常登录的,紧接着就要做获取选课列表了,方法同上。
我发现本学期的获取选课列表的地址是 http://jwxt.wust.edu.cn/whkjdx/xkglAction.do?method=toFindxskxkclb&xnxq01id=2017-2018-2&zzdxklbname=1&type=1&jx02kczid=null 很明显参数 xnxq01id 应该就是学期号了,规则也很容易发现。然后我就直接用Python实现了一下,然后发现网页会返回没有访问权限的消息。回过头分析登录过程,发现还有一个 SSO(点对点登录)的 API,然后试了一下新的登录函数:

def Login(username, password, randcode):
    url = r‘http://jwxt.wust.edu.cn/whkjdx/Logon.do?method=logon‘
    SSOurl = r‘http://jwxt.wust.edu.cn/whkjdx/Logon.do?method=logonBySSO‘
    information = {‘USERNAME‘: username, ‘PASSWORD‘: password, ‘RANDOMCODE‘: randcode}
    ans = foo.post(url, data = information, headers = headers)
    ans.raise_for_status()
    ans.encoding = ans.apparent_encoding
    ans2 = foo.post(SSOurl, headers)
    ans2.raise_for_status()
    if ans.text.find(r‘http://jwxt.wust.edu.cn/whkjdx/framework/main.jsp‘) != -1:
        return True
    else:
        return False

通过新的登录函数可以正常获取公选课选课列表。具体实现如下:

def GetCoursesList():
    url = r‘http://jwxt.wust.edu.cn/whkjdx/xkglAction.do?method=toFindxskxkclb&xnxq01id=2017-2018-2&zzdxklbname=1&type=1&jx02kczid=null‘
    ans = foo.get(url, headers = headers)
    ans.raise_for_status()
    ans.encoding = ans.apparent_encoding
    CoursesList = re.findall(r‘<td height="23"  style="text-overflow:ellipsis; white-space:nowrap; overflow:hidden;" width="\d+" title=".*"‘, ans.text)
    XKLJList = re.findall("javascript:vJsMod\(\‘.*\‘", ans.text)
    keyname = [‘kcmc‘, ‘kkdw‘, ‘zyfx‘, ‘xf‘, ‘yxrs‘, ‘yl‘, ‘skjs‘, ‘skzc‘, ‘sksj‘, ‘skdd‘, ‘kcsx‘, ‘kcxz‘, ‘fzm‘, ‘xbyq‘]
    result = []
    item = {}
    bar = 0
    index = 0
    for i in CoursesList:
        Left = i.find(r‘title="‘)
        Right = i[Left + 7:].find(r‘"‘)
        text = i[Left + 7:Left + Right + 7]
        #print(i)
        #print(text)
        item[keyname[bar]] = text
        bar = bar + 1
        if (bar == 14):
            Left = XKLJList[index].find("‘")
            Right = XKLJList[index][Left + 1:].find("‘")
            text = XKLJList[index][Left + 1:Left + Right + 1]
            item[‘xklj‘] = text
            index = index + 1

            result.append(item)
            item = {}
            bar = 0
    return result

其中正则表达式匹配所有网页列表中的信息,每 14 项是一个课程的全部信息,具体信息对应哪些,可以看列表的表头,我用字典来保存这些课程的信息,然后存到一个列表里,每个信息的拼音简写就是字典中对应的键的名称,然后又有一个 xklj 用来保存选课时需要通过 get 访问的链接,这样实现选课就非常简单了,只需要对这个链接发送 get 请求即可:

def ChoseCourseByLink(link):
    url = ‘http://jwxt.wust.edu.cn‘ + link
    ans = foo.get(url, headers = headers)
    ans.raise_for_status()
    ans.encoding = ans.apparent_encoding
    return ans.text

然后用同样的办法构造学分制选课的列表:

def GetCoursesList2():
    url = r‘http://jwxt.wust.edu.cn/whkjdx/xkglAction.do?method=toFindxskxkclb&xnxq01id=2017-2018-2&zzdxklbname=6&type=1&jx02kczid=null‘
    ans = foo.get(url, headers = headers)
    ans.raise_for_status()
    ans.encoding = ans.apparent_encoding
    CoursesList = re.findall(r‘<td height="23"  style="text-overflow:ellipsis; white-space:nowrap; overflow:hidden;" width="\d+" title=".*"‘, ans.text)
    XKLJList = re.findall("javascript:vJsMod\(\‘.*\‘", ans.text)
    keyname = [‘kcmc‘, ‘kkdw‘, ‘zyfx‘, ‘xf‘, ‘yxrs‘, ‘yl‘, ‘skjs‘, ‘skzc‘, ‘sksj‘, ‘skdd‘, ‘kcsx‘, ‘kcxz‘, ‘fzm‘, ‘xbyq‘]
    result = []
    item = {}
    bar = 0
    index = 0
    for i in CoursesList:
        Left = i.find(r‘title="‘)
        Right = i[Left + 7:].find(r‘"‘)
        text = i[Left + 7:Left + Right + 7]
        #print(i)
        #print(text)
        item[keyname[bar]] = text
        bar = bar + 1
        if (bar == 14):
            Left = XKLJList[index].find("‘")
            Right = XKLJList[index][Left + 1:].find("‘")
            text = XKLJList[index][Left + 1:Left + Right + 1]
            item[‘xklj‘] = text
            index = index + 1

            result.append(item)
            item = {}
            bar = 0
    return result

这样一个简单的抢课库就实现了,抢课的时候只需要调用相关的接口就行了,最终全部代码在我的 Github 上:https://github.com/Rugel/wustjwxt

用 Python 实现武科大教务处自动抢课

标签:正则表达式   image   inf   slist   匹配   函数   jsm   ppa   username   

原文地址:https://www.cnblogs.com/Uwgl/p/8468923.html

(0)
(1)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!