Python笔记··By/蜜汁炒酸奶

python版成绩查询又前进一步

学了点python后,看到各种爬虫教程,原本想做个统计平均学分绩的小爬虫。当真正动手时,发现了各种难题,由于网上多数都是没有验证码的模拟登录,而方正教务系统却是存在验证码的,于是出现了之前关于“ubuntu 14.04 下安装 PyTesser 进行OCR识别”漫长安装。原本以为可以简简单单的完成验证,但意外总是会有的,它竟然仅支持最简单的那种没有任何变形的验证码,再次深入百度发现关于验证码的问题是个长期而浩瀚的任务,就自己目前这点含量。。。 最终无奈地对这条路宣布了死刑,然而幸运总是于不经意间到来,偶然的一次搜索,找到了不需要验证码的登录界面,在之后的实验中我竟然找到了第二个不需要验证码的界面。 终于可以按照教程改自己的了,但这次不出现登陆界面改出现系统繁忙的提示。那么问题来了,这是为什么呢/。后来仔细对照,发现 [callout class=“info” title=“”] 提交post请求后获取登录后的页面即可[/callout],而我依旧在请求打开登陆界面= =。 由于网络基础比较薄弱,抓包什么的也都是现学现用,之后就按照登录的写法去请求成绩页面,去总是在成绩的默认页面,获取不到其他的成绩方式,在实验了“一七得七,二七四十八,三八妇女节,五一劳动节,六一儿童节”反正好多次,另开了n次.py文件后,终于误打误撞的成功了。回首之前写的那些‘无用’代码,感觉主要问题应该是存在在头文件(Headers)或(PostData)上。 [callout class=“info” title=“”] 最大的可能是Cookies值没有一直统一,或__VIEWSTATE取值错误,或两者都有问题。 [/callout] 能力有限,目前能想到的原因也就这些。至于代码及各种参考资料,会在真正完成第一版后公布出来。 至于现在。。就到这里吧。最后附上初步成功查询的结果图,至于成绩,就不在这现眼啦O(∩_∩)O~ Python_chengjiiaxun.jpg

预览
Loading comments...
13 条评论
  • W

    博主的js和背景有问题,chrome下

    • W

      回复 @吴尼玛: O(∩_∩)O谢谢提醒,能说详细些么,粗心的我一直在chrome玩耍没注意到饿

  • W

    不知道是啥教务系统额 祝博主新年快乐,羊年大吉。博客拜年咯

    • W

      回复 @恋羽: O(∩_∩)O谢谢,正方,拜个晚年

  • W

    很不错啊!1

  • W

    :eek: 介个我不懂···

    • W

      回复 @Me.稀奇: 这才叫正常人,什么都懂得是超人

  • W

    识别验证码,应该还是很难的,还好找到了绕过的地址~

  • W

    一款优雅的语言

  • W

    呵呵,真是恭喜你好,解决验证码的问题。一点一点地钻研吧,很快会有眉目的。

example
预览