标签:
北京、天津求实习,本人大三狗
不知不觉,16年就快过去半年了,上半年强迫自己学了很多东西,都是逼自己的,以至于自己有些东西学的很混乱,还有就是一直犹豫到底该不该学一下JavaScript(不想从事前端的工作),下面慢慢来说说上半年的小结吧。
一、首先是python网络爬虫
这个也算是自己动手做的第一份爬虫吧,开始用的urllib爬取不出来,后来发现这网站用的是动态的网站做出来的,网上查了好久,最终使用的selenium和phantomjs做出来了,现在觉得嘛,selenium还是自动化测试使用的比较多。。。。这个我学到了selenium的代理,还有正则表达式的入门(晕,基本靠乱蒙加百度),字符串的处理(ascii简直无语)。。。。入门python真的好简单,然而后来发现,简单到只要不用就会忘光。。。。
二、flask网站开发
这个项目我还是没有完全搞好,是学姐的毕业设计,三月份的时候做了一下,后来做不下去了,sae实在是太折腾了,不支持本地存储,用里面的storage,我也就呵呵一下,这个项目用了同学给我的爬取教务处的代码,当然爬虫这部分我也添加了一下,碰到的问题也挺多的,第一个是不知道session之前,各种bug,我也是痛恨我自己了,这么low的问题,搞得切换页面就丢失了username,自己还傻傻的建一个类来保存(别笑);第二个jinjia,唉,一接触我还有点乱,这倒像是jsp、php,好吧,仔细认真的学学;第三个,到现在还没解决的,差不多做完发现,学校的个人信息界面是动态的,真是吐血啊,没办法,只能用selenium加phantomjs吧,好吧,又得重新爬取一次,只是pytesseract这个验证码识别实在是太低了;第四个,课表怎么存入数据库,下面是课表的图,请求各位大神给个建议(现在我佩服超级课程表啊)
这个项目真的让我学到了很多,虽然还是没有完成(抱歉了学姐)。。。。。这个项目学到了验证码识别、sqlalchemy的使用(ORM)
三、基于ssh2的商城网站
这个项目是同学的突发奇想,找了三个人,嗯,没错,到最后一直都是只有我在做。。。。。。
前前后后花了一个月吧(四月份),ssh2毕竟几个月没用过了,都忘了很多,这个项目自己做了个热身的test,当然,基于书本的,后来慢慢熟悉了也就让自己放手去做了,碰到的问题就更过了,spring的注解方式,struts能不能二次迭代,hql语句的书写,各个层之间的联系。。。。自己写的代码貌似过2000多了吧,当然,前台用的网上下载的模板,做出来也有模有样,没有支付的跳转,这个项目也没有完成,跟那位同学讨论了一下就停止项目了,他觉得自己规划不太好,好吧,4月份结束了,剩下的那些的语句都差不多一样,无非就是增删改查,基本框架我也熟悉了一遍,好吧,暂停项目。。。。。。
四、大数据
很久之前就想搞大数据,想了想自己的学校(二本的),呵呵,简历HR一看,就那么随手一扔。。。。。。。。。。。5月份开始着手大数据。。。。光是环境就搭了7天,别提了,各种书上的网上的都不一样,有些命令还出不来,就介么换了n本书和n个网站,终于搭建成功了,伪分布式的
我就不打开了,太慢太卡,下面是单机模式的
嗯,知道我成功就行了哈哈哈哈哈,高兴了一天,其实开发的话还是单机模式好吧(毕竟穷,电脑配置也不高),运行了wordcount,爽的一笔,大数据就这么开始慢慢来吧,↖(^ω^)↗
五、Ubuntu
Ubuntu kylin16.04的版本真的推荐新手使用,太漂亮的, 太适合国人使用了。。。
当然,各种命令虐死你。。。。。。。。
上半年的总结完毕,期待下半年的吧,还是第一句话,北京、天津求实习!!!北京、天津求实习!!!北京、天津求实习!!!
如果没有的话暑假就得去考驾照了,顺便留校拼最后的冲刺,ssh2连到基本掌握的,python的数据分析也要掌握,hadoop、spark更要掌握,一切向大数据冲刺!!!加油↖(^ω^)↗
标签:
原文地址:http://www.cnblogs.com/w1570631036/p/5484067.html