(总结)python在各领域的应用

按照Python的几个应用点来总结的。

基础语法

很好的Python、JavaScript、Git学习网站,使用的时候建议配上Chrome的插件adblock。有时候也可以充当一个函数查找的功能,有一些内置函数的介绍和例子。 我的Python学习之路就是从这里开始的,别的书也没怎么看过。

爬虫

这个课是在中国大学MOOC上的,老师是北理的嵩天老师,老师讲课一幅很稳的样子,老师本文讲课说话的水平也很高。当然这个只是入门。同时,嵩天老师在中国大学MOOC上也有很多其他Python学习的视频,可以根据自己的兴趣学习,其他的一些我都没有完整看完,所以在此处不做推荐。我之所以没有看完,不是因为讲的不好,是因为我个人的惰性原因。

  • 一本书 :Python网络数据采集

emmm、我有电子版的书籍。我基本上是跟着全书的做了一遍,书的质量也很高。

说实话,我用这个用的不怎么样,也没有好好学这个框架。不过这个框架确实是一个很优秀的框架,会让你有一个基本的项目思想。这个框架的学习的话直接看官方文档最好了,而且还有中文版的。 上述的东西可能就有点多了,但是慢慢来就行,视频的话可以倍速看,但是要边看边自己动手操作。第二本书可以翻阅,根据自己的弱项专门看就行。第三个项目文档可以作为检阅的工具,需要的时候差一下就行。 几个练手的项目

  • 80s.tw, 经常在上面下载电影,网站不复杂,可以练练手。

  • 知乎, 这个其实有点复杂,中间有些东西需要自己摸索,这样可以快速成长。

有些网站我也记不清了,不过我还真没像很多文章一样就知道爬妹子图,0.0,爬虫技术的增加,就是在不断的挑战反爬虫机制。所以进阶的话,就不断地去做,大量的对单个网页,一个域名下的所有网站,挑战设置了很多反爬虫策略的网站。 对、还有一个资源是ip池,也可以自己爬,但是感觉用的效果一般。推荐一个卖ip的地方。

  • 大象大理IP, 推荐计数版的,5块钱20000个ip。可以用半年。

数据科学领域

目前其实个人在这方面没有深究,主要是一些简单的库使用。只推荐自己使用过的。

  • numpy, Python自身没有数组的,在Python中用列表的概念,numpy提供了这个,而且,有很多向量化的操作在神经网络的搭建中被大量使用。

  • pandas, 我基本上就是用它来处理表格数据,使用的时候也很强大,面对上百万条数据也不虚,前提是你不要使用循环遍历DataFrame。它的操作有点像并行操作。我目前就用它来做数据预处理的工作。

  • scikit-learn, 数据挖掘和数据分析工具,提供了很多算法的函数。提供中文文档,用的时候查文档就行了,不用单独学习。

  • SciPy, 这个我没怎么用个,也是我下一阶段要学习的库。

  • matplotlib, 数据科学怎么能少得了数据可视化,用这个库就可以直接作图看结果了,还是可以的。现在不是也有一个叫做数据可视化过程嘛,就是把神经网络的学习过程用可视化表现出来。感觉很酷。

暂时就这么多吧,这个我没怎么利用教程,主要看文档吧,前两个和第三个我有电子书。scikitlearn用官方文档就行。优先学习前两个库,numpy和pandas。

web

先说学习资源吧、

在廖雪峰的网站Python章节中的最后一节有一个web开发实战。这个实战的难度相对来说还是比较大的,要从头自己写框架、写orm、写MVC等等。这些知识需要Python前面的知识学的很扎实才能很好的完成。 除了自己写这些框架之外,还可以使用Python的两个流行框架django和flask,使用框架相较于前面的从头自己做少写了很多代码。flask没用过,就不说了。

django的两个博客之一,可以查阅一下整个流程。有一些内容是不需要的,就没必要去做了,比如自动化部署等部分的内容。

Django2.0的官方文档,很全,很细致,需要英语水平差不多。还有很多bug的解决方法在其官网code都能找到解决办法。 emmm、用框架不可耻。不过我们需要能在现有框架的基础上达到能自己拿到框架源码,根据自己的需求等去修改、完善这个框架才是正解。 其实web开发需要的知识面不仅仅涉及到后端,同样的前端和后端的结合也是一个很重要的问题,即前后端数据的传递,前端页面的设计,对于我们不是专门做UI设计的来说,前端页面在网上找一找模板就行,比如bootstrap模板等。 同时Python web开发的一整个框架如下图所示,搞懂了这个web框架也就理清了怎么开始开发web的这个问题了。

哦、我还有Django开发的一本电子书。 待更。