伪·从零开始学Python-1.1 认识Python

python的简要介绍
python是一种多模型的、开源、跨平台的脚本语言、高级编程语言、通用型编程语言,由吉多·范罗苏姆(guido van rossum)在1989年圣诞节期间,为了打发无聊的圣诞节而编写。
python是多模型的,指的是它同时支持面向过程和面向对象的程序设计,程序设计方式灵活。
python是开源的,指的是它由非盈利组织——python软件基金会(python software foundation, psf)拥有、管理,由社区驱动,解释器源代码公开,属于自由软件。它在开源促进会(open source initiative,
osi)支持的开源许可证下开发,使得它可以自由使用、分发,用于商业目的也是可以的。这个许可证被psf管理。
python是跨平台的,指的是它可以在多个操作系统上使用、运行,如windows、linux、unix、macos。而且,对于绝大多数使用python编写的代码而言,无需修改或仅需极少量修改即可直接在不同平台上运行。
python是脚本语言(或:解释型语言),指的是它利用解释器将代码一句一句直接运行,不同于编译型语言(通过编译器将整个代码编译为机器码,执行、分发程序时只需编译生成的机器码文件;如c语言)。通常来说,python程序的运行需要解释器和源代码,也可通过封装的方式将其组合,可以在未安装解释器的客户端上使用。
python是高级编程语言,指的是它使用类似于人类语言(而非机器语言)的语言形式来书写代码,具有较高的可读性。
python是通用型的编程语言,指的是它可以编写解决任何问题的应用程序。
python的优势与劣势
前面提到过,python是通用型的编程语言,指的是它可以编写解决任何问题的应用程序。
不过,这并不是python的优势:它可以写的东西,其他语言也可以写。
python相对于其他语言有两个明显的优势:
第一,它提供了非常完善的基础代码库,覆盖了网络、文件、gui、数据库、文本等大量内容,被形象地称作“内置电池(batteries included)”。用python开发,许多功能不必从零编写,直接使用现成的即可。
第二——也是最重要的,它拥有庞大的第三方库,除了直接使用外,还可以通过pip、conda等软件包管理工具来下载、安装、更新,而且许多知名的第三方库可以非常轻松地被调用,功能也相当强大。
作为脚本语言,python的运行效率不如编译型语言,运行相同功能的代码所需时间更长。但是,随着计算机硬件技术的发展,这样的差别变得可以忽略。
但是,由于它是解释型语言,所以依赖于解释器,在效率、对内存的操作和处理器的控制明显比编译型语言弱。所以,它不适合写系统软件。尤其是操作系统,由于高度依赖于硬件控制,它应该是不能写的。
而且,由于ios的生态系统的高度封闭性,它也不能直接写ios应用;对于android,虽然有适用于android的解释器,但其封装还是有难度的,而且针对于android上的python的库(尤其是gui相关的库)和文档不发达,所以它目前也不适宜写android应用。
有很多人把python当作“胶水语言”来使用,即使用python将其他语言编写的程序进行集成和封装。在google内部的很多项目,例如google应用服务引擎,使用c++编写性能要求极高的部分,然后用python或java/go调用相应的模块。
这很难讲,不过,2004年,python已在google内部使用,google召募许多python高手,但在这之前就已决定使用python。他们的目的是尽量使用python,在不得已时改用c++;在操控硬件的场合使用c++,在快速开发时候使用python。
——马特利(alex martelli),《python技术手册》的作者
python目前的应用
很多大公司,包括google、yahoo等,甚至nasa(美国航空航天局)都大量地使用python。
目前python主要有下列热门领域的应用:
爬虫
使用requests构建http请求,使用selenium和phantomjs获取网页内容,使用beautifulsoup解析html,可以高效地爬取数据。
科学计算、数据分析与数据可视化
使用numpy、scipy、matplotlib、pandas、wordcloud等第三方库进行高等数学、线性代数等相关的科学计算、对数据进行可视化输出,使用jieba进行分词。可以部分替代付费的matlab、office,而且在绘图的信息获取上比office更加灵活。
matplotlib
人工智能与机器学习
谷歌开发维护的tensorflow以python为主,进而推动了其他的关于人工智能的开发,所以现在凡是人工智能、机器学习,都离不开python。
使用tensorflow的公司
交易
有人通过爬虫爬取新闻和交易信息,通过数据分析和预测辅助决策;有人写出交易的程序,如vn.py。
vn.py
web框架
有django这样的功能齐全的框架,也有flask、tornado这样的轻量级框架。使用python作为web框架的最大的好处就是可以以网站的形式轻松解决上面的问题。许多大型网站就是用python开发的,例如youtube、instagram,还有国内的豆瓣。
django
硬件控制与物联网
尽管python是解释型语言,但树莓派为代表的单板计算机解决了它在控制硬件上的问题。在它上面可以在linux的环境下用python控制gpio,从而控制外围硬件。另外,也有人正在开发硬件解释器,可以在上面直接运行python代码控制gpio,如python-on-a-chip。
树莓派
两大版本
pyhon目前同时有两个最新版本供下载。这是因为兼容性的问题。
python官网上同时提供两种版本的最新版下载
python 3.0于2008年12月3日发布,此版由于追求语言设计上的完美、不带入过多的累赘,不完全兼容之前的python源代码。由于python拥有大量的第三方库,所以这些库都需要重写以兼容新版本。到了今天,由于3.x版越来越普及,许多主要的第三方库都完成了适配或有了替代品,而且有一些已经开始抛弃2.x版的适配,所以现在建议使用3.x版本进行python开发。
以下如涉及到版本问题,使用“python 2”“python 3”指代对应版本系统。
在python 3.0发布的时候,同期的python 2的版本为2008年10月2日发布的python 2.6.0。在此及之后的python 2版本中也可直接或间接使用python 3的一些特性,但并不是完全兼容。而在python 3中也附带有2to3来将适配于python 2的代码转换为适配于python 3的代码,但也不是万能的。
之前放过的图,图中可以看出python 2.7可以直接使用python 3的print语句
python 2的最后的版本为python 2.7,但也是有更新的。
但是,正是由于上面的问题,我们在学习python的时候需要特别注意python的版本。虽然python是最近才走进大众的视野的,但是许多学校的图书馆很早就藏有关于python的较老的书籍,而它们一般都是基于python 2编写的,如果在python 3下运行会报错。而且,一般的书籍不会标注python的版本号(也许是编写时想不到新版的python会这样)!所以在图书馆借阅关于python的书籍的话,必须要翻阅其中的代码,以便辨认版本。
据我的经验,查看代码时,只要找输出(print)语句,看它的写法,十有八九就能准确判断版本:
python 3中的输出语句如同:
print(hello world)
python 2中的输出语句如同:
print hello world
简而言之,就是带不带括号的区别:带括号是3,不带括号是2。
虽然python 2.6、python 2.7也可以在输出语句上如同python 3那样写,但是那个时候的程序员由于习惯原因是不会这么写的。
如果是购买书籍的话,如果是比较负责的编者或出版商,而且书籍是最近几年发布的话,这样的问题可能会有所避免。
但是,python 3与python 2的区别绝不仅仅是print语句的变化,还有许多。这不属于本教程内容,感兴趣的话可以自行查阅。
本教程基于python 3的最新版本。
作业
上面对于python的简要介绍中使用了一些词语,我在这里对于它们的解释并不完全,请自行查找关于它们的更多信息,尽量搞懂它们。(其实“面向对象”我也没搞懂……)
在python界中有一句话:“人生苦短,我用python。”根据本节讲述内容说明原因(当然,如果你愿意查找资料,也可以不限于本节内容来说明)。
参考资料
除0.1节提到的之外,还有:
about python | python.org
download python | python.org
matplotlib - 维基百科,自由的百科全书
tensorflow
vn.py - 基于python的开源交易平台开发框架 - vn.py
the web framework for perfectionists with deadlines | django
raspberry pi - raspberry pi hardware guide requirements | raspberry pi learning resources