Python开发丨如果你是python新手,千万别犯这些错误

在学习python初期,往往会犯一些错误,这些错误是不自知的,但是早早了解了这些,比犯了错后才明白好的多。这里就总结了python新手常常遇到的问题。
1.不知道python版本
这是一个在stackoverflow上反复出现的问题。许多人能写出在某个版本上完美工作的代码,但在他们在自己的系统上安装有不同版本的python。要确保你知道你正在使用的python版本。
你可以通过下边的代码查看python版本:
[pythontab@testserver]$ python--version
python2.7.10
[pythontab@testserver]$ python--v
上面两种方法都是可以的
2.不使用版本管理器
pyenv是一个极好的管理不同python版本的工具,但很不幸,它只工作在*nix系统上。在mac系统上,你可以简单地通过brew install pyenv安装它,在linux上,也有一个自动安装程序。
3.沉迷于一行程序
许多人热衷于一行程序带来的兴奋感。即使他们的一行解决方案比一个多行解决方案低效,他们也会吹嘘。
python中的一行程序在本质上意味着具有多个表达式的复杂推导。例如:
l=[mfora, binzip(this, that)ifb.method(a) !=bforminbifnotm.method(a, b)
老实讲,我编造了上面的例子。但我看到很多人都写类似的代码。这样的代码在一个星期后就会变得难以理解。如果你想做一些稍微复杂的事情,例如根据条件简单地在一个列表或集合中添加一个元素,你可能就会犯错误。
单行代码并不是什么成就,是的,他们可能看起来很灵活,但不是什么成就。想象一下,这就像是你在打扫房间时把所有的东西都塞进你的衣橱。好的代码应该是干净的,易于阅读的和高效的。
4.利用错误的方式初始化一个集合
这是一个更微妙的问题,可能让你措手不及。集合推导很像列表推导。
>>> { nforninrange(10)ifn%2==0}
{0,8,2,4,6}
>>>type({ nforninrange(10)ifn%2==0})
上面就是集合推导的一个例子。集合就像列表,也是一个容器。所不同的是,一个集合中不能有任何重复的值,而且是无序的。看到集合推导人们经常错误地认为{}能初始化一个空集合。但其实不然,它初始化一个空字典。
>>>{}
{}
>>>type({})
如果你想初始化一个空集合,可以简单地调用set()方法。
>>>set()
set()
>>>type(set())
注意一个空集合用set()表示,但是一个包含一些元素的集合就就要用花括号包围元素来表示。
>>>s=set()
>>>s
>>>s.add(1)
{1}
>>>s.add(2)
{1,2}
这和直觉是相反的,因为你期望类似于set([1, 2])的一些东西。
5.误解gil
gil(全局解释器锁)意味着在python程序中,任意一个时间点只能有一个线程在运行。这意味着当我们创建一个线程并希望它并行运行时,它并不会那样。python解释器实际的工作是在不同的运行线程之间快速进行切换。但这只是对实际发生事情的一个非常简单的解释,实际情况要复杂的多。有很多种并行运行的实例,例如使用本质为c扩展的各种库。但运行python代码时,大部分时间里它不会并行执行。换句话说,python中的线程并不像java或c++中的线程。
许多人会尝试为python辩解,说这些都是真正的线程。这确实是真的,但并不能改变这样一个事实:python处理线程的方式和你期望的方式是不同的。ruby语言也有相同的情况(ruby也有一个解释器锁)。
指定的解决方案是使用multiprocessing模块。multiprocessing模块提供process类,它是一个对fork的很好的覆盖。然而,fork过程比一个线程的代价高得多,所以你可能不会每次都能看到性能上的提升,因为不同的process之间需要做大量的工作来进行相互协调。
然而,这个问题并不存在于每一个python的实现版本中。例如,python的一个实现pypy-stm就试图摆脱gil(仍未稳定)。建立在其他平台,如jvm(jython)或clr(ironpython),上的python实现,也没有gil的问题。
总之,使用thread类时要多加小心,你得到的可能不是你想要的。
6.使用旧式类
在python 2中,有两种类型的类,分别为“旧式”类和“新式”类。如果你使用python 3,那么你默认使用“新式”类。为了确保在python2中使用“新式”类,你需要让你新创建的每一个类都继承object类,且类不能已继承了内置类型,例如int或list。换句话说,你的基类、类如果不继承其他类,就总是需要继承object类。
classmynewobject(object):
# stuff here
这些“新式”类解决一些老式类的根本缺陷,想要详细了解新式类和旧式类请参见《python新式类和旧式类区别》《python2中的__new__与__init__,新式类和经典类》。
7.按错误的方式迭代
对于这门语言的新手来说,下边的代码是非常常见的:
forname_indexinrange(len(names)):
print(names[name_index])
在上边的例子中,没有必须调用len函数,因为列表迭代实际上要简单得多:
fornameinnames:
print(name)
此外,还有一大堆其他的工具帮助你简化迭代。例如,可以使用zip同时遍历两个列表:
forcat, doginzip(cats, dogs):
print(cat, dog)
如果你想同时考虑列表变量的索引和值,可以使用enumerate:
forindex, catinenumerate(cats):
print(cat, index)
在itertools中也有很多有用的函数供你选择。然而请注意,使用itertools函数并不总是正确的选择。如果itertools中的一个函数为你试图解决的问题提供了一个非常方便的解决办法,例如铺平一个列表或根据给定的列表创建一个其内容的排列,那就用它吧。但是不要仅仅因为你想要它而去适应你代码的一部分。
滥用itertools引发的问题出现的过于频繁,以至于在stackoverflow上一个德高望重的python贡献者已经贡献他们资料的重要组成部分来解决这些问题。
8.使用可变的默认参数
我多次见到过如下的代码:
deffoo(a, b, c=[]):
# append to c
# do some more stuff
永远不要使用可变的默认参数,可以使用如下的代码代替:
deffoo(a, b, c=none):
ifcisnone:
c=[]
与其解释这个问题是什么,不如展示下使用可变默认参数的影响:
>>>deffoo(a, b, c=[]):
... c.append(a)
... c.append(b)
...print(c)
...
>>>foo(1,1)
[1,1]
[1,1,1,1]
[1,1,1,1,1,1]
同一个变量c在函数调用的每一次都被反复引用。这可能有一些意想不到的后果。
以上这些问题都是新手常常会遇到的问题,但也并不仅仅只是这些,还有些人会用以前熟知的语言习惯来使用python,这也会造成很多问题。