10个Python小技巧

列表推导式

你有一个list: bag = [1, 2, 3, 4, 5]

现在你想让所有元素翻倍,让它看起来是这个样子: [2, 4, 6, 8, 10]

大多初学者,根据之前语言的经验会大概这样来做

bag = [1, 2, 3, 4, 5]

for i in range(len(bag)):

bag[i] = bag[i] * 2

但是有更好的方法:

bag = [elem * 2 for elem in bag]

很简洁对不对?这叫做Python的列表推导式 。

遍历列表

还是上面的列表。如果可能尽量避免这样做:

bag = [1, 2, 3, 4, 5]

for i in range(len(bag)):

print(bag[i])

取而代之的应该是这样:

bag = [1, 2, 3, 4, 5]

for i in bag:

print(i)

如果 x 是一个列表,你可以对它的元素进行迭代。多数情况下你不需要各元素的索引,但如果你非要这样做,那就用 enumerate 函数。它像下边的样子:

bag = [1, 2, 3, 4, 5]

for index, element in enumerate(bag):

print(index, element)

非常直观明了。

元素互换

如果你是从java或者C语言转到Python来,可能会习惯于这样:

a = 5

b = 10

# 交换 a 和 b

tmp = a

a = b

b = tmp

但Python提供了一个更自然更好的方法!

a = 5

b = 10

# 交换a 和 b

a, b = b, a

初始化列表

假如你要一个是10个整数0的列表,你可能首先想到:

bag = []

for _ in range(10):

bag.append(0)

换个方式吧:

bag = [0] * 10

看,多优雅。

注意:如果你列表包含了列表,这样做会产生浅拷贝。

举个例子:

bag_of_bags = [[0]] * 5 # [[0], [0], [0], [0], [0]]

bag_of_bags[0][0] = 1 # [[1], [1], [1], [1], [1]]

Oops!所有的列表都改变了,而我们只是想要改变第一个列表。

改一改啦:

bag_of_bags = [[0] for _ in range(5)]

# [[0], [0], [0], [0], [0]]

bag_of_bags[0][0] = 1

# [[1], [0], [0], [0], [0]]

“过早优化是万恶之源”问问自己,初始化一个列表是必须的吗?

构造字符串

你会经常需要打印字符串。要是有很多变量,避免下面这样:

name = "Raymond"

age = 22

born_in = "Oakland, CA"

string = "Hello my name is " + name + "and I'm " + str(age) + " years old. I was born in " + born_in + "."

print(string)

额,这看起来多乱呀?你可以用个漂亮简洁的方法来代替, .format 。

这样做:

name = "Raymond"

age = 22

born_in = "Oakland, CA"

string = "Hello my name is {0} and I'm {1} years old. I was born in {2}.".format(name, age, born_in)

print(string)

返回tuple元组

Python允许你在一个函数中返回多个元素,这让生活更简单。但是在解包元组的时候出出线这样的常见错误:

def binary(): return 0, 1

result = binary()

zero = result[0]

one = result[1]

这是没必要的,你完全可以换成这样:

def binary(): return 0, 1

zero, one = binary()

要是你需要所有的元素被返回,用个下划线 _ :

zero, _ = binary()

就是这么高效率!

访问Dict字典

你也会经常给 dicts 中写入 key,value (键,值)。

如果你试图访问一个不存在的于 dict 的 key ,可能会为了避免 KeyError 错误,你会倾向于这样做:

countr = {}

bag = [2, 3, 1, 2, 5, 6, 7, 9, 2, 7]

for i in bag:

if i in countr:

countr[i] += 1 else:

countr[i] = 1

for i in range(10):

if i in countr:

print("Count of {}: {}".format(i, countr[i]))

else:

print("Count of {}: {}".format(i, 0))

但是,用 get() 是个更好的办法。

countr = {}

bag = [2, 3, 1, 2, 5, 6, 7, 9, 2, 7]

for i in bag:

countr[i] = countr.get(i, 0) + 1

for i in range(10):

print("Count of {}: {}".format(i, countr.get(i, 0)))

当然你也可以用 setdefault 来代替。

这还用一个更简单却多费点开销的办法:

bag = [2, 3, 1, 2, 5, 6, 7, 9, 2, 7]

# {2: 3, 3: 1, 1: 1, 5: 1, 6: 1, 7: 2, 9: 1}

countr = dict([(num, bag.count(num)) for num in bag])

for i in range(10):

print("Count of {}: {}".format(i, countr.get(i, 0)))

你也可以用 dict 推导式。

countr = {num: bag.count(num) for num in bag}

这两种方法开销大是因为它们在每次 count 被调用时都会对列表遍历。

使用库

现有的库只需导入你就可以做你真正想做的了。

还是说前面的例子,我们建一个函数来数一个数字在列表中出现的次数。那么,已经有一个库就可以做这样的事情。

from collections import Counter

bag = [2, 3, 1, 2, 5, 6, 7, 9, 2, 7]

countr = Counter(bag)for i in range(10):

print("Count of {}: {}".format(i, countr[i]))

一些用库的理由:

代码是正确而且经过测试的。

它们的算法可能会是最优的,这样就跑的更快。

抽象化:它们指向明确而且文档友好,你可以专注于那些还没有被实现的。

最后,它都已经在那儿了,你不用再造轮子了。

在列表中切片/步进

你可以指定 start 的点和 stop 点,就像这样 list[start:stop:step] 。我们取出列表中的前5个元素:

bag = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

for elem in bag[:5]:

print(elem)

这就是切片,我们指定 stop 点是5,再停止前就会从列表中取出5个元素。

要是最后5个元素怎么做?

bag = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

for elem in bag[-5:]:

print(elem)

没看明白吗? -5 意味着从列表的结尾取出5个元素。

如果你想对列表中元素间隔操作,你可能会这样做:

bag = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

for index, elem in enumerate(bag):

if index % 2 == 0:

print(elem)

但是你应该这样来做:

bag = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

for elem in bag[::2]:

print(elem)

# 或者用 ranges

bag = list(range(0,10,2))

print(bag)

这就是列表中的步进。 list[::2] 意思是遍历列表同时两步取出一个元素。

你可以用 list[::-1] 很酷的翻转列表。

tab键还是空格

长时间来看,将tab和空格混在一起会带来很多不必要的麻烦,你会看到 IndentationError: unexpected indent 。不管你选择tab键还是空格键,你应该在你的文件和项目中一直保持使用。

一个使用空格而不是tab的原因是,tab不是在所有编辑器中都一样的。视呢所用的编辑器,tab可能会被当作2到8个空格。

你也可以在写代码时用空格来定义tab。这样你可以自己选择用几个空格来当做tab。大多数Python用户是用4个空格。

本页共156段,3860个字符,6330 Byte(字节)