你们祈求,就给你们;寻找,就寻见;叩门,就给你们开门。因为凡祈求的,就得着;寻找的,就寻见;叩门的,就给他们开门。
所以无论何事,你们愿意人怎样待你们,你们也要怎样待人,因为这就是律法和先知的道理。(MATTHEW 7:7-8,12)
#列表(2)
“列表是Python的苦力”,那么它或者对它能做什么呢?
在交互模式下这么操作,就看到有关它的函数或方法了。
>>> dir(list)
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']
上面的结果中,以双下划线开始和结尾的暂时不管,如__add__
(以后会管的)。就剩下以下几个了:
'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'
这几个都是在编程实践中常常要用到的。
##常用的列表函数
###append和extend
《列表(1)》中,对列表的基本操作提到了list.append(x)
,也就是将某个元素x
追加到已知的一个列表后边。
除了将元素追加到列表中,还能够将两个列表合并,或者说将一个列表追加到另外一个列表中。按照前文的惯例,还是首先看官方文档中的描述:
list.extend(L)
Extend the list by appending all the items in the given list; equivalent to a[len(a):] = L.
向所有正在学习本内容的朋友提供一个成为优秀程序员的必备:看官方文档,是必须的。
官方文档的这句话翻译过来:
通过将所有元素追加到已知列表来扩充它,相当于a[len(a):]= L
。
英语太烂,翻译太差。直接看例子,更明白。
>>> la = [1, 2, 3]
>>> lb = ['qiwsir', 'python']
>>> la.extend(lb)
>>> la
[1, 2, 3, 'qiwsir', 'python']
>>> lb
['qiwsir', 'python']
变量la
指向一个列表对象;变量lb
也指向一个列表对象。为了简单,就说成la
和lb
两个列表。
将lb追加到la的后面,也就是把lb中的所有元素加入到la中,即让la扩容。
学程序一定要有好奇心,我在交互环境中,经常实验一下自己的想法,有时候是比较愚蠢的想法。
>>> la = [1,2,3]
>>> b = "abc"
>>> la.extend(b)
>>> la
[1, 2, 3, 'a', 'b', 'c']
>>> c = 5
>>> la.extend(c)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable
仔细观察,能看出什么来吗?
原来,如果extend(str)
的时候,字符串被以字符为单位拆开,然后追加到la里面。
如果extend的对象是数值型,则报错。
extend的对象是一个列表,如果是字符串,则Python会先把它按照字符为单位转化为列表再追加到已知列表后面。
不过,别忘记了前面官方文档的后半句话,它的意思是:
>>> la = [1, 2, 3, 'a', 'b', 'c']
>>> lb = ['qiwsir', 'python']
>>> la[len(la):]=lb
>>> la
[1, 2, 3, 'a', 'b', 'c', 'qiwsir', 'python']
list.extend(L)
等效于 list[len(list):] = L
,L是待并入的列表。
联想到到上一讲中的一个list函数list.append()
,有类似之处。
extend(...) L.extend(iterable) -- extend list by appending elements from the iterable
上面是在交互模式中输入help(list.extend)
后得到的说明。这是非常重要而且简单的获得文档帮助的方法。
该文档中出现了iterable,什么是iterable?这个从现在开始,会经常遇到,所以是要搞搞清楚的。
iterable,中文含义是“可迭代的”。在Python中,还有一个词,就是iterator,这个叫做“迭代器”。这两者有着区别和联系。不过,这里暂且不说那么多,说多了就容易糊涂,我也糊涂了。
为了解释iterable(可迭代的),又引入了一个词“迭代”,什么是迭代呢?
尽管我们很多文档是用英文写的,但是,如果你能充分利用汉语来理解某些名词,是非常有帮助的。因为在汉语中,不仅仅表音,而且能从词语组合中体会到该术语的含义。比如“激光”,这是汉语。英语是从"light amplification by stimulated emission of radiation"化出来的"laser",它是一个造出来的词。因为此前人们不知道那种条件下发出来的是什么。但是汉语不然,反正用一个“光”就可以概括了,只不过这个“光”不是传统概念中的“光”,而是由于“受激”辐射得到的光,故名“激光”。是不是汉语很牛叉?
“迭”在汉语中的意思是“屡次,反复”。如:高潮迭起。那么跟“代”组合,就可以理解为“反复‘代’”,是不是有点“子子孙孙”的意思了?“结婚-生子-子成长-结婚-生子-子成长-...”,你是不是也在这个“迭代”的过程中呢?
给个稍微严格的定义,来自维基百科。“迭代是重复反馈过程的活动,其目的通常是为了接近并到达所需的目标或结果。”
某些类型的对象是“可迭代”(iterable)的,这类数据类型有共同的特点。如何判断一个对象是不是可迭代的?下面演示一种方法。事实上还有别的方式。
>>> astr = "python"
>>> hasattr(astr, '__iter__')
False #Python2返回的结果。如果是Python3返回True.
这里用内建函数hasattr()
判断一个字符串是否是可迭代的,在Python 2中返回了False,在Python 3中返回了True。那么,这里似乎有一个矛盾的命题,一个字符串,在不同的Python版本中,为什么不一样呢?请继续阅读。
用同样的方式可以判断:
>>> alst = [1, 2]
>>> hasattr(alst, '__iter__')
True
>>> hasattr(3, '__iter__')
False
hasattr()
的判断本质就是看那个类型中是否有__iter__
函数。读者可以用dir()
找一找,在数字、字符串、列表中,谁有__iter__
。同样还可找一找dict
和tuple
两种类型对象是否含有这个方法。
如果你使用的是Pyhon 2,在dir(str)
是无法发现__iter__
的。但是,在Python 3中,则可以在dir(str)
的结果中看到__iter__
。这也是为什么在Python 3中,hasattr(astr, '__iter__')
返回True
的原因。
将前面的所有对于字符串的操作,你连贯起来看一下,在Python 2中,不认为它是可迭代的,这是针对字符串本身而言,然而如果对它进行了应用于可迭代对象的操作,它又能正常进行,因为Python把字符串做了自动转化;因此Python 3中干脆顺水推舟,把这个过程一气呵成。让它也具有__iter__
属性了。
以上穿插了一个新的概念“iterable”(可迭代的),现在回到extend()
上。这个函数需要的参数就是iterable类型的对象。
>>> new = [1, 2, 3]
>>> lst = ['python', 'qiwsir']
>>> lst.extend(new)
>>> lst
['python', 'qiwsir', 1, 2, 3]
>>> new
[1, 2, 3]
还要关注列表lst的变化。lst经过extend函数操作之后,变成了一个貌似“新”的列表。这句话有点别扭,“貌似新”的,之所以这么说,是因为对“新的”可能有不同的理解。
不妨深挖一下。
>>> new = [1, 2, 3]
>>> id(new)
3072383244L
>>> lst = ['python', 'qiwsir']
>>> id(lst)
3069501420L
用id()
能够看到两个列表分别在内存中的“窝”的编号。
>>> lst.extend(new)
>>> lst
['python', 'qiwsir', 1, 2, 3]
>>> id(lst)
3069501420L
注意到没有?虽然lst经过extend()
方法之后,比原来扩容了,但是,并没有离开原来的“窝”,也就是在内存中,还是“旧”的,只不过里面的内容增多了。相当于两口之家,经过一番云雨之后,又增加了一个小宝宝,那么这个家是“新”的还是“旧”的呢?角度不同或许说法不一了。
这就是列表的一个重要特征:列表是可以修改的。这种修改,不是复制一个新的,而是在原地进行修改。
其实,append()
对列表的操作也是如此,不妨用同样的方式看看。
**说明:**虽然这里的lst内容和上面的一样,但是,我从新在shell中输入,所以id会变化。也就是内存分配的“窝”的编号变了。
>>> lst = ['python', 'qiwsir']
>>> id(lst)
3069501388L
>>> lst.append(new)
>>> lst
['python', 'qiwsir', [1, 2, 3]]
>>> id(lst)
3069501388L
显然,append()
也是原地修改列表。
>>> lst.extend("itdiffer")
>>> lst
['python', 'qiwsir', 'i', 't', 'd', 'i', 'f', 'f', 'e', 'r']
它把一个字符串"itdiffer"
转化为['i', 't', 'd', 'i', 'f', 'f', 'e', 'r']
,然后将这个列表作为参数,提供给extend()
,并将列表中的元素塞入原来的列表中。
这里讲述的两个让列表扩容的函数append()
和extend()
,它们的共同点是“都能原地修改列表”。
对于“原地修改”还应该增加一个理解——没有返回值。
原地修改没有返回值,就不能赋值给某个变量。
>>> one = ["good","good","study"]
>>> another = one.extend(["day","day","up"]) #对于没有提供返回值的函数,如果要这样,结果是:
>>> print anthor #打印变量another的值。如果是Python3则输入print(another)
None #返回为None, one.extend()没有返回值,即是None.
>>> one
['good', 'good', 'study', 'day', 'day', 'up']
append()
和extend()
的区别呢?看下面例子:
>>> lst = [1,2,3]
>>> lst.append(["qiwsir","github"])
>>> lst
[1, 2, 3, ['qiwsir', 'github']] #append的结果
>>> len(lst)
4
>>> lst2 = [1,2,3]
>>> lst2.extend(["qiwsir","github"])
>>> lst2
[1, 2, 3, 'qiwsir', 'github'] #extend的结果
>>> len(lst2)
5
append是整建制地追加,extend是个体化扩编。
###count
count()
是一个帮着我们弄清楚列表中元素重复出现次数的方法。官方文档是这么说的:
list.count(x)
Return the number of times x appears in the list.
一定要不断实验,才能理解文档中精炼的表达。
>>> la = [1,2,1,1,3]
>>> la.count(1)
3
>>> la.append('a')
>>> la.append('a')
>>> la
[1, 2, 1, 1, 3, 'a', 'a']
>>> la.count('a')
2
>>> la.count(2)
1
>>> la.count(5) #la中没有5,但是如果用这种方法找,不报错,返回的是数字0
0
###index
《列表(1)》中已经提到,这里不赘述,但是为了完整,也占个位置吧。
>>> la
[1, 2, 3, 'a', 'b', 'c', 'qiwsir', 'python']
>>> la.index(3)
2
>>> la.index('qi') #如果不存在,就报错
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: 'qi' is not in list
>>> la.index('qiwsir')
6
x
是列表中的一个元素,list.index(x)
能够检索到该元素在列表中第一次出现的位置。这才是真正的索引,注意那个英文单词index。
依然是上一条官方解释:
list.index(x)
Return the index in the list of the first item whose value is x. It is an error if there is no such item.
是不是说的非常清楚明白了?
中场休息,下节继续列表的方法。
如果你认为有必要打赏我,请通过支付宝:[email protected],不胜感激。