Skip to content

Latest commit

 

History

History
265 lines (176 loc) · 12 KB

112.md

File metadata and controls

265 lines (176 loc) · 12 KB

你们祈求,就给你们;寻找,就寻见;叩门,就给你们开门。因为凡祈求的,就得着;寻找的,就寻见;叩门的,就给他们开门。

所以无论何事,你们愿意人怎样待你们,你们也要怎样待人,因为这就是律法和先知的道理。(MATTHEW 7:7-8,12)

#列表(2)

“列表是Python的苦力”,那么它或者对它能做什么呢?

在交互模式下这么操作,就看到有关它的函数或方法了。

>>> dir(list)
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']

上面的结果中,以双下划线开始和结尾的暂时不管,如__add__(以后会管的)。就剩下以下几个了:

'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'

这几个都是在编程实践中常常要用到的。

##常用的列表函数

###append和extend

《列表(1)》中,对列表的基本操作提到了list.append(x),也就是将某个元素x 追加到已知的一个列表后边。

除了将元素追加到列表中,还能够将两个列表合并,或者说将一个列表追加到另外一个列表中。按照前文的惯例,还是首先看官方文档中的描述:

list.extend(L)

Extend the list by appending all the items in the given list; equivalent to a[len(a):] = L.

向所有正在学习本内容的朋友提供一个成为优秀程序员的必备:看官方文档,是必须的。

官方文档的这句话翻译过来:

通过将所有元素追加到已知列表来扩充它,相当于a[len(a):]= L

英语太烂,翻译太差。直接看例子,更明白。

>>> la = [1, 2, 3]
>>> lb = ['qiwsir', 'python']
>>> la.extend(lb)
>>> la
[1, 2, 3, 'qiwsir', 'python']
>>> lb
['qiwsir', 'python']

变量la指向一个列表对象;变量lb也指向一个列表对象。为了简单,就说成lalb两个列表。

将lb追加到la的后面,也就是把lb中的所有元素加入到la中,即让la扩容。

学程序一定要有好奇心,我在交互环境中,经常实验一下自己的想法,有时候是比较愚蠢的想法。

>>> la = [1,2,3]
>>> b = "abc"
>>> la.extend(b)
>>> la
[1, 2, 3, 'a', 'b', 'c']
>>> c = 5
>>> la.extend(c)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  TypeError: 'int' object is not iterable

仔细观察,能看出什么来吗?

原来,如果extend(str)的时候,字符串被以字符为单位拆开,然后追加到la里面。

如果extend的对象是数值型,则报错。

extend的对象是一个列表,如果是字符串,则Python会先把它按照字符为单位转化为列表再追加到已知列表后面。

不过,别忘记了前面官方文档的后半句话,它的意思是:

>>> la = [1, 2, 3, 'a', 'b', 'c']
>>> lb = ['qiwsir', 'python']
>>> la[len(la):]=lb
>>> la
[1, 2, 3, 'a', 'b', 'c', 'qiwsir', 'python']

list.extend(L) 等效于 list[len(list):] = L,L是待并入的列表。

联想到到上一讲中的一个list函数list.append(),有类似之处。

extend(...) L.extend(iterable) -- extend list by appending elements from the iterable

上面是在交互模式中输入help(list.extend)后得到的说明。这是非常重要而且简单的获得文档帮助的方法。

该文档中出现了iterable,什么是iterable?这个从现在开始,会经常遇到,所以是要搞搞清楚的。

iterable,中文含义是“可迭代的”。在Python中,还有一个词,就是iterator,这个叫做“迭代器”。这两者有着区别和联系。不过,这里暂且不说那么多,说多了就容易糊涂,我也糊涂了。

为了解释iterable(可迭代的),又引入了一个词“迭代”,什么是迭代呢?

尽管我们很多文档是用英文写的,但是,如果你能充分利用汉语来理解某些名词,是非常有帮助的。因为在汉语中,不仅仅表音,而且能从词语组合中体会到该术语的含义。比如“激光”,这是汉语。英语是从"light amplification by stimulated emission of radiation"化出来的"laser",它是一个造出来的词。因为此前人们不知道那种条件下发出来的是什么。但是汉语不然,反正用一个“光”就可以概括了,只不过这个“光”不是传统概念中的“光”,而是由于“受激”辐射得到的光,故名“激光”。是不是汉语很牛叉?

“迭”在汉语中的意思是“屡次,反复”。如:高潮迭起。那么跟“代”组合,就可以理解为“反复‘代’”,是不是有点“子子孙孙”的意思了?“结婚-生子-子成长-结婚-生子-子成长-...”,你是不是也在这个“迭代”的过程中呢?

给个稍微严格的定义,来自维基百科。“迭代是重复反馈过程的活动,其目的通常是为了接近并到达所需的目标或结果。”

某些类型的对象是“可迭代”(iterable)的,这类数据类型有共同的特点。如何判断一个对象是不是可迭代的?下面演示一种方法。事实上还有别的方式。

>>> astr = "python"
>>> hasattr(astr, '__iter__')
False                                                 #Python2返回的结果。如果是Python3返回True.

这里用内建函数hasattr()判断一个字符串是否是可迭代的,在Python 2中返回了False,在Python 3中返回了True。那么,这里似乎有一个矛盾的命题,一个字符串,在不同的Python版本中,为什么不一样呢?请继续阅读。

用同样的方式可以判断:

>>> alst = [1, 2]
>>> hasattr(alst, '__iter__')  
True             
>>> hasattr(3, '__iter__')
False

hasattr()的判断本质就是看那个类型中是否有__iter__函数。读者可以用dir()找一找,在数字、字符串、列表中,谁有__iter__。同样还可找一找dicttuple两种类型对象是否含有这个方法。

如果你使用的是Pyhon 2,在dir(str)是无法发现__iter__的。但是,在Python 3中,则可以在dir(str)的结果中看到__iter__。这也是为什么在Python 3中,hasattr(astr, '__iter__')返回True的原因。

将前面的所有对于字符串的操作,你连贯起来看一下,在Python 2中,不认为它是可迭代的,这是针对字符串本身而言,然而如果对它进行了应用于可迭代对象的操作,它又能正常进行,因为Python把字符串做了自动转化;因此Python 3中干脆顺水推舟,把这个过程一气呵成。让它也具有__iter__属性了。

以上穿插了一个新的概念“iterable”(可迭代的),现在回到extend()上。这个函数需要的参数就是iterable类型的对象。

>>> new = [1, 2, 3]
>>> lst = ['python', 'qiwsir']
>>> lst.extend(new)
>>> lst
['python', 'qiwsir', 1, 2, 3]
>>> new
[1, 2, 3]

还要关注列表lst的变化。lst经过extend函数操作之后,变成了一个貌似“新”的列表。这句话有点别扭,“貌似新”的,之所以这么说,是因为对“新的”可能有不同的理解。

不妨深挖一下。

>>> new = [1, 2, 3]
>>> id(new)
3072383244L

>>> lst = ['python', 'qiwsir']
>>> id(lst)
3069501420L

id()能够看到两个列表分别在内存中的“窝”的编号。

>>> lst.extend(new)
>>> lst
['python', 'qiwsir', 1, 2, 3]
>>> id(lst)
3069501420L

注意到没有?虽然lst经过extend()方法之后,比原来扩容了,但是,并没有离开原来的“窝”,也就是在内存中,还是“旧”的,只不过里面的内容增多了。相当于两口之家,经过一番云雨之后,又增加了一个小宝宝,那么这个家是“新”的还是“旧”的呢?角度不同或许说法不一了。

这就是列表的一个重要特征:列表是可以修改的。这种修改,不是复制一个新的,而是在原地进行修改。

其实,append()对列表的操作也是如此,不妨用同样的方式看看。

**说明:**虽然这里的lst内容和上面的一样,但是,我从新在shell中输入,所以id会变化。也就是内存分配的“窝”的编号变了。

>>> lst = ['python', 'qiwsir']
>>> id(lst)     
3069501388L
>>> lst.append(new)
>>> lst
['python', 'qiwsir', [1, 2, 3]]
>>> id(lst)
3069501388L

显然,append()也是原地修改列表。

>>> lst.extend("itdiffer")
>>> lst
['python', 'qiwsir', 'i', 't', 'd', 'i', 'f', 'f', 'e', 'r']

它把一个字符串"itdiffer"转化为['i', 't', 'd', 'i', 'f', 'f', 'e', 'r'],然后将这个列表作为参数,提供给extend(),并将列表中的元素塞入原来的列表中。

这里讲述的两个让列表扩容的函数append()extend(),它们的共同点是“都能原地修改列表”。

对于“原地修改”还应该增加一个理解——没有返回值。

原地修改没有返回值,就不能赋值给某个变量。

>>> one = ["good","good","study"]
>>> another = one.extend(["day","day","up"])    #对于没有提供返回值的函数,如果要这样,结果是:
>>> print anthor                                #打印变量another的值。如果是Python3则输入print(another)
None                                            #返回为None, one.extend()没有返回值,即是None.
>>> one
['good', 'good', 'study', 'day', 'day', 'up']

append()extend()的区别呢?看下面例子:

>>> lst = [1,2,3]
>>> lst.append(["qiwsir","github"])
>>> lst
[1, 2, 3, ['qiwsir', 'github']]       #append的结果
>>> len(lst)
4

>>> lst2 = [1,2,3]
>>> lst2.extend(["qiwsir","github"])
>>> lst2
[1, 2, 3, 'qiwsir', 'github']   #extend的结果
>>> len(lst2)
5

append是整建制地追加,extend是个体化扩编。

###count

count()是一个帮着我们弄清楚列表中元素重复出现次数的方法。官方文档是这么说的:

list.count(x)

Return the number of times x appears in the list.

一定要不断实验,才能理解文档中精炼的表达。

>>> la = [1,2,1,1,3]
>>> la.count(1)
3
>>> la.append('a')
>>> la.append('a')
>>> la
[1, 2, 1, 1, 3, 'a', 'a']
>>> la.count('a')
2
>>> la.count(2)
1
>>> la.count(5)          #la中没有5,但是如果用这种方法找,不报错,返回的是数字0
0

###index

《列表(1)》中已经提到,这里不赘述,但是为了完整,也占个位置吧。

>>> la
[1, 2, 3, 'a', 'b', 'c', 'qiwsir', 'python']
>>> la.index(3)
2
>>> la.index('qi')      #如果不存在,就报错
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  ValueError: 'qi' is not in list
>>> la.index('qiwsir')
6

x是列表中的一个元素,list.index(x)能够检索到该元素在列表中第一次出现的位置。这才是真正的索引,注意那个英文单词index。

依然是上一条官方解释:

list.index(x)

Return the index in the list of the first item whose value is x. It is an error if there is no such item.

是不是说的非常清楚明白了?

中场休息,下节继续列表的方法。


总目录   |   上节:列表(1)   |   下节:列表(3)

如果你认为有必要打赏我,请通过支付宝:[email protected],不胜感激。