索引(下标)
索引又称下标,用来表示可迭代对象中的某个元素的位置。
- 用正整数表示的索引值,从左向右定位,从 0 开始计数,如 0,1,2
- 用负整数表示的索引值,从右向左定位,从 -1 开始计数,如 -1,-2,-3
例如:
1 | name = "meet" # 计算机从0开始数 |
输出的结果为:
1 | e |
切片
有这样一个字符串:meet_alex_wusir
,我们想要把其中的 alex
取出来,该怎么做呢?一个可行的方法是,分别用 a
、l
、e
和 x
的索引值,把它们分别取出来,再利用字符串的 加和
操作把它们拼接起来,就像这样:
1 | name = "meet_alex_wusir" |
当然也可以通过循环的方法来取出相应的字符,然后拼接成新的字符串:
1 | name = "meet_alex_wusir" |
因为这样的循环在 Python 中非常常用,所以被封装成为了一种简便的方法,就是字符串的 切片
。切片的基本格式和使用方法如下:
1 | name = "meet_alex_wusir" |
输出的结果为:
1 | alex |
关于切片的终止位置的选择,还有一个技巧是:终止位置 = 起始位置 + 切片长度
。例如上面的例子中,起始位置为 5
,切片长度为 4
,终止位置为 5 + 4 = 9
。
有的时候我们并不想要一个一个取字符,而是要隔一个字符取一个。比如对于上面 "meet_alex_wusir"
的例子,我们想要取第 3
、5
、7
位的 e
、_
、l
,该如何操作呢?
我们依旧可以使用最原始的,分别取值,然后拼接字符串的方法:
1 | name = "meet_alex_wusir" |
这种方法确实能得到我们想要的结果,但是太过繁琐。如果我们想要处理很长的字符串,就会非常麻烦了。这就需要我们在切片时引入 步长
变量。步长
是使用切片方法的第三个参数,默认值为 1
。对于上面的例子,我们可以设置 步长
为 2
:
1 | name = "meet_alex_wusir" |
如果我们把步长设置成 -1,可以实现从右向左查找:
1 | name = "meet_alex_wusir" |
输出的结果为:
1 | risuw_xela_ |
在进行索引操作时,如果输入的参数超过最大索引值时,程序会报错。而在进行切片操作时,如果终止位置超出最大索引值时,程序不会报错,而是会走到字符串的结尾:
1 | name = "meet_alex_wusir" |
输出的结果为:
1 | e_lxwsr |
需要注意的是,索引和切片只能给有序数据(字符串、列表、元组)使用。整型和布尔值等均不可以用来进行索引和切片操作。
同整型一样,字符串也是一个不可变的数据类型:
1 | name = "meet" |
在 Python 中,对于字符串的赋值,还会有这样一个有趣的情况:
1 | name = "meet" |
明明是两次赋值,两个字符串的内存地址居然是相同的。这是因为 Python 中有一个小数据池,小数据会驻留。在小数据驻留期间对相同的数据有新的赋值操作,不会新开辟一个内存空间,而是将变量指向已有数据的内存地址。小数据池机制是为了节省内存空间。