经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » NumPy » 查看文章
Numpy 数组索引的实现
来源:jb51  时间:2023/1/20 8:39:21  对本文有异议

数组索引是指使用方括号([])来索引数组值,numpy提供了比常规的python序列更多的索引工具。除了按整数和切片索引之外,数组可以由整数数组索引、布尔索引及花式索引。下面逐一学习。

一、整数索引

这种机制有助于基于 N 维索引来获取数组中任意元素。 每个整数数组表示该维度的下标值。 当索引的元素个数就是目标ndarray的维度时,会变得相当直接。

  1. import numpy as np
  2. >>> s = np.arange(27).reshape(3,3,3)
  3. >>> s
  4. array([[[ 0, ?1, ?2],
  5. ? ? ? ? [ 3, ?4, ?5],
  6. ? ? ? ? [ 6, ?7, ?8]],
  7.  
  8. ? ? ? ?[[ 9, 10, 11],
  9. ? ? ? ? [12, 13, 14],
  10. ? ? ? ? [15, 16, 17]],
  11.  
  12. ? ? ? ?[[18, 19, 20],
  13. ? ? ? ? [21, 22, 23],
  14. ? ? ? ? [24, 25, 26]]])
  15. >>> s[1]
  16. array([[ 9, 10, 11],
  17. ? ? ? ?[12, 13, 14],
  18. ? ? ? ?[15, 16, 17]])
  19. >>> s[1][1]
  20. array([12, 13, 14])
  21. >>> s[1][1][1]
  22. 13

二、切片索引

原理:切片操作是指抽取数组的一部分元素生成新数组。对 python 列表进行切片操作得到的数组是原数组的副本,而对 Numpy 数据进行切片操作得到的数组则是指向相同缓冲区的视图。如果想抽取(或查看)数组的一部分,必须使用切片语法,也就是,把几个用冒号( start:stop:step )隔开的数字置于方括号内。为了更好地理解切片语法,还应该了解不明确指明起始和结束位置的情况。如省去第一个数字,numpy 会认为第一个数字是0;如省去第二个 数字,numpy 则会认为第二个数字是数组的大索引值;如省去后一个数字,它将会被理解为1,也就是抽取所有元素而不再考虑间隔。

2.1、一维数组切片

同python 中list 切片

  1. >>> s1 = np.array([3, 8, 6, 9, 0])
  2. >>> s1
  3. array([3, 8, 6, 9, 0])
  4. >>> s1[3]
  5. 9
  6. >>> s1[1:3]
  7. array([8, 6])
  8. >>> s1[-1]
  9. 0
  10. >>> s1[2:]
  11. array([6, 9, 0])
  12. >>> s1[:4]
  13. array([3, 8, 6, 9])
  14. >>> s1[:]
  15. array([3, 8, 6, 9, 0])

2.2、多维数组切片

  1. >>> s2 = np.arange(12).reshape(3,4)
  2. >>> s2
  3. array([[ 0, 1, 2, 3],
  4. [ 4, 5, 6, 7],
  5. [ 8, 9, 10, 11]])
  6. >>> s2[1]
  7. array([4, 5, 6, 7])
  8. >>> s2[1][:1]
  9. array([4])
  10. >>> s2[1][:3]
  11. array([4, 5, 6])

三、整数数组索引

数组作为索引的一大优势,便是可以将索引得到的结果组织成自己想要的形状。
输出结果的shape与索引数组的shape相同,而输出中各个元素的取值,便是由各个索引数组对应位置的值作为index索引得到。

3.1、 一维数组的整数数组索引

  1. >>> x = np.arange(10,1,-1)
  2. >>> x
  3. array([10, 9, 8, 7, 6, 5, 4, 3, 2])
  4. >>> x[np.array([3, 3, 1, 8])]
  5. array([7, 7, 9, 2])
  6. >>> x[np.array([[0,1][2,3]])]
  7. array([[10, 9],
  8. [ 8, 7]])

3.2、多维数组的整数数组索引

  1. >>> a = np.arange(15).reshape(3,5)
  2. >>> a
  3. array([[ 0, 1, 2, 3, 4],
  4. [ 5, 6, 7, 8, 9],
  5. [10, 11, 12, 13, 14]])
  6. >>> a[np.array([0,2])] # 获取数组的第0行和第2行
  7. array([[ 0, 1, 2, 3, 4],
  8. [10, 11, 12, 13, 14]])
  9. >>> a[np.array([0,2]),np.array([1,3])] # 获取数组第0行的第二个元素和第2行的第四个元素
  10. array([ 1, 13])
  11. >>> a[np.array([1,2])]
  12. array([[ 5, 6, 7, 8, 9],
  13. [10, 11, 12, 13, 14]])
  14. # 获取数组a[np.array([[0,2])] 的第一行的第二个元素和第二行的第四个元素...
  15. >>> a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])]
  16. array([[ 1, 13],
  17. [ 5, 12]])

每一个索引数组单独控制一个维度。例如对于 a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])],此时np.array([[0,2],[1,2]])控制输出的对应位置的行索引,np.array([[1,3],[0,2]])]控制输出的对应位置的列索引。行列索引组织在一起,便可以得到输出的每个位置的索引。

具体地,对于a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])],
由于np.array([[0,2],[1,2]])的shape为(2, 2),因此输出是一个(2,2)的矩阵。
在左上位置,行索引为0,列索引为1,值为1;
在右上位置,行索引为2,列索引为3,值为13;
在左下位置,行索引为0,列索引为1,值为5;
在右下位置,行索引为2,列索引为2, 值为12。
因此输出的矩阵即为,array([[1, 13],[5, 12]])。

充分利用"广播"机制,以及对于维度数量的省略,使得以数组作为索引的方式有更加灵活的应用,例如:

  1. >>> a = np.arange(15).reshape(3,5)
  2. >>> a
  3. array([[ 0, 1, 2, 3, 4],
  4. [ 5, 6, 7, 8, 9],
  5. [10, 11, 12, 13, 14]])
  6. >>> a[np.array([0,2]),3]
  7. array([ 3, 13])
  8. >>> a[np.array([0,2])]
  9. array([[ 0, 1, 2, 3, 4],
  10. [10, 11, 12, 13, 14]])

在上例中,a[np.array([0,2]),3] 便可以广播为 a[np.array([0,2]),np.array([3,3])],从而化为我们熟悉的形式。而 a[np.array([0,2])] 通过省略一个维度,达到索引该维度全体数据的效果。

四、布尔索引

bool数组可以通过直接指出保留的值(True)与舍弃的值(False),来构建输出的数组。
bool数组的shape需要与被索引的数组(的前若干个维度)shape严格对齐。

  1. >>> a = np.arange(15).reshape(3,5)
  2. >>> a
  3. array([[ 0, 1, 2, 3, 4],
  4. [ 5, 6, 7, 8, 9],
  5. [10, 11, 12, 13, 14]])
  6. >>> b = a > 10
  7. >>> b
  8. array([[False, False, False, False, False],
  9. [False, False, False, False, False],
  10. [False, True, True, True, True]])
  11. >>> a[b]
  12. array([11, 12, 13, 14])

使用bool 值获取数组元素

  1. >>> a = np.arange(15).reshape(3,5)
  2. >>> a
  3. array([[ 0, 1, 2, 3, 4],
  4. [ 5, 6, 7, 8, 9],
  5. [10, 11, 12, 13, 14]])
  6. >>> a[np.array([True])]
  7. Traceback (most recent call last):
  8. File "<stdin>", line 1, in <module>
  9. IndexError: boolean index did not match indexed array along dimension 0; dimension is 3 but corresponding boolean dimension is 1
  10. >>> a[np.array([True, False])]
  11. Traceback (most recent call last):
  12. File "<stdin>", line 1, in <module>
  13. IndexError: boolean index did not match indexed array along dimension 0; dimension is 3 but corresponding boolean dimension is 2
  14. >>> a[np.array([True, False,False])]
  15. array([[0, 1, 2, 3, 4]])
  16. >>> a[np.array([False, False,False])]
  17. array([], shape=(0, 5), dtype=int64)
  18. >>> a[np.array([False, False,True])]
  19. array([[10, 11, 12, 13, 14]])
  20. >>> a[np.array([True, True,True])]
  21. array([[ 0, 1, 2, 3, 4],
  22. [ 5, 6, 7, 8, 9],
  23. [10, 11, 12, 13, 14]])
  24. >>> a[np.array([False, False,True]),np.array([True,False,True,False,True])]
  25. array([10, 12, 14])

五、花式索引

花式索引指的是利用整数数组进行索引。
花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。
对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应位置的元素,如果目标是二维数组,那么就是对应下标的行。
花式索引跟切片不一样,它总是将数据复制到新数组中。

  1. >>> a = np.arange(12)**2
  2. >>> a
  3. array([ 0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121])
  4. >>> i = np.array( [ 1,1,3,8,5 ] )
  5. >>> i
  6. array([1, 1, 3, 8, 5])
  7. >>> a[i]
  8. array([ 1, 1, 9, 64, 25])
  9. >>> j = np.array( [ [ 3, 4], [ 9, 7 ] ] )
  10. >>> j
  11. array([[3, 4],
  12. [9, 7]])
  13. >>> a[j]
  14. array([[ 9, 16],
  15. [81, 49]])

当被索引的数组是多维数组时,将按照它的第一轴进行索引的

  1. >>> p = np.arange(27).reshape(3,3,3)
  2. >>> p
  3. array([[[ 0, ?1, ?2],
  4. ? ? ? ? [ 3, ?4, ?5],
  5. ? ? ? ? [ 6, ?7, ?8]],
  6.  
  7. ? ? ? ?[[ 9, 10, 11],
  8. ? ? ? ? [12, 13, 14],
  9. ? ? ? ? [15, 16, 17]],
  10.  
  11. ? ? ? ?[[18, 19, 20],
  12. ? ? ? ? [21, 22, 23],
  13. ? ? ? ? [24, 25, 26]]])
  14. >>> l = np.array([[0, 2, 1],[1,2,1]])
  15. >>> p[l]
  16. array([[[[ 0, ?1, ?2],
  17. ? ? ? ? ?[ 3, ?4, ?5],
  18. ? ? ? ? ?[ 6, ?7, ?8]],
  19.  
  20. ? ? ? ? [[18, 19, 20],
  21. ? ? ? ? ?[21, 22, 23],
  22. ? ? ? ? ?[24, 25, 26]],
  23.  
  24. ? ? ? ? [[ 9, 10, 11],
  25. ? ? ? ? ?[12, 13, 14],
  26. ? ? ? ? ?[15, 16, 17]]],
  27.  
  28.  
  29. ? ? ? ?[[[ 9, 10, 11],
  30. ? ? ? ? ?[12, 13, 14],
  31. ? ? ? ? ?[15, 16, 17]],
  32.  
  33. ? ? ? ? [[18, 19, 20],
  34. ? ? ? ? ?[21, 22, 23],
  35. ? ? ? ? ?[24, 25, 26]],
  36.  
  37. ? ? ? ? [[ 9, 10, 11],
  38. ? ? ? ? ?[12, 13, 14],
  39. ? ? ? ? ?[15, 16, 17]]]])
  40. >>> c = np.array([0,0,0])
  41. >>> p[c]
  42. array([[[0, 1, 2],
  43. ? ? ? ? [3, 4, 5],
  44. ? ? ? ? [6, 7, 8]],
  45.  
  46. ? ? ? ?[[0, 1, 2],
  47. ? ? ? ? [3, 4, 5],
  48. ? ? ? ? [6, 7, 8]],
  49.  
  50. ? ? ? ?[[0, 1, 2],
  51. ? ? ? ? [3, 4, 5],
  52. ? ? ? ? [6, 7, 8]]])

参考文档
1、https://blog.csdn.net/qq_45759562/article/details/109249685
2、https://zhuanlan.zhihu.com/p/427216184
3、http://t.zoukankan.com/lavender1221-p-12651442.html
4、https://www.runoob.com/numpy/numpy-advanced-indexing.html

到此这篇关于Numpy 数组索引的实现的文章就介绍到这了,更多相关Numpy 数组索引内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号