码迷,mamicode.com
首页 > 编程语言 > 详细

python数据分析(三) python numpy--数组--运算,切片和索引

时间:2019-10-08 16:00:35      阅读:134      评论:0      收藏:0      [点我收藏+]

标签:赋值   二维数组   most   矢量化   批量   千万   广播   重要   方向   

Numpy数组的运算:

numpy数组最大的特点是任何运算,都会自动的对数组当中的所有变量进行运算,所以千万不要试图自己去使用循环去取数组当中的值进行运算(非常愚蠢)。

1.相同大小的数组之间的运算

数组可以不编写循环而对数据执行批量运算,称之为矢量化,大小相同数组之间的算术运算将会应用到元素级。

In [51]: arr = np.array([[1., 2., 3.], [4., 5., 6.]])
In [52]: arr
Out[52]:
array([[ 1.,2.,3.],
[ 4.,5.,6.]])
In [53]: arr * arr
Out[53]:
array([[1.,4.,9.],
[ 16.,25.,36.]])
In [54]: arr - arr
Out[54]:
array([[ 0.,0.,0.],
[ 0.,0.,0.]])

2.大小不同的数组之间的运算

大小不同的数组之间的运算叫做广播,本教程暂时不涉及该内容。

3.标量与数组之间的运算

数组与标量值之间的运算,会将标量值传播到各个元素

In [55]: 1 / arr
Out[55]:
array([[ 1.,0.5,0.3333],
    [ 0.25,0.2,0.1667]])
In [56]: arr ** 0.5
Out[56]:
array([[ 1.,1.4142,1.7321],
    [ 2.,2.2361,2.4495]])
        

Numpy数组的索引和切片

keypoint:

1.Numpy的切片非常重要的一点是,numpy的切片是原数组的视图,而不是副本,这也就意味着对于切片的赋值和修改会直接反映到原数组当中,这样设计的目的是由于,由于numpy处理的都是大数据,如果需要复制的话会对内存造成多大的压力。

2.Numpy多维数组当中最常见的是二维数组,我们日常工作当中也主要是对二维数组进行操作,Numpy当中的轴是数组很重要的概念。0代表纵轴也就是行伸展的方向,numpy当中默认axis=0,也是基于日常数据处理通常是逐行进行数据处理,1代表横轴,是列的伸展,需要对列进行操作时,通常需要指定axis=1。

技术图片

 

 

一维数组

一维数组的索引和切片与python当中的列表差不多

In [60]: arr = np.arange(10)
In [61]: arr
Out[61]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
In [62]: arr[5]
Out[62]: 5
In [63]: arr[5:8]
Out[63]: array([5, 6, 7])
In [64]: arr[5:8] = 12
In [65]: arr
Out[65]: array([ 0,1,2,3,4, 12, 12, 12,8,9])

多维数组

以二维数组为例

索引

单行索引

当你想要获取二维数组的某一行(注意是仅是单行)可以使用arr[],同时假如需要该行当中的某一列时可以采用arr[2][3]或者arr[2,3] 这两者是等价的

In [10]: data
Out[10]:
array([[ 1.0788974 ,  0.68102429,  1.25657144,  0.86003818],
       [ 0.12736723, -1.02105407, -1.73882805, -0.95977831],
       [ 1.72637531,  1.34888078, -0.30239276, -0.2500709 ],
       [ 1.35099747, -1.548361  ,  0.42033975, -0.45966589],
       [-1.33488847,  0.03941755,  1.62740521,  1.06397523],
       [ 0.24654034, -1.78687642, -1.48406199,  0.26911715],
       [-1.51003484, -0.00391514,  1.0792482 ,  1.4810209 ]])

In [15]: data[0]
Out[15]: array([1.0788974 , 0.68102429, 1.25657144, 0.86003818])


In [16]: data[0,2,4,6]
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-16-6d104e373c35> in <module>
----> 1 data[0,2,4,6]

IndexError: too many indices for array
In [17]: data[0][2]
Out[17]: 1.25657144416686

In [18]: data[0,2]
Out[18]: 1.25657144416686

多行索引

当你需要数组其中的多行时,需要使用[[]]来制定需要的行

In [14]: data[[0,2,4,6]]
Out[14]:
array([[ 1.0788974 ,  0.68102429,  1.25657144,  0.86003818],
       [ 1.72637531,  1.34888078, -0.30239276, -0.2500709 ],
       [-1.33488847,  0.03941755,  1.62740521,  1.06397523],
       [-1.51003484, -0.00391514,  1.0792482 ,  1.4810209 ]])

同时很是特殊的一点是,当你想要其中的一些行与列时,你可能想到这样使用:arr[[1, 5, 7, 2], [0, 3, 1, 2]],但是你会发现得到是一个一维数组

In [22]: arr
Out[22]:
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

In [23]: arr[[1, 5, 7, 2], [0, 3, 1, 2]]
Out[23]: array([ 4, 23, 29, 10])

当你想得到的这样的结果时,以下是其中一种方法:

In [24]: arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]
Out[24]:
array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

布尔型索引

 

python数据分析(三) python numpy--数组--运算,切片和索引

标签:赋值   二维数组   most   矢量化   批量   千万   广播   重要   方向   

原文地址:https://www.cnblogs.com/xiaosanye/p/11634475.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!