在前一篇我们初步领略了 NumPy 库创建数组以及一些基本操作的魅力,今天我们将继续深挖 NumPy 的强大功能,聚焦于数组的高级操作,包括广播机制以及各种聚合函数的运用。这些知识将进一步提升我们处理数值数据的能力,让我们在数据分析、科学计算等诸多领域能够更加得心应手地施展拳脚
一、NumPy 数组的广播机制
广播机制概述:
广播机制是 NumPy 中一种强大且灵活的功能,它允许不同形状的数组在满足一定规则的情况下进行兼容运算。简单来说,就是能够自动地将较小形状的数组 “扩展” 到和较大形状数组匹配的维度,使得运算可以顺利进行,就好像是广播电台把信号传递到各个角落一样,让不同的数组能够 “对接” 上。
标量与数组的运算:
最常见的广播应用就是一个标量(单个数值)与数组进行运算。例如:
import numpy as np
arr = np.array([1, 2, 3, 4])
result = arr + 5print(result)
在这个例子中,数值 5 这个标量会被自动广播到和 arr 数组相同的形状,相当于变成了 [5, 5, 5, 5],然后与 arr 数组对应元素进行加法运算,最终输出 [6, 7, 8, 9]。
同样,对于乘法、减法等其他运算也是如此,比如:
arr = np.array([2, 4, 6])
result = arr * 3print(result)
输出为 [6, 12, 18],这里 3 被广播后与 arr 数组的每个元素相乘。
不同形状但可广播的数组运算:
当涉及两个数组进行广播运算时,需要遵循一定的规则。例如,两个数组的维度数可以不同,但从后往前对比维度大小时,较小维度的数组对应的维度要么是 1,要么和较大维度数组的对应维度相等。
比如,有一个二维数组 (3, 4) 和一个一维数组 (4,) 进行运算:
arr_2d = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
arr_1d = np.array([10, 20, 30, 40])
result = arr_2d + arr_1d
print(result)
在这个例子中,一维数组 arr_1d 会沿着二维数组 arr_2d 的行方向进行广播,相当于把 arr_1d 扩展为 (3, 4) 的形状(即 [[10, 20, 30, 40], [10, 20, 30, 40], [10, 20, 30, 40]]),然后对应元素相加,输出如下:
[[11 22 33 44]
[15 26 37 48]
[19 30 31 42]]
二、数组的聚合函数
sum 函数 —— 计算总和:
sum 函数用于计算数组所有元素的总和。对于一维数组,操作很直观,例如:
arr = np.array([10, 20, 30, 40])
total_sum = arr.sum()print(total_sum)
输出为 100,即数组元素相加的结果。
对于多维数组,可以指定沿着哪个轴(维度)进行求和。例如,对于一个二维数组:
arr_2d = np.array([[1, 2], [3, 4]])
row_sum = arr_2d.sum(axis=0) # 沿着列方向求和,也就是计算每列元素的总和print(row_sum)
col_sum = arr_2d.sum(axis=1) # 沿着行方向求和,计算每行元素的总和print(col_sum)
输出分别为 [4 6](列方向求和结果)和 [3, 7](行方向求和结果)。
mean 函数 —— 计算平均值:
mean 函数用于计算数组元素的平均值。用法和 sum 函数类似,对于一维数组:
arr = np.array([2, 4, 6, 8])
average = arr.mean()print(average)
输出为 5,即数组元素总和除以元素个数的结果。
对于多维数组同样可以指定轴来计算平均值,例如:
arr_2d = np.array([[1, 2], [3, 4]])
row_mean = arr_2d.mean(axis=0)print(row_mean)
col_mean = arr_2d.mean(axis=1)print(col_mean)
输出分别为 [2. 3.](列方向平均)和 [1.5, 3.5](行方向平均)。
max 和 min 函数 —— 求最大值和最小值:
max 函数用于找出数组中的最大值,min 函数则找出最小值。对于一维数组:
arr = np.array([5, 3, 8, 1])print(arr.max())print(arr.min())
分别输出 8(最大值)和 1(最小值)。
对于多维数组也可以按轴来查找最值,比如:
arr_2d = np.array([[1, 2], [9, 4]])print(arr_2d.max(axis=0)) # 列方向找最大值print(arr_2d.min(axis=0)) # 列方向找最小值
输出分别为 [9, 4](列方向最大值)和 [1, 2](列方向最小值)。
通过今天对 NumPy 数组高级操作的学习,我们解锁了更强大的数值数据处理技能。广播机制让不同形状数组间的运算变得轻松自如,而聚合函数则为我们进行统计分析提供了便捷的工具,这都将助力我们在后续的数据分析等工作中更高效地挖掘数据背后的价值。
#NumPy 高级操作# #数组广播机制# #聚合函数运用# #数据统计分析# #Python 科学计算进阶# #数值数据处理#