百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Python NumPy库的安装和使用(python安装numpy库的方法)

ztj100 2025-03-20 21:18 47 浏览 0 评论

NumPy 就是一个数学运算的库,使用 C 语言实现的,所以运算速度非常快。该模块也不是 Python 自带的,需要自行安装。

可以使用 PIP 进行安装,命令如下:

pip install numpy

使用该模块之前需要将其引入,常用的方法是:

import numpy as np

这样以后就可以使用 np 来表示该模块了。

NumPy 最常见的数据结构就是 ndarray,ndarray 表示 N-dimentioanl Array,就是多维数组的意思。本节也从这里开始介绍 NumPy。

ndarray的构造

可以使用多种方式来构建多维数组,最常见的是使用列表来构建多维数组。下面的例子便使用一维列表构建了一个一维数组。

>>> import numpy as np
>>> nda1 = np.array([1, 2, 3])        # 使用一维列表来作为输入
>>> nda1                       
array([1, 2, 3])6    >>> type(nda1)

如果希望构建二维数组,可以使用下面的方法:

>>> input_list = [
...     [1, 2, 3],
...     [4, 5, 6]
... ]
>>> nda2 = np.array(input_list)
>>> nda2
array([[1, 2, 3],                    # 查看值
       [4, 5, 6]])
>>> type(nda2)                        # 查看类型

也可以指定一些特征值,让 NumPy 自动产生相关的数组。例如指定维度,让其产生所有元素都为正常 0 的数组,代码如下:

>>> np.zeros(5)                        # 5个元素的一维数组
array([0., 0., 0., 0., 0.])
>>> np.zeros((5, 2))                # 二维数组,5行,2列
array([[0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.],
       [0., 0.]])

也可以指定维度,让其产生所有元素值都为 1 的数组,代码如下:

>>> np.ones((5, 2))                    # 二维数组,5行,2列,所有元素都为1
array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])
>>> np.ones(5)                        # 一维数组,5个元素
array([1., 1., 1., 1., 1.])

还可以让 NumPy 自动产生等差数组,此时需要指定开始值、结束值和步长。代码如下:

>>> np.arange(3,7,2)                # 从3开始,直到7,步长为2
array([3, 5])
>>> np.arange(3,7,1)                # 从3开始,直到7,步长为1
array([3, 4, 5, 6])
>>> np.arange(7, 3, -1)                # 从7开始,直到3,步长为-1
array([7, 6, 5, 4])
>>> np.arange(7, 3, -2)                # 从7开始,直到3,步长为-2
array([7, 5])

arange() 函数和 range() 类似,如果仅提供一个值,那么开始值就是 0,步长是 1,代码如下:

>>> np.arange(7)
array([0, 1, 2, 3, 4, 5, 6])
如果提供两个参数,那么步长为 1:
>>> np.arange(2, 5)                # 从2开始,直到5,步长为1
array([2, 3, 4])
>>> np.arange(2, 6)                # 从2开始,直到6,步长为1
array([2, 3, 4, 5])


另外一个等差数列函数是 linspace(),其指定开始位置和结束位置,但不指定步长,而是指定元素个数。例如从 1 开始,到 5 结束,一共有 8 个数,那么生成的数组如下面所示:

>>> np.linspace(1, 5, 8)        # 包括1和5,等分8个点
array([1. , 1.57142857, 2.14285714, 2.71428571, 3.28571429,
     3.85714286, 4.42857143, 5])

可以发现元素个数和指定的一致,开始值和结束值也都被包含,而且它们的确是等差数列。

linspace() 函数比较有用,例如要画正弦函数在 0 到 2π 之间的图形,便可以使用该函数在 0 到 2π 之间产生均匀分布的 100 个点,然后使用 matplotlib 将它们画出来。下面是演示的代码:

import matplotlib.pyplot as plt
import numpy as np
x  = np.linspace(0, 2*np.pi, 100)
y  = [np.sin(e) for e in x]
plt.plot(x, y)
plt.savefig("sindemo1.png")

运行后产生的图片如图 1 所示。

图 1 y=sin(x)的曲线

还可以使用 logspace() 函数让 NumPy 自动产生等比数列,此时需要指定开始点和结束点,同时指定点的个数。如果没有提供点的数目,默认是生成 50 个点。

>>> np.logspace(2.0, 3.0, num=4)    # 4个点,其实位置是102,结束位置是103
array([ 100. , 215.443469,  464.15888336, 1000.])


下面是一个例子,其演示了 logspace() 的用法和参数 endpoint 的用法。endpoint=True 表示结束值被包含在输出数组中,否则表示不包含在输出数组中。下面是完整的代码:

import matplotlib.pyplot as plt
import numpy as np
N = 10            # 一共10个点
x1 = np.logspace(0.1, 1, N, endpoint=True)        # 10被算作是最后一个点
x2 = np.logspace(0.1, 1, N, endpoint=False)    # 10不被算作是最后一个点
y = np.zeros(N)
plt.plot(x1, y, 'o')
plt.plot(x2, y + 0.5, 'x')
plt.ylim([-0.5, 1])                                # y轴的范围是-0.5到1
plt.savefig("logspace1.png")                    # 保存图片到文件

运行该脚本,得到的输出图片如图 2 所示。

图 2 logspace()的用法

还可以使用 full() 函数指定维度和一个值,让所有的元素都等于该值。该函数和 ones() 类似,但值是由用户指定的。

>>> np.full((2, 2), np.inf)                # 所有元素都是无穷大
array([[inf, inf],
       [inf, inf]])
>>> np.full((2, 2), 11)                    # 所有元素都是11
array([[11, 11],
       [11, 11]])
>>> np.full((2, 2), 1.51)                # 所有元素都是1.51
array([[1.51, 1.51],
       [1.51, 1.51]])


使用 eye() 函数还可以自动生成单位矩阵,就是仅对角线上的值为 1,其他位置上的值都为 0。

>>> np.eye(2)                                    # 2x2的单位矩阵
array([[1., 0.],
       [0., 1.]])
>>> np.eye(3)                                    # 3x3的单位矩阵
array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

还可以自动产生随机的矩阵,例如可以使用 random.normal() 函数产生一个正态分布的一维矩阵:

>>> mu, sigma = 0, 0.1                    # mu是平均值,sigma代表分散程度
>>> s = np.random.normal(mu, sigma, 1000)
>>> s.size                                        # 元素个数为1000
1000
>>> np.mean(s)                                    # 平均值接近0
-0.0011152161285000821
>>> abs(mu - np.mean(s)) < 0.01 mu='0' true>>> abs(sigma - np.std(s, ddof=1)) < 0.01        # 分散程度检查
True

可以将生成的数据画出来,使用下面的代码:

import matplotlib.pyplot as plt
import numpy as np
mu, sigma = 0, 0.1
s = np.random.normal(mu, sigma, 1000)
count, bins, ignored = plt.hist(s, 30, density=True)
plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *
         np.exp( - (bins - mu)**2 / (2 * sigma**2) ),
         linewidth=2, color='r')
plt.savefig("rand1.png")

运行该脚本,得到的输出图片文件如图 3 所示。

图 3 正态分布

还可以生成完全随机的矩阵,方法是使用 np.random.rand(外形)函数。例如在下面的例子中,就生成了随机内容组成的指定外形的矩阵。

>>> np.random.rand(3,2)                    # 3x2的二维矩阵
array([[0.11319256, 0.84668147],
       [0.4040353 , 0.70912343],
       [0.6511614 , 0.80706271]])
>>> np.random.rand(3,2,2)                # 3x2x2的三维矩阵
array([[[0.64851863, 0.3895985 ],
        [0.63038544, 0.58402249]],
       [[0.39816687, 0.92149102],
        [0.07113285, 0.17109903]],
       [[0.06713956, 0.39415293],
        [0.06125844, 0.71276929]]])
>>> np.random.rand(4)                    # 一维矩阵
array([0.11918788, 0.91847982, 0.29599804, 0.42242323])

相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: