百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

对二维张量 `X` 使用布尔索引 `~mask`

ztj100 2024-11-14 19:23 20 浏览 0 评论

为什么 当你对二维张量 `X` 使用布尔索引 `~mask` 时,实际上是将 `X` 中所有满足 `~mask` 为 `True` 的元素提取出来?为什么不提取X中为True的元素?

在理解布尔索引时,我们要明确 mask 和 ~mask 的含义。布尔索引的功能是提取或操作张量中符合某些条件的元素。

为什么是提取满足 ~mask 为 True 的元素?

在下面的代码中,mask 是一个布尔张量,它表示在某些位置上应该保留的元素:

mask = torch.arange((maxlen), dtype=torch.float32,
                    device=X.device)[None, :] < valid_len[:, None]

这里 mask 中为 True 的元素表示这些位置上的元素应该保留,为 False 的元素表示这些位置上的元素应该被遮蔽。

当我们使用 X[~mask] = value 这样的语句时:

X[~mask] = value

意思是将 X 中所有对应 ~mask 为 True 的元素替换为 value。这样做是因为我们想要屏蔽(替换)那些无效的位置。

为什么是 ~mask 而不是 mask?

  • mask 中 mask 中`对True 表示有效的位置,这些位置的值应该保留。
  • mask 中 False 表示无效的位置,这些位置的值应该屏蔽。

我们需要将无效位置的值替换为 value,因此使用 ~mask(对 mask 取反)来索引那些无效的位置。

举例说明

假设 X 是:

[[1, 2, 3],
 [4, 5, 6]]

valid_len 是:

[1, 2]

生成 mask 的过程如下:

maxlen = X.size(1)  # 3
mask = torch.arange((maxlen), dtype=torch.float32, device=X.device)[None, :] < valid_len[:, None]

生成的 mask 是:

[[ True, False, False],
 [ True,  True, False]]

对于 X,我们希望将 mask 中 False 对应的位置替换为 value,所以我们用 ~mask:

~mask = [[False,  True,  True],
         [False, False,  True]]

这样,我们就可以将 X 中这些位置的值替换为 value:

X[~mask] = value

这时的 X 变为:

[[1, 0, 0],
 [4, 5, 0]]

总结

在Python中,特别是使用NumPy或Pandas这类库处理数组和数据帧时,布尔索引是一种强大的特性,它允许你根据条件选择数组或数据帧的一部分。这里的操作符 `~` 是按位取反运算符,它会反转布尔数组中的真值(True和False)。所以当你有一个布尔掩码(例如,`mask`)并且你执行 `~mask`,原本为 `True` 的位置将会变为 `False`,而为 `False` 的位置会变为 `True`。

当我们用这样的反转掩码 `~mask` 去索引另一个数组 `X` 时,我们实际上是在告诉Python:“请从 `X` 中选择那些在 `~mask` 中为 `True` 的对应位置的元素。” 因为 `~mask` 转换后指示的是原 `mask` 中 `False` 的位置,所以这样做实际上是选择了 `X` 中原本不满足 `mask` 条件的元素,而非满足条件的元素。

举个例子,假设你有一个数组 `X = [10, 20, 30, 40]` 和一个布尔掩码 `mask = [True, False, True, False]`,`mask` 表明你想要排除(或说是不感兴趣于)`X` 中的前一个和第三个元素(因为它们在 `mask` 中对应的位置是 `True`,意味着这些位置上的值满足某个条件)。如果你使用 `~mask`,得到 `[False, True, False, True]`,这实际上标记出了你想保留的元素位置。因此,当你用 `X[~mask]` 索引时,你得到的是 `[20, 40]`,即 `X` 中那些原本在 `mask` 中为 `False` 的值。

简而言之,使用 `~mask` 实现的是逻辑上的“取反”,帮助你从原始数据集中选出那些不满足原始条件的元素,而不是直接选取满足条件的元素。

相关推荐

再说圆的面积-蒙特卡洛(蒙特卡洛方法求圆周率的matlab程序)

在微积分-圆的面积和周长(1)介绍微积分方法求解圆的面积,本文使用蒙特卡洛方法求解圆面积。...

python编程:如何使用python代码绘制出哪些常见的机器学习图像?

专栏推荐...

python创建分类器小结(pytorch分类数据集创建)

简介:分类是指利用数据的特性将其分成若干类型的过程。监督学习分类器就是用带标记的训练数据建立一个模型,然后对未知数据进行分类。...

matplotlib——绘制散点图(matplotlib散点图颜色和图例)

绘制散点图不同条件(维度)之间的内在关联关系观察数据的离散聚合程度...

python实现实时绘制数据(python如何绘制)

方法一importmatplotlib.pyplotaspltimportnumpyasnpimporttimefrommathimport*plt.ion()#...

简单学Python——matplotlib库3——绘制散点图

前面我们学习了用matplotlib绘制折线图,今天我们学习绘制散点图。其实简单的散点图与折线图的语法基本相同,只是作图函数由plot()变成了scatter()。下面就绘制一个散点图:import...

数据分析-相关性分析可视化(相关性分析数据处理)

前面介绍了相关性分析的原理、流程和常用的皮尔逊相关系数和斯皮尔曼相关系数,具体可以参考...

免费Python机器学习课程一:线性回归算法

学习线性回归的概念并从头开始在python中开发完整的线性回归算法最基本的机器学习算法必须是具有单个变量的线性回归算法。如今,可用的高级机器学习算法,库和技术如此之多,以至于线性回归似乎并不重要。但是...

用Python进行机器学习(2)之逻辑回归

前面介绍了线性回归,本次介绍的是逻辑回归。逻辑回归虽然名字里面带有“回归”两个字,但是它是一种分类算法,通常用于解决二分类问题,比如某个邮件是否是广告邮件,比如某个评价是否为正向的评价。逻辑回归也可以...

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂

一、拟合和回归的区别拟合...

推荐2个十分好用的pandas数据探索分析神器

作者:俊欣来源:关于数据分析与可视化...

向量数据库:解锁大模型记忆的关键!选型指南+实战案例全解析

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...

用Python进行机器学习(11)-主成分分析PCA

我们在机器学习中有时候需要处理很多个参数,但是这些参数有时候彼此之间是有着各种关系的,这个时候我们就会想:是否可以找到一种方式来降低参数的个数呢?这就是今天我们要介绍的主成分分析,英文是Princip...

神经网络基础深度解析:从感知机到反向传播

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...

Python实现基于机器学习的RFM模型

CDA数据分析师出品作者:CDALevelⅠ持证人岗位:数据分析师行业:大数据...

取消回复欢迎 发表评论: