百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

对二维张量 `X` 使用布尔索引 `~mask`

ztj100 2024-11-14 19:23 15 浏览 0 评论

为什么 当你对二维张量 `X` 使用布尔索引 `~mask` 时,实际上是将 `X` 中所有满足 `~mask` 为 `True` 的元素提取出来?为什么不提取X中为True的元素?

在理解布尔索引时,我们要明确 mask 和 ~mask 的含义。布尔索引的功能是提取或操作张量中符合某些条件的元素。

为什么是提取满足 ~mask 为 True 的元素?

在下面的代码中,mask 是一个布尔张量,它表示在某些位置上应该保留的元素:

mask = torch.arange((maxlen), dtype=torch.float32,
                    device=X.device)[None, :] < valid_len[:, None]

这里 mask 中为 True 的元素表示这些位置上的元素应该保留,为 False 的元素表示这些位置上的元素应该被遮蔽。

当我们使用 X[~mask] = value 这样的语句时:

X[~mask] = value

意思是将 X 中所有对应 ~mask 为 True 的元素替换为 value。这样做是因为我们想要屏蔽(替换)那些无效的位置。

为什么是 ~mask 而不是 mask?

  • mask 中 mask 中`对True 表示有效的位置,这些位置的值应该保留。
  • mask 中 False 表示无效的位置,这些位置的值应该屏蔽。

我们需要将无效位置的值替换为 value,因此使用 ~mask(对 mask 取反)来索引那些无效的位置。

举例说明

假设 X 是:

[[1, 2, 3],
 [4, 5, 6]]

valid_len 是:

[1, 2]

生成 mask 的过程如下:

maxlen = X.size(1)  # 3
mask = torch.arange((maxlen), dtype=torch.float32, device=X.device)[None, :] < valid_len[:, None]

生成的 mask 是:

[[ True, False, False],
 [ True,  True, False]]

对于 X,我们希望将 mask 中 False 对应的位置替换为 value,所以我们用 ~mask:

~mask = [[False,  True,  True],
         [False, False,  True]]

这样,我们就可以将 X 中这些位置的值替换为 value:

X[~mask] = value

这时的 X 变为:

[[1, 0, 0],
 [4, 5, 0]]

总结

在Python中,特别是使用NumPy或Pandas这类库处理数组和数据帧时,布尔索引是一种强大的特性,它允许你根据条件选择数组或数据帧的一部分。这里的操作符 `~` 是按位取反运算符,它会反转布尔数组中的真值(True和False)。所以当你有一个布尔掩码(例如,`mask`)并且你执行 `~mask`,原本为 `True` 的位置将会变为 `False`,而为 `False` 的位置会变为 `True`。

当我们用这样的反转掩码 `~mask` 去索引另一个数组 `X` 时,我们实际上是在告诉Python:“请从 `X` 中选择那些在 `~mask` 中为 `True` 的对应位置的元素。” 因为 `~mask` 转换后指示的是原 `mask` 中 `False` 的位置,所以这样做实际上是选择了 `X` 中原本不满足 `mask` 条件的元素,而非满足条件的元素。

举个例子,假设你有一个数组 `X = [10, 20, 30, 40]` 和一个布尔掩码 `mask = [True, False, True, False]`,`mask` 表明你想要排除(或说是不感兴趣于)`X` 中的前一个和第三个元素(因为它们在 `mask` 中对应的位置是 `True`,意味着这些位置上的值满足某个条件)。如果你使用 `~mask`,得到 `[False, True, False, True]`,这实际上标记出了你想保留的元素位置。因此,当你用 `X[~mask]` 索引时,你得到的是 `[20, 40]`,即 `X` 中那些原本在 `mask` 中为 `False` 的值。

简而言之,使用 `~mask` 实现的是逻辑上的“取反”,帮助你从原始数据集中选出那些不满足原始条件的元素,而不是直接选取满足条件的元素。

相关推荐

如何将数据仓库迁移到阿里云 AnalyticDB for PostgreSQL

阿里云AnalyticDBforPostgreSQL(以下简称ADBPG,即原HybridDBforPostgreSQL)为基于PostgreSQL内核的MPP架构的实时数据仓库服务,可以...

Python数据分析:探索性分析

写在前面如果你忘记了前面的文章,可以看看加深印象:Python数据处理...

CSP-J/S冲奖第21天:插入排序

...

C++基础语法梳理:算法丨十大排序算法(二)

本期是C++基础语法分享的第十六节,今天给大家来梳理一下十大排序算法后五个!归并排序...

C 语言的标准库有哪些

C语言的标准库并不是一个单一的实体,而是由一系列头文件(headerfiles)组成的集合。每个头文件声明了一组相关的函数、宏、类型和常量。程序员通过在代码中使用#include<...

[深度学习] ncnn安装和调用基础教程

1介绍ncnn是腾讯开发的一个为手机端极致优化的高性能神经网络前向计算框架,无第三方依赖,跨平台,但是通常都需要protobuf和opencv。ncnn目前已在腾讯多款应用中使用,如QQ,Qzon...

用rust实现经典的冒泡排序和快速排序

1.假设待排序数组如下letmutarr=[5,3,8,4,2,7,1];...

ncnn+PPYOLOv2首次结合!全网最详细代码解读来了

编辑:好困LRS【新智元导读】今天给大家安利一个宝藏仓库miemiedetection,该仓库集合了PPYOLO、PPYOLOv2、PPYOLOE三个算法pytorch实现三合一,其中的PPYOL...

C++特性使用建议

1.引用参数使用引用替代指针且所有不变的引用参数必须加上const。在C语言中,如果函数需要修改变量的值,参数必须为指针,如...

Qt4/5升级到Qt6吐血经验总结V202308

00:直观总结增加了很多轮子,同时原有模块拆分的也更细致,估计为了方便拓展个管理。把一些过度封装的东西移除了(比如同样的功能有多个函数),保证了只有一个函数执行该功能。把一些Qt5中兼容Qt4的方法废...

到底什么是C++11新特性,请看下文

C++11是一个比较大的更新,引入了很多新特性,以下是对这些特性的详细解释,帮助您快速理解C++11的内容1.自动类型推导(auto和decltype)...

掌握C++11这些特性,代码简洁性、安全性和性能轻松跃升!

C++11(又称C++0x)是C++编程语言的一次重大更新,引入了许多新特性,显著提升了代码简洁性、安全性和性能。以下是主要特性的分类介绍及示例:一、核心语言特性1.自动类型推导(auto)编译器自...

经典算法——凸包算法

凸包算法(ConvexHull)一、概念与问题描述凸包是指在平面上给定一组点,找到包含这些点的最小面积或最小周长的凸多边形。这个多边形没有任何内凹部分,即从一个多边形内的任意一点画一条线到多边形边界...

一起学习c++11——c++11中的新增的容器

c++11新增的容器1:array当时的初衷是希望提供一个在栈上分配的,定长数组,而且可以使用stl中的模板算法。array的用法如下:#include<string>#includ...

C++ 编程中的一些最佳实践

1.遵循代码简洁原则尽量避免冗余代码,通过模块化设计、清晰的命名和良好的结构,让代码更易于阅读和维护...

取消回复欢迎 发表评论: