Python中numpy数据分析库知识点总结
ztj100 2024-11-21 00:30 16 浏览 0 评论
Python中numpy数据分析库知识点总结
- 二、对已读取数据的处理
- ②指定一个值,并对该值双边进行修改
- ③指定两个值,并对第一个值的左侧和第二个值的右侧进行修改
- 2.4 数组的拼接和行列交换
- ①竖直拼接(np.vstacknp.vstack)
- ②水平拼接(np.hstacknp.hstack)
- 2.5 创建特殊类型的数组
- 2.6 numpy中常用统计函数
- 3.1 numpy中的nan和inf
- ①两个np.nannp.nan 是不相等的
一、numpy读取数据
推荐读入CSV( CSV:Comma-Separated Value,逗号分隔值文件 )格式的文件
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
二、对已读取数据的处理
我们默认要处理的数据命名为 t
如果,你不方便读入可以以下面的 t 为例子进行操作
t=np.array([[1,2,3],
[4,5,6],
[7,8,9]])
2.1 转置
读取数据后可能不符合日常操作习惯,这时可以对数据进行转置处理。
有三种办法进行转置,但是我只推荐前两种。
①第一种
t.transpose()
②第二种
t.T
③第三种
解释一下:这里通过交换0-axis和1-axis轴巧妙的将数据进行了转置
t.swapaxes(1,0)
2.2 数值的修改
这里通过举例子,来解释更容易理解!
①单边进行修改
这里其实是基于 numpy中布尔索引 ,感兴趣的同学可以自行百度。
例子:我们想要把t中小于3的数字替换为3
t[t<3]=3
②指定一个值,并对该值双边进行修改
例子:我们想把t中小于5的数字替换为0,把大于5的替换为1
这里的 np.where() 是 numpy 的三元运算符
np.where(t<5,0,1)
③指定两个值,并对第一个值的左侧和第二个值的右侧进行修改
例子:我们想把小于3的替换为3,大于5的替换为5
这里的 clip() 函数是修剪函数
np.clip(t,3,5)
2.3 索引和切片
这里通过举例子,来解释更容易理解!
①索引单个元素
例子:取出位于第一行第二列的元素
t[0,1]
②取出某行或某列
例子:取出第2行和第2列
t[1,:] # 第二行
t[:,1] # 第二列
③取出连续多行或多列
例子:取出第二行到第三行
取出第二行之后所有行(这个还是很有用的,因为,大多数情况下,我们数据的第一行都是标签)
t[1:3,:] # 第二行到第三行
t[1:,:] # 第二行之后所有行
④取出不连续的多行或多列
例子:取出第一行和第三行
t[[0,2],:] # 取出第一行和第三行
⑤取出多个交叉点的元素
例子:取出第2行和第2列的元素一和第3行和第3列的元素二,并组成一个新数组
t[[1,2],[1,2]]
2.4 数组的拼接和行列交换
我们大部分时间使用数组的拼接,很少用到数组的切割。因为我们如果需要切割,我们会首先选择切片。
①竖直拼接(np.vstack)
t1=np.array([[1,2],
[3,4]])
t2=np.array([[5,6],
[7,8]])
print(np.vstack((t1,t2)))
output:
[[1 2]
[3 4]
[5 6]
[7 8]]
②水平拼接(np.hstack)
t1=np.array([[1,2],
[3,4]])
t2=np.array([[5,6],
[7,8]])
print(np.hstack((t1,t2)))
output:
[[1 2 5 6]
[3 4 7 8]]
③行交换
将数组的二三行进行交换。
t[[1,2],:]=t[[2,1],:]
④列交换
将数组的二三列进行交换。
t[:,[1,2]]=t[:,[2,1]]
2.5 创建特殊类型的数组
①创建一个全0的数组
np.zeros((3,4))
②创建一个全1的数组
np.ones((3,4))
③创建一个对角线为1的正方形数组(方阵)
np.eye(3)
2.6 numpy中常用统计函数
根据情况需要,选择传入 axis=0 或者 axis=1 或者不传入 axis 参数。
t.sum(axis=None)
t.mean(a,axis=None)
np.median(t,axis=None)
④最大值
t.max(axis=None)
⑤最小值
t.min(axis=None)
⑥最大值减去最小值
np.ptp(t,axis=None)
⑦标准差
t.std(axis=None)
⑧获取最大值的位置
np.argmax(t,axis=0)
⑧获取最小值的位置
np.argmin(t,axis=1)
三、几个注意点
3.1 numpy中的nan和inf
np.nan (not a number)表示不是一个数字。
我们的数据中如果出现这种情况,不要着急删除整行或是整列数据,因为数据是宝贵的。我们可以将其 替换为 该行或该列的均值、中值等。
同时, np.nan 具有一些特殊的性质,下面用代码来说。
①两个np.nan是不相等的
# 两个nan 是不相等的
print(np.nan==np.nan) # False
print(np.nan!=np.nan) # True
②np.nan的类型是<class 'float'>
print(type(np.nan)) # <class 'float'>
③判断数组中的nan 的个数
注意,数组中的元素需要是 <class 'float'> 类型,才能有元素 np.nan 。
利用两个 np.nan 是不相等的性质
如果数组内有元素 np.nan ,就会在位置上返回 True ,其他位置均返回 False
print(t!=t)
利用现有函数 np.isnan()
np.isnan(t)
然后通过函数 np.count_nonzero() 数0(False)的个数就可以了。
④ndarry缺失值填充
下面是利用均值来填充缺失值
# 要注意的是这里的平均个数是删去nan元素后的数组个数
def fill_nan_by_col_mean(t):
for i in range(t.shape[1]):
t_col=t[:,i]
if np.count_nonzero(np.isnan(t_col)) != 0:
t_col[t_col!=t_col]=t_col[t_col==t_col].mean()
# 没必要写这一句话,因为上面的t_col=t[:,i]属于view,属于浅拷贝,数据是同时变化的!
t[:,i]=t_col
def fill_nan_by_row_mean(t):
for i in range(t.shape[0]):
t_row=t[i,:]
if np.count_nonzero(np.isnan(t_row)) != 0:
t_row[t_row!=t_row]=t_row[t_row==t_row].mean()
# 没必要写这一句话,因为上面的t_row=t[i,:]属于view,属于浅拷贝,数据是同时变化的!
t[i,:]=t_row
3.2 view(浅拷贝)和 copy(深拷贝)
完全不复制
t1和t2相互影响。
t1=t2
view(浅拷贝)
视图的操作,一种切片,会创建新的对象,但是新的对象的数据完全由原对象保管,他们两个的数据变化是一致的。
t1=t2[:,1]
copy(深拷贝)
复制的操作,新的对象和原对象之间互不影响。
t1=t2.copy()
- 上一篇:图像颜色特征提取
- 下一篇:147.Python——图像预处理操作:缩放和裁剪
相关推荐
- 30天学会Python编程:16. Python常用标准库使用教程
-
16.1collections模块16.1.1高级数据结构16.1.2示例...
- 强烈推荐!Python 这个宝藏库 re 正则匹配
-
Python的re模块(RegularExpression正则表达式)提供各种正则表达式的匹配操作。...
- Python爬虫中正则表达式的用法,只讲如何应用,不讲原理
-
Python爬虫:正则的用法(非原理)。大家好,这节课给大家讲正则的实际用法,不讲原理,通俗易懂的讲如何用正则抓取内容。·导入re库,这里是需要从html这段字符串中提取出中间的那几个文字。实例一个对...
- Python数据分析实战-正则提取文本的URL网址和邮箱(源码和效果)
-
实现功能:Python数据分析实战-利用正则表达式提取文本中的URL网址和邮箱...
- python爬虫教程之爬取当当网 Top 500 本五星好评书籍
-
我们使用requests和re来写一个爬虫作为一个爱看书的你(说的跟真的似的)怎么能发现好书呢?所以我们爬取当当网的前500本好五星评书籍怎么样?ok接下来就是学习python的正确姿...
- 深入理解re模块:Python中的正则表达式神器解析
-
在Python中,"re"是一个强大的模块,用于处理正则表达式(regularexpressions)。正则表达式是一种强大的文本模式匹配工具,用于在字符串中查找、替换或提取特定模式...
- 如何使用正则表达式和 Python 匹配不以模式开头的字符串
-
需要在Python中使用正则表达式来匹配不以给定模式开头的字符串吗?如果是这样,你可以使用下面的语法来查找所有的字符串,除了那些不以https开始的字符串。r"^(?!https).*&...
- 先Mark后用!8分钟读懂 Python 性能优化
-
从本文总结了Python开发时,遇到的性能优化问题的定位和解决。概述:性能优化的原则——优化需要优化的部分。性能优化的一般步骤:首先,让你的程序跑起来结果一切正常。然后,运行这个结果正常的代码,看看它...
- Python“三步”即可爬取,毋庸置疑
-
声明:本实例仅供学习,切忌遵守robots协议,请不要使用多线程等方式频繁访问网站。#第一步导入模块importreimportrequests#第二步获取你想爬取的网页地址,发送请求,获取网页内...
- 简单学Python——re库(正则表达式)2(split、findall、和sub)
-
1、split():分割字符串,返回列表语法:re.split('分隔符','目标字符串')例如:importrere.split(',','...
- Lavazza拉瓦萨再度牵手上海大师赛
-
阅读此文前,麻烦您点击一下“关注”,方便您进行讨论和分享。Lavazza拉瓦萨再度牵手上海大师赛标题:2024上海大师赛:网球与咖啡的浪漫邂逅在2024年的上海劳力士大师赛上,拉瓦萨咖啡再次成为官...
- ArkUI-X构建Android平台AAR及使用
-
本教程主要讲述如何利用ArkUI-XSDK完成AndroidAAR开发,实现基于ArkTS的声明式开发范式在android平台显示。包括:1.跨平台Library工程开发介绍...
- Deepseek写歌详细教程(怎样用deepseek写歌功能)
-
以下为结合DeepSeek及相关工具实现AI写歌的详细教程,涵盖作词、作曲、演唱全流程:一、核心流程三步法1.AI生成歌词-打开DeepSeek(网页/APP/API),使用结构化提示词生成歌词:...
- “AI说唱解说影视”走红,“零基础入行”靠谱吗?本报记者实测
-
“手里翻找冻鱼,精心的布局;老漠却不言语,脸上带笑意……”《狂飙》剧情被写成歌词,再配上“科目三”背景音乐的演唱,这段1分钟30秒的视频受到了无数网友的点赞。最近一段时间随着AI技术的发展,说唱解说影...
- AI音乐制作神器揭秘!3款工具让你秒变高手
-
在音乐创作的领域里,每个人都有一颗想要成为大师的心。但是面对复杂的乐理知识和繁复的制作过程,许多人的热情被一点点消磨。...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 30天学会Python编程:16. Python常用标准库使用教程
- 强烈推荐!Python 这个宝藏库 re 正则匹配
- Python爬虫中正则表达式的用法,只讲如何应用,不讲原理
- Python数据分析实战-正则提取文本的URL网址和邮箱(源码和效果)
- python爬虫教程之爬取当当网 Top 500 本五星好评书籍
- 深入理解re模块:Python中的正则表达式神器解析
- 如何使用正则表达式和 Python 匹配不以模式开头的字符串
- 先Mark后用!8分钟读懂 Python 性能优化
- Python“三步”即可爬取,毋庸置疑
- 简单学Python——re库(正则表达式)2(split、findall、和sub)
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)