数据可视化:解析小提琴图(Violin plots)
ztj100 2024-12-12 16:13 13 浏览 0 评论
小提琴图(Violin plots)是一种数据可视化类型,结合了箱线图( box plot )和核密度图( kernel density plot)的特点。它展示了数据在不同类别或分组中的分布情况。在小提琴图中,每个组的分布由一个核密度图表示,镜像和旋转以形成类似小提琴的对称形状。小提琴图在任何给定点的宽度对应于该值的数据密度。此外,通常在小提琴图上叠加一个箱线图,提供摘要统计信息,如中位数、四分位数和异常值。小提琴图可用于比较不同组之间的分布,并识别它们的形状和扩展之间的差异。
Python 中的实现
标准正态分布(Standard Normal distribution)
代码生成了一个展示标准正态分布数据样本的直方图、箱线图和小提琴图的图形。首先,从标准正态分布中生成了一组具有10^4个样本的数据。然后,使用matplotlib和seaborn库创建了一个包含3个子图的图形。第一个子图显示了数据样本的直方图和核密度估计图(KDE),第二个子图显示了数据样本的箱线图,第三个子图显示了数据样本的小提琴图。标题标注了每个子图中显示的图形类型以及整个图形的主标题是"标准正态分布"。
import matplotlib.pyplot as plt
import seaborn as sns
N = 10 ** 4
np.random.seed(2024)
sample_gaussian = np.random.normal(size=N)
fig, ax = plt.subplots(3, 1, sharex=True)
sns.distplot(sample_gaussian, ax=ax[0])
ax[0].set_title('Histogram + KDE')
sns.boxplot(sample_gaussian, ax=ax[1])
ax[1].set_title('Boxplot')
sns.violinplot(sample_gaussian, ax=ax[2])
ax[2].set_title('Violin plot')
fig.suptitle('Standard Normal Distribution', fontsize=16)
plt.show()
可以得出一些观察结果:
- 在直方图中,我们看到了分布的对称形状。
- 在箱线图和小提琴图中,我们可以看到之前提到的指标(中位数、四分位距、图基的栅栏)。
- 用于创建小提琴图的核密度图与添加在直方图上方的核密度图相同。小提琴图中较宽的部分代表观察值取特定值的概率较高,而较窄的部分对应着概率较低的情况。
将这三种图形放在一起展示可以很好地解释小提琴图的本质以及它包含的信息类型。
对数正态分布(Log-normal distribution)
接下来是对数正态分布的示例,这种分布明显比正态分布更倾斜。
import matplotlib.pyplot as plt
import seaborn as sns
N = 10 ** 4
np.random.seed(2024)
sample_lognormal = np.random.lognormal(size=N)
fig, ax = plt.subplots(3, 1, sharex=True)
sns.distplot(sample_lognormal, ax=ax[0])
ax[0].set_title('Histogram + KDE')
sns.boxplot(sample_lognormal, ax=ax[1])
ax[1].set_title('Boxplot')
sns.violinplot(sample_lognormal, ax=ax[2])
ax[2].set_title('Violin plot')
fig.suptitle('Log-normal Distribution', fontsize=16)
plt.show()
混合高斯分布 — 双峰(Mixture of Gaussians — bimodal)
在前两个例子中,我们已经看到小提琴图比箱线图包含更多信息。当我们考虑多峰分布时,这一点变得更加明显。在这个例子中,我们创建一个双峰分布,作为两个高斯分布的混合。
import matplotlib.pyplot as plt
import seaborn as sns
N = 10 ** 4
np.random.seed(2024)
sample_bimodal = np.concatenate([np.random.normal(loc=-2, scale=2, size=int(N/2)),
np.random.normal(loc=3, scale=1, size=int(N/2))])
fig, ax = plt.subplots(3, 1, sharex=True)
sns.distplot(sample_bimodal, ax=ax[0])
ax[0].set_title('Histogram + KDE')
sns.boxplot(sample_bimodal, ax=ax[1])
ax[1].set_title('Boxplot')
sns.violinplot(sample_bimodal, ax=ax[2])
ax[2].set_title('Violin plot')
fig.suptitle('Mixture of Gaussians - bimodal', fontsize=16)
plt.show()
没有密度图,我们将无法发现数据中的两个峰值。
高级用法
小提琴图经常用于比较某个变量在不同类别间的分布。我们以下列出了一些可能性。为此,我们从seaborn加载了小费(tips)数据集。
import seaborn as sns
#tips = sns.load_dataset("tips",cache=False)
tips = pd.read_csv('tips.csv')
tips
下面的示例:按性别分组的小费分布。此外,我们改变了小提琴图的结构,仅显示四分位数。其他一些可能性包括点表示所有观测值,或者箱形图表示在小提琴图内绘制一个小箱形图。
ax = sns.violinplot(x="sex", y="tip", inner='quartile', data=tips)
ax.set_title('Distribution of tips', fontsize=16);
下面示例:每天的总账单金额分布。此外,我们按性别进行了分组。立即可以看到,性别之间分布形状的最大差异发生在星期五。
ax = sns.violinplot(x="day", y="total_bill", hue="sex", data=tips)
ax.set_title('Distribution of total bill amount per day', fontsize=16)
在最后一个示例中,我们调查了与前一个案例相同的内容,但是我们设置了split=True。这样做的话,我们不是得到了8个小提琴图,而是得到了四个 —— 每个小提琴图的一侧对应着不同的性别。
ax = sns.violinplot(x="day", y="total_bill", hue="sex", split=True, data=tips)
ax.set_title('Distribution of total bill amount per day', fontsize=16);
主要介绍了什么是小提琴图,如何解释它们以及它们相对于箱线图的优势。值得一提的是,只要四分位数保持不变,箱线图就不会适应变化。我们可以以一种方式修改数据,使四分位数保持不变,但分布的形状却发生了明显的变化。以下 GIF 动画说明了这一点。
source:Same Stats, Different Graphs(https://www.research.autodesk.com/publications/same-stats-different-graphs/)
相关推荐
- 使用Python编写Ping监测程序(python 测验)
-
Ping是一种常用的网络诊断工具,它可以测试两台计算机之间的连通性;如果您需要监测某个IP地址的连通情况,可以使用Python编写一个Ping监测程序;本文将介绍如何使用Python编写Ping监测程...
- 批量ping!有了这个小工具,python再也香不了一点
-
号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部下午好,我的网工朋友。在咱们网工的日常工作中,经常需要检测多个IP地址的连通性。不知道你是否也有这样的经历:对着电脑屏...
- python之ping主机(python获取ping结果)
-
#coding=utf-8frompythonpingimportpingforiinrange(100,255):ip='192.168.1.'+...
- 网站安全提速秘籍!Nginx配置HTTPS+反向代理实战指南
-
太好了,你直接问到重点场景了:Nginx+HTTPS+反向代理,这个组合是现代Web架构中最常见的一种部署方式。咱们就从理论原理→实操配置→常见问题排查→高级玩法一层层剖开说,...
- Vue开发中使用iframe(vue 使用iframe)
-
内容:iframe全屏显示...
- Vue3项目实践-第五篇(改造登录页-Axios模拟请求数据)
-
本文将介绍以下内容:项目中的public目录和访问静态资源文件的方法使用json文件代替http模拟请求使用Axios直接访问json文件改造登录页,配合Axios进行登录请求,并...
- Vue基础四——Vue-router配置子路由
-
我们上节课初步了解Vue-router的初步知识,也学会了基本的跳转,那我们这节课学习一下子菜单的路由方式,也叫子路由。子路由的情况一般用在一个页面有他的基础模版,然后它下面的页面都隶属于这个模版,只...
- Vue3.0权限管理实现流程【实践】(vue权限管理系统教程)
-
作者:lxcan转发链接:https://segmentfault.com/a/1190000022431839一、整体思路...
- swiper在vue中正确的使用方法(vue中如何使用swiper)
-
swiper是网页中非常强大的一款轮播插件,说是轮播插件都不恰当,因为它能做的事情太多了,swiper在vue下也是能用的,需要依赖专门的vue-swiper插件,因为vue是没有操作dom的逻辑的,...
- Vue怎么实现权限管理?控制到按钮级别的权限怎么做?
-
在Vue项目中实现权限管理,尤其是控制到按钮级别的权限控制,通常包括以下几个方面:一、权限管理的层级划分...
- 【Vue3】保姆级毫无废话的进阶到实战教程 - 01
-
作为一个React、Vue双修选手,在Vue3逐渐稳定下来之后,是时候摸摸Vue3了。Vue3的变化不可谓不大,所以,本系列主要通过对Vue3中的一些BigChanges做...
- Vue3开发极简入门(13):编程式导航路由
-
前面几节文章,写的都是配置路由。但是在实际项目中,下面这种路由导航的写法才是最常用的:比如登录页面,服务端校验成功后,跳转至系统功能页面;通过浏览器输入URL直接进入系统功能页面后,读取本地存储的To...
- vue路由同页面重定向(vue路由重定向到外部url)
-
在Vue中,可以使用路由的重定向功能来实现同页面的重定向。首先,在路由配置文件(通常是`router/index.js`)中,定义一个新的路由,用于重定向到同一个页面。例如,我们可以定义一个名为`Re...
- 那个 Vue 的路由,路由是干什么用的?
-
在Vue里,路由就像“页面导航的指挥官”,专门负责管理页面(组件)的切换和显示逻辑。简单来说,它能让单页应用(SPA)像多页应用一样实现“不同URL对应不同页面”的效果,但整个过程不会刷新网页。一、路...
- Vue3项目投屏功能开发!(vue投票功能)
-
最近接了个大屏项目,产品想在不同的显示器上展示大屏项目不同的页面,做出来的效果图大概长这样...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)