百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

用Python让图表动起来,居然这么简单

ztj100 2025-02-19 14:44 9 浏览 0 评论

我好像看到这个emoji:??动起来了!

编译:佑铭

参考:

https://towardsdatascience.com/how-to-create-animated-graphs-in-python-bb619cc2dec1

用Matplotlib和Seaborn这类Python库可以画出很好看的图,但是这些图只是静态的,难以动态且美观地呈现数值变化。要是在你下次的演示、视频、社交媒体Po文里能用短视频呈现数据变化,是不是很赞呢?更棒的是,你还是可以在你的图表上用Matplotlib、Seaborn或者其他库!

本文将使用美国国家药物滥用研究所和疾病预防控制中心公布的阿片类药物数据,可在此处下载:

https://www.drugabuse.gov/sites/default/files/overdosedata1999-2015.xls

我们会用到的数据是这样的:

https://www.drugabuse.gov/sites/default/files/overdose_data_1999-2015.xls.

我们将用Matplotlib和Seaborn绘图,用Numpy和Pandas处理数据。Matplotlib也提供了一些我们做动画可以的函数,所以让我们首先导入所有依赖项。

  1. import numpy as np

  2. import pandas as pd

  3. import seaborn as sns

  4. import matplotlib

  5. import matplotlib.pyplot as plt

  6. import matplotlib.animation as animation

然后用Pandas载入数据并转成DataFrame类型的数据结构。因为我们要针对不同阿片类药物的滥用画图,写个函数来载入感兴趣的特定行的数据能避免重复代码。(小编注:原文提供的代码在读取excel文件的时候使用了已废弃的sheetname参数,本文中已修正为sheet_name)

  1. overdoses = pd.read_excel('overdose_data_1999-2015.xls',sheet_name='Online',skiprows =6)

  2. def get_data(table,rownum,title):

  3. data = pd.DataFrame(table.loc[rownum][2:]).astype(float)

  4. data.columns = {title}

  5. return data

现在让我们来做动画吧!

首先,如果你和我一样使用的是jupyter notebook,请在代码首行加入 %matplotlib notebook,如此便可在notebook直接看到生成的动画而非保存后才可见。

Python 环境搭建以及神器推荐,果断转走!

我现在使用 get_data函数从表中检索海洛因过量的数据并放在有两列的Pandas DataFrame中,一列是年,一列是过量死亡的人数。

  1. %matplotlib notebook

  2. title = 'Heroin Overdoses'

  3. d = get_data(overdoses,18,title)

  4. x = np.array(d.index)

  5. y = np.array(d['Heroin Overdoses'])

  6. overdose = pd.DataFrame(y,x)

  7. #XN,YN = augment(x,y,10)

  8. #augmented = pd.DataFrame(YN,XN)

  9. overdose.columns = {title}

接下来我们初始化一个ffmpeg Writer并以20帧每秒、1800比特率进行录屏。你也可以根据喜好自行设置这些值。

  1. Writer = animation.writers['ffmpeg']

  2. writer = Writer(fps=20, metadata=dict(artist='Me'), bitrate=1800)

(小编注:如果出现
RuntimeError:RequestedMovieWriter(ffmpeg)notavailable
的报错,请自行安装ffmpeg,装了brew的Mac可以直接:brew install ffmpeg

现在我们创建一个有几个标签的图形。确保设置x和y轴的限制,以免动画随当前显示的数据范围乱跳转。

  1. fig = plt.figure(figsize=(10,6))

  2. plt.xlim(1999, 2016)

  3. plt.ylim(np.min(overdose)[0], np.max(overdose)[0])

  4. plt.xlabel('Year',fontsize=20)

  5. plt.ylabel(title,fontsize=20)

  6. plt.title('Heroin Overdoses per Year',fontsize=20)

动画的核心是动画函数,你可以在其中定义视频的每一帧发生什么。这里的 i表示动画中帧的索引。使用这个索引可以选择应在此帧中可见的数据范围。然后我使用seaborn线图来绘制所选的数据。最后两行代码只是为了让图表更美观。

  1. def animate(i):

  2. data = overdose.iloc[:int(i+1)] #选择数据范围

  3. p = sns.lineplot(x=data.index, y=data[title], data=data, color="r")

  4. p.tick_params(labelsize=17)

  5. plt.setp(p.lines,linewidth=7)

我们用调用了 animate函数并定义了帧数的
matplotlib.animation.FuncAnimation
来开始动画,frames实际上定义了调用animate的频率。

  1. ani = matplotlib.animation.FuncAnimation(fig, animate, frames=17, repeat=True)

你可以用 ani.save把动画保存为mp4,如果你想直接看一看动画效果可以用plt.show

  1. ani.save('HeroinOverdosesJumpy.mp4', writer=writer)

现在我们的图表动起来啦:

动画能够正常运行但是感觉有点跳跃,所以我们需要在已有数据点之间增加更多的数据点来使动画的过渡平滑。于是我们使用另一个函数 augment

  1. def augment(xold,yold,numsteps):

  2. xnew =

  3. ynew =

  4. for i in range(len(xold)-1):

  5. difX = xold[i+1]-xold[i]

  6. stepsX = difX/numsteps

  7. difY = yold[i+1]-yold[i]

  8. stepsY = difY/numsteps

  9. for s in range(numsteps):

  10. xnew = np.append(xnew,xold[i]+s*stepsX)

  11. ynew = np.append(ynew,yold[i]+s*stepsY)

  12. return xnew,ynew

现在我们只需要对我们的数据应用这个函数、增加
matplotlib.animation.FuncAnimation
函数的帧数。在这里我用参数numsteps=10调用augment函数,也就是增加数据点至160个,并且设置frames=160。这样以来,图表显得更为平滑,但还是在数值变动处有些突兀。

为了让我们的动画更平滑美观,我们可以增加一个平滑函数(具体请见:
https://www.swharden.com/wp/2008-11-17-linear-data-smoothing-in-python/ )。

  1. def smoothListGaussian(listin,strippedXs=False,degree=5):

  2. window=degree*2-1

  3. weight=np.array([1.0]*window)

  4. weightGauss=

  5. for i in range(window):

  6. i=i-degree+1

  7. frac=i/float(window)

  8. gauss=1/(np.exp((4*(frac))**2))

  9. weightGauss.append(gauss)

  10. weight=np.array(weightGauss)*weight

  11. smoothed=[0.0]*(len(listin)-window)

  12. for i in range(len(smoothed)): smoothed[i]=sum(np.array(listin[i:i+window])*weight)/sum(weight)

  13. return smoothed

另外我们也可以加上一点颜色和样式参数,让图表更个性化。

  1. sns.set(rc={'axes.facecolor':'lightgrey', 'figure.facecolor':'lightgrey','figure.edgecolor':'black','axes.grid':False})

当当当!如此我们便得到了文章开头的动画图表。

这篇文章仅仅只是matplotlib动画功能的一个例子,你大可以用它来实现任何一种图表的动画效果。简单调整 animate函数内的参数和图表类型,就能得到无穷无尽的可能性。

(完)

相关推荐

告别手动操作:一键多工作表合并的实用方法

通常情况下,我们需要将同一工作簿内不同工作表中的数据进行合并处理。如何快速有效地完成这些数据的整合呢?这主要取决于需要合并的源数据的结构。...

【MySQL技术专题】「优化技术系列」常用SQL的优化方案和技术思路

概述前面我们介绍了MySQL中怎么样通过索引来优化查询。日常开发中,除了使用查询外,我们还会使用一些其他的常用SQL,比如INSERT、GROUPBY等。对于这些SQL语句,我们该怎么样进行优化呢...

9.7寸视网膜屏原道M9i双系统安装教程

泡泡网平板电脑频道4月17日原道M9i采用Win8安卓双系统,对于喜欢折腾的朋友来说,刷机成了一件难事,那么原道M9i如何刷机呢?下面通过详细地图文,介绍原道M9i的刷机操作过程,在刷机的过程中,要...

如何做好分布式任务调度——Scheduler 的一些探索

作者:张宇轩,章逸,曾丹初识Scheduler找准定位:分布式任务调度平台...

mysqldump备份操作大全及相关参数详解

mysqldump简介mysqldump是用于转储MySQL数据库的实用程序,通常我们用来迁移和备份数据库;它自带的功能参数非常多,文中列举出几乎所有常用的导出操作方法,在文章末尾将所有的参数详细说明...

大厂面试冲刺,Java“实战”问题三连,你碰到了哪个?

推荐学习...

亿级分库分表,如何丝滑扩容、如何双写灰度

以下是基于亿级分库分表丝滑扩容与双写灰度设计方案,结合架构图与核心流程说明:一、总体设计目标...

MYSQL表设计规范(mysql表设计原则)

日常工作总结,不是通用规范一、表设计库名、表名、字段名必须使用小写字母,“_”分割。...

怎么解决MySQL中的Duplicate entry错误?

在使用MySQL数据库时,我们经常会遇到Duplicateentry错误,这是由于插入或更新数据时出现了重复的唯一键值。这种错误可能会导致数据的不一致性和完整性问题。为了解决这个问题,我们可以采取以...

高并发下如何防重?(高并发如何防止重复)

前言最近测试给我提了一个bug,说我之前提供的一个批量复制商品的接口,产生了重复的商品数据。...

性能压测数据告诉你MySQL和MariaDB该怎么选

1.压测环境为了尽可能的客观公正,本次选择同一物理机上的两台虚拟机,一台用作数据库服务器,一台用作运行压测工具mysqlslap,操作系统均为UbuntuServer22.04LTS。...

屠龙之技 --sql注入 不值得浪费超过十天 实战中sqlmap--lv 3通杀全国

MySQL小结发表于2020-09-21分类于知识整理阅读次数:本文字数:67k阅读时长≈1:01...

破防了,谁懂啊家人们:记一次 mysql 问题排查

作者:温粥一、前言谁懂啊家人们,作为一名java开发,原来以为mysql这东西,写写CRUD,不是有手就行吗;你说DDL啊,不就是设计个表结构,搞几个索引吗。...

SpringBoot系列Mybatis之批量插入的几种姿势

...

MySQL 之 Performance Schema(mysql安装及配置超详细教程)

MySQL之PerformanceSchema介绍PerformanceSchema提供了在数据库运行时实时检查MySQL服务器的内部执行情况的方法,通过监视MySQL服务器的事件来实现监视内...

取消回复欢迎 发表评论: