百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

用Python让图表动起来,居然这么简单

ztj100 2025-02-19 14:44 15 浏览 0 评论

我好像看到这个emoji:??动起来了!

编译:佑铭

参考:

https://towardsdatascience.com/how-to-create-animated-graphs-in-python-bb619cc2dec1

用Matplotlib和Seaborn这类Python库可以画出很好看的图,但是这些图只是静态的,难以动态且美观地呈现数值变化。要是在你下次的演示、视频、社交媒体Po文里能用短视频呈现数据变化,是不是很赞呢?更棒的是,你还是可以在你的图表上用Matplotlib、Seaborn或者其他库!

本文将使用美国国家药物滥用研究所和疾病预防控制中心公布的阿片类药物数据,可在此处下载:

https://www.drugabuse.gov/sites/default/files/overdosedata1999-2015.xls

我们会用到的数据是这样的:

https://www.drugabuse.gov/sites/default/files/overdose_data_1999-2015.xls.

我们将用Matplotlib和Seaborn绘图,用Numpy和Pandas处理数据。Matplotlib也提供了一些我们做动画可以的函数,所以让我们首先导入所有依赖项。

  1. import numpy as np

  2. import pandas as pd

  3. import seaborn as sns

  4. import matplotlib

  5. import matplotlib.pyplot as plt

  6. import matplotlib.animation as animation

然后用Pandas载入数据并转成DataFrame类型的数据结构。因为我们要针对不同阿片类药物的滥用画图,写个函数来载入感兴趣的特定行的数据能避免重复代码。(小编注:原文提供的代码在读取excel文件的时候使用了已废弃的sheetname参数,本文中已修正为sheet_name)

  1. overdoses = pd.read_excel('overdose_data_1999-2015.xls',sheet_name='Online',skiprows =6)

  2. def get_data(table,rownum,title):

  3. data = pd.DataFrame(table.loc[rownum][2:]).astype(float)

  4. data.columns = {title}

  5. return data

现在让我们来做动画吧!

首先,如果你和我一样使用的是jupyter notebook,请在代码首行加入 %matplotlib notebook,如此便可在notebook直接看到生成的动画而非保存后才可见。

Python 环境搭建以及神器推荐,果断转走!

我现在使用 get_data函数从表中检索海洛因过量的数据并放在有两列的Pandas DataFrame中,一列是年,一列是过量死亡的人数。

  1. %matplotlib notebook

  2. title = 'Heroin Overdoses'

  3. d = get_data(overdoses,18,title)

  4. x = np.array(d.index)

  5. y = np.array(d['Heroin Overdoses'])

  6. overdose = pd.DataFrame(y,x)

  7. #XN,YN = augment(x,y,10)

  8. #augmented = pd.DataFrame(YN,XN)

  9. overdose.columns = {title}

接下来我们初始化一个ffmpeg Writer并以20帧每秒、1800比特率进行录屏。你也可以根据喜好自行设置这些值。

  1. Writer = animation.writers['ffmpeg']

  2. writer = Writer(fps=20, metadata=dict(artist='Me'), bitrate=1800)

(小编注:如果出现
RuntimeError:RequestedMovieWriter(ffmpeg)notavailable
的报错,请自行安装ffmpeg,装了brew的Mac可以直接:brew install ffmpeg

现在我们创建一个有几个标签的图形。确保设置x和y轴的限制,以免动画随当前显示的数据范围乱跳转。

  1. fig = plt.figure(figsize=(10,6))

  2. plt.xlim(1999, 2016)

  3. plt.ylim(np.min(overdose)[0], np.max(overdose)[0])

  4. plt.xlabel('Year',fontsize=20)

  5. plt.ylabel(title,fontsize=20)

  6. plt.title('Heroin Overdoses per Year',fontsize=20)

动画的核心是动画函数,你可以在其中定义视频的每一帧发生什么。这里的 i表示动画中帧的索引。使用这个索引可以选择应在此帧中可见的数据范围。然后我使用seaborn线图来绘制所选的数据。最后两行代码只是为了让图表更美观。

  1. def animate(i):

  2. data = overdose.iloc[:int(i+1)] #选择数据范围

  3. p = sns.lineplot(x=data.index, y=data[title], data=data, color="r")

  4. p.tick_params(labelsize=17)

  5. plt.setp(p.lines,linewidth=7)

我们用调用了 animate函数并定义了帧数的
matplotlib.animation.FuncAnimation
来开始动画,frames实际上定义了调用animate的频率。

  1. ani = matplotlib.animation.FuncAnimation(fig, animate, frames=17, repeat=True)

你可以用 ani.save把动画保存为mp4,如果你想直接看一看动画效果可以用plt.show

  1. ani.save('HeroinOverdosesJumpy.mp4', writer=writer)

现在我们的图表动起来啦:

动画能够正常运行但是感觉有点跳跃,所以我们需要在已有数据点之间增加更多的数据点来使动画的过渡平滑。于是我们使用另一个函数 augment

  1. def augment(xold,yold,numsteps):

  2. xnew =

  3. ynew =

  4. for i in range(len(xold)-1):

  5. difX = xold[i+1]-xold[i]

  6. stepsX = difX/numsteps

  7. difY = yold[i+1]-yold[i]

  8. stepsY = difY/numsteps

  9. for s in range(numsteps):

  10. xnew = np.append(xnew,xold[i]+s*stepsX)

  11. ynew = np.append(ynew,yold[i]+s*stepsY)

  12. return xnew,ynew

现在我们只需要对我们的数据应用这个函数、增加
matplotlib.animation.FuncAnimation
函数的帧数。在这里我用参数numsteps=10调用augment函数,也就是增加数据点至160个,并且设置frames=160。这样以来,图表显得更为平滑,但还是在数值变动处有些突兀。

为了让我们的动画更平滑美观,我们可以增加一个平滑函数(具体请见:
https://www.swharden.com/wp/2008-11-17-linear-data-smoothing-in-python/ )。

  1. def smoothListGaussian(listin,strippedXs=False,degree=5):

  2. window=degree*2-1

  3. weight=np.array([1.0]*window)

  4. weightGauss=

  5. for i in range(window):

  6. i=i-degree+1

  7. frac=i/float(window)

  8. gauss=1/(np.exp((4*(frac))**2))

  9. weightGauss.append(gauss)

  10. weight=np.array(weightGauss)*weight

  11. smoothed=[0.0]*(len(listin)-window)

  12. for i in range(len(smoothed)): smoothed[i]=sum(np.array(listin[i:i+window])*weight)/sum(weight)

  13. return smoothed

另外我们也可以加上一点颜色和样式参数,让图表更个性化。

  1. sns.set(rc={'axes.facecolor':'lightgrey', 'figure.facecolor':'lightgrey','figure.edgecolor':'black','axes.grid':False})

当当当!如此我们便得到了文章开头的动画图表。

这篇文章仅仅只是matplotlib动画功能的一个例子,你大可以用它来实现任何一种图表的动画效果。简单调整 animate函数内的参数和图表类型,就能得到无穷无尽的可能性。

(完)

相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: