百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

AI数据分析:集中度分析和离散度分析

ztj100 2025-01-05 00:59 17 浏览 0 评论


在deepseek中输入提示词:

你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下:

读取Excel表格:"F:\AI自媒体内容\AI行业数据分析\toolify月榜\toolify2023年-2024年月排行榜汇总数据.xlsx"

计算第2列第1行-20行数据组的:

最大值

最小值

均值

中位数

极差

方差

标准差

20%分位数

25%分位数

75%分位数

80%分位数

将计算结果写入第2列第21行-31行;

然后按照上面的计算步骤一直计算到第15列第21行-31行;

计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的简单年均增长率,写入第16列第1行,然后计算第2行,第3行数据,一直计算到第20行;

计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的复合年均增长率,然后计算第2行,第3行数据,一直计算到第20行;

注意:每一步都输出信息到屏幕

一步步的思考,但是代码要整合在一起

计算复合年均增长率的时候,年数n是固定值:13

源代码:

import pandas as pd

import numpy as np

# 读取Excel文件

file_path = "F:\\AI自媒体内容\\AI行业数据分析\\toolify月榜\\toolify2023年-2024年月排行榜汇总数据.xlsx"

df = pd.read_excel(file_path)

# 计算第2列到第15列的统计量并写入新的单元格

for i in range(1, 15):

data = df.iloc[0:20, i] # 第i列的数据

stats = {

'最大值': np.max(data),

'最小值': np.min(data),

'均值': np.mean(data),

'中位数': np.median(data),

'极差': np.ptp(data),

'方差': np.var(data),

'标准差': np.std(data),

'20%分位数': np.percentile(data, 20),

'25%分位数': np.percentile(data, 25),

'75%分位数': np.percentile(data, 75),

'80%分位数': np.percentile(data, 80)

}

# 将计算结果写入新的单元格

for j, (stat_name, stat_value) in enumerate(stats.items(), start=20):

df.iloc[j, i] = stat_value

print(f"第{i+1}列的{stat_name}已经写入第{j+1}行。")

# 计算简单年均增长率并写入第16列

for i in range(1, 21):

start_value = df.iloc[i-1, 1] # 起点数据

end_value = df.iloc[i-1, 14] # 终点数据

growth_rate = ((end_value - start_value) / start_value) * 100

df.iloc[i-1, 15] = growth_rate

print(f"第{i}行的简单年均增长率已经写入第16列。")

# 计算复合年均增长率(假设年数为13年)并写入第17列

n = 13 # 固定年数

for i in range(1, 21):

start_value = df.iloc[i-1, 1] # 起点数据

end_value = df.iloc[i-1, 14] # 终点数据

compound_growth_rate = ((end_value / start_value) ** (1/n) - 1) * 100

df.iloc[i-1, 16] = compound_growth_rate

print(f"第{i}行的复合年均增长率(假设年数为13年)已经写入第17列。")

# 将更新后的DataFrame写入Excel文件

with pd.ExcelWriter(file_path, engine='openpyxl', mode='a', if_sheet_exists='overlay') as writer:

df.to_excel(writer, sheet_name='Sheet1', startrow=1, startcol=0, index=False)

print("所有计算结果已经写入Excel文件。")

相关推荐

再说圆的面积-蒙特卡洛(蒙特卡洛方法求圆周率的matlab程序)

在微积分-圆的面积和周长(1)介绍微积分方法求解圆的面积,本文使用蒙特卡洛方法求解圆面积。...

python编程:如何使用python代码绘制出哪些常见的机器学习图像?

专栏推荐...

python创建分类器小结(pytorch分类数据集创建)

简介:分类是指利用数据的特性将其分成若干类型的过程。监督学习分类器就是用带标记的训练数据建立一个模型,然后对未知数据进行分类。...

matplotlib——绘制散点图(matplotlib散点图颜色和图例)

绘制散点图不同条件(维度)之间的内在关联关系观察数据的离散聚合程度...

python实现实时绘制数据(python如何绘制)

方法一importmatplotlib.pyplotaspltimportnumpyasnpimporttimefrommathimport*plt.ion()#...

简单学Python——matplotlib库3——绘制散点图

前面我们学习了用matplotlib绘制折线图,今天我们学习绘制散点图。其实简单的散点图与折线图的语法基本相同,只是作图函数由plot()变成了scatter()。下面就绘制一个散点图:import...

数据分析-相关性分析可视化(相关性分析数据处理)

前面介绍了相关性分析的原理、流程和常用的皮尔逊相关系数和斯皮尔曼相关系数,具体可以参考...

免费Python机器学习课程一:线性回归算法

学习线性回归的概念并从头开始在python中开发完整的线性回归算法最基本的机器学习算法必须是具有单个变量的线性回归算法。如今,可用的高级机器学习算法,库和技术如此之多,以至于线性回归似乎并不重要。但是...

用Python进行机器学习(2)之逻辑回归

前面介绍了线性回归,本次介绍的是逻辑回归。逻辑回归虽然名字里面带有“回归”两个字,但是它是一种分类算法,通常用于解决二分类问题,比如某个邮件是否是广告邮件,比如某个评价是否为正向的评价。逻辑回归也可以...

【Python机器学习系列】拟合和回归傻傻分不清?一文带你彻底搞懂

一、拟合和回归的区别拟合...

推荐2个十分好用的pandas数据探索分析神器

作者:俊欣来源:关于数据分析与可视化...

向量数据库:解锁大模型记忆的关键!选型指南+实战案例全解析

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...

用Python进行机器学习(11)-主成分分析PCA

我们在机器学习中有时候需要处理很多个参数,但是这些参数有时候彼此之间是有着各种关系的,这个时候我们就会想:是否可以找到一种方式来降低参数的个数呢?这就是今天我们要介绍的主成分分析,英文是Princip...

神经网络基础深度解析:从感知机到反向传播

本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在...

Python实现基于机器学习的RFM模型

CDA数据分析师出品作者:CDALevelⅠ持证人岗位:数据分析师行业:大数据...

取消回复欢迎 发表评论: