百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Python数据分析实战:以数据分析岗为例,探索行业与薪资关联性

ztj100 2025-06-04 08:56 35 浏览 0 评论

金三银四,数据分析师成为众多行业竞相追逐的热门岗位,想知道如何在这个领域精准发力、脱颖而出吗?今天,我将以 BOSS 直聘上的数据为样本,借助 Python 强大的数据分析能力,深度剖析各个行业与薪资关联性分析,下面一起学习!

1.数据准备

首先,我们需要导入必要的库并加载数据。

import pandas as pd
import numpy as np
from pyecharts import options as opts
from pyecharts.charts import Bar, Pie, Boxplot, WordCloud, Map
from pyecharts.globals import SymbolType
import re
# 加载数据
df = pd.read_excel('/home/mw/project/BOSS直聘数据分析师职位.xlsx')
# 查看数据概览
df.head(3)
# 查看数据信息
df.info()

2. 数据清洗

我们需要对数据进行清洗,特别是薪资范围和经验要求字段。

def process_salary(salary):
    if not isinstance(salary, str):
        return np.nan
    
    # 处理日薪
    if '元/天' in salary:
        # 提取第一个数值(-前面的数值)
        daily = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0])
        return daily * 30 / 1000  # 转换为月薪(千元),按30天计算
    
    # 处理时薪
    elif '元/时' in salary:
        # 提取第一个数值(-前面的数值)
        hourly = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0])
        return hourly * 8 * 30 / 1000  # 转换为月薪(千元),8小时/天,30天/月
    
    # 处理月薪
    elif 'K' in salary or 'k' in salary:
        # 提取第一个数值(-前面的数值)
        monthly = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0])
        # 处理16薪等情况
        if '薪' in salary:
            months = float(re.findall(r'(\d+)薪', salary)[0])
            return monthly * months / 12
        return monthly
    
    # 处理纯数字月薪(如10000-15000)
    elif re.search(r'\d+-\d+', salary):
        # 提取第一个数值(-前面的数值)
        monthly = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0])
        return monthly / 1000  # 转换为千元
    
    # 其他情况(如纯数字)
    else:
        try:
            return float(re.findall(r'(\d+\.?\d*)', salary)[0]) / 1000  # 转换为千元
        except:
            return np.nan

# 应用处理函数
df['薪资月薪(K)'] = df['薪资范围'].apply(process_salary)

# 显示前3行结果
df.head(3)

3.行业与薪资关联性分析

分析不同行业的数据分析师岗位薪资是否存在显著差异。

# 按公司类型分组统计薪资
industry_salary = df.groupby('公司类型')['薪资月薪(K)'].agg(['mean', 'median', 'count']).sort_values('mean', ascending=False)

# 筛选至少有5个样本的行业
industry_salary = industry_salary[industry_salary['count'] >= 5]

# 可视化
bar1 = (
    Bar()
    .add_xaxis(industry_salary.index.tolist())
    .add_yaxis("薪资月薪(K)", industry_salary['mean'].round(1).tolist())
    .set_global_opts(
        title_opts=opts.TitleOpts(title="不同行业数据分析师平均薪资"),
        yaxis_opts=opts.AxisOpts(name="薪资(千元)"),
        xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),
    )
)
bar1.render_notebook()

由柱形图可以看出游戏、互联网、电子商务行业的平均月薪资最高,分别达到约21.5k、20.4k和16.6k,传统行业如医疗健康、广告公关会展的薪资相对较低,差不多在11K左右,互联网相关行业(游戏、互联网、电子商务)普遍高于其他行业,在工作选择时可以更倾向于互联网公司的数据分析岗。

相关推荐

这个 JavaScript Api 已被废弃!请慎用!

在开发过程中,我们可能会不自觉地使用一些已经被标记为废弃的JavaScriptAPI。这些...

JavaScript中10个“过时”的API,你的代码里还在用吗?

JavaScript作为一门不断发展的语言,其API也在持续进化。新的、更安全、更高效的API不断涌现,而一些旧的API则因为各种原因(如安全问题、性能瓶颈、设计缺陷或有了更好的替代品)被标记为“废...

几大开源免费的 JavaScript 富文本编辑器测评

MarkDown编辑器用的时间长了,发现发现富文本编辑器用起来是真的舒服。...

比较好的网页里面的 html 编辑器 推荐

如果您正在寻找嵌入到网页中的HTML编辑器,以便用户可以直接在网页上编辑HTML内容,以下是几个备受推荐的:CKEditor:CKEditor是一个功能强大的、开源的富文本编辑器,可以嵌入到...

Luckysheet 实现excel多人在线协同编辑

前言前些天看到Luckysheet支持协同编辑Excel,正符合我们协同项目的一部分,故而想进一步完善协同文章,但是遇到了一下困难,特此做声明哈,若侵权,请联系我删除文章!若侵犯版权、个人隐私,请联系...

从 Element UI 源码的构建流程来看前端 UI 库设计

作者:前端森林转发链接:https://mp.weixin.qq.com/s/ziDMLDJcvx07aM6xoEyWHQ引言...

手把手教你如何用 Decorator 装饰你的 Typescript?「实践」

作者:Nealyang转发连接:https://mp.weixin.qq.com/s/PFgc8xD7gT40-9qXNTpk7A...

推荐五个优秀的富文本编辑器

富文本编辑器是一种可嵌入浏览器网页中,所见即所得的文本编辑器。对于许多从事前端开发的小伙伴来说并不算陌生,它的应用场景非常广泛,平时发个评论、写篇博客文章等都能见到它的身影。...

基于vue + element的后台管理系统解决方案

作者:林鑫转发链接:https://github.com/lin-xin前言该方案作为一套多功能的后台框架模板,适用于绝大部分的后台管理系统(WebManagementSystem)开发。基于v...

开源富文本编辑器Quill 2.0重磅发布

开源富文本编辑器Quill正式发布2.0版本。官方TypeScript声明...

Python之Web开发框架学习 Django-表单处理

在Django中创建表单实际上类似于创建模型。同样,我们只需要从Django类继承,则类属性将是表单字段。让我们在myapp文件夹中添加一个forms.py文件以包含我们的应用程序表单。我们将创建一个...

Django测试入门:打造坚实代码基础的钥匙

这一篇说一下django框架的自动化测试,...

Django ORM vs SQLAlchemy:到底谁更香?从入门到上头的选择指南

阅读文章前辛苦您点下“关注”,方便讨论和分享,为了回馈您的支持,我将每日更新优质内容。...

超详细的Django 框架介绍,它来了!

时光荏苒,一晃小编的Tornado框架系列也结束了。这个框架虽然没有之前的FastAPI高流量,但是,它也是小编的心血呀。总共16篇博文,从入门到进阶,包含了框架的方方面面。虽然小编有些方面介绍得不是...

20《Nginx 入门教程》使用 Nginx 部署 Python 项目

今天的目标是完成一个PythonWeb项目的线上部署,我们使用最新的Django项目搭建一个简易的Web工程,然后基于Nginx服务部署该PythonWeb项目。1.前期准备...

取消回复欢迎 发表评论: