文章目录
- 🏳️🌈 1. 导入模块
- 🏳️🌈 2. Pandas数据处理
- 2.1 读取数据
- 2.2 查看数据信息
- 2.3 去除重复数据
- 2.4 调整部分城市名称
- 🏳️🌈 3. Pyecharts数据可视化
- 3.1 招聘数量前20岗位
- 3.2 各城市招聘数量
- 3.3 各城市平均薪资象形图
- 3.4 招聘学历占比
- 3.5 实习薪资分布
- 3.6 实习薪资区间
- 3.7 实习时间要求
- 3.8 实习工作周期
- 3.9 公司词云
- 🏳️🌈 4. 可视化大屏
- 4.1 普通大屏
- 4.2 Flask大屏
- 🏳️🌈 5. 可视化项目源码+数据
大家好,我是 👉 【Python当打之年(点击跳转)】
本期将利用Python分析「实习僧网站招聘数据」 ,看看:各城市python岗位实习生招聘数量,招聘平均薪资分布,招聘岗位分布,招聘学历要求、实习周期分布等情况,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
【下期:实习僧网站岗位数据爬虫】
涉及到的库:
- Pandas — 数据处理
- Pyecharts — 数据可视化
🏳️🌈 1. 导入模块
import pandas as pd
from pyecharts.charts import *
from pyecharts.commons.utils import JsCode
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
🏳️🌈 2. Pandas数据处理
2.1 读取数据
df = pd.read_excel('./实习僧招聘数据.xlsx')
2.2 查看数据信息
df.info()
- 一共有600条数据,包含岗位名称、公司、城市、学历、福利、薪资、工作周期、实习时间等字段
2.3 去除重复数据
df1 = df.drop_duplicates()
2.4 调整部分城市名称
df['城市'] = df['城市'].replace({'上海市':'上海','成都市':'成都','武汉市':'武汉','北京市':'北京','深圳市':'深圳'})
🏳️🌈 3. Pyecharts数据可视化
3.1 招聘数量前20岗位
def get_bar1():chart = (Bar().add_xaxis(x_data).add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right')).set_global_opts(title_opts=opts.TitleOpts(title="1-招聘数量前20岗位",pos_left="center",pos_top='2%',subtitle=subtitle,),visualmap_opts=opts.VisualMapOpts(is_show=True,),) )
- 招聘数量前20的岗位主要是:后端开发、算法、软件开发、后端开发工程师、深度学习算法、NLP算法、后端、算法工程师、机器学习、视觉算法、python开发、后端研发、软件工程师、软件开发工程师、语音算法、NLP、Python开发、AI算法、大模型算法、图像算法等,主要以后端算法为主。
3.2 各城市招聘数量
- 招聘地点主要集中在:北京、上海、深圳、杭州、成都、南京、广州、苏州、武汉等城市。
3.3 各城市平均薪资象形图
def get_pictorialBar():chart = (PictorialBar().add_xaxis(x_data).add_yaxis("",y_data,label_opts=opts.LabelOpts(is_show=False),symbol_size=12,symbol_repeat="fixed",symbol_offset=[0, 0],is_symbol_clip=True,).set_global_opts(title_opts=opts.TitleOpts(title='3-各城市平均薪资象形图',pos_left="center",pos_top='2%',subtitle=subtitle,),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=90)),visualmap_opts=opts.VisualMapOpts(is_show=True,),))
- 上海、北京、深圳、杭州等地的平均薪资相较于其他城市更高一些。
3.4 招聘学历占比
- 招聘学历方面主要以本科、硕士为主,占比超过80%。
3.5 实习薪资分布
def get_scatter():chart = (Scatter().add_xaxis(x_data).add_yaxis("",y_data,label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="5-实习薪资分布",pos_left="center",pos_top='2%',subtitle=subtitle,),xaxis_opts=opts.AxisOpts(name='id'),yaxis_opts=opts.AxisOpts(name='元/天'),visualmap_opts=opts.VisualMapOpts(is_show=True,),) )
- 实习期间薪资基本上集中在100-400元/天这个区间。
3.6 实习薪资区间
3.7 实习时间要求
- 实习时间上大部分公司要求实习3-6个月,以3个月居多,也存在实习期1个月和1年的情况。
3.8 实习工作周期
def get_scatter():chart = (Pie().add("",[list(z) for z in zip(x_data, y_data)],center=['50%','55%'],).set_global_opts(title_opts=opts.TitleOpts(title="8-实习工作周期",pos_left="center",pos_top='2%',subtitle=subtitle,),visualmap_opts=opts.VisualMapOpts(is_show=True,),) )
- 实习工作周期以5天/周为主,占比接近65%。
3.9 公司词云
def get_WordCloud():chart = (WordCloud(init_opts=init_opts).add('',words,word_size_range=[5,34]).set_global_opts(title_opts=opts.TitleOpts(title='9-公司词云',subtitle=subtitle,pos_top='2%',pos_left='center',),visualmap_opts=opts.VisualMapOpts(is_show=False,),) )
🏳️🌈 4. 可视化大屏
4.1 普通大屏
4.2 Flask大屏
🏳️🌈 5. 可视化项目源码+数据
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。