最近大环境有些吃紧,赶紧用数据来分析一下算法岗!

2022-09-19 11:36:50 浏览数 (1)

导读

作为一名新时代打工人,最近一段时间的就业大环境可真是没什么好消息可言啊,从国内到国际,从天灾到人祸,各行各业都简直是太难了。有感于此,本文从某招聘网站以“算法工程师”为关键词,爬取了一波岗位招聘数据,并简单分析了一下。

ps.: 由于缺乏历史数据,仅从当前招聘数据是无法给出定性的对比分析结论的,所以权当了解岗位招聘现状了……另,推荐与本文内容类似的两篇历史推文:

听说数据分析师挺火,我们来数据分析一下

转岗大数据了,先用数据看看行情

2022年虽然刚过了没多久,但国内外大事可谓接二连三:俄乌战争持续了一个月有余;新一轮疫情接连爆发,先后肆虐国内多个大城市至今未止;东航3.21坠机事件终于还是没能迎来奇迹,无一生还;互联网大厂裁员新闻频频曝出……。单从笔者的朋友圈中,就频繁看到有人不断发出这样的感慨:不知道明天和意外哪个先来……当然,这里的意外可能是战争,可能是疫情中招,也可能是突如其来的灾难,更可能是裁员。总之,最近的整体形势可能真的不太好……

"百度指数"查询几个关键词的趋势对比

有感于此,以xxxx直聘平台为来源,筛选城市为杭州,以“算法工程师”为关键词抓取了一波岗位招聘数据,去重后有260条记录,共8个字段(平台最多显示10页,但手动点击发现10页其实也不满...),数据示意如下:

本抓取数据仅用于学习交流,无任何商业目的。


下面,分别就这8个字段加以分析及可视化展示。

01. 招聘岗位title统计

搜索关键词是算法工程师,但实际上在不同的公司可能相应的岗位title各不一样。简单统计了一下,发现在260条招聘数据中,居然有100 种岗位title,可见国内算法岗招聘之众生百相!

从中遴选Top10岗位title,绘制直方图结果如下,其中排名较为靠前的除了纯粹的算法工程师title外,出现最多的应该是NLP算法工程师,以4类title共占大约40条左右招聘数据;而常常与之齐名的CV方向算法工程师居然没有进入Top10……

02. 岗位招聘公司和地点分布

鉴于岗位招聘公司和地点在某种程度上具有强相关性,这里一并给出相应的统计结果。首先基于正则表达式提取招聘数据中的所属区划,并统计相应结果如下:

根据杭州市最新区划调整结果,杭州目前下辖10个区2县1市,其中上城、拱墅、西湖和滨江四区构成了主城区,与其余6区2县1市形成了1核9星的城市布局。

260条招聘数据分布于杭州的9个区划,唯独富阳区尽显尴尬。另外,滨江、西湖、余杭三区占据明显数量优势,这大概率与阿里的势力有关吧……,所以再进一步看下招聘公司统计情况,结果如下:

统计结果也大体如此,例如阿里巴巴集团、菜鸟网络和蚂蚁金服等都属于阿里势力。

03. 岗位招聘薪资分布

作为一名打工人,应聘岗位首先看重的大多是薪资因素了吧,其次才是发展前景、工作环境等,所以这里当然要看一看算法岗的招聘薪资分布。ps.:在招聘平台上岗位薪资一般会给出上下限区间,这里简单的以薪资上下限均值作为统计数据,一定程度上可能会比实际情况偏高,因为岗位JD往往会写的高一些……

受限于招聘数据的记录数有限,所以这里的分布其实不是特别的精细和完美,但从这“有偏”的样本统计中,大体可以看出算法刚招聘薪资大体有4挡:12K左右、22K左右,30K左右,以及40K ,不得不说整体薪资还是很高的!当然,算法岗位近年来的压力和内卷也都不叫白热化,高薪也不是白拿的。

此外,部分岗位中除了给出薪资区间范围,还列出了每年发放薪资月数,也就相当于给出了年终奖的月数,这里也简单统计一下:

易见,发放薪资月数大体在13-16之间,其中15薪居多,其次是13和14薪,而16薪则最少。当然,实际参加工作的都知道:这里的薪资月数只是一个大概数字,实际上还主要取决于你的KPI考核结果!

04. 岗位学历要求

都说算法岗内卷,那么这一内卷是否在学历要求上有所体现呢?这里统计一下学历的要求,结果如下:

观察其中的Top10学历要求,整体上具有强烈的“对称性”:从学历层次上大体分为本科和硕士两类门槛;从年限要求上大体可以分为:在校/应届、经验不限、1-3年、3-5年、5-10年这五档(注意:在校/应届和经验不限两个条目是不一样的,前者意味着只招应届生,社招是没机会的,而后者则意味着校招和社招都可以)。同时,对不同工作年限的要求上,本科和硕士也几乎具有对等性,所以似乎可以说明算法岗其实对学历要求也没有那么挑剔,但不同学历要求的薪资则一定有所差距。详见下图:

整体上比较符合直观和预期,唯独1-3年硕士反倒不如1-3本科值钱,不知是数据不够的原因还是就业市场本身如此……

05. 岗位招聘的公司规模

接下来按下招聘公司所对应的规模,也就是大家口中的所谓大厂或小厂。这里公司规模也是以人数区间给出,但招聘记录又不完全工整,所以这里仅提取其人数规模所对应的区间上限,结果如下:

大体上,10000人以上大厂和499人中小厂两类公司所对应的招聘记录最多。当然,统计公司规模其实并不是我们直接关心的,仍然分析其所对应的招聘平均薪资上:

结果就是:几乎毫无意外地,就职于规模越大的公司越有可能拿高薪

06. 岗位招聘标签词云

接下来分析一下岗位招聘时所罗列的标签,这些标签往往描述了该岗位的核心技术能力要求,也就是大家常讲的技术栈

从中可以看出,占据词云C位的当属"深度学习算法",其次则是Python和C 这两大编程语言,Java因为字体颜色原因略逊一筹,而Go、C和SQL三种语言则要仔细寻找方可定位;而深度学习工具方面,则主要是PyTorch和TensorFlow两大框架,caffe也依稀可见;算法应用方面,则主要可以看到三大关键词:视觉图像算法、自然语言处理、推荐算法,基本上这也代表了算法岗的三个典型应用方向。所以,这里进一步以这些词语为关键词,按照前序的方法,分别统计各类岗位标签所对应的平均薪资:

这里做以简单对比:

  • 就应用方向而言,推荐算法和自然语言两个方向略胜于视觉图像
  • 就深度学习框架而言,TensorFlow略胜于PyTorch
  • 就编程语言而言,Python仍然是王者,其次为C

07. 岗位招聘福利信息

最后,给出岗位的描述,这一部分主要是介绍了岗位招聘的福利信息。整体来看,对一名新时代打工人来看,没有什么福利是比“钱”更能吸引大家的了:从岗位描述词云中可以看到满屏的与“钱”相关的福利:五险一金、年终奖、带薪休假、餐补、交通补助、股票期权……

最后再次声明:以上分析仅基于小样本数据和个人认知经验的分析结果,相关结论可能有一定偏差,仅供参考。

相关阅读:

  • 写在1024:一名数据分析师的修炼之路
  • 数据科学系列:sklearn库主要模块简介
  • 数据科学系列:seaborn入门详细教程
  • 数据科学系列:pandas入门详细教程
  • 数据科学系列:matplotlib入门详细教程
  • 数据科学系列:numpy入门详细教程

0 人点赞