代码语言:javascript复制编辑 | 南乔River
2021年第42周 | 观察岗位:语音识别算法工程师。
代码语言:javascript复制让数据『动』起来!汇集求职数据,支持交互分析,超酷动态展示。
声音的记录者
提起『记录声音』,你会想到什么呢?
是磁带、光盘、录音笔、手机等录音工具,还是会议、访谈、沟通、演唱等场景?是键指如飞的神奇速录师,还是方便快捷的语音转文字AI小工具?
最近,B站一条『高级速录师』与『人工智能研究员』两个岗位隔空对话的视频火了。
速录师,是声音到文字的『同声传译』,他们可以在三小时的会议之后,当场出稿,又快又准确。
经验丰富的速录师,瞬时录入速度可以达到600字/分钟,平均速度也有300字/分钟。然而『快』并不是工作的全部。为了做到文稿的逻辑清晰、准确无误,他们不仅要完整记录,还要辨析、理解和修正内容。
视频的另一位受访者,是科大讯飞的AI技术人员,在语音识别条线,负责优化会议场景下的语音识别率。
同样三小时的会议音频,他通过程序跑出结果,只需要7分钟。『start process』之后的等待时间里,程序员小哥甚至还悠闲地喝了一杯奶茶。
那『智能』会取代『人工』吗?
虽然后者在文字处理效率方面有着显著优势。但答案依然是,不会。
一方面,当前的识别技术仍有待提升,噪音环境、方言、离线识别等环境中的准确度并不理想。另一方面,机器识别结果的整理,需要花费的时间,甚至超过了内容本身的时长。
更确切一点说,二者从来不是非此即彼的替代关系。视频中,两个职业的隔空对话,不仅体现了这一点,也将『语音识别技术』和『语音识别算法工程师岗位』,呈现到更多观众面前。
语音识别
语音识别,是让计算机模仿人的听觉系统,输入语音信号,输出对应的文字信号。
语音识别算法工程师
语音识别算法工程师,是提供高效的 ASR 算法库给到软件集成人员。
已随处可见的『语音识别』
经过近10年的高速发展,语音识别技术进步显著,不断刷新着识别准确率的上限。Siri智能语音助手、小爱音箱、智能录音笔等,产品推陈出新,消费者目不暇接。
而随着产品线的丰富和市场规模的扩大,产业生态日趋完善,资金和人才也被持续吸引加入。
我们梳理了语音识别产业链,看看有哪些你熟悉的公司!
热门的『语音识别算法工程师』
好的!让我们看一下岗位求职者关心的问题,也是我们本次招聘数据分析的目标:
- 薪资待遇有多高?
- 哪些城市机会更多?
- 现在热招的公司有哪些?
- 岗位职能和所需技能都有哪些?
本次数据来源于某招聘网站的最新数据,岗位相关数据共350条。以下展示部分关键图片。查看更多信息,请扫描下方二维码,或点击页面 (http://blog.showmeai.tech/job-and-hiring/)
20K-40K、30K-60K、25K-50K是三个占比最高的薪资区间。而从整个饼图的薪资分布可以看出,20K、30K、50K是三个比较显著的薪资门槛。
最高的薪资区间在70K-120K,TOP10的平均薪资线已超过65K,妥妥的年入百万。行业分布和城市分布都比较分散,说明技术已经比较成熟,进入了应用落地阶段。
北京遥遥领先,深圳、上海位列第二梯队、杭州、广州第三梯队。西安、南京、武汉、苏州、合肥同列第四梯队,占据了TOP10的其他名额。
不出意外,岗位机会最密集的,依旧是北上广深杭这五座城市。
我们把目光转向城市的区域,看看『企业密集度』。
TOP10名单中,北京以一己之力占据6位,深圳占据2位(南山区、大冲),上海1位(闵行区),杭州1位(余杭区)。
北京的语音识别相关企业,主要分布在海淀区和朝阳区。海淀区的西北旺、五道口、科技园和朝阳区的望京,更因高频出现而成为招聘和求职的热门地点。相信你一定对其中一两个耳熟能详。
人工智能服务占据了40%,音频处理、视频媒体、智能硬件和工具类,也是招聘和求职的热门。
在招岗位数量的TOP公司名单,字节跳动、之江实验室、ZOOM、UMU、佳仕、美的集团位列其中。除此之外,还有3家猎头公司榜上有名,看来人才紧俏~
百度、快手、美团、网易、等互联网大厂也是招聘主力,斗鱼、YY等垂直赛道的产品也需要语音识别的技术人才。
语音识别算法工程师,工作内容有哪些呢?
从图中可以看到,语音转文字、对话、声纹识别、端点检测、声学模型训练等技术方向,安防、车载与原因、音频监控、电话录音、客服语音等应用场景,是招聘的热门,出现的频次最高。
围绕语音识别这个关键词,我们可以看到机器学习、深度学习、信号与信息处理这样的基础知识储备,也需要Python、C/C 、Shell的编程语言熟练度,对常用算法模型和开源库也要有要求。
作为高薪又热门的岗位,任职要求自然也是颇具挑战的,需要有求职意向的各位早做准备。
岗位技能图谱@语音识别算法工程师
为方便小伙伴们学习和准备求职,我们为大家梳理了语音识别算法工程师的《岗位技能图谱》。如果需要高清版本或PDF版本,可以前往公众号获取。
参考链接
[1] https://cloud.baidu.com/product/speech
[2] https://heartbeat.fritz.ai/a-2019-guide-for-automatic-speech-recognition-f1e1129a141c
[3] https://zhuanlan.zhihu.com/p/31193859
[4] https://github.com/PaddlePaddle/DeepSpeech/blob/develop/docs/source/asr/feature_list.md