毕业论文
您现在的位置:  >> 笛图片 >> 正文 >> 正文

薪资高到没朋友的数据科学职位到底是干啥的

来源:笛 时间:2022/8/17
北京哪家治白癜风医院最好 https://jbk.39.net/yiyuanfengcai/yyjs_bjzkbdfyy/

作者

ClintChegin

翻译

Sambodhi

编辑

Natalie,Emily

你这个工作到底是干啥的?

在办公室里有一幕令人难忘:顾问在决定员工的生产率时,首先会询问:“你会怎么形容你在这里所做的工作?”

这一幕和上面那张图片很有趣,因为我们对描述我们工作的努力感同身受。然而,在求职过程中发生同样的误解时,这可并不好笑。了解招聘信息的准确含义很重要。对未来的雇主来说,最重要的是了解我们的技能和能力。我们都看过相同职位的招聘信息,但实际上它们的描述完全不同。

相同的职位,怎么会在每个公司都有如此截然不同的意思呢?

这种现象在数据科学领域越来越普遍。在过去的几年里,这门学科的知名度急剧上升。尽管数据科学工作的数量有所增加,但有关这一角色的清晰度却有所下降。本文引用了Indeed的大量行为数据来描述该领域的趋势,以及对数据科学这一角色进行更为具体的定义。

数据科学日益流行

叫“数据科学家”的工作岗位,在过去四年从0.03%上升到0.15%,这四年时间涨了%。

甚至在年早些时候,就有篇文章大肆宣扬数据科学家是“21世纪最性感的工作”(HarvardBusinessReview:DataScientist:TheSexiestJobofthe21stCentury)。如果单靠这个头街还不够,也许人们对金钱的原因更感兴趣。根据Indeed的薪酬数据,一位数据科学家平均每年赚13万美元。

OK,明白了。数据科学家就像欧洲超市中打折销售的能多益(Nutella)榛果巧克力酱那样被抢购一空。随着这一增长,我们也目睹了该学科领域内更具体角色的细化。我同事TreyCausey在《数据产品经理的崛起》

treycausey/rise-of-the-data-product-manager-2fbb21d1)一文中提到了产品经理和数据科学家之间的融合。

在Indeed中,我们许多人也感觉到,“数据科学家”这个头街最近越来越多地涵盖了许多不同的职责。我们想深入挖掘并验证这一直觉:我们能否找到就业市场内角色的自然划分?我们是否可以用数据来理解这些职位中的差异,并将它们分类得更清晰、更一致?

数据科学中重叠的职业

为了对职位名称进行分析,我们查看了年1月在Indeed上搜索查询“datascientist”的所有访客,接下来,我们查看了这些用户的其他搜索。我们根为每个用户创建了搜索行为的矩阵,并为每个搜索行为创建了用户矩阵。我们计算这些矩阵的笛卡尔积来表示任意两个搜索项之间的频率:

AI前线注:关于笛卡尔积(cartesianproduct),在数学中,两个集合X和Y的笛卡儿积,又称直积,在集合论中表示为X×Y,是所有可能的有序对组成的集合,其中有序对的第一个对象是X的成员,第二个对象是Y的成员。

接下来,我们从数据中删除了“datascientist”,因为这个搜索是针对所有用户的。我们使用一个名为“igraph”的R包进行聚类分析和可视化。根据igraph文档,“该函数实现了用于查找社区结构的快速贪婪模块优化算法(fastgreedymodularityoptimizationalgorithm)。”在研究这个算法的过程中,我们了解到,它的设计是为了快速地从具有稀疏区域的大型数据集创建社区。嗯,这听起来和我们正在使用的数据完全一样!

AI前线(ID:ai-front)注:相关算法研究可参阅论文:Finding

转载请注明:http://www.0431gb208.com/sjszlff/1446.html