范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

数据工作者的自我修养哪些技能是必不可少的?

  CDA数据分析师 出品
  作者: Jeff Hale
  编译: Mika
  市场上对数据工作者的要求特别多:需要掌握机器学习、计算机科学、统计学、数学、数据可视化,深度学习等知识。要想全部掌握这些方面的知识,起码需要学习数十种语言、框架和技术,这显然是有难度的。
  那么,为此数据工作者应该如何合理地分配时间,该掌握哪些技能呢?
  在本文中,我们对求职网站进行搜索,找出针对数据科学家等数据相关工作的技能要求。我分别分析了通常的数据相关技能和特定语言以及工具。
  我们具体搜索了 LinkedIn、Indeed、SimplyHired、Monster、以及AngelList 这些求职网站。
  以下图表显示了在每个网站中发布了多少相关工作。
  我分析了许多工作列表和调查,想列出当中最常见的技能要求。"管理"这类词没有包含在内,因为许多求职发布中都会包含这个词。
  全部搜索都是针对美国地区,关键词中带有"数据科学家"的职位发布,并使用精确匹配搜索减少了结果数量。但是,这种方法确保结果与数据科学家职位相关,并且影响所有搜索项。
  AngelList中提供的是招聘数据科学家的公司数量,而不是职位数量。我将AngelList排除在这两种分析之外,因为它的搜索算法是OR的逻辑搜索,而且无法将其修改为AND。如果你搜索"数据科学家""TensorFlow"这类关键词,AngelList表现还不错,但如果你搜索"数据科学家""react.js"也会返回不招聘数据科学家的公司。
  Glassdoor也被我排除在外。网站上表示美国目前发布了26,263个"数据科学家"的职位,然而实际只显示了不到900个的职位。此外,Glassdoor发布的数据科学家职位也不可能比起其他主流平台的三倍要多。
  最终分析采用了在LinkedIn上400多个职位信息分析通用技能,针对200多个职位信息分析特定技能。当中有一些重复,结果记录在Google Sheet中。
  https://docs.google.com/spreadsheets/d/1df7QTgdAOItQJadLoMHlIZH3AsQ2j2_yoyvHOpsy9qU/edit?usp=sharing
  我下载了.csv文件并将其导入JupyterLab。然后,我计算出每个百分比,并对招聘网站上的数量进行平均。
  此外,我将结果与Glassdoor 在上半年发布的数据科学家职位研究进行比较,并且结合KDNuggets的调查信息。从中可以发现,对于数据科学家而言,有些技能变得越来越重要,而其他技能则逐渐不再重要。之后我们将具体看到。
  Glassdoor
  https://www.glassdoor.com/research/data-scientist-personas/
  KDNuggets
  https://www.kdnuggets.com/2018/05/poll-tools-analytics-data-science-machine-learning-results.html/2
  可以在我的Kaggle Kernel 中看到交互式图表和分析。我使用Plotly进行可视化,在写本文时,使用Plotly和JupyterLab有一些难点,具体说明在 Kaggle Kernel 最后的Plotly文档中
  Kaggle
  https://www.kaggle.com/discper/the-most-in-demand-skills-for-data-scientists/
  Plotly 文档
  https://github.com/plotly/plotly.py 1. 通用技能
  以下是雇主最希望数据科学家具备的通用技能。
  结果表明,通用技能中 数据分析和机器学习是数据科学家工作的核心 。从数据中收集分析见解是数据科学的主要功能。机器学习是关于开发创建预测性能的系统,这也是十分受欢迎的技能。
  数据科学家需要 统计学和计算机科学技能 ,这并不惊讶。统计学、计算机科学和数学也是大学专业,这也可能提高了这些技能出现的频率。
  有趣的是,近一半的职位要求中都提到了 沟通能力 。数据科学家需要能够传达自己的见解,并与他人合作。
  人工智能和深度学习 并不像其他术语那样经常出现。它们是机器学习的子集,深度学习被用于越来越多的机器学习任务中,之前主要是使用其他算法。如今,大多数用于自然语言处理问题的最佳机器学习算法是深度学习算法。我预计将来在职位信息中,深度学习技能将被越来越明确,而且机器学习将与深度学习越来越类似。
  那么雇主希望数据科学家使用哪些特定软件工具?接下来,让我们看到这个问题。 2. 技术技能
  以下是雇主最希望数据科学家掌握的前20种特定语言,库和科技工具。
  让我们简要介绍一下最常见的技术技能。
  Python是最受欢迎的语言。 这种开源语言已经非常普及。对初学者而言,这种语言很好上手,有许多支持的资源。绝大多数数据科学工具都与之兼容。Python是数据科学家主要的使用语言。
  R语言 与Python相差不远。它曾经是数据科学的主要语言,R语言的需求仍然很大。这种开源语言的根源在于统计数据,它非常受统计学家的欢迎。
  Python或R语言是从事数据科学工作的必备条件。
  SQL的需求也很高。 SQL指的是Structured Query Language(结构化查询语言),是与数据库交互的主要方式。在数据科学领域,SQL有时会被忽视,但如果想找数据科学方面的工作,这项技能是很重要的。
  接下来是 Hadoop和Spark ,它们都是Apache的大数据开源工具。
  Apache Hadoop是一个开源软件平台,用于分布式存储和分布式处理大型数据集,这些数据集是由商用硬件构建的计算机集群。
  Apache Spark是快速的内存数据处理引擎,具有强大且富有表现力的开发API,能够让数据工作者有效地执行流、机器学习或SQL,这些情况需要对数据集进行快速迭代访问。
  与Python,R和SQL相比,很少有求职者具备这些技能。如果你会Hadoop和Spark的经验,那么你更有可能在求职中成功。
  接下来是 Java和SAS 。我惊讶地发现在职位描述中,这两种语言出现的频率也很高。通常,Java和SAS在数据科学界的关注度都不高。
  接下来是 Tableau 。这个分析平台和可视化工具功能强大,易于使用且越来越受欢迎。它有一个免费的公共版本,但如果你想保持数据私密就需要花钱。如果你不熟悉Tableau,那么强烈推荐Udemy的 Tableau 10 A-Z 。
  下图技能列表显示的语言、框架和其他数据科学软件工具更多。
  根据我们的分析和GlassDoor的调查,Python、R和SQL都是是最受欢迎的技能。根据局KDnuggets开发人员调查等分析显示,R语言、Hadoop、Java和SAS在近年来使用量呈下降趋势,Tableau呈明显的上升趋势。 3. 建议
  根据这些分析的结果,以下是对数据科学家的一些建议。 证明自己的数据分析能力,并专注熟练掌握机器学习。 提高你的沟通技巧。推荐阅读《Made to Stick》这本书,帮助你提升自己观点的影响力。还可以试试Hemmingway Editor这款app,提高写作的逻辑性。 掌握深度学习框架。精通深度学习框架在机器学习方面越来越重要。 如果你在犹豫选择Python还是R语言之间做出选择,请选择Python。如果你数量掌握Python,那么可以也考虑学习R语言,这会让你在行业中更占优势。
  当雇主在寻找具有Python技能的数据科学家时,他们也期望求职者掌握常见的Python数据科学库:numpy、pandas、scikit-learn和matplotlib。如果你在学习这些工具,建议你使用以下资源: DataCamp,DataQuest
  两者都是价格合理的在线SaaS数据科学教育产品,你可以在编程时学习,当中都教授了许多技术工具。Data School
  拥有各种资源,还包括一系列很赞的YouTube视频,解释各种数据科学概念。McKinney,《Python for Data Analysis 》
  本书注重pandas,还讨论了基础的numpy和scikit-learn等知识。Müller,Guido《Introduction to Machine Leaning with Python》
  Müller是scikit-learn的主要维护者。这是一本关于用scikit-learn学习机器学习的好书。
  如果你想学习深度学习,我建议先学习Keras或FastAI,然后在学习TensorFlow或PyTorch。Chollet的《Deep Learning with Python》这本书是学习Keras的绝佳资源。
  除此之外,我建议你了解你感兴趣的内容,尽管这里需要考虑到时间分配等因素。
  如果你想通过招聘网站找数据科学家工作,我建议试试LinkedIn,这上面可找到的工作信息是最多的。
  同时,我建议你制作一个在线作品集,能够很好地展示你的数据科学技能。还建议在你的LinkedIn个人资料中注明自己的技能。

魅族18X和iqooz5价格差距不大,该如何选?这两款手机同为2021年九月份发布的新机并且两款手机的价格是差不多的。那么问题来了,如何从这两款手机中选择一款手机进行购买呢?关于这个问题小芳建议大家还是要将自身的需求以及两款手机华为nova9和OPPOK9这两款手机,到底该如何选?就小芳个人而言,我会更加倾向于性价比更高的OPPOK9这款手机会更多一些。不过大家在实际购买手机的过程当中,因为需求是不一样的那么做出的,最终购机选择也是会存在差异的。鉴于这种情况魅族18Spro和苹果13mini价格差距不大,该如何选择?魅族18Spro和苹果13mini这两款手机同为九月份的新机,而且价格也是差不多的。那么问题来了,如果预算在5000左右,如何从这两款手机中选择一款手机进行购买呢?关于这个问题,大魅族18S和vivoX60价格差别不大,买哪款更合适?如果非要在这两款手机中选择一款手机进行购买,小芳我个人是更加推荐大家购买性价比更高的魅族18S这款手机。不过大家在实际购买手机过程当中还是要将自身的需求以及两款手机的对比优点情况相建艺集团发展潜力获国资认可发展前景未来可期10月22日晚间,建艺集团(002789。SZ)发布控股股东协议转让部分股份完成过户登记的公告,公告显示,公司控股股东刘海云向第二大股东珠海正方集团转让其持有的14,98。76万股爱美客药物临床试验获批研发实力构筑企业护城河10月19日,爱美客(300896。SZ)发布公告,公司全资子公司北京诺博特生物科技有限公司于2021年8月5日申报的利多卡因丁卡因乳膏临床试验申请,已于2021年10月18日获得国立科技坚持发展低碳环保新材料产业,未来成长空间可期2021年10月26日晚间,国立科技(证券代码300716)披露2021年三季报。报告期内,公司积极应对原材料价格大幅波动,限电停产,国内外新冠疫情反复等因素影响,实现营业收入约1新大正护航广交会全国化战略驱动广深市场快速发展导语第130届中国进出口商品交易会(广交会)作为疫情下截止目前全球规模最大的实体展会,这次广交会的线下展展览面积达40万平方米。按16大类商品设置51个展区,展位总数19181个参iQOOz5和真我GTneo相比较,该如何选?就两款手机的售价以及综合配置来看,当然是真我GTneo这款手机的性价比更高,小芳个人是更加推荐大家购买真我GTneo这款手机的。但是大家在实际选择手机的过程当中还是要将自身的需求以魅族18X和一加8之间,到底买谁好?根据买新不买旧的原则,小个人是更加推荐大家购买魅族18X这款手机的。为了提高大家在购买手机的过程当中的决定的科学性,我建议大家还是要将自身的需求以及两款手机的对比优点相结合,才能够iQOOz5和红米note10pro相比较,该如何选?如果非要在这两款手机中选择一款手机进行购买,小芳我个人是会更加倾向于红米note10pro这款手机会更多一些的。我给到的理由有以下几点,大家不妨参考一下。理由一首先红米note10
RTX30Super将在明年一月发布RTX40暂定明年十月根据油管博主RedGamingTech以及社交软件网友Greymon55的消息,NVIDIA的RTX30Super系列显卡将会在明年1月份的CES2022大展上发布,不过目前尚不清多达九盘片西部数据发布20TB硬盘以及OptiNAND加速技术西部数据今天发布了该公司首款采用iNANDUFS闪存的20TB机械硬盘,和以往集成闪存的机械硬盘将闪存作为数据缓存的做法不同的是,这次西部数据引入了名为OptiNAND的技术,闪存火力全开480HzLCD面板加紧研发中或明年上市目前市场上最强的电竞显示器已经将画面刷新率推到了360Hz,例如华硕的ROGFastIPS系列就是已经上市的360Hz显示器之一,售价接近6000大元,远高于普通的电竞显示器,这也Adobe宣布与史密森学会及Hydrous合作推出AR海洋展览编译VR陀螺近日,Adobe公司宣布与史密森学会以及Hydrous公司建立了新的合作关系,将通过智能手机将世界海洋的AR展览带入人们的生活。图源AdobeHydrous创建了一个名MetaRealityLabs展示其兼具逼真和风格化的虚拟化身优化技术编译VR陀螺在上周Meta(正式称为Facebook)Connect主题演讲活动中,首席执行官马克扎克伯格向我们详细说明了这个成立新品牌的公司是如何实现其元宇宙愿景的。在与RealNiantic正式发行PikminBloom,已免费在澳大利亚及新加坡推出编译VR陀螺Niantic昨日宣布,其正式推出的下一款AR手机游戏将是与任天堂合作的PikminBloom。这款免费游戏现在已经在新加坡和澳大利亚的iOS和安卓系统上推出,其将在未Meta宣布收购热门VR健身应用Supernatural开发商Within编译VR陀螺近日刚刚将公司名改为Meta的Facebook在健身和元空间方面有很大的计划,其宣布收购热门VR健身应用Supernatural的开发商Within。Within制作的你是Linux游戏玩家吗?AMDFSR全面登录Linux了解一下Linux游戏玩家是一个非常小众的群体,长期以来都是都不受大厂的关注,主要依靠的是所谓社区关怀支撑,而开源则是社区力量的主要动力。随着AMD超分辨率技术FSR1。0的开源,现在Li警惕充新二手盘Chia挖矿收益暴跌矿工出逃由于有高额回报预期,CHIA加密货币挖矿在数个月之前曾经牵起了一股炒卖硬盘的热潮,原价1000元的8TB硬盘曾经一度被炒上两千甚至更高。但是随着CHIA挖矿代币XCH的价格暴跌以及嫌弃12GB不够用?不锁矿的GeForceRTX3080Ti20GB版开卖NVIDIA在三个月之前(6月3日)发布了GeForceRTX3080Ti12GB显卡,该卡提供了接近RTX3090的强大游戏性能,但是ETH挖矿性能减半,由于恰巧发布在小型矿难的耗时超四年IntelXe独显即将登台亮相你想了解的一切都在这自从2018年英特尔发布打算重新进入独显市场,公布XeGPU架构后,距今已经有三年时间,在上周的Hotchips33技术峰会上,Intel举办了名为Intel架构日的线上发布会,公