2023年大数据学习路线分享! 第一阶段:需要认真学习java基础相关知识,图中的理解内容需要好好关注哟! 该阶段需要可以写一个简易的后台管理系统的Web页面即可,主要重点整合maven+mybatis+springboot+html 第二阶段进入最重要的学习阶段,夯实基础,要求中的相关知识都需要重点理解,也算是较为高频的面试重点哟! 众所周知!大数据最重要的就是HSQL能力,hive阶段需要夯实sql语句,学有余力可以多找些sql题来刷一刷,提高自己HSQL能力 flume+kafka这阶段需要了解数据采集部分的知识。学有余力可以阅读源码了解学习:OffSet相关:包括如何获取、如何提交 文件存储相关:Topic、Partition、Segment、副本与备份 Leader&Follower同步机制 Kafka和Spark、Flink的整合:也就是Connector 列式数据库Hbase,这个环节可能有点难理解。理解角度上,我们可以把它不要当作二维的表格,他和人一样像是个四维生物,HBase那就算三维的表格,因为引入了时间。HBase 是一个面向列的数据库,在表中它由行排序。表模式定义只能列族,也就是键值对。一个表有多个列族以及每一个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。 表中的每个单元格值都具有时间戳。总之,在一个 HBase:表是行的集合、行是列族的集合、列族是列的集合、列是键值对的集合。[机智] 这三天的学习内容较为轻松,会用即可,Sqoop、superset均是市面上使用较少的技术。 该阶段极为重要,scala的学习能看懂语法即可,但假如你是零基础,还是需要花点时间去理解他的语法,他的语法思路就是能省则省。 Sprak需要认真学习与理解,找工作必备技术。 两三年前的前沿技术,已经成为现在的主流技术啦!Flink的学习可以帮助你找到一份薪水不错的工作哟,同时也会给你更多的选择,假如面试一份离线数仓的岗位,flink的知识会给你大大加分! Clickhouse也是工作需求较高的技术站,如果你熟练使用的话,会很轻松地找到一份工作哟。 如果大家都像我的猫一样热爱学习技术,那么你们一定会成功的啦!