范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

MRSApacheZeppelin,让数据分析更便捷

  摘要:选择轻量化、免运维、低成本的大数据云服务是业界趋势,如果搭建Zeppelin再同步自建一套Hadoop生态成本太高!因此我们通过结合华为云MRS服务构建数据中台。
  本文分享自华为云社区《MRS大数据平台结合Apache Zeppelin让数据分析更便捷-云社区-华为云》,作者: dullman。
  Apache Zeppelin:一款大数据分析和可视化工具,可以让数据分析师在一个基于Web的notebook中,采用不同语言对不同数据源中的数据进行交互式分析,并对结果进行可视化图表的展示。
  云服务MRS:华为云提供的一站式大数据平台,包含Hudi、ClickHouse、Spark、Flink、Kafka、Hive、HBase等丰富的大数据组件,完全兼容开源生态。 本文介绍如何搭建Zeppelin并连接Hive、HBase进行简单的数据开发。 为什么写这篇文章?Zeppelin相关的文章虽然很多,但是都没有与实际大数据平台结合的实践案例指导。 Zeppelin的搭建存在不少坑,因此记录下部署中的各个问题,为后人填坑。 选择轻量化、免运维、低成本的大数据云服务是业界趋势,如果搭建Zeppelin再同步自建一套Hadoop生态成本太高!因此我们通过结合华为云MRS服务构建数据中台。 环境准备Apache Zeppelin 0.9.0安装包 MRS 3.1.0普通集群 (包含Hive、HBase组件) ECS centos7.6 安装MRS客户端
  MRS客户端提供java、python开发环境,也提供开通集群中各组件的环境变量:Hadoop、Hive、HBase、flink等。
  参见登录ECS安装集群外客户端 安装Zeppelin使用Xftp等工具导入主机并采用以下命令安装在/opt/zeppelin目录。 tar -zxvf zeppelin-0.9.0-bin-all.tgz mv zeppelin-0.9.0-bin-all /opt/zeppelin配置Zeppelin环境变量,在profile文件中加入变量 vi /etc/profile export ZEPPELIN_HOME=/opt/zeppelin export PATH=ZEPPELIN_HOME/bin:ZEPPELINHOME/bin:PATH导入环境变量 source /etc/profile编辑zeppelin-env.sh文件,加入JAVA_HOME,这里需要替换成自己的环境变量 cd /opt/zeppelin/conf/ cp zeppelin-env.sh.template zeppelin-env.sh source /opt/hadoopclient/bigdata_env echo "export JAVA_HOME=/opt/hadoopclient/JDK/jdk-8u201">>zeppelin-env.sh编辑zeppelin-site.xml文件,将zeppelin.server.port 8080替换成18081(可自定义,也可以不改);将zeppelin.anonymous.allowed参数的true修改为false cd /opt/zeppelin/conf cp zeppelin-site.xml.template zeppelin-site.xml vi zeppelin-site.xml     zeppelin.server.port     18081     Server port.       zeppelin.anonymous.allowed     falase     Anonymous user allowed by default 编辑shiro.ini文件,新增用户developuser cp shiro.ini.template shiro.ini vi shiro.ini
  在[users]下新增用户developuser,密码Huawei@123,权限admin developuser=Huawei@123, admin
  运行Zeppelin(并检查启动参数) cd /opt/zeppelin bin/zeppelin-daemon.sh start
  ps ef | grep zeppelin
  关闭防火墙,允许端口18081(此为测试环境,生产环境建议采取更安全措施) systtemctl stop firewalld 完成以上配置,并启动成功后,在浏览器中输入地址zeppelin_ip:18081(zeppelin_ip为安装zeppelin的HD客户端IP),即可看到如下界面。
  使用developuser登录,就可以基于note进行大数据的交互式开发了!
  Zeppelin连接Hive
  1、将Zeppelin中jdbc依赖的jar包替换成MRS客户端中Hive/Beeline/lib中的jar包,保证hive Interpreter依赖的Jar包存在 cp -f /opt/Bigdata/client/Hive/Beeline/lib/*.jar /opt/zeppelin/interpreter/jdbc/
  2、修改Zeppelin配置,添加Client Hive Url
  查询CLIENT_HIVE_URL source /opt/hadoopclient/bigdata_env echo $CLIENT_HIVE_URI
  编辑interpreter.json,位置/usr/zeppelin/conf/interpreter.json,修改JDBC default.url,default.driver. "jdbc": {    "id": "jdbc",    "name": "jdbc",    "group": "jdbc",    "properties": {      "default.url": {        "name": "default.url",        "value": "jdbc:hive2://192.168.1.188:24002,192.168.1.234:24002,192.168.1.241:24002/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2",        "type": "string",        "description": "The URL for JDBC."      },      "default.user": {        "name": "default.user",        "value": "gpadmin",        "type": "string",        "description": "The JDBC user name"      },      "default.password": {        "name": "default.password",        "value": "",        "type": "password",        "description": "The JDBC user password"      },      "default.driver": {        "name": "default.driver",        "value": "org.apache.hive.jdbc.HiveDriver",        "type": "string",        "description": "JDBC Driver Name"      }
  3、重启zeppelin bin/zeppelin-daemon.sh restart
  4、创建Notebook,选择default interpreter 为jdbc
  5、在notebook上使用Hive SQL进行查询 查询数据库 %jdbc show databases;
  创建Hive表 %jdbc create external table stu (s_id string,s_name string) row format delimited fields terminated by ‘	’;
  Zeppelin连接HBase
  1、将Zeppelin中hbase依赖的jar包替换成MRS客户端中HBase中的jar包,保持jar的一致 先将/opt/zeppelin/interpreter/hbase/目录下原本的Jar包移走 cd /opt/zeppelin/interpreter/hbase mkdir hbase_old_jar mv hbase*.jar hbase_old_jar mv hadoop*.jar hbase_old_jar mv zookeeper-3.4.6.jar hbase_old_jar再将/opt/hadoopclient/HBase/hbase/lib/下的jar包拷贝至/opt/zeppelin/interpreter/hbase/。 cp -f /opt/hadoopclient/HBase/hbase/lib/*.jar /usr/zeppelin/interpreter/hbase/
  2、修改Zeppelin配置
  编辑zeppelin-env.sh,加入hbase环境变量 export HBASE_HOME=/opt/hadoopclient/HBase/hbase
  编辑interpreter.json,位置/opt/zeppelin/conf/interpreter.json,修改hbase.home   "hbase.home": {         "name": "hbase.home",         "value": "/opt/hadoopclient/HBase/hbase",         "type": "string"       }
  3、重启zeppelin bin/zeppelin-daemon.sh restart
  4、配置Interpreter
  从web界面右上角菜单中Interpreter中进入,配置Interpreter
  选择Hbase,修改如下配置,并保存配置。 hbase.home : /opt/client/HBase/hbase
  5、创建note进行数据开发
  页面选择Notebook →create new note
  自定义Note名称,例如hbaseNote,并指定Interpreter为HBase。
  编辑Note,点击右侧"执行"按钮(三角标志) %hbase create ‘test6’, ‘cf’ put ‘test6’, ‘row1’, ‘cf:a’, ‘value1’
  若在创建Interpreter未指定default Interpreter,需要在note最前面加上%hbase进行指定。
  6、在FusionInsight客户端下查看刚刚通过Zeppelin创建的hbase表test6和数据
  其他Hadoop生态组件在云服务MRS上的实践参考
  使用商业智能软件Superset分析MRS数据之最佳实践
  基于云服务MRS构建DolphinScheduler2调度系统
  开源工作流引擎Azkaban在MRS中的实践
  分布式调度平台Airflow在华为云MRS中的实践
  点击下方,第一时间了解华为云新鲜技术~
  华为云博客_大数据博客_AI博客_云计算博客_开发者中心-华为云

串都移至淄博,济南不用不服气,10年前就已失去串都之名作为土生土长的济南人,吃串那是刻在骨子里的东西。我是70后,生于济南,其实老济南最初的饮食文化并不是串文化,而是扎啤文化。八十年代济南人路边练摊,喝的是趵突泉扎啤,吃的是花生毛豆酱白酒专家王瑞明全域化提升酒质是鲁酒振兴的根本记者张頔山东作为全国五大白酒核心产区之一,拥有黄河流域自然生态环境,孕育着北方独特的微生物群,为高端优质白酒生产提供了优质条件。如何持续高质量发展,是鲁酒振兴的关键,白酒专家王瑞明学会这样蒸馒头,凉了都还是软的,只需1个特殊手法,个个水光肌学会这样蒸馒头,凉了都还是软的,只需1个特殊手法,个个水光肌。在中国,面食的受欢迎程度有多高?不仅北方各个地区都流传着各自的美味面食,在很多南方地区也开始流行起了面食美味。说到面食若想世间来生存,做个问心无愧人今天再来抖音谈,想做正直人真难。虽说邪不能胜正,其中真是危机存。世上有那邪恶人,心里只有恶念存。舍却性命为他紧,还是恶狗咬上门。六组千多万帐因,无用之祖舍命争。组内一些无良心,追帐绿意盎然游北京来源人民日报海外版蓝天白云下,北京窑洼湖公园美如诗画。胡庆明摄(人民图片)北京市园林绿化局日前公布这样一组数据今年,北京市将再添22处休闲公园和城市森林50处口袋公园及小微绿地,全烽火戏诸侯惶惶大周800年江山,由周文王打下基础,他儿子姬发,也就是周武王,在太公忘的帮助下,整顿朝堂,训练士兵,最终打败商纣王,这个我国史上最后一个人王,成功登上帝位,号天子。公元前781淞沪会战抗战史上最大最惨烈的一仗淞沪会战发生时间1937年8月13日1937年11月12日,最终日本获胜,上海沦陷。淞沪会战,日本投入了30多万军人,中国投入约75万军人,中央军,桂军,川军,滇军,湘军,东北军,梁思成续娶的林洙,不只抹黑林徽因,晚年做法更是引起众怒1962年,也是林徽因先生去世的第7年,梁思成娶了第二位妻子,名林洙,与林徽因属于福建同宗,林徽因在世时,林洙多得林徽因照扶。1950年,林徽因与清华大学建筑系的学生在一起梁思成再青州军和曹操对决前干掉了哪个枭雄?曹操为啥可以收编他们?历史开讲此时兖州的形势也发生了重大变化,188年,青州再次爆发变乱,死灰复燃的黄巾军,连破州郡,人数一度发展到了百余万。就在盟军讨董的时候,青州的黄巾军(以下简称青州军)开始肆虐青揭开法老的奥秘埃及新王国的死亡和来世,原来不死之身真的存在引言几个世纪以来,埃及的古代文明一直吸引着历史学家和外行人的思想。这种文明特别引起学者兴趣的一个方面是新王国时期皇家葬礼习俗的宏伟和精致。新王国埃及的法老被视为神圣的统治者,拥有巨浅谈隋炀帝的功与过历史开讲在阅读此文之前,麻烦您点击一下关注,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。隋朝可谓是中国古代史上为数不多的成功实现大一统的封建王朝。隋朝的建立标
火箭如今阵容攻守平衡,是否具有夺冠实力?千山万水总是情,关注一波行不行!火箭下赛季的核心阵容基本已经浮出水面,球队在续约卡佩拉之后下赛季的首发阵容应该是保罗哈登X安东尼卡佩拉。之所以说小前锋位置是X,那是因为火箭的阵容还那么多游戏抄袭我的世界,为什么大家只喷迷你世界?这里是专注于有为青年游戏体验的敢为青年游场,我是敢哥!那么多游戏抄袭我的世界,为什么大家只喷迷你世界?我的世界作为沙盒类手游的先驱者,受到很多游戏的抄袭模仿是很正常的,任何行业都无为什么NBA总冠军奖杯叫奥布莱恩杯?NBA现在的总冠军奖杯全称叫做拉里奥布莱恩杯,而与总决赛MVP奖杯叫做比尔拉塞尔杯一样,拉里奥布莱恩也是NBA历史当中鼎鼎大名的人物,他是NBA在1975年1984年期间的总裁,也天津自驾贵州15天行程,路线有什么推荐?当看到这个问题,首先是脑子一懵。从天津到贵州最近的距离都是1715公里。自驾游是一个苦差事,一站赶一站,线路和景点规划不好,大部分时间都用在了车上,成了窗外风景,真正没有看到该看的负债人,出路在哪?负债人出路在两个方面一方面,是国家政策的调整。自从2017年以来,因各种原因,负债人数呈激增状况。到2020年为止,国家公布的数据,可以很清楚的了解到,现在有二千多万负债人,七百多大家都知道彩票难中,为什么每期还有那么多人去买?若要知道,经过一遭。买彩票骗局不骗局,只有买彩票的的当事人才能知道,实事胜于雄辩。自从双色球彩种上云,初处彩市的人们买彩票十分热心,很多人都是铁杆硬棍彩民。铁杆硬棍彩民一一一彩民们现在的中超,哪支球队在全国的球迷最多?山东鲁能泰山队是中国足球联业化二十七年以来唯一没有降过级的三支球队之一,另两支是北京国安队和上海申花队,山东陆地面积有十五万七千多平方公里,东临大海,西接平原,中有泰山,丘陵地带,药店开始卖彩票了,你怎么看?为什么?骗局扩大了!你提的关于药店卖彩票问题还真是挺有趣的,我也见过报道,认真研究了一下。1,药店的日子现在也不好过了。地主家也没有余粮了啊!开个玩笑。流水销售额下滑,毛利率下降,成本却不有人说普通人交社保,交的档次太低,还不如不交社保你怎么看?感谢邀请,更感谢楼主的提问。楼主你好,有人说普通人缴纳社保缴纳的档次如果太低,还不如不缴纳社保,你怎么看呢?首先我并不这样认为。我们社保确实是分为不同的缴费指数,根据每一年所在地区历史上被球员做掉的教练有哪些?我来回答这个问题,喜欢的话可以关注我哦。历史上因为与球员关系不和,而被球员逼迫下课的教练实在是太多了,比如2011年的,中国U19男篮联盟写血书要求主教练范斌下课事件。2011年,洛杉矶湖人队决定让詹姆斯打中锋,遇到戈贝尔和约基奇该怎么打?利用移动灵活的优势打外线,让霍师傅肉搏内线抢篮板。老詹撕开空间或者利用霍师傅挡拆给三分射手创造投篮机会。除了高度不占优势,其它都不一定能胜过詹姆斯,詹姆斯可突可投,戈贝尔就是个蓝领