范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

建议收藏MysqlFlinkCDCDoris数据同步实战(上)

  1、业务需求及其痛点
  公司诸多业务需求求其最新状态,例如车最新状态,桩最新状态,报告最新状态,检定任务最新状态,业务信息所有的明细数据保存至doris中,但是无法得知其最新状态集;
  阶段1:根据GB4403、GB27930等协议,数据允许迟到7天,也就是说,通过sql进行计算的时候,必须取最近7天的数据,平均每天数据1000w条,就是单次计算大概在7000w条左右,通过创建最新状态表,然后通过sql取出结果集至状态表当中,通过调度框架dolphinscheduler对其进行调度;由于是最新状态其实时性比较高,往常是设定了1分钟的调度时间
  痛点:
  ①:实时性根据调度时间确定,不管时间设定多短,都不够实时
  ②:频繁重复计算浪费大量计算资源insert into the_monitor_latest_status select vin, daq_time, province, city, district, odo, cha_state, op_mode, op_state, soc, curr, volt, lat, lng from     (select vin, daq_time, province, city, district, odo, cha_state, op_mode, op_state, soc, curr, volt, lat, lng,row_number() over (partition by vin order by daq_time desc)ro      from ods_monitordata      where daq_time >= date_format(data_sub(current_date(),interval 7 day),"%Y-%m-%d 00:00:00") and odo != 0 and province != "unknown")t1 where ro = 1;
  阶段2:
  痛点:
  ①:开发成本高,每张表都需要写一段程序
  Mysql外表需求和痛点:
  业务系统很多表结构一直存储在mysql当中,其中的大表(数据量大)都会同步至doris中,数据量较小的维表没必要同步至doris当中,可以通过外表的方式挂载到doris中,但是创建外表的步骤较为繁琐,只能一张张手动创建,另外mysql中表结构更改后,外表就需要重建
  痛点:
  ①:外部表手动创建繁琐,如100张表全部手动创建
  ②:mysql表结构更改就需要重新创建外表2、mysql_to_doris结构图
  工具实现上述优化,优点如下:shell编写极其轻量,开源即用纯sql语法开发成本0特别适用于当前业务场景简单配置实现全程自动化处理
  架构图:
  mysql_to_doris/ ├── bin │   ├── auto.sh  --Flink_job启动脚本 │   ├── create_doris.sh  --生成doris映射flink的建表语句 │   ├── create_mysql.sh  --生成mysql映射flink的建表语句 │   ├── e_auto.sh  --外部表执行脚本 │   ├── e_mysql_to_doris.sh  --外部表建表语句生成脚本 │   ├── flinksql.sh  --flink_job语句生成脚本 │   └── insert_into.sh  --insert into 语句生成脚本 ├── conf │   ├── doris │   │   ├── doris.conf  --doris连接配置信息 │   │   ├── flink.conf  --flink特殊配置项 │   │   └── tables  --sink端的库名.表名 │   ├── e_mysql │   │   ├── doris.conf  --外部表连接信息 │   │   ├── doris_tables  --外部表库名.表名(自定义) │   │   ├── mysql.conf  --外部表连接信息 │   │   └── mysql_tables  --源表库名.表名 │   ├── flink │   │   ├── flink_conf  --flink配置信息 │   └── mysql │       ├── flink.conf  --flink特殊配置项 │       ├── mysql.conf  --mysql连接配置信息 │       └── tables  --source端的库名.表名 └── lib     ├── doris_to_flink.sh  --doris映射flink表结构转换     ├── mysql_to_doris.sh  --mysql映射doris外表结构转换     └── mysql_to_flink.sh  --mysql映射flink外表结构转换
  代码流程:
  1、获取建表语句for table in $(cat ../conf/e_mysql/mysql_tables |grep -v "#" | awk -F " " "{print $1}")         do         echo "show create table ${table};" |mysql -h$mysql_host -uroot -p$mysql_password  >> $path done
  2、调整格式awk -F "	" "{print $2}" $path |awk "!(NR%2)" |awk "{print $0 ";"}" > ../result/tmp111.sql sed -i "s/n/ /g" ../result/tmp111.sql sed -n "/CREATE TABLE/,/ENGINE=/p" ../result/tmp111.sql > ../result/tmp222.sql ##delete tables special struct sed -i "/^  CON/d" ../result/tmp222.sql sed -i "/^  KEY/d" ../result/tmp222.sql
  3、拼接doris信息sed -i "/ENGINE=/a) ENGINE=ODBC  COMMENT "ODBC" PROPERTIES ( "host" = "ApacheDorisHostIp", "port" = "3306", "user" = "root", "password" = "ApacheDorisHostPassword", "database" = "ApacheDorisDataBases", "table" = "ApacheDorisTables", "driver" = "MySQL", "odbc_type" = "mysql");" $path
  3、涉及组件介绍:FlinkCDC版本2.2.1Doris Flink Connector版本:1.14_2.12-1.0.0FLink版本:1.14.5Hadoop版本:3.1.3doris版本:1.1.1mysql odbc版本:5.3.13链接:https://pan.baidu.com/s/1eMML1Km-VYa01SRQaGuwBQ  提取码:yyds什么是 CDC
  CDC 是 Change Data Capture 变更数据获取的简称。
  核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入 INSERT、更新 UPDATE、删除 DELETE 等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。
  CDC 技术应用场景也非常广泛,包括:数据分发:将一个数据源分发给多个下游,常用于业务解耦、微服务。数据集成:将分散异构的数据源集成到数据仓库中,消除数据孤岛,便于后续的分析。数据迁移:常用于数据库备份、容灾等。什么是 Apache Doris
  Apache Doris 是一个现代化的 MPP 分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris 的分布式架构非常简洁,易于运维,并且可以支持 10PB 以上的超大数据集。
  Apache Doris 可以满足多种数据分析需求,例如固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等。可以使数据分析工作更加简单高效!什么是 Doris Flink Connector
  Flink Doris Connector 是 Doris 社区为了方便用户使用 Flink 读写 Doris 数据表的一个扩展。实现了通过flink实时写入数据进入到doris的可能,Flink Doris Connector之前,针对业务不规则数据,经常需要针对消息做规范处理,空值过滤等写入新的topic,然后再启动Routine load写入Doris。Flink Doris Connector之后,flink可以直接读取kafka,直接写入doris。什么是Doris On ODBC
  ODBC External Table Of Doris 提供了Doris通过数据库访问的标准接口(ODBC)来访问外部表,外部表省去了繁琐的数据导入工作,让Doris可以具有了访问各式数据库的能力,并借助Doris本身的OLAP的能力来解决外部表的数据分析问题:支持各种数据源接入Doris支持Doris与各种数据源中的表联合查询,进行更加复杂的分析操作通过insert into将Doris执行的查询结果写入外部的数据源

DNF升级普雷魔法石直接掉50属强好亏,升级之后会不会是负提升?首先先说明不管普雷先升级哪个部位都是正提升没有负提升,只是根据不同的防具提升大小不同罢了,那么有人会问特殊魔法石掉50属强提升会很小吗,当然不会,魔法石的提升反而是比较大的一个部位如果郎平重新执掌中国女排,你同意吗?恐怕没有人支持郎平继续担任中国女排主教练,只是某些人不想发表意见而已,郎平老了,好好休息吧!让有能力的年轻人来干吧,年轻人更有朝气郎平不能再次挂帅中国女排了。为什么?一是年纪大了,本次亚洲杯女篮不敌日本队,失败的原因在哪?我认为中国女篮打遍亚洲没对手,打不过的对手是自己,很怀念队中的李梦,邵婷两名老将,主教练许利民高度也到这个境界,每次犯同样的错误,将胜利恭让给别人。本次亚州杯女篮不敌日本队,失败的球迷是不是对奥运冠军陈梦太苛刻?她现在仍然是女乒一号单打吗?球迷对陈梦是有点苛刻的。主要是鲨鱼,鳗鱼和小枣的粉丝对她不满。奥运单打决赛陈梦战胜莎莎后,说了句我的时代到来,其实这是运动员对自己职业生涯20来年努力的一个肯定,也是渴望奥运冠军压内存64g的平价手机,那几个牌子的手机较好?首先,不管您买什么品牌的,建议千万不要碰vivo和oppo。如果您已经打算买OPPO或者VIVO了,下面的推荐您基本就不用看了。先是1500以下的手机。首推360n6pro。464买p40pro还是mate30pro?如果在以前,我会毫不犹豫的推荐Mate系列,因为mate系列一直是华为的当家旗舰,P系列智能屈居老二,哪怕是强如P30Pro,在我看来依然没有Mate20pro香,但P40Pro一赛金花用身体贿赂瓦德西,减轻了北京八国联军的罪行。是真的吗?晚清时期,中国最有名的两个女人,论身份地位却是天差地别。一位自然是权倾天下的慈禧,另一位却是一个普通妓女。那么这位妓女凭什么能与慈禧齐名呢?谁又能有此殊荣呢?赛金花,原名傅彩云,安朱棣耗费国力让郑和下7下西洋,朱棣死后,郑和下场如何?我来答一下这个问题。第一,一般认为,永乐皇帝朱棣生前,郑和是六次下西洋从永乐三年(1405年)到永乐二十年(1422年),郑和总共六次下西洋,当时有一个绝密使命,就是要在海外寻找建当军嫂是一种什么样的体验?当军嫂是一种什么样的体验?作为一名退役军人,我来给大家分享一下,军嫂在局外人看来,那是十足的令人羡慕,丈夫穿着笔直的军装,到部队探亲还能报销路费,享受优待服务,在部队小兵看到人人喊有些人退休金比当地平均工资高很多,有的人却低很多,为什么?谢邀有些人退休金比当地平均工资高很多,有的人却很低,这是以下几种情况造成的。第一,企业退休的人员,一般都是从1995年前后开始缴纳养老保险的,没缴纳养老保险之前的工龄被叫作视同缴费二手车贩子最喜欢收哪些车?二手车可以简单粗暴的分为两种1。高利润的2。没那么高利润的高利润车型的共同特点是市场保有量很小,或者目前二手车价格与新车价格有着非常大的差距。这两个特点都造成了一个现象,就是这类二
辽宁队资讯速递莫兰德快马加鞭,洋助教训练师走人,外援回国辽宁队第二阶段的收官战结束后杨鸣把大家叫到一起简单总结了一下前两个阶段的得与失,更多的是肯定全队的表现,在阵容不整的情况下还能稳居积分榜第二名真的太不容易了。然后俱乐部刘总宣布就地李春江嘶吼整场球队依然惨败,球迷是教练不行,还是外援太差半个月前两队首次交手,上海久事四人得分20,以19分优势击败山西队本场比赛仅有两个得分上20,球队从第二节崩塌后就一直让对手按地摩擦。血布的20分有17分是第四节大局已定的情况下拿显卡价格行情(1月20日),矿卡行情,RTX4060Ti功耗降至160W一显卡相关资讯1最新产品资讯英伟达RTX40系移动显卡2023年1月4日英伟达RTX4070Ti发布2023年1月4日13代酷睿非K处理器上架2023年1月4日AMD锐龙7000非商务本,还得是ThinkPad联想ThinkPadX1Carbon2022款体验引子十年前,我们对办公场景的定义还很单纯办公室坐一天,MicrosoftOffice三件套电邮。十年后的今天,这一场景被无限扩容高铁航班家里随时约个网络会议来一通多方视频通话沟通下教老年人使用智能手机,学会这5个小技巧,使用手机更得心应手嗨喽大家好我是肖肖今天给大家分享一下老年人使用智能手机需要学会的5个小技巧,学会了使用手机更得心应手,再也不怕被别人吐槽了,如果你也是刚使用智能手机,或者家里有长辈学智能手机不妨将2022年度推荐与不推荐SOOMALDockey年度推荐Doc2022年12月某日,历时三年多的Covid19在中国终于成为乙类乙管传染病。在2019年春节的四年之后,大家可以迎来一个正常的新年了。HiFi往往被定位升级11健康空气专家美的鲜净感空气机重新定义品质家居在换新主导的消费趋势下,消费者对于空调的诉求已不再局限于调节冷暖温度,也越来越关注舒适健康洁净等精细化功能,因此,空调产品的功能和技术研发上需要与时俱进,更契合时下消费需求。美的结正式上线!上海交通版兔年专属表情包来啦恭贺新禧万事如意!兔年新春将至,你们的手机里是否还缺一套别具特色的拜年表情包这不,马上就来了!上海交通版兔年专属表情包今日上线!小交贴心的制作了两个版本欢迎大家按需下载收藏转发版本山进DT123收音机评测一款相当成熟的机型,但是底噪过大原创收音机评论译介2022年7月25日,山进公司推出了一款调频中波两波段数调式口袋收音机DT123,是该品牌面向国内市场推出的首款此类收音机。它没有配备扬声器,只有耳机插口,正因为14。字符设备框架介绍与实现openwrt入门经典教程14。字符设备框架介绍与实现实验目的掌握编写一个字符设备驱动程序的框架必须的步骤1字符设备驱动程序框架简介我们在学习C语言的时候,知道每个应用程序的入口函数,即第一个被执行的函数是2023年有线电视还要继续缴费吗?有线电视从垄断到竞争,市场化给有线电视带来众多的竞争对手,也从不同角度展开了对有线电视市场的争夺,而长期靠政策生存的有线电视面对突然出现的狼群竟然没有惊慌失措,仍然保持着昔日的王者