范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

数据中台到底长什么样子?4张图带你详解数据中台架构

  数据中台不是一个单纯的系统,而是一套架构、一套数据流转模式。数据中台需要采集数据作为原材料进行数据加工、数据建模,然后分门别类地储存,再根据实际的业务场景,打造各类数据服务(含数据应用平台)从而实现对业务的赋能加速。
  但以上流程的实现,需要有对应的系统与产品作为支撑,那么基础的数据中台到底应该由哪些系统或者产品组成?
  这里我们可以先来看一下几个企业的数据中台架构。
  可以看出,虽然每个企业由于自身业务的不同,衍生出来的数据中台体系都有所不同,但大的架构方面是基本统一的,都需要通过"数据采集接入"—"加工存储"—"统一管理"—"服务应用"的阶段 。
  这里笔者认为《数据中台产品经理:从数据体系到数据平台实战》一书中总结的数据中台架构是比较具有普适性的, 无论是互联网行业,还是传统行业,都可以在该架构上进行改造,设计建设自己的中台架构。
  总体来说数据中台的功能架构由大数据平台、数据资产管理平台与数据服务平台三大部分组成 ,其中在数据服务平台中自助分析平台与标签管理系统的应用场景最为广泛。一、大数据平台
  大数据平台是数据中台的基座,我们也可以把大数据平台称为大数据开发平台,它需要具备与大数据相关的开发能力,提供数据存储、数据清洗/计算、数据查询展示及权限管理等功能。
  那么,应该如何建设上述功能与服务?是不是拥有了上述能力就等同于成功打造大数据平台了?
  其实我们可以发现各公司的大数据平台系统架构其实大同小异, 各类架构都包含了数据采集组件、数据存储组件、数据计算引擎、数据权限与安全组件,以及集群管理与监控组件等。
  除了少数像阿里这样倾力打造自研"飞天"系统的企业,其他企业在底层组件选用上,还是以 Hadoop生态构建的技术体系为主,依托各类开源组件进行优化改进与二次开发。例如,数据存储组件可以选择HBase、Hive等组件,数据计算引擎可以选择Spark、Flink等分布式计算引擎。
  既然大家选用的组件相同或者相似,那为什么最终各企业大数据平台的服务能力还是存在差距呢?这有些类似于购买零件组装台式电脑,零件不需要选最贵的,而是要根据实际需求来选择最适合的。
  好用的大数据平台需要拥有为用户解决问题的能力。 因此,数据中台的大数据平台建设不是比拼引用了多少新技术、覆盖了多少技术组件,而是要看它能否解决数据中台建设中所面临的复杂数据现状,能否成为数据中台打破数据壁垒的技术保障,能否提供简洁有效的数据处理工具,如提供自助配置式的数据采集与数据清洗工具等,以及能否提供更多的附加价值。
  数据中台的大数据平台建设,可以避免各事业部技术团队各自搭建大数据集群所带来的资源浪费。 统一的、成熟的大数据平台对企业来说,不能一蹴而就,需要循序渐进 、分步实施,在持续迭代中构建企业的大数据平台生态。 二、数据资产管理平台
  数据资产管理平台主要解决数据资源的管理, 数据资产遍布在各个大数据组件中, 有 hive 的表, 有 hbase 的表, 有 druid 的datasource, 有 kafka 中的流,各个组件的管控系统很难互相打通, 所以需要一个统一的数据资产管理服务, 来统筹大数据资源的管理。
  随着大数据平台的建设,构建数据中台的数据体系成为可能,通过对各业务线数据的归类整合,我们可以构建出各个数据主题域,完成数据的规范存储,形成数据资产,进而完成数据资产管理。
  在数据中台体系中, 数据资产管理平台主要由元数据管理与数据模型管理组成 ,下面让我们分别了解一下。 元数据管理
  讲述元数据管理,我们需要先弄清楚什么是元数据。
  元数据(MetaData)通常被定义为:关于数据的数据(Metadata),或者描述数据的数据(data about data),对数据及信息资源的描述性信息。元数据是所有数据中最重要的数据。
  这里举一个最通俗的例子 。当我们去图书馆借书时,直接面对数以万计的图书,自然难以寻找,但是你通过在图书馆查询系统中输入这本的书名、作者、出版社等信息,获取就能准确的图书位置。那么这些书名、作者等信息,就可以理解为元数据,而图书的存放位置、借阅历史记录等,则是我们系统中的普通数据。
  在数据库中,每一张数据表的表名、创建信息(创建人、创建时间、所属部门)、修改信息、表字段(字段名、字段类型、字段长度等),以及该表与其他表之间的关系等信息都属于这张数据表的元数据。
  其实,元数据有多种分类方式,笔者更倾向于按照元数据的用途来区分,总共分为三类:业务元数据、技术元数据和管理元数据。
  1、业务元数据:描述数据的业务含义、业务规则等,包括业务规则、数据字典以及安全标准等多项内容。通过明确业务元数据,让人们产生统一的数据认知,消除数据歧义,让不懂数据库的业务方读懂数据表的内容。
  2、技术元数据:描述数据源信息、数据流转信息及数据结构化信息,主要服务于数据开发人员,让开发人员明晰数据表结构与所依赖的上下游任务,主要包括库表字段(存储位置、数据库表、字段长度和类型)、数据模型、ETL脚本(调度信息)与SQL脚本等。
  3、管理元数据:描述数据的管理归属信息,包括业务归属、系统归属、运维归属以及数据权限归属等信息,是数据安全管理的基础。
  所以有人说, 元数据记录了数据从无到有的全过程,就像一本有关数据的"字典", 让我们可以查询到每一个字段的含义与出处,同时它又像是一张"地图",让我们可以追溯数据产生的路径。
  通过对数据体系的建设,数据中台的元数据汇聚了企业各业务线与各系统的数据信息, 让数据中台具备了提供全域数据资产视图的能力,实现了统一数据资产查询与获取入口的目标 。
  元数据管理包括对元数据增删与编辑管理、版本管理、元数据统计分析与元模型管理。通过上述功能模块,有计划地进行数据体系的落地实施,实现数据中台元数据的结构化与模型化,这样既可以避免元数据出现杂乱与冗余的现象,也便于用户查询与定位数据。 数据模型管理
  介绍元数据时,我们提到技术元数据中包括数据模型,这里的 数据模型就是指使用元数据进行数据建模的工作产物。
  根据底层数据的使用情况,如数据表的关联信息、SQL脚本信息(数据聚合与查询信息等),来获取元数据,可以更好地完成对业务的抽象,提高建模效率。
  数据模型是数据整合的有效手段,它完成了各数据源之间的映射关系设计,为数据主题建设提供了"实施图纸"。
  同时,在数据建模过程中,通过明确数据标准,可以确保数据的一致性,还可以消化冗余数据。至于数据模型管理,其是指在数据建模过程中,通过既定的数据模型管理制度,实现对数据模型增、删、改、查的管理,同时遵守数据标准化与数据统一化的要求,确保数据质量。 三、数据服务平台自助分析平台
  自助分析平台,也就是商业智能平台(BI平台)。 BI平台目前已经是很多企业的标配, 目前BI商用市场的行业竞争日趋激烈,进场者可以分为如下3类。
  1、国内BI厂商,典型代表为 连续多年国内市场占有率第一的帆软
  2、国外BI厂商,如Tableau
  3、互联网大厂内部孵化
  平台是数据中台服务能力的主要输出方,要想让数据中台发挥出应有价值,那么BI平台的建设必不可少,所以需要将BI 平台建设划分在数据中台体系下。综合来看,BI平台应该具备如下能力。
  (1)数据接入
  除了数据中台的自有数据源,BI平台还需要支持外部数据源的接入。其接入方式,主要有如下3种。
  文件型:支持Excel等文件数据的上传。
  数据连接型:支持Mysql、Oracle等数据库,以及Hadoop、Spark等大数据平台(数据中台的大数据平台也在此列)。
  API读取:支持通过API获取第三方系统数据。
  图例:帆软BI平台支持的数据源
  (2)数据处理
  BI 平台需要能为用户提供数据建模工具,帮助用户创建目标数据(数据集),其提供的功能包括拖拽表字段、自动识别维度/指标、自定义视图语句、预览数据、设置虚拟字段、函数计算、设置参数等基本操作,以及多源异构的 JOIN/UNION等数据处理功能。
  FineBI自助数据集数据处理界面
  (3)数据分析与可视化
  在数据处理的基础上,BI 平台还需要为用户提供丰富的图表制作和联机分析处理(OLAP)操作,让用户在前端页面完成数据分析与数据可视化等工作。
  其操作流程如下:用户选择处理后的数据集,对维度与指标进行筛选过滤,然后通过上卷下钻、图表联动、报表跳转等操作,完成业务需求的分析,同时BI平台会为用户提供可视化图形组件,使其最终完成可视化内容的设计。
  (4)内容分发与基础服务
  BI平台需要具备分发可视化内容,并进行查看权限与数据权限控制的能力。主要的分发方式包括BI平台、移动BI(App)、数据大屏、邮件、链接访问,以及第三方嵌入等方式。
  同时BI平台还需要具备基础的运营管理、角色管理、帮助中心与消息推送等功能。
  只有满足以上功能、具备了多维分析、数据可视化与数据大屏等服务能力 的BI平台,才可以最大限度的发挥在数据中台体系中的价值,有效地帮助分析师与运营团队提升工作效率。 标签管理系统
  除了BI平台,标签管理系统也是数据服务的重要应用方向之一。 目前,业务部门面临着大量的精准营销场景,这些千人千面的推荐、推送需要基于一个完善且准确的用户画像来实现,而用户画像的构成又需要由大量、全面的用户标签来支撑。
  因此,标签数据作为个性化业务应用的基础数据,其可信度与有效性就成了衡量用户画像成熟度的关键指标。
  我们可以把标签管理系统看作用户画像系统的基座,基于数据中台打造的数据体系,可以顺其自然地打通标签治理中的数据壁垒,构建企业级的、统一认可的用户标签体系,并由此打造一个企业级的用户画像系统。
  数据中台的标签管理系统,主要具备以下功能。
  (1)用户唯一性识别
  很多企业内各业务线都有自己的独立用户识别体系,如在 58 集团内就有 58设备指纹、安居客唯一用户、招聘自然人、金融自然人等多种用户识别方式,但是这些识别方式大部分是服务于单一业务线的,各业务线内的标签也是面向本业务的独立用户标识进行研发的。
  数据中台的标签管理体系,可以提供统一的用户识别服务,将各业务线的独立用户标识进行关联和统一,从而打通面向整个企业的独立用户识别和标签交互转换方案。
  (2)标签体系管理
  标签体系管理的主要工作是制订标签数据和信息交互方案,打通用户画像研发和服务中的信息及数据壁垒,提供标签接入、可视化标签信息展现、可视化标签权限控制、可视化用户标签分析、可视化人群定向提取与可视化相似人群扩展(Lookalike)等功能。
  (3)标签数据服务
  标签管理系统,需要提供用户画像研发和应用过程中涉及的标签提取与查询等服务,以标准化服务接口(API)的方式将相关解决方案提供给各业务方,支持业务方基于数据中台的能力,打造业务线的个性化服务。
  除了商业智能BI和标签管理外,各企业还需根据自身所处行业的特性去进行数据应用价值的最大化挖掘。
  文章主体内容来源:《数据中台产品经理:从数据体系到数据平台实战》

中国市场高端安卓手机份额下跌8,这意味着什么?2022年3月24日消息,CounterpointResearch发布手机市场研究报告,2021年,中国600美元(约3828元人民币)以上价位的安卓智能手机市场份额从2020年的GalaxyZFlip4跑分曝光配高通骁龙8Gen1芯片三星可能将会在今年8月发布GalaxyZFold4和GalaxyZFlip4。根据国内数码博主i冰宇宙提供的信息,GalaxyZFlip4已经出现在GeekBench跑分库上,显示红米k50跳水380元,12256GB天玑8100,等什么618红米的手机产品一直都以性价比在国内的手机市场,甚至在国际手机市场闻名。红米的手机产品也因为优秀的配备以及优越的使用体验能够在手机市场上占据一席之地。以红米今年所发布的红米k50手机iOS16什么时候发布?苹果全力赶工中!全新交互界面等对于即将召开的6月WWDC开发者大会来说,苹果不会放大家的鸽子,也就是说iOS16届时会正常亮相,而相应的工作也在推进中。根据彭博社MarkGurman最新爆料,iOS16的首个公苹果macOSMonterey12。4(21F79)发布苹果macOSMonterey12。4发布。macOSMonterey提供了突破性的新功能,可帮助用户以新方式进行连接完成更多任务并在他们的Apple设备上无缝工作。FaceTim全新设计,质感十足,OPPOReno8Pro上手体验全新登场的OPPOReno8Pro可以说在外观上相比前代有很大的变化,特别是背面的颜值引发了不小的争议,去除摄像头模组阶梯的流云双镜设计,后置摄像头全平的设计真的好评。还有与旗舰F杨磊共享单车笑到最后的人,18岁结缘500强副总,获马云6次撑腰你的共享押金退了吗?回想当年,光是共享单车APP,就足够填满手机的一个屏幕,可见其竞争之激烈。那么,现在到底是谁成了最后的赢家?很多互联网行业都流传着这样一个定律老大跟老二打架,老乐视超级电视九岁生日再耍宝乐视还在,何止奇迹简直不科学九年前的5月5日,是乐视超级电视诞生的日子。早几年,每年的这个时候乐视超级电视都会举行大规模大力度的促销行动。但最近几年,乐视超级电视在这个日子也日渐消沉。不过,今天乐视超级电视又发布不到一年下跌1900元,12GB256GB,120W闪充旗舰售价大跳水都说苹果公司是手机行业风向标,一旦苹果公司做了一些改变,除非是其它手机厂商在技术层面无法借鉴到的,不然都会快速学习苹果,无论是刘海屏还是不送充电器等都是如此,所以当苹果公司推出1TvivoX80使用体验闺蜜聚会拍照,我不用争C位了闺蜜聚会除了下午茶和火热八卦,还有就是拍拍拍啦!每次和闺蜜聚会重头戏总是拍照,各种自拍合拍,不过每次去聚会我的手机像素低,都是她们拍好发给我,自从男朋友给买了vivoX80,姐妹聚被抖音蹭了几次后,美团终于要反击了作者丨柳丁是编辑丨木鱼出品丨壹览商业你能想象在一个外卖平台上看直播吗?你的外卖从配菜到成品,一览无余地展现在你面前,顺便还能看吃播陪吃。瞬息万变的互联网时代,直播这种颇具实时性和交
线下体验华为nova9系列手机,这几点功能才是让人入手的真正原因现如今,只要说到国产手机的代表,相信每个人第一时间都会想到华为。可以说在人们心中,最具值得信赖的国产品牌,非华为莫属!特别是旗下nova系列,以年轻人为主力的目标客户群,依靠绚丽酷做朋友圈最靓的仔!华为nova9Pro手机实现你的小目标在网上一项民意调查中显示存在感是现在90后00后十分在意的方面,是经济地位外貌形象等选项中占比最高的选项。所以,也就非常好理解当下年轻人喜欢在朋友圈炫的行为了。想要更好的展示自我,满载时光的滋养,燕之屋碗燕让健康久久停留在父母身边农历九月初九,两阳相重,故叫重阳,代表着天长地久,也代表着尊老敬老爱老。最美重阳,美在一份景致,美在一份孝心!当孩子渐渐长大,父母却在慢慢地老去,年少时,孩子踩着父母的双肩走向远方丰谷有情节打造情感释放器,治愈现代人的情感退化症社会节奏越来越快,人们的情感被高度压缩,但其实每个人心底都渴望一次情感释放。10月23日,丰谷有情节情感释放器快闪店空降成都春熙路,围绕丰谷有情节,把酒满上,让情释放的主题,为都市年轻一代的时尚选择,鸿蒙加持的华为nova9系列手机值得你拥有华为nova9系列手机上市以来,取得了非常不错的口碑,新机型受到了很多年轻人的追捧,小编也在第一时间抢到了华为nova9Pro手机,这也让小编那些喜爱自拍的闺蜜看见之后羡慕的不得了恒洁卫浴为家居新国货品牌代表,受邀参与中国家居家电高峰论坛会恒洁作为新一代国货品牌,非常关注年轻消费者对时尚感和科技型卫浴产品的需求。近年来,恒洁更是以硬核技术,铸造专业卫浴国货品牌形象,引领国货新潮流。日前,以拓设计之界,襄融合之举为主题秋季运动正当时飞利浦耳机A6606带来运动与音乐的完美融合秋天被誉为运动健身的黄金季节,无论是跑步骑行,在享受大汗淋漓的放松和快乐时,也收获着满眼的金黄。而此时如果再有只为运动而生的飞利浦新品骨传导耳机A6606的陪伴,边运动边听音乐,激也太会玩了吧,与汪苏泷共创音乐本月初,全新smart精灵1概念车于IAA慕尼黑国际车展全球首秀,以轻奢风尚与明日科技清晰呈现了品牌焕新方向。今日,轻奢智能纯电汽车科技品牌smart,携手2021百度AI营销创想热销的华为nova9Pro手机告诉你,鸿蒙系统升级用户破1。2亿的秘密全新华为nova9Pro手机,你一定知道吧,它是专为年轻人定制的首款鸿蒙影像旗舰,其主打年轻时尚,更好地满足了年轻人群的需求。在外观影像智能体验等多方面都有新的突破。从6月初发布截汽车行业首个AI共创计划发布smart以明日科技赋能用户共创本月初,全新smart精灵1概念车于IAA慕尼黑国际车展全球首秀,以轻奢风尚与明日科技清晰呈现了品牌焕新方向。今日,轻奢智能纯电汽车科技品牌smart,携手2021百度AI营销创想华为nova9Pro手机,鸿蒙多机位模式就是YYDS现如今,如果你说你不会玩Vlog,那肯定会有人会说你被时代淘汰了,现在的人无论是社交,旅行娱乐,甚至学习都会发个视频来找一下存在感,这也是为什么这款华为nova9Pro受欢迎的原因