天天快看点丨由表及里的解读数据仓库

2023-04-26 17:13:56    来源:软服之家

数据仓库作为商业智能BI系统中的一部分,已经成长为了企业信息化建设中必不可少的重要支撑,在可见的未来,数据仓库还会随着信息化、数字化技术、理念、应用的落地,继续成长。

数据仓库是一个面向主题的、集成的、随时间变化但信息本身相对稳定的数据集合,用于支持管理决策过程。其本质就是完成从面向业务过程数据的组织管理到面向业务分析数据的组织和管理的转变过程,也是商业智能BI中数据仓库的主要作用。

数据仓库的六大现状1、缺失业务系统数据模型清单与变更同步


【资料图】

没有对已归集到数仓业务系统数据模型记录,业务系统数据模型发送变更也没有对数仓知会,更多是出现问题后或者是数据使用者事后告知数仓。

2、业务部门数据自理

有些部门绕过数仓直接接入上游数据源,搭建各自的小数仓,从而导致数据孤岛、重复计算、口径不一致。

3、存在业务盲区

有些业务需要专业知识背景如:财务;有些业务规则保密级别高,无法对非业务相关员公开业务逻辑,如风控;因此无法系统梳理这些业务实体与实体之间关系,提炼指标,共享数据。

4、流程规范缺少

没有流程与规范指引数据开发者根据流程对数据进行规范化建设,导致数据分层分类不清晰,数据混乱;命名不规范,同义不同名,同名不同义;数据重复建设,冗余数据多。

5、没有体系化技术设计

无论是离线或实时数据采集、处理与分发都缺少体系化设计与搭建;例如在离线与实时对同一数据源进行采集;无差别对所有数据源每次全量抽取与 DWD 到 DWS 层无差别全量计算;T+1 与每小时批处理烟囱开发,同一宽表离线与实时烟囱开发、重复计算与存储;对不同应用场景无差别使用相同存储与计算等等;

6、影响无互相隔离

数仓数据存储与计算,没有与数据应用服务存储与技术隔离,存在互相之间资源抢占与问题被放大情况;同时也存在数仓底层模型设计很难兼容数据应用层模型设计需求

数据仓库的实施步骤● 需求分析

需求分析是数据仓库项目最重要的一个环节,数仓说到底还是服务于业务,支撑于业务:

1、尽可能与业务方/客户方一起分析需求,从而正确理解实际的业务需求。

2、必须实事求是地将数据仓库所能实现的目标和不容易解决的问题与协商清楚。

3、需求方群体的分类

4、需求调研的再完美,也避免不了需求变更。

● 逻辑分析

数据仓库在逻辑上可以分成操作型数据库、数据仓库层、数据集市层、数据分析应用层和报表展示层。

设计ODS系统

ODS数据缓冲区ODS数据缓冲区是业务数据流动过程的第一个存储区,实现了数据仓库从各个业务系统的数据源中将数据抽取出来,并且装载到ODS数据缓冲区的这一过程,从而实现统一的全局的企业数据平台,为以后的数据抽取、清洗、转换过程打下坚实的基础。

ODS数据缓冲区的ETL规则一般只进行简单的汇总、计算,或者从操作型数据库中直接抽取而中间不进行任何转化。ODS 统一信息视图区的数据一般都是从ODS数据缓冲区中抽取过来的。

● 数据仓库建模

概念模型主要是模型设计人员对业务规则的理解,是最高层次的数据模型,几乎涵盖了业务所有的核心概念和重要的主题,为以后逻辑模型的建设打下了基础。逻辑模型是对概念模型的分解、细化,将数据主题划分成一个个的实体和实体关系,一般将第三范式作为设计的模板。

数据集市建模

一般数据集市模型的建设是基于需求分析得到的结果,数据集巾的建模主要针对事实表和维表的设计。

● 数据源分析

所谓数据源分析,就是对源数据进行分析和总结,得出源数据的范围、格式、更新方式、更新频率和质量好坏的过程。数据源分析是指通过需求调研得知业务数据源的基本情况,并且加以详细说明,具体内容包括数据源中存在哪些物理表,表之间的关系和表中每个字段的数据类型和含义等。一般来说,业务数据源通常会有数据不完整、口径不一致,或者各个数据源存在业务规则不统一的情况。● 数据的获取与整合

数据的获取与整合存在于数据仓库项目中的各个阶段。数据仓库很重要的一个作用就是将散落在各业务系统的数据整合起来,不规范的数据规范起来,以一种便于分析和应用的方式放到数据仓库里,供前端应用分析。

ETL 过程实际上就是数据流动的过程,即从不同的数据源流向统一的目标数据库。数据的获取与整合是完成数据仓库建设取复杂的过程,它关系到数据的质量,是数据仓库项目建设的根基。

● 数据应用和报表展现

现在一般都是采用专业的低代码的报表工具来做报表,提升开发效率,侧重应用分析。公司负责报表分析这块的项目人员,那针对报表延伸出来的工作,报表需求分析、指标体系规划、以及各位为经营为管理为基层人员的报表分类,还有围绕业务的分层设计。对于基层员工,报表使用的最多的就是录数据,查询数据。对于企业管理层,更多的说是进行指标的监控,做的业绩分析。而这一过程,也是通过数据使管理层可以更容易的按照标准的管理方法进行决策。

关键词:

相关新闻
相关新闻
v 天天快看点丨由表及里的解读数据仓库 2023-04-26
v 打开番茄属遗传资源领域研究宝库_世界快资讯 2023-04-26
v 世界滚动:英雄联盟封号申诉客服电话_英雄联盟封号申诉 2023-04-26
v 一个四一个不念什么意思_一个四一个不念什么 2023-04-26
v 华策影视(300133):电视剧龙头回暖 数字科技深化版权开发 最新 2023-04-26
v 【环球播资讯】秦皇岛市政府食安办组织召开2023年一季度食品安全风险隐患分析会商会议 2023-04-26
v 5月1日12时起 海南进入伏季休渔期 2023-04-26
v 【环球聚看点】吉林省2023年放心农资下乡进村宣传活动全面启动 2023-04-26
v 重庆举办农产品“消费帮扶、产销对接”活动 2023-04-26
v 湖南一季度农林牧渔业增加值同比增长2.4% 农业农村经济运行总体平稳-天天观速讯 2023-04-26
v 农业生产开局良好 当前观察 2023-04-26
v 广西举办工业服务保障重大工程项目推进会 成交签约金额超100亿_当前聚焦 2023-04-26
v 第十五卷 二年级篇4 各自的想法 世界视点 2023-04-26
v 【视频】浩翔,你的车票和白头发一样多! 全球独家 2023-04-26
v 天天亮点!A股收评 | 创指触底反弹收涨1.54%!新能源、汽车两大赛道爆发 昱能科技(688348.SH)20%涨停 2023-04-26
v ST爱迪尔(002740)4月26日主力资金净买入226.02万元 全球简讯 2023-04-26
v 4月26日:"农产品批发价格200指数"比昨天上升0.05个点 2023-04-26
v 今日热闻!比亚迪高管犀利点评行业:吹牛能带来流量,但不能解决问题! 2023-04-26
v 北京市交通委:“五一”假期北京出行规模将超2023年春运 2023-04-26
v 世界热推荐:高阳台·新秋息园晚眺_关于高阳台·新秋息园晚眺简述 2023-04-26
v 无人农机大田耕种显身手|时快讯 2023-04-26
v 开展收入提升专项行动 壮大农村集体经济 2023-04-26
v 广西运动员在全国国际式摔跤锦标赛上表现不俗 获3金2银1铜 2023-04-26
v 全球新动态:鲍威尔:最重要的是健康 需要把健康和其他一切适时结合在一起 2023-04-26
v 每日速看!永远不要质疑你厂队长的眼光!27岁厄德高女友Helene美照跟进 2023-04-26
v 每日速看!AI情绪识别3.0首次亮相 第六届数字中国建设成果展览会开幕 2023-04-26
v 全国人大常委会分组审议反间谍法修订草案 筑一道坚实的反间谍安全防范大堤|全球热资讯 2023-04-26
v 东京电力公司宣布核污染水排海隧道挖掘完成-世界新要闻 2023-04-26
v 中国热带农业科学院环植所在棕榈入侵害虫椰子织蛾生物防治方面取得新进展 2023-04-26
v 每日聚焦:五一来朝阳,这儿有最顶级的音乐享受→ 2023-04-26

种植基地网 版权所有©未经书面授权禁止复制或建立镜像
京ICP备2022022245号-33
联系我们: 435 226 40@qq.com