数据仓库的建设方法

  培训讲师:刘晖

讲师背景:
刘晖老师通信行业特约培训导师【专业资质】✦北大计算机、北邮通信双学位✦(原)中兴通讯学院高级讲师✦大庆油田技术研究院高级内训讲师✦15年嵌入式硬件、软件开发和系统架构设计总监✦有8年多的“云大智物”开发及实施经验。曾供职于巨龙通信、大唐电信 详细>>

刘晖
    课程咨询电话:

数据仓库的建设方法详细内容

数据仓库的建设方法

【课程特色】

1.   课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。

2.   清晰的知识结构,根据应用经验采用最优化授课模式。

3.   内容充沛、详略得当,前后呼应。

4.   讲师资历丰富,具有丰富的实践经验。

5.   知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪

【课程时间】2天

【课程大纲】

第1章 大数据与数据仓库概论

1.1 大数据概论

1.1.1 什么是大数据

1.1.2 大数据生态圈简介

1.1.3 大数据应用场景

1.2 数据仓库概论

1.2.1 什么是数据仓库

1.2.2 数据仓库能干什么

1.2.3 数据仓库的特点

第2章 项目需求描述

2.1 任务概述

2.1.1 产品描述

2.1.2 系统目标

2.1.3 系统功能结构

2.1.4 系统流程图

2.2 业务描述

2.2.1 采集模块业务描述

2.2.2 数据仓库需求业务描述

2.2.3 数据可视化业务描述

2.3 系统运行环境

2.3.1 硬件环境

2.3.2 软件环境

第3章 项目部署的环境准备

3.1 Linux环境准备

3.1.1 VMware安装

3.1.2 CentOS安装

3.1.3 远程终端安装

3.2 Linux环境配置

3.2.1 网络配置

3.2.2 网络IP地址配置

3.2.3 主机名配置

3.2.4 防火墙配置

3.2.5 一般用户设置

3.3 Hadoop环境搭建

3.3.1 虚拟机环境准备

3.3.2 JDK安装

3.3.3 Hadoop安装

3.3.4 Hadoop分布式集群部署

3.3.5 配置Hadoop支持LZO压缩

3.3.6 配置Hadoop支持Snappy压缩

第4章 用户行为数据采集模块

4.1 日志生成

4.2 采集日志的Flume 

4.2.1 Flume组件

4.2.2 Flume安装

4.2.3 采集日志Flume配置

4.2.4 Flume的ETL拦截器和日志类型区分拦截器

4.2.5 采集日志Flume启动、停止脚本

4.3 消息队列Kafka 

4.3.1 Zookeeper安装

4.3.2 Zookeeper集群启动、停止脚本

4.3.3 Kafka安装

4.3.4 Kafka集群启动、停止脚本

4.3.5 Kafka Topic相关操作

4.4 消费Kafka日志的Flume 

4.4.1 消费日志Flume配置

4.4.2 消费日志Flume启动、停止脚本

4.5 采集通道启动、停止脚本

第5章 业务数据采集模块

5.1 电商业务概述

5.1.1 电商业务流程

5.1.2 电商常识

5.1.3 电商表结构

5.1.4 数据同步策略

5.2 业务数据采集

5.2.1 MySQL安装

5.2.2 业务数据生成

5.2.3 业务数据建模

5.2.4 Sqoop安装

5.2.5 业务数据导入数据仓库

第6章 数据仓库搭建模块

6.1 数据仓库理论准备

6.1.1 范式理论

6.1.2 关系模型与维度模型

6.1.3 星形模型、雪花模型与星座模型

6.1.4 表的分类

6.1.5 为什么要分层

6.1.6 数据仓库建模

6.1.7 业务术语

6.2 数据仓库搭建环境准备

6.2.1 MySQL HA 

6.2.2 Hive安装

6.2.3 Tez引擎安装

6.3 数据仓库搭建——ODS层

6.3.1 创建数据库

6.3.2 用户行为数据

6.3.3 ODS层用户行为数据导入脚本

6.3.4 业务数据

6.3.5 ODS层业务数据导入脚本

6.4 数据仓库搭建——DWD层

6.4.1 用户行为启动日志表解析

6.4.2 用户行为事件表拆分

6.4.3 用户行为事件表解析

6.4.4 业务数据维度表解析

6.4.5 业务数据事实表解析

6.4.6 拉链表构建之用户维度表

6.4.7 DWD层数据导入脚本

6.5 数据仓库搭建——DWS层

6.5.1 系统函数

6.5.2 用户行为数据聚合

6.5.3 业务数据聚合

6.5.4 DWS层数据导入脚本

6.6 数据仓库搭建——DWT层

6.6.1 设备主题宽表

6.6.2 会员主题宽表

6.6.3 商品主题宽表

6.6.4 优惠券主题宽表

6.6.5 活动主题宽表

6.6.6 DWT层数据导入脚本

6.7 数据仓库搭建——ADS层

6.7.1 设备主题

6.7.2 会员主题

6.7.3 商品主题

6.7.4 营销主题

6.7.5 ADS层数据导入脚本

6.8 结果数据导出脚本

6.9 会员主题指标获取的全调度流程

6.9.1 Azkaban安装

6.9.2 创建可视化的MySQL数据库和表

6.9.3 编写指标获取调度流程

第7章 数据可视化模块

7.1 模拟可视化数据

7.1.1 会员主题

7.1.2 地区主题

7.2 Superset部署

7.2.1 环境准备

7.2.2 Superset安装

7.3 Superset使用

7.3.1 对接MySQL数据源

7.3.2 制作仪表盘

第8章 即席查询模块

8.1 Presto 

8.1.1 Presto特点

8.1.2 Presto安装

8.1.3 Presto优化之数据存储

8.1.4 Presto优化之查询SQL 

8.1.5 Presto注意事项

8.2 Druid 

8.2.1 Druid简介

8.2.2 Druid框架原理

8.2.3 Druid数据结构

8.2.4 Druid安装(单机版)

8.3 Kylin 

8.3.1 Kylin简介

8.3.2 HBase安装

8.3.3 Kylin安装

8.3.4 Kylin使用

8.3.5 Kylin Cube构建原理

8.3.6 Kylin Cube构建优化

8.3.7 Kylin BI工具集成

8.4 即席查询框架对比

第9章 元数据管理模块

9.1 Atlas入门

9.1.1 Atlas概述

9.1.2 Atlas架构原理

9.2 Atlas安装及使用

9.2.1 安装前环境准备

9.2.2 集成外部框架

9.2.3 集群启动

9.2.4 导入Hive元数据到Atlas 

9.3 Atlas界面查看及使用

9.3.1 查看基本信息

9.3.2 查看血缘依赖关系

 



 

刘晖老师的其它课程

【课程特色】1.  课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.  清晰的知识结构,根据应用经验采用最优化授课模式。3.  内容充沛、详略得当,前后呼应。4.  讲师资历丰富,具有丰富的实践经验。5.  知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程时间】1天【课程

 讲师:刘晖详情


【课程背景】住房和城乡建设部印发的《国家智慧城市试点暂行管理办法》和《国家智慧城市(区、镇)试点指标体系(试行)》两个文件指出:建设智慧城市是创新驱动发展、推动新型城镇化、全面建成小康社会的重要举措。这对于服务于千千万万城市、社区、园区、小区、楼宇,以及工作和生活在其中的业主和客户的物业管理服务业来说,已然迎来最大的发展机遇。物业管理行业不仅是智慧社区的受益

 讲师:刘晖详情


5G+智慧煤矿   12.31

【课程特色】1.  课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.  清晰的知识结构,根据应用经验采用最优化授课模式。3.  内容充沛、详略得当,前后呼应。4.  讲师资历丰富,具有丰富的实践经验。5.  知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】无线网、核

 讲师:刘晖详情


【课程特色】1.  课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.  清晰的知识结构,根据应用经验采用最优化授课模式。3.  内容充沛、详略得当,前后呼应。4.  讲师资历丰富,具有丰富的实践经验。5.  知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】相关人员【

 讲师:刘晖详情


5G产业发展与应用创新【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。本课程站在科技发展的前沿,探讨了5G在物联网、人工智能、无人机、医疗、农业、教育、工业互联网、新媒体等行业的应用案例。值得指出的是,案例以运营商、一流企业等机构在5G领域的实践为主线,对5G行业应用创新案例做了详细的讲解。【课程收益】

 讲师:刘晖详情


【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。【课程收益】1了解5G从信息通信技术支持到业务模式推广和场景的应用,掌握5G在新时代、新技术下的行业发展趋势;2以鲜活的应用案例和解决方案详细掌握5G给环保行业方面带来全新变革的蓝图和愿景;【课程特色】1.  课上采用案例式教学,通俗易懂,课下一对一辅导强

 讲师:刘晖详情


5G赋能工业互联网【课程背景】5G通过技术创新实现了增强型移动宽带、超大规模物联网和高可靠、低时延等三大应用场景全覆盖,把人与人之间的通信拓展到了人与物、物与物之间的通信,从消费互联网拓展到了产业互联网,为行业数字化转型提供了关键的数字基础设施。5G和人工智能/大数据/云计算/边缘计算/区块链等新一代信息技术相结合,多技术交织并进、深度渗透、协同应用,孕育技

 讲师:刘晖详情


【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。本课程站在科技发展的前沿,探讨了5G在物联网、人工智能、无人机、医疗、农业、教育、工业互联网、新媒体等行业的应用案例。值得指出的是,案例以运营商、一流企业等机构在5G领域的实践为主线,对5G行业应用创新案例做了详细的讲解。【课程收益】1了解5G从信息通信技

 讲师:刘晖详情


【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。本课程站在科技发展的前沿,探讨了5G与数字货币、区块链在金融行业的应用案例。值得指出的是,案例以运营商、一流企业等机构在5G领域的实践为主线,对5G金融行业应用创新案例做了详细的讲解。【课程收益】1了解5G从信息通信技术支持到业务模式推广和场景的应用,掌握

 讲师:刘晖详情


【课程背景】国家电网“三型两网、世界一流”战略、南方电网定位“五者”,转型“三商”战略,需赋能智能终端,加速电网全面感知,打通数据和业务壁垒,驱动创新能力。传统通信方式难以满足数字电网发展需求,电力生产、传输、消费全过程需要低时延、大宽带、大连接,对5G的诉求十分迫切5G作为最新一代的无线通信技术,其超高速率、超低时延、超大连接特性对智慧城市建设产生巨大的影

 讲师:刘晖详情


COPYRIGT @ 2018-2028 HTTPS://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有