大数据课程-太原
大数据课程-太原详细内容
大数据课程-太原
【课程特色】
1. 课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。
2. 清晰的知识结构,根据应用经验采用最优化授课模式。
3. 内容充沛、详略得当,前后呼应。
4. 讲师资历丰富,具有丰富的实践经验。
5. 知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪
【课程时间】3天
【课程大纲】
第一部分:数据处理架构介绍
1大数据的初步认知
1.1何谓大数据
1.2大数据的发展现状
1.3大数据的发展趋势
2大数据的架构分析
2.1大数据架构概述
2.2大数据架构设计
2.3大数据架构的参考模型
3大数据的数据获取
3.1数据分类与数据获取组件
3.2探针在数据获取中的原理作用
3.3 网页采集与日志收集
3.4 数据分发中间件的作用分析
4机器学习和数据挖掘技术
4.1 机器学习与数据挖掘的关系
4.2机器学习的方式与类型
4.3机器学习与数据挖掘的应用
4.4深度学习的实践与发展
5大数据的安全与隐私
5.1大数据时代面临的安全挑战
5.2安全问题解决的框架、技术与体系
5.3大数据隐私保护的政策法规与技术介绍
6大数据架构的实现与应用实例
6.1大数据架构的实现途径
6.2 大数据在电网中的应用案例解析
第二部分:HDFS原理及应用
1分布式文件系统HDFS
1.1 计算机集群结构
1.2 分布式文件系统的结构
1.3 分布式文件系统的设计需求
2 HDFS简介
3 HDFS的相关概念
3.1 块
3.2 名称节点和数据节点
3.3 第二名称节点
4 HDFS体系结构
4.1 概述
4.2 HDFS命名空间管理
4.3 通信协议
4.4 客户端
4.5 HDFS体系结构的局限性
5 HDFS的存储原理
5.1 数据的冗余存储
5.2 数据存取策略
5.3 数据错误与恢复
6 HDFS的数据读写过程
6.1 读数据的过程
6.2 写数据的过程
7 HDFS编程实践
7.1 HDFS常用命令
7.2 HDFS的Web页面
7.3 HDFS常用Java API及应用实例
实验:熟悉常用的HDFS操作
第三部分:HBase原理及应用
1 概述
1.1 从BigTable说起
1.2 HBase简介
1.3 HBase与传统关系数据库的对比分析
2 HBase访问接口
3 HBase数据模型
3.1 数据模型概述
3.2 数据模型的相关概念
3.3 数据坐标
3.4 概念视图
3.5 物理视图
3.6 面向列的存储
4 HBase的实现原理
4.1 HBase的功能组件
4.2 表和Region
4.3 Region的定位
5 HBase运行机制
5.1 HBase系统架构
5.2 Region服务器的工作原理
5.3 Store的工作原理
5.4 HLog的工作原理
6 HBase编程实践
6.1 HBase常用的Shell命令
6.2 HBase常用的Java API及应用实例
实验:熟悉常用的HBase操作
第四部分:ETL工具介绍
1开启ETL之旅
1.1了解ETL
1.2选择ETL工具
2配置Kettle运行环境
2.1安装JDK
2.2安装MySQL数据库
2.3配置Kettle
3熟悉Kettle基本操作
3.1认识Kettle界面
3.2新建转换与任务
3.3运行与查看结果面板
4数据获取
4.1创建数据库连接
4.2表输入
4.3 CSV文件输入
4.4 Excel输入
4.5生成记录
5记录处理
5.1 排序记录
5.2 去除重复记录
5.3 过滤记录
5.4值映射
5.5字符串替换
5.6字符串操作
5.7分组
6字段处理
6.1字段选择
6.2增加常量
6.3将字段值设置为常量
6.4剪切字符串
6.5拆分字段
7高级转换
7.1记录集连接
7.2多路数据合并连接
7.3公式
8迁移和装载
8.1表输出
8.2插入/更新
8.3 Excel输出
8.4文本文件输出
8.5 SQL文件输出
9项目实战
9.1分析任务数据需求
9.2熟悉任务流程
9.3实现项目
第五部分:MapReduce原理应用开发
1概述
1.1 分布式并行编程
1.2 MapReduce模型简介
1.3 Map和Reduce函数
2 MapReduce的工作流程
2.1 工作流程概述
2.2 MapReduce的各个执行阶段
2.3 Shuffle过程详解
3 实例分析:WordCount
3.1 WordCount的程序任务
3.2 WordCount的设计思路
3.3 WordCount的具体执行过程
3.4 一个WordCount执行过程的实例
4 MapReduce的具体应用
4.1 MapReduce在关系代数运算中的应用
4.2 分组与聚合运算
4.3 矩阵-向量乘法
4.4 矩阵乘法
5 MapReduce编程实践
5.1 任务要求
5.2 编写Map处理逻辑
5.3 编写Reduce处理逻辑
5.4 编写main方法
5.5 编译打包代码以及运行程序
实验MapReduce初级编程实践
实操内容:
1 在Windows中使用VirtualBox安装Ubuntu虚拟机
2 Hadoop3.1.3安装教程 单机版
2.1 Hadoop简介
2.2 安装Hadoop前的准备工作
2.2.1 创建hadoop用户
2.2.2 更新APT
2.2.3 安装SSH
2.2.4 安装Java环境
2.3 安装Hadoop
2.3.1 下载安装文件
2.3.2 单机模式配置
3 HDFS编程实践(Hadoop3.1.3)
3.1 HDFS操作常用的Shell命令
3.1.1 查看命令的用法
3.1.2 HDFS操作
3.2 利用HDFS的Web管理界面
3.3 HDFS编程实践
3.3.1 在Eclipse中创建项目
3.3.2 为项目添加需要用到的JAR包
3.3.3 编写Java应用程序
3.3.4 编译运行程序
3.3.5 应用程序的部署
4 MapReduce编程实践(Hadoop3.1.3)
4.1词频统计任务要求
4.2 MapReduce程序编写方法
4.2.1 编写Map处理逻辑
4.2.2 编写Reduce处理逻辑
4.2.3 编写main方法
4.2.4 完整的词频统计程序
4.3 编译打包程序
4.3.1 使用命令行编译打包词频统计程序
4.3.2 使用Eclipse编译打包词频统计程序
4.4 运行程序
刘晖老师的其它课程
5G、大数据对于医疗行业发展趋势的影响和指导意义 12.31
【课程特色】1. 课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2. 清晰的知识结构,根据应用经验采用最优化授课模式。3. 内容充沛、详略得当,前后呼应。4. 讲师资历丰富,具有丰富的实践经验。5. 知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程时间】1天【课程
讲师:刘晖详情
5G 时代下的绿色智慧物业 12.31
【课程背景】住房和城乡建设部印发的《国家智慧城市试点暂行管理办法》和《国家智慧城市(区、镇)试点指标体系(试行)》两个文件指出:建设智慧城市是创新驱动发展、推动新型城镇化、全面建成小康社会的重要举措。这对于服务于千千万万城市、社区、园区、小区、楼宇,以及工作和生活在其中的业主和客户的物业管理服务业来说,已然迎来最大的发展机遇。物业管理行业不仅是智慧社区的受益
讲师:刘晖详情
5G+智慧煤矿 12.31
【课程特色】1. 课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2. 清晰的知识结构,根据应用经验采用最优化授课模式。3. 内容充沛、详略得当,前后呼应。4. 讲师资历丰富,具有丰富的实践经验。5. 知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】无线网、核
讲师:刘晖详情
5G+行业应用前景及知识赋能 12.31
【课程特色】1. 课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2. 清晰的知识结构,根据应用经验采用最优化授课模式。3. 内容充沛、详略得当,前后呼应。4. 讲师资历丰富,具有丰富的实践经验。5. 知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】相关人员【
讲师:刘晖详情
5G产业发展与应用创新 12.31
5G产业发展与应用创新【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。本课程站在科技发展的前沿,探讨了5G在物联网、人工智能、无人机、医疗、农业、教育、工业互联网、新媒体等行业的应用案例。值得指出的是,案例以运营商、一流企业等机构在5G领域的实践为主线,对5G行业应用创新案例做了详细的讲解。【课程收益】
讲师:刘晖详情
5G赋能环保行业应用与创新案例解析 12.31
【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。【课程收益】1了解5G从信息通信技术支持到业务模式推广和场景的应用,掌握5G在新时代、新技术下的行业发展趋势;2以鲜活的应用案例和解决方案详细掌握5G给环保行业方面带来全新变革的蓝图和愿景;【课程特色】1. 课上采用案例式教学,通俗易懂,课下一对一辅导强
讲师:刘晖详情
5G赋能工业互联网 12.31
5G赋能工业互联网【课程背景】5G通过技术创新实现了增强型移动宽带、超大规模物联网和高可靠、低时延等三大应用场景全覆盖,把人与人之间的通信拓展到了人与物、物与物之间的通信,从消费互联网拓展到了产业互联网,为行业数字化转型提供了关键的数字基础设施。5G和人工智能/大数据/云计算/边缘计算/区块链等新一代信息技术相结合,多技术交织并进、深度渗透、协同应用,孕育技
讲师:刘晖详情
5G赋能行业应用与创新案例解析 12.31
【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。本课程站在科技发展的前沿,探讨了5G在物联网、人工智能、无人机、医疗、农业、教育、工业互联网、新媒体等行业的应用案例。值得指出的是,案例以运营商、一流企业等机构在5G领域的实践为主线,对5G行业应用创新案例做了详细的讲解。【课程收益】1了解5G从信息通信技
讲师:刘晖详情
5G赋能金融行业应用与创新案例解析 12.31
【课程背景】随着5G 技术的快速发展,5G 应用已成为各界热议的话题,很多行业陆续开展了相关的实践探索。本课程站在科技发展的前沿,探讨了5G与数字货币、区块链在金融行业的应用案例。值得指出的是,案例以运营商、一流企业等机构在5G领域的实践为主线,对5G金融行业应用创新案例做了详细的讲解。【课程收益】1了解5G从信息通信技术支持到业务模式推广和场景的应用,掌握
讲师:刘晖详情
- [杨建允]2024全国商业数字化技
- [杨建允]2023双11交易额出炉
- [杨建允]DTC营销模式是传统品牌
- [杨建允]探析传统品牌DTC营销模
- [杨建允]专家称预制菜是猪狗食,预
- [潘文富]为什么店家都不肯做服务
- [潘文富]厂家对经销商工作的当务之急
- [潘文富]经销商转型期间的内部组织结
- [潘文富]小型厂家的招商吸引力锻造
- [潘文富]经销商发展观的四个突破
- 1社会保障基础知识(ppt) 21255
- 2安全生产事故案例分析(ppt) 20330
- 3行政专员岗位职责 19114
- 4品管部岗位职责与任职要求 16373
- 5员工守则 15537
- 6软件验收报告 15460
- 7问卷调查表(范例) 15204
- 8工资发放明细表 14660
- 9文件签收单 14315





