Spark大数据分析 5天

  培训讲师:孙增辉

讲师背景:
孙增辉老师讲师资质ØOracle数据库DBA认证ØSAS数据分析高级程序员认证ØHadoop大数据及数据分析讲师讲师简介Ø数据库专家。孙增辉老师多年从事数据库的管理和教学工作。对oracle、sqlserver、mysql等关系型数据库有丰 详细>>

    课程咨询电话:

Spark大数据分析 5天详细内容

Spark大数据分析 5天

Spark数据分析
课程介绍
本课程将关注spark的数据分析技术实际应用。
课程目标
数据分析
培训对象
开发人员
课程长度
5天(30学时)
培训方式
案例分析、情景演练
课程内容
第1天
主题
Spark 的环境搭建与运行
大纲
Spark 的本地安装与配置
Spark 集群
Spark 编程模型
主题
数据分析系统商业案例
大纲
个性化
目标营销和客户细分
预测建模与分析
机器学习的系统架构
第2天
主题
Spark 上数据的获取、处理与准备
大纲
获取公开数据集
处理与转换数据
从数据中提取有用特征
主题
构建基于Spark 的推荐引擎
大纲
推荐模型的分类
提取有效特征
训练推荐模型
使用推荐模型
推荐模型效果的评估.
第3天
主题
Spark 构建分类模型
大纲
分类模型的种类
从数据中抽取合适的特征
训练分类模型
使用分类模型
评估分类模型的性
改进模型性能以及参数调优.
主题
Spark 构建回归模型
大纲
回归模型的种类
从数据中抽取合适的特征
回归模型的训练和应用
评估回归模型的性能
改进模型性能和参数调优.
第4天
主题
Spark 构建聚类模型
大纲
聚类模型的类型
从数据中提取正确的特征
训练聚类模型
使用聚类模型进行预测
评估聚类模型的性能
主题
Spark 应用于数据降维大纲
降维方法的种类
从数据中抽取合适的特征
训练降维模型使用降维模型第5天
主题
Spark 高级文本处理技术
大纲
处理文本数据有什么特别之处
从数据中抽取合适的特征
评估文本处理技术的作用
主题
Spark Streaming 在实时机器学习上的应用
大纲
在线学习.
流处理.
使用Spark Streaming 进行在线学习

 

孙增辉老师的其它课程

大数据处理技术培训课程介绍Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。课程目标掌握

 讲师:孙增辉详情


信息安全5天    12.08

信息安全课程介绍本课程涵盖了信息安全从概念到细节的多个方面。本课程同样适用于初学者和专业人员,相对全面地提供了一站式的参考内容。课程目标安全基础数据安全如何保护网络上的资产网络安全计算机安全应用程序安全安全操作培训对象相关的技术人员、管理人员、运维人员课程长度5天课程内容第1天主题信息安全概述大纲信息保护的重要性信息安全的演变合理的安全投资安全方法论建立一个

 讲师:孙增辉详情


应用容器引擎Docker课程介绍Docker是基于GO语言实现的云开源项目,诞生于2013年初。Docker希望达到应用组件级别的“一次封装,到处运行”。学员可以简单将docker容器理解为沙盒。每个容器运行一个应用,不同的容器互相隔离,容器之间也可以建立通信机制。容器的创建和停止十分快速,容器自身对资源的需求也十分有限,远远低于虚拟机。很多时候直接把容器党

 讲师:孙增辉详情


云计算openstack课程介绍云计算从提出到成熟,中间经历了较长的时间。云计算的各种概念也在不断发展更新。本课程能够给想要学习云计算知识的人们,提供一个可供学习的云计算系统,帮助大家学习、实验和使用。课程目标了解云计算,知道云计算产生的原因以及应用场景。了解云存储,知道云计算系统中大数据的存储方式。私有云和公有云。云计算的两种不同应用场景,它们的联系与区别

 讲师:孙增辉详情


mysql 4天    12.08

MYSQL数据库课程介绍本课程介绍MySQL的启动、连接等基础应用开始,SQL语句的使用、MySQL内置函数、备份与恢复、数据库优化、数据库安全等主题,介绍相关开发实例课程目标了解mysql数据库的体系结构创建和管理mysql数据库备份和恢复数据库培训对象软件开发人员、数据库管理员课程长度5天(30学时)培训方式案例分析、情景演练课程内容第1天主题体系结构大

 讲师:孙增辉详情


Oracle数据库管理(DBA)课程介绍本课程是你作为Oracle专业人员走向成功的第一步。课程设计为你打下基本的数据库管理的坚实基础并帮助你准备通过OracleCertifiedAssociate考试。课程目标课程中,你将学习如何安装和维护Oracle数据库。学员将获得Oracle数据库结构的概念性理解,以及它的组件是如何彼此协调工作的。学员将学习如何创建

 讲师:孙增辉详情


Oracle调优培训课程介绍该培训课程面向大中型企业中的数据库相关的开发人员和管理人员。课程的主要内容是Oracle11g数据库性能调优的各种实例、方法、技巧以及与之对应的原理的讲解通过本课程地学习。学员可以大大的提升数据库性能调优的能力。课程结合大量案例,使学员能够理论结合实际,学以致用。课程目标←掌握Oracle11g数据库性能调优的各种实例、方法、技巧

 讲师:孙增辉详情


Oracle数据库调优课程课时:4天1.课程适合对象Oracle数据库运维人员(DBA)2.培训所需实验设备及软件清单编号设备及软件名称对应课程1Oracle11g数据库课程安排上午(9:00-12:00)下午(14:00-17:00)第一天(1).Oracle数据库性能诊断工具•最根本的性能信息工具——数据库数据字典和动态性能视图•诊断性能定位问题工具:S

 讲师:孙增辉详情


SAS数据分析从入门到精通课程介绍SAS数据分析软件是应用最广泛的商业统计分析软件之一。本课程是从基础开始到专业应用的整体内容,帮助您理解数据分析的操作。课程目标SAS编程基础SAS常用函数及应用SAS数据集处理操作SAS宏编程SASPROCSQL描述统计T检验方差分析回归分析。培训对象数据库管理员、开发人员课程长度5天(30学时)培训方式案例分析、情景演练

 讲师:孙增辉详情


课程名称课程介绍本课程是大数据与使用sas做数据挖掘的基础课。主要内容是:1、介绍了大数据的定义。回顾大数据的时代背景、大数据的构成,已经大数据的“4v”特征。并且介绍了大数据的技术与应用范围。并介绍了大数据已经对我们产生的影响。以及一个广受欢迎的大数据支撑产品---hadoop软件的安装2、大数据是数据分析的前提,也是从数据中产生价值的基础。真正产生价值,

 讲师:孙增辉详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有