大数据时代的数据挖掘及案例(含CRISP-DM方法论)内训
大数据时代的数据挖掘及案例(含CRISP-DM方法论)内训详细内容
大数据时代的数据挖掘及案例(含CRISP-DM方法论)内训
课程内容:
一、“大数据、大机会”:
1.概述
1)大数据概念和特点
2)大数据需要哪些技术支撑
3)大数据能够带来哪些新应用?
2.大数据时代带来对传统营销的挑战
1)大数据如何成为资产?——GOOGLE的市值远超过制造企业
2)大数据如何体现精细营销
3)大数据的价值——靠空调电表判断气候趋势(“指数”)
1) 互联网思维——先圈用户再挣钱
3) CRM——“旧貌焕发新颜”
4)精细营销——装上了GPS,实现“精确打击”
4.如何在海量数据中整合线上、线下数据,形成你对客户的独特洞察力
1)知道客户的各个属性——互联网时代不再“是否是狗”
2)客户的群体特征——“人以群分”
5.如何建立产品分析的数据平台,提供产品的“标尺”
1)产品的数据有哪些?
2)产品设计的互联网思维?——小米手机
3)产品的大数据分析——哪些维度?
4)如何“产品为中心”发展为“客户为中心”?——有数据就有可能
6.大数据对企业的精细管理提升
1)企业的精细管理——不再盲人摸象
2)企业的KPI仪表板——进入驾驶舱
3)预防企业的管理风险——早诊断、早发现
4)员工的量化绩效评定——计件之后计量
7.大数据提升企业的产品质量
1)建立量化的产品管理方法——辣椒的辣度评定
2)产品制造过程的管理控制——监控大数据分析
3)产品问题的及时监控——温度、风速等异常早发现
4)产品订制的范例——好莱坞大片的大数据
5)产品质量的量化管控——挡板安装的故事
二、大数据的“数据挖掘技术”
1. 数据挖掘概述
1)基本概念——“啤酒和尿布的故事”
2)与讲师系统、统计分析、人工智能的关系——演进历史分析
3)数据挖掘在制造行业的应用内容——如何体现“智能制造”?
2. CRISP-DM过程描述
1)商业理解——要实现什么“目的”?
2)数据的理解以及收集——手里有哪些数据?
3)数据的准备——数据的清洗及转换
4)应用数据挖掘工具建立模型——使用哪种数据挖掘算法和工具?
5)模型评估——算法评估
6)部署(并形成数据挖掘报告)——实际使用及形成报告
3. 数据挖掘常用算法介绍
预测型
1)分类算法
2)回归分析
3)时间序列
描述型
4)关联分析
5)序列关联分析
6)聚类分析
4.数据挖掘具体算法举例
1)神经网络算法
2)决策树算法
5.根据实际问题选择数据挖掘算法
1)客户离网分析
2)客户分群模型
3)产品关联分析
4)问题的描述
需要解决的关键问题
如何转换成为数据挖掘的描述
数据挖掘算法的选择依据
预测类还是描述类
与各种算法的使用特点结合
6.分析结果的检验
对照组数据的选择方法
对照组数据的时间窗口选择
对照组数据的抽样
数据挖掘模型的修订
1)如何剔除无效的结果数据
2) 根据反馈结果进行模型修订
7.数据挖掘项目的投入产出
数据挖掘项目的投入成本计算
数据挖掘项目的产出计算依据
8. 如何形成分析报告
1)分析报告的组成部分
2)部分优秀的分析报告演示
9.常用数据挖掘工具介绍
1)SAS
2 ) SPSS
三、数据挖掘具体案例分析
某电信公司具体数据挖掘案例(某产品营销)详细举例
1. 商业理解:提升哪个KPI指标?(ARPU/MOU等)
2. 数据理解及收集:哪些具体的数据(客户详单、客户资料等)
3. 数据准备:
1)客户数据质量分析
如何保障数据质量——哪些衡量指标
如何发现异常数据——剔除干扰数据
2)客户数据抽样过程
抽样比例分析
抽样的具体方法
3)挖掘应用需求描述
如何筛选有用数据——选择相关变量和汇总数据
如何描述需求
4.数据挖掘工具建立模型
挖掘算法选择
如何选择合适的分析方法
如何剔除无效的干扰数据
选择关键变量
挖掘具体过程
结果数据分析
5.模型(算法)评估
LIFT值等分析
6.实际部署及分析报告
实际分析报告编写示例
如何计算该项目的投入、产出
项目的投入计算依据
项目的产出计算方法
项目的投入/产出结果
四、基础数据的收集和整理
1、数据的种类
1)客户数据内容(保险客户的基本资料)
2)产品数据内容(产品的编码)
3)营销数据内容(交易记录的保存)
4)服务数据内容(客户服务数据的保存)
5)制造行业数据的特点:(数据类型杂、数据量大等)
2、数据的存放方法
1)数据的清洗、转换和加载
2)存放在数据库/数据仓库
3)数据的基本分析工具EXCEL等
3、数据的基本整理
1)数据的归类存放(建模型)
2)数据的基本加工
4、数据的基础分析
1)数据的基本汇总
2)数据中的“金子”:从石头中淘金子
5、数据质量的基本保障
1)指标的口径描述和统一
2)后期补数据成本是前提收集数据成本的15倍
3)“差之毫厘谬以千里”
6、制造业企业数据的收集和整理
1)制造环境的数据收集/整理
2)采购数据的收集/整理
3)营销数据的收集/整理:
4)人力资源数据的收集/整理
示例:某企业的数据收集/整理方案
五、云计算技术
1.Hadoop项目简介
2.HDFS体系结构
3.HDFS关键运行机制
4.MapReduce产生背景
5.MapReduce编程模型
6.MapReduce实现机制
7.MapReduce案例分析
8.HIVE介绍
9.HBASE介绍
六、总结和展望
马兆林老师的其它课程
中国式现代化愿景下的新型工业化发展(3小时) 03.08
中国式现代化愿景下的新型工业化发展课程背景:中国式现代化是工业化、信息化、城镇化、农业现代化叠加发展的现代化,对创新现代化发展进程具有重要启示意义。目前中国是全球最大的制造业国家,大多数中国工厂并没有掌握制造的核心材料、设备,以及工艺,他们仍然停留在组装加工的阶段,缺乏原创技术、缺乏创新。面对工业4.0和工业互联网的新工业革命大潮,中国是否会丧失制造业大国的
讲师:马兆林详情
银行网络信息安全培训(半天) 03.08
银行网络信息安全培训课程背景:银行加强信息安全主要目的是为了保障信息化的持续稳定发展,网络信息安全不仅属于技术问题,也属于管理问题。网络信息安全的构建,是大数据时代网络信息技术的发展安全,也是确保金融企业网络环境安全有序重要保障。课程时间:3小时课程形式:以讲授为主,结合案例分析、体验游戏、视频观赏等形式。授课讲师:马兆林(简介略)课程大纲银行网络安全概述我
讲师:马兆林详情
数字化项目管理 03.08
数字化项目管理数字化中的项目管理几个方面、工具支撑导入:项目风险(经济背景),EDS界面数字化工具,不能太微观财务管理,共性特性这怎么呈现?怎么匹配学员的刚需?课程背景:数字化项目管理是项目管理在数字化领域的应用,结合数字化行业特点运用项目管理技术、理念和方法,包括9大领域(项目综合、范围、时间、成本、质量、人力资源、沟通、风险和采购管理)以及启动、计划、实
讲师:马兆林详情
数据治理(1天) 03.08
数据治理数据治理课程是ICCP的一门认证课程。学员掌握数据治理与管理的知识体系,提高数据资产的管理能力。深刻理解数据治理为企业战略目标实现带来的价值。经认证考试后可收获国际认可的数据治理与管理(DGSP)培训和认证证书。培训时长:6小时授课内容数据治理和管理核心概念数据管理和数据治理数据治理业务驱动因素和其他概念数据管理范围和组织数据治理角色和其他计划元素数
讲师:马兆林详情
数据资产管理-数据治理(3小时) 03.08
数据资产管理-数据治理数据治理课程是ICCP的一门认证课程。学员掌握数据治理与管理的知识体系,提高数据资产的管理能力。深刻理解数据治理为企业战略目标实现带来的价值。经认证考试后可收获国际认可的数据治理与管理(DGSP)培训和认证证书。培训时长:3-6小时授课内容数据治理和管理核心概念数据管理和数据治理数据治理业务驱动因素和其他概念数据管理范围和组织数据治理角
讲师:马兆林详情
ITIL运维管理(1天) 03.08
ITIL运维管理课程内容ITIL是一种全新的、基于流程的IT管理模式,可快速帮助企业IT部门从职能/后勤部门转型为服务部门,并实现规范、精细、可量化的IT管理,提供可保证的IT服务质量。ITIL是ITSM流程中最核心的一组,已有近20年的全球应用历史,并于2005年被批准为国际标准ISO20000。适合对象CIO、IT运维经理、网络管理员;数据中心经理;IT
讲师:马兆林详情
前沿技术及应用(6小时) 03.08
前沿技术及应用课程背景:学习前沿科技新技术,量子科技、元宇宙、数字孪生、结合案例、深入研讨智能化创新制造工业产业发展。课程时间:6小时课程形式:以讲授为主,结合案例分析、互动体验等形式。课程对象:适合学习前沿技术创新转型变革所有相关人员主训导师:马兆林(简介略)课程大纲:人工智能技术与应用机器学习与深入学习文字识别、图像识别、语音识别、视频标注应用NLP/O
讲师:马兆林详情
ITILV4foundation课程内容ITIL是一种全新的、基于流程的IT管理模式,可快速帮助企业IT部门从职能/后勤部门转型为服务部门,并实现规范、精细、可量化的IT管理,提供可保证的IT服务质量。ITIL是ITSM流程中最核心的一组,已有近20年的全球应用历史,并于2005年被批准为国际标准ISO20000。适合对象CIO、IT运维经理、网络管理员;数
讲师:马兆林详情
AI技术及汽车行业应用 03.08
AI技术及汽车行业应用课程背景:人工智能技术拉开新工业革命的序幕,随着机器人技术、语音图像识别技术、专家系统等人工智能技术逐步突破,日臻完善,并以前所未有的广度运用到汽车行业的智能化应用,高度智能化的汽车行业将会以革命性的姿态影响人们的工作和生活,迎来汽车产业大机遇。课程目标:通过人工智能技术体系的介绍以及当前行业内的应用案例,导入数字化意识,激活思维课程时
讲师:马兆林详情
云计算市场趋势研究及商模营销策略变革 02.21
云计算市场趋势研究及商模营销策略-马兆林计算机行业过去十年回顾技术变革推动行业发展计算机行业持续增长,云服务为重要增长动力计算机行业市值持续上升,占比呈现上升趋势计算机行业收入规模及公司数量持续上升计算机行业市场规模不断扩大计算机市场竞争格局:龙头公司随行业发展而变迁云计算商模营销策略变革计算机行业商业模式:从软件向云变迁变化背后的原因:技术变革为计算机行业
讲师:马兆林详情
- [潘文富] 经销商终端建设的基本推进
- [潘文富] 中小企业招聘广告的内容完
- [潘文富] 优化考核方式,减少员工抵
- [潘文富] 厂家心目中的理想化经销商
- [潘文富] 经销商的产品驱动与管理驱
- [王晓楠] 辅警转正方式,定向招录成为
- [王晓楠] 西安老师招聘要求,西安各区
- [王晓楠] 西安中小学教师薪资福利待遇
- [王晓楠] 什么是备案制教师?备案制教
- [王晓楠] 2024年陕西省及西安市最
- 1社会保障基础知识(ppt) 21170
- 2安全生产事故案例分析(ppt) 20254
- 3行政专员岗位职责 19063
- 4品管部岗位职责与任职要求 16233
- 5员工守则 15471
- 6软件验收报告 15410
- 7问卷调查表(范例) 15123
- 8工资发放明细表 14564
- 9文件签收单 14208