《大数据的机器学习方法》
《大数据的机器学习方法》 详细内容
《大数据的机器学习方法》
《大数据的机器学习方法》
段方
北京大学 博士后
1 背景
1.1 数据驱动还是应用驱动?
1.2 应用价值的显现化
1.3 对内服务和对外服务
1.4 建设应用的生态圈
2 大数据应用开发方法
2.1 CRISP-DM (CRoss-Industry Standard Process for Data Mining)方法论
2.2 业务理解 (Business Understanding)
2.3 数据理解 (Data Understanding)
2.4 数据准备 (Data Preparation)
2.5 建模(Modeling)
2.6 评估(Evaluation)
2.7 部署 (Deployment)
2.8 数据挖掘之外的方法论
2.9 【案例】 电信行业外来工识别及营销
3 大数据的互联网思维
3.1 互联网思维概述
3.2 用户思维
3.2.1 用户是谁
3.2.2 用户需要什么?
3.3 极致思维
3.3.1 产品极致设计
3.3.2 服务的极致
3.4 简约思维
3.4.1 产品的简约
3.4.2 简约的流程
3.5 迭代思维
3.5.1 产品的快速迭代
3.5.2 开发过程的快速迭代
3.6 流量思维
3.6.1 现有客户再有钱
3.6.2 扩展客户使用流量
3.7 平台思维
3.7.1 APP store 的借鉴
3.7.2 生态圈的构筑
3.8 跨界思维
3.8.1 数据的跨界 3.8.2 应用的跨界 3.9 数据思维
3.9.1 收集数据 3.9.2 分析数据 3.10 社会化思维 3.10.1 影响社会
3.10.2 社会角度思考
3.11 互联网思维在大数据系统中的落地
4 机器学习基础
4.1 多维分析方法
4.1.1 OLAP 分析
4.1.2 上钻和下钻
4.1.3 用 OLAP 分析问题
4.2 分析算法
4.2.1 回归算法
线性回归
逻辑回归
4.2.2 决策树算法
C4.5 算法 CART 算法
4.2.3 贝叶斯算法
朴素贝叶斯算法
BBN(Bayesian Belief Network)算法
4.2.4 基于核的算法
支持向量机 SVM 算法
线性判别分析(Linear Discriminate Analysis , LDA)
4.2.5 聚类算法
K-MEANS 算法
期望最大化算法(Expectation Maximization, ME)
4.2.6 关联规则算法
Apriori 算法
4.2.7 降低维度算法
主成份分析(Principle Component Analysis, PCA)算法
偏最小二乘回归(Partial Least Square Regression, PLS)算法
4.2.8 集成算法
随机森林算法 梯度推进机
4.3 【案例】 机器学习方法在电信行业应用案例汇编
5 大数据机器学习过程
5.1 需求的收集、整理
5.1.1 需求的收集方
5.1.2 需求的表述方法
5.2 数据的收集
5.2.1 能收集哪些数据
5.2.2 数据的维度
5.2.3 数据的质量
5.2.4 数据的管理
5.3 分析方法的选择
5.3.1 统计分析方法
5.3.2 OLAP 分析
5.3.3 数据挖掘方法
5.4 应用开发原型
5.4.1 原型系统的开发
5.4.2 原型系统的评估
5.5 应用的上线
5.5.1 谁负责使用
5.5.2 谁负责验收
5.6 快速迭代开发
5.6.1 如何快速迭代
5.6.2 迭代后的上线
5.7 上线后评估
5.7.1 客户满意度
5.7.2 效率提升
5.7.3 效益评估等
5.8 效益的评估方法
5.8.1 经济效益
5.8.2 社会效益
5.8.3 管理效益等
6 数据分析工具
6.1 Cognos
6.2 BRIO
6.3 SAS
6.4 SPSS
6.5 R 语言
7 大数据机器学习案例
7.1 【案例 1】客户离网分析案例
7.2 【案例 2】 客户群体细分及营销
7.3 【案例 3】 4G 业务营销案例
7.4 【案例 4】 电信网络智慧运维案例
7.5 【案例5】 人工智能技术在电信领域中应用案例
8 总结
段方老师的其它课程
中国广电5G运营策略 04.24
=============================================================《中国广电5G运营策略》——段方中国移动资深专家教授北京大学博士后=============================================================15G发展概述1.15G概述1.25G技术特征1.
讲师:段方详情
人工智能基础及应用培训 04.24
=============================================================《人工智能基础及应用培训》-段方某世界100强大数据/AI总设计师教授北京大学博士后=============================================================202916811801概述--
讲师:段方详情
数据安全技术 04.24
《数据安全技术》-段方某世界100强企业大数据总设计师教授北京大学博士后1概述1.1信息安全的概念及范围1.1.1概述1.1.2信息系统潜在威胁被动攻击主动攻击黑客攻击手法1.1.3信息安全技术概览1.1.4信息安全注重体系安全防护检测响应恢复1.2信息安全等级分类1.2.1分级的概念1.2.2分级保护涉及的标准1.2.3职责和角色1.2.4企业信息等级选择
讲师:段方详情
数据管理及数仓建模 04.24
=============================================================《数据管理及数仓建模》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465791461概述---
讲师:段方详情
数智化发展及运用案例分析 04.24
=============================================================《数智化发展及运用案例分析》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================23704858471概念
讲师:段方详情
数字经济时代内部审计实战技能提升 04.24
=============================================================《数字经济时代内部审计实战技能提升》——段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465791
讲师:段方详情
铁路行业的数字化转型 04.24
=============================================================《铁路行业的数字化转型》——段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465762131为什么
讲师:段方详情
信息技术的国产化发展与展望 04.24
《信息技术的国产化发展与展望》-段方总设计师教授北京大学博士后1概述1.1信息技术的发展概况1.2盗版软件的双刃剑1.3美国为何在信息技术领域对中国进行限制1.4中国如何选择应对的方法?2信息技术国产化现状2.1操作系统方面2.2芯片方面2.3数据系统方面2.4工业软件方面2.5应用软件方面2.6互联网软件方面2.7计算机板卡方面2.8服务器方面2.9云计算
讲师:段方详情
银行业与中国科技强国战略的融合与创新 04.24
《银行业与中国科技强国战略的融合与创新》——段方某世界100强企业AI/大数据总设计师教授、北京大学博士后【课程目的】:本课程旨在深化学员对中国科技强国战略的理解,并探讨银行业如何利用新兴科技助力战略实施,促进业务创新和转型升级。通过系统学习,学员将能够识别并应对金融科技发展的趋势和挑战,为银行业的可持续发展提供战略支持。【课程提纲】:I.引言A.银行业与科
讲师:段方详情
- [潘文富] 中小企业招聘广告的内容完
- [潘文富] 优化考核方式,减少员工抵
- [潘文富] 厂家心目中的理想化经销商
- [潘文富] 经销商的产品驱动与管理驱
- [潘文富] 消费行为的背后
- [王晓楠] 辅警转正方式,定向招录成为
- [王晓楠] 西安老师招聘要求,西安各区
- [王晓楠] 西安中小学教师薪资福利待遇
- [王晓楠] 什么是备案制教师?备案制教
- [王晓楠] 2024年陕西省及西安市最
- 1社会保障基础知识(ppt) 21151
- 2安全生产事故案例分析(ppt) 20189
- 3行政专员岗位职责 19036
- 4品管部岗位职责与任职要求 16210
- 5员工守则 15449
- 6软件验收报告 15385
- 7问卷调查表(范例) 15104
- 8工资发放明细表 14541
- 9文件签收单 14184