大数据分析挖掘与可视化最佳实践培训
大数据分析挖掘与可视化最佳实践培训详细内容
大数据分析挖掘与可视化最佳实践培训
【培训日期】成都,2022年10月28-30日;北京,2022年12月20-22日
【培训地点】成都、北京、直播
【培训重点】
1.数据分析实战
2.数据挖掘理论及核心技术
3.大数据算法原理及案例实现
4.Python应用实战
【培训特色】
1.理论与实践相结合、案例分析与行业应用穿插进行;
2.专家精彩内容解析、学员专题讨论、分组研究;
3.通过全面知识理解、专题技能和实践结合的授课方式。
【课程大纲】
第一天
上午 数据分析实战
第一讲 零基础学Python
讲解Python背景、国内发展状况、基础语法、数据结构及绘图操作等内容。特别针对向量计算这块,着重介绍Python在这方面的优势及用法。
第二讲 数据分析方法论
讲解统计分析基础,包括统计学基本概念,假设检验,置信区间等基础,并结合数据案例说明其使用场景和运用方法。介绍数据分析流程和常见分析思路,并结合案例进行讲解。
第三讲 数据处理技法
从数据接入、数据统计、数据转换等几个方面进行讲解。数据接入包含接入MySQL、Oracle、Hadoop等常见数据库操作;数据统计包含Pandas包的具体用法和讲解;数据转换包含对数据集的关联、合并、重塑等操作。此外,针对海量数据的情况下,介绍在Spark平台上的数据处理技术,并结合真实环境进行操作讲解。
第一天
下午 数据挖掘理论及核心技术
第四讲 认识数据挖掘
讲解数据挖掘基本概念,细致讲解业务理解、数据理解、数据准备、建立模型、模型评估、模型部署各环节的工作内容及相关技术;结合业界经典场景,讲解数据挖掘的实施流程和方法体系。
第五讲 数据挖掘核心技术
细致讲解抽样、分区、样本平衡、特征选择、训练模型、评估模型等数据挖掘核心技术原理,并结合案例讲解其具体实现和用法。尤其针对样本平衡,重点讲解人工合成、代价敏感等算法;针对特征选择,重点讲解特征选择的核心思路,并结合Python进行案例演示。
第二天
上午 大数据算法原理及案例实现(1)
第六讲 特征降维算法及Python实现
降维是大数据分析非常重要的算法,它可以在降低极少信息量的情况下,极大地缩小数据规模。主要讲解主成分、LDA以及t-SNE原理,并结合案例进行Python实现。特别地,针对海量数据情况下的应用场景,讲解实现思路和Python案例。
第七讲 决策树算法及Python实现
决策树是非常经典的算法,一般常见于小数据的挖掘。由于决策树具有极强的可解释性,针对海量数据仍然是非常重要的实用价值。主要讲解ID3、C4.5、C5.0以及CART决策树算法的实现原理,并结合案例进行Python实现。
第八讲 好莱坞百万级影评数据分析与电影推荐实现
实战部分:基于好莱坞百万级的影评数据,对数据进行建模、清洗、透视表操作。然后根据用户画像分析不同的用户喜好通过机器学习算法对不同性别、年龄阶段的用户进行定制化的电影推荐,最后把推荐的电影进行可视化的展示操作
第二天
下午 大数据算法原理及案例实现(2)
第九讲 因果推理算法及Python实现
大数据分析技术可以帮助我们去发现、解决一些业务问题,然而如何去判断我们的改进是否生效,是否在业务指标上呈现过一定的因果逻辑,则是一个重要问题和分析方向。本节主要介绍因果推理算法,包括贝叶斯推理、状态空间模型以及CausalImpact工具等内容,并结合案例进行Python实现。
第十讲 深度学习算法及Python实现
对于大数据的建模任务,我们可以基于深度学习来实现,不仅能够针对海量数据进行建模,其效果也非常不错。本节主要讲解深度学习的发展历程,DBN、DNN等经典深度学习算法,深度学习优化算法以及一些技巧。同时,介绍Keras、OpenCV库的使用方法,并结合案例进行Python实现。
第十一讲 采用OpenCV实现计算机视觉技术
实战部分:基于OpenCV面部模型,完成对图片和视频的人脸识别,实战中会讲解OpenCV的重要类和函数。主要内容包括OpenCV库的安装和部署、图像增强、像素操作、图形分析等各种技术,并且详细介绍了如何处理来自文件或摄像机的视频,以及如何检测和跟踪移动对象。
第三天
上午 Python应用实战(一)
第十二讲 Python自然语言处理原理及案例
目前文档数据已经成为很多企业重要的资产,通过对文档数据进行解析、建模、分析、挖掘、可视化,我们能够发现不一样的洞察。本节主要讲解自然语言处理基本概念和技法,包含分词、关键字提取、文摘提取、文本分类、主题模型、word2vec等内容。介绍在深度学习的加持下,与传统做法的区别,并使用Python进行案例讲解。
第十三讲 数据分析图表及Python案例
数据可视化是大数据分析的重要手段,通过合理地使用图表,不仅可以简洁地表达数据的含义,高效地发现问题,还可以为报告的编写以及数据分析web应用增色不少。本节主要讲解常用的数据分析图表及其使用场景,介绍数据可视化的方法论,避免生搬硬套的使用图表,针对不同的业务场景和需求,合理选择可视化方法。介绍的工具不限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常用可视化库。
第三天
下午 Python应用实战(二)
第十四讲 使用Notebook编写数据分析报告
数据分析报告在大数据分析过程中具有重要价值,它体现了大数据分析的目的、过程和结果,以及对发现问题的解读、改进方案等等,本节主要讲解使用Notebook编写数据分析报告的具体方法,以及编写数据分析报告的方法论,并结合案例讲解其用法。
第十五讲 Seaborn可视化开发实战
Seaborn是一款不错的可视化框架,它和 Pandas一样是建立在 Matplotlib 之上的。可以基于Seaborn快速开发一个轻量级的数据分析web应用。在网页中嵌入图表、数据以及分析的算法,非常适合打造企业内部的敏捷数据分析工具集。本节主要介绍Pie、Scatter、Radar等等各种可视化解决方案,同时讲解一个用Seaborn实现数据分析功能(兼图表)的实际案例,搭建服务器,在企业内部实现轻量级数据分析应用。
【讲师介绍】
刘老师
10多年的IT领域相关技术研究和项目开发工作,在长期软件领域工作过程中,对软件企业运作模式有深入研究,熟悉软件质量保障标准ISO9003和软件过程改进模型CMM/CMMI,在具体项目实施过程中总结经验,有深刻认识。通晓多种软件设计和开发工具。对软件开发整个流程非常熟悉,能根据项目特点定制具体软件过程,并进行项目管理和监控,有很强的软件项目组织管理能力。对C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大数据、云计算有比较深入的理解和应用,具有较强的移动互联网应用需求分析和系统设计能力,熟悉Android框架、IOS框架等技术,了解各种设计模式,能在具体项目中灵活运用。
推荐课程
供应链量化分析与决策 2025-09-02
供应链量化分析与决策-DeepSeek AI 为供应链计划赋能培训时间/地点:2025年6月1718日(星期二 星期三)/上 海2025年9月23日(星期二 星期三)/苏 州2025年11月2021日(星期四 星期五)/成 都收费标准:¥6200/人Ø含授课费、证书费、资料费、午餐费、茶点费、会务费、税费Ø不包含学员往返培训场地的交通费用、住宿费用、早餐...
讲师:肖老师详情
精益领导力和精益思想建设 2025-09-02
培训时间/地点:2025年9月23日(星期二 星期三)/上 海收费标准:¥4500/人Ø含授课费、证书费、资料费、午餐费、茶点费、会务费、税费Ø不包含学员往返培训场地的交通费用、住宿费用、早餐及晚餐课程背景:在当今经济经营进入全面寒冬的时代及工厂运营全面进入降本增效精益生产运营的今天,精益生产作为一种寻找浪费、降低成本提高企业利润,备受全球精益专家们的追捧,...
讲师:白老师详情
卓越服务意识与沟通技巧 2025-09-03
卓越服务意识与沟通技巧线上直播 (宫同昌老师主讲)培训时间:2025年2月26-27日、4月16-17日、5月13-14日、9月3-4日、10月22-23日6课时 14:00-17:00课程背景:如果说顾客是企业的生命,服务则是维持这种生命的血液。纵观世界顶尖企业的发展历程和经营策略,像沃尔玛、麦当劳、IBM、联邦快递、星巴克、迪士尼、花旗银行等,这些公司无...
讲师:宫同昌详情
金字塔原理:逻辑思维与高效表达 2025-09-03
金字塔原理:逻辑思维与高效表达课程概述/Overview课程介绍《金字塔原理》课程的基本原则和思想来源于芭芭拉•明托女士经久不衰的经典畅销商业管理书籍——《金字塔原理》。本课程通过对文章结构性特点的讲解,强化学员表达与思考时的逻辑思维方式,大量的实战体验式演练,从而提高学员表达与思考的能力。基于此,它受到全球众多跨国公司的推崇,也受到广大职场人士和诸多学习者...
讲师:姜老师详情
设备精益管理-5大技能提升 2025-09-03
培训时间/地点:2025年7月2122日(星期一 星期二)/苏 州2025年9月34日(星期三 星期四)/成 都2025年12月12日(星期一 星期二)/上 海收费标准:¥4000/人Ø含授课费、证书费、资料费、午餐费、茶点费、会务费、税费Ø不包含学员往返培训场地的交通费用、住宿费用、早餐及晚餐课程目标:结合专家多年企业管理实务经验,借用互联网思维与大数...
讲师:唐老师详情
AI提效:HR工作效能跃升实战 2025-09-04
《AI提效:HR工作效能跃升实战》费用: 2980元/ 人(差旅费用请自理)【课程背景】人工智能(AI)正逐渐渗透到各个行业和日常生活中,大大提高了我们的生产力和创新能力。本课程旨在引领您全面了解人工智能的基础知识,掌握其在办公、HR管理和实际应用中的技巧,并展望未来发展趋势。通过系统学习,学员将深入了解AI的定义、发展现状、基本原理及其工作机制,掌握包括机...
讲师:青锋详情
AI造课—企业内训师极速课程开发 2025-09-04
AI造课—企业内训师极速课程开发课程费用:2980元/人 (含培训费、教材费、场地费、午餐、茶歇费及税金)参训对象:企业内训师、培训管理者、企业兼职讲师、HRBP、经常分享的岗位专家等课程地点:上海课程时间: 2天第一期第二期第三期4月16-17日9月4-5日12月4-5日课程背景:随着企业内训的不断发展,内训师们需要不断地开发新的课程来满足企业的需求。然...
讲师:布谷学长详情
DFMEA 研发失效模式与影响分析 2025-09-04
培训时间/地点:2025年3月1314日(星期四 星期五)/苏州2025年9月45日(星期四 星期五)/上 海收费标准:¥4000/人含授课费、证书费、资料费、午餐费、茶点费、会务费、税费不包含学员往返培训场地的交通费用、住宿费用、早餐及晚餐课程介绍:以AIAG-VDA FMEA手册为基础,系统地讲解DFMEA的信息流、内容、要求、实施步骤和方法,帮助学员了...
讲师:沈老师详情
阿里巴巴销售铁军管理实战营 2025-09-04
阿里巴巴销售铁军管理实战营课程背景以下企业痛点您是否感同身受?带兵打仗没有章法;业绩增长没有抓手;团队成员没有激情;培养人才没有方法。“阿里巴巴销售铁军”是中国互联网史上最彪悍、最勇猛、最具阿里味的团队,在阿里早期,用汗水磕下每一位客户,为阿里的发展奠定了坚厚的基础,被马云评价为“最有阿里味儿”的一群人。6年时间,从零开始,一年做到每天营收100万,两年做到...
讲师:韦老师详情
企业绩效考核与薪酬体系设计实战特训班 2025-09-04
企业绩效考核与薪酬体系设计实战特训班培训时间: 25年4月24-25日 25年9月4-5日 北京培训费用: 4680元/人(含培训费、教材费、午餐费、茶点费等)培训对象:企、事业单位董事长、总经理、人力资源总监、人力资源经理以及各部门经理及薪酬、岗位和绩效相关管理人员等。课程背景:现代企业管理,更注重“以人为本”的人性化管理模式,企业管理的重点也日趋体现在对...
讲师:蔡巍详情
- [潘文富]引进非酒类商品之前的铺垫
- [潘文富]大客户的非酒型维护
- [潘文富]烟酒店,从服务大客户到服
- [潘文富]烟酒店别指望大客户了,扎
- [潘文富]酒商当前的应急措施十一条
- [王晓楠]辅警转正方式,定向招录成为
- [王晓楠]西安老师招聘要求,西安各区
- [王晓楠]西安中小学教师薪资福利待遇
- [王晓楠]什么是备案制教师?备案制教
- [王晓楠]2024年陕西省及西安市最







