Python课程

  培训讲师:尹传亮

讲师背景:
尹传亮——平安金融高级工程师10年以上的IT工作经验,研发出身,在产品设计,项目管理均有着丰富的实战经验。14-15年,作为产品经理,参与公司爬虫系统设计。15-16年,作为项目负责人,带队在华为实施爬虫项目,并在期间打磨爬虫系统,数据爬取 详细>>

尹传亮
    课程咨询电话:

Python课程详细内容

Python课程

Python课程一、数据挖掘导论
数据挖掘的基本任务与步骤:目标、数据探索、数据预处理、建模、模型评价
有监督学习
无监督学习和半监督学习算法模型
Sklean 数据挖掘和机器学习算法库介绍
大数据建模常见问题
问题引出:客户行为分析-用户用电异常的识别
二、Python 编程快速入门
Python 编程环境与语法快速入门
基础数据结构:字符串处理及应用
数据结构:列表、元组、集合、字典
Python 控制流:IF 与 while、for 循环
函数与模块定义
Python 文件读写
Python 面向对象编程思想
Python 异常处理
实验:
—— 读写 CSV 文件
—— 处理 Excel 文件
三、Python 数据分析进阶
Python 并行编程:多线程与多进程实现
—— 进程与线程概念
—— 进程同步机制
—— 多进程实现
—— 多线程实现
轻松访问数据库
—— 连接访问 Sqlite
—— 操纵 MySQL
—— Python 的对象关系映射模型
实验:
—— 多进程读取超大文件
—— SQLite 读写练习南京•杭州•上海
五、Scikit-learn 数据预处理实践
数据统计量:期望/方差/偏度/峰度
协方差和相关系数、方差与标准差
数据描述:集中趋势、离散程度、分位数
数据可视化:直方图、盒图、散点图
数据预处理基本方法
数据归一化方法
对数据进行降维,主成分分析 PCA
实验:
—— 利用随机森林做特征筛选
—— 数据预处理:归一化、缺失值处理
—— 降维 PCA 实现
—— 找出较好的特征组合:PCA 与 LDA 效果对比
—— 随机森林评估特征重要性
四、Python 数据分析进阶
 高性能矩阵计算工具 Numpy:
—— Numpy 数组与元素索引、
—— 矩阵计算、
—— 通用函数、计算统计量
 以表格处理数据——高级数据分析包
—— Pandas:数据框架 Dataframe
—— 快速索引数据
—— 常用函数
—— 快速可视化分析
—— 汇总与统计
实验:基于 Pandas 的数据预处理
五、数据可视化分析

Matplotlib 绘图库介绍
快速绘图
常见绘图函数:散点图、柱状图、盒图
图片处理
三维绘图演示
Pandas 快速绘图南京•杭州•上海
实验:
—— 绘制常见统计图
—— 利用 Pandas 获取数据并绘图
七、Scikit-Learn 数据挖掘实践 1
数值预测:Logistic/Softmax 回归/随机森林
梯度下降算法:BGD 与 SGD 介绍
Sklean 决策树算法实现: ID3、C4.5、CART 决策树算法
用 Bagging 改善分类性能
随机森林方法
决策树用于分析挖掘的建模实现和决策树的评估
Sklean 决策树算法应用编程
实验:
—— 用随机森林预测数值
—— 决策树编程演示
—— 决策树分析客户数据
八、 Scikit-Learn 数据挖掘实践 2:支持向量机 SVM
线性可分软间隔 SVM
损失函数的理解
支持向量回归 SVR
不平衡数据集的处理
分类器性能评价
支持向量机的参数调优
分类器性能评价
实验:
—— 银行信贷客户分类
—— Grid 法调参
—— 不平衡分布对性能的影响
—— 交叉验证
—— 多分类器性能比较:ROC 曲线
—— 问题讨论:用电异常行为识别
六、无监督学习:Scikit-Learn 聚类分析
Jaccard 相似度
Pearson 相关系数与余弦相似度南京•杭州•上海
层次聚类
K-means 聚类
半监督 AP 聚类算法及其应用
密度聚类 DBSCAN
聚类评价和结果指标
实验:
—— K-Means 算法原理和实现
—— 密度聚类
—— 比较不同的聚类算法
—— 问题讨论:客户分级
九、神经网络实践
神经网络基本原理
浅层神经网络与深层网络分析
神经网络用于数值预测
神经网络用于分类
Scikit-Learn 神经网络实现
案例分享:阿里云天池赛电力 AI:预测用电量
十七、Python 数据挖掘项目实践
根据客户数据集特点,完成数据的预处理、特征筛选
客户流失问题建模与分类
客户分级建模
解决方案讨论
大数据挖掘技术的发展
案例分享:用户画像
需新增重点内容:
基于阿里MAXCOMPUTE的相关PYTHON函数学习
多增加PYTHON机器学习的实验课
大数据应用解决实践方法及案例

 

尹传亮老师的其它课程

Python机器学习算法实战【课程目标】本课程为高级课程,专注于机器学习算法,原理,以及算法实现及优化。通过本课程的学习,达到如下目的:熟悉常见的机器学习的算法。掌握机器学习的算法原理,以及数据推导。学会使用Python来实现机器学习算法,以及优化算法。掌握scikit-learn扩展库来实现机器学习算法。【授课时间】2-3天时间【授课对象】IT系统部、大数

 讲师:尹传亮详情


Python开发语言基础实战培训【课程目标】Python已经成为稳居前三的最受欢迎的语言之一,它简单易用、跨平台、功能强大、扩展性强,而且能够将其它语言编写的程序融合起来,实现无缝连接,号称是万能胶水语言。本课程为Python语言基础学习,通过本课程的学习,达到如下目的:全面掌握Python语言以及其编程思想。掌握Python基本格式,以及常用的6种基本语句

 讲师:尹传亮详情


Python实现大数据挖掘技术培训【课程目标】Python已经成为数据分析和数据挖掘的首选语言,作为除了Java、C/C++/C#外最受欢迎的语言。本课程基于Python工具来实现大数据的数据分析和数据挖掘项目。基于业务问题,在数据挖掘标准过程指导下,采用Python分析工具,实现数据挖掘项目的每一步操作,从数据预处理、数据建模、数据可视化,到最终数据挖掘结

 讲师:尹传亮详情


Python运用   06.19

PYTHON数据分析第一模块:python语言基础知识0.5H1.python简介2.python的特征3.第一个python程序4.搭建开发环境5.python的开发工具6.不同平台下的python第二模块:Python的基本语法2H1.Python的文件类型2.Python的编码规则3.变量和常量4.数据类型5.运算符与表达式第三模块:python的控制

 讲师:尹传亮详情


大数据变革与商业模式创新【课程目标】大数据时代已经来临,大数据战略已经上升到国家意志,拥有大数据的规模和利用大数据的能力已经成为国家竞争力的一种体现,大数据的重要性已经毋庸置疑。本课程围绕大数据产业,从大数据的基本面出发,分析大数据的应用价值;大数据作为工具,如何帮助企业提升运营效率,提升企业利润;再到大数据引起的思维变革,怎样改变企业管理、社会治理的思维;

 讲师:尹传亮详情


大数据时代的精准营销【课程目标】本课程从实际的市场营销问题出发,了解大数据在市场营销领域的价值以及应用。并对大数据分析与挖掘技术进行了介绍,通过从大量的市场营销数据中分析潜在的客户特征,挖掘客户行为特点,实现精准营销,帮助市场营销团队深入理解业务运作,支持业务策略制定以及营销决策。通过本课程的学习,达到如下目的:了解大数据营销内容,掌握大数据在营销中的应用。

 讲师:尹传亮详情


大数据挖掘工具:SPSSStatistics入门与提高【课程目标】随着大数据分析的需求越来越旺盛,大数据分析工具也越来越琳琅满目,然而,绝大多数的分析工具都只具有单一用途,无法满足企业的复杂的多样化的全面的业务分析需求,因此分析工具的选择成为了一个挑战。一个良好的分析工具必须满足如下要求:易学易用易操作。分析效率要高。满足业务分析需求。如果要说前两个要求,显

 讲师:尹传亮详情


数据分析与建模第一章数据分析与大数据平台1.大数据相关概念2.大数据特征3.大数据平台简介第二章数据分析流程1.数据分析2.数据分析工具3.数据分析流程4.典型模型场景第三章重要的python库1.NumPy2.pandas3.matplotlib4.IPython与Jupyter5.SciPy6.scikit-learn7statsmodels第4章Num

 讲师:尹传亮详情


Hadoop大数据解决方案平台技术培训【课程目标】Hadoop作为开源的云计算平台,为大数据处理提供了一整套解决方案,应用非常广泛。Hadoop作为一个平台框架,包括了如何存储海量数据,如何处理海量数据,以及相应的数据库、数据仓库、数据流处理、数据分析和挖掘算法库,等等。本课程主要介绍Hadoop的思想、原理,以及重要技术等相关知识。通过本课程的学习,达到如

 讲师:尹传亮详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有