计算机视觉的深度学习实践

  培训讲师:叶梓

讲师背景:
叶梓老师叶梓,工学博士,高级工程师。现某大型上市企业资深技术专家。2005年上海交通大学计算机专业博士毕业,在校期间的主研方向为数据挖掘、机器学习、人工智能。毕业后即进入软件行业从事信息化技术相关工作;负责或参与了多项、省市级人工智能及大数 详细>>

叶梓
    课程咨询电话:

计算机视觉的深度学习实践详细内容

计算机视觉的深度学习实践

计算机视觉的深度学习实践
【课程时长】
3天(6小时/天)
【课程简介】
在所有人工智能的应用方向上,计算机视觉/机器视觉图像处理的落地应用最为成熟,近两年的技术发展是最为迅猛。
互联网巨头为代表的企业正在开展如:基于识别的智能机器人,无人驾驶,人脸识别、图像搜索,图像处理,游戏界面等;专门从事视觉、图像处理的新兴公司正在发力于人脸识别,检测,跟踪,安防等领域。只有对计算机视觉这个领域有了一个初步的全面了解才能在这些领域进行研究,一步步深入下去。
【课程目标】
计算机视觉领域的重点研究问题。由浅入深得 讲解数字图像的存储、预处理、特征提取,以及在深度学习兴起之前计算机视觉领域所取得的成就。
专门介绍深度学习的基础理论知识,包括神经 网络的基本原理,以及深度学习对于传统神经 网络的关键改进。
重点介绍深度学习模型在计算机视觉领域的应用。具体涉及在计算机视觉领域如何应用卷积 神经网络(CNN)、区域卷积网络(R-CNN) 全卷积网络(FCN)、循环神经网络(RNN)、 长短时记忆单元(LSTM)、生成对抗网络 (GAN)等解决图像应用的难点 课程将使用Python语言及Tensorflow、Keras 深度学习框架等进行案例实践教学。【讲师介绍】
叶梓,博士、高级工程师。2005年上海交通大学计算机专业博士毕业,主研方向为数据挖掘、机器学习、人工智能等。现为某大型上市软件企业的人工智能团队技术负责人。曾主持多项国家战略级人工智能项目,主持设计并搭建多个市级大数据平台,在大数据人工智能应用等方面有着丰富的工程实践经验。先后在SCI或EI期刊上发表论文4篇,在中文核心期刊上发表论文近20篇,并被百度学术收录。2011年获中国行业协会科技创新一等奖。
第一讲 课程概述
1、计算机视觉的研究意义
2、计算机视觉的难点
3、当前研究的主要热点问题(分类、目标检测、实例分割、图说等)
4、本课程的主要内容介绍
5、相关开源库介绍(OpenCV、Tensorflow、Keras、pyTorch等)
6、应用案例:搭建tensorflow+opencv的环境
第二讲 图像预处理
1、图像平滑与去噪(高斯滤波、中值滤波等)
2、基于直方图的对比度增强:CLAHE
3、边缘检测算子(Sobel、拉普拉斯等)
4、形态学处理(腐蚀、膨胀、开闭运算等)
5、高斯金字塔与拉普拉斯金字塔
6、频域分析及变换(卷积计算、傅里叶变换、小波变换)
7、应用案例:平滑、边缘检测、CLAHE、FFT等
第三讲 图像特征提取
1、颜色特征(量化直方图、聚类直方图)
2、几何特征(Edge、Corner、Blob等)
3、Harris角点与FAST角点
4、基于关键点的特征描述子(SIFT、SURF、ORB)
5、其他特征提取(LBP、Gabor)
6、应用案例:SIFT、图像拼接等
第四讲 未有深度学习之前
1、基于灰度的图像分割(阈值分割、区域生长、分水岭等)
2、基于图论:graph-cut与grab-cut
3、用于人脸检测的Haar-like特征与级联分类器
4、用于行人检测的HOG+SVM
5、用于行人检测的多尺度形变部件模型(DPM)
6、应用案例:人脸识别、行人识别
第五讲 神经网络与误差反向传播算法
1、人工神经元及感知机模型
2、目标函数(MSE)
3、激励函数(sigmoid、tanh)
4、误差反向传播算法的推导
5、应用案例:可以手算的BP神经网络
6、深度学习与神经网络的区别与联系
第六讲 深度学习基础
1、深度学习中的目标函数与激励函数
2、深度学习中的求解方法(Adagrad、RMSprop、Adam等)
3、深度学习中的技巧(dropout、BN、weights decay等)
4、应用案例:利用tensorflow实现的手写数字识别
5、卷积神经网络介绍
6、卷积层的误差反向传播
7、池化层的误差反向传播
第七讲 图像分类
1、竞赛中的分类问题
2、CNN的发展概述
3、开山之作:AlexNet4、5层变为5组:VGG
5、组合所有可能的模型:GoogLeNet6、残差网络:ResNet7、深与宽之外的改进方向:ResNext6、应用案例:VGG、ResNet第八讲 图像检索
1、检索特征(基于颜色,纹理,形状,局部特征)
2、特征相似度度量(EMD)
3、建立基于深度学习的检索索引
4、知识点:迁移学习的一种实现(fine-tune)
5、索引加速:KD-tree
6、大数据条件下的索引加速:Locality Sensitive Hash
7、应用案例:CBIR的应用
第九讲 目标检测(上)
1、目标检测任务概述
2、区域卷积神经网络:R-CNN
3、共享卷积层与多尺度:SPP-Net
4、多任务的目标函数:Fast R-CNN
5、SS改成RPN:Faster R-CNN
6、其他数据集介绍:行人检测、人脸检测
7、应用案例:Faster R-CNN
第十讲 目标检测(下)
1、之前方法的总结
2、ROI-wise子网继续共享:R-FCN
3、回归解决一切:YOLO v1
4、八大改进:YOLO v2
5、构建语义树:YOLO 9000
6、多尺度预测:YOLO v3
7、应用案例:Darknet实现的YOLO
第十一讲 通用场景下的图像分割
1、语义分割
2、全卷积网络语义分割:FCN
3、知识点:反卷积、转置卷积与空洞(膨胀)卷积
4、DeepLab v1(含CRF)
5、DeepLab v2(多尺度)
6、DeepLab v3与v3+(多尺度级联)
7、PASCAL VOC、MS COCO、Cityscapes等数据集介绍
8、应用案例:DeepLab、denseCRF第十二讲 医疗影像分割
1、医学影像分析任务概述与数据集
2、U-Net
3、3D U-NET与V-Net
4、FC-DenseNet5、病理切片分析任务概述与数据集6、病理切片分析的实现
7、应用案例:利用U-Net实现的器官分割
第十三讲 图像描述(图说)
1、深度学习的语言模型(RNN)
2、知识点介绍;LSTM与GRU
3、图说模型原理与结构
4、模型增强:注意力机制
5、图说效果的评判标准
6、数据集介绍(MS COCO, Flickr等)
7、应用案例:RNN简单示例,图像描述:show and Tell
第十四讲 图像生成
1、变分自编码器(VAE)
2、生成对抗网络(GAN)
3、知识点:KL散度与JS散度
4、改进的GAN:DCGAN
5、从根本上解决训练的困难:Wasserstein GAN
6、超分辨率问题:SRGAN
7、应用案例:GAN与DCGAN等

 

叶梓老师的其它课程

知识图谱的Python实现【课程简介】本课程包含知识图谱的基本概念及常用算法,并实现了一个基于知识图谱的对话机器人。通过1天的系统学习、案例讲解和动手实践,让学员能初步了解知识图谱的的相关知识与技术。【课程对象】理工科本科以上,或至少了解一种编程语言。知识图谱基础知识图谱存储知识图谱基础概念知识推理本体推理方法本体推理工具语义搜索RDF与RDFSOWL与OW

 讲师:叶梓详情


智能医疗技术与ChatGPT临床应用三日深度培训第一天:人工智能基础与Python编程入门上午:人工智能在医疗领域的应用概述Python编程基础环境搭建、数据类型、流程控制Python环境搭建Python数据类型与流程控制Python函数的应用Python面向对象编程 文件读写和目录操作异常处理机器学习概述数据探索性分析:智能化数据分析特征工程:数据准备、数

 讲师:叶梓详情


人工智能“最强模型”transformer详解【课程简介】Transformer是迄今为止人工智能领域的最新和最强大的模型类别之一。它几乎正在凭借一己之力来推动深度学习的又一波重大进步。Transformer模型充分运用了称为注意力和自注意力机制,以检测系列(或图像)中元素相互影响和相互依赖的微妙关系。本课程通过2天时间的详细介绍,可使学习者初步了解Tran

 讲师:叶梓详情


||1.人工智能概述||第一节:人工智能与机器学习基础|2.机器学习概述|||3.机器学习算法应用分析|||1.一元线性回归|||2.代价函数|||3.梯度下降法||第二节:回归算法|4.sklearn一元线性回归应用|||5.多元线性回归|||6.sklearn多元线性回归应用|||案例:葡萄酒质量和时间的关系|||1.KNN分类算法介绍|||2.KNN分

 讲师:叶梓详情


人工智能技术详解【课程内容】本课程包含大数据、机器学习、深度学习、知识图谱、强化学习与深度强化学习的相关知识。【课程时长】7天(7小时/天)【课程对象】理工科本科及以上,且至少了解一门编程语言。【课程大纲】(培训内容可根据客户需求调整)时间内容案例实践与练习Day1上午准备工作准备工作1.概念与术语2.Python(Anaconda)的安装3.Pycharm

 讲师:叶梓详情


人工智能与深度学习第一天:人工智能概念与经典算法人工智能概念综述(第一天——1)从一些术语辨析人工智能人工智能之连接主义的兴衰史这次AI的热潮是怎么来的?图像处理领域的最新热点(第一天——2)分类、目标检测与实例分割风格迁移自动驾驶人体姿态识别超分辨率图像生成语言处理领域的最新热点(第一天——3)Attention机制自动构建知识图谱看图说话预训练机制三大经

 讲师:叶梓详情


人工智能之最新自然语言处理技术与实战课程介绍:自然语言处理(简称NLP)是计算机科学和人工智能研究的一个重要方向,研究计算机和理解和运用人类语言进行交互的问题,它是集语言学、机器学习、统计学、大数据于一体的综合学科。本课程主要介绍了NLP中的常用知识点:分词、词法分析、句法分析、向量化方法、经典的NLP机器学习算法,还重点介绍了NLP中最近两年来基于大规模语

 讲师:叶梓详情


第一天上午:统计分析原理从最简单的案例开始统计基础描述性统计用SPSS实现描述性统计的案例回归分析:线性回归回归分析:logistics回归用SPSS实现回归分析的案例可视化工具第一天下午:数据库与数据仓库介绍数据库概述SQL(基本的增、删、改、查)SQL(稍复杂的子句或嵌套)基于MySQL的上机操作SQL语言数据仓库:度量与维度数据仓库:星型模型、雪花模型

 讲师:叶梓详情


计算机视觉【课程时长】3天(7小时/天)【课程对象】理工科本科及以上,且至少了解一门编程语言。【课程大纲】(培训内容可根据客户需求调整)时间内容案例实践与练习Day1上午准备工作准备工作决策树准备工作(1)概念与术语Python(Anaconda)的安装Pycharm的安装与使用JupyterNotebook的安装与使用Tensorflow与pytorch的

 讲师:叶梓详情


计算机视觉【课程简介】本课程包含计算机视觉领域的的重要概念及常用算法(神经网络、支持向量机、CNN、GAN等),以及人工智能领域热点应用场景:目标检测、图像分割、图像生成等。通过2天的系统学习、案例讲解和动手实践,让学员能初步迈入深度学习和计算视觉的知识殿堂。【课程收益】掌握基于python的视觉分析知识;掌握深度学习框架:TensorFlow、pytorc

 讲师:叶梓详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有