《自然语言处理实战》

  培训讲师:段方

讲师背景:
段方专业背景:曾在中国银行工作现任某集团总部大数据专家、数据仓库项目经理多家培训机构及大学总裁班特邀讲师十几年专注于大数据的研究与推广积累了15年的大数据领域的实际工作经验。带领相关的团队,从系统创建到系统运营,开发了很多大数据领域的各种应 详细>>

段方
    课程咨询电话:

《自然语言处理实战》详细内容

《自然语言处理实战》

《自然语言处理实战》
——段方
大数据(分析) 总设计师
教授 北京大学博士后
1 自然语言处理概述
1.1 什么是自然语言处理(NLP)
1.2 NLP 的发展历史
1.2.1 1956 年以前的萌芽期
1.2.2 1957-1970 年的快速发展期
1.2.3 1971-1993 年的低谷期
1.2.4 1994 年至今的复苏其
1.3 NLP 发展的原因
1.3.1 互联网提供了大量的语料库
1.3.2 深度学习算法提升了精度
1.3.3 场景更加丰富
1.4 NLP 的价值
1.4.1 语言是信息的载体
1.4.2 构建人机自然交互接口
1.4.3 语言翻译、信息检索等价值凸显
1.4.4 市场规模巨大
1.5 自然语言处理的典型应用
1.5.1 机器翻译
1.5.2 自动摘要
1.5.3 文本分类与信息过滤
1.5.4 信息检索
1.5.5 自动问答
1.5.6 信息抽取与文本挖掘
1.5.7 情感分析
1.6 机器翻译
1.6.1 文本机器翻译
1.6.2 语音机器翻译
1.7 自动摘要
1.7.1 单文档摘要
1.7.2 多文档摘要
1.8 信息检索
1.8.1 基本概念
1.8.2 搜索引擎
1.8.3 【例】谷歌搜索引擎算法
1.9 自动问答
1.9.1 基于知识图谱的问答系统
1.9.2 BERT 算法
1.10 NLP 产品举例
1.10.1 Google translate
1.10.2 Bing translate
1.10.3 语音输入法
1.10.4 Siri 问答
1.11 【例】 NLP 在(电信) 客服中的应用
1.11.1 部分替代人工
1.11.2 解决部分业务问题
1.11.3 中国移动的例子
1.12 【例】微软小冰的问答原理
2 自然语言处理的基本任务
2.1 语言分析
2.2 词法分析
2.3 句法分析
2.4 语义分析
2.5 语言生成
2.6 多语言处理(机器翻译、跨语言检索)
2.7 NLP 在各个行业的应用
2.7.1 教育
2.7.2 医疗
2.7.3 金融
2.7.4 法律等
2.8 【例】分词工具——结巴、 NLPIR 、 IKAnalyzer(开源)
2.9 【例】附件-IBM 沃森介绍
3 自然语言处理的基本策略和实现方法
3.1 基于规则的理性方法
3.2 基于语料库的经验方法
3.3 混合方法
3.4 自然语言的分类
3.5 自然语言处理的难点
3.5.1 汉语处理的难点
3.5.2 自然语言处理涉及的学科
3.6 【附】阿里小蜜的例子
4 基于规则的自然语言处理方法
4.1 概述
4.2 词法分析
4.3 形态还原(英语)
4.3.1 形态还原算法
4.3.2 英语词的分类
4.4 词性标注/体系
4.4.1 词性标注方法
4.5 汉语分词
4.5.1 切分歧义及歧义字段的种类
4.6 分词方法
4.6.1 基于词库
4.7 句法分析
4.7.1 基于上下文无关语法(CFG) 的表示
4.7.2 基于 CFG 算法及过程
4.7.3 搜索策略
4.7.4 自顶向下句法分析
4.7.5 自底向上句法分析
chart parsing
4.7.6 句法分析与逻辑程序设计
4.7.7 传统 CFG 在描述自然语言的问题
4.7.8 基于特征的扩展 CFG
合一文法
合一运算
chart parsing 举例
4.8 语义分析
4.8.1 词汇语义
4.8.2 语义类
4.8.3 词义间关系
4.9 句义分析
4.9.1 句义表示与语义组合
4.9.2 论旨角色与格语法
4.9.3 格语法
4.9.4 基于格语法的语义分析
4.10 【例】附件-Siri 的介绍
5 机器翻译
5.1 机器翻译的历史
5.2 机器翻译的基本策略
5.3 机器翻译的实现方法
5.4 基于规则的机器翻译
5.4.1 基于词的转换翻译
5.4.2 基于句法结构转换的翻译
5.4.3 基于语义转换的翻译
5.4.4 基于中间语言的翻译
5.4.5 机器翻译的现状
5.5 基于语料库的机器翻译
5.5.1 基于实例的方法
5.5.2 基于统计的方法
5.5.3 基于神经网络的方法
5.6 混合法机器翻译
5.6.1 基于规则与语料库结合起来
5.7 【例】附件-科大讯飞的 NLP 产品
6 基于深度学习方法的 NLP
6.1 深度学习算法简介
6.2 词向量模型
6.2.1 原理
6.2.2 Word2vec
6.2.3 ELMo
6.2.4 OpenAI GPT
6.3 BERT 词向量模型
6.4 信息抽取
6.4.1 实体识别与抽取
隐马尔可夫模型 HMM
最大熵马尔可夫模型 MEMM 条件随机场算法 CRF
6.4.2 开放式实体抽取
6.4.3 命名实体消歧
6.4.4 关系抽取
传统方法
基于特征向量 基于核函数
基于神经网络
6.5 情感分析
6.5.1 情感分析的层次
6.5.2 句子级
6.5.3 词语级
6.5.4 情感信息抽取
6.5.5 情感分析的方法
6.6 语义分析
6.6.1 词汇级语义分析
6.6.2 词义消歧
基于规则 基于词典
6.6.3 词汇级语义分析
有监督
无监督
6.6.4 句子级语义分析
句义分析
句子语义相似度分析
6.7 【例】附件-NLP 的调用工具(百度等)
7 自然语言处理的未来发展
7.1 下一代信息检索
7.1.1 当前搜索引擎的问题
7.1.2 垂直搜索
7.1.3 智能搜索
7.1.4 个性化搜索
7.1.5 跨语言信息检索
7.1.6 多媒体信息检索
7.2 物联网与 NLP
7.2.1 5G 开启物联网
7.2.2 人与物之间的 NLP
7.2.3 万物之间 NLP?
7.2.4 简单的指令集 or 语言集
7.3 知识获取
7.3.1 从依赖专家到依赖用户
7.3.2 从模型到大数据
7.4 强化学习的引入
7.4.1 强化学习方法简介
7.4.2 强化学习与 NLP
7.5 与知识图谱的结合
7.5.1 知识图谱的介绍
7.5.2 专业知识图谱
7.5.3 NLP 如何与知识图谱结合?
7.6 语言知识——从人工构建到自动构建
7.6.1 AlphaGo zero 的自学习能力
7.6.2 自动构筑语言知识?
7.7 文本理解与推理
7.7.1 从浅层分析到深度理解
7.8 文本生成
7.8.1 从写诗说起
7.8.2 从规范文本到自由文本
7.9 【例】基于知识图谱的医药问答系统
8 总结

 

段方老师的其它课程

=============================================================《中国广电5G运营策略》——段方中国移动资深专家教授北京大学博士后=============================================================15G发展概述1.15G概述1.25G技术特征1.

 讲师:段方详情


=============================================================《人工智能基础及应用培训》-段方某世界100强大数据/AI总设计师教授北京大学博士后=============================================================202916811801概述--

 讲师:段方详情


数据安全技术   04.24

《数据安全技术》-段方某世界100强企业大数据总设计师教授北京大学博士后1概述1.1信息安全的概念及范围1.1.1概述1.1.2信息系统潜在威胁被动攻击主动攻击黑客攻击手法1.1.3信息安全技术概览1.1.4信息安全注重体系安全防护检测响应恢复1.2信息安全等级分类1.2.1分级的概念1.2.2分级保护涉及的标准1.2.3职责和角色1.2.4企业信息等级选择

 讲师:段方详情


=============================================================《数据管理及数仓建模》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465791461概述---

 讲师:段方详情


=============================================================《数智化发展及运用案例分析》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================23704858471概念

 讲师:段方详情


=============================================================《数字经济时代内部审计实战技能提升》——段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465791

 讲师:段方详情


=============================================================《铁路行业的数字化转型》——段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465762131为什么

 讲师:段方详情


《信息技术的国产化发展与展望》-段方总设计师教授北京大学博士后1概述1.1信息技术的发展概况1.2盗版软件的双刃剑1.3美国为何在信息技术领域对中国进行限制1.4中国如何选择应对的方法?2信息技术国产化现状2.1操作系统方面2.2芯片方面2.3数据系统方面2.4工业软件方面2.5应用软件方面2.6互联网软件方面2.7计算机板卡方面2.8服务器方面2.9云计算

 讲师:段方详情


《银行业与中国科技强国战略的融合与创新》——段方某世界100强企业AI/大数据总设计师教授、北京大学博士后【课程目的】:本课程旨在深化学员对中国科技强国战略的理解,并探讨银行业如何利用新兴科技助力战略实施,促进业务创新和转型升级。通过系统学习,学员将能够识别并应对金融科技发展的趋势和挑战,为银行业的可持续发展提供战略支持。【课程提纲】:I.引言A.银行业与科

 讲师:段方详情


=============================================================《元宇宙概念及应用》-段方某世界100强企业资深专家教授北京大学博士后=============================================================14135907071基本概念--------

 讲师:段方详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有