《自然语言处理实战》

  培训讲师:段方

讲师背景:
段方专业背景:曾在中国银行工作现任某集团总部大数据专家、数据仓库项目经理多家培训机构及大学总裁班特邀讲师十几年专注于大数据的研究与推广积累了15年的大数据领域的实际工作经验。带领相关的团队,从系统创建到系统运营,开发了很多大数据领域的各种应 详细>>

段方
    课程咨询电话:

《自然语言处理实战》详细内容

《自然语言处理实战》

《自然语言处理实战》
——段方
大数据(分析) 总设计师
教授 北京大学博士后
1 自然语言处理概述
1.1 什么是自然语言处理(NLP)
1.2 NLP 的发展历史
1.2.1 1956 年以前的萌芽期
1.2.2 1957-1970 年的快速发展期
1.2.3 1971-1993 年的低谷期
1.2.4 1994 年至今的复苏其
1.3 NLP 发展的原因
1.3.1 互联网提供了大量的语料库
1.3.2 深度学习算法提升了精度
1.3.3 场景更加丰富
1.4 NLP 的价值
1.4.1 语言是信息的载体
1.4.2 构建人机自然交互接口
1.4.3 语言翻译、信息检索等价值凸显
1.4.4 市场规模巨大
1.5 自然语言处理的典型应用
1.5.1 机器翻译
1.5.2 自动摘要
1.5.3 文本分类与信息过滤
1.5.4 信息检索
1.5.5 自动问答
1.5.6 信息抽取与文本挖掘
1.5.7 情感分析
1.6 机器翻译
1.6.1 文本机器翻译
1.6.2 语音机器翻译
1.7 自动摘要
1.7.1 单文档摘要
1.7.2 多文档摘要
1.8 信息检索
1.8.1 基本概念
1.8.2 搜索引擎
1.8.3 【例】谷歌搜索引擎算法
1.9 自动问答
1.9.1 基于知识图谱的问答系统
1.9.2 BERT 算法
1.10 NLP 产品举例
1.10.1 Google translate
1.10.2 Bing translate
1.10.3 语音输入法
1.10.4 Siri 问答
1.11 【例】 NLP 在(电信) 客服中的应用
1.11.1 部分替代人工
1.11.2 解决部分业务问题
1.11.3 中国移动的例子
1.12 【例】微软小冰的问答原理
2 自然语言处理的基本任务
2.1 语言分析
2.2 词法分析
2.3 句法分析
2.4 语义分析
2.5 语言生成
2.6 多语言处理(机器翻译、跨语言检索)
2.7 NLP 在各个行业的应用
2.7.1 教育
2.7.2 医疗
2.7.3 金融
2.7.4 法律等
2.8 【例】分词工具——结巴、 NLPIR 、 IKAnalyzer(开源)
2.9 【例】附件-IBM 沃森介绍
3 自然语言处理的基本策略和实现方法
3.1 基于规则的理性方法
3.2 基于语料库的经验方法
3.3 混合方法
3.4 自然语言的分类
3.5 自然语言处理的难点
3.5.1 汉语处理的难点
3.5.2 自然语言处理涉及的学科
3.6 【附】阿里小蜜的例子
4 基于规则的自然语言处理方法
4.1 概述
4.2 词法分析
4.3 形态还原(英语)
4.3.1 形态还原算法
4.3.2 英语词的分类
4.4 词性标注/体系
4.4.1 词性标注方法
4.5 汉语分词
4.5.1 切分歧义及歧义字段的种类
4.6 分词方法
4.6.1 基于词库
4.7 句法分析
4.7.1 基于上下文无关语法(CFG) 的表示
4.7.2 基于 CFG 算法及过程
4.7.3 搜索策略
4.7.4 自顶向下句法分析
4.7.5 自底向上句法分析
chart parsing
4.7.6 句法分析与逻辑程序设计
4.7.7 传统 CFG 在描述自然语言的问题
4.7.8 基于特征的扩展 CFG
合一文法
合一运算
chart parsing 举例
4.8 语义分析
4.8.1 词汇语义
4.8.2 语义类
4.8.3 词义间关系
4.9 句义分析
4.9.1 句义表示与语义组合
4.9.2 论旨角色与格语法
4.9.3 格语法
4.9.4 基于格语法的语义分析
4.10 【例】附件-Siri 的介绍
5 机器翻译
5.1 机器翻译的历史
5.2 机器翻译的基本策略
5.3 机器翻译的实现方法
5.4 基于规则的机器翻译
5.4.1 基于词的转换翻译
5.4.2 基于句法结构转换的翻译
5.4.3 基于语义转换的翻译
5.4.4 基于中间语言的翻译
5.4.5 机器翻译的现状
5.5 基于语料库的机器翻译
5.5.1 基于实例的方法
5.5.2 基于统计的方法
5.5.3 基于神经网络的方法
5.6 混合法机器翻译
5.6.1 基于规则与语料库结合起来
5.7 【例】附件-科大讯飞的 NLP 产品
6 基于深度学习方法的 NLP
6.1 深度学习算法简介
6.2 词向量模型
6.2.1 原理
6.2.2 Word2vec
6.2.3 ELMo
6.2.4 OpenAI GPT
6.3 BERT 词向量模型
6.4 信息抽取
6.4.1 实体识别与抽取
隐马尔可夫模型 HMM
最大熵马尔可夫模型 MEMM 条件随机场算法 CRF
6.4.2 开放式实体抽取
6.4.3 命名实体消歧
6.4.4 关系抽取
传统方法
基于特征向量 基于核函数
基于神经网络
6.5 情感分析
6.5.1 情感分析的层次
6.5.2 句子级
6.5.3 词语级
6.5.4 情感信息抽取
6.5.5 情感分析的方法
6.6 语义分析
6.6.1 词汇级语义分析
6.6.2 词义消歧
基于规则 基于词典
6.6.3 词汇级语义分析
有监督
无监督
6.6.4 句子级语义分析
句义分析
句子语义相似度分析
6.7 【例】附件-NLP 的调用工具(百度等)
7 自然语言处理的未来发展
7.1 下一代信息检索
7.1.1 当前搜索引擎的问题
7.1.2 垂直搜索
7.1.3 智能搜索
7.1.4 个性化搜索
7.1.5 跨语言信息检索
7.1.6 多媒体信息检索
7.2 物联网与 NLP
7.2.1 5G 开启物联网
7.2.2 人与物之间的 NLP
7.2.3 万物之间 NLP?
7.2.4 简单的指令集 or 语言集
7.3 知识获取
7.3.1 从依赖专家到依赖用户
7.3.2 从模型到大数据
7.4 强化学习的引入
7.4.1 强化学习方法简介
7.4.2 强化学习与 NLP
7.5 与知识图谱的结合
7.5.1 知识图谱的介绍
7.5.2 专业知识图谱
7.5.3 NLP 如何与知识图谱结合?
7.6 语言知识——从人工构建到自动构建
7.6.1 AlphaGo zero 的自学习能力
7.6.2 自动构筑语言知识?
7.7 文本理解与推理
7.7.1 从浅层分析到深度理解
7.8 文本生成
7.8.1 从写诗说起
7.8.2 从规范文本到自由文本
7.9 【例】基于知识图谱的医药问答系统
8 总结

 

段方老师的其它课程

《“连接+算力+能力”——移动公司新战略》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后===========================================================概述-------------------------------------------------------------1.1中国移

 讲师:段方详情


《大数据系列培训的课程目录》——段方段方——北京大学博士后摘要列出大数据系列课程目录,从不同角度详细介绍大数据的各种相关内容。从实际案例出发,分享实际建设、运营的经验和教训,分享个人的思考。【讲师简介】30余年计算机(IT)领域从业经历,直至博士后的学历背景;16年大数据系统(含数据仓库)设计、建设、应用、管理、运营实际经验,累计投资120亿元买来的教训;2

 讲师:段方详情


《基于大数据的机器学习和深度学习》——原理与实践目录1背景1.1从AlphaGo说起5\lquot;bookmark6quot;1.1.1AlphaGo的效果5\lquot;bookmark8quot;1.1.2AlphaGo的原理5\lquot;bookmark10quot;1.2机器学习基础5\lquot;bookmark12quot;1.2.1机器学习

 讲师:段方详情


《物联网技术与应用》段方——北京大学博士后目录1概述1.1物联网概念及特点1.1.1定义1.1.2与互联网的关系1.1.3物联网的特点1.2物联网发展历程1.2.1源起1.2.2中国移动的“万物互联”1.3物联网关键技术1.3.1从RFID开始1.3.2感应识别技术1.3.3定位系统1.3.4其它的感应技术1.4物联网的产业链1.4.1设备层面1.4.2网络

 讲师:段方详情


=============================================================《人工智能(含机器学习)及其在电信领域应用》-段方某世界100强企业大数据/AI总设计师教授、北京大学博士后=============================================================1930

 讲师:段方详情


=============================================================《中国广电5G运营策略》——段方中国移动资深专家教授北京大学博士后=============================================================15G发展概述1.15G概述1.25G技术特征1.

 讲师:段方详情


=============================================================《人工智能基础及应用培训》-段方某世界100强大数据/AI总设计师教授北京大学博士后=============================================================202916811801概述--

 讲师:段方详情


数据安全技术   04.24

《数据安全技术》-段方某世界100强企业大数据总设计师教授北京大学博士后1概述1.1信息安全的概念及范围1.1.1概述1.1.2信息系统潜在威胁被动攻击主动攻击黑客攻击手法1.1.3信息安全技术概览1.1.4信息安全注重体系安全防护检测响应恢复1.2信息安全等级分类1.2.1分级的概念1.2.2分级保护涉及的标准1.2.3职责和角色1.2.4企业信息等级选择

 讲师:段方详情


=============================================================《数据管理及数仓建模》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================13465791461概述---

 讲师:段方详情


=============================================================《数智化发展及运用案例分析》-段方某世界100强企业大数据/AI总设计师教授北京大学博士后=============================================================23704858471概念

 讲师:段方详情


COPYRIGT @ 2001-2018 HTTP://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有