课程介绍:
自然语言处理是机器学习当前最神秘,最红火,最具难度,也最让引人关注的分支。在搜索引擎,语音识别,情感分析,大批量文档处理,机器翻译,自动应答等各个领域有着前程无可限量的应用。可以试想一台能理解自然语言,并且和人类能用语言纯熟交流的机器,那还能叫机器么?文本挖掘(Text Mining)是数据挖掘以及自然语言处理技术衍生的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页所产生的BBS留言、博客、微博、新闻跟贴与转贴等。
适用人群:
对文本挖掘与自然语言处理感兴趣者,潜在研究者,爱好者,职业方向准备转型高级数据分析师,迈向数据科学家的朋友。较好是学习过炼数成金上《机器学习》课程或具备类似能力。
课程目录:
第01课 自然语言处理与文本挖掘概述
第02课 自动机及其应用,文稿自动校正,歧义消除
第03课 语言模型,平滑方法
第04课 概率图模型,生成式模型与判别式模型,贝叶斯网,马尔科夫链,隐马尔科夫模型HMM
第05课 马尔科夫网,最大熵模型,条件随机场CRF,实现HMM和CRF的软件
第06课 汉语分词专题。世界上最难的语言名不虚传
第07课 命名实体识别,词性标注,从文本里挖出最重要的内容
第08课 句法分析找出句子的重点
第09课 语义分析与篇章分析,让机器象语言学家那样思考
第10课 文本分类,情感分析。应用案例:互联网自动门户,评论倾向性分析
第11课 信息检索系统,搜索引擎原理,问答系统,应用案例:客服机器人是怎么造出来的?
第12课 文本深度挖掘:自动文摘与信息抽取
评论0