Rumia's blog

Introduction 自然是简单介绍,有一些有意思的概念大致写一下。

0.语音处理与nlp

​ 语音处理已经做得很不错了,可以看得出来,包括siri,Cortana之类的语音助手,在将语音信号转化为文字这方面还是很不错的,以前感觉它们算是一整个大体系的前端与后端的关系,但似乎并不是,nlp更加关注的如何用计算机处理既有问语言文字数据,包括理解这句话到底什么意思,或者这句话的发出者的情感是怎么样的。这并不是一件容易的事情,就像 Manning 在slides里面提到了例子:

​ The Pope’s baby steps on gays.

这句话可以理解为教皇的baby走上gays,也可以理解为教皇在对gays的观念上走出了baby steps,显然后者才是正确的,作为人当然可以很容易的区分,但是对于计算机来说似乎就不是一件多么容易的事情了。

1.Deep Learning & nlp

似乎又拿传统与现代比较,结合了DL的nlp似乎变得又非常强了,就像拥有了cnn的CV一样,

还没有具体讲到底是什么,大致讲了一下 词向量,就是用向量表示单词,这个就很灵性了,大概就像这样: 当被问道每个维度具体的意义是,Manning的回答就比较有意思了,一般来说,并不知道每个维度的意义,只能是尝试着去理解每个维度的意义,果然黑箱一路货色。所以,虽然没有具体了解一些东西,但是猜着是一通数据拟合fit?


2.Why nlp hard?

简单来说,语言本身就存在一定的不确定性,自然语言并不像计算机语言一般有着严格确定的规则和语法甚至可以编译成一条一条机器指令去执行,自然语言在具有混沌性?是与上下文以及语境惯量的。我认为,就像slides里漫画中讲的:

Language isn’t a formal system, language is glorious chaos

语言并不是一套规则的系统,语言是一种华丽的混沌。