出国留学网 > 留学论坛 > 科学 >

AI“解剖”语言新收获 谷歌开源自然语言解析器

目录

xx02120710

回复 1 楼 2016-05-13

该软件的语言技能熟练度已与人类相当

  虽然现在的AI已经发展到了相对成熟的地步,但是它仍不能识别和解析自然语言。而Google一直都在努力打造一套系统来帮助AI理解自然语言。现在,Google在此领域的研究终于初见端倪。

  近日,Google发布了开源的SyntaxNet自然语言神经网络框架,以帮助机器更好地理解自然语言。SyntaxNet中包括了Parsey McParseface,后者是一种专门用于“解剖”英语的语言解析器。Google称之为世界上最准确的语言解析器,并且已经放出了允许人们借助自有数据来训练SyntaxNet的全部代码。

  SyntaxNet和Parsey McParseface都是自然语言理解(NLU)系统的一部分。给出一个句子,它就会将之分解成各种部分,比如名词、动词、形容词。

  对自然语言研究人员和需要这种应用程序的人们来说,这款开源工具显然会助力相关研究的爆发式发展。

  据Google自述,经过TensorFlow框架训练后的Parsey McParseface,是其出产的“最复杂的网络”之一。

  在某一测试中,他们发现该模型的准确度超过94%——作为比较,训练有趣的语言学家的准确率在96-97%左右——这表明该软件的技能熟练度已与人类相当。

本帖地址:http://bbs.liuxue86.com/913910.html

未AKZE404jl

回复 2 楼 2016-05-13

仍是GoogleAI语言解析的第一步


  看到这里,如果你对SyntaxNet的运行方式还是不甚其解,那小编给大家一个比喻:Parsey 和SyntaxNet就像5岁孩子学习句法结构一样。

624320_1622398927.jpg

  在上面这个句子中,“Saw”是基本词(动词),”Alice”和”Bob”是非基本词(名词)。Paesey McParseface能正确地分析这一句子,也能理解下面这个更加复杂的例子:

624320_1622399667.jpg

  Alice Drove Down The Street In Her Car.

  对于开发此自然语言神经网络框架的原因,Google是这样回应的:

  解析语言最大的挑战就是人类语言有很多歧义,一个正常长度的句子(20到30字)也许有上百、上千,甚至上万中句法结构。而要一个自然的语言解析过程就是扫描所有句法结构,然后找出最合适的句法结构。

  而虽然Parsey McParseface 和 SyntaxNet看起来牛逼哄哄,但它并不是自然语言解析的最终方式,它只是GoogleAI语言解析的第一步。