织梦CMS - 轻松建站从此开始!

棋牌_棋牌游戏_棋牌游戏平台_网络棋牌游戏-棋牌游戏下载

当前位置: 主页 > 搜狗知乎 >

余亮:与谷歌翻译小别胜新婚之后,看清中国人工智能到 …

时间:2018-07-01 06:51来源:未知 作者:admin 点击:
上周我在虎嗅撰文致意吴恩达先生的离职,文中有两处提到谷歌翻译和百度翻译的对比:一处是说百度领先谷歌一年上线基于NMT神经网络的翻译系统,一处是说百度翻译的使用体验不如谷歌方便。巧的是几天后,3月29日,谷歌翻译APP就重返中国大陆,引起一片欢腾。在段子手国度,此事很快演变成狂欢。人们拿出各种网络用语虐各家翻译软件,对比结果。有人说,与谷歌翻译比,中国的翻译软件都是垃圾,比如“你是猪啊”,百度、有道都看不懂,就谷歌明白:我觉得,这种事,各方都能找出几个例子来证明对方不行自己行,玩玩可以,别太当真。而且如果一味强调本地段子翻译准,就好比问对方茴香豆的“茴”字有几种说法,没什么实际价值。翻译背后是语言,语言的本质是符号,符号是对信息的编码。翻译就是符号的“编码”和“解码”。从一种语言翻译到另一种语言,就是对一种编码进行解码,再重新编码为另一套体系。人类文明萌芽于符号(语言),赫拉利老师在《人类简史》中就强调,我们的智人祖先正是因为有了完备的语言,才能组织起来,击败身体强壮的尼安德特人。商品的物质“使用价值”不再重要,符号价值才重要。商品就是一种语言符号,消费成了一种言说。爱漂亮衣服,爱打折标签,你是凡客。吃西少肉夹馍、骑摩拜单车,你是创业狗。在这种时代,依赖符号运作的机器反而如鱼得水。因为它们的一切运行以符号(代码、函数、数据、标签)为基础。追溯计算机的发明,无非是人类把自己的意图翻译成机器可以理解的语言,促成机器的行动。如今做feed流的公司,利用机器算法给每条资讯打上成百的属性标签,通过用户点击行为反测用户的消费偏好,这难道不是鲍德里亚消费社会理论的机器化实现?观察当下AI大企业,技术线路都有清晰的两块,一块是图像识别、语音识别方向,一块是自然语言处理方向。从阿里的小黄图牛皮藓鉴别、讯飞的语音识别,甚至到百度的无人车,更多利用前者。从百度的搜索、翻译、度秘到阿里的机器客服、搜狗的输入法,更多基于后者。看AI人才也可分这两类。吴恩达与酷炫的图像识别(识猫)、无人车相关,王海峰、王小川则与低调的自然语言处理相关。相对于看、听和行动的能力,语言是人类区别于其他生物最重要的特征之一。视觉、听觉和行为不仅是人特有的,动物也会有,甚至比人强,但是语言是人特有的。AlphaGo对于普通人来讲是非常震撼的一件事情,我们也认为它是一个挺大的成绩。但是我们也不能忽略,它的规则是明确的,空间是封闭的,为围棋训练出来的程序下象棋就不好用。基本来讲是一个可解的问题,但是语言的很多问题是更难解的。翻译,是“自然语言处理”的最重要分支,也是比较难的一支。人工智能在早期就是符号智能,人把各种规则变成符号算式输入机器,结果深挖下去发现规则比恒河沙粒还多,累死了自己。最早的机器翻译方法就是基于词和语法规则。注意,人类并不了解大脑是如何工作的,但是依然工作得很好。反过来,人类自己语言熟练,不代表人能理解自己语言神经是怎么运作的。这就导致依赖人工规则的翻译软件笑话百出。即便现在,谷歌、百度也无法避免下面这样的翻译错误:在翻译界的常识是:机器翻译是突然爆发的,原因在于互联网带来的大数据。前谷歌工程师吴军在《智能时代》里说过,2005年,谷歌翻译在美国翻译界大赛上异军突起,秒杀老牌翻译公司,靠的就是更多的数据。因为谷歌有互联网,有网上人类提供的海量翻译例句。十年后机器翻译第二次爆发。百度和谷歌一前一后上线NMT神经网络翻译系统。相比SMT聚焦于局部信息(短语),NMT更擅长利用全局信息——在对整个句子的信息解码、编码后,才生成结果。所以无论是语音识别还是翻译,你会发现句子长一点,机器识别和翻译的效果就会更好一点。比如,语序问题是“翻译”头疼的问题,中文会把所有的定语都放在中心词前面,英文则会倒装,以往机器常混淆这个顺序。 NMT通过基于深度学习的神经网络,向人类较好地学习到语序模式,长句翻译比以往流畅多了。在谷歌和腾讯都工作过的吴军,却认为在搜索、翻译领域,排在前面的就是谷歌和百度,别人很难追上这俩。因为他们都是搜索引擎起家,先发优势明显。谁积累的数据多、算法训练成熟,谁就赢者通吃。搜狗搜索技术不弱,且有微信搜索的优势,但是搜索结果依然被人诟病(甚至被诟病的机会也比百度少得多),就是因为起步晚,吃了马太效应的亏。谷歌翻译进入大陆,以后用的人越多,它的段子也可能翻译越准,所以比段子没什么好得意的。人类之间存在文化壁垒,但是对于没文化的机器,一切壁垒都会击穿,或者说一切文化它都能学会,从推特上的种族歧视言论到中国的神段子。真正要比拼的只有技术深度和产品体验的积累。首先根据用户 Query(诗歌题目)对要生成诗歌的内容进行规划,预测得到每一句诗的子主题,每一个子主题用一个单词来表示。这个过程和人类创作诗歌比较相似,诗人在创作之前往往会列出提纲,规划出每一句诗要描写的核心内容,然后再进行每句诗的创作。主题规划模型在生成每一句诗的时候,同时把上文生成的诗句和主题词一起输入来生成下一句诗。在这里,主题词的引入可以让生成的诗句不偏离主题,从而使整首诗都做到主题明确,逻辑顺畅。还有“实物翻译”和“拍照翻译”功能,目前谷歌和百度在做。实物翻译主要是图像识别技术,拍照识别物体是什么并提供相关资料。拍照翻译,谷歌的产品体验看似很好,拍照时候翻译结果直接融入实物,有种虚拟现实的效果。界面极简,初见时效果很惊艳。下图是我用谷歌翻译APP拍摄一本杂志的截图,封面上部分中文被“变成”了英文。据传,百度翻译原本也打算这样做,但最终选择了更复杂的交互方式——拍照后,需要用户用手指涂抹照片相应部位才会出现翻译效果。效果不够酷炫,不过注意,在对谷歌最初的新鲜感过去之后你会发现,谷歌拍照翻译在目前状态下无法令画面静止下来,无法按下拍照按钮。画面动个不停,只能即时查看。百度翻译则能获得稳定、可保存(截图)的效果。善解人意,是翻译要求的品质,也是用户体验要求的品质。国内的技术型科技企业似乎都有产品体验弱的问题。比如讯飞的语音输入技术很强,但是输入法产品设计上就差了点,全键盘首屏缺少一些常用标点符号,也没有百度输入法和搜狗输入法那样方便调出的多重记录剪贴板。去年微软亚洲研究院的秦涛和他的团队,在机器翻译领域提出“对偶学习法”,听起来很有创意。目的是:利用没有标注的数据。要知道,一般机器学习需要人类标注过的数据。比如一张猫的图片需要人工打上“cat”文字标签,然后拿去训练机器。但是人工标注成本高,探求如何让机器自主学习就成了未来发展方向。在自然语言的自主学习领域,最近百度也搞了个大新闻。余昊男、张海超、徐伟发表了一篇论文,提出了一个新的框架,把视觉识别和自然语言处理技术结合起来,让AI机器人在没有先验知识的情况下,自己学会理解人的命令并在迷宫中导航并定位物体。他们把初始机器人称做婴儿智能体,用无数回合来迭代训练。在每个回合,只给出极少的像素和语言指令,通过梯度下降,端到端地从零开始训练,让AI在实验中自主学习环境的视觉表示,语言的句法和语义,以及如何在环境中给自己导航。比如要求智能体能够推广解释从未见过的命令和词汇。那么中国企业还缺什么?古人云,做人要“世事洞明,人情练达”,改一下就可以送给中国AI企业:“技术洞明,产品练达”。技术好,还要转化为产品的体贴和话语的高度。当然,中国人总是与最好的比,要求很高,动力很足。 (责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
葡京赌场 澳门永利 mg电子游戏 ——mg电子游戏 星际娱乐场 澳门威尼斯人官网网址 澳门威尼斯人官网 澳门葡京_澳门葡京娱乐网址 澳门银河娱乐场 澳门银河网址 澳门星际 澳门金沙官网 澳门永利娱乐 威尼斯人 澳门新濠天地 澳门葡京平台 官方_澳门葡京 澳门葡京官网网址 威尼斯人注册网 威尼斯人 JS澳门金沙网址 澳门葡京 澳门葡京娱乐网址 澳门威尼斯人 威尼斯人官网网址 澳门葡京赌场 -澳门金沙客服 时时彩网址 澳门永利 威尼斯人网址 澳门银河网站|网址 澳门葡京赌场 澳门威尼斯人官方平台