11月8日,猎豹移动董(dǒng)事长兼 CEO 傅盛出席第五届世界互联网大会“物联网:连接无(wú)处不在(zài)”论坛(tán),并(bìng)发(fā)表题为(wéi)《真开放·全链条AI技术赋能物联网》的主(zhǔ)题演(yǎn)讲。
猎豹移动董事长兼(jiān)CEO傅盛(shèng)
傅盛表示,即(jí)便是在今天的(de)生产(chǎn)线上,也很难解决设备智能化的问题,而AI让机器第(dì)一次拥(yōng)有了人类的感知能力(lì),也让物联网(wǎng)终端更聪(cōng)明。这是一(yī)个(gè)巨大的分水岭,使得AIoT的(de)概念开(kāi)始出现。在行(háng)业和(hé)自身的变革背景下(xià),猎(liè)豹移动(dòng)携旗下人工智能(néng)公司猎户星空,研发了包括语音(yīn)识别、视觉(jiào)识别、室内导航平台等在内的行业(yè)唯(wéi)一全链条AI技术。
他(tā)说到,“我们未来不会单(dān)做(zuò)一款(kuǎn)硬件,我们致力于打造AI赋能的云端(duān)操作系(xì)统,跟开发者一起做更多的(de)物联网设备(bèi)。”
以下是演讲全文:
首先,我花一点(diǎn)时间介绍一下猎豹移动(dòng)。猎豹(bào)移动(dòng)是一家经历(lì)过三次跨越的公司,2010年由我自己创办的(de)可牛影像和金山安全(quán)合并而成。
当时我们经历的第一波(bō)是PC杀(shā)毒(dú)软件(jiàn)免费化(huà),实现(xiàn)了第(dì)一次的增长。
第二波在移(yí)动互联网的(de)时候,我们(men)碰到了(le)强大的对手,决定(dìng)出(chū)海(hǎi)。我们是(shì)第一家大规模的把用(yòng)户做到(dào)海外的(de)中国公司。今(jīn)天,猎豹移动大概(gài)有5亿(yì)多的月度活(huó)跃用户,其中80%来自于海外,完全走出(chū)了一条不(bú)一样的曲线,我们内部叫做“天(tiān)外飞仙”。所以(yǐ)我们现在依然(rán)是Google工具(jù)排行榜的第一,我们游戏的下载次数在全球接(jiē)近20亿次。
第三(sān)波是在2014年上市(shì)以后。我当时就(jiù)意识到,整个移动互联(lián)网的风口将尽(jìn),我们需要寻找下一个机会。我(wǒ)们在硅谷、以色列都投资了基金,由此(cǐ)看到了人(rén)工智能的机会。
AI让机(jī)器(qì)拥有感知能力(lì) 全力以赴打(dǎ)造全链条AI技术
我对人工智能有一些自己的理解和思(sī)考,我们(men)讲了(le)很久(jiǔ)的物联(lián)网、智能(néng)硬件,其实在AI或者人工智能出现(xiàn)之前,所有(yǒu)的智能硬件(jiàn)都(dōu)是(shì)伪智能硬件。那个时候的智能硬件本质上是联网硬件,你要(yào)掏出(chū)手机进行操作。大概(gài)在三五年前,各种(zhǒng)智能硬件的(de)行业都起来了,但是很快这个行业又衰落(luò)了(le)。
我(wǒ)甚至想要把机器人行业划分成两个(gè)分水(shuǐ)岭。在AI出现之前的机器(qì)人本质上都是自动化机器,没有人的属性(xìng)。我们看(kàn)产线(xiàn)上那么多(duō)漂亮的机械手,其实都(dōu)是通过非常原(yuán)始的编程和自动(dòng)化的(de)设备进行(háng)生产(chǎn)的。即便今(jīn)天在生产线(xiàn)上,也很难解决(jué)智能化的问题。
但AI出(chū)现以后,第一次让机器有(yǒu)了人类(lèi)的感知能(néng)力,我们(men)以前的摄像头看到的都(dōu)是0101等一串数字,但今天摄像头看到的是人脸;以前看到的语音(yīn)是波形,我们现(xiàn)在看到的语音是文字。
机器(qì)开始有了人类的感知能力,使(shǐ)得(dé)AIoT的概念开始出现,看到(dào)这(zhè)个机会以后,我们(men)就去做了行业(yè)唯一的全链条AI技术。包括语音识别、视(shì)觉识别、导航、机械臂、麦克风阵(zhèn)列等,为什么要做呢?
这(zhè)是从(cóng)内外两个方面思考的。
第(dì)一个,猎豹移动在以前做的太(tài)快了(le)。我(wǒ)们就做一个(gè)小工具(jù),居(jū)然就上市了(le)。后来等到Google发(fā)政(zhèng)策不让我们做工具,手机厂商都开(kāi)始自己做工具(jù)的(de)时候,我(wǒ)们的日子就变得很艰难。所以我当时就想,拥有自己的底层技术(shù)很关键(jiàn)。
第二(èr)个,因为AI行(háng)业还处于早期。很多技术都不完善,或者没有形成产业分工。但很多开(kāi)发(fā)者(zhě),拿一块板子,拿(ná)一个所谓(wèi)的开放平台(tái),就想实现很好(hǎo)的语(yǔ)音识别效果,其实是非(fēi)常难的。以智能音箱为例(lì),换一个外壳罩上去,算(suàn)法就得调(diào)整(zhěng),因为混响不一样。就(jiù)像(xiàng),在你的(de)耳朵(duǒ)上加(jiā)一个耳塞,听力就可能大(dà)幅度(dù)下降,和你的大脑聪不聪明没关系。所以整个人工智能产业的链条都非常新,又(yòu)没(méi)有(yǒu)足够的(de)分工。
第三(sān)个(gè),我意识到,AI其实并不(bú)算是一个不(bú)可(kě)逾越的黑(hēi)科(kē)技。很(hěn)多(duō)人都说,BAT才能做AI,或者人家的积累更(gèng)好(hǎo)一(yī)点。但是(shì)今天(tiān)看来(lái),开(kāi)源代码会远远丰富于任(rèn)何一个时代。很多(duō)大(dà)洋彼(bǐ)岸的论文出(chū)现之后,中(zhōng)国的工(gōng)程师就(jiù)很快把它实现了(le)。所(suǒ)以,好处就在(zài)于,AI大大(dà)降低了技术壁垒。而且(qiě)AI使得以前(qián)很多公司的积(jī)累变得无效,大家处在同一起跑线上。我们认为,这(zhè)是一个弯道超车的好机会(huì)。
所以,我们当时就下定(dìng)决心(xīn),把所以(yǐ)技(jì)术全都(dōu)干了一(yī)遍,全力以赴打造全链条 AI 技术。全干一遍的好处就是,我(wǒ)们能(néng)够(gòu)自主调整很多细节。
语音交互实现了命令的自然(rán)化 可能颠覆手机的中心地位
我认为真正(zhèng)有(yǒu)智能的第一个硬件品类,应该是智能音箱,我(wǒ)一(yī)直在想,语音识别是(shì)什么东西?今天有人谈“语义理解能力超(chāo)过(guò)人(rén)”。只要看到这种标题,基本上(shàng)都是骗子。
为什么(me)这么说?在语义的理解上,AI离人有(yǒu)巨大的差距。因为语言是(shì)人(rén)类超级牛的发(fā)明,你能(néng)够(gòu)把你对(duì)世界的理解,压缩(suō)成一串(chuàn)很(hěn)短的文字输入(rù)给对(duì)方,对(duì)方听完以后,能把这(zhè)个图像(xiàng)、事件还原(yuán)出来,这是个(gè)相(xiàng)当牛的(de)能力,人(rén)类(lèi)之间的交流是带有巨大的信息压(yā)缩(suō)和(hé)背景知识的。
所以,今天机器完全(quán)做不到。AI想在阅读理解上超过人类,那是在一个(gè)很(hěn)有(yǒu)限的短文章里,没有实际(jì)意义。
真(zhēn)正的语音操(cāo)作是什(shí)么(me)?我认为它的本质是实现了命令的自然化(huà)。乔布(bù)斯(sī)有一句话说,每一次交互操作的演进都是一(yī)次(cì)革命(mìng)。苹果有幸抓住了两次革命,第一个(gè)是(shì)抓住了(le)键(jiàn)盘和(hé)鼠标,第二个是抓住了触(chù)摸屏。
今天的手机不是因(yīn)为它有(yǒu)多么智(zhì)能,而是因为它有强大(dà)的处理能力,你可以非常方(fāng)便地touch。所以(yǐ)手机立刻(kè)取代了以前的(de)PC、电视(shì),成(chéng)为了(le)你的中心(xīn)位(wèi)置。
但(dàn)语音使(shǐ)得(dé)手(shǒu)机的中心位置(zhì)有可能被(bèi)颠覆掉,你想象一下(xià),语(yǔ)音是什么?比如,你想(xiǎng)看《延禧攻略》,以(yǐ)往你需要从口袋里(lǐ)掏一个东西,解锁(suǒ)、搜索,未来(lái)可以用语音就直接唤醒:我想看《延禧攻略》。
我甚至认为,虽然手(shǒu)机还(hái)是(shì)个非常(cháng)关键(jiàn)性(xìng)的设备,但下一(yī)代(dài)设备都可(kě)以变得(dé)去(qù)手机化。
两年前,我们是业(yè)内第二款做智能音(yīn)箱的厂(chǎng)商。我(wǒ)们(联合喜马(mǎ)拉雅)做(zuò)了一款(kuǎn)小雅(yǎ)音箱,当时很(hěn)多人就(jiù)问我,智能音箱有多智能呢?我回答(dá):你不要考(kǎo)虑(lǜ)它有多(duō)智能,你只(zhī)要(yào)考虑它是个摇控(kòng)器,能够(gòu)非常简单地(dì)点(diǎn)歌、了解(jiě)天气(qì),设置(zhì)闹(nào)钟(zhōng)。我们买来了对手的(de)产品,我们发现点歌(gē)根本点不(bú)准,只(zhī)有(yǒu)50%的准确率。为什(shí)么?不是语(yǔ)音识(shí)别的问题(tí),而是内容上的问题(tí)。比如说(shuō)今天抖(dǒu)音出了个神曲叫《我们(men)一起学猫叫》,你的曲库里(lǐ)得有(yǒu)这首歌。有的时(shí)候用户说叫“学猫叫”,有的说喵喵喵,有多种的说法。这(zhè)不是一个智能的活儿,这是个产品的活儿。
所以我们(men)就把音乐的点(diǎn)播率和内容的点播(bō)率,这一件事(shì)儿做好了(le)。当时,我(wǒ)觉得智能音(yīn)箱的核心不是(shì)它有(yǒu)多(duō)智能,而是一种新的交互模式。这种新的交互(hù)模式本质上就是一个摇控(kòng)器(qì),它把极其复杂难用的摇控器给改掉了,这个进步是非常巨(jù)大的。
iphoness刚出来(lái)的时候,大(dà)家说(shuō)这个没有全键(jiàn)盘(pán)、没有硬(yìng)键盘怎(zěn)么(me)用(yòng),输入内容太慢(màn)了。但就是因(yīn)为它方(fāng)便,你可以容忍它非常多不够(gòu)快(kuài)速的地方(fāng)。
我们赋能了很(hěn)多物联网(wǎng)的中枢,我坚(jiān)定的认为,语音是下一代操作系统的界面(miàn),它一定可以(yǐ)使得物联网的很(hěn)多(duō)设备变得智能。可以跟你直接(jiē)交互,不(bú)需要通过手机APP的方式,它自己就被赋能了。我们跟很(hěn)多厂商合作了很多款音箱,因为我们觉得(dé)打音箱上的战役可(kě)能打不(bú)过(guò),但是合作是有机会的。
人(rén)工智能不会颠覆人 只要一(yī)点突破就会带来变革(gé)
我们还做了一款(kuǎn)能移动的售卖机——零售机器人(rén)豹小贩,它会主动问你是否需要商品,用户扫描二维(wéi)码就可以购(gòu)买。看到人(rén)多的地(dì)方它就会过去(qù),因(yīn)为它有人(rén)脸(liǎn)识别技术。以前,售卖(mài)机只能(néng)放在一个地方,如今(jīn),自动售卖机的售卖效率,大概是传统的三到(dào)五倍,用互联(lián)网的定律看,当(dāng)多一个链接,互联网就(jiù)损(sǔn)失了50%以上的流(liú)量。而在(zài)线(xiàn)下零(líng)售(shòu)端,当你(nǐ)从原有的位置(zhì)走出来,让用户看到有一点点改进,效(xiào)率的改变是巨大的(de)。
在机械(xiè)臂方面,我专门去发那科看过他们的生产线。我个人(rén)觉得,在精密(mì)制造上和日本、德(dé)国企业(yè)去比拼,是没有机(jī)会的。因为他们是三(sān)十年(nián)的积累,可以用机械臂(bì)生产机械(xiè)臂。但是他们面临一个问题:整(zhěng)个产线(xiàn)投产周期非常长(zhǎng),他要(yào)改变(biàn)一个(gè)产品的时候,整条产线(xiàn)都要变,成本非常高。
我一直在想,AI 出(chū)现之后,可能不需要精(jīng)密的机械(xiè)臂,来做生产(chǎn)。我想到(dào)我奶奶(nǎi)的(de)手,哆哆嗦嗦的,但她仍然能够织毛衣,还可以穿针引线(xiàn)。核心不(bú)是因(yīn)为她的肌肉能够多么精确地控制,而是因为她能用眼睛做(zuò)最后一点点调整。
受此启发(fā),我们(men)在机械(xiè)臂上加上了(le)摄像头,使得(dé)它去抓杯子(zǐ)的时候(hòu),杯(bēi)子怎(zěn)么样(yàng)放都可以抓得到,这样可以降低对机械臂精度的要求(qiú)。
做机械臂的机床,如果从日本买,大概需要(yào) 2000 万的投资,六个月之后(hòu)拿(ná)货,我们现在正在尝(cháng)试用韩国产的机床(chuáng)为我们做谐波减速器,未来可能用国产的(de)机床。虽然精度(dù)降低了(le)一点点(diǎn),由(yóu)于由于有视觉技(jì)术,所以它最后肯定能完成动作。
因(yīn)为机械臂最(zuì)大的成(chéng)本就来自于谐(xié)波(bō)减速器,我们正在做的机械臂,未来可以降到市场价格的三分之一(yī)。当机械臂的价(jià)格降低(dī),可能会(huì)产生新的(de)、比(bǐ)工业市场大十倍的市(shì)场,市场增大十倍之后(hòu),成(chéng)本又会进(jìn)一步降低。在(zài) AI 赋能(néng)之(zhī)后,机械臂是(shì)有可能实现跨越式增长的(de)。
在接待服务方面,如(rú)果大家有兴趣的话,可(kě)以去猎豹(bào)移(yí)动参观一下。我们的前台已经是机器人接(jiē)待了,我们是一家没有前台的公司,只有机器人。你来的(de)时候,我在OA上提一个申请(qǐng),然(rán)后你会收到一条数字码(mǎ),机器人就会过来。你跟它说(shuō)“我来面试”或者(zhě)开(kāi)会,把数(shù)字(zì)码输上(shàng),它(tā)给你拍张(zhāng)照,在(zài)我(wǒ)们的闸机上刷一下脸,你(nǐ)就可以进入公司(sī),它(tā)也会带你去会议室。
今天(tiān)讲(jiǎng)人工智能,很多人太(tài)强调所谓颠覆人(rén)的智能,这条(tiáo)路我还没有看到颠覆(fù)人的(de)地方。但(dàn)核心是有可(kě)能(néng)实现(xiàn)一点点突破,比如说(shuō)它能够把原来的0101这种信号,对应成(chéng)真正(zhèng)的人(rén)脸和语音的字(zì)节的(de)时候,其实(shí)我(wǒ)觉得这个机会(huì)就已(yǐ)经非(fēi)常非常巨大了。它会让(ràng)很多设备具(jù)备人的感(gǎn)知(zhī)能力(lì),在(zài)一个非常垂直的(de)领域,完成一点点工作。这一点点工作,可(kě)能会带来巨大的变革。
我们最(zuì)近刚跟一个酒店签约(yuē),我们的音箱进(jìn)酒店了。以后你到房间以后,你就直接(jiē)可以说,开灯。你可以跟(gēn)音箱说:“给我来支牙刷”,酒(jiǔ)店系(xì)统就会收到,服务员很快就会把牙刷送过来。这样的话,通过人工智能技术可以让物联网的(de)设备变得(dé)更聪明,而且(qiě)真正(zhèng)可以使得照明、空调等设备变得互联互(hù)通,非(fēi)常好用。
我希望(wàng)机器人也好(hǎo),音箱也好,都能跟各(gè)行各(gè)业合作,我们的本质不是想做一个硬(yìng)件,我(wǒ)们的本(běn)质还是想做一个AI赋能的云端(duān)操作系(xì)统(tǒng),跟开发者一起做更多(duō)的物联网设(shè)备。谢谢(xiè)大家!