王小川
文|揚(yáng)子晚報(bào)記者 徐曉風(fēng)
中國江蘇網(wǎng)5月22日訊他是所有爸媽心目中“別人家的孩子”,這位清華學(xué)霸從小學(xué)習(xí)優(yōu)異,拿到的大大小小各類競賽獎(jiǎng)項(xiàng)無數(shù);他是互聯(lián)網(wǎng)業(yè)界的鉆石王老五,27歲就當(dāng)上了搜狐高級副總裁,現(xiàn)任搜狗CEO,曾聲稱搜狗就是自己的“老婆”……這是一次反射弧很長的采訪,緣起于去年世界互聯(lián)網(wǎng)大會(huì)期間,記者在烏鎮(zhèn)內(nèi)一家小店邂逅王小川后的簡單餐敘,一直到不久前的博鰲亞洲論壇。這位搜狗掌舵者留給記者的印象是他始終散發(fā)著強(qiáng)大的自信和對未知領(lǐng)域的狂熱探索欲望。
“有個(gè)很著名的自媒體人問我,搜狗要轉(zhuǎn)型做AI(人工智能的英文縮寫)了?我聽了一肚子火。因?yàn)樗阉髌鋵?shí)就是AI,它就是讓機(jī)器像人一樣去思考,越來越聰明的搜索引擎能夠幫我們選擇出更好的頁面來。百度集團(tuán)總裁兼首席運(yùn)營官陸奇就放出一句話,說搜索是AI最好的場景,搜索和AI是天生在一塊兒的。”
不管是在烏鎮(zhèn)水鄉(xiāng)小店的長條餐桌上,還是在搜狗發(fā)布2016年全年和2016年Q4財(cái)報(bào)的訪問現(xiàn)場,或者是前不久舉辦的博鰲論壇上,王小川跟記者聊得最多的都是人工智能。2月21日公布的財(cái)報(bào)顯示,2016年全年,搜狗營收44億元人民幣,已經(jīng)連續(xù)12個(gè)季度實(shí)現(xiàn)了持續(xù)盈利,把自己最美好的18年青春年華都與搜狗綁在一起的王小川感慨“搜狗搜索活下來了”,也開始秀搜狗與AI的“二三事”。
說到搜狗的AI,其實(shí)最近大家很熟悉的就是2017年2月6日,耗資4000萬打造的搜狗問答機(jī)器人汪仔登錄江蘇衛(wèi)視的《一站到底》。在人類獲勝選手領(lǐng)先3分的情況下,汪仔最終完勝哈佛女學(xué)霸。“搜索的未來將走向問答機(jī)器人。用戶的搜索行為會(huì)從輸入一個(gè)關(guān)鍵詞,變成表達(dá)一個(gè)完整的句子,讓機(jī)器找出其中的含義,同時(shí),搜索引擎返回的內(nèi)容,也將從簡單的10條鏈接轉(zhuǎn)向直接給出答案或者是建議?!蓖跣〈ㄈ缡钦f。而搜狗汪仔無疑是“問答機(jī)器人”這一理念的具象形態(tài)。搜狗汪仔背后依靠的是基于人工智能技術(shù)的搜狗立知問答系統(tǒng),這個(gè)搜狗研發(fā)的面向未來的搜索技術(shù),在理解用戶的問題或信息需求后,利用海量網(wǎng)絡(luò)信息及大規(guī)模知識庫,能夠直接給出答案,背后蘊(yùn)含了語義分析,問題理解,信息抽取,知識圖譜,信息檢索,深度學(xué)習(xí)等眾多技術(shù)。
學(xué)霸出身的王小川回答記者問題時(shí)也略帶著學(xué)術(shù)味兒,不過對于汪仔的能干,他舉了個(gè)簡單的例子:以前機(jī)器人和人比賽,要求是全部說完才能搶答,可是《一站到底》里只要主持人開始念題,在任何時(shí)間點(diǎn)都可以去答,這代表高手可以預(yù)測題并搶答,對人工智能機(jī)器人來說就非常難,比如節(jié)目組派了頂尖選手來做測試,一個(gè)題目說“《鹿鼎記》中哪一種毒藥……?”提到這個(gè)問題的時(shí)候,人已經(jīng)答了,題還沒問完呢。所以如何判斷問題并且去推測、搶答,汪仔背后是有綜合的技術(shù)挑戰(zhàn)。
參加了江蘇衛(wèi)視另一個(gè)王牌節(jié)目《最強(qiáng)大腦》的百度機(jī)器人小度現(xiàn)在也正當(dāng)紅,與汪仔同樣粉絲無數(shù),王小川對此并不回避:“大家可能都想看百度小度跟搜狗汪仔比幾場,這是不可避免的事,這個(gè)場景也是挺好的?!?/p>
“去年六月份,我去了英國倫敦,和開發(fā)阿爾法狗的工程師做了交流,我特別好奇的事情就是機(jī)器輸?shù)舻哪且痪值降装l(fā)生了什么事情?他們說不是程序有BUG,就是深度學(xué)習(xí)本身有瓶頸。圍棋比賽是三月份,我是在六月份去的倫敦,已經(jīng)過了三個(gè)月,這個(gè)問題依然沒有解決。但是我離開以后一個(gè)星期,他們的程序就能夠正確面對之前輸?shù)舻哪且痪制遄V,我問他是否這個(gè)BUG修好了,工程師說沒有,只是代表那一局那個(gè)特定問題,正好機(jī)器可以解決。但依然不知道在什么情況下,阿爾法狗會(huì)繼續(xù)出錯(cuò)。所以深度學(xué)習(xí)這樣一個(gè)體系其實(shí)還是有瓶頸在的?!?/p>
去年11月份,王小川在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上展示了實(shí)時(shí)機(jī)器翻譯技術(shù),該技術(shù)可將演講者的中文同步翻譯成英文并實(shí)時(shí)上屏,被現(xiàn)場同聲傳譯的翻譯戲稱為職業(yè)終結(jié)者。不過在展示自己新技術(shù)的同時(shí),王小川聊得更多的還是:以深度學(xué)習(xí)為代表的今天的人工智能技術(shù),還有哪些不靠譜的地方?在產(chǎn)品上不適用之處有哪些?
拿語音識別來說,王小川表示現(xiàn)在技術(shù)在安靜的環(huán)境里面識別準(zhǔn)確度已經(jīng)到了97%,但是一旦有噪音,準(zhǔn)確率就會(huì)迅速下降。研究人員把汽車的引擎噪音、風(fēng)的噪音等等也加入了機(jī)器學(xué)習(xí)系統(tǒng),但是如果碰到兩個(gè)人在說話,同聲傳譯的機(jī)器又該怎么分辨?對于人來說,只要有細(xì)微的音色等差別就能夠把其中的一個(gè)聲音識別出來,和機(jī)器在處理過程當(dāng)中有巨大的不同。
“另外一件事情是語義靠譜嗎?”王小川說,去年自己在一個(gè)實(shí)驗(yàn)室看到最先進(jìn)的人機(jī)對話系統(tǒng),這個(gè)系統(tǒng)可以幫你訂餐訂酒店,對話過程當(dāng)中機(jī)器的表現(xiàn)非常驚艷,比如有一個(gè)環(huán)節(jié),機(jī)器問你:“你是需要停車位還是不要停車位?”這個(gè)時(shí)候我們回答要或者不要都沒問題,可是如果回答“我沒車”,問題就來了:因?yàn)闄C(jī)器完全不理解我沒車代表著我不需要停車位。所以很多對于人來講非常好理解的東西,對計(jì)算機(jī)的挑戰(zhàn)卻非常大,這是深度學(xué)習(xí)人工智能還不夠的地方。
王小川還跟記者提到了一個(gè)很敏感的問題:無人駕駛靠譜嗎?去年被炒得很熱的無人駕駛汽車,在王小川看來,確實(shí)在特定的或者封閉場景中都可以使用,但是對于真正開放的復(fù)雜的道路環(huán)境,技術(shù)還不成熟,也有可能會(huì)犯嚴(yán)重的錯(cuò)誤,“就像AlphaGo下棋一樣會(huì)突然發(fā)瘋”,所以作為輔助駕駛是可以的,真正無人駕駛目前還做不到。
翻開王小川的履歷,被稱為天才一點(diǎn)也不夸張,1978年出生于成都的他,從小就是學(xué)霸,還是那種還沒參加考試就被特招走的頂級學(xué)霸。中考,高考、研究生考、博士考,幾乎人生每個(gè)最重要的考試節(jié)點(diǎn),他不是特招就是保送,根本沒機(jī)會(huì)坐考場,還一路拿下無數(shù)大大小小、國內(nèi)國外的競賽大獎(jiǎng),幾乎慕煞一票頭懸梁錐刺股的學(xué)子;步入職場,還是實(shí)習(xí)生的他就為老板賺了2個(gè)億,27歲就成為了搜狐最年輕副總裁,如今身為搜狗CEO,公司估值甚至超過了350億……
在互聯(lián)網(wǎng)業(yè)界,有很多王小川的傳說,比如別人都把自己創(chuàng)業(yè)的公司比作兒子,可是他卻說搜狗就是自己的老婆;比如據(jù)說包括網(wǎng)易的丁磊、百度的李彥宏等諸多互聯(lián)網(wǎng)巨頭都曾來挖他,可是誰也沒挖走,最后一直到了2013年,馬化騰拍板投資4.48億美元戰(zhàn)略入股搜狗,還把旗下搜搜業(yè)務(wù)直接交給了王小川來做。
學(xué)霸出身的王小川不但是個(gè)工作狂,還是個(gè)技術(shù)狂。他告訴記者,現(xiàn)在機(jī)器能夠像人一樣聽懂東西了,會(huì)下棋了,會(huì)做面部識別了,但是自己特別想看看人的極限是怎樣的。比如之前《最強(qiáng)大腦》的水哥,他的眼睛比常人厲害很多,于是自己做搜狗輸入法的時(shí)候就會(huì)想,除了做語音識別之外,是否可以基于視覺可以做唇語的識別,看你的嘴唇怎么動(dòng)就能識別你說什么?“當(dāng)我把這個(gè)課題和工程師討論的時(shí)候,他們表示這個(gè)太難了,人都看不懂。這時(shí)候我們就跑去找水哥了,問他你覺得這個(gè)唇語識別能做到嗎?水哥說‘當(dāng)然’。我拿到這個(gè)消息就跟我們團(tuán)隊(duì)講,你看,人是可以做到的?!彼酝跣〈▓?jiān)持認(rèn)為,再難的事情只要技術(shù)足夠好是可能解決的,是我們的技術(shù)不夠,而不是這個(gè)題目不對。
快問快答
X=揚(yáng)子晚報(bào)記者 徐曉風(fēng)
W=王小川
X 一個(gè)最常被提到的問題,你認(rèn)為人工智能會(huì)把人干掉嗎?
W 我不認(rèn)為機(jī)器能把人干掉。創(chuàng)造生命太難了。我們有時(shí)候會(huì)高估人工智能現(xiàn)在的能力,開始想象人工智能是否會(huì)威脅人取代人,這是不存在的。但凡你和一些比較嚴(yán)肅的做學(xué)問的人聊的時(shí)候,大家都會(huì)不斷給你降低這里面的預(yù)期。
X 你以前曾舉例說,阿爾法狗看著很厲害,但如果把棋盤多添一個(gè)格子,可能就出了它的邏輯范疇了,有可能打敗它?
W 對,它得靠人的傳統(tǒng)經(jīng)驗(yàn)來訓(xùn)練。但凡操作經(jīng)驗(yàn)或者是數(shù)據(jù)量不夠,這個(gè)時(shí)候人是可以靠推理和思考來解決,但機(jī)器就不行了。人作為一個(gè)生命,有對環(huán)境的適應(yīng)能力,還有自我的繁衍能力,機(jī)器遠(yuǎn)遠(yuǎn)做不到。機(jī)器現(xiàn)在沒有生命,我們也沒有打算賦予其生命權(quán),我們今天關(guān)一臺電腦說關(guān)就關(guān)了,也沒有想這個(gè)電腦不高興了。換句話說,想造一個(gè)讓你害怕得想關(guān)掉它的機(jī)器,現(xiàn)在我們的能力也不夠。
X 我們用過一些翻譯軟件,尤其是一些學(xué)術(shù)上的東西,結(jié)果翻譯出來很可能句子的架構(gòu)、邏輯完全不通,還不如自己從頭來寫,現(xiàn)在人工智能的翻譯水平如何?
W 我原來在研究生里學(xué)過科技英語,非常嚴(yán)謹(jǐn),折騰得很,句子又臭又長,每個(gè)詞性都巨復(fù)雜,現(xiàn)在機(jī)器已經(jīng)能夠在這個(gè)架構(gòu)里輕松幫你解決掉。
X 你參加了一些科技的綜藝秀,現(xiàn)在其實(shí)很多大佬都會(huì)干這件事,但是你還沒有做過直播吧?你感興趣嗎?
W 我還沒做過,我不感興趣。
X 你覺得中美之間在人工智能領(lǐng)域的差距是什么樣的?
W 我覺得基礎(chǔ)研究上差距巨大。國外很多科學(xué)家真的能夠發(fā)明新的算法和新的體系結(jié)構(gòu)來解決人工智能的問題,我們基本是看論文,看誰能夠最快把論文的這些東西用到我們系統(tǒng)里去。我給你個(gè)數(shù)據(jù),全球前十大互聯(lián)網(wǎng)上市公司,中國占了4家,但全球前100所高校,中國只有兩家,一個(gè)清華一個(gè)北大,在這種研究能力上差距是巨大的。