在2012年之前,很少有人(rén)會說自己是做(zuò)AI的(de),隻會說做(zuò)統計建模、統計學習(xí)這(zhè)些具體的(de)方向。但從2016年AlphaGo登上《自然》雜(zá)志,到美(měi)國著名的(de)《經濟學人(rén)》雜(zá)志多(duō)期報道,AI頻(pín)繁登上世界最著名的(de)雜(zá)志成爲封面主題,如今已經進入了(le)一個(gè)言必稱AI的(de)時(shí)代。與AI相關的(de)各種言論,關于機器學習(xí)、圖像識别、無人(rén)車、健康醫藥等等都逐步成爲熱(rè)點。而朱珑一直關注的(de)是未來(lái)到底AI能發生一些什(shén)麽?
沒有權威的(de)時(shí)代讓AI正變得(de)真假難辨
在朱珑的(de)演講中,他(tā)提到目前AI跟過去比較重大(dà)的(de)區(qū)别:因爲AI發展太快(kuài),現在技術處于一個(gè)很難辨别真假、好壞的(de)時(shí)代。以深度學習(xí)爲代表新的(de)AI技術,因爲過去參與的(de)人(rén)和(hé)實踐不多(duō),全球性研究的(de)大(dà)規模以及長(cháng)時(shí)間的(de)積累并不夠。因爲太“熱(rè)”,使得(de)各方都熱(rè)衷參與到AI的(de)討(tǎo)論,交流甚至宣傳當中,AI的(de)觀點就變得(de)非常多(duō),這(zhè)客觀上使得(de)很多(duō)專家真正有見地的(de)意見和(hé)其他(tā)的(de)言論很難區(qū)分(fēn)開來(lái),這(zhè)不僅是中國,在美(měi)國也(yě)是同樣。
另外一個(gè)則是:技術到了(le)一個(gè)沒有權威的(de)時(shí)代。過去不管是從計算(suàn)機視覺,還(hái)是整個(gè)人(rén)工智能領域,最好的(de)實驗室幾乎能夠壟斷預測全球百分(fēn)之七八十的(de)進展,但是現在AI無論是在美(měi)國,還(hái)是在中國或歐洲,大(dà)家的(de)發展是比較跳躍性的(de),在一兩個(gè)實驗室非常難預測主流到底在關注什(shén)麽。這(zhè)是整個(gè)時(shí)代的(de)特點。
朱珑的(de)背景是跨越學術界和(hé)工業界的(de)創業典型,經曆了(le)中國2012年到2018年這(zhè)五、 六年非常特殊的(de)階段,正如他(tā)在演講中提到的(de),過去中國沒有成熟的(de)科技創業的(de)情景和(hé)市場(chǎng)機制。過去,政府、投資者、媒體這(zhè)三者可(kě)以頻(pín)繁交流,在2012年之前,學術界不像今天這(zhè)樣經常會被政府或一流基金邀請交流。美(měi)國則因爲市場(chǎng)成熟,這(zhè)些人(rén)經常會在一起交流,甚至都是朋友。中國這(zhè)幾年開始,各種背景的(de)人(rén)在一起交流的(de)越來(lái)越多(duō),這(zhè)是新的(de)形态。
技術突破打開了(le)工業界應用(yòng)的(de)突破 技術上,2015年,機器識别人(rén)臉的(de)水(shuǐ)平正式超過人(rén)類。人(rén)臉識别中機器比人(rén)強,最簡單基礎應用(yòng)就是1:1的(de)比對(duì),證明(míng)你就是你,大(dà)家熟知的(de)是2017年iPhone推出的(de)刷臉開機;其次是1:N,是通(tōng)過任一設備裏捕捉到的(de)人(rén)臉,從一個(gè)省(億級)或一個(gè)國家的(de)人(rén)像庫(十億級)裏來(lái)回答(dá)你是誰,這(zhè)對(duì)識别性能的(de)要求提升了(le)一個(gè)量級,是千倍萬倍地增長(cháng)。這(zhè)意味著(zhe)識别技術的(de)突破,打開了(le)工業界中的(de)産品的(de)突破。
2012年之前,可(kě)以認爲人(rén)臉識别技術幾乎沒有什(shén)麽發展,2017年人(rén)臉識别最高(gāo)水(shuǐ)平可(kě)識别規模在20億人(rén),大(dà)概比2016年可(kě)識别千萬提高(gāo)兩百倍,比2015年提高(gāo)了(le)數萬倍。那未來(lái)的(de)發展到底是什(shén)麽樣?會不會再10倍、100倍甚至萬倍地發展?
大(dà)家現在也(yě)有個(gè)討(tǎo)論,技術是不是發展到了(le)瓶頸?各項算(suàn)法之間有沒有區(qū)别?随著(zhe)AI熱(rè)潮的(de)湧現,各家AI公司都會頻(pín)繁參加一些業界的(de)比賽以證明(míng)自己的(de)算(suàn)法實力,以人(rén)臉識别算(suàn)法爲例,可(kě)以看到各AI公司在LFW等類似的(de)計算(suàn)機視覺比賽中都取得(de)99.xx%的(de)成績。于是人(rén)們會問:AI算(suàn)法是否已經趨同了(le)?如果算(suàn)法精度差别不大(dà)(隻有幾個(gè)百分(fēn)點),是否意味著(zhe)創業公司的(de)技術已經同質化(huà)了(le),沒有技術創業的(de)核心競争力了(le)呢(ne)?
但實際上,這(zhè)是典型的(de)認知誤區(qū)。我們在朱珑的(de)演講中看到了(le)一張表,可(kě)能更準确的(de)回答(dá)了(le)這(zhè)個(gè)問題,這(zhè)是中國某省1億人(rén)像庫的(de)情況下(xià),真實的(de)刑偵案件的(de)破案環境的(de)性能測試對(duì)比的(de)表,參與方是知名的(de)幾大(dà)人(rén)臉識别公司:
我們可(kě)以這(zhè)樣理(lǐ)解這(zhè)張圖:必須對(duì)應場(chǎng)景來(lái)談算(suàn)法精度。不同場(chǎng)景的(de)算(suàn)法精度不具備任何可(kě)比性,甚至不代表有相關性。換句話(huà)說在簡單場(chǎng)景下(xià)算(suàn)法精度高(gāo),不代表在複雜(zá)的(de)高(gāo)難度場(chǎng)景下(xià)有更大(dà)的(de)概率可(kě)以把算(suàn)法精度做(zuò)高(gāo),就比如在小學生的(de)考試中拿滿分(fēn),不見得(de)可(kě)以在大(dà)學的(de)考試中也(yě)拿滿分(fēn)。因爲很多(duō)學術界的(de)比賽使用(yòng)的(de)都是公開數據集,數據集内多(duō)是互聯網照(zhào)片,類似于難度小的(de)開卷考試,大(dà)家很容易把測試成績刷到比較高(gāo)。但在實際的(de)應用(yòng)中則會遇到各種高(gāo)難度場(chǎng)景,包括變形、昏暗、逆光(guāng)、強光(guāng)、光(guāng)照(zhào)不均、低清、運動模糊、遮擋、跨年齡段比對(duì)等,在這(zhè)種情況下(xià)各家的(de)差距迅速拉開了(le),第二名和(hé)第一名的(de)錯誤率都會相差幾倍以上,遠(yuǎn)未到趨同的(de)程度。
第二,這(zhè)些實戰中的(de)技術差距體現在具體産品或應用(yòng)上,不是簡單的(de)好用(yòng)和(hé)一般好用(yòng)的(de)差距,而是可(kě)用(yòng)和(hé)不可(kě)用(yòng)的(de)差距。實戰中是要以最高(gāo)效率解決實際問題爲目的(de)的(de)。在一個(gè)1億級别人(rén)像系統中進行1:N的(de)靜态比對(duì)時(shí),錯誤率相差幾倍,就導緻使用(yòng)者做(zuò)事效率下(xià)降幾倍,那麽自然而然,即使他(tā)使用(yòng)的(de)是一個(gè)多(duō)算(suàn)法平台,他(tā)也(yě)隻會傾向于使用(yòng)第一名的(de)算(suàn)法。 AI幫助探索人(rén)類智慧的(de)邊界
AI除了(le)在産業界的(de)實際應用(yòng)外,更能夠幫助我們理(lǐ)解人(rén)類的(de)智慧、人(rén)類智慧的(de)邊界。
我們以前是沒辦法了(le)解人(rén)類自己識别能力的(de)規模和(hé)精度,到底是什(shén)麽程度?過去沒法做(zuò)這(zhè)個(gè)科學實驗,1萬人(rén)還(hái)是10萬人(rén)你辨别不出來(lái)。而機器在大(dà)規模的(de)情況下(xià),很輕易地識别1億人(rén)、10億人(rén),甚至更多(duō)的(de)時(shí)候,機器識别就相當于提供了(le)一把尺子,根據相似度比例篩選出來(lái)給人(rén)去測,可(kě)以在有效的(de)時(shí)間裏面,測出一個(gè)人(rén)自己“看”這(zhè)個(gè)世界的(de)能力。
這(zhè)是人(rén)類第一次有一個(gè)非常穩定且強大(dà)的(de)機器,有識别能力看到人(rén)和(hé)機器智能差别到什(shén)麽程度。依圖曾做(zuò)過一個(gè)實驗,在幾千萬量級的(de)身份數據庫上,一個(gè)人(rén)把他(tā)女(nǚ)朋友生活照(zhào)輸入進去,在機器輸出相似度前十的(de)照(zhào)片中,他(tā)是非常難辨别哪張是他(tā)的(de)女(nǚ)朋友。過去機器認識生人(rén)的(de)能力比人(rén)強,但是今天機器識别熟人(rén)臉的(de)能力也(yě)超越人(rén)了(le)。
今天機器是有了(le)高(gāo)性能的(de),比人(rén)類大(dà)很多(duō)倍的(de)這(zhè)種識别能力,能夠幫助我們回答(dá)這(zhè)些更有趣的(de)問題:在13億中國人(rén)中有多(duō)少人(rén)跟你長(cháng)的(de)一模一樣?一模一樣我們可(kě)以先定義爲自己的(de)媽媽辨别不出來(lái)誰是誰。經過依圖的(de)實驗,結果是,每1億人(rén)當中有一個(gè)人(rén)跟你長(cháng)的(de)一樣,所以全中國差不多(duō)12個(gè)人(rén)跟你長(cháng)的(de)一模一樣的(de)。
這(zhè)個(gè)意味著(zhe)什(shén)麽? 1億人(rén)當中有一個(gè)人(rén)跟你長(cháng)的(de)像,這(zhè)又意味著(zhe)什(shén)麽? 人(rén)類進化(huà)過程中,視覺識别能力在各大(dà)感官中的(de)比重越來(lái)越大(dà),也(yě)可(kě)能是人(rén)類穿衣服,嗅覺識别家庭成員(yuán)的(de)能力在哺乳動物(wù)中比較低下(xià),主要是看人(rén)臉來(lái)辨别同類。選擇壓力驅使人(rén)類的(de)臉之間的(de)區(qū)分(fēn)度需要盡量的(de)大(dà),這(zhè)樣保證家庭成員(yuán)的(de)穩定性得(de)到保障。 而人(rén)作爲社群動物(wù),需要和(hé)大(dà)量同類打交道,臉部識别錯誤的(de)代價是失去整個(gè)基因組的(de)遺傳繼承。對(duì)應的(de)編碼人(rén)臉形狀的(de)基因數量需要很大(dà),目前知道有一條染色體的(de)一大(dà)塊用(yòng)于編碼臉部特征。一億分(fēn)之一的(de)識别度是一個(gè)具有巨大(dà)社會學意義的(de)統計數值,背後更多(duō)的(de)生物(wù)學意義需要更近一步探討(tǎo)。與之對(duì)應的(de)一個(gè)未經實驗證實的(de)觀察是,動物(wù)的(de)臉部特征區(qū)分(fēn)度不像人(rén)類這(zhè)麽大(dà)。比如貓和(hé)狗,光(guāng)看臉,我們很不容易區(qū)分(fēn)出來(lái)。
臉部信息對(duì)于身份的(de)确認是非常重要的(de),人(rén)類如果不具備辨别能力,出門回來(lái)之後你認不出你的(de)小孩、老婆,就會出現社會的(de)騷亂,所以說人(rén)臉識别對(duì)基因的(de)進化(huà)有非常巨大(dà)的(de)影(yǐng)響。