域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過
時(shí)至今日,你也很難估量2011年——微博上一個(gè)黃金時(shí)期,社科院農(nóng)村發(fā)展研究所教授于建嶸先生發(fā)起的“隨手拍照解救乞討兒”活動(dòng)產(chǎn)生的社會(huì)影響力。盡管轟轟烈烈的“人人拍照挽救拐賣兒童”因陷入某種狂熱而遭到質(zhì)疑,但公眾對(duì)這一事件的憤恨,對(duì)離散家庭的憐憫,依舊持續(xù)產(chǎn)生了在其他事件上并不常見的共情效應(yīng)——為數(shù)不多的社會(huì)題材院線電影,甚至有《失孤》和《親愛的》兩部與此相關(guān)。
不過現(xiàn)實(shí)是,由于查找與辨認(rèn)兒童唯有靠肉眼并不擅長(zhǎng)的照片對(duì)比,準(zhǔn)確率和效率上都非常有限,仍未從根本上改善這一社會(huì)悲劇。也因此,幾乎每年兩會(huì)都有人大代表提出與走失兒童相關(guān)議案,譬如去年就有代表建議:兒童出生時(shí)由政府免費(fèi)采集DNA,且所有孩子上戶口時(shí)必須核對(duì)DNA信息。然而經(jīng)濟(jì)學(xué)常識(shí)是,美好愿景與“社會(huì)成本”之間存在鴻溝,通過DNA比對(duì)需要巨大的技術(shù)成本。
一年之后,今年提出議案的換成了科技大佬李彥宏。3月3日,李彥宏在全國政協(xié)十二屆五次會(huì)議提案:利用已經(jīng)成熟的人工智能和大數(shù)據(jù)技術(shù),幫助解決走失兒童問題。
事實(shí)上,當(dāng)人工智能普遍被產(chǎn)業(yè)界視作未來社會(huì)下一代基礎(chǔ)設(shè)施,與之相關(guān)的提案當(dāng)然不只李彥宏一份,復(fù)星集團(tuán)董事長(zhǎng)郭廣昌也提案,希望更多醫(yī)療健康行業(yè)與人工智能技術(shù)相結(jié)合——而讓李彥宏和郭廣昌興奮的是,就在3月5日上午,第十二屆全國人民代表大會(huì)第五次會(huì)議在人民大會(huì)堂開幕,“人工智能”首次被寫入全國政府工作報(bào)告。
當(dāng)然,說回李彥宏的這份提案。其實(shí)多年來,輿論強(qiáng)大的共情作用讓不少科技企業(yè)都試圖改善這一現(xiàn)象:譬如兩年前頗為火爆的兒童智能穿戴設(shè)備,但遺憾的是,后來由于輻射高,續(xù)航差,GPS 誤差高等原因,被寄予厚望的可穿戴逐漸淪為一時(shí)玩物;此外微博也曾推出過“LBS地域情景化網(wǎng)格系統(tǒng)”,利用用戶位置信息有所作為。
與上述從“邊緣性”突圍的方式不同,李彥宏祭出的手段是過去一年多次提及的人工智能,在他看來,“近年來人工智能和大數(shù)據(jù)技術(shù)不斷完善,應(yīng)用日趨成熟,有望進(jìn)一步促進(jìn)兒童走失案件的偵破。一方面,人臉識(shí)別能夠提升圖像偵查效率,盡早鎖定失蹤兒童或涉案人員。另一方面,人臉識(shí)別能夠?qū)崿F(xiàn)海量人臉數(shù)據(jù)的跨年齡比對(duì),幫助偵破兒童走失積案。”
于是問題的關(guān)鍵轉(zhuǎn)向在公眾一端熟悉又陌生的詞匯:人臉識(shí)別。今天不妨從技術(shù)視角,分析一下李彥宏這一提案的理論基礎(chǔ)。畢竟,相較于DNA,“人臉”是大眾更熟悉且成本低得多的識(shí)別對(duì)象。
人類思維VS機(jī)器思維
進(jìn)化心理學(xué)告訴我們:由于祖先族群內(nèi)原始的協(xié)作需求——以及識(shí)別“異己者”和“不合作者”的本能,人類大腦從上百萬年前就演化出了識(shí)別人臉的能力。而也正由于這上百萬年“時(shí)間差”造成的演化沉淀,識(shí)別他人面孔歸屬于大腦應(yīng)激反應(yīng)的所謂快系統(tǒng),或者說直覺——不過,機(jī)器世界里從來沒有“直覺”二字,有的只是算法和數(shù)據(jù)。
這亦是人臉識(shí)別技術(shù)難度所在。不同于一般圖像識(shí)別,人類臉部結(jié)構(gòu)存在極大相似性;且表情易變(人類究竟有多少種表情?我還沒看到特別權(quán)威的數(shù)字,但至少比“表情包”豐富得多);另外,不同的觀察角度,光照條件,遮蓋物(口罩,墨鏡,頭發(fā),胡須等等)都會(huì)增加機(jī)器識(shí)別難度;更何況喪心病狂的人類居然還通過整容和P圖等行為擾亂機(jī)器判斷……
不過即便如此,當(dāng)如今人工智能已發(fā)展到“只要人類正常情況下1秒就能做的事,它幾乎也能做到”的地步,人臉識(shí)別的技術(shù)進(jìn)步也令人欣喜。
顧名思義,作為一種集成了機(jī)器學(xué)習(xí),模型理論,專家系統(tǒng),視頻圖像等多種技術(shù)的綜合實(shí)現(xiàn)方式,人臉識(shí)別可以實(shí)現(xiàn)人臉檢測(cè),對(duì)比以及查找。而這一輪人臉識(shí)別精準(zhǔn)性的提升,無疑受益于在海量數(shù)據(jù)加持下的深度學(xué)習(xí)(作為一次算法革命,深度學(xué)習(xí)以一種簡(jiǎn)練的網(wǎng)絡(luò)模型解決了過往印象中極為復(fù)雜的思維體系):換句話說,為了在“茫茫人臉”中認(rèn)出特定面孔,機(jī)器需要先自己“記住”上億張人臉。
這就得說到機(jī)器思維的底層邏輯。與人類思維試圖將整個(gè)世界簡(jiǎn)化和抽象理解不同(大腦帶寬有限,人類對(duì)因果關(guān)系和“貼標(biāo)簽”的熱衷皆因于此),機(jī)器思維走在了奧卡姆剃刀原則的反面——人工智能不會(huì)將世界簡(jiǎn)化,而是從復(fù)雜信息中以自己的方式進(jìn)行篩選。
舉個(gè)例子,在那期被廣泛熱議的《最強(qiáng)大腦》人機(jī)大戰(zhàn)中,人工智能與世界記憶大師王峰通過分析照片中出現(xiàn)的幼年人臉,識(shí)別出現(xiàn)場(chǎng)20年后的成年人,人工智能贏了,但要知道,截止這場(chǎng)比賽前,百度已動(dòng)用大概200萬人次,近2億張照片作為訓(xùn)練樣本數(shù)據(jù),通過提取人臉中相對(duì)穩(wěn)定和細(xì)微的特征,完成年齡跨度較大的人像高精度比對(duì)。
從“競(jìng)賽”角度,人類與機(jī)器并不在同一起跑線,但也就在那次節(jié)目上,初為人母的章子怡女士感慨道:“我們有很多的失蹤兒童,他成長(zhǎng)了之后可能連父母都認(rèn)不出來他的樣子,但小度可以幫我們辨別出來,所以小度要為人類作出更多貢獻(xiàn)。”
不知道李彥宏的兩會(huì)提案,是否與此有關(guān)。
人臉識(shí)別技術(shù)路徑
在我看來,已頗為成熟的人臉識(shí)別技術(shù),倒不失為一次理解機(jī)器思維的好機(jī)會(huì)。
事實(shí)上,人臉識(shí)別的實(shí)現(xiàn)大體可分為四步。第一步當(dāng)然是人臉檢測(cè):根據(jù)眼睛,眉毛,嘴巴,鼻子等器官特征和相互幾何位置關(guān)系檢測(cè)人臉。第二步則是人臉圖像預(yù)處理:如前所述,原始圖像由于受各種條件的限制和干擾,很多時(shí)候無法直接使用,必須在早期階段對(duì)其進(jìn)行灰度校正,噪聲過濾等圖像預(yù)處理。進(jìn)一步剖析的話,這種預(yù)處理主要包括人臉對(duì)準(zhǔn)(得到人臉位置端正的人臉圖像),圖像增強(qiáng)(改善圖像質(zhì)量,在視覺上更清晰,且讓圖像更利于計(jì)算機(jī)的處理與識(shí)別)以及歸一化(取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像)等工作。
人臉識(shí)別的第三步就是臉圖像特征提取——這一步是針對(duì)人臉某些特征進(jìn)行的,也是對(duì)人臉進(jìn)行特征建模的過程。最后一步,即是輸出結(jié)果的匹配與識(shí)別:將待識(shí)別的人臉特征與已得到的人臉特征模板進(jìn)行比較,根據(jù)相似程度對(duì)人臉的身份信息進(jìn)行判斷。
以上是適用于所有識(shí)別用途的理論路徑,但李彥宏在提案中涉及的場(chǎng)景則更為復(fù)雜:“可能孩子是在很小的時(shí)候走失的,但他再進(jìn)入公眾視線可能已經(jīng)上小學(xué)了——比如辦學(xué)生證的時(shí)候需要拍照片,這種情況下通過人工智能的比對(duì),就有可能比以前更加高效的幫助有關(guān)部門和家庭找到走失兒童。”
就像章子怡冀望的那樣,對(duì)比走失兒童是“跨年齡人臉識(shí)別”技術(shù)最具社會(huì)價(jià)值的實(shí)現(xiàn)場(chǎng)景。但在影響人臉識(shí)別率的所有因素上,時(shí)間往往是最難對(duì)抗的部分,原因之一是跨年齡識(shí)別中類內(nèi)變化通常會(huì)大于類間變化;另外,跨年齡訓(xùn)練數(shù)據(jù)難尋,若沒有海量數(shù)據(jù),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)便很難學(xué)習(xí)到跨年齡的類內(nèi)和類間變化。不過百度也提出了解決方案:針對(duì)第一點(diǎn),他們選擇用度量學(xué)習(xí)的方法,通過學(xué)習(xí)一個(gè)非線性投影函數(shù),把圖像空間投影到特征空間中,在這個(gè)特征空間里跨年齡的同一個(gè)人的兩張人臉距離會(huì)比不同人的相似年齡的兩張人臉的距離要??;而針對(duì)第二點(diǎn),考慮到跨年齡人臉的稀缺性,通過一個(gè)用大規(guī)模人臉數(shù)據(jù)訓(xùn)練好的模型作為底座,然后用跨年齡數(shù)據(jù)對(duì)他做更新。而將上述兩點(diǎn)結(jié)合,通過端到端的訓(xùn)練,即可以大幅提升跨年齡識(shí)別的識(shí)別率。
這也正是李彥宏此次提案的理論基礎(chǔ)。
培育共識(shí)
事實(shí)上,在準(zhǔn)備兩會(huì)提案時(shí),李彥宏已非常確信技術(shù)本身的成熟度。但要知道,讓技術(shù)落地從來都是檢驗(yàn)技術(shù)的唯一標(biāo)準(zhǔn)。其實(shí)人臉識(shí)別已廣泛應(yīng)用于諸多領(lǐng)域,最直接的例子是,早在提案前,百度人臉識(shí)別就已經(jīng)用于尋人平臺(tái)上,平臺(tái)現(xiàn)對(duì)接民政部全國救助尋親網(wǎng)中近3萬條走失人口信息。
不過,歷史經(jīng)驗(yàn)是:讓社會(huì)系統(tǒng)向更美好的方向演進(jìn),技術(shù)之外,還需要某種合力。通過人工智能尋找走失兒童亦不例外,它需要與相關(guān)部門相互嵌合,根據(jù)場(chǎng)景不斷調(diào)優(yōu)。也因?yàn)榇?,李彥宏在提案中的具體建議包括:建立適用于搜尋走失兒童的人臉識(shí)別模型;建立覆蓋全國的走失兒童數(shù)據(jù)庫;將人臉識(shí)別技術(shù)與治安和交通監(jiān)控系統(tǒng)相結(jié)合等。
在我看來,即便提案延緩落地,也不失為一次在整個(gè)社會(huì)范疇孕育共識(shí)的機(jī)會(huì),要知道,人工智能會(huì)成為未來服務(wù)公共事務(wù)的重要方式,但來自政府的頂層支持也是讓作為社會(huì)基礎(chǔ)設(shè)施的人工智能盡早落地的途徑。
如今,人工智能仿佛一個(gè)植入系統(tǒng),已經(jīng)改變了購物,金融,媒體,交通,外賣等生活各個(gè)日常片段,并期待自己如百年前的電力系統(tǒng)一般為人類延伸出更多的可能。所以你完全可以想象如下場(chǎng)景:《失孤》和《親愛的》中的父母不再通過持續(xù)多年的滿城尋覓,而是到公安機(jī)關(guān)錄入孩子照片,機(jī)器通過數(shù)據(jù)庫對(duì)比,尋找到匹配對(duì)象,以更能燃起希望的方式,讓故事以相對(duì)完滿的結(jié)局收?qǐng)觥?/p>
李北辰/文(知名科技自媒體,致力于用文字優(yōu)雅的文章,為您提供談資與見識(shí);微信公號(hào):李北辰)
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!