理查德·費(fèi)曼(1918—1988,1965年諾貝爾物理學(xué)獎(jiǎng)得主)是著名的物理學(xué)家,他曾講過(guò)一個(gè)故事。
(相關(guān)資料圖)
某天下午,費(fèi)曼坐在巴西的一家咖啡館中思考,這時(shí)進(jìn)來(lái)一個(gè)賣(mài)算盤(pán)的日本人,打算向咖啡館推銷(xiāo)算盤(pán)。這個(gè)日本推銷(xiāo)員說(shuō)用算盤(pán)便于記賬(當(dāng)時(shí)還沒(méi)有計(jì)算機(jī)),但是咖啡館老板表示不想買(mǎi)。
咖啡館老板說(shuō):既然你說(shuō)這個(gè)東西計(jì)算很快,那我隨便找一個(gè)顧客(碰巧就是費(fèi)曼),你們兩個(gè)比試一下,看看機(jī)器人和人誰(shuí)的運(yùn)算更快。
比試開(kāi)始,首先是算加法,費(fèi)曼的速度完全沒(méi)辦法和算盤(pán)比,他還沒(méi)讀完數(shù)字,日本推銷(xiāo)員就已經(jīng)用算法算出得數(shù)了。后來(lái)費(fèi)曼說(shuō)要增加難度,算乘法,這時(shí)用算盤(pán)需要更多步驟,所以費(fèi)曼和算盤(pán)的速度差不多。
這下,日本推銷(xiāo)員說(shuō),這不行,我們要找一樣更難運(yùn)算的:開(kāi)立方根。
費(fèi)曼同意了,于是咖啡館老板隨機(jī)選定了1729.03這個(gè)數(shù)字。費(fèi)曼作為一個(gè)物理學(xué)家,碰巧知道12的立方是1728(一英尺等于12英寸,求立方體體積時(shí),這種運(yùn)算是很常見(jiàn)的),所以他只需要知道剩下的1.03怎么開(kāi)立方。
很快,在幾秒鐘內(nèi),費(fèi)曼通過(guò)使用“泰勒公式”算出了小數(shù)點(diǎn)后5位的得數(shù),給出了12.0025,這個(gè)數(shù)字和正確答案12.00238……的誤差是10萬(wàn)分之一。
幾分鐘后日本推銷(xiāo)員才喊出12,費(fèi)曼完勝算盤(pán)。
人與機(jī)器的角逐實(shí)際上各有優(yōu)劣,人的直覺(jué)和經(jīng)驗(yàn)是機(jī)器無(wú)法模仿與超越的,而機(jī)器在弱人工智能方面是勝過(guò)人類(lèi)的。一個(gè)簡(jiǎn)單的人造計(jì)算器沒(méi)有智能,但是可以在計(jì)算6位數(shù)乘以6位數(shù)的乘法上勝過(guò)人類(lèi)。100年前那個(gè)人造的手搖計(jì)算機(jī)在計(jì)算速度方面已經(jīng)超過(guò)人了。
機(jī)器確實(shí)有比人做得更好的地方,但是在需要直覺(jué)和經(jīng)驗(yàn)的場(chǎng)景下,機(jī)器往往無(wú)法勝過(guò)人。
人和機(jī)器在做決定時(shí),用的是兩種不同的方法。
人是用直覺(jué),直覺(jué)是人將各方面知識(shí)綜合在一起形成的,直覺(jué)讓人快速得到一個(gè)解決答案。
機(jī)器用的是“梯度下降”算法,這是在求解機(jī)器學(xué)習(xí)算法的模型參數(shù)時(shí),最常采用的方法之一。
機(jī)器做決策只有一個(gè)方法,就是先讓人類(lèi)找到“損失函數(shù)”,然后讓損失函數(shù)最小化。
從這方面看,機(jī)器沒(méi)有任何智能——是人寫(xiě)出損失函數(shù),然后讓機(jī)器執(zhí)行優(yōu)化算法。所以人們對(duì)機(jī)器的期望不能太高:機(jī)器在弱人工智能層面可以做得很好,但是用梯度下降的范式不可能產(chǎn)生強(qiáng)人工智能。
現(xiàn)在我們常說(shuō)的人工智能,與以前的人工智能最大的區(qū)別是:以前,人通過(guò)寫(xiě)計(jì)算機(jī)程序來(lái)制定規(guī)則,然后輸入一些數(shù)據(jù),讓計(jì)算機(jī)算出結(jié)果;而現(xiàn)在,是人把數(shù)據(jù)和結(jié)果輸入進(jìn)去,通過(guò)監(jiān)督和非監(jiān)督學(xué)習(xí)的算法,讓機(jī)器來(lái)學(xué)習(xí)并得到規(guī)則。
以前的人工智能叫做“專(zhuān)家系統(tǒng)”,是基于規(guī)則的;現(xiàn)在的人工智能則更多是讓系統(tǒng)根據(jù)數(shù)據(jù)去自動(dòng)優(yōu)化,學(xué)習(xí)底層邏輯。
就如所有機(jī)器一般,人工智能在某個(gè)方面可以很強(qiáng)大,但是復(fù)雜的算法常常被掩蓋在簡(jiǎn)單的界面里,使用者在不理解底層邏輯的情況下使用,可能會(huì)產(chǎn)生極壞的效果。就好比把機(jī)關(guān)槍交給一個(gè)三歲的小孩去用,結(jié)果會(huì)難以想象。
我們舉幾個(gè)例子。
有一位美國(guó)朋友給我們發(fā)來(lái)一張優(yōu)步的自動(dòng)駕駛汽車(chē)的照片,從中我們發(fā)現(xiàn)一處不對(duì)勁的地方:禁止左轉(zhuǎn)的紅燈亮的時(shí)候,車(chē)居然向左轉(zhuǎn)彎了。
后來(lái)我們討論了這個(gè)問(wèn)題,原來(lái)是因?yàn)橛?xùn)練自動(dòng)駕駛時(shí)使用的是人類(lèi)駕駛的數(shù)據(jù)記錄,有人在禁止左轉(zhuǎn)的紅燈亮的時(shí)候左轉(zhuǎn)過(guò),導(dǎo)致機(jī)器學(xué)到了這樣一個(gè)行為。
所以,人并不是一個(gè)完美的物種,如果機(jī)器完全向人類(lèi)學(xué)習(xí)的話(huà),也會(huì)學(xué)到人的一些壞習(xí)慣。
幾年前,幾位北航的教授做過(guò)一個(gè)研究,根據(jù)人們乘坐北京地鐵進(jìn)站和出站的情況,畫(huà)出一些曲線(xiàn),把人分成幾種類(lèi)型。
例如,游客會(huì)去圓明園、香山;購(gòu)物者會(huì)去西單、王府井;而小偷的行為曲線(xiàn)與正常人群是非常不一樣的。
是否可以用人工智能分析所有人的行為軌跡,找出小偷呢?
可以。
但是另一種分析方法則是比較危險(xiǎn)的。
美國(guó)新澤西州的警監(jiān)說(shuō):“我們用大數(shù)據(jù)技術(shù)能夠算出什么樣的人會(huì)比較容易犯罪,并算出他們?cè)谑裁磿r(shí)候會(huì)犯罪,這樣可以提前預(yù)警。”
這讓我們想起科幻片《少數(shù)派報(bào)告》,這里最大的問(wèn)題就是,這樣的計(jì)算依賴(lài)的是人不可改變的數(shù)據(jù)平均值。平均來(lái)講,黑人的犯罪率更高,但是并不代表每個(gè)黑人的犯罪概率都高,用平均值算出來(lái)的結(jié)論如果推廣開(kāi)來(lái),對(duì)黑人個(gè)體就是很不公平的,而在很多場(chǎng)景下是很危險(xiǎn)的。
從算法上講,我們不能只看平均效果,還要看個(gè)體行為。
這與抓小偷的區(qū)別在于:美國(guó)新澤西州的警監(jiān)抓罪犯的方法,是根據(jù)對(duì)方的年齡和膚色這些自身無(wú)法改變的因素來(lái)判斷的,這樣會(huì)冤枉好人;而前面抓小偷的方法則是根據(jù)對(duì)方的行為,根據(jù)行為的判斷就沒(méi)有問(wèn)題。
很多人工智能算法試圖追求的都是平均效果,但如果聚焦到人的話(huà),結(jié)論就會(huì)完全相反。
可見(jiàn),人工智能不是萬(wàn)能的,結(jié)果要靠人去解讀,人和機(jī)器要一起合作才是最優(yōu)的。
人工智能有兩個(gè)非常深刻的課題需要解決:一是過(guò)度擬合問(wèn)題(假如給了系統(tǒng)太多的自由度,讓它學(xué)到一些不該學(xué)的東西,那么它在樣本內(nèi)的表現(xiàn)很好,但是在樣本外就很差);二是因果關(guān)系的問(wèn)題(即便能發(fā)現(xiàn)兩個(gè)變量的強(qiáng)相關(guān)關(guān)系,也不能代表其中一個(gè)導(dǎo)致了另一個(gè)發(fā)生)。
這兩大挑戰(zhàn),是人工智能目前急需解決的問(wèn)題。
(張曉泉為香港中文大學(xué)商學(xué)院副院長(zhǎng)、決策科學(xué)與企業(yè)經(jīng)濟(jì)學(xué)系教授)
[責(zé)任編輯:linlin]
標(biāo)簽: