第四次工业革命:人工智能(AI)入门
轉(zhuǎn)載自 http://www.infoq.com/cn/articles/the-fourth-industrial-revolution-an-introduction-to-ai
“過(guò)去10年我們?cè)诿τ诖蛟煲苿?dòng)為先的世界。未來(lái)10年,我們將步入AI為先的世界。”(谷歌CEO Sundar Pichai,2016年10月)
從亞馬遜到Facebook,再到谷歌和微軟,全球最頂尖、最有影響力的技術(shù)公司都將目光轉(zhuǎn)向了人工智能(AI)。AI到底是什么?為何如此重要?為何現(xiàn)在變得重要?雖然人們對(duì)AI的關(guān)注與日俱增,但對(duì)該領(lǐng)域有著充分理解的依然僅僅只是業(yè)內(nèi)專家。本文意在讓更多人了解這一重要的前沿領(lǐng)域。
本文首先會(huì)介紹“AI”的含義以及包括“機(jī)器學(xué)習(xí)”在內(nèi)的一些關(guān)鍵詞。我們將介紹“深度學(xué)習(xí)”這一最有成效的AI分支是如何實(shí)現(xiàn)的。同時(shí)還會(huì)介紹AI試圖解決的問(wèn)題以及這些問(wèn)題的重要性。最后,我們還將深入介紹為何早在二十世紀(jì)五十年代就已誕生的AI這一概念直到今天才開(kāi)始逐漸成熟。
作為風(fēng)險(xiǎn)投資人,我們需要緊跟能為消費(fèi)者和企業(yè)創(chuàng)造價(jià)值的新興趨勢(shì)。我們認(rèn)為AI是計(jì)算領(lǐng)域的一次革命,其重要性甚至遠(yuǎn)遠(yuǎn)超過(guò)移動(dòng)或云計(jì)算。“這實(shí)在難以用言語(yǔ)表達(dá),”亞馬遜CEO Jeff Bezos寫道:“未來(lái)20年里,人工智能對(duì)全社會(huì)產(chǎn)生的影響將大到難以想象。”希望本文可以破除各種喧囂炒作,向消費(fèi)者或企業(yè)高管,以及創(chuàng)業(yè)者和投資人解釋這一新興趨勢(shì)如此重要的原因。
1. AI是什么?
人工智能:研究智能程序的科學(xué)
“人工智能(AI)”這個(gè)詞由達(dá)特茅斯大學(xué)助理教授John McCarthy在1956年提出,作為一種統(tǒng)稱,AI可用于指代可體現(xiàn)出智能行為的硬件或軟件。按照McCarthy教受的說(shuō)法,這是一種“可以制造出智能的機(jī)器,尤其是智能的計(jì)算機(jī)程序的科學(xué)和工程。”
最基本的AI早在幾十年前就已誕生,當(dāng)時(shí)的AI可通過(guò)基于規(guī)則的程序,在某些特定情境中體現(xiàn)出最基本的“智能”。然而這類技術(shù)的發(fā)展一直受到各種限制,因?yàn)樽阋詰?yīng)對(duì)現(xiàn)實(shí)世界中各種問(wèn)題所需的算法實(shí)在是太過(guò)復(fù)雜,很難由人工編程的方式實(shí)現(xiàn)。
這里所謂的復(fù)雜的活動(dòng)包括做出醫(yī)學(xué)診斷、預(yù)測(cè)機(jī)器故障時(shí)間或衡量某些資產(chǎn)的市值,這些行為中往往涉及數(shù)千種數(shù)據(jù)集和大量變量之間的非線性關(guān)系。這種情況下通常難以通過(guò)現(xiàn)有數(shù)據(jù)獲得最佳效果,即對(duì)我們的預(yù)測(cè)進(jìn)行“優(yōu)化”。對(duì)于其他一些情況,例如識(shí)別圖片中的物體以及翻譯語(yǔ)言,此時(shí)我們甚至無(wú)法開(kāi)發(fā)出用于描述所需“功能”的規(guī)則。例如,我們?cè)撊绾瓮ㄟ^(guò)編寫一系列規(guī)則,使得程序能在任何情況下描述出一只狗的外觀?
如果能將做出各種復(fù)雜預(yù)測(cè)的困難工作,即數(shù)據(jù)優(yōu)化和特征(Feature)規(guī)范?,從程序員身上轉(zhuǎn)嫁給程序,情況又會(huì)怎樣?這正是現(xiàn)代化人工智能帶給我們的承諾。
機(jī)器學(xué)習(xí):承擔(dān)優(yōu)化任務(wù)
機(jī)器學(xué)習(xí)(ML)是AI的一個(gè)子集。所有機(jī)器學(xué)習(xí)都是AI,但并非所有AI都是機(jī)器學(xué)習(xí)(圖上圖1)。當(dāng)今人們對(duì)AI的興趣主要體現(xiàn)在對(duì)機(jī)器學(xué)習(xí)技術(shù)的關(guān)注中,使得這一技術(shù)快速獲得了顯著進(jìn)步。
機(jī)器學(xué)習(xí)使得我們可以將某些沉重的工作交給算法處理,進(jìn)而解決相對(duì)于人類來(lái)說(shuō)過(guò)于復(fù)雜的問(wèn)題。AI分支的先驅(qū)Arthur Samuel在1959年曾經(jīng)寫到,機(jī)器學(xué)習(xí)是“一種能夠讓計(jì)算機(jī)在無(wú)須進(jìn)行有針對(duì)性的編程情況下,自行獲得學(xué)習(xí)能力的學(xué)科領(lǐng)域。”
大部分機(jī)器學(xué)習(xí)技術(shù)的目標(biāo)在于針對(duì)特定用例開(kāi)發(fā)一種預(yù)測(cè)引擎。算法負(fù)責(zé)接收有關(guān)特定領(lǐng)域(例如某人過(guò)去看過(guò)的所有電影)的信息,通過(guò)對(duì)輸入的信息進(jìn)行權(quán)衡做出有用的預(yù)測(cè)(此人未來(lái)觀看其他種類電影的可能性)。通過(guò)實(shí)現(xiàn)讓“計(jì)算機(jī)自行學(xué)習(xí)的能力”,我們可以將優(yōu)化方面的任務(wù),即對(duì)可用數(shù)據(jù)中的不同變量進(jìn)行權(quán)衡,進(jìn)而面向未來(lái)做出精確的預(yù)測(cè),交給算法負(fù)責(zé)。有時(shí)候甚至可以更進(jìn)一步,將“需要考慮的未來(lái)”這種初步?jīng)Q策也交給程序處理。
機(jī)器學(xué)習(xí)算法可通過(guò)訓(xùn)練進(jìn)行學(xué)習(xí)。最開(kāi)始,可以為算法提供輸出結(jié)果為已知的樣本數(shù)據(jù),并將實(shí)際結(jié)果與預(yù)測(cè)結(jié)果的差異進(jìn)行對(duì)比,隨后對(duì)所輸入內(nèi)容的權(quán)重進(jìn)行調(diào)優(yōu),借此改善預(yù)測(cè)結(jié)果的精確度,直到最終獲得優(yōu)化。因此機(jī)器學(xué)習(xí)算法的界定性征(Defining characteristic)就在于通過(guò)經(jīng)驗(yàn)對(duì)預(yù)測(cè)結(jié)果進(jìn)行改善所能取得的質(zhì)量。我們提供的數(shù)據(jù)越多(通常大到某種臨界點(diǎn)),就能創(chuàng)建出越好的預(yù)測(cè)引擎(如下圖2和圖3,需要注意,所需數(shù)據(jù)集的規(guī)模嚴(yán)重取決于具體情境,但無(wú)法從下列范例中加以概括。)
目前機(jī)器學(xué)習(xí)方法已經(jīng)超過(guò)15種,每種都可以使用不同的算法結(jié)構(gòu)通過(guò)收到的數(shù)據(jù)對(duì)預(yù)測(cè)進(jìn)行優(yōu)化。作為其中的一種方法,“深度學(xué)習(xí)”在很多全新領(lǐng)域?qū)崿F(xiàn)了突破性的結(jié)果,下文將詳細(xì)介紹。算法其實(shí)還有很多,其他算法雖然不像深度學(xué)習(xí)那樣獲得了最為廣泛的關(guān)注,但也有自己的價(jià)值,因?yàn)榭梢赃m用于更廣泛的用例中。除了深度學(xué)習(xí),其他最實(shí)用的機(jī)器學(xué)習(xí)算法還包括:
- “Random forests(隨機(jī)叢林)”,通過(guò)創(chuàng)建大量決策樹(shù)對(duì)預(yù)測(cè)進(jìn)行優(yōu)化;
- “Bayesian networks(貝葉斯網(wǎng)絡(luò))”,使用基于概率的方法分析變量和變量之間的關(guān)系,以及
- “支持向量機(jī)(Vector machine)”,可通過(guò)多種分類樣本并創(chuàng)建模型將新的輸入內(nèi)容分配給某一分類。
每種方法各有利弊,并能混合使用(一種“綜合”方法)。針對(duì)特定問(wèn)題選擇哪種算法,主要取決于各種因素,包括可用數(shù)據(jù)集的本質(zhì)特征等。實(shí)際上開(kāi)發(fā)者通常趨向于通過(guò)多種實(shí)驗(yàn)確定最佳算法。
機(jī)器學(xué)習(xí)技術(shù)的用例因具體需求和想象力而各不相同。只要有合適的數(shù)據(jù),我們就可以為無(wú)數(shù)用途構(gòu)建所需的算法,例如:根據(jù)購(gòu)買記錄推薦顧客可能愿意購(gòu)買的產(chǎn)品,預(yù)測(cè)汽車組裝流水線上的機(jī)械手什么時(shí)候會(huì)故障,預(yù)測(cè)郵件地址是否輸入有誤,估算某筆信用卡交易存在欺詐情況的可能性等。
深度學(xué)習(xí):開(kāi)始處理特征規(guī)范
就算借助通用用途的機(jī)器學(xué)習(xí)(隨機(jī)叢林、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)等),編寫能良好執(zhí)行某類任務(wù)的程序這也是一項(xiàng)困難的工作,從語(yǔ)言的理解到圖片中物體的識(shí)別不出其外。為什么?因?yàn)槲覀儫o(wú)法用足夠?qū)嵱貌⑶铱煽康姆绞矫鞔_指定所要優(yōu)化的特征。舉例來(lái)說(shuō),如果希望編寫能識(shí)別車輛圖片的計(jì)算機(jī)程序,我們根本不能通過(guò)為算法指定車輛特征的方式確保在任何情況下均能獲得正確的識(shí)別結(jié)果。車輛有著不同的外形、尺寸和顏色,車輛的位置、朝向以及具體形態(tài)也多種多樣。背景、光照,以及眾多其他因素都會(huì)對(duì)物體的外觀產(chǎn)生影響。此時(shí)若要編寫規(guī)則,需要考慮的變化實(shí)在是太多了。就算可以做到這一切,整個(gè)解決方案的縮放能力也會(huì)受到極大限制:我們必須為打算識(shí)別的每個(gè)類型的物體分別編寫一套程序。
擁抱深度學(xué)習(xí)(DL)吧,該技術(shù)讓人工智能領(lǐng)域產(chǎn)生了脫胎換骨的革新。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,也是超過(guò)15種不同方法之一。所有深度學(xué)習(xí)均為機(jī)器學(xué)習(xí),但并非所有機(jī)器學(xué)習(xí)均為深度學(xué)習(xí)(見(jiàn)下圖4)。
深度學(xué)習(xí)很有用,避免了程序員不得不自行處理特征規(guī)范(定義要在數(shù)據(jù)種分析的特征)或優(yōu)化(如何對(duì)數(shù)據(jù)進(jìn)行權(quán)衡以提供更精確的預(yù)測(cè))的麻煩,這些可交給算法來(lái)做。
這是如何實(shí)現(xiàn)的?深度學(xué)習(xí)的突破之處在于對(duì)大腦,而非整個(gè)世界進(jìn)行建模。人類的大腦會(huì)學(xué)著做各種困難的事,例如理解語(yǔ)音和識(shí)別物體,這并不是通過(guò)事無(wú)巨細(xì)的規(guī)則實(shí)現(xiàn)的,而是通過(guò)各種實(shí)踐和反饋實(shí)現(xiàn)。孩提時(shí)期,我們會(huì)逐漸開(kāi)始探索整個(gè)世界(例如看到一張汽車的圖片),做出預(yù)測(cè)(“看,汽車!”),并收到反饋(“你說(shuō)的沒(méi)錯(cuò)!”)。并不需要各種瑣碎的規(guī)則,我們可以通過(guò)訓(xùn)練自行學(xué)習(xí)。
深度學(xué)習(xí)使用了類似的方法。人工制造的僅僅是基于軟件的計(jì)算器,借此模擬出與大腦中神經(jīng)元相互連接后所實(shí)現(xiàn)的類似功能。通過(guò)這種計(jì)算機(jī)組成一個(gè)“神經(jīng)網(wǎng)絡(luò)”,接受輸入(繼續(xù)上文的例子,一張汽車的圖片),對(duì)輸入的內(nèi)容進(jìn)行分析進(jìn)而做出判斷,并了解自己的判斷是否正確。如果輸出結(jié)果是錯(cuò)誤的,將由算法對(duì)神經(jīng)元之間的連接進(jìn)行調(diào)教,進(jìn)而改變后續(xù)的預(yù)測(cè)。最初這個(gè)網(wǎng)絡(luò)可能會(huì)經(jīng)常犯錯(cuò),但隨著我們向TA提供數(shù)百萬(wàn)個(gè)樣本,神經(jīng)元之間的連接將獲得調(diào)優(yōu),使得整個(gè)神經(jīng)網(wǎng)絡(luò)能在幾乎所有情況下做出正確的判斷。實(shí)踐出(近似的)真知。
通過(guò)這種過(guò)程,隨著效果日漸好轉(zhuǎn),現(xiàn)在我們已經(jīng)可以:
- 識(shí)別圖片中的元素;
- 實(shí)時(shí)進(jìn)行兩種語(yǔ)言的互譯;
- 通過(guò)語(yǔ)音命令控制設(shè)備(例如蘋果的Siri、Google Now、亞馬遜Alexa,以及微軟小娜);
- 預(yù)測(cè)基因變異對(duì)DNA轉(zhuǎn)錄的影響;
- 分析客戶評(píng)論中的情緒;
- 檢測(cè)醫(yī)療影像中的腫瘤等。
深度學(xué)習(xí)并不能用來(lái)解決所有問(wèn)題。這種方式通常需要用極大量的數(shù)據(jù)集進(jìn)行訓(xùn)練。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和運(yùn)行需要投入大量計(jì)算處理能力,此外這種方法還存在“可解釋性”方面的問(wèn)題:可能很難知道某個(gè)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力是如何發(fā)展起來(lái)的。但因?yàn)槟軐㈤_(kāi)發(fā)者從復(fù)雜的特征規(guī)范任務(wù)中解脫出來(lái),深度學(xué)習(xí)已經(jīng)可以為各種重要問(wèn)題提供非常成功的預(yù)測(cè)引擎。因此深度學(xué)習(xí)已經(jīng)成為AI開(kāi)發(fā)者手中一款強(qiáng)大的利器。
2. 深度學(xué)習(xí)是如何工作的?
鑒于其重要性,我們有必要對(duì)深度學(xué)習(xí)的工作原理有所簡(jiǎn)單理解。深度學(xué)習(xí)需要使用人造的“神經(jīng)網(wǎng)絡(luò)”,這是一種相互連接的“神經(jīng)元”(基于軟件的計(jì)算器)的集合。
人造的神經(jīng)元可以接受一種或多種輸入。神經(jīng)元會(huì)針對(duì)輸入結(jié)果執(zhí)行數(shù)學(xué)運(yùn)算,并產(chǎn)生可輸出的結(jié)果。輸出的結(jié)果取決于每類輸入的“權(quán)重”以及神經(jīng)元的“輸入-輸出函數(shù)”配置(見(jiàn)下圖5)。輸入-輸出函數(shù)各異。神經(jīng)元可以是:
- 一種線性單位(Linear unit),輸出結(jié)果與輸入總權(quán)重成比例;
- 一種閾值單位(Threshold unit),輸出結(jié)果為兩個(gè)級(jí)別中的一種,取決于總輸入是否高于某一特定值;或
- 是一種S形單位(Sigmoid unit),輸出結(jié)果頻繁變化,而不像輸入那樣呈線性變化的態(tài)勢(shì)。
多個(gè)神經(jīng)元相互連接組成了神經(jīng)網(wǎng)絡(luò),一個(gè)神經(jīng)元的輸出可以成為另一個(gè)神經(jīng)元的輸入(見(jiàn)下圖6)。
神經(jīng)網(wǎng)絡(luò)可通過(guò)組織整理呈現(xiàn)為多層次神經(jīng)元(這也是“深度”這個(gè)詞的由來(lái))。其中“輸入層”負(fù)責(zé)接收將由網(wǎng)絡(luò)處理的信息,例如一組圖片。“輸出層”負(fù)責(zé)提供結(jié)果。輸入和輸出層之間還有“隱藏層”,大部分活動(dòng)均在這一層中發(fā)生。通常來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)上每一層神經(jīng)元的輸出內(nèi)容均可成為下一層神經(jīng)元的輸入內(nèi)容之一(見(jiàn)下圖7)。
用圖像識(shí)別算法作為例子來(lái)看看吧。假設(shè)要識(shí)別圖片中的人臉。將數(shù)據(jù)裝入神經(jīng)網(wǎng)絡(luò)后,第一層負(fù)責(zé)識(shí)別局部對(duì)比模式,例如圖片邊緣,這是一種“底層”特征。隨著圖片在整個(gè)網(wǎng)絡(luò)中流動(dòng),逐漸提取出“高層”特征,例如從邊緣到鼻子,再?gòu)谋亲拥矫婵?#xff08;見(jiàn)下圖8)。
在輸出層方面,根據(jù)訓(xùn)練效果,神經(jīng)網(wǎng)絡(luò)會(huì)就圖片是每種特定類型的可能性給出概率(人臉:97%;氣球:2%;樹(shù)葉:1%)。
通常來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程需要使用大量已經(jīng)進(jìn)行過(guò)分類的樣本。隨后算法會(huì)通過(guò)檢測(cè)出的錯(cuò)誤和神經(jīng)元之間的連接權(quán)重進(jìn)行調(diào)整,借此改善效果。優(yōu)化過(guò)程的重復(fù)性極高,訓(xùn)練完成后即可部署系統(tǒng)并對(duì)未分類圖片進(jìn)行評(píng)估。
上文描述的是一種很簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò),實(shí)際上神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可能各異,并且大部分都非常復(fù)雜。各種常見(jiàn)變體包括:同層神經(jīng)元之間的不同連接,每層神經(jīng)元數(shù)量的變化,以及將神經(jīng)元的輸出結(jié)果流向前一層網(wǎng)絡(luò)(“遞歸”神經(jīng)網(wǎng)絡(luò))的連接。
神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)和完善需要投入相當(dāng)多的技能。例如針對(duì)特定應(yīng)用調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),提供適宜的訓(xùn)練數(shù)據(jù)集,根據(jù)進(jìn)展調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),以及多種方法的混合使用等。
3. 為何AI如此重要?
AI如此重要,原因在于這種技術(shù)可以順利解決以往看來(lái)極為困難的問(wèn)題,而這些問(wèn)題的解決方案能夠應(yīng)用于關(guān)乎人類福祉的重要領(lǐng)域:健康、教育、商業(yè)、運(yùn)輸、公共事業(yè)、娛樂(lè)…… 自二十世紀(jì)五十年代開(kāi)始,人們對(duì)AI的研究主要側(cè)重于下列五大領(lǐng)域的“查詢”:
AI蘊(yùn)含著重大的價(jià)值,因?yàn)樵诤芏嗲榫诚?#xff0c;這些能力方面取得的最新進(jìn)展往往能催生出顛覆性(Revolutionary),而不僅僅是逐漸演變而來(lái)(Evolutionary)的其他能力。例如下文列舉了AI的部分(遠(yuǎn)非全部)應(yīng)用范例:
未來(lái)幾年里,機(jī)器學(xué)習(xí)能力將被運(yùn)用于幾乎所有領(lǐng)域的各種過(guò)程中。以企業(yè)中的某一個(gè)職能為例,例如公司內(nèi)部的人力資源(HR)活動(dòng),即可在下列不同過(guò)程中運(yùn)用機(jī)器學(xué)習(xí)技術(shù):
- 通過(guò)更完善的目標(biāo)定位、更智能的崗位匹配,以及部分程度上自動(dòng)化實(shí)現(xiàn)的評(píng)估改善人員招募過(guò)程;
- 通過(guò)對(duì)個(gè)人需求和可能出現(xiàn)的缺席進(jìn)行預(yù)測(cè)式規(guī)劃,改善員工管理能力;
- 通過(guò)向員工提供更有針對(duì)性的培訓(xùn)內(nèi)容建議,實(shí)現(xiàn)更有效的員工學(xué)習(xí)活動(dòng);以及
- 通過(guò)預(yù)測(cè)重要員工可能存在離職風(fēng)險(xiǎn)降低員工流失率。
隨著時(shí)間的發(fā)展,我們期待著機(jī)器學(xué)習(xí)能變成常態(tài)。機(jī)器學(xué)習(xí)遲早會(huì)成為開(kāi)發(fā)者人手必備的工具,最初也許只能對(duì)現(xiàn)有過(guò)程進(jìn)行改善,但有朝一日將實(shí)現(xiàn)徹底的革新。
機(jī)器學(xué)習(xí)的深遠(yuǎn)影響遠(yuǎn)遠(yuǎn)勝過(guò)這些直接產(chǎn)生的影響。深度學(xué)習(xí)已經(jīng)讓計(jì)算機(jī)視覺(jué)獲得了突飛猛進(jìn)的提高,例如目前的自動(dòng)駕駛機(jī)動(dòng)車(轎車和卡車)均已變?yōu)楝F(xiàn)實(shí)。但會(huì)產(chǎn)生怎樣的影響?以目前的英國(guó)為例,90%的人員和80%的貨物運(yùn)輸是在道路上進(jìn)行的,僅自動(dòng)駕駛機(jī)動(dòng)車本身就能產(chǎn)生下列影響:
- 安全性(90%的機(jī)動(dòng)車事故源于駕駛員注意力不集中);
- 就業(yè)(英國(guó)的貨運(yùn)和物流行業(yè)員工總數(shù)為220萬(wàn)人,年薪總和約為570億英鎊);
- 保險(xiǎn)(Autonomous Research預(yù)計(jì)經(jīng)過(guò)一段時(shí)間后英國(guó)的機(jī)動(dòng)車保險(xiǎn)保費(fèi)總額將減少63%);
- 經(jīng)濟(jì)(消費(fèi)者更愿意按需獲得交通服務(wù),而非自行購(gòu)置機(jī)動(dòng)車);
- 機(jī)動(dòng)車生產(chǎn)量、城市規(guī)劃、規(guī)章制度……
4. 為何AI直到今天才開(kāi)始成熟?
有關(guān)AI的研究始于二十世紀(jì)五十年代,經(jīng)歷過(guò)數(shù)次虛假的“黎明期”后,為何現(xiàn)在才迎來(lái)拐點(diǎn)?由于新算法的陸續(xù)完善,所適用數(shù)據(jù)的大幅豐富,用于訓(xùn)練的硬件日益強(qiáng)大,以及云服務(wù)對(duì)開(kāi)發(fā)者接受度的逐漸催化,AI的實(shí)際運(yùn)用效果在近些年有了大幅改進(jìn)。
1. 算法的改進(jìn)
雖然深度學(xué)習(xí)算不上一種新技術(shù)(早在1965年就有人提出了第一個(gè)實(shí)際有效的多層神經(jīng)網(wǎng)絡(luò)規(guī)范?),但最近十年來(lái)深度學(xué)習(xí)算法的革新催生出了截然不同的結(jié)果。
識(shí)別圖像中物體的能力隨著卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network)的發(fā)展產(chǎn)生了突飛猛進(jìn)的提高(如下圖9)。受到動(dòng)物視覺(jué)腦皮層工作原理啟發(fā)設(shè)計(jì)而來(lái)的CNN中,神經(jīng)網(wǎng)絡(luò)中的每一層均可充當(dāng)判斷特定模式是否存在所用的篩選器。2015年,微軟基于CNN的計(jì)算機(jī)視覺(jué)系統(tǒng)在對(duì)圖片中物體進(jìn)行識(shí)別方面實(shí)現(xiàn)了比人類更高的準(zhǔn)確度(計(jì)算機(jī):95.1%;人類:94.9%)。“據(jù)我們所知,”他們寫到:“我們的測(cè)試結(jié)果是計(jì)算機(jī)戰(zhàn)勝人類的首例。”CNN還可應(yīng)用于視頻和語(yǔ)音識(shí)別等更廣泛的領(lǐng)域。
與此同時(shí),隨著遞歸神經(jīng)網(wǎng)絡(luò)(RNN,Recurrent Neural Network)的誕生,語(yǔ)音和手寫識(shí)別方面也取得了飛速進(jìn)展(見(jiàn)下圖10)。不同于卷積神經(jīng)網(wǎng)絡(luò)僅“向下饋送”的運(yùn)作方式,RNN可通過(guò)反饋連接讓數(shù)據(jù)呈環(huán)路流動(dòng)。RNN還出現(xiàn)了一種更強(qiáng)大的新類型:長(zhǎng)短期記憶(LSTM,Long Short-Term Memory)模型。在額外的連接和內(nèi)存“細(xì)胞(Cell)”的幫助下,RNN可以“記住”自己在數(shù)千步操作之前看到的數(shù)據(jù),并使用這些數(shù)據(jù)對(duì)后續(xù)需要關(guān)注的內(nèi)容進(jìn)行解釋:這一特性對(duì)語(yǔ)音識(shí)別產(chǎn)生了巨大的幫助,因?yàn)閷?duì)下一個(gè)詞的理解通常會(huì)受到之前所處理詞匯的影響。從2012年開(kāi)始,谷歌就在使用LSTM驅(qū)動(dòng)Android中的語(yǔ)音識(shí)別系統(tǒng)。就在六周前,微軟工程師稱他們的系統(tǒng)實(shí)現(xiàn)了低至5.9%的單詞錯(cuò)誤率,這是有史以來(lái)首次接近人類能力的水平。
2. 專用硬件
圖形處理器(GPU)是一種特殊設(shè)計(jì)的電子電路,可大幅縮短為深度學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的時(shí)間。
現(xiàn)代化的GPU最初誕生于二十世紀(jì)九十年代末,當(dāng)時(shí)主要是為了為3D游戲和3D開(kāi)發(fā)應(yīng)用程序進(jìn)行加速。在3D環(huán)境中平移或縮放鏡頭需要重復(fù)用到一種名為矩陣計(jì)算的數(shù)學(xué)運(yùn)算過(guò)程,串行架構(gòu)的微處理器,包括當(dāng)今大部分計(jì)算機(jī)所用的CPU很不適合用來(lái)處理此類任務(wù)。為了更高效地執(zhí)行矩陣計(jì)算,GPU通常會(huì)使用大規(guī)模并行架構(gòu)來(lái)制造(Nvidia M40包含3,072個(gè)內(nèi)核)。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練會(huì)涉及大量矩陣計(jì)算。因此人們發(fā)現(xiàn)原本針對(duì)3D游戲設(shè)計(jì)的GPU其實(shí)很適合用來(lái)對(duì)深度學(xué)習(xí)過(guò)程加速。這樣做獲得了巨大的收效:一顆GPU即可讓神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間縮短5倍,針對(duì)一些比較大規(guī)模的問(wèn)題甚至可實(shí)現(xiàn)10倍甚至更高的加速。在配合針對(duì)深度學(xué)習(xí)框架進(jìn)行優(yōu)化的軟件開(kāi)發(fā)工具包之后,甚至還可以進(jìn)一步加快訓(xùn)練速度(見(jiàn)下圖11)。
3. 廣博的數(shù)據(jù)
深度學(xué)習(xí)所用的神經(jīng)網(wǎng)絡(luò)通常需要用大量數(shù)據(jù)集進(jìn)行訓(xùn)練,樣本數(shù)量從數(shù)千起步,甚至可高達(dá)數(shù)百萬(wàn)。好在數(shù)據(jù)的創(chuàng)建速度和可用性也經(jīng)歷了指數(shù)形式的增長(zhǎng)。今天,隨著我們步入“第三波”數(shù)據(jù)時(shí)代,人類平均每天會(huì)生成2.2EB(23億GB)數(shù)據(jù),全球數(shù)據(jù)總量中有90%是過(guò)去24個(gè)月內(nèi)創(chuàng)建的。
“第一波”的數(shù)據(jù)創(chuàng)建時(shí)代始于二十世紀(jì)八十年代,當(dāng)時(shí)創(chuàng)建的主要是文檔和事務(wù)數(shù)據(jù),這一時(shí)期還在可聯(lián)網(wǎng)臺(tái)式計(jì)算機(jī)的普及過(guò)程中獲得了催化。隨后“第二波”數(shù)據(jù)時(shí)代,在可聯(lián)網(wǎng)智能手機(jī)的推動(dòng)下,誕生了大量非結(jié)構(gòu)化媒體數(shù)據(jù)(郵件、照片、音樂(lè)、視頻)、Web數(shù)據(jù),以及各種元數(shù)據(jù)。今天我們正在步入數(shù)據(jù)的“第三個(gè)時(shí)代”,工業(yè)設(shè)施和家庭中部署的機(jī)器傳感器創(chuàng)造了更多監(jiān)視用數(shù)據(jù)、分析用數(shù)據(jù),以及更多元數(shù)據(jù)。
考慮到今天我們所創(chuàng)建的大部分?jǐn)?shù)據(jù)都會(huì)通過(guò)互聯(lián)網(wǎng)傳輸,日益膨脹的互聯(lián)網(wǎng)流量也開(kāi)始充當(dāng)人類海量數(shù)據(jù)生成過(guò)程中的代理。1992年,全人類每天平均傳輸100GB數(shù)據(jù),但到2020年,我們將每秒傳輸61,000GB數(shù)據(jù)(見(jiàn)下圖12,請(qǐng)注意尺度的變化)。
除了通用數(shù)據(jù)的富足,專用數(shù)據(jù)資源也在機(jī)器學(xué)習(xí)的推動(dòng)下與日俱增。例如ImageNet是一個(gè)免費(fèi)提供的數(shù)據(jù)庫(kù),其中已經(jīng)包含超過(guò)1千萬(wàn)張手工分類的圖片。該資源的誕生也對(duì)深度學(xué)習(xí)算法物體分類能力的發(fā)展起到了推波助瀾的效果。
4. 云服務(wù)
開(kāi)發(fā)者對(duì)機(jī)器學(xué)習(xí)的運(yùn)用還受到云端機(jī)器學(xué)習(xí)基礎(chǔ)架構(gòu)和業(yè)界領(lǐng)先云供應(yīng)商所提供服務(wù)的推動(dòng)。
谷歌、亞馬遜、微軟,以及IBM均提供了云端基礎(chǔ)架構(gòu)(用于構(gòu)建和迭代模型的環(huán)境,提供可縮放“GPU即服務(wù)”產(chǎn)品,并提供其他相關(guān)托管服務(wù)),這也使得機(jī)器學(xué)習(xí)能力的開(kāi)發(fā)成本和難度大幅降低。
此外他們還提供了正在飛速發(fā)展的一系列云端機(jī)器學(xué)習(xí)服務(wù),開(kāi)發(fā)者可將其(從圖像識(shí)別到語(yǔ)言翻譯)直接用于自己的應(yīng)用程序內(nèi)。谷歌的機(jī)器學(xué)習(xí)服務(wù)針對(duì)下列領(lǐng)域提供了易于訪問(wèn)的服務(wù):視覺(jué)(物體識(shí)別、顯性內(nèi)容檢測(cè)、人臉檢測(cè)、圖像情緒分析);語(yǔ)音(語(yǔ)音識(shí)別和語(yǔ)音到文字轉(zhuǎn)換);文字分析(實(shí)體識(shí)別、情緒分析、語(yǔ)言檢測(cè)和翻譯);以及職員工作搜索(機(jī)會(huì)呈現(xiàn)和基于資歷的匹配)。微軟認(rèn)知服務(wù)也提供了涵蓋視覺(jué)、語(yǔ)音、語(yǔ)言、知識(shí)和搜索等領(lǐng)域的超過(guò)21種服務(wù)。
5. 興趣和創(chuàng)業(yè)者
公眾對(duì)AI的興趣在過(guò)去五年里增加了六倍(見(jiàn)下圖13),風(fēng)投公司對(duì)AI公司的注資金額也有了顯著增長(zhǎng)(見(jiàn)下圖14)。我們已經(jīng)進(jìn)入了一種良性循環(huán)的境地,機(jī)器學(xué)習(xí)的進(jìn)一步發(fā)展正在繼續(xù)吸引投資、創(chuàng)業(yè)者,以及社會(huì)各界的關(guān)注。尤其是后者,對(duì)機(jī)器學(xué)習(xí)的未來(lái)發(fā)展意義重大。
5. 接下來(lái)會(huì)怎樣?
機(jī)器學(xué)習(xí)能帶來(lái)數(shù)量眾多、意義重大的收益。很多收益是看得見(jiàn)的,從無(wú)人駕駛機(jī)動(dòng)車到新的人機(jī)交互方式等。還有一些收益雖然不那么明顯,但也會(huì)對(duì)日常業(yè)務(wù)流程和消費(fèi)者服務(wù)提供更強(qiáng)大的能力和效率。
與任何范式轉(zhuǎn)變過(guò)程一樣,有時(shí)過(guò)高的期望可能會(huì)超出短期內(nèi)所能實(shí)現(xiàn)的潛力。我們期待著未來(lái)某一時(shí)刻,人們對(duì)AI的幻想能夠徹底幻滅,隨之而來(lái)的將會(huì)是長(zhǎng)期、持續(xù)的價(jià)值認(rèn)可,因?yàn)闄C(jī)器學(xué)習(xí)已經(jīng)被用于改善并革新現(xiàn)有的系統(tǒng)。
在歷史上,工業(yè)革命曾通過(guò)新的電力和傳送方式改變了生產(chǎn)和交流方法。第一次工業(yè)革命在十八世紀(jì)八十年代使用蒸汽機(jī)驅(qū)動(dòng)了機(jī)械化的生產(chǎn)過(guò)程;第二次工業(yè)革命在十九世紀(jì)七十年代使用電力推動(dòng)了商品的大規(guī)模量產(chǎn);第三次工業(yè)革命在二十世紀(jì)七十年代使用電子和軟件技術(shù)實(shí)現(xiàn)了生產(chǎn)和交流的自動(dòng)化。今天,隨著軟件逐漸“蠶食”整個(gè)世界,我們創(chuàng)造價(jià)值的主要來(lái)源已成為信息本身的處理。通過(guò)用更智能的方式完成這樣的工作,機(jī)器學(xué)習(xí)將低調(diào)地為我們帶來(lái)效益和歷史意義。
作者:David Kelnar,閱讀英文原文:The fourth industrial revolution: a primer on Artificial Intelligence (AI)
轉(zhuǎn)載于:https://www.cnblogs.com/hwBeta/p/7571051.html
總結(jié)
以上是生活随笔為你收集整理的第四次工业革命:人工智能(AI)入门的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 冯志远0920
- 下一篇: Python Day28