肖仰华 | 做个“有知识”的机器人
本文轉載自公眾號:知識工場。
? ? ? ? ? ??
肖仰華博士,復旦大學計算機科學與技術學院教授,博士生導師,知識工場實驗室負責人。
本文是肖仰華教授應《中國計算機學會通信》邀請所撰寫的特邀文章,全文見 CCCF 2019 年第 5 期。
摘要:時下人工智能(AI)飛速發展,AI最為吸引人眼球的載體不外乎實體化的機器人。越來越多的機器人,特別是服務機器人“飛入”尋常百姓家。機器人產業似乎一片繁榮。然而,看似繁華的表象背后隱藏著深深的憂患。我們的服務機器人在很多看似簡單的任務中卻“出乎意料”地難以勝任。我們一直“夢想”著讓服務機器人為人類服務,比如端茶倒水,但如此簡單的任務卻難倒幾乎所有的機器人。因為機器人必須要知道水是要往杯子里倒的而不是向人嘴里灌的,并且快倒滿了就不能再倒。凡此種種,在復雜的開放環境中可能會用到的知識幾乎不可窮盡。這些對機器而言異常困難的知識積累與應用對于我們人類而言卻是十分簡單。讓機器“有知識”將成為進一步發展機器人產業的關鍵舉措。在向這一宏偉目標邁出征程之前,很多基本問題需要得到澄清。讓機器“有知識”何以必要?為何困難?是否可行?如何做到?本文嘗試對這些問題作一初步回答。
隨著我國人工智能戰略的持續推進,作為人工智能的重要分支的機器人產業迎來了發展的黃金期。其中,各種服務機器人,包括客服機器人、陪伴機器人、問診機器人、導購機器人、理財機器人等已經日益融入到人們的日常生活中。與工業機器人相比,服務機器人對機器的認知水平要求更高,而對動作能力要求相對較低。因此,決定服務機器人服務效果的是大腦而非四肢。建設具有一定認知能力的機器智腦是服務機器人產業發展的至關重要的環節。而機器智腦的重要組成部分是知識庫。機器是否具有知識并且能夠利用知識形成認知能力進而解決問題,是服務機器人更好地造福人類社會的關鍵。
引言自人工智能提出之初,讓機器利用人類的知識解決問題就一直是重要的發展思路之一。上世紀七十年代發展起來的專家系統,就是以“讓機器利用專家知識來解決現實問題”作為基本目標。以構建專家系統為核心目標的知識工程成為符號主義思潮的代表,與以神經網絡為代表的連接主義交相輝映,成為人工智能發展歷程中最為亮麗的兩道風景線。近年來,伴隨著大數據技術飛速發展,知識工程進入了大數據知識工程的全新階段。以知識圖譜為代表的大規模知識表示不僅為大數據的價值挖掘帶來了全新機遇,也為機器智腦的發展帶來全新機遇。大數據知識工程以大規模自動化知識獲取為其根本特征。自動化知識使得知識庫的規模呈幾何級數增長。知識庫在規模上的量變正在醞釀著知識庫在效用上的質變。這一質變對于機器智腦而言集中體現在構建一個能夠應對開放復雜世界的機器智腦成為可能。
大數據知識工程將為機器人打造一顆“最強大腦”。伴隨著這一發展進程的將是機器認知智能的逐步發展。認知智能發展過程本質上將是人類腦力不斷解放的過程。在工業革命和信息化時代,人類的體力被逐步解放。而隨著人工智能技術的發展,尤其是認知智能技術的發展,人類的腦力也將會被逐步解放。越來越多只有人才能從事的知識工作將逐步被機器所代替,伴隨而來的將是機器生產力的革命性進步。
然而,在我們即將邁出構建機器智腦的豪邁征程之前,仍然存在一些問題必須得到清晰地回答。首先,當下人工智能的發展很大程度上體現在以深度學習為代表的機器學習突飛猛進,這一定程度上宣告了聯結主義的“勝利”。此時提及符號知識會不會不合時宜。換言之,符號知識對于發展機器智腦是否必要(本文第二節)?如果承認了這種必要性,將知識灌輸給機器難在何處,是否有充分的研究價值(本文第三節)?當前的知識庫積累以及當前的研究項目是否能應對這些挑戰(本文第四節)?未來還有哪些困難需要我們解決(本文第五節)?只有清晰地回答了這些問題才能放下思想包袱輕裝上陣。
是否必要?符號知識對于發展機器智腦的必要性至少體現在三個方面:產業發展、研究意義和應用價值。
(1)產業發展:感知智能的產業升級需要知識庫技術。對于智能機器人而言,首先要具備人類的視、聽、觸、嗅、味覺等五官的感知能力。受益于大數據所提供給的海量標注樣本,以及深度學習模型強大的學習能力,機器感知能力在語音識別、圖像識別等方面日益接近甚至超越人類水準,機器感知智能率先進入大規模產業化應用階段。然而,機器的智能不應僅僅停留在感知階段。類人五官的感知能力只是再現了絕大部分動物所具備的能力。機器智能的進一步發展勢必會對認知智能提出訴求。語音處理應用日益要求從“聽見”升級為“聽懂”,圖像處理應用日益要求從“看到”升級為“看懂”。而“懂”就是理解,要求機器形成認知能力。
從以信號識別為主的感知智能發展到以符號理解為主的認知智能是語音與視覺產業后程發展的必經路徑。一定程度上,信號感知只是在為符號理解提供數據來源,一旦信號感知的使命結束,對由感知而得的數據形成理解,進而理解人類社會、理解世界,并形成有效的推理與決策將是機器智腦的重要使命。只有機器智腦具備了一定的認知能力,才能最終形成與環境交互的閉環,最終有效指導智能機器的行為。
(2)研究意義:機器的理解和解釋能力需要符號知識。語言能力是人從猿猴進化為智人的關鍵。讓機器具備理解人類語言的能力將是機器智能發展歷程中的分水嶺,也是機器人為人類社會服務的前提。人類之所以能夠很自然地“理解”彼此的語言,是因為彼此有著類似的生活體驗、類似的教育背景,塑造具有類似知識的心靈。要讓機器理解我們人類的語言,機器必須具備與我們類似的知識。符號知識對于認知智能的另一個重要意義在于“解釋”,使得可解釋的人工智能成為可能。大部分機器人都是以“為人類服務”為基本目標的,比如家庭陪伴機器人。機器必須合理地解釋自身的行為與決策才能服務人類,才能融入人類社會。當人類的指令或要求不合理時,機器應該具備反抗意識,適時地提醒并且給出解釋。服務機器人必須具備一定的理解和解釋能力。
機器的“理解”和“解釋”均與符號知識有著密切關系。所謂機器的理解是針對輸入數據形成特定形式的內在表示。比如讓機器幫我們“訂一張周杰倫的演唱會門票”,機器必須將“周杰倫”這個字符串映射到知識庫中我們所熟知的歌手周杰倫,才能夠準確完成任務。所謂機器的解釋是用知識庫中的片段來解釋問題的過程。例如,鯊魚為什么可怕?因為鯊魚是食肉動物,這實質上是在用概念解釋。若問鳥兒為什么能飛翔?因為它有翅膀,這是在用屬性解釋。人類傾向于利用概念、屬性、關系這些認知的基本元素去解釋現象和事實。而對于智能機器而言,概念、屬性和關系都是符號知識。因此,機器的“解釋”能力離不開符號知識。
(3)應用價值:服務機器人的核心能力包括自然人機交互、決策輔助等都對知識提出了需求。自然人機交互是發展智能機器人的關鍵技術,人機交互方式可以體現為問答系統、智能搜索和聊天互動等等。無論人機對話系統采取哪種具體形式,知識庫都扮演著至關重要的角色。在一個典型的人機交互的系統架構中(如圖1所示),其控制層中的核心包括問題理解、對話管理、答案生成等各模塊均需要來自知識層所提供的高質量知識。比如在影視相關的問答交互中,當用戶問及“吳京最近有什么電影”,平臺必須知道“吳京”是電影演員,才能準確理解用戶的提問意圖,這是問題理解的核心。在信用卡業務問答中,客服機器人需要具備信用卡辦理的相關知識,才能正確引導用戶辦理信用卡業務,這是對話管理通常需要實現的功能。在出行平臺的用戶投訴問答中,平臺需要各類判責的知識才能向客戶解釋。在司法相關的問答機器人,更是需要專業的司法知識才能準確為用提供司法解答。這些知識均在答案生成部分扮演重要角色。 ? ? ? ? ? ??
圖1:特定任務型人機交互系統框架
隨著智能機器人應用的深化,人類的腦力工作將越來越多地交給機器。因此,機器不但要理解人類社會、理解人類的意圖,更需要開展一定的自主決策。為了實現這種自主決策,需要機器人能夠按照人類社會的價值觀與規則體系,按照預設任務的基本目標,開展有效的推理,實現自主決策。當前的推理決策主要分為基于規則和基于統計兩大類。基于規則的推理是早期知識工程采用的主流技術路線。但是規則的獲取一直是個瓶頸問題。在很多相對開放的應用領域,規則獲取與規則匹配十分困難,還難以應對開放世界的挑戰?;诮y計的推理是在信息不完整或者決策不確定等環境下的推理方式。概率圖模型是基于統計的推理方式的典型代表。概率圖模型又演化出了多種不確定推理模型,比如馬爾科夫決策過程、部分可觀測馬爾科夫決策過程[1][2]、動態貝葉斯網絡[3]等。這些模型均采用概率建模決策要素之間的條件依賴、狀態遷移甚至因果關聯。概率圖模型等統計推理模型以專家的先驗知識確定決策要素,通過大規模數據訓練以確定不同要素之間的統計關聯強度。這一思路充分地體現了專家知識+數據驅動的問題求解思路。對于樣本稀疏但專家知識豐富的應用場景具有十分積極的意義。司法、醫療、金融等領域的服務機器人均應認真考慮此類模型的適用性。
為何困難?近年來,越來越多的智能機器人走進了我們的日常生活與生產。不同的領域對機器人的智能水平要求完全不同。在生產車間的機械手臂只需要按照固定程序完成工作即可。在倉庫中的無人駕駛汽車也只需要沿著固定路線行駛即可。這些封閉的應用場景,對于機器的智能水平要求相對不高。但是服務機器人的使命不同,大部分服務機器人是直接面向人類的,是直接“生活”或“工作”在一定的家庭或者社會環境中的。這一類直接面向人類社會的服務機器人需要應對“開放性”挑戰。所謂開放性挑戰是指無法預期可能發生的事態,從而無法有效預設先驗規則。換言之,在開放環境中,機器很容易碰到無法合理處理的情形,因為這些情形沒有被定義過、沒有被描述過,從而機器顯得無法適從。開放性問題是整個人工智能的根本難題。這個問題或許太難,以至于很少被提及與討論。開放性難題被巧妙地隱藏在諸如常識理解、小樣本學習、元學習等一系列表層問題背后。開放性難題是帶來一次次人工智能寒冬的“罪魁禍首”。
然而,在今天這個時間節點討論人工智能的開放性難題是合適的。因為我們面臨全新機遇。在數據+算力+模型的三駕馬車的牽引下,開放性難題的解決面臨一些新機遇。本文聚焦在知識工程給智能機器人帶來的機遇。因此,著重討論知識庫相關技術應對開發性難題的主要思路。首先,大規模通用知識圖譜的建設,為應對開放性難題帶來新機遇。互聯網上的海量數據,使得從中獲取大規模通用知識圖譜成為可能。再加上人類專家經年累月積累的各類知識庫,我們可以灌輸給機器的知識庫規模是前所未有的,甚至可以企及普通人類的知識容量。量變總是醞釀質變,當機器的知識庫規模逐步增大,開放環境所需知識不被命中的可能性勢必下降。其次,最近幾年大規模概念圖譜的出現,使得歸納和類比成為可能,進而使得類人化的開放問題求解成為可能。歸納能力是我們人類抽象思考的前提。歸納使得人類不必糾纏于不熟悉的實例,而只需關注其類別就可以進行準確的認知。類比使得我們人類能夠通過同類相似的案例從容應對從未遇到的情形。隨著概念圖譜的日益完善,這些人類解決開放性問題的典型思路對于機器而言也將越加可行。
是否可能??4.1各類互聯網知識庫已有多年積累與沉淀
在知識工程、Web數據挖掘、自然語言處理等領域大量的研究工作致力于大規模知識獲取的工作,為打造機器智腦提供了豐富的知識庫來源。目前互聯網上可用于智能機器人的知識庫包括以下各類知識:
(1)事實知識(Factual Knowledge)。是關于某個特定實體的基本事實。例如(中國,首都,北京)。事實知識是知識圖譜中最常見的知識類型。大部分實體的事實可以對應實體的特定屬性或者關系。很多以實體為中心組織的知識庫均富含此類知識,比如DBpedia[4]、Freebase[5]以及CN-DBpedia[6]等等。
(2)概念知識(Taxonomy Knowledge)。分為兩類,一類是實體與概念之間的類屬關系(InstanceOf關系),例如(柏拉圖 InstanceOf哲學家)。另一類為子概念與父概念的子類關系(SubclassOf),比如(唯心主義哲學家SubclassOf 哲學家)。一個概念有子概念也可能同時具有父概念,使得整個概念之間構成層級體系。概念之間的層級關系是本體定義中最為重要的部分,特定領域的概念知識是機器認知領域的基本框架。典型概念知識圖譜(有時簡稱概念圖譜)包括Yago[7][8][9][10]、Probase[11]、WikiTaxonomy[12]等等。概念是歸納的前提,是基于概念推理的(類別推理,taxonomy reasoning)依據。概念知識是一種典型的元知識(Meta-knowledge)。元知識處理概念知識之外,還包括概念之間的屬性、概念與屬性的領域與約束等元知識。這些知識通常在傳統的本體中加以定義與明確。
(3)詞匯知識。詞匯知識主要包括實體與詞匯之間的關系(比如實體的命名、稱謂、英文名等等)以及詞匯之間的關系(包括同義詞,反義詞、縮寫詞以及上下位詞關系等等)。例如(柏拉圖,英文名, “Plato”)、(趙匡胤,謚號,宋太祖)、(妻子,同義詞,老婆)。一些跨語言知識庫比如BabelNet[13]專注于建立實體或概念之間的跨語言等價關系。詞匯知識的自動化獲取在目前的實際應用中已經取得較好效果。從豐富的領域語料自動挖掘領域詞匯,并建立詞匯之間的語義關聯以及詞匯與實體之間的關聯已經成為知識圖譜構建最為重要的一步。詞匯知識也是相對簡單的知識。人類學習某個新領域往往是從該領域的術語或者詞匯開始的。因此,賦予機器認知領域詞匯,是實現機器認知整個領域知識的第一步。此類典型知識圖譜包括WordNet[14]等。
(4)常識知識。常識是人類通過身體與世界交互而積累的經驗與知識,是人們在交流時無需言明就能理解的知識。例如我們都知道鳥有翅膀,鳥能飛等。再比如如果x是個人,那么x要么是男人要么是女人。常識的表征與定義、常識的獲取與理解等問題一直都是人工智能發展的瓶頸性問題。常識知識的基本特點是我們每個人都知道,但很少在文本里提及,使得基于文本抽取的常識獲取方式效果有限。典型的常識知識圖譜包括Cyc[15],ConceptNet[16]等。
(5)領域知識。服務機器人需要建立人類社會與生活相關的方方面面知識庫。比如日常陪伴機器人需要具備衣食住行等各方面的知識庫。比如當用戶抱怨“空氣不好”,機器人能夠開啟空氣凈化器;當用戶感冒了,機器應該能夠結合醫學和用戶醫療知識庫提供相應的藥物與生活建議;在午餐時間,機器人能通過飲食知識庫推薦近期的飲食等等。
4.2各類服務機器人專用知識庫蓬勃發展
除了上述幾類常見的知識之外,下面幾類知識對于服務機器人尤為重要并受到了密切的關注,發展迅速:
(1)個性知識。我們希望服務機器人具有個性化服務能力。因此,服務機器人應該具備其服務對象的個性化知識,也就是傳統的用戶畫像包括的內容,比如職業、身份、婚姻、年齡等等,也包括服務對象的喜怒哀樂、興趣愛好、技術能力以及服務對象近期的行為軌跡、社會交往、消費娛樂等動態畫像。
(2)動態知識。人類所身處的真實世界不是靜態的,而是動態變化的。因此,對于智能機器人,不僅需要各種靜態知識(比如番茄是一種蔬菜),還需考慮如何表示和應用動態知識,特別是決策過程知識、因果關聯知識、時序依賴知識等等。例如用戶想看電影,如果機器人具備看電影場景的基本知識,就可以幫助用戶約朋友、訂票、選座位、建議出行路徑。這些服務的實現均需要建立起看電影場景下事件之間的邏輯關聯。
(3)情感知識。隨著我國老齡化的發展,家庭陪伴機器人需要能夠像人類伴侶一樣感知用戶情感、能在回答或者輔助人類工作時表達出相應的情感[17][18]。比如當用戶表達:“今天空氣不好,感冒了,好難受”的時候,服務機器人應該通過主觀情感知識庫將該語句歸類為尋求關心與呵護類的情感表達范疇,并提供相應的情感輸出,以表達合理的人文關懷。讓智能機器人富有“情緒”是另一類讓機器更加類人的關鍵技術。情緒的檢測和有效的傳達是人類自然交互中不可或缺的部分,顯然情緒知識庫是實現這些能力的前提。
(4)多模態知識。人類之間相互交流和溝通的方式不僅僅是單一的文字問答,還需結合圖像、語音、手勢、情緒、表情、眼神以及暗示等多模態來了解外部世界。因此對于智能機器人,所需要構建的知識庫不應該拘泥于文本形式,而是應該向多模態方式轉變。多模態知識庫可以有效幫助智能機器人從多維角度去理解人類社會,可以在與人類的交互中更準確地理解人類的意圖。在圖像識別領域的ImageNet[19]就是典型的圖像知識庫。最近有學者提出的多模態知識圖譜[20]將實體、文本、圖像、視頻等相鏈接,使得機器可以理解實體的不同模態表示。
?
4.3面向機器智腦的典型研究項目具有一定的示范與帶動作用
此外,也存在一些專門的針對智能機器人的知識引擎。其中具有代表性的是RoboBrain[21]?。RoboBrain是斯坦福大學和康奈爾大學為機器人定制的知識引擎項目。機器人系統涉及的數據模態多樣(包括符號、語言、語音、圖像、視頻以及軌跡等等),機器人需要從事的任務多樣(包括感知、規劃、控制、決策等等)。因此,面向機器人的知識引擎必須能夠將多模態多任務的知識統一表示。RoboBrain知識引擎采用圖統一表達各種知識。RoboBrain除了存儲了來自互聯網的多個來源的公開知識庫(包括前面提及的百科圖譜、語言知識庫、圖像知識庫等),還通過學習模型習得機器與物理環境進行交互的知識。知識引擎主要實現知識的獲取、解析、存儲以及推理功能,并提供查詢語言RQL(Robot Query Language)供第三方平臺使用知識。RoboBrain能夠幫助機器理解人類活動并采取相應行動。比如圖2所示,RoboBrain通過“冰箱是固定的”,“人、碗是活動的”等常識知識預測人將拿著碗走向冰箱,此時智能機器人就可以為人類打開冰箱。
? ? ? ? ? ? ? ?
圖2:機器人通過常識知識預測人類行動
隨著服務機器人產業的進一步發展,將認知能力賦予機器,讓機器“掌握”一定的知識,并利用這些知識更好地為人類服務已經是服務機器人產業乃至整個智能機器人產業進一步發展所面臨的重大問題。大數據為知識工程、智能機器人等領域的發展所帶來的巨大數據紅利,仍有待相關領域的進一步消化與利用。相信在大數據知識工程等技術的助力下,實現智能機器人的認知能力,顯著提升機器人的智能水平是完全可能的。
然而,需要指出的是構建機器智腦的強大知識庫仍然面臨很多挑戰。
首先、知識表達困難重重。人類用于解決問題的很多知識是難以言說的隱性知識,表達這類知識仍然十分困難。多模態知識的表達也是十分困難的,如何在一個統一的表示空間表達不同模態的數據與知識仍然是個十分活躍的研究問題。此外,如何將知識的向量表示與符號表示相融合以進一步增強知識的表達能力也是個值得探索的問題。知識表示在服務機器人的實際應用中也還存在一些基本的理論問題需要澄清。比如需要多少類型的知識,需要多大規模的知識才足以使得機器能夠像人一樣應對復雜開放環境?機器勝任開放環境處理能力的最小知識集合是什么?這些問題的回答是深化知識表示研究的前提。
其次、知識獲取任重道遠。大數據為知識獲取帶來了量的提升,但是在質的方面仍有很大提升空間。很多知識是從元知識通過實例化或者隱喻派生而得。元知識對于機器而言是十分必要的。元知識獲取仍然缺乏有效的方法。此外,常識在語料中的稀疏造成了常識獲取的巨大困難。機器在常識獲取與理解的道路上仍需經歷漫長的征程。
最后,知識應用仍需深化。人類在面對實際問題時,可以很自然地以一種近乎直覺的方式適配和調用自己積累的知識來完成任務。但機器的自動知識適配卻仍然十分困難。隨著知識體系的日益完善,如何協同各類不同的知識表示形成有效的推理機制,也是亟待研究的問題。
總之,我們相信我們身邊的機器將不僅會擁有發達四肢,也將會擁有超強的大腦。未來的智能機器將絕不僅僅是一堆冰冷的鐵皮與硅基,表皮之下鑲嵌的將是一顆“有知識”、“有文化”、“有溫度”的“有趣”“靈魂”。
參考文獻
本文轉自CCF數字圖書館——CCCF2019年第5期專題
了解更多信息請點擊知識工場網站主頁:http://kw.fudan.edu.cn/
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的肖仰华 | 做个“有知识”的机器人的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 基于深度强化学习将图注意力
- 下一篇: 论文浅尝 - AAAI2020 | 迈向