下一代对话系统中的关键技术(上篇)
6年前,人工智能AlphaGo戰(zhàn)勝李世石,成為第一個擊敗人類職業(yè)圍棋選手、第一個戰(zhàn)勝圍棋世界冠軍的人工智能機(jī)器人。
如今,作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力,人工智能正在對經(jīng)濟(jì)發(fā)展、社會進(jìn)步等多個方面都產(chǎn)生著重大而深遠(yuǎn)的影響。
在人工智能浪潮的推動下,聊天機(jī)器人的各方面技術(shù)也獲得飛躍式提升,在諸多行業(yè)中得到廣泛應(yīng)用,為用戶提供了全新的交流方式。
我們將用兩期內(nèi)容,來闡述了聊天機(jī)器人中對話交互的主要技術(shù),從理解、擬人、及與人互動三個方面說明當(dāng)前對話系統(tǒng)面臨的挑戰(zhàn)。并嘗試勾勒出下一代類人對話系統(tǒng)應(yīng)具備的主要技能。
用戶與具有情緒支持和心理共情技能的
智能虛擬人emohaa的對話
近年來,隨著人工智能技術(shù)的不斷發(fā)展,各種形態(tài)的聊天機(jī)器人以新型有效的溝通方式,為普通大眾提供智能、高效的服務(wù),在私人助理、客服等各類場景有著廣泛的應(yīng)用。在當(dāng)前技術(shù)下,對人類語言的理解和表達(dá)是聊天機(jī)器人實(shí)現(xiàn)真正的擬人化交互過程中面臨的巨大挑戰(zhàn)。
作為實(shí)現(xiàn)智能交互的關(guān)鍵模塊,對話交互技術(shù)的研究在學(xué)術(shù)界和工業(yè)界一直備受關(guān)注。讓機(jī)器人擁有了與人類交流的能力,能夠通過語音和語義識別等智能技術(shù)識別使用者的意圖,并且將會按照使用者目前的意愿來達(dá)到具體的互動目的。對話交互技術(shù)的研究,在進(jìn)一步推動聊天機(jī)器人產(chǎn)業(yè)發(fā)展、實(shí)現(xiàn)智能化的過程中具有巨大的意義和價值。
在人工智能領(lǐng)域,對話系統(tǒng)的發(fā)展歷史非常悠久,在英國電腦科學(xué)家Alan Turing于1950年提出圖靈測試,即測試機(jī)器能否表現(xiàn)出與人類似或無法區(qū)分的智能,而對話系統(tǒng)就是圖靈測試最自然的表現(xiàn)形式。美國麻省理工學(xué)院人工智能實(shí)驗(yàn)室的德裔電腦科學(xué)家Joseph Weizenbaum則是在1964年至1966年期間打造史上第一個聊天機(jī)器人“Eliza”,并定位為模仿人本主義療法(Rogerian psychotherapy)的心理治療師。
“Eliza”是以MAD-SLIP程序語言編寫,并且在36位元架構(gòu)的IBM 7094大型電腦上運(yùn)作,所有程序代碼約在200行左右。執(zhí)行過程中,“Eliza”會透過分析所輸入文字內(nèi)容,并且將特定字句重組,變成全新字句組合。
Eliza 的名字源于愛爾蘭劇作家蕭伯納的戲劇作品《賣花女》中的角色,劇中出身貧寒的賣花女 Eliza 通過學(xué)習(xí)與上流社會溝通的方式,變成大使館舞會上人人艷羨的“匈牙利王家公主”。作為世界上第一個聊天機(jī)器人,Eliza 被其作者賦予了“心理治療師”的角色,在人工智能的整個發(fā)展史上具有重要的地位。
據(jù)說,Weizenbaum教授將Eliza系統(tǒng)給同事們使用,
他們都以為Eliza是一個真人,還交談了很多隱私的事情。
2011年,蘋果推出的語音助手 Siri也使得智能助理在工業(yè)界引起了廣泛關(guān)注。微軟于2014年發(fā)布了首個社會機(jī)器人——微軟"小冰",它能夠提供一個開放式的領(lǐng)域聊天功能。2020年,在大數(shù)據(jù)、大算力的支持下,大量大型預(yù)訓(xùn)模型陸續(xù)推出,它們不僅可以回答用戶的問題,還能以有趣的方式進(jìn)行各種話題討論。這些預(yù)訓(xùn)練模型將對話系統(tǒng)的研究推向了一個新的高度,在開放領(lǐng)域的會話能力方面有了新的突破。
對話系統(tǒng)的發(fā)展里程碑
對話系統(tǒng)發(fā)展至今,已經(jīng)可以與用戶產(chǎn)生非常自然地對話。在2017至2019年間,連續(xù)舉辦的三屆Alexa大獎賽中,最好的對話系統(tǒng)能夠與人類用戶開展超過10分鐘的聊天,聊天內(nèi)容不受領(lǐng)域和話題限制。以Emohaa為例,他不僅能理解“講個笑話”這一含義,并且已經(jīng)可以在與用戶的對話中,展現(xiàn)出自然的幽默感。
另一個例子是FAIR在2020年發(fā)布了的Blender,其最大的參數(shù)規(guī)模達(dá)到94億,并且使用了8880億個詞匯。Blender可以將不同的技巧融合在一起,包含個性嵌入、知識賦值和表達(dá)共情,使得人機(jī)對話更加具有人性化。
在人工智能領(lǐng)域,相關(guān)技術(shù)的發(fā)展和進(jìn)步為對話系統(tǒng)的研究帶來了機(jī)遇,這對于促進(jìn)人工智能以及聊天機(jī)器人的發(fā)展有著十分重大的意義。
當(dāng)前對話系統(tǒng)可以總結(jié)為以下兩種類型,第一種是任務(wù)導(dǎo)向型的對話系統(tǒng)(Task-Oriented Dialog System),它通常以幫助用戶完成具體的任務(wù)為目的,如手機(jī)助理、客服機(jī)器人,訂票機(jī)器人等;第二種是開放域的對話系統(tǒng)(Open-Domain Dialog System),它經(jīng)常會在一個開放的區(qū)域里和用戶聊天,并且利用各種談話技巧來增加他們的互動,例如提供娛樂、給出建議、討論有趣的話題、提供情感安慰等。
任務(wù)導(dǎo)向型對話系統(tǒng)(左)
和開放域?qū)υ捪到y(tǒng)(右)的典型結(jié)構(gòu)
開放域?qū)υ捪到y(tǒng)中,通常要求系統(tǒng)對對話環(huán)境和用戶的情感需求有更深刻的理解,以便在正確的時間使用正確的對話技能,從而產(chǎn)生更富有個性和同情心的回應(yīng)。
那么現(xiàn)有的對話系統(tǒng),又存在哪些挑戰(zhàn)和不足呢?
首先是關(guān)于語義的認(rèn)識。語意理解是人類進(jìn)行會話活動的基礎(chǔ)和核心,是對話活動的先決條件。它要求系統(tǒng)能夠理解對話、理解用戶,甚至關(guān)聯(lián)對話之外的背景信息。在早期的測試階段,當(dāng)用戶問Emohaa“你為什么叫Emohaa”,Emohaa卻仍然回復(fù)“我叫Emohaa”,意義就差得非常遠(yuǎn)。
其次是人格認(rèn)同的連貫性問題。同樣舉一個在早期測試階段的案例:當(dāng)用戶問Emohaa家庭成員相關(guān)問題時,Emohaa在不同時刻回答“我有一個妹妹”和“我沒有妹妹”這種信息不一致,會讓用戶產(chǎn)生困惑。如今這些問題正在迭代中改進(jìn)和完善。
最后是交互性的問題。在開放域?qū)υ捪到y(tǒng)中,其設(shè)計的目的通常是滿足用戶的社交需求,比如情感和社會歸屬感等,以最大限度地提高用戶的長期參與度。系統(tǒng)語義理解和個性身份一致性問題,將直接影響用戶的體驗(yàn),導(dǎo)致低質(zhì)量的交互。此外,如何在各種場景下應(yīng)對用戶的負(fù)面情緒,如失落、悲傷等,也是提高對話系統(tǒng)交互性中面臨的巨大挑戰(zhàn)。
總的來說,當(dāng)前的對話系統(tǒng)面臨三個問題,第一個是語義理解的問題,第二個是個性身份一致性的問題,第三個是互動性的問題。在語義理解方面,我們希望對話系統(tǒng)能夠理解內(nèi)容(content)、文本(context)和場景(scene);對于個性身份一致性問題,我們希望對話系統(tǒng)能夠產(chǎn)生與個性和身份一致的對話,具有類人的個性和身份;對于互動性問題,我們希望對話系統(tǒng)與用戶進(jìn)行情感、情緒上的交流,然后綜合運(yùn)用各種行為策略,實(shí)現(xiàn)強(qiáng)互動性的對話。
更多閱讀
#投 稿?通 道#
?讓你的文字被更多人看到?
如何才能讓更多的優(yōu)質(zhì)內(nèi)容以更短路徑到達(dá)讀者群體,縮短讀者尋找優(yōu)質(zhì)內(nèi)容的成本呢?答案就是:你不認(rèn)識的人。
總有一些你不認(rèn)識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學(xué)者和學(xué)術(shù)靈感相互碰撞,迸發(fā)出更多的可能性。?
PaperWeekly 鼓勵高校實(shí)驗(yàn)室或個人,在我們的平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是最新論文解讀,也可以是學(xué)術(shù)熱點(diǎn)剖析、科研心得或競賽經(jīng)驗(yàn)講解等。我們的目的只有一個,讓知識真正流動起來。
📝?稿件基本要求:
? 文章確系個人原創(chuàng)作品,未曾在公開渠道發(fā)表,如為其他平臺已發(fā)表或待發(fā)表的文章,請明確標(biāo)注?
? 稿件建議以?markdown?格式撰寫,文中配圖以附件形式發(fā)送,要求圖片清晰,無版權(quán)問題
? PaperWeekly 尊重原作者署名權(quán),并將為每篇被采納的原創(chuàng)首發(fā)稿件,提供業(yè)內(nèi)具有競爭力稿酬,具體依據(jù)文章閱讀量和文章質(zhì)量階梯制結(jié)算
📬?投稿通道:
? 投稿郵箱:hr@paperweekly.site?
? 來稿請備注即時聯(lián)系方式(微信),以便我們在稿件選用的第一時間聯(lián)系作者
? 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿
△長按添加PaperWeekly小編
🔍
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
·
總結(jié)
以上是生活随笔為你收集整理的下一代对话系统中的关键技术(上篇)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 直播间的定海神针清屏怎么设置?
- 下一篇: 廉颇老矣尚能饭否是谁说的?