1-通用对话系统-阿里大文娱-李亚楠
整理自2019AI科學(xué)前沿大會分會場2-自然語言處理,如有侵權(quán),請聯(lián)系作者刪除。
圖片下載鏈接: https://pan.baidu.com/s/1M_n9OX3H6U7AujsYFIpHOw 提取碼: iz2x?
1-通用對話系統(tǒng)-阿里大文娛-李亞楠
對于對話系統(tǒng)的理解,我們想象中是像經(jīng)常在電影里看到的比如賈維斯等的,但是回歸到現(xiàn)實世界中,有時候會覺得對話系統(tǒng)有些智障。本次的分享主要以技術(shù)報告的形式,我們先看看對話系統(tǒng)的發(fā)展過程,上個世紀(jì)60年代,出現(xiàn)了Elisa(對話機器人),甚至后來用于心理咨詢師等等。我們從工業(yè)界、搜索引擎的角度出發(fā)來看,第一代互聯(lián)網(wǎng)的出現(xiàn)時因為信息量增多,楊致遠(yuǎn)和他的舍友通過手動編輯的方式,也就是當(dāng)時的Yahoo,后來有發(fā)展到了Google網(wǎng)頁搜索階段,再后來web搜索。
大致經(jīng)歷了中國雅虎搜索、阿里云搜索、神馬搜索、UC頭條、夸克。
也就是說,我們需要一個跨平臺多終端的智能助手,主要分為三個方面:業(yè)務(wù)產(chǎn)品:UC瀏覽器、UC頭條等;技術(shù)設(shè)施:搜索、推薦、智能交互;內(nèi)容生態(tài):阿里的大魚號、知識圖譜、用戶畫像、非結(jié)構(gòu)化的網(wǎng)頁生態(tài)等等。
通用對話平臺的結(jié)構(gòu)框架如下:核心是對話系統(tǒng)SDS
對話系統(tǒng)中的五個組成部分:自動語音識別(ASR),自然語言理解(NLU),對話管理(DM),自然語言生成(NLG)和文本到語音合成(TTS)。
?
遷移學(xué)習(xí)主要有半監(jiān)督和監(jiān)督兩種方式。數(shù)據(jù)量大,會采用小樣本學(xué)習(xí)的方法。
對話管理(DM)的目的是在有著不同知識的不同領(lǐng)域中通過使用NLP的方法進(jìn)行流暢地表達(dá),涉及到眾多領(lǐng)域,同時聊天也有很多技術(shù),如聊天術(shù)等等的,如何將他們統(tǒng)一起來,進(jìn)行靈活地處理,是一個難點,同時也需要注意到它的可擴展性,不能說稍有變動就重頭來過,因此提出了這個業(yè)務(wù)與引擎分離的思想,業(yè)務(wù)就是上層的一些機構(gòu)和分支,DST層就是引擎層。
?
?
?
?
?
除了檢索式對話系統(tǒng),還有生成式的對話系統(tǒng),生成式的對話系統(tǒng)的概念,是當(dāng)前的一個學(xué)術(shù)熱點,但是目前應(yīng)用不成書,準(zhǔn)確率低。
?
目前對話系統(tǒng)在古詩生成、對聯(lián)生成等方面做的較好,但是在簡單的日常對話上表現(xiàn)欠佳。
?
Q:對知識圖譜的查詢是否會消耗大量的時間,知識圖譜的存儲。
答:知識圖譜的建立經(jīng)過很長時間,大概三四年,需要一個慢慢積累的過程,尤其是長尾數(shù)據(jù)。知識圖譜存在于圖數(shù)據(jù)庫中,對它做關(guān)系抽取、驗證,時間是挑戰(zhàn)之一,如果規(guī)模大,那么相應(yīng)的靈活性相應(yīng)地較小,目前只用于處理一些比較簡單的問題,如一輪推理。
總結(jié)
以上是生活随笔為你收集整理的1-通用对话系统-阿里大文娱-李亚楠的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 当p.1引脚的电平正跳变c语言程序,数字
- 下一篇: Java学习资料(一)——Java书籍
