机器学习(二十三)——Beam Search, NLP机器翻译常用评价度量, 模型驱动 vs 数据驱动
https://antkillerfarm.github.io/
Beam Search
Beam Search(集束搜索)是一種啟發式圖搜索算法,通常用在圖的解空間比較大的情況下,為了減少搜索所占用的空間和時間,在每一步深度擴展的時候,剪掉一些質量比較差的結點,保留下一些質量較高的結點。
這樣減少了空間消耗,并提高了時間效率,但缺點就是有可能存在潛在的最佳方案被丟棄,因此Beam Search算法是不完全的,一般用于解空間較大的系統中。
上圖是一個Beam Search的剪枝示意圖。
Beam Search主要用于機器翻譯、語音識別等系統。這類系統雖然從理論來說,也就是個多分類系統,然而由于分類數等于詞匯數,簡單的套用softmax之類的多分類方案,明顯是計算量過于巨大了。
PS:中文驗證碼識別估計也可以采用該技術。
參見:
http://people.csail.mit.edu/srush/optbeam.pdf
Optimal Beam Search for Machine Translation
http://www.cnblogs.com/xxey/p/4277181.html
Beam Search(集束搜索/束搜索)
http://blog.csdn.net/girlhpp/article/details/19400731
束搜索算法(Andrew Jungwirth 初稿)BEAM Search
NLP機器翻譯常用評價度量
機器翻譯的評價指標主要有:BLEU、NIST、Rouge、METEOR等。
參考:
http://blog.csdn.net/joshuaxx316/article/details/58696552
BLEU,ROUGE,METEOR,ROUGE-淺述自然語言處理機器翻譯常用評價度量
http://blog.csdn.net/guolindonggld/article/details/56966200
機器翻譯評價指標之BLEU
http://blog.csdn.net/han_xiaoyang/article/details/10118517
機器翻譯評估標準介紹和計算方法
http://blog.csdn.net/lcj369387335/article/details/69845385
自動文檔摘要評價方法—Edmundson和ROUGE
https://mp.weixin.qq.com/s/XiZ6Uc5cHZjczn-qoupQnA
對話系統評價方法綜述
模型驅動 vs 數據驅動
最近閱讀了這篇文章,深有感慨:
https://mp.weixin.qq.com/s/N7DE0kvf8THhJQwroHj4vA
成不了AI高手?因為你根本不懂數據!聽聽這位老教授多年心血練就的最實用統計學
注:吳喜之教授是我國著名的統計學家,退休前在中國人民大學統計學院任統計學教授。吳教授上世紀六十年代就讀于北京大學數學力學系,八十年代出國深造,在美國北卡羅來納大學獲得統計學博士學位,是改革開放之后第一批留美并獲得統計學博士學位的中國學者。多年來吳教授在國內外數十所高校講授統計學課程,在國內統計學界享有盛譽。其知名的學生有李艦和劉思喆。
李艦,從2003年開始,一直把R當作隨身武器奮戰在統計學和數據分析的第一線,是Rweibo、Rwordseg、tmcn等高質量R包的作者,在業界積累了大量的經驗,目前供職于Mango Solutions(中國),任數據總監。
劉思喆,2012至2016年就職于京東商城,推薦系統平臺部高級經理,主要負責和推薦系統離線、在線相關的用戶行為、商品特征的建模,以及數據監控平臺。因工作業績,在《京東技術解密》一書中獲“數據達人”稱號。
總結
以上是生活随笔為你收集整理的机器学习(二十三)——Beam Search, NLP机器翻译常用评价度量, 模型驱动 vs 数据驱动的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习(十二)——Winograd(2
- 下一篇: 深度学习(十三)——花式池化, Batc