全球最强大脑在哪?阿里小蜜算法团队在寻找
阿里妹導讀:阿里小蜜的算法專家們最近在意大利都靈籌備一場國際數據挖掘競賽。這場競賽的名字叫CIKM AnalytiCup,是全球著名的公開、公正的大數據開放式競賽。
去年,這場比賽是與阿里云、深圳氣象局合辦,最終選手們成功建立降水預報模型,其中最好成績為RMSE10.997,比主辦方提供的標準線提高了25%,大幅提高了短期降水預報的準確性。今年,CIKM再次與阿里巴巴集團攜手,與阿里小蜜團隊一起舉辦本次競賽。
?
阿里小蜜是什么?
?
阿里小蜜是阿里巴巴集團智能服務事業部旗下的面向電商領域的服務機器人。阿里小蜜所在的智能服務事業部,致力于以體驗為核心,通過人工智能算法,以數據和技術為驅動,提升用戶的服務體驗以及解決問題的效率。目前圍繞著智能對話、智能輔助、智能決策、智能管理4大核心體系通過人工智能技術全面賦能客戶,引領服務的智能化升級。在2017年,阿里小蜜家族產品通過自然語言處理、知識圖譜、深度學習等技術引領阿里小蜜從阿里走向行業,從中國走向國際,圍繞這商家生態圈及阿里云生態圈,賦能數百萬商家和全球中小企業,覆蓋了英語、俄語、葡萄牙語、西班牙語、印尼語、泰語等多個國家和地區。
阿里小蜜吉祥物
在過去的一年中,阿里小蜜團隊已經在文本匹配及遷移學習兩個方向上做了很多工作,不僅在工業界落地,真實服務消費者,而且在一些重要的國際會議上,如ACL、WSDM、CIKM等,發表了多篇論文。例如在2018的WSDM上,我們提出了一個文本匹配模型的遷移學習框架,嘗試解決了同種語言下的文本匹配模型的冷啟動問題。
?
為什么會選擇“跨語言短文本匹配算法”相關賽題?
?
隨著人工智能時代的到來,大數據和算法成為了互聯網企業發展的兩個重要驅動力。作為人工智能重要的落地場景之一,以聊天機器人出現的智能服務系統,為企業減少大量勞動力的同時,也對提升用戶體驗具有重要意義。因此在過去幾年中,聊天機器人成為了商業公司重金投入的熱點。從微軟小冰、亞馬遜的Echo等到各種垂直行業的客服機器人,聊天機器人蓬勃發展,形態各異,又不乏共性。阿里小蜜正是阿里巴巴集團圍繞電商領域構建的超級個人助理,不僅可以解決用戶的各種信息咨詢類問題,也可以幫助用戶挑選商品,為用戶訂購機票等任務。
?
根據應答產生的方式,聊天機器人可以分為檢索式、生成式或者混合式。在檢索式的聊天機器人中,文本匹配模型是至關重要的一個模塊,決定了聊天機器人解決用戶問題的能力。文本匹配模型接受一個用戶的問題,在FAQ數據集上尋找一個匹配的問答對,并將人工編寫的答案回傳給用戶。為了構建一個文本匹配模型,不僅需要人工收集一個稱之為FAQ(Frequently Asked Questions)的數據集,同時也需要人工標注一批用戶問題與FAQ中問答對的匹配語料,用于訓練模型。然而這種情況在一些小語種中不太現實,一方面缺乏相應的標注語料,另一方面了解小語種的NLP研發人員很稀少,這兩個方面都限制了聊天機器人的研發。
阿里巴巴集團在去年開始明顯加快了國際化的進程,不僅通過速賣通(AliExpress)覆蓋了俄羅斯、西班牙等120多個國家和地區,而且還在不同地區收購或投資了當地的電商企業,比如收購了東南亞地區最大的電商Lazada,在印度地區投資了Paytm等。
?
未來,阿里巴巴集團將為20億用戶提供服務。在這樣一個背景下,作為阿里集團內最大的服務團隊,在服務好國內消費者的前提下,也需要思考如何服務好國外的消費者,其中就包括使用技術手段解決消費者的服務咨詢類問題。然而,現有的技術手段需要大量的標注數據,以幫助深度學習或機器學習系統訓練出有效的模型。但一些小語種(如印尼語、泰語、菲律賓語等)不僅缺乏大規模的標注數據,而且相應的算法研發人員也相當匱乏。如何為使用這些語種的國家和地區的消費者提供高質量的服務,將是對算法人員很大的挑戰。因此我們設計了這種一個題目,希望將數據資源豐富的語言理解能力遷移到資源匱乏的語言上。
?
期待你的參與
?
通過本次比賽,我們不僅希望為學術界拋磚引玉,貢獻一個在真實場景中需要面對解決的問題,而且希望有更多的優秀選手參與比賽,共同幫助我們提升聊天機器人的能力。未來,對于消費者,他們可以自由地選擇語言,不管是使用官方語言(如英語)還是使用日常用語(如印尼語等小語種),都將得到高質量的服務。
?
在這項比賽中,為了使參賽人員關注于語言本身的特性及遷移能力上,我們做了一些限制,比如不要過分關注于機器翻譯技術等。這些限制,本質上是為了回歸問題本身,而不是利用外部的能力。在此之外,參賽人員可以發揮想象力和創造力,提出各種模型和解決方案。
?
本次大賽將向全社會開放,我們期待來自高等院校、科研單位、互聯網企業等算法工程師,在這個舞臺大展身手。
?
點擊CIKM AnalytiCup 2018,進入阿里天池平臺了解大賽詳情、報名。
總結
以上是生活随笔為你收集整理的全球最强大脑在哪?阿里小蜜算法团队在寻找的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里Java高考卷来了,你能得几分?
- 下一篇: 重磅!阿里开源自研语音识别模型DFSMN