搜索推荐炼丹笔记:酒店搜索位置偏差的边际重要性
Handling Position Bias For Unbiased Learning To Rank In Hotels Search(ArXiv2020)
作者:一毛,公眾號:煉丹筆記背景
對給定查詢的結果進行排序的模型和隱含的用戶反饋(如點擊數據)由于其豐富性和低成本而成為數據收集的主要來源,特別是對于大型互聯網公司。然而,這種數據收集方法的一個缺點是數據可能有很大的偏差,其中最重要的偏差是位置偏差,用戶傾向于點擊排名較高的結果。
本文我們探討在Tripadvisor酒店搜索的在線測試環境中正確處理位置偏差的邊際重要性。
我們提出了一個經驗有效的方法來處理位置偏差,充分利用用戶的行動數據。我們利用了這樣一個事實:當用戶點擊一個結果時,他幾乎可以肯定地觀察到上面的所有結果,并且點擊結果下面的結果的傾向性將通過一個簡單但有效的位置偏差模型來估計。
在線A/B測試結果表明,該方法改進了搜索排序模型。
三種處理position bias的方案
1. 忽略position的影響
這種方法假設用戶已經評估了所有的選項(items),對于相對較短的列表(比如Facebook廣告推薦)來說是可以接受的.
2. 樣本調整處理
只保留用戶點擊的最后一個結果以及之前的樣本。這種方法假設用戶從上到下依次查看結果,并在向下滾動和停止時單擊第一個相關結果(類似于Cascade模型)。
該方法對于相對較長的list例如Airbnb搜索是非常有效的;但是這種做法是有系統的偏見,這將導致排名模式reverse現有的秩序。
3. 保留訓練的所有數據并使用propensities作為權重
在訓練數據中保留所有結果,但在損失函數中使用傾向作為權重。與前兩種方法相比,該方法通過考慮傾向性來減少訓練數據。他們已經證明,這種方法導致了一個無偏損失函數,從而形成了一個無偏模型,并將此框架稱為無偏學習排名。
然而,這種方法尚未充分利用用戶反饋數據(例如,當用戶單擊結果N時,該用戶幾乎肯定已評估結果1到結果N-1)。此外,這種方法需要傾向性估計(propensity estimation),這是另一項具有挑戰性的任務。
propensity估計的工作
1. Position bias model
位置偏差模型(Position bias model)假設點擊給定結果的概率是評估結果的概率和點擊給定已評估結果的概率的乘積:
其中C表示一個結果是否被點擊, E表示一個結果是否被檢查, R表示一個結果是否相關,這種模型需要結果隨機化實驗來降低用戶體驗,盡管已經花費了很多精力來最小化這種降低效果。
2. 基于回歸的EM算法
為了完全消除退化效應,Wang等人提出了一種無結果隨機化的方法,從平時的點擊中估計位置偏差。該方法采用基于回歸的期望最大化(EM)算法同時提取位置偏差和結果相關性。
我們認為,這種方法傾向于根據一個結果與相同位置k的其他結果的相關性來分配相關性,可能忽略了這樣一個事實,即排名靠前的結果通常比排名靠后的結果更好。
3. 估計點擊傾向的方法
后來,Aslanyan等人提出了一種在不干預實時搜索結果的情況下估計點擊傾向的方法。這種方法利用了在電子商務搜索中,同一query-document對可能隨著時間的推移而自然地改變排名的事實,并使用出現在不同排名的query-document對來估計傾向性。
類似地,Agarwal等人提出了一種無需干預的估算方法,它使用來自不同排名函數的查詢文檔對。這兩種方法都假設一個文檔不會隨時間發生太大的變化,并且傾向性是基于同一文檔在不同位置的CTR來估計的。然而,盡管搜索引擎中的文檔是相對靜態的,但是酒店的價格是動態的,并且是用戶做出點擊/預訂決策時需要考慮的關鍵因素之一,這使得酒店搜索很難生成配對。
方案
1. position bias處理
考慮一個隱式用戶反饋的例子,如下圖所示,列表中有五個酒店曝光,用戶單擊Hotel3。下面是我們將如何處理位置偏差。因為用戶點擊了Hotel 3,所以對Hotel 3進行了評估,我們假設Hotel 1-2也進行了評估,而Hotel 4-5處于未知的評估狀態。因此,在準備訓練數據時,將保留1-3家酒店,而4-5家酒店將根據其傾向進行抽樣。
擴展了經典的位置偏差模型,如公式1所示,當用戶點擊LastClickPos時,用戶已經評估了LastClickPos上面的所有結果。
另一方面, 在LastClickedPos之后觀測到的結果的propensity可以通過下面的式子計算得到:
2. propensity預估
基于結果隨機化的傾向性估計降低了用戶體驗,而現有的基于規則點擊的評價方法難以將酒店關聯性與傾向性分離。在這項工作中,我們將使用一個簡單的基于歷史預訂數量的相關性分配,這將被證明是足夠好的,以評估酒店在某個位置上的平均相關性。根據位置偏差模型,我們有:
此處,我們令P =(R=1|Hotel,k)為在位置k的歷史bookings的個數,我們發現對于在線旅行社(OTAs),歷史預訂數量是酒店相關性的一個非常強烈的信號,與我們的最終業務目標一致。下圖顯示了測量的點擊曲線P(C=1 | k)vs 位置)和基于上面的燈飾計算的傾向曲線P(E=1 | k)與位置)。點擊曲線證明了用戶對點擊排名較高的酒店有很大的偏好,而且由于點擊曲線比計算出的傾向曲線更陡,這意味著我們的榜單已經將更多相關酒店推到了榜首。
實驗
實驗結果
- 與Control模型相比,propensity抽樣模型(測試2)的點擊率提高了1.5%(統計顯著)。
- 在80%的恒定采樣率(測試1)下,它的點擊率比模型高出1.7%(統計顯著)。
- 80%抽樣的模型與控制模型相比,結果差不大。
小結
雖然在LTR模型的訓練中沒有一種被廣泛接受的處理位置偏差的方法,但是處理這種偏差的重要性不容忽視。
在本文中,我們提出了一種簡單易用的方法,充分利用用戶行為的傾向性抽樣,并通過在線實驗證明了該方法的有效性。在線測試結果表明,該方法顯著提高了系統的性能。與支持更復雜模型的基礎設施上的大量投資相比,這種方法需要最少的effort,而不需要更高級別的模型復雜性,但仍然能夠顯著提高搜索排名。
更多干貨,請關注微信公眾號:煉丹筆記總結
以上是生活随笔為你收集整理的搜索推荐炼丹笔记:酒店搜索位置偏差的边际重要性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2020年AI领域有哪些让人惊艳的研究?
- 下一篇: 事半功倍:推荐系统Pre-train预训