ICITR 2021 | 排序算法中的用户公平性、item公平性和多样性
?PaperWeekly 原創 ·?作者?|?金金
單位?|?阿里巴巴研究實習生
研究方向?|?推薦系統
簡介
根據相關性概率對項目進行排序一直是傳統排序系統的目標。雖然這最大化了傳統的排名標準,但人們越來越認識到,在線平臺不僅服務于多樣化的用戶群體,而且還服務于產品的生產者,這是一種過于簡單化的做法。
特別是,排名算法在如何服務所有用戶群體(而不僅僅是多數用戶群體)方面應該是公平的,而且在如何在項目之間劃分曝光率方面也應該是公平的。
然而,本文證明了用戶公平、item 公平和多樣性是本質上不同的概念。特別地,作者發現,只考慮其中一個需求的算法可能無法滿足,甚至損害其他兩個需求。
作者提出了第一個排序算法,它顯式地強制執行所有三個要求。
從它的解中,可以通過一種新穎的 Birkhoff-von Neumann 分解算法得到一個排序策略,該算法優化了多樣性。
論文標題:
User Fairness, Item Fairness, and Diversity for Rankings in Two-Sided Markets
論文來源:
ICITR 2021
論文鏈接:
http://www.cs.cornell.edu/people/tj/publications/wang_joachims_21a.pdf
理論分析
第一,作者進行了零效用分析,具體來說:
首先,最大化整體效用可能會導致用戶組和/或 item 組的效用為零,并且它可能無法覆蓋意圖的最大數量。
其次,強制執行 item 公平性可能會導致用戶組的效用為零,并且無法覆蓋最大的意圖量。
第三,最大化用戶公平性可能導致 item 組的效用為零,并且不能覆蓋最大的意圖量。
第四,最大化多樣性會導致用戶組和/或 item 組的效用為零。
根據這一分析,作者得到如下結果,并總結了兩條定理:
定理 1:存在非退化排序問題,任何排序策略 ???? 最大化整體效用 ????(????|????) 對某用戶組 ???????? 的效用 ????(????|????????,????)=0。
定理 2:對于任何非退化排序問題,都存在一個用戶公平函數 ????,使得排序策略 ???? 使用戶公平最大化 ???????? (????|????),那么在這個排名策略 ???? 下,每個用戶組都有非零的效用。
其次,作者進行了效用-效率分析,得到了如下結果,并同樣總結了兩條定理:
定理3:對于任何非退化的排名問題和用戶公平性函數 ????,如果排名策略 ???? 使用戶公平性 ????????(????|????) 最大化,則 ???? 對用戶組來說是帕累托效率。
定理4:存在排名問題和用戶公平性函數,在任何排名政策下,項目都沒有按照每個 item 組內的預期相關性進行排名 ???? 這最大化了用戶的公平性 ???????? (????|????)。
模型
在研究的基礎上,作者提出了 TSFD 算法,該算法分為 3 個步驟。
首先優化用戶公平性和商品公平性:
然后采樣一些多樣性排序結果:對于每一輪 Birkhoff 算法,找到一個排列(排名)????,該排列可以從邊緣排名概率矩陣 Σ 中抽樣。這相當于尋找由 Σ 生成的二部圖的完美匹配 ????。然后將這個 ???? 添加到排名策略 ???? 中,選擇概率為排列 ???? 中最小的條目。然后從 Σ 中減去這個排列中所有元素的選擇概率。實驗證明該算法是正確的,在每一輪中,總能從 Σ 生成的二部圖中找到一個完美匹配。而且,生成的策略不超過 (?????1)2 +1 排列,其中 ???? 是 Σ 的維度。
實驗
在實驗階段,作者首先研究了用戶意圖相似性、用戶群體比例和曝光度如何影響用戶公平性?
作者發現三個因素的影響在男性和女性之間的實用率用戶組 ????????????????????????????/????????????????????=????(????|????????????????????????,????)/????(????|????????????????,????),衡量效用兩個用戶組之間的區別。對于最大化用戶公平的政策,少數人(女性)隨著意向相似性的降低,群體的效用比率也會降低。該比率也隨著男性群體比例的增加而降低,并在不同的暴露陡度下保持平穩。這是意料之中的,因為用戶公平性目標為大多數群體賦予了更大的權重,但卻忽略了曝光度的陡度。
所提出的 TSFD Rank 與只最大化用戶公平性的策略達到了幾乎相同的比例,這表明了它在公平分配兩個用戶組之間由于其他需求造成的效用下降方面的有效性。最大化 item 公平性或整體效用的策略放大少數(女性)用戶群體的效用降幅大于 TSFD 排名。使多樣性最大化的政策有時會放大效用下降,有時又會矯枉過正。
其次作者研究了外在偏差和曝光陡度如何影響 item 公平性?
具有不同偏差的結果如圖(d)所示。最大化 item 公平性的策略確保隨著偏差的增加,曝光率大致呈線性變化,這是可以預料的,因為曝光率是黑點電影的平均相關性的線性函數,而黑點電影的平均相關性又是偏差水平的線性函數。
所提出的 TSFD 排序與最大化 item 公平性的策略獲得了相似的曝光率,而所有其他方法都導致了對較少代表性的黑線電影的偏見的過度放大。圖(e)顯示,當曝光陡峭度增加時,TSFD 排名和最大化 item 公平性的策略都能夠控制贏家通吃的動態,而所有其他方法都不能確保對較少代表性的黑線電影的更公平的曝光量。
最后作者研究了意圖的數量和曝光的陡度如何影響多樣性?
圖(f)顯示,隨著意圖數量的增加,最大化多樣性與最大化用戶公平性的距離越來越遠。圖(g)和(h)表明,隨著意圖數量的增加和暴露度分布的陡峭,滿足其他需求的政策會進一步偏離政策最大化多樣性。
更多閱讀
#投 稿?通 道#
?讓你的文字被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析、科研心得或競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
?????稿件基本要求:
? 文章確系個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標注?
? 稿件建議以?markdown?格式撰寫,文中配圖以附件形式發送,要求圖片清晰,無版權問題
? PaperWeekly 尊重原作者署名權,并將為每篇被采納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
?????投稿通道:
? 投稿郵箱:hr@paperweekly.site?
? 來稿請備注即時聯系方式(微信),以便我們在稿件選用的第一時間聯系作者
? 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿
△長按添加PaperWeekly小編
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
·
總結
以上是生活随笔為你收集整理的ICITR 2021 | 排序算法中的用户公平性、item公平性和多样性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 今日arXiv精选:Transforme
- 下一篇: 科创板申购额度