以人为本的机器学习:谷歌人工智能产品设计概述 By 机器之心2017年7月17日 12:13 取代了手动编程,机器学习(ML)是一种帮助计算机发现数据中的模式和关系的科学。对于创建个人的和动态的经历
以人為本的機(jī)器學(xué)習(xí):谷歌人工智能產(chǎn)品設(shè)計(jì)概述
By?機(jī)器之心2017年7月17日 12:13取代了手動編程,機(jī)器學(xué)習(xí)(ML)是一種幫助計(jì)算機(jī)發(fā)現(xiàn)數(shù)據(jù)中的模式和關(guān)系的科學(xué)。對于創(chuàng)建個(gè)人的和動態(tài)的經(jīng)歷來說,它是一種強(qiáng)有力的工具。從?Netflix?的推薦系統(tǒng)到自動駕駛車輛,它已經(jīng)在驅(qū)動生活中的很多事物。但隨著構(gòu)建機(jī)器學(xué)習(xí)的經(jīng)歷越來越多,如何設(shè)計(jì)用戶體驗(yàn)(User?Experience?Design)讓人們感覺是在掌控技術(shù),而非技術(shù)控制人,很明顯?UXers?在這方面仍舊有很多需要我們深入探索。
就像手機(jī)和之前的網(wǎng)絡(luò)革命一樣,機(jī)器學(xué)習(xí)使我們重新思考、重組結(jié)構(gòu),它將取代并對之前所有我們之前建立的體驗(yàn)帶來全新可能性。在谷歌用戶體驗(yàn)社區(qū),我們已經(jīng)開展了一項(xiàng)稱為「以人為本的機(jī)器學(xué)習(xí)(HCML)」計(jì)劃以助于讓人們重視并引導(dǎo)這個(gè)過程。通過這種方式,我們可以觀察產(chǎn)品,看看機(jī)器學(xué)習(xí)是如何使用一些特有方法解決人類需求的。我們在谷歌的隊(duì)伍與公司內(nèi)的用戶體驗(yàn)工程師共同開發(fā)了加速核心機(jī)器學(xué)習(xí)理論的算法,他們知道如何將機(jī)器學(xué)習(xí)與用戶體驗(yàn)相結(jié)合,并且保證以包容性的方式構(gòu)建機(jī)器學(xué)習(xí)和人工智能。
如果你剛開始使用機(jī)器學(xué)習(xí),你也許會對其空間的復(fù)雜性和廣泛的創(chuàng)新機(jī)制有些不適應(yīng)。慢慢來,不要著急,你需要一點(diǎn)時(shí)間去適應(yīng)。你并不需要為了在團(tuán)隊(duì)中表現(xiàn)的更有價(jià)值而重新塑造自己。
我們已經(jīng)開發(fā)了?7?個(gè)要點(diǎn)幫助設(shè)計(jì)師找到一種新的平臺設(shè)計(jì)以機(jī)器學(xué)習(xí)為驅(qū)動的產(chǎn)品。誕生于我們與?UX?和谷歌的人工智能團(tuán)隊(duì)共同完成的工作,這些要點(diǎn)將幫助你把用戶放在首位、快速迭代并理解機(jī)器學(xué)習(xí)創(chuàng)造的獨(dú)特的機(jī)會。
讓我們開始吧
1.?不要指望機(jī)器學(xué)習(xí)能幫你找出需要解決的問題
如今有很多圍繞機(jī)器學(xué)習(xí)和人工智能的夸張的宣傳。許多公司和產(chǎn)品團(tuán)隊(duì)將機(jī)器學(xué)習(xí)視做一些產(chǎn)品策略的解決方案,而忽略了真正需要解決的、有意義的問題。
這對于純粹的探索或者了解一項(xiàng)技術(shù)的能力來說是不錯(cuò)的,并且這經(jīng)常會激發(fā)新的產(chǎn)品的靈感。然而,如果不考慮人類的需求,你將要構(gòu)建的非常強(qiáng)力的系統(tǒng)只能解決一個(gè)非常小—或者不存在的—的問題。
所以我們的第一個(gè)要點(diǎn)是,你仍然需要做那些一直所做的辛苦工作去找出人們的需求。這些工作就是所有那些人類學(xué)、情景調(diào)查、采訪、深入調(diào)查、瀏覽消費(fèi)者的投票、日志分析等等。你要貼近大眾,以了解你是否在解決一個(gè)人們未明的需求。機(jī)器學(xué)習(xí)不會找出需要解決的問題。我們?nèi)耘f需要定義它。作為用戶體驗(yàn)設(shè)計(jì)者,無論主導(dǎo)技術(shù)的框架如何,我們已經(jīng)有了引導(dǎo)我們的團(tuán)隊(duì)的工具。
2.?機(jī)器學(xué)習(xí)是否能以一種獨(dú)特的方式解決問題?
一旦你明確了需求或者明確了你想要解決的需求,你會考慮一下究竟機(jī)器學(xué)習(xí)能否以獨(dú)特的方式解決這些需求。有許多切實(shí)存在的問題不需要機(jī)器學(xué)習(xí)的解決方案。
然而在這點(diǎn)所面對的挑戰(zhàn)在于,如何確定哪個(gè)任務(wù)需要機(jī)器學(xué)習(xí),哪些通過機(jī)器學(xué)習(xí)能獲得有意義的提升,哪些不會從機(jī)器學(xué)習(xí)中獲利或者甚至讓體驗(yàn)變得更差。許多產(chǎn)品可以在沒有機(jī)器學(xué)習(xí)的情況下讓人感受到「智能」或者「個(gè)性化」。不要認(rèn)為只有通過機(jī)器學(xué)習(xí)這些才有可能實(shí)現(xiàn)。
當(dāng)你忘記添加附件時(shí),Gmail?尋找包含「附件(attachment)」和「附上(attached)」之類的短語并向你發(fā)出提醒。啟發(fā)式方法在這方面表現(xiàn)的不錯(cuò)。一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)更可能發(fā)現(xiàn)更多的隱含錯(cuò)誤,但是構(gòu)建這樣的系統(tǒng)卻消耗太大。
我們創(chuàng)建了一組練習(xí)幫助團(tuán)隊(duì)理解機(jī)器學(xué)習(xí)對其用例的價(jià)值。這些練習(xí)通過挖掘人們所帶有的思維模型和期望與機(jī)器學(xué)習(xí)系統(tǒng)和系統(tǒng)所需要的數(shù)據(jù)進(jìn)行交互時(shí)的細(xì)節(jié),從而幫助團(tuán)隊(duì)。
以下是?3?個(gè)示例練習(xí),我們使一些團(tuán)隊(duì)看過練習(xí)并回答他們想要使用機(jī)器學(xué)習(xí)解決的用例:
- 描述一種理論上人類「專家」今天可能執(zhí)行任務(wù)的方式。
- 如果你的人類專家將要執(zhí)行這項(xiàng)任務(wù),你將如何對其反饋使下次得以提升?對混淆矩陣的?4?個(gè)階段執(zhí)行此操作
- 如果人類執(zhí)行這項(xiàng)任務(wù),用戶希望其采取怎樣的假設(shè)?
花費(fèi)僅僅幾分鐘的時(shí)間回答這些問題揭示了人們對以機(jī)器學(xué)習(xí)為驅(qū)動的產(chǎn)品提出的必然假設(shè)。他們同樣適用于作為產(chǎn)品團(tuán)隊(duì)的討論中或者在用戶研究的刺激中的提示。當(dāng)我們討論到定義標(biāo)簽和訓(xùn)練模型的過程時(shí),我們還會再談?wù)撍?/p>
在完成這些練習(xí),梳理出一些特殊產(chǎn)品和特征的額外概要和故事之后,我們就能將團(tuán)隊(duì)所有的產(chǎn)品創(chuàng)意在一個(gè)簡單的二維坐標(biāo)系中畫出來。
在二維坐標(biāo)系中繪制出想法。使隊(duì)伍投票得出哪種想法具有最大的用戶影響力、哪種使用機(jī)器學(xué)習(xí)的方案體驗(yàn)可以獲得最大限度地提升。
這可以讓我們區(qū)分具有影響力的想法與影響力較低的想法,并與那些沒有或者只從中受益很少的想法相比較,機(jī)器學(xué)習(xí)?vs.?X。你應(yīng)該已經(jīng)在這些會話中結(jié)合了工程師的思想,如果你沒有,你需要讓他們考慮一下這些想法在機(jī)器學(xué)習(xí)上的可行性。無論哪種想法對用戶有著最大的影響且機(jī)器學(xué)習(xí)唯一適用(位于上述矩陣中的右上角),這都是你首先想要關(guān)注的方面。
3.?個(gè)人示例和測試
機(jī)器學(xué)習(xí)系統(tǒng)面臨的一個(gè)重大的挑戰(zhàn)是原型的制作。如果你的產(chǎn)品的全部價(jià)值就是使用唯一的用戶數(shù)據(jù)為她專門設(shè)計(jì)一種體驗(yàn),你不能僅僅使原型提升速度并使其盡量貼近真實(shí)。同樣,如果你等到完全地建立一個(gè)適當(dāng)?shù)臋C(jī)器學(xué)習(xí)系統(tǒng)對設(shè)計(jì)進(jìn)行測試,那么在測試后再進(jìn)行改變就沒有多大的意義了。然而,以下兩種用戶研究方法可以幫助你:使用參與者的個(gè)人的實(shí)例和「綠野仙蹤」研究。
當(dāng)使用早期設(shè)計(jì)圖做用戶研究時(shí),在這一階段使參與者帶來他們自己的數(shù)據(jù)—比如,個(gè)人照片、他們自己的聯(lián)系人名單、他們所接受的音樂或者電影推薦。記住,你需要確定已完全告知參與者們在測試中數(shù)據(jù)的用途以及銷毀時(shí)間。在階段開始前,對于參與者這甚至可以是一種有趣的「家庭作業(yè)」。(畢竟,人們習(xí)慣談?wù)撍麄冏钕矚g的電影)
使用這些事例,你就可以模仿系統(tǒng)所做出的正確或者錯(cuò)誤的回應(yīng)。比如,你可以模仿系統(tǒng)為用戶推薦錯(cuò)誤的電影,以觀察她的反映以及她對系統(tǒng)返回錯(cuò)誤結(jié)果所做出的假設(shè)。比起使用模仿的示例或者概念性的說明,這使得你評估這些可能性的消耗和收益有效得多。
第二種比較好的測試建立機(jī)器學(xué)習(xí)系統(tǒng)的產(chǎn)品的方法是執(zhí)行巫師研究(Wizard?of?Oz?studies)。這種方法曾經(jīng)風(fēng)靡一時(shí),在過去?20?年左右的時(shí)間中,其作為用戶研究方法不被看好。好的,他們現(xiàn)在又回來了。
聊天界面是最簡單的檢測巫師研究的經(jīng)歷了。只需要一名隊(duì)友扮演一方與「人工智能」聊天
快速提示:巫師研究的參與者們與他們所認(rèn)為的人工智能系統(tǒng)進(jìn)行互動,但是該自主系統(tǒng)實(shí)際上由人控制(通常是一個(gè)隊(duì)友)。
讓一個(gè)隊(duì)友模仿機(jī)器學(xué)習(xí)系統(tǒng)的行為,比如聊天響應(yīng)、為參與者建議應(yīng)該呼叫的人選或者作出電影推薦,這些行為可以假裝正在于「智能系統(tǒng)」進(jìn)行互動。這些互動對于設(shè)計(jì)的指導(dǎo)非常重要,因?yàn)楫?dāng)參與者認(rèn)真地與他們認(rèn)為的人工智能接觸時(shí),他們會自然地傾向于形成系統(tǒng)的心理模型并根據(jù)這些系統(tǒng)調(diào)整他們的行為。觀察他們與系統(tǒng)的適應(yīng)性以及二次交互對于影響其設(shè)計(jì)非常有價(jià)值。
4.?衡量權(quán)重
機(jī)器學(xué)習(xí)系統(tǒng)也會犯錯(cuò)。弄清楚出錯(cuò)的緣由以及對用戶體驗(yàn)的影響至關(guān)重要。上文中我們提到的混淆矩陣(confusion?matrix) 是機(jī)器學(xué)習(xí)中的一個(gè)關(guān)鍵概念,闡釋了系統(tǒng)在正常和不正常時(shí)分別應(yīng)該有什么樣的表現(xiàn)形態(tài)。
混淆矩陣的四種狀態(tài)及用戶相應(yīng)的反應(yīng)。
盡管系統(tǒng)對每種錯(cuò)誤都一視同仁,但是對于用戶來說,每種錯(cuò)誤的體驗(yàn)不盡相同。比如,我們有一個(gè)『人類與怪獸』分辨器,偶而一次將人類識別成怪獸對于系統(tǒng)來說只是一次小小的識別錯(cuò)誤。系統(tǒng)無意冒犯用戶或者出于某種文化傾向做出這樣的判斷。它也不明白,相較于怪獸被錯(cuò)誤地識別為人類的情況,用戶經(jīng)常碰到的卻是被錯(cuò)判成怪獸。但或許那是我們的人本位意識在作怪。
在機(jī)器學(xué)習(xí)的范疇里,必須在準(zhǔn)確率和召回率之間做有意識的權(quán)衡取舍。也就是說,明確哪種結(jié)果更符合需求--得到所有正確信息,這意味著結(jié)果中包含更多的錯(cuò)誤信息(優(yōu)化召回率);?或者最小化錯(cuò)誤信息量,而這意味著會犧牲部分正確的信息(優(yōu)化準(zhǔn)確度)。例如,如果用?Google?搜索游樂場(playground),可能會得到以下結(jié)果:
這些結(jié)果包含了一部分兒童玩耍的場景,但是并不全都在游樂場。這種情況下召回率優(yōu)先于準(zhǔn)確率。重要的是能夠獲取全部的游樂場圖片,哪怕結(jié)果里包含了少量類似但并不正確的圖片,而不僅僅只是獲取有游樂場的照片而恰恰漏掉了需要的那張。
5.?共同學(xué)習(xí)和適應(yīng)計(jì)劃
最有價(jià)值的機(jī)器學(xué)習(xí)模式會隨著時(shí)間的推移與用戶的心理狀態(tài)一同演變。當(dāng)人們與這些系統(tǒng)交互的同時(shí),也影響和調(diào)整著產(chǎn)品即將呈現(xiàn)的狀態(tài)。進(jìn)而這些調(diào)整也將反過來影響用戶與系統(tǒng)交互的過程,并通過循環(huán)反饋改造模型本身。這會形成所謂的『陰謀論』——人們構(gòu)筑了一套系統(tǒng)卻或錯(cuò)誤或不完整的心理模型,并試圖根據(jù)這些虛構(gòu)規(guī)則來控制輸出——旨在用明確的心理暗示來引導(dǎo)用戶,鼓勵(lì)用戶提供對其自己和模型互利的反饋。
一個(gè)良性循環(huán)的例子:Gboard?不斷改進(jìn)技術(shù)以預(yù)測用戶要打出的下一個(gè)字。使用系統(tǒng)建議的人越多,這些建議就會變得越好。
當(dāng)機(jī)器學(xué)習(xí)系統(tǒng)根據(jù)現(xiàn)有的數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí),它們會以不可預(yù)知的方式來適應(yīng)新數(shù)據(jù)的輸入。因此我們也需相應(yīng)地調(diào)整對用戶及其反饋的研究。這意味著我們應(yīng)先于產(chǎn)品周期對用戶進(jìn)行縱向,廣泛其高頻的研究。由于用戶和用例增加,以及需要第一時(shí)間了解人們在使用系統(tǒng)時(shí)其心理如何隨著每次的成功和失敗而發(fā)展變化。我們應(yīng)當(dāng)計(jì)劃足夠的時(shí)間,通過量化準(zhǔn)確度和錯(cuò)誤來評估機(jī)器學(xué)習(xí)系統(tǒng)的性能,并在用戶使用系統(tǒng)時(shí)獲知情感模型的表現(xiàn)。
此外,作為?UXer(用戶體驗(yàn)設(shè)計(jì)者?User?Experience?Design),我們需要考慮如何在整個(gè)產(chǎn)品生命周期內(nèi)獲得用戶的原始反饋,以改進(jìn)機(jī)器學(xué)習(xí)系統(tǒng)。交互模塊的設(shè)計(jì)如果能做到便于反饋且能夠及時(shí)呈現(xiàn)快速反饋的優(yōu)越性,這就使得該系統(tǒng)與普通的好系統(tǒng)區(qū)別開來。
?Google?應(yīng)用程式會在一段時(shí)間內(nèi)詢問特定的卡牌是否有用,以獲取相關(guān)建議。
人們可對?Google?搜索自動填充功能提供反饋,包括預(yù)測可能不準(zhǔn)確的原因。
6.?讓你的算法使用正確的標(biāo)簽
作為用戶體驗(yàn)設(shè)計(jì)者,我們已經(jīng)習(xí)慣于把點(diǎn)線三維模擬圖,小樣,樣機(jī)和進(jìn)度條作為可交付成果的標(biāo)志。但對于得到機(jī)器學(xué)習(xí)加持的設(shè)計(jì)者來說,需要關(guān)注的范圍有限,其中就不得不提到『標(biāo)簽』。
標(biāo)簽是機(jī)器學(xué)習(xí)的標(biāo)配。有專門的人員每天的工作就是為成千上萬的內(nèi)容打標(biāo)簽,回答諸如『圖片里是一只貓么』這樣的問題。一旦有足夠的圖片被標(biāo)注成『是』或者『不是』,我們就得到一個(gè)數(shù)據(jù)庫可以用來訓(xùn)練專門辨識貓的模型。或者,準(zhǔn)確地說,有了這樣的標(biāo)簽構(gòu)成的數(shù)據(jù)庫,就可以在相當(dāng)程度上預(yù)測一張新的圖片上是否有一只貓。很簡單,對不對?
你能通過這個(gè)小測驗(yàn)么
但是真正的挑戰(zhàn)在于當(dāng)模型用于一些比較主觀的判斷的時(shí)候,比如『一篇文章是否有趣』,或者『一封電郵回復(fù)是否有意義』。但是,這樣的模型不僅訓(xùn)練的時(shí)間很長,并且獲得一個(gè)完整標(biāo)記的數(shù)據(jù)集的代價(jià)可能非常高,更不要說錯(cuò)誤的標(biāo)簽可能會對產(chǎn)品的可行性產(chǎn)生巨大的影響。
大致的流程應(yīng)該是這樣:?首先作出合理假設(shè),并與相關(guān)人員進(jìn)行討論。這些假設(shè)通常是這樣的--對于XX用戶的XX情況,我們認(rèn)為他們會傾向于XX而不是XX』。然后盡快地將這些假設(shè)轉(zhuǎn)化為最接近可行的測試小樣,以便收集反饋和不斷改進(jìn)。
無論想要做任何預(yù)測模型,我們都需要找到最適合給機(jī)器當(dāng)老師的專家--具有相關(guān)領(lǐng)域?qū)I(yè)知識的人。我們建議只需雇傭少數(shù)的專家,或把他們當(dāng)做后援,更重要的是在目前的團(tuán)隊(duì)中培養(yǎng)這樣的專家,我們稱之為「內(nèi)容專員」。
從這個(gè)角度來說,確定哪種假設(shè)更具可行性很重要。在展開大規(guī)模數(shù)據(jù)收集分析和標(biāo)注之前,需要「Content?Specialists」從實(shí)際用戶數(shù)據(jù)中挑選出示例來執(zhí)行關(guān)鍵的第二輪驗(yàn)證。用戶應(yīng)該對一個(gè)高度接近成品的測試機(jī)進(jìn)行測試,使其認(rèn)為他們正在與一個(gè)真正的?AI?交流(按上述第?3?點(diǎn))。
無論對?AI?產(chǎn)品有何需求,通過實(shí)地驗(yàn)證,「Content?Specialists」就可以創(chuàng)建一系列手動標(biāo)注示例。通過這些例子便可以掌握數(shù)據(jù)收集流程,用于訓(xùn)練模型的標(biāo)簽,以及用于設(shè)計(jì)大規(guī)模標(biāo)簽協(xié)議的框架。
7.?擴(kuò)充用戶體驗(yàn)設(shè)計(jì)師隊(duì)伍,機(jī)器學(xué)習(xí)是一個(gè)創(chuàng)意過程
作為?UXer,試想一下最糟糕的所謂微管理「反饋」是什么。是不是就好像一個(gè)奇怪的家伙靠著你肩膀?qū)δ愕拿總€(gè)動作指手畫腳?好的,記住這個(gè)場景,并且萬分確定你絕對不會碰到這樣的工程師。
有很多潛在的方法可以應(yīng)對任何機(jī)器學(xué)習(xí)的挑戰(zhàn)。對于?UXer?來說,過早地被條條框框束縛可能會無意間變得被動而缺乏創(chuàng)造力。相信工程師們的直覺并且鼓勵(lì)他們大膽去試驗(yàn),哪怕缺乏完整的評估體系會使其對用戶測試猶豫不決。
機(jī)器學(xué)習(xí)是一個(gè)比我們想象中更具創(chuàng)造力和表現(xiàn)力的過程。訓(xùn)練模型過程很漫長,可視化的工具還不是很好,所以工程師在調(diào)整算法時(shí)最終靠的是他們的想象力(有一種被稱為「主動學(xué)習(xí)」的方法,手動「調(diào)整」每次迭代后的模型)。持續(xù)地幫助工程師們做出偉大的以用戶為中心的選擇任重道遠(yuǎn)。
與工程,產(chǎn)品為伍,拼接對的體驗(yàn)。
工程師們需要被啟發(fā)--規(guī)則,個(gè)人經(jīng)歷,視頻,模型,用戶研究的剪輯--不論任何方式,只要能夠呈現(xiàn)出什么才是超棒的用戶體驗(yàn)--讓他們能順暢地展開用戶研究,并出其不意地將其帶入充滿設(shè)計(jì)師頭腦風(fēng)暴,研討會和設(shè)計(jì)大賽的精彩世界從而更深入地了解產(chǎn)品原理和體驗(yàn)?zāi)繕?biāo)。工程師越早地進(jìn)入產(chǎn)品改進(jìn)階段,機(jī)器學(xué)習(xí)系統(tǒng)的魯棒性就會越好,那么就會對產(chǎn)品形成更加積極有效的影響。
總結(jié)
以上就是谷歌內(nèi)部對開發(fā)團(tuán)隊(duì)強(qiáng)調(diào)的七個(gè)要素,我們希望這些在你的機(jī)器學(xué)習(xí)產(chǎn)品創(chuàng)造過程中同樣有用。隨著機(jī)器學(xué)習(xí)開始助力越來越多的產(chǎn)品和用戶體驗(yàn)研究,讓我們繼續(xù)堅(jiān)持以人為本,為人們尋求獨(dú)特的價(jià)值,讓每一次體驗(yàn)都變得彌足珍貴。
總結(jié)
以上是生活随笔為你收集整理的以人为本的机器学习:谷歌人工智能产品设计概述 By 机器之心2017年7月17日 12:13 取代了手动编程,机器学习(ML)是一种帮助计算机发现数据中的模式和关系的科学。对于创建个人的和动态的经历的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AK-47 制造商 Kalashniko
- 下一篇: 从蚂蚁金服一窥人工智能在金融领域的机遇与