阿里P8架构师谈:阿里双11秒杀系统如何设计?
秒殺活動場景
淘寶雙11秒殺場景,大量的用戶短時間內涌入,瞬間流量巨大(高并發),比如:1000萬人同一時間搶購100件商品。秒殺活動是一個特別考驗后臺數據庫、緩存服務的業務,對于數據庫、緩存的性能要求特別嚴格。
秒殺背后的技術挑戰
1、突增的服務器及網絡需求
通常情況下,雙 11 的服務器使用是平時的 3-5 倍,網絡帶寬是平時 N倍。
2、業務高并發,服務負載重
我們通常衡量一個 Web 系統的吞吐率的指標是 QPS(Query Per Second,每秒處理請求數),解決每秒數萬次的高并發場景,這個指標非常關鍵。
假設處理一個業務請求平均響應時間為 100 ms,同時,系統內有 20 臺 Web 服務器,配置最大連接數為 500 個,Web 系統的理論峰值 QPS 為(理想化的計算方式):100000 (10萬QPS)意味著1 秒鐘可以處理完 10 萬的請求,而“秒殺”的那 5w/s 的秒殺似乎是“紙老虎”。
實際情況,在高并發的實際場景下,服務器處于高負載的狀態,網絡帶寬被擠滿,在這個時候平均響應時間會被大大增加。隨著用戶數量的增加,數據庫連接進程增加,需要處理的上下文切換也越多,服務器造成負載壓力越來越重。
3、業務耦合度高,引起系統“雪崩”
更可怕的問題是,當系統上某個應用因為延遲而變得不可用,用戶的點擊越頻繁,惡性循環最終導致“雪崩”,因為其中一臺服務器掛了,導致流量分散到其他正常工作的機器上,再導致正常的機器也掛,然后惡性循環,將整個系統拖垮。
如何解決秒殺技術瓶頸
秒殺架構設計思路:
將請求攔截在系統上游,降低下游壓力:秒殺系統特點是并發量極大,但實際秒殺成功的請求數量卻很少,所以如果不在前端攔截很可能造成數據庫讀寫鎖沖突,甚至導致死鎖,最終請求超時。
充分利用緩存(redis):利用緩存可極大提高系統讀寫速度。
消息中間件(ActiveMQ、Kafka等):消息隊列可以削峰,將攔截大量并發請求,這也是一個異步處理過程,后臺業務根據自己的處理能力,從消息隊列中主動的拉取請求消息進行業務處理。
前端設計方案
頁面靜態化:將活動頁面上的所有可以靜態的元素全部靜態化,并盡量減少動態元素。通過CDN來抗峰值。
禁止重復提交:用戶提交之后按鈕置灰,禁止重復提交
用戶限流:在某一時間段內只允許用戶提交一次請求,比如可以采取IP限流
后端設計方案
服務端控制器層(網關層)
限制uid(UserID)訪問頻率:我們上面攔截了瀏覽器訪問的請求,但針對某些惡意攻擊或其它插件,在服務端控制層需要針對同一個訪問uid,限制訪問頻率。
服務層
上面只攔截了一部分訪問請求,當秒殺的用戶量很大時,即使每個用戶只有一個請求,到服務層的請求數量還是很大。比如我們有100W用戶同時搶100臺手機,服務層并發請求壓力至少為100W。
采用消息隊列緩存請求:既然服務層知道庫存只有100臺手機,那完全沒有必要把100W個請求都傳遞到數據庫啊,那么可以先把這些請求都寫到消息隊列緩存一下,數據庫層訂閱消息減庫存,減庫存成功的請求返回秒殺成功,失敗的返回秒殺結束。
利用緩存應對讀請求:比如雙11秒殺搶購,是典型的讀多寫少業務,大部分請求是查詢請求,所以可以利用緩存分擔數據庫壓力。
利用緩存應對寫請求:緩存也是可以應對寫請求的,比如我們就可以把數據庫中的庫存數據轉移到Redis緩存中,所有減庫存操作都在Redis中進行,然后再通過后臺進程把Redis中的用戶秒殺請求同步到數據庫中。
數據庫層
數據庫層是最脆弱的一層,一般在應用設計時在上游就需要把請求攔截掉,數據庫層只承擔“能力范圍內”的訪問請求。所以,上面通過在服務層引入隊列和緩存,讓最底層的數據庫高枕無憂。
比如:利用消息中間件和緩存實現簡單的秒殺系統
Redis是一個分布式緩存系統,支持多種數據結構,我們可以利用Redis輕松實現一個強大的秒殺系統。
我們可以采用Redis 最簡單的key-value數據結構,用一個原子類型的變量值(AtomicInteger)作為key,把用戶id作為value,庫存數量便是原子變量的最大值。對于每個用戶的秒殺,我們使用 RPUSH key value插入秒殺請求, 當插入的秒殺請求數達到上限時,停止所有后續插入。
然后我們可以在臺啟動多個工作線程,使用 LPOP key 讀取秒殺成功者的用戶id,然后再操作數據庫做最終的下訂單減庫存操作。
當然,上面Redis也可以替換成消息中間件如ActiveMQ、Kafka等,也可以將緩存和消息中間件 組合起來,緩存系統負責接收記錄用戶請求,消息中間件負責將緩存中的請求同步到數據庫。
秒殺架構設計總結:
限流: 鑒于只有少部分用戶能夠秒殺成功,所以要限制大部分流量,只允許少部分流量進入服務后端。
削峰:對于秒殺系統瞬時會有大量用戶涌入,所以在搶購一開始會有很高的瞬間峰值。高峰值流量是壓垮系統很重要的原因,所以如何把瞬間的高流量變成一段時間平穩的流量也是設計秒殺系統很重要的思路。實現削峰的常用的方法有利用緩存和消息中間件等技術。
異步處理:秒殺系統是一個高并發系統,采用異步處理模式可以極大地提高系統并發量,其實異步處理就是削峰的一種實現方式。
內存緩存:秒殺系統最大的瓶頸一般都是數據庫讀寫,由于數據庫讀寫屬于磁盤IO,性能很低,如果能夠把部分數據或業務邏輯轉移到內存緩存,效率會有極大地提升。
可拓展:當然如果我們想支持更多用戶,更大的并發,最好就將系統設計成彈性可拓展的,如果流量來了,拓展機器就好了。像淘寶、京東等雙十一活動時會增加大量機器應對交易高峰。
阿里架構師面試130題目
答案領取方法:
歡迎私信關鍵詞 “我要130” 即可獲得阿里架構師面試題目鏈接!
作者:mikechen的博客
鏈接:https://www.jianshu.com/p/09693cc14d49
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯系作者獲得授權并注明出處。
總結
以上是生活随笔為你收集整理的阿里P8架构师谈:阿里双11秒杀系统如何设计?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 好零友零食这段时间开店有哪些政策?
- 下一篇: 厚曲酒不好买的原因是什么?