可靠性测试-故障模型库
- 什么是可靠性測試:
系統的可靠性是指在發生故障的情況下,系統的數據部丟失,故障恢復后系統能夠正常工作。可靠性測試是有針對性的對系統注入特定的故障的一種測試活動。
- 什么是故障模型庫
故障模型庫是將故障整理分類后的故障集合。
- 故障模型庫分類
按網絡資源分類:創建大量socket連接(tcp連接)、配置ip地址(占用指定的ip)、刪除指定網卡ip地址
按系統操作分類:操作系統吊死、關閉主機(poweroff -f)、修改用戶密碼、重啟主機(shutdown -r)
按系統資源分類:部分cpu核心失效、限制用戶資源(cpu、句柄、進程,修改/etc/security/limits.conf)消耗jvm、消耗cpu、消耗內存、消耗系統io、消耗系統進程數、消耗句柄
?
2.網絡QoS
按網卡分類:禁用網卡、刪除網卡驅動、網卡啟停斷續、修改網卡工作模式(ethtool)
按網絡服務分類:FTP服務吊死、停止網絡服務(rcnetwork stop命令停止所有網卡服務)
按網絡連接分類:TCP端口占用、TCP連接吊死、網絡單通(iptables)、網絡風暴、網絡閃斷(iptables 反復丟掉數據報文來模擬)、限制網絡帶寬(tc)、消耗網絡帶寬
按網絡數據分類:數據報文錯誤(tc)、數據報文丟失(iptables)、數據報文丟失(tc)、數據報文亂 序(tc)、數據報文延遲抖動(tc)、數據報文重復(tc)
3.文件系統
按文件系統分類:搶占文件系統空間(dd)、修改文件系統權限、損壞文件、修改目錄
4.系統進程
按進程操作分類:掛起進程、掛起線程、結束進程、結束線程、進程啟動、進程死循環
按進程狀態分類:進程轉為D狀態、進程轉為Z狀態
5.磁盤
磁盤系統故障類型主要有:DF(device fault)全F壞道,不提供讀寫
UNC壞道,讀出錯,寫可修復,此故障發生最為頻繁
WP(write projected)寫保護,寫出錯,讀正常
ICRC 鏈路傳輸出現誤碼,持續出現的話會導致I/O阻塞
DS(disk slow)慢盤
這些都是平時項目過程中測試過的可靠性場景,這些故障有些可以通過shell命令模擬,有些需要特定的工具(磁盤就需要rdisk.ko工具),系統進程的操作都是通過內部開發的一個工具實現的,可靠性測試深不可測啊 ,需要在這條路上繼續摸索。
---------------------------------------------------------------------------------------------------------------
如需轉載,請注明出處,多謝!
轉載于:https://www.cnblogs.com/xmchene/p/3939621.html
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的可靠性测试-故障模型库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: rsync同步(2010年写作)
- 下一篇: 配置kickstart脚本--图形篇