SQL Server 2012笔记分享-52:可用性指标
在電信和可靠性理論中,可用性是指:
系統(tǒng),子系統(tǒng),或者設(shè)備在開始一項(xiàng)任務(wù)時(shí)處在指定的可操作或可提交狀態(tài)的程度,這項(xiàng)任務(wù)什么時(shí)候被用到是未知的,例如,是隨機(jī)的。簡單的說,可用性就是一個(gè)系統(tǒng)處在可工作狀態(tài)的時(shí)間的比例。這通常被描述為任務(wù)可行率。數(shù)學(xué)上來講,相當(dāng)于1減去不可用性。
在一個(gè)給定的時(shí)間間隔內(nèi),對(duì)于一個(gè)功能個(gè)體來講,總的可用時(shí)間所占的比例。
例如,一個(gè)一周里(168小時(shí))有100小時(shí)可用的單元的可用性為100/168。可用性的值通常用小數(shù)來表示(如0.9998)。在高可用性的應(yīng)用中,使用一個(gè)被稱為幾個(gè)九的度量,對(duì)應(yīng)小數(shù)點(diǎn)后9的個(gè)數(shù)。在這個(gè)系統(tǒng)中,“五個(gè)九”相當(dāng)于0.99999(或者99.999%)的可用性。
例子
如果我們使用的設(shè)備的MTBF(平均故障間隔)為81.5年,MDT(平均修復(fù)時(shí)間)為1小時(shí):
MTBF in hours = 81.5*365*24=713940
Availability= MTBF/(MTBF+MDT) = 713940/713941 =99.999859%
Unavailability = 0.000141%
每年每設(shè)備的當(dāng)機(jī)時(shí)間以小時(shí)計(jì)為: U=0.01235 小時(shí)每年。
==============================================================
ISO9241/11中的定義是:一個(gè)產(chǎn)品可以被特定的用戶在特定的境況中,有效、高效并且滿意得達(dá)成特定目標(biāo)的程度(The extent to which a product can be used by specified users to achieve specified goals with effectiveness, efficiency and satisfaction in a specified context of use.)。
GB/T3187-97對(duì)可用性的定義:在要求的外部資源得到保證的前提下,產(chǎn)品在規(guī)定的條件下和規(guī)定的時(shí)刻或時(shí)間區(qū)間內(nèi)處于可執(zhí)行規(guī)定功能狀態(tài)的能力。它是產(chǎn)品可靠性、維修性和維修保障性的綜合反映。
==============================================================
下面是一個(gè)可用性的圖例,在不同的可用性標(biāo)準(zhǔn)下,每年允許的宕機(jī)時(shí)間,每月允許的宕機(jī)時(shí)間和每周允許的宕機(jī)時(shí)間。
==============================================================
延展知識(shí)
RPO(Recovery Point Object)
指一個(gè)過去的時(shí)間點(diǎn),當(dāng)災(zāi)難或緊急事件發(fā)生時(shí),數(shù)據(jù)可以恢復(fù)到的時(shí)間點(diǎn)。例如每天23:00進(jìn)行數(shù)據(jù)備份,那么如果今天發(fā)生了宕機(jī)事件,數(shù)據(jù)可以恢復(fù)到的時(shí)間點(diǎn)(RPO)就是昨天的23:00。
(對(duì)比RTO,恢復(fù)時(shí)間目標(biāo),是指宕機(jī)發(fā)生后多長時(shí)間要恢復(fù)運(yùn)行。)
短時(shí)間的RPO能夠更少地丟失數(shù)據(jù)。例如,一個(gè)五分鐘的RPO表明必須在五分鐘內(nèi)恢復(fù)數(shù)據(jù),而一個(gè)一小時(shí)的RPO表明這種數(shù)據(jù)恢復(fù)的弱點(diǎn)在于,在這一個(gè)小時(shí)內(nèi),要備份的數(shù)據(jù)可能已經(jīng)丟失了。相反地,一個(gè)零分鐘的RPO表明沒有數(shù)據(jù)可以丟失,因?yàn)槟臄?shù)據(jù)及時(shí)地備份、復(fù)制或記錄下來,從而阻止任何數(shù)據(jù)的丟失。RPO要考慮的另外一個(gè)層面是數(shù)據(jù)的保護(hù)要完整和全面到什么程度。例如:您的RPO如果每隔8小時(shí)備份一次的話,意味著這8個(gè)小時(shí)內(nèi)數(shù)據(jù)可能會(huì)丟失。完全和全面的數(shù)據(jù)保護(hù)注重的是您的數(shù)據(jù)是否100%的被保護(hù)起來或者說只有部分的文件和數(shù)據(jù)被保護(hù)起來。再舉一例,打開的文件可能不能被完全的備份,除非內(nèi)存里面的緩存中的數(shù)據(jù)存儲(chǔ)到了磁盤里。另外還要考慮的因素是您所要備份的文件是否是某個(gè)特殊的目錄或文件共享中的某種特定文件,以及數(shù)據(jù)是否完全備份下來了。小的RPO意味著要付出更多的費(fèi)用以及更少的數(shù)據(jù)丟失量,我們必須在這之間作一個(gè)權(quán)衡。
簡單來說:就是故障發(fā)生時(shí),允許的最大數(shù)據(jù)丟失。
RTO:(RecoveryTime Object)是指災(zāi)難發(fā)生后,從IT系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停頓之刻開始,到IT系統(tǒng)恢復(fù)至可以支持各部門運(yùn)作,業(yè)務(wù)恢復(fù)運(yùn)營之時(shí),此兩點(diǎn)之間的時(shí)間段稱為RTO。
簡單來說:就是故障發(fā)生時(shí)允許的最大宕機(jī)時(shí)間,通常表示為數(shù)字,例如9s。
目標(biāo)越高,成本越高。
=================================================================
The Myth of the 9’s of Availability
It is common for organizations to state that they provide a number of 9’s of availability when referring to their environments. The truth is often much different than what is advertised and even then, it is often meant for only operating hours or not counting planned downtime, which may not be clearly documented in the SLA. Committing to only business hours and unplanned outages is acceptable as long as it is supported by what is documented in the SLA.
Note: Microsoft recommends that the 9’s of availability are based on agreed upon hours of operation, which should be clearly stated in the SLA.
The table on the slide above outlines the 9’s of availability and what actually means to have that level of uptime. Based on the table above, if an organization claims to have 3 – 9’s of availability and they are a 24/7 operation, they can only have 8.76 hours of downtime per year.
Additional resources
The table above provides only a brief idea of availability impact and understanding high availability for operations. For more information, refer to the following Microsoft Operations Framework (MOF) resources:
Microsoft Operations Framework – SLA Review –
http://www.microsoft.com/technet/solutionaccelerators/cits/mo/mof/omr/sla.mspx
High Availability and the Microsoft Operations Framework –
http://technet.microsoft.com/en-us/library/aa560207.aspx
=================================================================
總結(jié)
以上是生活随笔為你收集整理的SQL Server 2012笔记分享-52:可用性指标的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql metadata lock(
- 下一篇: Linux 小知识翻译 - 「NTP」