不幸的是,沒(méi)有一個(gè)一刀切的方法來(lái)管理應用的服務(wù)質(zhì)量。對于任何特定的應用,用戶(hù)的服務(wù)質(zhì)量可能對一些基礎設施受損很敏感但對其他因素卻相對不敏感。更重要的是,不同的應用和架構有不同的敏感性。
即便如此,云服務(wù)供應商沒(méi)必要就給定的目標應用而言并不重要的KQI來(lái)過(guò)度設計基礎設施的性能。例如,視頻流應用可將內容緩存在客戶(hù)端設備上,因此可以容忍某些服務(wù)質(zhì)量的損傷如分組丟失和重傳或虛擬機故障和恢復。與此相反,一個(gè)視頻聊天應用卻需要非常低的服務(wù)時(shí)延,以保持雙方之間的對話(huà)互動(dòng),所以沒(méi)有時(shí)間來(lái)重傳丟失的數據包。因此,托管交互式視頻聊天的云計算基礎設施可能比托管預錄制視頻的基礎設施需要較低的丟包率和更嚴格的資源調度。
由于職責改變帶來(lái)的服務(wù)質(zhì)量受損
傳統的角色、責任和職責在云服務(wù)模式中發(fā)生了改變。云服務(wù)供應商可能把各種來(lái)自不同供應商的軟件、網(wǎng)絡(luò )和虛擬化技術(shù)集成在一起來(lái)實(shí)現一個(gè)應用服務(wù)。這使得問(wèn)題的跟蹤和確定誰(shuí)來(lái)為解決問(wèn)題負責變得困難。
標準化云計算基礎設施服務(wù)質(zhì)量的度量可以幫助云計算消費者和服務(wù)供應商管理不可避免的服務(wù)質(zhì)量受損。這些指標有助于快速確定故障部件或服務(wù),以便有關(guān)職責方及時(shí)恢復服務(wù),并實(shí)施適當的糾正措施。有了標準的基礎設施的KQI ,云服務(wù)供應商可以很清楚地協(xié)商給定應用所需的服務(wù)等級目標(SLO )。云服務(wù)供應商也可以選擇最能滿(mǎn)足這些需求的基礎設施設備和軟件,并確保其能持續滿(mǎn)足或超過(guò)事先定義的SLO。
由于新的伙伴關(guān)系帶來(lái)的服務(wù)質(zhì)量受損
除了應用軟件之外,運行在云計算基礎設施之上的應用實(shí)例依賴(lài)于由合作伙伴提供的重要組件來(lái)為用戶(hù)提供可接受的服務(wù)質(zhì)量。這些組件包括:
針對基于云的應用,用于取代傳統計算機或服務(wù)器硬件的虛擬機。與傳統的硬件類(lèi)似,虛擬機實(shí)例很容易受到損害。然而,虛擬機實(shí)體更容易受死機、可變資源的訪(fǎng)問(wèn)延遲、不一致的計時(shí)器事件激活、時(shí)鐘誤差和其他異常事件的損傷。這些損傷可能是由于資源共享和底層虛擬化技術(shù)(在應用的客戶(hù)機操作系統與物理硬件之間插入了一層并非完全的硬件仿真)引起。
‘連接即服務(wù)’,它提供了應用的虛擬機實(shí)體和其他分布式系統與設備之間的網(wǎng)絡(luò )連接。傳統服務(wù)供應商使用背板和物理網(wǎng)絡(luò )基礎設施來(lái)連接傳統的硬件設備。云服務(wù)提供商必須把網(wǎng)絡(luò )連接作為一種服務(wù)來(lái)提供,讓分布式的基于云的應用可以發(fā)揮作用,并給客戶(hù)提供價(jià)值。這些提供的’連接即服務(wù)’---容易受到數據包丟失、數據包延遲、數據包抖動(dòng)和業(yè)務(wù)不可用的損傷。
以服務(wù)形式提供的技術(shù)組件可以縮短應用的上市時(shí)間并降低運營(yíng)費用。例如‘數據庫即服務(wù)’和‘負載均衡即服務(wù)’允許云服務(wù)提供商'買(mǎi)'一個(gè)成熟的技術(shù)組件服務(wù),而不是“建設”私有和特定應用實(shí)例。然而,這些產(chǎn)品很容易受到服務(wù)的可靠性、時(shí)延、質(zhì)量和業(yè)務(wù)不可用等因素的損傷。
采取措施解決服務(wù)質(zhì)量受損
利用三個(gè)基本的措施,就可以開(kāi)始正視和克服由云計算基礎設施帶給用戶(hù)服務(wù)質(zhì)量的損傷。這些措施包括:
1.理解不同的應用具有不同的面向用戶(hù)與云服務(wù)供應商缺陷相關(guān)的服務(wù)質(zhì)量敏感性。例如,一個(gè)面向批處理的應用的服務(wù)質(zhì)量可能對丟包、數據包時(shí)延和數據包抖動(dòng)等損傷不敏感。但對一個(gè)高度交互的應用而言,其服務(wù)質(zhì)量可能對丟包、延遲和抖動(dòng)非常敏感。
2.通過(guò)合理的應用設計來(lái)減少云基礎設施受損對最終用戶(hù)的影響。此外,要在具有類(lèi)似服務(wù)質(zhì)量的基礎設施條件下測試應用,確保用戶(hù)持續獲得可接受的服務(wù)質(zhì)量。
3.認識到”籬笆扎得牢,鄰居處得好”。為所有云計算基礎設施的KQI商定SLO,以便在應用業(yè)務(wù)遇到用戶(hù)的服務(wù)質(zhì)量問(wèn)題時(shí)能使故障得到快速隔離。進(jìn)一步明確服務(wù)范圍和要求將使它更容易找出問(wèn)題,并確定誰(shuí)有責任來(lái)解決問(wèn)題的根本起因。
設定可實(shí)現的目標
與傳統方式部署的應用一樣,基于云的應用不可避免地會(huì )遇到偶爾的業(yè)務(wù)損傷和故障。我們的目標應該是在云基礎設施上部署穩健和具有成本效益的應用,并確保它們始終如一地滿(mǎn)足或超越用戶(hù)對服務(wù)質(zhì)量的期望。
這意味著(zhù)要確保一個(gè)給定的應用可以快速檢測、減輕由云計算基礎設施帶來(lái)的業(yè)務(wù)損傷并從中恢復過(guò)來(lái)。這也意味著(zhù)為‘應用即服務(wù)’、‘基礎設施即服務(wù)’和‘平臺即服務(wù)’等供應商明確定義角色和職責。通過(guò)結合商業(yè)技巧為每個(gè)責任方實(shí)施量化的SLO,運用標準化的指標和明確的問(wèn)責,一個(gè)云服務(wù)供應商可以確保一個(gè)應用的所有供應商知道他們需要提供什么來(lái)滿(mǎn)足用戶(hù)對服務(wù)質(zhì)量的期望。