熄燈數據中心其實(shí)是一種無(wú)人值守的數據中心,也是一種完全實(shí)現自動(dòng)化的數據中心設施,可以更顯著(zhù)地節約能源和管理成本。
“熄燈”這個(gè)術(shù)語(yǔ)可以追溯到Philip K Dick在1955年發(fā)表的一篇短篇小說(shuō)。例如在制造行業(yè)中,荷蘭飛利浦公司的一家工廠(chǎng)在少數質(zhì)檢人員的監督下生產(chǎn)剃須刀;而日本Fanuc公司生產(chǎn)工業(yè)機器人的工廠(chǎng)可以長(cháng)期關(guān)閉空調和供暖系統,以使機器人的生產(chǎn)不受干擾。
當最初構建的熄燈數據中心運營(yíng)時(shí),其計算機系統仍然需要定期維護和保養。現場(chǎng)工作人員不得不經(jīng)常進(jìn)入機房重置服務(wù)器或重新連接交換機。
但這種情況正在改變,如今的IT組件變得越來(lái)越可靠。而軟件定義網(wǎng)絡(luò )(SDN)意味著(zhù)通過(guò)軟件重新設置服務(wù)器或連接網(wǎng)絡(luò )。采用虛擬化技術(shù)使工作負載獨立于物理服務(wù)器,而采用自動(dòng)化技術(shù)意味著(zhù)可以遠程完成重置和調整。
多年來(lái),傳統數據中心一直通過(guò)運營(yíng)人員管理和維護數百臺甚至數千臺服務(wù)器。除非更換硬件或修復故障,通常不會(huì )進(jìn)入機房。數據中心的機械和電氣設備采用自動(dòng)化技術(shù),而空調制冷系統也可以在無(wú)人值守的情況下運行,并且提示工程師或制造商進(jìn)行預防性維護。
傳統數據中心“浪費”了更多的空間和能源,這是因為需要為運營(yíng)人員提供工作環(huán)境和條件,并設置了滿(mǎn)足安全和生理等需求的安全出入口和洗手間等設施。
熄燈數據中心首次在2011年亮相,美國互聯(lián)網(wǎng)服務(wù)提供商AOL公司當時(shí)宣布將采用一種激進(jìn)的模式,推出名為ATC的小型無(wú)人值守的數據中心。AOL公司技術(shù)副總裁Mike Manos曾是在微軟公司的數據中心專(zhuān)家,他在一篇博客文章對熄燈數據中心的理念表示贊賞,認為這種技術(shù)可以從根本上改變一切。
對熄燈數據中心的宣傳和炒作
但是十年過(guò)去了,AOL公司早已不復存在,而數據中心仍然需要運營(yíng)人員的運營(yíng)和維護。但熄燈數據中心的的想法一直存在,通常可以采用預先安裝服務(wù)器的方式將機架安裝在這樣的數據中心中。
數據中心設計師指出,如果無(wú)需工作人員運營(yíng)和維護的話(huà),數據中心的機架和服務(wù)器等IT設備將部署得更緊湊,在更高的溫度下運行,并且大幅削減冷卻費用。而抽取空氣中的氧氣可以防止火災,減少腐蝕。
但是事實(shí)表明,大型數據中心設施仍然需要配備運營(yíng)人員。

Uptime Institute是數據中心可靠性方面的全球權威機構,該機構一直建議數據中心運營(yíng)人員需要隨時(shí)準備處理出現的任何問(wèn)題。該機構的技術(shù)專(zhuān)家Richard F.Van Loo在2015年發(fā)布的一份簡(jiǎn)報中說(shuō):“對于需要在Tier III級或Tier IV數據中心設施運營(yíng)關(guān)鍵業(yè)務(wù)的組織來(lái)說(shuō),我們建議至少有一到兩家數據中心運營(yíng)商的工作人員全天候在現場(chǎng)工作,而配備適當數量的數據中心人員是可靠運營(yíng)的關(guān)鍵。”
熄燈數據中心的發(fā)展在此后發(fā)生了一些變化,尤其是規模較小的數據中心提供商,例如EdgeConneX公司。
EdgeConneX公司席信息官Lance Devin表示:“我們的業(yè)務(wù)是建立在熄燈數據中心的基礎上,我們通常部署電力容量為2MW的數據中心,而不是100MW的大型數據中心。因為我們公司無(wú)法承擔在數據中心雇傭更多的工程師、安全人員以及維護人員的成本。”
EdgeConneX公司運行了分段管理系統,該系統可讓客戶(hù)控制IT硬件,而EdgeConneX公司則負責管理電源和冷卻基礎設施。
但這樣的數據中心并非完全熄燈,EdgeConneX公司具有遠程控制安全性,因此可以通過(guò)蜂鳴器通知客戶(hù)或運營(yíng)商的運營(yíng)人員。
疫情鎖定和熄燈運營(yíng)
擁有和運營(yíng)規模更大的數據中心設施的運營(yíng)商并不需要這樣做。但是他們需要具有遠程管理數據中心的能力,由于2020年發(fā)生了冠狀病毒疫情,這些能力得到了驗證。
當很多組織的員工在家遠程工作時(shí),數據中心運營(yíng)商采用的遠程控制服務(wù)激增。數據中心運營(yíng)商QTS Data Centers公司首席技術(shù)官Brent Bensten表示,在由于疫情而導致封鎖的前三周內,該公司遠程管理門(mén)戶(hù)(服務(wù)交付平臺或SDP)的登錄量增長(cháng)了30%,而用戶(hù)在該系統上花費的時(shí)間增加了一倍。
雖然允許工作人員進(jìn)入數據中心,但是需要相互遠離,并且發(fā)現數據中心仍然可以在更少的人為干預下運行,因此我發(fā)現了遠程管理的更多價(jià)值。Bensten說(shuō):“冠狀疫情加快了遠程管理平臺和工具的應用,因此可以遠程完成以前在現場(chǎng)完成的工作。”
熄燈運營(yíng)是為了解決技能短缺問(wèn)題?
在許多情況下,“熄燈”是降低數據中心技能要求的一種方式,既可以作為一種削減成本的措施,也可以作為解決難以尋求熟練員工問(wèn)題的一種方式。
施耐德電氣公司的工程師Steven Carlini在一篇博客文章中對“為什么將來(lái)每個(gè)數據中心都將成為熄燈數據中心”進(jìn)行了解釋。他在這篇文章指出,企業(yè)應該盡可能讓其內部部署數據中心實(shí)現熄燈,其中一個(gè)原因是為了應對疫情的封鎖,另一個(gè)原因是解決技能短缺問(wèn)題。
Carlini說(shuō):“熄燈和無(wú)人值守的說(shuō)法可能并不完全準確,因為安全人員很可能會(huì )在現場(chǎng)工作。”他建議數據中心應該雇用具有機械技能的安全人員,并讓他們實(shí)施即插即用的硬件更換工作,有些公司已經(jīng)在嘗試使用Zoom視頻軟件指導人員進(jìn)行維護和維修。
在很多情況下,熄燈數據中心的概念已經(jīng)演變?yōu)閿祿行牟恍枰嗉寄艿母拍睢?/div>
水下數據中心的探索
那么,熄燈數據中心真的存在和可行嗎?也許有一些數據中心以這種方式運行,也許是一些公司對此進(jìn)行保密,也許已經(jīng)失敗(例如AOL公司的ATC數據中心)。
但是行業(yè)人士確實(shí)了解一個(gè)知名案例。微軟公司試點(diǎn)部署的一個(gè)水下數據中心已經(jīng)運營(yíng)了兩年,該數據中心的電力容量為240kW,并且不用工作人員現場(chǎng)訪(fǎng)問(wèn)和維護,這是因為這個(gè)數據中心沉在海底。
微軟公司的一個(gè)名為Project Natick的研究團隊在2018年將12個(gè)服務(wù)器機架部署在一個(gè)壓力容器中,并將其沉入蘇格蘭海岸附近的海底。兩年來(lái),這個(gè)水下數據中心的服務(wù)器的運行沒(méi)有受到任何影響,與它們的唯一通信是通過(guò)電力和網(wǎng)絡(luò )電纜進(jìn)行的。該數據中心運行了864臺服務(wù)器和27.6 PB的存儲設備,主要處理來(lái)自Azure云平臺的工作負載。這個(gè)無(wú)人值守的數據中心部署在充滿(mǎn)了非活性氮氣的密封罐體中。
微軟公司最終在2020年從海底打撈出這個(gè)名為“SSDC-002”的水下數據中心。Project Natick水下數據中心主管David Cutler說(shuō):“這個(gè)水下數據中心無(wú)人運營(yíng)長(cháng)達25個(gè)月零八天,其運營(yíng)結果令人滿(mǎn)意。”
可靠性和摩爾定律
水下數據中心服務(wù)器的可靠性與傳統數據中心的同類(lèi)服務(wù)器相比高出大約七倍。Project Natick水下數據中心使用的是一批二手服務(wù)器,并將其中135臺的服務(wù)器在陸基傳統數據中心中運行,其余的855臺服務(wù)器部署在這個(gè)水下數據中心。
Cutler說(shuō):“在135臺陸地服務(wù)器中,有8臺服務(wù)器在兩年內發(fā)生了宕機。而在水下數據中心的855臺服務(wù)器中,只有6臺服務(wù)器發(fā)生宕機。這些服務(wù)器都執行相同的任務(wù),并且沒(méi)有進(jìn)行任何維護,但是傳統數據中心的振動(dòng)和氧氣環(huán)境導致其可靠性相對不高。”
行業(yè)人士反對運營(yíng)熄燈數據中心的主要意見(jiàn)是,需要定期更換服務(wù)器和存儲設備,這并不是因為服務(wù)器和存儲設備的硬件損耗,而是因為它們已經(jīng)過(guò)時(shí)。幾十年來(lái),IT硬件遵循摩爾定律(硬件性能隨著(zhù)技術(shù)進(jìn)步每18個(gè)月翻一番),采用新服務(wù)器僅在使用能源成本方面就可以在三年內收回投資。
芯片工藝現在已經(jīng)接近極限,摩爾定律也即將終結,而服務(wù)器的使用壽命將更長(cháng)。Uptime Institute研究總監Rabih Bashroush說(shuō),“在更換使用壽命長(cháng)達9年的服務(wù)器時(shí),仍然有非常充分的理由節約能源。”
Cutler預測,這將使數據中心運營(yíng)商更加關(guān)注熄燈數據中心的部署和運營(yíng)。他說(shuō),“在數據中心的整個(gè)生命周期中,服務(wù)器的成本占很大比例。在后摩爾定律時(shí)代,沒(méi)有理由每?jì)赡旮鼡Q一次IT設備。”
在邊緣采用熄燈數據中心
盡管傳統數據中心仍然需要運營(yíng)人員進(jìn)行管理,但新的應用場(chǎng)景和邊緣計算領(lǐng)域將可能需要運營(yíng)熄燈數據中心。
物聯(lián)網(wǎng)等新技術(shù)發(fā)展以及更多采用流媒體和遠程工作應用程序,導致數據中心用戶(hù)對高度分散的低延遲資源的需求。這意味著(zhù)需要靠近人員和數據源部署大量小型數據中心設施。大多數的邊緣數據中心規模比微軟公司Project Natick的水下數據中心要小得多,有些甚至在燈柱上安裝。除非能夠完全消除現場(chǎng)訪(fǎng)問(wèn)和運營(yíng),否則邊緣數據中心在維護成本方面難以承受。
Cutler說(shuō):“就像我們所做的那樣,通常會(huì )采用熄燈數據中心。邊緣計算設施最終只能獨立運行。”
當AOL公司技術(shù)副總裁Mike ManosMike Manos提出這一想法時(shí),實(shí)際上是在談?wù)撨吘売嬎阍O施,旨在使AOL公司的服務(wù)更貼近客戶(hù)。
Cutler表示,隨著(zhù)技術(shù)的進(jìn)步和發(fā)展,熄燈數據中心的發(fā)展可能比人們想象的還要快,將會(huì )成為數據中心行業(yè)的一種趨勢。
文章來(lái)源:51CTO
【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。
相關(guān)閱讀:
- ·思享家 | 噩夢(mèng)不再,美夢(mèng)成真—數據中心智能主動(dòng)運維2021-02-26 13:49:02
- ·數據中心的綠色化發(fā)展方向探討2020-08-13 14:43:22
- ·數據中心22年基礎架構演進(jìn)史2020-08-11 10:35:30
- ·【W(wǎng)e訪(fǎng)談】特發(fā)信息郭兆程:大灣區是未來(lái)數據中心行業(yè)用武之地2020-06-11 16:12:43
- ·新基建之數據中心20202020-06-09 11:03:06
- ·中興通訊許璐:數據中心將進(jìn)入模塊化與間接蒸發(fā)冷的新紀元2020-05-14 15:28:09
- ·DCN學(xué)院派丨智能時(shí)代的數據中心網(wǎng)絡(luò )發(fā)展趨勢推演2020-04-28 09:29:54
- ·熱談模塊化數據中心、未來(lái)IDC不容忽略的趨勢2019-07-29 10:13:47
- ·數據中心基礎架構 22 年演進(jìn)2019-06-19 09:39:31
- ·謹防云中斷、數據中心冗余如何設計?2019-01-21 15:38:53