數(shù)據(jù)中心無法實(shí)現(xiàn)自動化的5件事
來源: 作者:澎湃新聞 發(fā)布日期:2024-02-27 訪問次數(shù):606
人們很容易認(rèn)為,在數(shù)據(jù)中心及其他領(lǐng)域,自動化是沒有界限的。在人工智能似乎為改善數(shù)據(jù)中心運(yùn)營和網(wǎng)絡(luò)提供無限機(jī)會的世界中,整個(gè)IT行業(yè)已經(jīng)接受了工作流程可以變得完全自動化以至于我們達(dá)到NoOps狀態(tài)的概念,數(shù)據(jù)中心內(nèi)似乎沒有什么是我們無法實(shí)現(xiàn)自動化的。然而,現(xiàn)實(shí)愈發(fā)發(fā)人深省。盡管現(xiàn)代技術(shù)在許多領(lǐng)域?yàn)閿?shù)據(jù)中心自動化提供了巨大潛力,但在可預(yù)見的未來,數(shù)據(jù)中心運(yùn)營的一些關(guān)鍵方面可能是無法實(shí)現(xiàn)自動化的。事實(shí)上,數(shù)據(jù)中心的物理性質(zhì)意味著在某些方面,數(shù)據(jù)中心設(shè)施和設(shè)備的自動化比其他類型的IT基礎(chǔ)設(shè)施或環(huán)境(例如公有云平臺)更具挑戰(zhàn)性。在公有云環(huán)境中,用戶交互的所有內(nèi)容都在這個(gè)平臺上,并且是軟件中定義,因此可以使用基于軟件的解決方案輕松實(shí)現(xiàn)自動化。為了證明這一點(diǎn),我們來看看下面數(shù)據(jù)中心或數(shù)據(jù)中心運(yùn)營的這五個(gè)方面,是所有人都不應(yīng)指望很快就能實(shí)現(xiàn)完全自動化的。在公有云中,自動部署服務(wù)器就像應(yīng)用一些基礎(chǔ)設(shè)施即代碼模板來配置云資源一樣簡單。然而,在數(shù)據(jù)中心中,這種自動化是不可能的,因?yàn)槟悴渴鸬姆?wù)器是物理硬件,必須有人安裝服務(wù)器,連接到電源和網(wǎng)絡(luò)電纜,確保服務(wù)器適當(dāng)冷卻,等等。理論上說,機(jī)器人可以自動化執(zhí)行數(shù)據(jù)中心內(nèi)服務(wù)器部署的大部分工作。然而,要使用機(jī)器人經(jīng)濟(jì)高效地完成這項(xiàng)工作,你就需要大規(guī)模的操作。你還需要足夠一致且可預(yù)測的服務(wù)器部署,以便在無需人工幫助的情況下實(shí)現(xiàn)自動化。如今,大多數(shù)服務(wù)器部署都不符合這個(gè)標(biāo)準(zhǔn)。盡管人們已經(jīng)談?wù)摍C(jī)器人數(shù)據(jù)中心自動化的潛力至少有十年時(shí)間了,但我們在數(shù)據(jù)中心內(nèi)仍然很少會看到機(jī)器人,這是有原因的:在大多數(shù)情況下這是不切實(shí)際的。在可預(yù)見的未來,預(yù)計(jì)服務(wù)器部署仍將是手動的方式。類似地,在大多數(shù)情況下,在數(shù)據(jù)中心內(nèi)部署后維護(hù)服務(wù)器硬件也不是一項(xiàng)可以實(shí)現(xiàn)自動化的任務(wù)。更換故障磁盤、更換磨損的電纜和電源、更新網(wǎng)卡是大多數(shù)數(shù)據(jù)中心的例行程序,處理這些問題的唯一方法是由技術(shù)人員操作。HVAC系統(tǒng)可以防止IT設(shè)備過熱,是每個(gè)數(shù)據(jù)中心的重要組成部分。與服務(wù)器一樣,HVAC系統(tǒng)也包含需要人工維護(hù)的物理組件。遠(yuǎn)程HVAC傳感器和監(jiān)控系統(tǒng)可以幫助實(shí)現(xiàn)與HVAC管理相關(guān)的一些流程自動化,但最終,HVAC維護(hù)并不是一項(xiàng)可以在數(shù)據(jù)中心輕松實(shí)現(xiàn)自動化的工作。數(shù)據(jù)中心物理安全是另一個(gè)領(lǐng)域,監(jiān)控系統(tǒng)可以幫助自動化某些任務(wù),但需要人工干預(yù)來應(yīng)對重大問題。你可以使用傳感器來跟蹤數(shù)據(jù)中心內(nèi)人員的移動,可以部署生物識別設(shè)備來自動控制對數(shù)據(jù)中心的物理訪問,但如果檢測到入侵者,或者自動訪問控制系統(tǒng)無法正常運(yùn)行,你就需要安全人員做出響應(yīng)。在某些情況下,災(zāi)難恢復(fù)例行程序是可以自動化的,事實(shí)上,災(zāi)難恢復(fù)自動化對于在發(fā)生故障后恢復(fù)數(shù)據(jù)或應(yīng)用時(shí)節(jié)省時(shí)間是至關(guān)重要的。但是,只有當(dāng)你需要恢復(fù)的資產(chǎn)是基于軟件的,而且你有足夠的基礎(chǔ)設(shè)施來托管恢復(fù)的資產(chǎn)時(shí),你才能自動執(zhí)行災(zāi)難恢復(fù)。如果恢復(fù)需要部署新硬件或更換故障組件(如果數(shù)據(jù)中心遭受自然災(zāi)害導(dǎo)致某些系統(tǒng)無法運(yùn)行,則可能會出現(xiàn)這種情況),你就需要依靠人工手動執(zhí)行工作。盡可能廣泛地自動化數(shù)據(jù)中心運(yùn)營是有很多充分的理由,但數(shù)據(jù)中心管理的許多方面并不適合自動化。即使在生成式AI和機(jī)器人技術(shù)的時(shí)代,也很難想象很快就會將人類從數(shù)據(jù)中心完全剔除。