Web運維要求理解架構(gòu)中的各個組成部分,在理解計算系統(tǒng)的來龍去脈時,扎實的計算背景對你會有莫大的幫助。處理器體系結(jié)構(gòu)、內(nèi)存系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)交換與路由、為何第二層協(xié)議那樣工作、HTTP、數(shù)據(jù)庫概念…這個清單可以列好幾頁。具有扎實的基礎(chǔ),對于理解為什么及如何架構(gòu)解決方案,以及識別出問題所在,是非常重要的,畢竟,計算是架構(gòu)我們的智能系統(tǒng)的基礎(chǔ)。此外,工程師的思維方式和對物理定律的基本理解也是一個很大的優(yōu)勢。
一天,在喝酒聊天的時候,我的一位朋友,也是Web運維領(lǐng)域的同行, Jesse Robbins,講了一個排查衛(wèi)星電話線路故障的故事。一套衛(wèi)星電話設(shè)施安裝好了,而線路有超過一秒的非預(yù)期”延遲。這是很久以前的事了,這套衛(wèi)星電話設(shè)施已經(jīng)花了一大筆錢,所以,客戶對于服務(wù)質(zhì)量感到非常沮喪。經(jīng)過好幾個小時的排查和連續(xù)的調(diào)優(yōu)之后,技術(shù)人員問道:“先要搞清楚,這一秒的延遲是算到預(yù)期的延遲時間里的,對不對?”一陣長時間的沉默之后,客戶問:“什么是預(yù)期延遲?”技術(shù)人員首先向請來的所有人為浪費他們的時間而道歉,然后嚴厲地斥責(zé)客戶,說他浪費了所有人的時問。所謂預(yù)期延遲就是將信號送到外層空間的衛(wèi)星再返回所需要的時間,我們就是再怎么努力,也沒有辦法增加光的速度啊。盡管這個故事看起來很愚鑫,我卻經(jīng)常遇到這種隨意的、不切實際的期望。可能最普通的就是跨洲同步復(fù)制的企圖了,就是公然藐視我們目前所知的物理定律嘛。我們還是努力成為一個維護好站點可靠性的工程師吧,盡量將計算機科學(xué)和物理學(xué)的基本原理付諸實踐。要在理論限度內(nèi)做好工作,你必須知道這些限度是什么以及在哪里,這就是為什么計算機科學(xué)、物理學(xué)、電氣工程,以及應(yīng)用數(shù)學(xué)的理論知識真正不可缺少的原因。
運維,就是理解理論和實踐在哪里發(fā)生沖突,并發(fā)明適當?shù)姆椒?,以便在發(fā)生事故時減少損失。
嫻熟的決斷力
雖然優(yōu)柔寡斷在任何領(lǐng)域都不算是一個優(yōu)點,但在Web運維中卻幾乎不能容忍。像急救中心和急診室的醫(yī)生一樣,你會經(jīng)常常面臨這樣的境地,此日時單有良好的判斷力是不夠的這一點你可要明白。決策的遲延就會導(dǎo)致宕機的持續(xù),所以必須訓(xùn)練你的大腦持續(xù)不斷地對接收到的輸入做出反應(yīng),因為那種“收集、審查、建議”的方式將會導(dǎo)致局面不可收拾。
在計算機科學(xué)中,算法有兩種類型:離線和在線。離線算法是指在確定輸出之前,整個輸入集都已獲得的解決方案。與此相反,在線算法是指邊獲取輸入邊產(chǎn)生輸出。當然,由于算法在產(chǎn)生輸出(或解決方案)時,并沒有獲得整個輸入集,也就沒有辦法保證產(chǎn)生最優(yōu)化的輸出。與離線算法不同的是,在線算法保證你手上總是有答案。
運維決策必須是在線算法的結(jié)果,而非離線算法。這并不是說離線算法在Web運維中就沒有地位了,恰恰相反,其中一個非常關(guān)鍵的過程就是離線的,那就是根本原因分析(RCA)。對于盡可能地形式化RCA過程,我可是有巨大熱情的。
對失敗及其癥狀表現(xiàn)以及“即時”決策的復(fù)審進行徹底的離線(事后)分析,是改進在線算法(你和你的團隊用于關(guān)鍵運維決策)的可能的最好途徑。
沉穩(wěn)的性格
一個沉穩(wěn)與可控的思維過程是非常關(guān)鍵的,沒有它,就會出現(xiàn)吉斯通警察綜合征,使糟糕的局面變得更加不可收拾。在瘋狂的動作片中,一個人崩潰了,另一個人就抓住他使勁搖晃,告訴他要鎮(zhèn)定下來一一在這種情形下,你要確定你是處在清醒的一方的。在清醒的一方,你就會有一個快樂、健康的職業(yè),否則,你得到的將是一份沉重的工作,弄不好,將會不堪重負。
因為沒有正式的教育途徑,Web運維行業(yè),就其目前的狀況而言,是一種非正式的師徒模型?;ヂ?lián)網(wǎng)的廣泛應(yīng)用,已使商務(wù)和社會交往發(fā)生了范式轉(zhuǎn)移,而且信息已經(jīng)在某種程度上唾手可及,從而一種虛擬的師徒模型便成為可能。不幸的是,正如你能夠料想到的,在不同的群組之間,這種師徒模型的質(zhì)量也是千差萬別的。
在網(wǎng)站建設(shè)Web運維領(lǐng)域,目標很簡單,使所有事情在所有時間正常運轉(zhuǎn):一個簡單的定義,但卻是一個不可能的期望。或許在這個領(lǐng)域成為一名工程師的更大挑戰(zhàn)是組織內(nèi)的同事對你的不切實際的期望。
本文地址:http://m.blackside-inc.com//article/3302.html