計(jì)算機(jī)運(yùn)維工程師忙嗎?
你好,很高興回答你這個(gè)問題。
作為一個(gè)運(yùn)維狗有話說,經(jīng)歷了手動(dòng)運(yùn)維、腳本運(yùn)維、自動(dòng)化運(yùn)維等各個(gè)階段,運(yùn)維工作也由非常忙、很忙、比較忙三個(gè)階段,咱們每個(gè)階段都說下:
1.手動(dòng)運(yùn)維
這個(gè)階段一般是新手階段,運(yùn)維知識(shí)儲(chǔ)備不足,思想意識(shí)也不夠深,基本是通過手動(dòng)操作來處理各種問題。兵來將擋,水來土掩。由于手動(dòng)處理,
工作效率
不高。 因此這個(gè)階段隨著各種問題的不斷擠壓,運(yùn)維工程師將會(huì)非常忙,可能真的需要7*24小時(shí)工作哦 。
2.腳本運(yùn)維
這個(gè)階段隨著運(yùn)維技能水平的提高、經(jīng)驗(yàn)的不斷積累,運(yùn)維工程師已經(jīng)可以熟練的運(yùn)用工具以及相應(yīng)的腳本開發(fā),實(shí)現(xiàn)批量操作。最重要的還是思想意識(shí)的提高,能夠主動(dòng)考慮如何解決問題,這樣驅(qū)動(dòng)著運(yùn)維不斷的去接觸新工具、新的解決方案。 因此運(yùn)維工程師從非常忙降級(jí)到很忙,有了一定的空閑時(shí)間去學(xué)習(xí)新知識(shí)。
3.自動(dòng)化運(yùn)維
這個(gè)階段單純的通過工具或腳本已經(jīng)不能滿足運(yùn)維日益增長的技能需求,因此此時(shí)通過各種媒體渠道、經(jīng)驗(yàn)交流,知道運(yùn)維過程中不僅僅是處理問題那么簡單,必須形成一定的制度規(guī)范,建立一套監(jiān)控、故障響應(yīng)、CI/CD機(jī)制,實(shí)現(xiàn)不同場(chǎng)景的自動(dòng)化運(yùn)維。 此時(shí)的運(yùn)維工程師將進(jìn)入全新的比較忙甚至有足夠的空閑時(shí)間,去學(xué)習(xí)總結(jié),將新的知識(shí)點(diǎn)、理念應(yīng)用到工作中。
最后,運(yùn)維是一個(gè)相對(duì)比較復(fù)雜的崗位,需要了解的知識(shí)面比較廣。當(dāng)然隨著
互聯(lián)網(wǎng)技術(shù)
的不斷更新,運(yùn)維也需要不斷進(jìn)行知識(shí)的儲(chǔ)備,以便更快速、高效的進(jìn)行交付工作。
希望我的回答對(duì)你有幫助。
我是【木訥大叔愛運(yùn)維】,歡迎關(guān)注,與你分享運(yùn)維路上的點(diǎn)點(diǎn)滴滴。
忙不忙看公司,小公司事情比較雜,相對(duì)要忙一點(diǎn),大公司運(yùn)維里面還分很多垂直領(lǐng)域,相對(duì)要輕松一點(diǎn)。
在互聯(lián)網(wǎng)公司,運(yùn)維崗是個(gè)占比很大的技術(shù)崗位,跟開發(fā)崗,測(cè)試崗并列。一個(gè)互聯(lián)網(wǎng)產(chǎn)品的生成一般經(jīng)歷的過程是:
產(chǎn)品經(jīng)理
、需求分析、研發(fā)部門開發(fā)、測(cè)試部門測(cè)試、運(yùn)維部門部署發(fā)布以及長期的運(yùn)行維護(hù)。一個(gè)產(chǎn)品的
生命周期
90%以上時(shí)間都在運(yùn)維手中,所以運(yùn)維的技術(shù)含量并不比開發(fā)低,甚至入門要高很多。
大公司有硬件運(yùn)維,
系統(tǒng)運(yùn)維
,數(shù)據(jù)運(yùn)維,應(yīng)用運(yùn)維,安全運(yùn)維等等,分的細(xì)自然要求也高,你要開發(fā)很多自動(dòng)化系統(tǒng)來保證業(yè)務(wù)x個(gè)9的可靠性;小公司這些都是一個(gè)人包了,沒有自動(dòng)化解決方案,很多需要人肉,運(yùn)維經(jīng)驗(yàn)更重要,什么故障都能很快定位到。
目前運(yùn)維工程師跟開發(fā)工程師的界限越來越模糊,什么運(yùn)維開發(fā)崗,什么開發(fā)運(yùn)維崗,都預(yù)示著未來不懂開發(fā)的運(yùn)維在運(yùn)維界很難立足。
一般,運(yùn)維工程師都很忙。尤其互聯(lián)網(wǎng)公司,他們的職責(zé)是保證線上服務(wù)或機(jī)器24小時(shí)不宕機(jī)允許,平穩(wěn)可靠地運(yùn)行。
巡視網(wǎng)絡(luò)環(huán)境,(通過掃描漏洞等措施)及時(shí)發(fā)現(xiàn)及時(shí)修復(fù)安全漏洞是他們的天職。或者幫助開發(fā)人員性能優(yōu)化、提供安全意識(shí)也屬于他們的工作范圍。希望你能采納。
總之,運(yùn)維工程師不會(huì)輕松,防范黑客攻擊,
網(wǎng)絡(luò)帶寬
優(yōu)化,24小時(shí)輪值待命,防患于未然,防微杜漸意識(shí)是做好運(yùn)維工作的基本要求。
分單位分項(xiàng)目分類型。有的單位信息化程度較高,設(shè)備多且種類復(fù)雜,數(shù)量大必然出現(xiàn)的問題就容易多,這樣一來運(yùn)維工程師就會(huì)很忙;有的項(xiàng)目就是運(yùn)維類項(xiàng)目,那肯定每天都跟運(yùn)維打交道,而有的項(xiàng)目是開發(fā)或者集成類項(xiàng)目,自然運(yùn)維的任務(wù)就比較少;有的運(yùn)維工程師類型會(huì)比較忙,比如數(shù)據(jù)庫運(yùn)維工程師和網(wǎng)絡(luò)運(yùn)維工程師,而像虛擬化運(yùn)維工程師工作量可能就沒那么大。
忙不忙主要還是取決于公司,這里拋開公司不談,說一下運(yùn)維的3個(gè)階段
我們以一個(gè)例子說一下3個(gè)階段。這里舉一個(gè)例子,一個(gè)系統(tǒng)升級(jí)和簡單故障處理的場(chǎng)景。
首先是手工運(yùn)維,公司有3臺(tái)服務(wù)器臺(tái),通過Nginx做的集群和
負(fù)載均衡
,跑的一樣工程代碼。那么每次服務(wù)器升級(jí)的時(shí)候,就需要人工把每臺(tái)服務(wù)器都備份了,然后停止每臺(tái)服務(wù)器的進(jìn)程,把新的工程傳到服務(wù)器上,再每臺(tái)服務(wù)器啟動(dòng)項(xiàng)目。這樣是不是很繁瑣,同樣的事情機(jī)械化做多次,而且全人工操作也有很大的風(fēng)險(xiǎn)。
在服務(wù)器不斷增多的情況下,工作會(huì)越來越忙,那么這個(gè)時(shí)候就可以引入
持續(xù)集成
的框架,例如Jenkins,它可以很方便的通過我們寫的shell腳本完成上述說的,寫好shell后,只需點(diǎn)擊按鍵,可以一件自動(dòng)完成從代碼服務(wù)器上拉取最新的代碼,然后自動(dòng)構(gòu)建為工程,上傳到目標(biāo)服務(wù)器,自動(dòng)停服備份,發(fā)布新工程啟動(dòng)。
這樣就需要一次的腳步勞作,減少機(jī)械勞動(dòng)和人為操作的風(fēng)險(xiǎn),但是還有個(gè)問題就是隨著業(yè)務(wù)的不斷發(fā)展,可能我們需要關(guān)注的還有服務(wù)器的性能,彈性擴(kuò)容等,如果我服務(wù)器超級(jí)多,工作就會(huì)越來越重。這個(gè)時(shí)候就有了新技術(shù)例如k8s+docker+Jenkins的組合,這里不太怎么具體搭建框架,介紹下能實(shí)現(xiàn)的效果,引入這一套服務(wù)器框架后可以實(shí)現(xiàn),自動(dòng)備份自動(dòng)發(fā)版,除了上述的,最厲害的是可以實(shí)現(xiàn)自動(dòng)擴(kuò)容,當(dāng)你設(shè)置一個(gè)服務(wù)器cpu性能值,例如50%,當(dāng)我現(xiàn)在有3個(gè)服務(wù),每個(gè)服務(wù)的cpu都到了設(shè)定值,k8s框架會(huì)根據(jù)我們之前設(shè)定的一些參數(shù),自動(dòng)啟動(dòng)新的服務(wù),并加入集群,如果判斷到某個(gè)節(jié)點(diǎn)故障了,也會(huì)啟動(dòng)新服務(wù),然后干掉故障服務(wù)。
所以運(yùn)維工程師忙不忙,除了公司的因數(shù)不談,還要看自己是不是善用各種工具技術(shù)
我是@零件小哥,我來回答下這個(gè)問題。
我之前也是做過運(yùn)維工程師,主要在海關(guān)信息中心機(jī)房做軟件運(yùn)維。
運(yùn)維的工作主要有以下內(nèi)容:
日常巡檢,主要巡檢服務(wù)器CPU、內(nèi)存、硬盤空間等。涉及到軟件部分,還要巡檢應(yīng)用服務(wù)是否正常運(yùn)行,有無錯(cuò)誤日志等內(nèi)容。日常巡檢的工作量根據(jù)所在企業(yè)的業(yè)務(wù)量大小來確定的,每個(gè)企業(yè)的標(biāo)準(zhǔn)都不一樣,有的一周巡檢3次,有的一天1次。
故障處理,主要對(duì)突發(fā)的故障進(jìn)行處理。故障處理根據(jù)故障的級(jí)別對(duì)客戶進(jìn)行響應(yīng)。故障級(jí)別一般分為:一般故障、較嚴(yán)重故障、重大故障。一般故障指的是不影響系統(tǒng)運(yùn)行的故障,處理完成時(shí)間是24小時(shí),一般故障占全部故障的90%。較嚴(yán)重故障指的是業(yè)務(wù)運(yùn)行遲緩、部分用戶受到影響,但系統(tǒng)還是有在運(yùn)行的故障。處理完成時(shí)間是6個(gè)小時(shí)。較嚴(yán)重故障占全部故障的9.9%。重大故障指的是業(yè)務(wù)停滯、用戶無法使用業(yè)務(wù)系統(tǒng),系統(tǒng)已崩潰的故障。處理完成時(shí)間2小時(shí)。重大故障比較少見,可能運(yùn)維工作中幾年不會(huì)碰到一次。
運(yùn)維報(bào)告整理,一般是在日常巡檢、故障處理后輸出的技術(shù)報(bào)告文檔。運(yùn)維報(bào)告每個(gè)企業(yè)都有固定的模板,我們需要把巡檢后或故障處理后的數(shù)據(jù)填入報(bào)告,把巡檢問題詳細(xì)記錄,把故障問題和故障處理方式詳細(xì)記錄。
應(yīng)用部署更新,主要是更新應(yīng)用服務(wù)。開發(fā)人員會(huì)把更新補(bǔ)丁交付給運(yùn)維工程師,我們需要備份先前版本的應(yīng)用后更新補(bǔ)丁。
客戶問題解答,主要在運(yùn)維工作群中解答客戶關(guān)于系統(tǒng)使用問題的解答。
最后重點(diǎn)來了,運(yùn)維工程師忙不忙呢?有的人說忙,也有人說不忙。其實(shí)都是有的。根據(jù)所在企業(yè)的業(yè)務(wù)量來確定,國企和私企也有區(qū)別。系統(tǒng)運(yùn)行故障少,我們一般按時(shí)做好巡檢就可以了,這樣工作量就比較少,相對(duì)會(huì)輕松些。系統(tǒng)不穩(wěn)定的話,那肯定就很忙了,時(shí)不時(shí)客戶一個(gè)個(gè)電話打進(jìn)來就夠頭疼了。
說到運(yùn)維工程師,一般人都會(huì)認(rèn)為是修電腦的。實(shí)際上運(yùn)維工程師的工作并不是這么簡單。運(yùn)維從字面上理解,運(yùn)就是運(yùn)行,維就是維護(hù),那么運(yùn)維工程師的職能就是保障業(yè)務(wù)的正常運(yùn)行并在出現(xiàn)問題時(shí)及時(shí)維護(hù)。
用專業(yè)的術(shù)語來解釋運(yùn)維工程師是負(fù)責(zé)維護(hù)并且確保整個(gè)服務(wù)系統(tǒng)的高可用性,同時(shí)不斷優(yōu)化系統(tǒng)架構(gòu)提升部署效率、優(yōu)化資源利用率提高整體的ROI。運(yùn)維工程師是一個(gè)統(tǒng)稱,其中有很多分類。包括:
桌面運(yùn)維工程師
、網(wǎng)絡(luò)運(yùn)維工程師、系統(tǒng)運(yùn)維工程師、基礎(chǔ)運(yùn)維工程師等等,他們的劃分主要是工作具體內(nèi)容的不同。
運(yùn)維工程師最忙的時(shí)候是他們完成一個(gè)項(xiàng)目產(chǎn)品的時(shí)候,有的時(shí)候需要加班好幾個(gè)星期。他們?cè)诋a(chǎn)品項(xiàng)目完成的不同階段會(huì)發(fā)揮不同的作用。所以其實(shí)他們的工作內(nèi)容很多:
產(chǎn)品發(fā)布前:負(fù)責(zé)參與并審核架構(gòu)設(shè)計(jì)的合理性和可運(yùn)維性,以確保在產(chǎn)品發(fā)布之后能高效穩(wěn)定的運(yùn)行。
產(chǎn)品發(fā)布階段:負(fù)責(zé)用自動(dòng)化的技術(shù)或者平臺(tái)確保產(chǎn)品可以高效的發(fā)布上線,之后可以快速穩(wěn)定迭代。
產(chǎn)品運(yùn)行維護(hù)階段:負(fù)責(zé)保障產(chǎn)品7*24H穩(wěn)定運(yùn)行,在此期間對(duì)出現(xiàn)的各種問題可以快速定位并解決;在日常工作中不斷優(yōu)化系統(tǒng)架構(gòu)和部署的合理性,以提升系統(tǒng)服務(wù)的穩(wěn)定性。
運(yùn)維工程師是一個(gè)需要二十四小時(shí)在線的職業(yè),因?yàn)槟悴恢朗裁磿r(shí)候系統(tǒng)就需要你去維護(hù)。所以就算你休假在家,需要運(yùn)維工程師的時(shí)候也需要出手。
運(yùn)維工程師會(huì)有著很多業(yè)務(wù)需求,如果運(yùn)維工程師能夠滿足業(yè)務(wù)需求,或者主動(dòng)挖掘業(yè)務(wù)的痛點(diǎn)和改進(jìn)方法,就能為業(yè)務(wù)實(shí)現(xiàn)更多的價(jià)值。業(yè)務(wù)由于故障引起的中斷一定會(huì)造成損失,所以能在發(fā)病之前就將它修理好,這才是運(yùn)維工程師的核心價(jià)值。在滿足業(yè)務(wù)需求時(shí),優(yōu)先面對(duì)業(yè)務(wù)快速發(fā)展非常重要的需求,例如穩(wěn)定性,部署和變更效率,容量管理。
那沒有項(xiàng)目的日常,運(yùn)維工程師們都在干嘛,是不是無所事事的玩手機(jī)?當(dāng)然不是了,如果你這么做的話,會(huì)被炒魷魚的。那運(yùn)維工程師日常工作是干嘛呢?每日定時(shí)對(duì)機(jī)房內(nèi)的網(wǎng)絡(luò)服務(wù)器、數(shù)據(jù)庫服務(wù)器、Internet服務(wù)器進(jìn)行日常巡視,檢查是否正常工作,公司的網(wǎng)站是否能正常訪問;每日巡查計(jì)算機(jī)系統(tǒng)各個(gè)終端電腦、打印機(jī)、復(fù)印機(jī)等設(shè)備是否工作正常,是否有不正確的操作使用,是否有帶故障工作的設(shè)備;每天夜間在大家都下班之后對(duì)財(cái)務(wù)軟件進(jìn)行自動(dòng)實(shí)時(shí)備份,每周做一次物理數(shù)據(jù)備份,并在備份服務(wù)器中進(jìn)行邏輯備份的驗(yàn)證工作;每周至少對(duì)文件服務(wù)器做一次物理數(shù)據(jù)備份;還有就是處理各種有關(guān)網(wǎng)絡(luò)的突發(fā)問題。當(dāng)然每個(gè)公司的運(yùn)維工程師從事的工作是大同小異的,有的公司可能還會(huì)給運(yùn)維工程師安排其他的工作。所以正在學(xué)習(xí)從事運(yùn)維工程師的同學(xué)們和想要成為運(yùn)維工程師的同學(xué)們,對(duì)于自己想要從事的崗位工作內(nèi)容有沒有多一點(diǎn)了解?以后別人問起來運(yùn)維工程師是干嘛的,千萬別再讓別人覺得就是個(gè)修電腦的了。而且看了工作內(nèi)容,你們有沒有信心成為運(yùn)維工程師的佼佼者呢?
有時(shí)候很忙,運(yùn)維工程師平時(shí)要做事比較雜,負(fù)責(zé)環(huán)境和服務(wù)包部署,解決部署問題,保障系統(tǒng)服務(wù)的正常運(yùn)行,協(xié)助開發(fā)定位問題,有的需要24小時(shí)響應(yīng)及時(shí)處理線上問題,部署和升級(jí)服務(wù)的話只能在晚上或半夜用戶流量少的時(shí)候,所以熬夜通宵干活還是比較累的
就看你公司運(yùn)維系統(tǒng)做的怎么樣,如果做的好就要輕松點(diǎn),但是如果直班也惱火
一個(gè)運(yùn)維工程師能管理多少臺(tái)服務(wù)器
運(yùn)維工程師(Operations),負(fù)責(zé)維護(hù)并確保整個(gè)服務(wù)的高可用性,同時(shí)不斷優(yōu)化系統(tǒng)架構(gòu)提升部署效率、優(yōu)化資源利用率提高整體的ROI。
運(yùn)維工程師面對(duì)的最大挑戰(zhàn)是大規(guī)模集群的管理問題,如何管理好幾十萬臺(tái)服務(wù)器上的服務(wù),同時(shí)保障服務(wù)的高可用性,是運(yùn)維工程師面臨的最大挑戰(zhàn)。所以他們一般都用
iis7服務(wù)器批量管理
要求的技能:服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫。
無論做什么運(yùn)維,運(yùn)維工程師最基本的職責(zé)都是負(fù)責(zé)服務(wù)的穩(wěn)定性,確保服務(wù)可以7*24H不間斷地為用戶提供服務(wù)。在此之上運(yùn)維工程師的主要工作職責(zé)如下:
質(zhì)量:保障并不斷提升服務(wù)的可用性,確保用戶數(shù)據(jù)安全,提升用戶體驗(yàn)。
效率:用自動(dòng)化的工具/平臺(tái)提升軟件在研發(fā)生命周期中的工程效率。
成本:通過技術(shù)手段優(yōu)化服務(wù)架構(gòu)、性能調(diào)優(yōu);通過資源優(yōu)化組合降低成本、提升ROI。
能力要求
基礎(chǔ)技能:
* 精通shell/Python/Perl等1至2種編程語言
* 熟練掌握常用數(shù)據(jù)結(jié)構(gòu)和算法,并能靈活運(yùn)用
* 熟悉網(wǎng)絡(luò)基礎(chǔ)知識(shí)
* 深入理解Linux操作系統(tǒng)
加分技能:
* 熟悉開源的監(jiān)控平臺(tái)工具,比如:Ganglia、Nagios、Zabbix等
* 熟練掌握Shell腳本熟悉Awk、Sed等基礎(chǔ)工具
* 熟悉分布式計(jì)算或者存儲(chǔ)系統(tǒng),比如Hadoop/Hbase/Storm等
* 熟悉機(jī)器學(xué)習(xí)原理能付諸實(shí)踐者更佳
* 熟悉TCP/IP、HTTP等網(wǎng)絡(luò)協(xié)議,精通socket網(wǎng)絡(luò)編程
請(qǐng)問:運(yùn)維工程師,工作強(qiáng)度如何?
工作強(qiáng)度低不低是看各個(gè)公司的,在A公司運(yùn)維的強(qiáng)度非常高,基本都是晚上回去還要加班做一些事情,主要原因是人比較少;而B公司的運(yùn)維強(qiáng)度和人均的負(fù)荷成正比,這個(gè)我雖然為B服務(wù)過,但是現(xiàn)在B怎么樣我不太清楚;
運(yùn)維人員的要求特別嚴(yán)苛,因?yàn)檫\(yùn)維人員針對(duì)不同的問題,需要不斷的補(bǔ)充擴(kuò)大自己的知識(shí)和研究范疇。
在初級(jí)階段,優(yōu)秀運(yùn)維人員會(huì)體現(xiàn)出格外出眾的主動(dòng)性和責(zé)任心,面對(duì)陌生的業(yè)務(wù)會(huì)主動(dòng)學(xué)習(xí)和拓展自己對(duì)業(yè)務(wù)對(duì)認(rèn)識(shí)和相應(yīng)的知識(shí)范疇,以能夠足夠的勝任業(yè)務(wù)的獨(dú)立維護(hù)。
在逐步的發(fā)展階段中,注重總結(jié)反省的工程師會(huì)逐漸成長為高階運(yùn)維人員,通常他們會(huì)有比較體系化的服務(wù)運(yùn)維理解。也有一部分工程師由于出色的項(xiàng)目管理規(guī)劃能力,逐漸成為項(xiàng)目經(jīng)理。
再進(jìn)一步的發(fā)展,高階的運(yùn)維人員對(duì)于產(chǎn)品的理解將非常的透徹,因而在這種情況下,高階運(yùn)維人員甚至可以成為產(chǎn)品的產(chǎn)品經(jīng)理、產(chǎn)品研發(fā)的咨詢顧問,在產(chǎn)品功能的設(shè)計(jì)與開發(fā)中起到至關(guān)重要的角色。
拓展資料
工作內(nèi)容
在軟件產(chǎn)品的整個(gè)生命周期中運(yùn)維工程師都需要適時(shí)地參與并發(fā)揮不同的作用,因此運(yùn)維工程師的工作內(nèi)容和方向非常多:
-
事件管理:目標(biāo)是在服務(wù)出現(xiàn)異常時(shí)盡可能快速的恢復(fù)服務(wù),從而保障服務(wù)的可用性;同時(shí)深入分析故障產(chǎn)生的原因,推動(dòng)并修復(fù)服務(wù)存在的問題,同時(shí)設(shè)計(jì)并開發(fā)相關(guān)的預(yù)案以確保服務(wù)出現(xiàn)故障時(shí)可以高效的止損。在這方面主要工作內(nèi)容有:
-
問題發(fā)現(xiàn):設(shè)計(jì)并開發(fā)高效的監(jiān)控平臺(tái)和告警平臺(tái),使用機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等方法對(duì)系統(tǒng)中的大量監(jiān)控?cái)?shù)據(jù)進(jìn)行匯總分析,以期在系統(tǒng)出現(xiàn)異常的時(shí)候可以快速的發(fā)現(xiàn)問題和判斷故障的影響。
-
問題處理:設(shè)計(jì)并開發(fā)高效的問題處理平臺(tái)和工具,在系統(tǒng)出現(xiàn)異常的時(shí)候可以快速/自動(dòng)決策并觸發(fā)相關(guān)止損預(yù)案,快速恢復(fù)服務(wù)。
-
問題跟蹤:通過分析問題發(fā)生時(shí)系統(tǒng)的各種表現(xiàn)(日志、變更、監(jiān)控)確定問題發(fā)生的根本原因,制定并開發(fā)預(yù)案工具。
-
變更管理:以可控的方式,盡可能高效的完成產(chǎn)品功能的迭代的變更工作。在這方面運(yùn)主要工作內(nèi)容有:
-
配置管理:通過配置管理平臺(tái)(自研、開源)管理服務(wù)涉及到的多個(gè)模塊、多個(gè)版本的關(guān)系以及配置的準(zhǔn)確性。
-
發(fā)布管理:通過構(gòu)建自動(dòng)化的平臺(tái)確保每一次版本變更可以安全可控地發(fā)布到生產(chǎn)環(huán)境。
-
容量管理:在服務(wù)運(yùn)行維護(hù)階段,為了確保服務(wù)架構(gòu)部署的合理性同時(shí)掌握服務(wù)整體的冗余,需要不斷評(píng)估系統(tǒng)的承載能力,并不斷優(yōu)化之。在這方面主要工作內(nèi)容有:
-
容量評(píng)估:通過技術(shù)手段模擬實(shí)際的用戶請(qǐng)求,測(cè)試整個(gè)系統(tǒng)所能承擔(dān)的最大吞吐;通過建立容量評(píng)估模型分析壓力測(cè)試過程中的數(shù)據(jù)以評(píng)估整個(gè)服務(wù)的容量。
-
容量優(yōu)化:基于容量評(píng)估數(shù)據(jù),判斷系統(tǒng)的瓶頸并提供容量優(yōu)化的解決方案。比如通過調(diào)整系統(tǒng)參數(shù)、優(yōu)化服務(wù)部署架構(gòu)等方法來高效的提升系統(tǒng)容量。
-
架構(gòu)優(yōu)化:為了支持產(chǎn)品的不斷迭代,需要不斷的進(jìn)行架構(gòu)優(yōu)化調(diào)整。以確保整個(gè)產(chǎn)品能夠在功能不斷豐富和復(fù)雜的條件下,同時(shí)保持高可用性。
參考資料:
百度百科-運(yùn)維工程師