計算機(jī)運(yùn)維工程師忙嗎?
你好,很高興回答你這個問題。
作為一個運(yùn)維狗有話說,經(jīng)歷了手動運(yùn)維、腳本運(yùn)維、自動化運(yùn)維等各個階段,運(yùn)維工作也由非常忙、很忙、比較忙三個階段,咱們每個階段都說下:
1.手動運(yùn)維
這個階段一般是新手階段,運(yùn)維知識儲備不足,思想意識也不夠深,基本是通過手動操作來處理各種問題。兵來將擋,水來土掩。由于手動處理,
工作效率
不高。 因此這個階段隨著各種問題的不斷擠壓,運(yùn)維工程師將會非常忙,可能真的需要7*24小時工作哦 。
2.腳本運(yùn)維
這個階段隨著運(yùn)維技能水平的提高、經(jīng)驗(yàn)的不斷積累,運(yùn)維工程師已經(jīng)可以熟練的運(yùn)用工具以及相應(yīng)的腳本開發(fā),實(shí)現(xiàn)批量操作。最重要的還是思想意識的提高,能夠主動考慮如何解決問題,這樣驅(qū)動著運(yùn)維不斷的去接觸新工具、新的解決方案。 因此運(yùn)維工程師從非常忙降級到很忙,有了一定的空閑時間去學(xué)習(xí)新知識。
3.自動化運(yùn)維
這個階段單純的通過工具或腳本已經(jīng)不能滿足運(yùn)維日益增長的技能需求,因此此時通過各種媒體渠道、經(jīng)驗(yàn)交流,知道運(yùn)維過程中不僅僅是處理問題那么簡單,必須形成一定的制度規(guī)范,建立一套監(jiān)控、故障響應(yīng)、CI/CD機(jī)制,實(shí)現(xiàn)不同場景的自動化運(yùn)維。 此時的運(yùn)維工程師將進(jìn)入全新的比較忙甚至有足夠的空閑時間,去學(xué)習(xí)總結(jié),將新的知識點(diǎn)、理念應(yīng)用到工作中。
最后,運(yùn)維是一個相對比較復(fù)雜的崗位,需要了解的知識面比較廣。當(dāng)然隨著
互聯(lián)網(wǎng)技術(shù)
的不斷更新,運(yùn)維也需要不斷進(jìn)行知識的儲備,以便更快速、高效的進(jìn)行交付工作。
希望我的回答對你有幫助。
我是【木訥大叔愛運(yùn)維】,歡迎關(guān)注,與你分享運(yùn)維路上的點(diǎn)點(diǎn)滴滴。
忙不忙看公司,小公司事情比較雜,相對要忙一點(diǎn),大公司運(yùn)維里面還分很多垂直領(lǐng)域,相對要輕松一點(diǎn)。
在互聯(lián)網(wǎng)公司,運(yùn)維崗是個占比很大的技術(shù)崗位,跟開發(fā)崗,測試崗并列。一個互聯(lián)網(wǎng)產(chǎn)品的生成一般經(jīng)歷的過程是:
產(chǎn)品經(jīng)理
、需求分析、研發(fā)部門開發(fā)、測試部門測試、運(yùn)維部門部署發(fā)布以及長期的運(yùn)行維護(hù)。一個產(chǎn)品的
生命周期
90%以上時間都在運(yùn)維手中,所以運(yùn)維的技術(shù)含量并不比開發(fā)低,甚至入門要高很多。
大公司有硬件運(yùn)維,
系統(tǒng)運(yùn)維
,數(shù)據(jù)運(yùn)維,應(yīng)用運(yùn)維,安全運(yùn)維等等,分的細(xì)自然要求也高,你要開發(fā)很多自動化系統(tǒng)來保證業(yè)務(wù)x個9的可靠性;小公司這些都是一個人包了,沒有自動化解決方案,很多需要人肉,運(yùn)維經(jīng)驗(yàn)更重要,什么故障都能很快定位到。
目前運(yùn)維工程師跟開發(fā)工程師的界限越來越模糊,什么運(yùn)維開發(fā)崗,什么開發(fā)運(yùn)維崗,都預(yù)示著未來不懂開發(fā)的運(yùn)維在運(yùn)維界很難立足。
一般,運(yùn)維工程師都很忙。尤其互聯(lián)網(wǎng)公司,他們的職責(zé)是保證線上服務(wù)或機(jī)器24小時不宕機(jī)允許,平穩(wěn)可靠地運(yùn)行。
巡視網(wǎng)絡(luò)環(huán)境,(通過掃描漏洞等措施)及時發(fā)現(xiàn)及時修復(fù)安全漏洞是他們的天職?;蛘邘椭_發(fā)人員性能優(yōu)化、提供安全意識也屬于他們的工作范圍。希望你能采納。
總之,運(yùn)維工程師不會輕松,防范黑客攻擊,
網(wǎng)絡(luò)帶寬
優(yōu)化,24小時輪值待命,防患于未然,防微杜漸意識是做好運(yùn)維工作的基本要求。
分單位分項(xiàng)目分類型。有的單位信息化程度較高,設(shè)備多且種類復(fù)雜,數(shù)量大必然出現(xiàn)的問題就容易多,這樣一來運(yùn)維工程師就會很忙;有的項(xiàng)目就是運(yùn)維類項(xiàng)目,那肯定每天都跟運(yùn)維打交道,而有的項(xiàng)目是開發(fā)或者集成類項(xiàng)目,自然運(yùn)維的任務(wù)就比較少;有的運(yùn)維工程師類型會比較忙,比如數(shù)據(jù)庫運(yùn)維工程師和網(wǎng)絡(luò)運(yùn)維工程師,而像虛擬化運(yùn)維工程師工作量可能就沒那么大。
忙不忙主要還是取決于公司,這里拋開公司不談,說一下運(yùn)維的3個階段
我們以一個例子說一下3個階段。這里舉一個例子,一個系統(tǒng)升級和簡單故障處理的場景。
首先是手工運(yùn)維,公司有3臺服務(wù)器臺,通過Nginx做的集群和
負(fù)載均衡
,跑的一樣工程代碼。那么每次服務(wù)器升級的時候,就需要人工把每臺服務(wù)器都備份了,然后停止每臺服務(wù)器的進(jìn)程,把新的工程傳到服務(wù)器上,再每臺服務(wù)器啟動項(xiàng)目。這樣是不是很繁瑣,同樣的事情機(jī)械化做多次,而且全人工操作也有很大的風(fēng)險。
在服務(wù)器不斷增多的情況下,工作會越來越忙,那么這個時候就可以引入
持續(xù)集成
的框架,例如Jenkins,它可以很方便的通過我們寫的shell腳本完成上述說的,寫好shell后,只需點(diǎn)擊按鍵,可以一件自動完成從代碼服務(wù)器上拉取最新的代碼,然后自動構(gòu)建為工程,上傳到目標(biāo)服務(wù)器,自動停服備份,發(fā)布新工程啟動。
這樣就需要一次的腳步勞作,減少機(jī)械勞動和人為操作的風(fēng)險,但是還有個問題就是隨著業(yè)務(wù)的不斷發(fā)展,可能我們需要關(guān)注的還有服務(wù)器的性能,彈性擴(kuò)容等,如果我服務(wù)器超級多,工作就會越來越重。這個時候就有了新技術(shù)例如k8s+docker+Jenkins的組合,這里不太怎么具體搭建框架,介紹下能實(shí)現(xiàn)的效果,引入這一套服務(wù)器框架后可以實(shí)現(xiàn),自動備份自動發(fā)版,除了上述的,最厲害的是可以實(shí)現(xiàn)自動擴(kuò)容,當(dāng)你設(shè)置一個服務(wù)器cpu性能值,例如50%,當(dāng)我現(xiàn)在有3個服務(wù),每個服務(wù)的cpu都到了設(shè)定值,k8s框架會根據(jù)我們之前設(shè)定的一些參數(shù),自動啟動新的服務(wù),并加入集群,如果判斷到某個節(jié)點(diǎn)故障了,也會啟動新服務(wù),然后干掉故障服務(wù)。
所以運(yùn)維工程師忙不忙,除了公司的因數(shù)不談,還要看自己是不是善用各種工具技術(shù)
我是@零件小哥,我來回答下這個問題。
我之前也是做過運(yùn)維工程師,主要在海關(guān)信息中心機(jī)房做軟件運(yùn)維。
運(yùn)維的工作主要有以下內(nèi)容:
日常巡檢,主要巡檢服務(wù)器CPU、內(nèi)存、硬盤空間等。涉及到軟件部分,還要巡檢應(yīng)用服務(wù)是否正常運(yùn)行,有無錯誤日志等內(nèi)容。日常巡檢的工作量根據(jù)所在企業(yè)的業(yè)務(wù)量大小來確定的,每個企業(yè)的標(biāo)準(zhǔn)都不一樣,有的一周巡檢3次,有的一天1次。
故障處理,主要對突發(fā)的故障進(jìn)行處理。故障處理根據(jù)故障的級別對客戶進(jìn)行響應(yīng)。故障級別一般分為:一般故障、較嚴(yán)重故障、重大故障。一般故障指的是不影響系統(tǒng)運(yùn)行的故障,處理完成時間是24小時,一般故障占全部故障的90%。較嚴(yán)重故障指的是業(yè)務(wù)運(yùn)行遲緩、部分用戶受到影響,但系統(tǒng)還是有在運(yùn)行的故障。處理完成時間是6個小時。較嚴(yán)重故障占全部故障的9.9%。重大故障指的是業(yè)務(wù)停滯、用戶無法使用業(yè)務(wù)系統(tǒng),系統(tǒng)已崩潰的故障。處理完成時間2小時。重大故障比較少見,可能運(yùn)維工作中幾年不會碰到一次。
運(yùn)維報告整理,一般是在日常巡檢、故障處理后輸出的技術(shù)報告文檔。運(yùn)維報告每個企業(yè)都有固定的模板,我們需要把巡檢后或故障處理后的數(shù)據(jù)填入報告,把巡檢問題詳細(xì)記錄,把故障問題和故障處理方式詳細(xì)記錄。
應(yīng)用部署更新,主要是更新應(yīng)用服務(wù)。開發(fā)人員會把更新補(bǔ)丁交付給運(yùn)維工程師,我們需要備份先前版本的應(yīng)用后更新補(bǔ)丁。
客戶問題解答,主要在運(yùn)維工作群中解答客戶關(guān)于系統(tǒng)使用問題的解答。
最后重點(diǎn)來了,運(yùn)維工程師忙不忙呢?有的人說忙,也有人說不忙。其實(shí)都是有的。根據(jù)所在企業(yè)的業(yè)務(wù)量來確定,國企和私企也有區(qū)別。系統(tǒng)運(yùn)行故障少,我們一般按時做好巡檢就可以了,這樣工作量就比較少,相對會輕松些。系統(tǒng)不穩(wěn)定的話,那肯定就很忙了,時不時客戶一個個電話打進(jìn)來就夠頭疼了。
說到運(yùn)維工程師,一般人都會認(rèn)為是修電腦的。實(shí)際上運(yùn)維工程師的工作并不是這么簡單。運(yùn)維從字面上理解,運(yùn)就是運(yùn)行,維就是維護(hù),那么運(yùn)維工程師的職能就是保障業(yè)務(wù)的正常運(yùn)行并在出現(xiàn)問題時及時維護(hù)。
用專業(yè)的術(shù)語來解釋運(yùn)維工程師是負(fù)責(zé)維護(hù)并且確保整個服務(wù)系統(tǒng)的高可用性,同時不斷優(yōu)化系統(tǒng)架構(gòu)提升部署效率、優(yōu)化資源利用率提高整體的ROI。運(yùn)維工程師是一個統(tǒng)稱,其中有很多分類。包括:
桌面運(yùn)維工程師
、網(wǎng)絡(luò)運(yùn)維工程師、系統(tǒng)運(yùn)維工程師、基礎(chǔ)運(yùn)維工程師等等,他們的劃分主要是工作具體內(nèi)容的不同。
運(yùn)維工程師最忙的時候是他們完成一個項(xiàng)目產(chǎn)品的時候,有的時候需要加班好幾個星期。他們在產(chǎn)品項(xiàng)目完成的不同階段會發(fā)揮不同的作用。所以其實(shí)他們的工作內(nèi)容很多:
產(chǎn)品發(fā)布前:負(fù)責(zé)參與并審核架構(gòu)設(shè)計的合理性和可運(yùn)維性,以確保在產(chǎn)品發(fā)布之后能高效穩(wěn)定的運(yùn)行。
產(chǎn)品發(fā)布階段:負(fù)責(zé)用自動化的技術(shù)或者平臺確保產(chǎn)品可以高效的發(fā)布上線,之后可以快速穩(wěn)定迭代。
產(chǎn)品運(yùn)行維護(hù)階段:負(fù)責(zé)保障產(chǎn)品7*24H穩(wěn)定運(yùn)行,在此期間對出現(xiàn)的各種問題可以快速定位并解決;在日常工作中不斷優(yōu)化系統(tǒng)架構(gòu)和部署的合理性,以提升系統(tǒng)服務(wù)的穩(wěn)定性。
運(yùn)維工程師是一個需要二十四小時在線的職業(yè),因?yàn)槟悴恢朗裁磿r候系統(tǒng)就需要你去維護(hù)。所以就算你休假在家,需要運(yùn)維工程師的時候也需要出手。
運(yùn)維工程師會有著很多業(yè)務(wù)需求,如果運(yùn)維工程師能夠滿足業(yè)務(wù)需求,或者主動挖掘業(yè)務(wù)的痛點(diǎn)和改進(jìn)方法,就能為業(yè)務(wù)實(shí)現(xiàn)更多的價值。業(yè)務(wù)由于故障引起的中斷一定會造成損失,所以能在發(fā)病之前就將它修理好,這才是運(yùn)維工程師的核心價值。在滿足業(yè)務(wù)需求時,優(yōu)先面對業(yè)務(wù)快速發(fā)展非常重要的需求,例如穩(wěn)定性,部署和變更效率,容量管理。
那沒有項(xiàng)目的日常,運(yùn)維工程師們都在干嘛,是不是無所事事的玩手機(jī)?當(dāng)然不是了,如果你這么做的話,會被炒魷魚的。那運(yùn)維工程師日常工作是干嘛呢?每日定時對機(jī)房內(nèi)的網(wǎng)絡(luò)服務(wù)器、數(shù)據(jù)庫服務(wù)器、Internet服務(wù)器進(jìn)行日常巡視,檢查是否正常工作,公司的網(wǎng)站是否能正常訪問;每日巡查計算機(jī)系統(tǒng)各個終端電腦、打印機(jī)、復(fù)印機(jī)等設(shè)備是否工作正常,是否有不正確的操作使用,是否有帶故障工作的設(shè)備;每天夜間在大家都下班之后對財務(wù)軟件進(jìn)行自動實(shí)時備份,每周做一次物理數(shù)據(jù)備份,并在備份服務(wù)器中進(jìn)行邏輯備份的驗(yàn)證工作;每周至少對文件服務(wù)器做一次物理數(shù)據(jù)備份;還有就是處理各種有關(guān)網(wǎng)絡(luò)的突發(fā)問題。當(dāng)然每個公司的運(yùn)維工程師從事的工作是大同小異的,有的公司可能還會給運(yùn)維工程師安排其他的工作。所以正在學(xué)習(xí)從事運(yùn)維工程師的同學(xué)們和想要成為運(yùn)維工程師的同學(xué)們,對于自己想要從事的崗位工作內(nèi)容有沒有多一點(diǎn)了解?以后別人問起來運(yùn)維工程師是干嘛的,千萬別再讓別人覺得就是個修電腦的了。而且看了工作內(nèi)容,你們有沒有信心成為運(yùn)維工程師的佼佼者呢?
有時候很忙,運(yùn)維工程師平時要做事比較雜,負(fù)責(zé)環(huán)境和服務(wù)包部署,解決部署問題,保障系統(tǒng)服務(wù)的正常運(yùn)行,協(xié)助開發(fā)定位問題,有的需要24小時響應(yīng)及時處理線上問題,部署和升級服務(wù)的話只能在晚上或半夜用戶流量少的時候,所以熬夜通宵干活還是比較累的
就看你公司運(yùn)維系統(tǒng)做的怎么樣,如果做的好就要輕松點(diǎn),但是如果直班也惱火
請問:運(yùn)維工程師,工作強(qiáng)度如何?
工作強(qiáng)度低不低是看各個公司的,在A公司運(yùn)維的強(qiáng)度非常高,基本都是晚上回去還要加班做一些事情,主要原因是人比較少;而B公司的運(yùn)維強(qiáng)度和人均的負(fù)荷成正比,這個我雖然為B服務(wù)過,但是現(xiàn)在B怎么樣我不太清楚;
運(yùn)維人員的要求特別嚴(yán)苛,因?yàn)檫\(yùn)維人員針對不同的問題,需要不斷的補(bǔ)充擴(kuò)大自己的知識和研究范疇。
在初級階段,優(yōu)秀運(yùn)維人員會體現(xiàn)出格外出眾的主動性和責(zé)任心,面對陌生的業(yè)務(wù)會主動學(xué)習(xí)和拓展自己對業(yè)務(wù)對認(rèn)識和相應(yīng)的知識范疇,以能夠足夠的勝任業(yè)務(wù)的獨(dú)立維護(hù)。
在逐步的發(fā)展階段中,注重總結(jié)反省的工程師會逐漸成長為高階運(yùn)維人員,通常他們會有比較體系化的服務(wù)運(yùn)維理解。也有一部分工程師由于出色的項(xiàng)目管理規(guī)劃能力,逐漸成為項(xiàng)目經(jīng)理。
再進(jìn)一步的發(fā)展,高階的運(yùn)維人員對于產(chǎn)品的理解將非常的透徹,因而在這種情況下,高階運(yùn)維人員甚至可以成為產(chǎn)品的產(chǎn)品經(jīng)理、產(chǎn)品研發(fā)的咨詢顧問,在產(chǎn)品功能的設(shè)計與開發(fā)中起到至關(guān)重要的角色。
拓展資料
工作內(nèi)容
在軟件產(chǎn)品的整個生命周期中運(yùn)維工程師都需要適時地參與并發(fā)揮不同的作用,因此運(yùn)維工程師的工作內(nèi)容和方向非常多:
-
事件管理:目標(biāo)是在服務(wù)出現(xiàn)異常時盡可能快速的恢復(fù)服務(wù),從而保障服務(wù)的可用性;同時深入分析故障產(chǎn)生的原因,推動并修復(fù)服務(wù)存在的問題,同時設(shè)計并開發(fā)相關(guān)的預(yù)案以確保服務(wù)出現(xiàn)故障時可以高效的止損。在這方面主要工作內(nèi)容有:
-
問題發(fā)現(xiàn):設(shè)計并開發(fā)高效的監(jiān)控平臺和告警平臺,使用機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等方法對系統(tǒng)中的大量監(jiān)控數(shù)據(jù)進(jìn)行匯總分析,以期在系統(tǒng)出現(xiàn)異常的時候可以快速的發(fā)現(xiàn)問題和判斷故障的影響。
-
問題處理:設(shè)計并開發(fā)高效的問題處理平臺和工具,在系統(tǒng)出現(xiàn)異常的時候可以快速/自動決策并觸發(fā)相關(guān)止損預(yù)案,快速恢復(fù)服務(wù)。
-
問題跟蹤:通過分析問題發(fā)生時系統(tǒng)的各種表現(xiàn)(日志、變更、監(jiān)控)確定問題發(fā)生的根本原因,制定并開發(fā)預(yù)案工具。
-
變更管理:以可控的方式,盡可能高效的完成產(chǎn)品功能的迭代的變更工作。在這方面運(yùn)主要工作內(nèi)容有:
-
配置管理:通過配置管理平臺(自研、開源)管理服務(wù)涉及到的多個模塊、多個版本的關(guān)系以及配置的準(zhǔn)確性。
-
發(fā)布管理:通過構(gòu)建自動化的平臺確保每一次版本變更可以安全可控地發(fā)布到生產(chǎn)環(huán)境。
-
容量管理:在服務(wù)運(yùn)行維護(hù)階段,為了確保服務(wù)架構(gòu)部署的合理性同時掌握服務(wù)整體的冗余,需要不斷評估系統(tǒng)的承載能力,并不斷優(yōu)化之。在這方面主要工作內(nèi)容有:
-
容量評估:通過技術(shù)手段模擬實(shí)際的用戶請求,測試整個系統(tǒng)所能承擔(dān)的最大吞吐;通過建立容量評估模型分析壓力測試過程中的數(shù)據(jù)以評估整個服務(wù)的容量。
-
容量優(yōu)化:基于容量評估數(shù)據(jù),判斷系統(tǒng)的瓶頸并提供容量優(yōu)化的解決方案。比如通過調(diào)整系統(tǒng)參數(shù)、優(yōu)化服務(wù)部署架構(gòu)等方法來高效的提升系統(tǒng)容量。
-
架構(gòu)優(yōu)化:為了支持產(chǎn)品的不斷迭代,需要不斷的進(jìn)行架構(gòu)優(yōu)化調(diào)整。以確保整個產(chǎn)品能夠在功能不斷豐富和復(fù)雜的條件下,同時保持高可用性。
參考資料:
百度百科-運(yùn)維工程師
運(yùn)維真有那么苦逼嗎
運(yùn)維會比較累一點(diǎn),去了人員緊張的公司,小一點(diǎn)的公司,把一個人當(dāng)好幾個人用,那你的體力就容易透支。
對于初創(chuàng)公司,運(yùn)維部和系統(tǒng)部一般是合二為一的,相關(guān)工作由同一批人負(fù)責(zé),界限可能不是很明顯。大型公司對運(yùn)維工作的要求更高,需要有更精細(xì)的分工,因此機(jī)房/網(wǎng)絡(luò)/操作系統(tǒng)相關(guān)的底層工作分離出來由專人負(fù)責(zé);
成為系統(tǒng)管理部,而上層和應(yīng)用產(chǎn)品相關(guān)的工作則由運(yùn)維負(fù)責(zé),成為運(yùn)維部。以下從互聯(lián)網(wǎng)產(chǎn)品生命周期和運(yùn)維涉及的技術(shù)分別來看分工較細(xì)的大型互聯(lián)網(wǎng)公司中運(yùn)維工作的職責(zé)。
擴(kuò)展資料:
從行業(yè)角度來看,隨著中國互聯(lián)網(wǎng)的高速發(fā)展、網(wǎng)站規(guī)模越來越來大、架構(gòu)越來越復(fù)雜,對專職網(wǎng)站運(yùn)維工程師、網(wǎng)站架構(gòu)師的要求會越來越急迫,特別是對有經(jīng)驗(yàn)的優(yōu)秀運(yùn)維人才需求量大,而且是越老越值錢。
從個人角度,運(yùn)維工程師技術(shù)含量及要求會越來越高,同時也是對公司應(yīng)用、架構(gòu)最了解最熟悉的人、越來越得到重視。
互聯(lián)網(wǎng)運(yùn)維是一個融合多學(xué)科(網(wǎng)絡(luò)、系統(tǒng)、開發(fā)、安全、應(yīng)用架構(gòu)、存儲等)的綜合性技術(shù)崗位,給運(yùn)維工程師提供了一個很好的個人能力與技術(shù)的發(fā)展空間。