軟件公司需要的運(yùn)營(yíng)維護(hù)工程師主要是干什么工作?
一、事件管理:目標(biāo)是在服務(wù)出現(xiàn)異常時(shí)盡可能快速的恢復(fù)服務(wù),從而保障服務(wù)的可用性;同時(shí)深入分析故障產(chǎn)生的原因,推動(dòng)并修復(fù)服務(wù)存在的問(wèn)題,同時(shí)設(shè)計(jì)并開(kāi)發(fā)相關(guān)的預(yù)案以確保服務(wù)出現(xiàn)故障時(shí)可以高效的止損。在這方面主要工作內(nèi)容有:
1、問(wèn)題發(fā)現(xiàn):設(shè)計(jì)并開(kāi)發(fā)高效的監(jiān)控平臺(tái)和告警平臺(tái),使用機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等方法對(duì)系統(tǒng)中的大量監(jiān)控?cái)?shù)據(jù)進(jìn)行匯總分析,以期在系統(tǒng)出現(xiàn)異常的時(shí)候可以快速的發(fā)現(xiàn)問(wèn)題和判斷故障的影響。
2、問(wèn)題處理:設(shè)計(jì)并開(kāi)發(fā)高效的問(wèn)題處理平臺(tái)和工具,在系統(tǒng)出現(xiàn)異常的時(shí)候可以快速/自動(dòng)決策并觸發(fā)相關(guān)止損預(yù)案,快速恢復(fù)服務(wù)。
3、問(wèn)題跟蹤:通過(guò)分析問(wèn)題發(fā)生時(shí)系統(tǒng)的各種表現(xiàn)(日志、變更、監(jiān)控)確定問(wèn)題發(fā)生的根本原因,制定并開(kāi)發(fā)預(yù)案工具。
二、變更管理:以可控的方式,盡可能高效的完成產(chǎn)品功能的迭代的變更工作。在這方面主要工作內(nèi)容有:
1、配置管理:通過(guò)配置管理平臺(tái)(自研、開(kāi)源)管理服務(wù)涉及到的多個(gè)模塊、多個(gè)版本的關(guān)系以及配置的準(zhǔn)確性。
2、發(fā)布管理:通過(guò)構(gòu)建自動(dòng)化的平臺(tái)確保每一次版本變更可以安全可控地發(fā)布到生產(chǎn)環(huán)境。
三、容量管理:在服務(wù)運(yùn)行維護(hù)階段,為了確保服務(wù)架構(gòu)部署的合理性同時(shí)掌握服務(wù)整體的冗余,需要不斷評(píng)估系統(tǒng)的承載能力,并不斷優(yōu)化之。在這方面主要工作內(nèi)容有:
1、容量評(píng)估:通過(guò)技術(shù)手段模擬實(shí)際的用戶請(qǐng)求,測(cè)試整個(gè)系統(tǒng)所能承擔(dān)的最大吞吐;通過(guò)建立容量評(píng)估模型分析壓力測(cè)試過(guò)程中的數(shù)據(jù)以評(píng)估整個(gè)服務(wù)的容量。
2、容量?jī)?yōu)化:基于容量評(píng)估數(shù)據(jù),判斷系統(tǒng)的瓶頸并提供容量?jī)?yōu)化的解決方案。比如通過(guò)調(diào)整系統(tǒng)參數(shù)、優(yōu)化服務(wù)部署架構(gòu)等方法來(lái)高效的提升系統(tǒng)容量。
3、架構(gòu)優(yōu)化:為了支持產(chǎn)品的不斷迭代,需要不斷的進(jìn)行架構(gòu)優(yōu)化調(diào)整。以確保整個(gè)產(chǎn)品能夠在功能不斷豐富和復(fù)雜的條件下,同時(shí)保持高可用性。
擴(kuò)展資料
一、無(wú)論做什么運(yùn)維,運(yùn)維工程師最基本的職責(zé)都是負(fù)責(zé)服務(wù)的穩(wěn)定性,確保服務(wù)可以7*24H不間斷地為用戶提供服務(wù)。在此之上運(yùn)維工程師的主要工作職責(zé)如下:
1、質(zhì)量:保障并不斷提升服務(wù)的可用性,確保用戶數(shù)據(jù)安全,提升用戶體驗(yàn)。
2、效率:用自動(dòng)化的工具/平臺(tái)提升軟件在研發(fā)生命周期中的工程效率。
3、成本:通過(guò)技術(shù)手段優(yōu)化服務(wù)架構(gòu)、性能調(diào)優(yōu);通過(guò)資源優(yōu)化組合降低成本、提升ROI。
二、從產(chǎn)品的生命周期來(lái)看:
1、產(chǎn)品發(fā)布前:負(fù)責(zé)參與并審核架構(gòu)設(shè)計(jì)的合理性和可運(yùn)維性,以確保在產(chǎn)品發(fā)布之后能高效穩(wěn)定的運(yùn)行。
2、產(chǎn)品發(fā)布階段:負(fù)責(zé)用自動(dòng)化的技術(shù)或者平臺(tái)確保產(chǎn)品可以高效的發(fā)布上線,之后可以快速穩(wěn)定迭代。
3、產(chǎn)品運(yùn)行維護(hù)階段:負(fù)責(zé)保障產(chǎn)品7*24H穩(wěn)定運(yùn)行,在此期間對(duì)出現(xiàn)的各種問(wèn)題可以快速定位并解決;在日常工作中不斷優(yōu)化系統(tǒng)架構(gòu)和部署的合理性,以提升系統(tǒng)服務(wù)的穩(wěn)定性。
參考資料來(lái)源:
百度百科——運(yùn)維工程師
Linux運(yùn)維方向需要學(xué)些什么,之后可以從事哪些工作
推薦幾本學(xué)習(xí)Linux的書(shū)籍供參考:
一、《快樂(lè)的Linux命令行》
這本書(shū)介紹如何生存在 Linux 命令行的世界。不像一些書(shū)籍僅僅涉及一個(gè)程序,比如像shell 程序, bash。這本書(shū)將試著向你傳授如何與命令行界面友好相處。它是怎樣工作的?它能做什么?使用它的最好方法是什么?
正如書(shū)中所說(shuō)的“就像有位老師在你身邊,指導(dǎo)你學(xué)習(xí)”,這本書(shū)的特點(diǎn)是語(yǔ)言簡(jiǎn)潔流暢,即使是英文版,看起來(lái)也不費(fèi)勁(目前已有中文版)。涵蓋了大部分命令行工具和Shell編程。最主要的是它基于 CC 協(xié)議共享,任何人都可以免費(fèi)下載。
二、《Linux命令行與shell腳本編程大全》
這是一本非常適合Linux小白的入門教程,內(nèi)容通俗易懂、深入淺出,除了日常工作中用的基礎(chǔ)命令之外,像正則表達(dá)式、sed、awk 這樣的高級(jí)命令也有介紹,書(shū)上還配有大量的實(shí)例,如果你想精通 shell 編程,那么這本書(shū)就是為你準(zhǔn)備的。也是有志于從事系統(tǒng)運(yùn)維開(kāi)發(fā)的朋友必備讀品,總之,只要你能跟著這本教程學(xué)完,使用 Linux 就輕車熟路了。
三、鳥(niǎo)哥的Linux私房菜 : 基礎(chǔ)學(xué)習(xí)篇
如果你想要學(xué)習(xí)Linux,強(qiáng)烈建議通過(guò)《鳥(niǎo)哥的Linux私房菜》這套書(shū)籍去學(xué)習(xí),淺顯易懂,小編就是通過(guò)這套書(shū)籍學(xué)會(huì)Linux的。
四、Linux UNIX系統(tǒng)編程手冊(cè) 套裝上下冊(cè)
《linux/unix系統(tǒng)編程手冊(cè)(上、下冊(cè))》是介紹linux與unix編程接口的權(quán)威著作。linux編程資深專家michael kerrisk在書(shū)中詳細(xì)描述了linux/unix系統(tǒng)編程所涉及的系統(tǒng)調(diào)用和庫(kù)函數(shù),并輔之以全面而清晰的代碼示例。
《linux/unix系統(tǒng)編程手冊(cè)(上、下冊(cè))》涵蓋了逾500個(gè)系統(tǒng)調(diào)用及庫(kù)函數(shù),并給出逾200個(gè)程序示例,另含88張表格和115幅示意圖。
學(xué)成之后從事的工作也是圍繞運(yùn)維進(jìn)行的:
應(yīng)用運(yùn)維(SRE)
:應(yīng)用運(yùn)維負(fù)責(zé)線上服務(wù)的變更、服務(wù)狀態(tài)監(jiān)控、服務(wù)容災(zāi)和數(shù)據(jù)備份等工作,對(duì)服務(wù)進(jìn)行例行排查、故障應(yīng)急處理等工作,工作職責(zé)如下:設(shè)計(jì)評(píng)審、服務(wù)管理、資源管理、例行檢查、預(yù)案管理、數(shù)據(jù)備份。
系統(tǒng)運(yùn)維(SYS)
:負(fù)責(zé)IDC、網(wǎng)絡(luò)、CDN和基礎(chǔ)服務(wù)的建設(shè)(LVS、NTP、DNS);負(fù)責(zé)資產(chǎn)管理,服務(wù)器選型、交付和維修,工作職責(zé)如下:IDC數(shù)據(jù)中心建設(shè)、網(wǎng)絡(luò)建設(shè)、LVS負(fù)載均衡和SNAT建設(shè)、CDN規(guī)劃和建設(shè)、服務(wù)器選型、交付和維護(hù)、內(nèi)核選型和OS相關(guān)維護(hù)工作、資產(chǎn)管理、基礎(chǔ)服務(wù)建設(shè)。
數(shù)據(jù)庫(kù)運(yùn)維(DBA)
:數(shù)據(jù)庫(kù)運(yùn)維負(fù)責(zé)數(shù)據(jù)存儲(chǔ)方案設(shè)計(jì)、數(shù)據(jù)庫(kù)表設(shè)計(jì)、索引設(shè)計(jì)和SQL優(yōu)化,對(duì)數(shù)據(jù)庫(kù)進(jìn)行變更、監(jiān)控、備份、高可用設(shè)計(jì)等工作,詳細(xì)的工作內(nèi)容如下:設(shè)計(jì)評(píng)審、容量規(guī)劃、數(shù)據(jù)備份與災(zāi)備、數(shù)據(jù)庫(kù)監(jiān)控、數(shù)據(jù)庫(kù)安全、數(shù)據(jù)庫(kù)高可用和性能優(yōu)化、自動(dòng)化系統(tǒng)建設(shè)、運(yùn)維研發(fā)、運(yùn)維平臺(tái)、監(jiān)控系統(tǒng)、自動(dòng)化部署系統(tǒng)。
運(yùn)維安全(SEC)
:運(yùn)維安全負(fù)責(zé)網(wǎng)絡(luò)、系統(tǒng)和業(yè)務(wù)等方面的安全加固工作,進(jìn)行常規(guī)的安全掃描、滲透測(cè)試,進(jìn)行安全工具和系統(tǒng)研發(fā)以及安全事件應(yīng)急處理,工作內(nèi)容如下:安全制度建立、風(fēng)險(xiǎn)評(píng)估、安全建設(shè)、安全合規(guī)、應(yīng)急響應(yīng)。
linux運(yùn)維工程師都是干什么啊 有發(fā)展嗎
運(yùn)維主要是保障服務(wù)器,系統(tǒng),數(shù)據(jù)庫(kù),云計(jì)算的平臺(tái)安全、穩(wěn)定的運(yùn)行,是屬于幕后的英雄,更多的是通過(guò)學(xué)到的知識(shí)和經(jīng)驗(yàn)幫你維護(hù)服務(wù)器。
如果你不能理解,我舉一個(gè)例子:假如一個(gè)汽車出問(wèn)題了,你去檢修維護(hù)就可以了,運(yùn)維也是這樣的工作!
那運(yùn)維開(kāi)發(fā)或者自動(dòng)化運(yùn)維是什么?
例如10臺(tái)太汽車出了問(wèn)題,限你1天之內(nèi)搞定,你要是還是按照老辦法一臺(tái)一臺(tái)檢修,那你啥時(shí)候能弄完,如果你能自己開(kāi)發(fā)出來(lái)一套軟件,把這10萬(wàn)臺(tái)汽車接入你這平臺(tái),汽車只要啟動(dòng),這個(gè)系統(tǒng)就會(huì)自動(dòng)檢測(cè)他哪里有問(wèn)題,可能一個(gè)小時(shí)全部搞定,并給解決方案!
如果你還不能理解,再舉個(gè)例子:正常的運(yùn)維類似手動(dòng)搶紅包,一個(gè)一個(gè)點(diǎn),如果你能開(kāi)發(fā)個(gè)外掛幫你搶紅包,只要有人發(fā)紅包,自動(dòng)就會(huì)幫你點(diǎn)了收進(jìn)你的錢包!
一個(gè)是運(yùn)維,一個(gè)是自動(dòng)化運(yùn)維或者運(yùn)維開(kāi)發(fā),大概有概念了吧!
自動(dòng)化運(yùn)維和運(yùn)維開(kāi)發(fā)的目標(biāo)就是提高運(yùn)維效率,節(jié)約成本,減少工作量,需要懂一門開(kāi)發(fā)語(yǔ)言,用學(xué)會(huì)的開(kāi)發(fā)語(yǔ)言開(kāi)發(fā)運(yùn)維的軟件和工具幫你更好的做運(yùn)維。
那你是不是有疑惑,我能不能一步到位,直接自動(dòng)化運(yùn)維!答案是可以的,那你就脫產(chǎn)學(xué)習(xí)linux云計(jì)算,周末再報(bào)個(gè)python自動(dòng)化開(kāi)發(fā)的班即可!
咱們linux云計(jì)算里面講的自動(dòng)化運(yùn)維是市場(chǎng)上已經(jīng)開(kāi)發(fā)好的比較常見(jiàn)的運(yùn)維的工具,例如ansible,zabbix都是,而python自動(dòng)化開(kāi)發(fā)學(xué)完之后你可以根據(jù)需求自己開(kāi)發(fā)軟件,工具啥的,當(dāng)然也可以改市面上已經(jīng)有的這個(gè)運(yùn)維工具的代碼,不學(xué)習(xí)python做不到。如果你精力有限,建議先學(xué)習(xí)運(yùn)維脫產(chǎn)班,一個(gè)月能有13-20k的待遇,上班之后再慢慢學(xué)習(xí)python自動(dòng)化!