存储系统运维要求 运维需要学什么

经验攻略 bvnghjyi7692 2024-05-07 11:27 6 0

如何做好运维监控

统一监控平台,说到底本质上也是一个监控系统,监控的基本能力是必不可少的,回归到监控的本质,先梳理下整个监控体系:

①监控系统的本质是通过发现故障、解决故障、预防故障来为了保障业务的稳定。

②监控体系一般来说包括数据采集、数据检测、告警管理、故障管理、视图管理和监控管理6大模块。而数据采集、数据检测和告警处理是监控的最小闭环,但如果想要真正把监控系统做好,那故障管理闭环、视图管理、监控管理的模块也缺一不可。

一、数据采集

1、采集方式

数据采集方式一般分为Agent模式和非Agent模式;

Agent模式包括插件采集、脚本采集、日志采集、进程采集、APM探针等

非Agent模式包括通用协议采集、Web拨测、API接口等

2、数据类型

监控的数据类型有指标、日志、跟踪数据三种类型。

指标数据是数值型的监控项,主要是通过维度来做标识。

日志数据是字符型的数据,主要是从中找一些关键字信息来做监控。

跟踪型数据反馈的是跟踪链路一个数据流转的过程,观察过程中的耗时性能是否正常。

3、采集频率

采集频率分秒级、分钟级、随机三种类型。常用的采集频率为分钟级。

4、采集传输

采集传输可按传输发起分类,也可按传输链路分类。

按传输发起分类有主动采集Pull(拉)、被动接收Push(推)

按传输链路分类有直连模式、Proxy传输。

其中Proxy传输不仅能解决监控数据跨网传输的问题,还可以缓解监控节点数量过多导致出现的数据传输的瓶颈,用Proxy实现数据分流。

5、数据存储

对于监控系统来说,主要有以下三种存储供选择

①关系型数据库

例如MySQL、MSSQL、DB2;典型监控系统代表:Zabbix、SCOM、Tivoli;

由于数据库本身的限制,很难搞定海量监控的场景,有性能瓶颈,只在传统监控系统常用

②时序数据库

为监控这种场景设计的数据库,擅长于指标数据存储和计算;例如InfluxDB、OpenTSDB(基于Hbase)、Prometheus等;典型监控系统代表:TICK监控框架、 Open-falcon、Prometheus

③全文检索数据库

这类型数据库主要用于日志型存储,对数据检索非常友好,例如Elasticsearch。

二、数据检测

1.数据加工

①数据清洗

数据清洗比如日志数据的清洗,因为日志数据是非结构化的数据,信息密度较低,因此需要从中提取有用的数据。

②数据计算

很多原始性能数据不能直接用来判断数据是否产生异常。比如采集的数据是磁盘总量和磁盘使用量,如果要检测磁盘使用率,就需要对现有指标进行一个简单的四则运算,才能得到磁盘使用率。

③数据丰富

数据丰富就是给数据打上一些tags标签,比如打上主机、机房的标签,方便进行聚合计算。

④指标派生

指标派生指的是通过已有的指标,通过计算得出新的指标。

2.检测算法

有固定规则和机器学习算法。固定算法是较为常见的算法,静态阈值、同比环比、自定义规则,而机器学习主要有动态基线、毛刺检测、指标预测、多指标关联检测等算法。

无论是固定规则还是机器学习,都会有相应的判断规则,即常见的<>>=和and/or的组合判断等。

三、告警管理

1.告警丰富

告警丰富是为了后续告警事件分析做准备,需要辅助信息去判断该怎么处理、分析和通知。

告警丰富一般是通过规则,联动CMDB、知识库、作业历史记录等数据源,实现告警字段、关联信息的丰富;通过人工打Tags也是一种丰富方式,不过实际场景下由于人工成本高导致难以落地。

2.告警收敛

告警收敛有三种思路:抑制、屏蔽和聚合

①抑制

即抑制同样的问题,避免重复告警。常见的抑制方案有防抖抑制、依赖抑制、时间抑制、组合条件抑制、高可用抑制等。

②屏蔽

屏蔽可预知的情况,比如变更维护期、固定的周期任务这些已经知道会发生的事件,心里已经有预期。

③聚合

聚合是把类似或相同的告警进行合并,因为可能反馈的是同一个现象。比如业务访问量升高,那承载业务的主机的CPU、内存、磁盘IO、网络IO等各项性能都会飙升,这样把这些性能指标都聚合到一块,更加便于告警的分析处理。

3.告警通知

①通知到人

通过一些常规的通知渠道,能够触达到人。

这样在没有人盯屏的时候,可以通过微信、短信、邮件触发到工作人员。

②通知到系统

一般通过API推送给第三方系统,便于进行后续的事件处理

另外还需要支持自定义渠道扩展(比如企业里有自己的IM系统,可以自行接入)

四、故障管理

告警事件必须要处理有闭环,否则监控是没有意义的。

最常见还是人工处理:值班、工单、故障升级等。

经验积累可以把人工处理的故障积累到知识库里面,用于后续故障处理的参考。

自动处理,通过提取一些特定告警的固化的处理流程,实现特定场景的故障自愈;比如磁盘空间告警时把一些无用日志清掉。

智能分析主要是通过故障的关联分析、定位、预测等AI算法,进一步提升故障定位和处理的效率;

1.视图管理

视图管理也属于增值性功能,主要是满足人的心理述求,做到心中有底,面向的角色很多(领导、管理员、值班员等)。

大屏:面向领导,提供全局概览

拓扑:面向运维人员,提供告警关联关系和影响面视图

仪表盘:面向运维人员,提供自定义的关注指标的视图

报表:面向运维人员、领导,提供一些统计汇总报表信息,例如周报、日报等

检索:面向运维人员,用于故障分析场景下的各类数据检索

2.监控管理

监控管理是企业监控落地过程中的最大挑战。前5个模块都是监控系统对外提供的服务功能,而监控管理才是面向监控系统自身的管理和控制,关注真正落地的过程的功能呈现。主要有以下几个方面:

配置:简单、批量、自动

覆盖率:监控水平的衡量指标

指标库:监控指标的规范

移动端:随时随地处理问题

权限:使用控制

审计:管理合规

API:运维数据最大的来源,用于数据消费

自监控:自身稳定的保障

为了实现上述监控六大基础能力模块,我们可以按如下架构设计我们的统一监控平台。

主要分三层,接入层,能力层,功能层。

接入层主要考虑各种数据的接入,除了本身Agent和插件的采集接入,还需要支持第三方监控源的数据接入,才能算一个完整的统一监控平台。

能力层主要考虑监控的基础通用能力,包含数据采集模块、数据存储模块、数据加工模块、数据检测模块、AI分析模块。

功能层需要贴近用户使用场景,主要有管理、展示两类功能,在建设的过程中可以不断丰富功能场景。

另外,考虑到数据的关联关系,为未来的数据分析打下基础,监控和CMDB也需要紧密联动,所有的监控对象都应该用CMDB进行管理,另外,还可以配置驱动监控为指导理念,实现监控的自动上下线,告警通知自动识别负责人等场景,简化监控的维护管理。

为了统一监控平台能够在企业更好的落地,我们需要配备对应的管理体系,其中最重要的是指标管理体系。

指标管理体系的核心理念:

监控的指标体系是以CMDB为骨架,以监控指标为经脉,将整个统一监控平台的数据有机整合起来。

贯穿指标的生命周期管理,辅以指标的管理规范,保障监控平台长久有序的运行。

从企业业务应用的视角出发,一般将企业监控的对象分为6层,也可以根据企业自己的情况进行调整:

基础设施层

硬件设备层

操作系统层

组件服务层

应用性能层

业务运营层

运维需要学什么

问题一:做系统运维需要学习些什么?

问题二:网站运维需要学习那些知识?网站最核心的是流量,也就是有人访问。

要解决流量的问题,首先是网站的基础优化到位,包括网站的程序代码,页面的导航栏目、首页、内容页的设置及内容添加要做到位。在保证网站内容的完整性和稀缺性的前提下,剩下需要做的就是网站的引流推广了,具体的方式也比较多,大概分成免费和付费两种,免费一般需要的时间要长一些,付费的效果一般是比较直接和快速的,如果对于时间没有要求可以选择免费的,如果想快否获得较好的网站排名还是需要进行付费推广。

问题三:做Linux运维要学哪些东西?什么顺序?主要需要什么能力?运维需要用到的东西很杂,从硬件设备到软件维护。

硬件设备比如服务器的安装网络的部署布局,最好能够了解防火墙,路由器,交换机的设置。

linux系统的深入了解。最好能够深入到内核和代码层面

部署在linux服务器上的应用的了解和维护,比如tomcat apache weblog浮c nagios cacti等。包括开发人员编写的软件,都需要去进行维护和调优建议,最好了解js和java语言。服务器的各种使用情况的监控,如磁盘,cpu,mem,io等。

架构设计的了解,以及自动化运维的脚本编写。

比如搭建集群或负载模式的架构等,实现服务器的多机热备高可用。

脚本编写,以减少人力操作来提高执行效率和准确性,一般需要shell,python,perl一类的语言基础,也包括awk,except等小语种使用。

数据库的维护

熟悉主流的数据库操作,主要是添删改查的操作。

oracle,mysql,芒果db,db2,memcache,redis等

问题四:运维工程师需要学习哪些课程操作系统概述、文件系统管理、unix作业管理、网络模型、UDP协议、网络层协议、各类局域网。

Linux基础知识、Vim使用、Shell编程、软件包管理、常用Server、容量分析、性能优化等。

AIX系统管理概述、系统管理工具、软件安装与维护、备份与恢复、网络管理基础、故障诊断、案例分析等。

powerHA概念和实施规划、VIO搭建和部署、日常检查、Oracle体系结构、客户机连接SQL语句、OracleRAC搭建等。

问题五:运维新手们,别再问需不需要学PYTHON了经常有人在群里问,运维人员需不需要学开发?需不需要学 PYTHON? PYTHON和 SHELL有什么区别?天天问这种好水的问题,我实在受不了,决定帮大家扫扫盲,求求新手们,以后别他妈瞎问了。

现阶段,掌握一门开发语言已经成为高级运维工程师的必备计能,不会开发,你就不能充分理解你们系统的业务流程,你就不能帮助调试、优化开发人开发的程序,开发人员有的时候很少关注性能的问题,这些问题就得运维人员来做,一个业务上线了,导致 CPU使用过高,内存占用过大,如果你不会开发,你可能只能查到进程级别,也就是哪个进程占用这么多,然后呢?然后就交给开发人员处理了,这样咋体现你的价值?

另外,大一点的公司,服务器都上几百,上千,甚至数万台,这种情况下怎样做自动化运维?用 SHELL写脚本 FOR循环?呵呵,歇了吧, SHELL也就适合简单的系统管理工作。到复杂的自动化任务还得要用专门的开发语言。你可能说了,自动化管理有专门的开源软件\监控也有,直接拿来用下就好了,但是现有的开源软件如 puppet\saltstack\zabbix\nagio多为通用的软件,不可能完全适用你公司的所有需求,当你需要做定制、做二次开发的时候,你咋办?找开发部门?开发部门不懂运维的实际业务逻辑,写出来的东西烂烂不能用,这活最后还得交给运维开发人员来做。

其次,不会运维开发,你就不能自己写运维平台\复杂的运维工具,一切要借助于找一些开源软件拼拼凑凑,如果是这样,那就请不要抱怨你的工资低,你的工作不受重视了。

为什么要学 PYTHON?

PYTHON第一是个非常牛 B的脚本语言,能满足绝大部分自动化运维的需求,又能做后端 C/S架构,又能用 WEB框架快速开发出高大上的 WEB界面,只有当你自已有能力做出一套运维自动化系统的时候,你的价值才体现出来,你才有资格跟老板谈重视,否则,还是老老实实回去装机器吧。

运维开发为什么要用 PYTHON?

Good question,为什么不用 PHP, JAVA, C++, RUBY,这里我只能说,见人见智,如果你碰巧已经掌握了除 PYTHON之外的其它语言,那你爱用啥用啥,如果你是一个连 SHELL都还没写明白的新手,想学个语言的话,请用 PYTHON,为什么呢?首先, PHP是跟 PYTHON比的最多的,其实他俩根本就不用比,为什么呢?两个语言适用性不同, PHP主要适用于 WEB开发,可以迅速的做出中小型,轻量级的 WEB网站,但后端嘛,基本还是要借助其它语言,借助什么语言呢? SHELL? PYTHON?呵呵。而 PYTHON呢,是个综合语言,前后端都可以,单拿出来比 WEB,也一点不比 PHP差,但为什么WEB方向上 PHP比 PYTHON要火?先入为主嘛, PHP 90年代诞生就是做 WEB的, PYTHON2000年后才出现 WEB框架,但论优秀程度上, PYTHON的 WEB框架基本上出其无左,至少是跟 PHP比。

那 JAVA呢?好吧,一个臃肿\中庸\豪无新意的语言,还是老老实实用它来做 ERP吧,搞个运维小平台,用 JAVA真心没啥必要,在我看来, JAVA就是稳定的中年男人,稳定\成熟\秃顶,而 PYTOHN代表的就是青春,简洁\快\干净\帅!

C++\ C,这个嘛,我只能说,如果你会了 PYTHON,又......>>

问题六:运维工程师需要什么技能?最好的方法就是去看一些招聘网站的招聘简介了已经很全了

岗位职责:

1、负责公司网络总体系统及子系统的维护;

2、负责网络整体架构规划、实施、优化、安全;

3、负责整体网络的操作规范文档编写,整合系激资源;

4、负责整体网络的风险评估与备份系统实现;

5、研究主流的互联网应用技术,并负责将此是现在公司业务系统测试及应用;

6、公司整体网络架构规划,实施及维护;

7、主动发现问题,提出合理化建设,积极提出优化手段和建议。

任职资格:

1、大专学历,3年以上工作经验;

2、能够承受一定的工作压力,具备良好的沟通协调能力及突发事件单独处理能力;

3、熟悉unix/linux操作系统;

4、熟悉Linux下不同数据库的安装和调试,熟练使用shell脚步语言;

5、精通L.A..M.P架构,对L.A..M.P架构的部署、搭建、优化、排错等方面有丰富的经验。对高负载、大访问量情况下的L.A..M.P架构有运维经验者优先。

6、熟悉Linux下不同的存储解决方案,同时管理超过50太以上的linux服务器组,有整体管理经验者优先;

7、利用syslong收集各个关键出口设备情况,充分利用snmp协议,规划并架设一整套网络监控系统;

8、具备独立的工作能力,良好的沟通能力和团队精神,高度的责任心,工作积极主动

问题七:想做IT运维该从什么方面学起这个东西不知道你有基础没,没有基础的话入门比较吃力,我做这块是从培训学校出来的,学了一年半花了近三万块。看视频用处不是很大,我从学校出来的感觉学的东西跟实际的都有些出入,找一个人带吧,这个要快点,自己学有那个毅力没有方向。给你讲下网络运维具体都要求哪块吧。1、网络运维离不开Linux,现在大些的企业基本上用的都是这个系统,特别是做金融,电商的,安全性,稳定性高,如果这个不会,哪基本上一般的工作机会都没了。2、网络日常基本问题的维护,像网络不稳定啊,丢包啊,服务器上网站不能访问啊,公司的服务器跨掉了啊,这些都是网络运维的工作。3、这个就是日常一些软件的管理了,像网站IIS,APACHE的搭建啊,MYSQL的管理啊,还有一些服务器上的基本应用等,这个都要熟练。说了这三条,其实要求的也没那么严格,都要精通,关键都得有所了解,遇到问题了知道大概的处理思路,多多百度,就可以应付过来,重要的是在工作的过程中多多学习,这就进步的快,想往这方面发展可以咨询我。

问题八:想学网络运维工程师需要什么要求如何入门呢?你是打算自学是吗?运维不仅仅是单机方面的知识哟,还涉及局域网,还有路由交换等等呢!你现在到底有什么样的基础,大家也不是很清楚哈。要不你说说自己的情况吧。

问题九:运维工程师必须掌握的基础技能有哪些技能:

1. Linux基础

包括对Linux整体的理解/使用和基本命令:

了解Linux FHS: Filesystem Hierarchy Standard,国人写的这本书不错 Linux系统架构与目录解析(豆瓣)

入门Linux:鸟哥的Linux私房菜.基础学习篇(第三版)(豆瓣)个人认为鸟哥的这本书是一本非常好的入门书

基本操作命令:Google,如Linux mand cheat sheet

熟悉至少一个内置编辑器: vi, nano

至少熟悉一个发行版(或系列),建议作为服务器常用的如Centos, Debian, Ubuntu,可以了解多个常用发行版

2.运维的命令:

运维相关的工具(命令),了解它能解决很多问题。

前几天刚回答了一个问题:如何才能更深入的学习linux?

里面的图在这里也可以用到:

可以对着图对学习了解这些命令。

另外我个人也会对平时用到的这些工具做一个整理和记录,总结到我的个人维基上:Wiki・ Tanky Woo

3.基础服务:

LAMP或LNMP:Apache/Nginx,MySQL,PHP/Python/Perl LAMP(software bundle)

FTP

DNS

SAMBA

EMAIL

NTP

DHCP

...

可以本地搭建练练手

这里推荐鸟哥另外一本书服务器架设篇:鸟哥的Linux私房菜(豆瓣)

4.运维平台工具:

也在这个问题如何才能更深入的学习linux?里提到了:

Nagios

Puppet

Zabbix

Cacti

SaltStack

....

可以选择性的折腾下,因为这个涉及到业务,没有实际环境,很难去理解他们的功能和特点。

5.脚本:

必备:Shell

额外:Python,Perl...

6.底层:

Linux C,内核

7.网络:

网络是非常重要的一块

把《TCP/IP协议详解》多看几遍,理解。

熟练使用tcpdump等抓包工具

8.安全:

防火墙配置,如 iptables

9.硬件:

接口类型

查看硬件信息

知道各类型服务器,如塔式、机架式、刀片式

10.其它:

了解更多特定技能要求的方式:

Google搜Linux运维工程师招聘,看看他们的需求。

最后推荐一本书:Unix/Linux系统管理技术手册 UNIX/Linux系统管理技术手册(豆瓣)

后续想到再做补充

素养/处理方式:

除了技能,我觉得素养(态度)也可以谈谈

这个正好看到右边相关问题:运维工程师需要具备哪些性格特质?

1.安全

运维人员的权限很大,所以一定要保证帐号/私钥的安全。

最好使用加密工具存储。比如truecrypt,1password

基于本地存储。切勿用网盘,也不建议用lastpass等

ssh私钥添加密码

以上任何一点都很重要,否则弄丢了,风险会非常大。

2.责任心

如上面那个帖子里@山大提到的 Owner意识

遇到报警,第一时间处理,而不要等着他人去处理

如果无法处理,应该第一时间让同事协助帮忙,而不要禁止报警,让问题掩盖

3.细心

你的任何一个操作,都可能造成系统的损坏、业务出问题。所以敲命令时一定要细心、再三确认。你敲的再快,也就节省那么一点时间,出了问题才是大事。

4.推进/改善

如果代码有问题,导致系统开销很大,比如负载,io等。应该第一时间和开发部门确认,要求优化代码。

5.进取心/不断学习

运维的知识范围很广......>>

问题十:关于系统运维方面,需要掌握哪些方面的知识我来试着回答一下吧:以前做过企业内部的支持顾问,也做过外部的技术支持顾问,现在主要做系统实施,对各方面的掌握知识的理解多少有点,提出几点,希望对你有帮助。我觉得你肯定指的是企业内部的SAP运维工程师吧,是吧?对于这个职位你需要掌握的几个重点内容如下:1》能够了解和掌握所负责的模块的公司业务情况。2》熟悉并掌握所负责模块的系统应用操作。3》能够配置所负责模块的系统配置。4》最好还能掌握其他相关联的模块的基本知识,比如说,你是SD模块的工程师,那你还应该掌握一些MM库存的知识,FICO的少量知识,最好还能了解一些WM的相关知识。5》对于系统内的增强开发非常熟悉,知道这些增强开发都控制了什么系统操作,如果更改的话,会对系统操作有什么影响。6》要会一些ABAP的基本知识,能够开发简单的程序,包括报表、表单和增强开发。7》起码要掌握一些debug技巧,能够知道说一个程序出错后,如何去跟踪这个程序的取数。8》对于表结构应该有了解,能够熟悉的写出负责模块的基本常用表名。9》除了以上技术方面的意外,还应该能够有能够跟业务人员沟通和了解业务需求的能力,能够把他们的需求转换为系统功能的实力,当然到了这一步,你就可以向外部顾问的方向迈进了。

系统运维工程师做什么

运维工程师主要是做什么的

负责一定产品集的运维,工作内容包括应用系统的发布、部署、变更、监控、事件处理、优化以及系统架构设计调优、提供运维报告等。IT类别的

IT运维工程师主要是什么的啊?

负责机房IT系统核心设备的日常巡检与维护工作,能按要求对其进行配置,保障系统的正常、安全运行;

2、负责服务器系统的安全管理,做好数据安全和病毒的防范工作;

3、负责现场的技术支持,及时解决出现的各类技术故障;

4、负责数据库管理,及相关系统测试;

5、负责制定各服务器的数据备份计划,并且确保备份数据可用性;

6、必要时,协助Helpdesk做一些桌面技术支持工作;

7、负责与相关部门的的交流,及时反馈用户使用信息;

8、运维文档的撰写与归档工作。

运维工程师,工作内容有哪些?

这要看你具体做什么运福了,运维工作也分很多种,如果是服务器运维工程师的话主要应该就是维护服务器的稳定,排查网络问题,不断的进行优化性能之类的

linux运维工程师一般做了哪些方面的工作?

1、对Linux下各种网络服务、应用系统、监控系统等进行自动化脚本开发的工作,并根据项目对系统进行性能优化;

2、负责网站项目中Linux服务器的部署与维护,解决Linux系统下版本兼容性问题;

3、精通linux操作系统,熟练部署和维护Linux服务器以及在linux服务器上架设各种服务;

4、熟练编写shell script脚本;

5、熟悉TCP/IP协议;

6、良好的英语读写能力,听说能力优秀者优先。

7、熟练LAMP,LNMP以及Mysql,oracle数据库维护。《Linux就该这么学》里有相关介绍,建议看看。

运维工程师,和系统工程师的区别详细一点的!

系统工程师是从系统开始安装到架构都是他来做,而运维工程师是别人已经搭建好了你去维护一下就这点区别

网络运维工程师具体是干什么的? 20分

岗位职责:

1、在线服务的维护监控。 2、企业邮件系统,业务邮件系统等的维护 3、 Oracle\mysql数据库的维护,性能调优,数据备份恢复,数据的导入导出。 4、开发环境的技术支持,代码服务器的维护。 5、进行网络调试配置,骇时解决故障问题。 6、办公网络环境的基本维护,各部门的桌面技术支持。

你自己看下吧。

运维工程师需要什么技能?

最好的方法就是去看一些招聘网站的招聘简介了已经很全了

岗位职责:

1、负责公司网络总体系统及子系统的维护;

2、负责网络整体架构规划、实施、优化、安全;

3、负责整体网络的操作规范文档编写,整合系激资源;

4、负责整体网络的风险评估与备份系统实现;

5、研究主流的互联网应用技术,并负责将此是现在公司业务系统测试及应用;

6、公司整体网络架构规划,实施及维护;

7、主动发现问题,提出合理化建设,积极提出优化手段和建议。

任职资格:

1、大专学历,3年以上工作经验;

2、能够承受一定的工作压力,具备良好的沟通协调能力及突发事件单独处理能力;

3、熟悉unix/linux操作系统;

4、熟悉Linux下不同数据库的安装和调试,熟练使用shell脚步语言;

5、精通L.A..M.P架构,对L.A..M.P架构的部署、搭建、优化、排错等方面有丰富的经验。对高负载、大访问量情况下的L.A..M.P架构有运维经验者优先。

6、熟悉Linux下不同的存储解决方案,同时管理超过50太以上的linux服务器组,有整体管理经验者优先;

7、利用syslong收集各个关键出口设备情况,充分利用snmp协议,规划并架设一整套网络监控系统;

8、具备独立的工作能力,良好的沟通能力和团队精神,高度的责任心,工作积极主动

请问:运维工程师,工作强度如何?

运维工程师的工作强度是不是比开发工程师的工作强度低一些?

工作强度低不低是看各个公司的,在A公司运维的强度非常高,基本都是晚上回去还要加班做一些事情,主要原因是人比较少;而B公司的运维强度和人均的负荷成正比,这个我虽然为B服务过(以前我在一家B的供应商呆过,去过B做过一段时间),但是现在B怎么样我不太清楚;

2.运维工程师工作的技术含量会不会低一些?所以压力小一些?

–运维的工作性质主要还是维持运行的平稳和高效,工作主要有安装调试软硬件,根据不同开发项目配置服务器软件,监控等事情;相对开发来说更加偏向操作系统或数据库(这是两个方向,一般是分开招人的);而开发的偏向于开发软件和一些中间件,数据库和系统一般就由运维的人把关;

a.DBA偏向软件,而OS管理员和network(比如cisco)管理员偏向软硬件结合,还有一种人就是纯粹玩硬件的(安装服务器硬件、机柜什么的);

b.至于说技术含量,我个人认为越集成的东西管理的人操心就越少,而每个不同岗位的技术没有什么可比性,关键看你个人的性格;c.相对开发,运维的经验学习成本是比较高的,就是说你不在一定的实用环境下是没法学会真本事的,而开发你坐在家里就可以摸索一个大概出来;而运维的知识更新的速度相对慢,10年前的DBA知识更新可能只有50%,而他本人会非常值钱,而2年前java的一些内容可能都没有发明出来;除非你在开发做到管理职位,否则纯技术开发学习更新的代价会非常高;反过来说:技术开发适合比较喜欢新鲜、喜欢创新的人,而运维适合循规蹈矩比较踏实的人;

3.在B,运维工程师的薪水只有开发的2/3左右.你们公司也是一样吗?

–我个人认为:公司给不同position的薪水肯定是和他预估这个职位重要性和工作强度成正比的,但和未来发展是否正比就不得而知了,这在B内部是有可比性的,至于A如何,我不太清楚,应该相差不大,毕竟A的运维已经是全球领先的,而且人数非常少;

4.运维工程师的发展前景怎么样,会不会以后的发展空间比较小?

–所谓发展空间是要结合你个人的性格,资深DBA之类的人在地球上还是很稀缺的,我知道ebay china operating center的DBA有开宝马上班的,而且运维不是吃青春饭,越老越吃香,可以说是个平滑的上升直线,而开发如果你只是一个执行者和coder,恐怕就是一个开始猛涨后面猛跌的曲线,毕竟开发知识代谢成本太高,过了30就走下坡路;

软件公司需要的运营维护工程师主要是干什么工作?

就是做软件实施的,也就是现在说的实施工程师到处跑,维护软件的!教别人如何使用软件,推广。