漫谈运维—运维工程师.docx

上传人:l*** 文档编号:19709410 上传时间:2022-06-10 格式:DOCX 页数:28 大小:45.32KB
返回 下载 相关 举报
漫谈运维—运维工程师.docx_第1页
第1页 / 共28页
漫谈运维—运维工程师.docx_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《漫谈运维—运维工程师.docx》由会员分享,可在线阅读,更多相关《漫谈运维—运维工程师.docx(28页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、漫谈运维运维工程师 谈网站或其他服务器运维,这里只谈运维工程师所要做的细微环节工作,让人们知道运维工程师究竟都在做些什么,至于上级所要做的,只是提一下,不做参考。 以下是个人观点,我说的只是我自己的想法,也是我发展的目标。你可以有异议,我们是来沟通的。你对的我确定会向你学习。因为我也在摸索。运维工程师至少要能做以下的工作: 1,网络工程师的工作 你至少要能配置CISCO 6509以下的设备,熟识各种网络协议,否则网络出问题的时候你会傻掉。 2,系统工程师的工作 你至少要理解各种系统服务,在出问题的状况下要快速解决问题,而不是等系统工程师来解决。 3,平安工程师的工作 我不要求你肯定要会各种网络

2、编程,但是在服务器收攻击的状况下,没有防火墙的状况下,做一些简洁的处理工作。 4,存储工程师的工作 至少要熟识各个厂商的设备,各种备份和还原的方法 5,测试工程师的工作 在新版本上线之前,你至少要协同测试工程师做测试工作,因为你是运维人员,不了解程序架构导致无法解决故障,你也有一份责任。 6,研发人员的工作 运维工具都须要自已开发,熟识开发语言,须要有过实际开发阅历,否则工作会特别苦痛,我深有体会。 7,英语 不想说了,我的最大苦痛就在这里 8,好的沟通者 不出问题时候你可以打嬉戏睡觉,出问题的时候要能和项目人员沟通,快速解决问题,而不是推;我知道有许多人能推责任,你可以做替死鬼,但是离开这个

3、工作你还能找到更好的;把责任推到别人身上的人,下次出问题的时候,肯定没人帮你。你要能和各个兄弟部门关系特别的亲密,出了问题有兄弟帮你担责任;也要能特别扯皮,没事在会议上把别人都搞定。 9,库房管理员 数万台服务器让你来管理,任何丢失或者损坏都是不负责任和失职的表现。 10,运动员 不要回家就睡觉,有空还是运动下吧;在服务器down机的时候,机房恰巧就你一个人,机柜没有空间,你须要更换一台HP 585 4U的服务器,满配约80公斤的服务器,你怎么做? 11,责任心 这个我不想说什么,这是你的职业精神。 12,组织者 给你2个啥都不会的民工,再给你2000台服务器,要求你2天把服务器装完,你咋办?

4、 13,17条中,你必需有一条特别精通,是这个行业的专家。否则过了32岁,没有公司要你。 大家看了确定觉得这个人是神仙,但是这必需是你渐渐能做到的,至少是我6年来运维阅历的一点总结。 因为现在的公司都在用聘请民工的钱聘请神仙,其次我也是想让各位看看,运维工程师要担负多少责任。 我去面试过的一些公司都说,你什么都会,什么都不精。我说对,正是须要我们这些什么都会的人领导什么都精的人。 我这句话没有贬低大牛的任何意思,只是当时一个临场的发挥。虽然说完就知道这个面试白来了,但是我还是想为广阔的运维工程师出口气。 不怕千招会,就怕一招精。这照旧是我给大家的建议。 最终给大家最终最大最重要的建议,做什么工

5、作都可以,千万别做SA。 我把SA的定义成:speedine answer而不是system admin。为什么?你可以想象一下哪些工作须要快速响应。网络工程师须要,机房网络骨干交换机故障,整个机房全部服务器无法连接,须要快速响应不?系统工程师须要,系统出问题了,要快速响应不?平安工程师须要,服务器被攻击了,要快速响应不?存储工程师须要,公司核心存储有问题了,要快速响应不? 你可以做研发,出了问题可以测试,可以想方法渐渐解决;你可以做DBA,出了问题可以推到网络工程师或者系统工程师身上,说不是DB连接问题;你可以做测试工程师,你说有问题这个东西就可以不上线在出问题的时候,倒霉的就是SA,所以不

6、要再争辩SA包含哪些工作,SA就是一个倒霉的快速响应者,你想,哪个SA 24小时不开手机?哪个SA 晚上可以舒适的睡觉或者安心的出去度假?走在路上一听到和自己手机短信铃声一样的,利马下意识的抓出自己的手机看看是不是服务器报警;晚上和老婆 XXOO00,一个电话过来,立马停下,抓出手机看流量图;包里放着笔记本,但是因为还要开机,太慢,拿着手机上putty ping或者telnet机器 这就是大家艳羡的SA ,你也不要埋怨自己做了SA,生活就是这样。所以不要再争辩哪些xxx员应当归属于SA,系统管理员或是运维工程师,假如想做这行,就安生的当一个“快速响应者”,这是你的职业,也是你须要做到的。作为一

7、个SA,你确定经验过通宵好几天加班做事,你确定经验过饭买来已经遗忘了吃,你确定经验过几天加班没睡觉,着个沙发坐下就失去知觉睡倒没有经验过不能说你不好,只能说你管理的机器太少。 我公司是每月发21天工资,某两月我一月发了44天工资一月发了47天工资,创全公司建司7年来加班记录项目做完自然也就落了个部门通告表扬,然后的结果就是健康状况急剧下滑,然后就是某天晚上在机房内加班一通宵,穿着短裤进机房,然后一个通宵被机柜下面的冷风吹了个关节炎这就是做SA的代价。 以下是一些实际阅历,发给大家做参考,有任何问题可以mail我,answer3ai 有的东西是企业机密,我不能透露也不能给你相关文档。 一,架构设

8、计 现在你要做的,就是设计你的服务器架构和网络架构。这要先看你的网站是做什么的,每日有多少的人数访问, 例如,我准备站点初期每日有20000左右的访问量,和1000人左右的并发量。我可以用我的人数并发量1000站点中每个页面的平均大小200k每个访问用户可能要打开4个网页800 000k=800M的网络流量(当然这个数字确定是特别的过分,至于为啥,自己可以想下) 然后可以用测试环境用软件检测在你的真实环境下的服务器压力,比如在2000人在线的状况下,服务器的cpu占用多少,内存占用多少。 那么你可以得到你大致配置,其实市面上的标准服务器配置都足够你用了,比如现在的DELL 1950,HP DL

9、360G5,IBM X?(遗忘了) 等服务器,足够我跑一个这样简洁的网站。其实说白了,双奔3都够,真的。当然你网站的流量比我要大的多,那你可以买的更好一点的服务器。或者负载均衡器。 网络架构 站点现在是一台独立服务器,将来采纳的是分布式架构,比如是一台服务器,是一台服务器 mysql是一台服务器。这样你要算服务器要多少台,交换机要多少口,防火墙要买什么级别的。 哪些服务器可以放在一个防火墙下,哪些服务器不用防火墙爱护,哪些服务器是内网服务器, 须要什么样的网络连接,最好是画出大致拓扑,便利你预算设备花费。 服务器交换机等设备选型和购买 说的简洁点就是买什么机器,你可以和google一样起先,买

10、几台pc作为你的网站服务器,也可以自己组装一台服务器 或者也可以和我一样,去选择品牌服务器当然,现在你要看你服务器做什么的, 你可以亲自去电脑城看组装服务器,也可以打电话到IBM,HP,DELL的各地销售商让他们送服务器来测试, 当然你不要告知他们你只买一台,那你就别希望测试了。我告知供货商须要200台服务器,一个F5,10台CISCO 2960交换机,3个NETSREEN206防火墙,一个EMC CX500+满硬盘 那么不到3天,所须要的4台测试服务器,就送来了当然,不要牛了这么多最终只买1台,那么你晚上走夜路会被人打的。 最终就是价钱问题了,这个你自己看着办吧。让你公司的财务或者选购出马砍

11、价付钱就是了。当然,除了服务器的服务,你最好还是想想有利于自己的服务,比如人家公司可以帮你拆箱子了什么的。我做的最弱智的一件事情就是,来了400台服务器,50个交换机,8台EMC,我一个人花了一星期把箱子才全部拆完 机器选型的时候你也要为自己考虑,比如HP的ILO功能,可以让你远程BIOS级操作服务器,比如浪潮的自动资产管理等等,为自己管理服务器供应便利,否则机器10来台还好,100台还一般,我这里3万来台,我不死几百遍了。丢失一台服务器,几个月工钱就没了 二,IDC选择 首先要看你服务的地区是哪里,然后再去找当地的电信机房。终归,虽说全国已经互联了,但是各地的网速还是有差异的。 或者说有的I

12、DC机房利用率高,虽然出口带宽大,但是利用率高的结果是导致你网速慢的缘由之一。 我的做法是在全国各个机房的服务器用pingplus这个软件进行一周的的流量测试。可以看到平均丢包,最大延时等等。 当然,你也可以到你目标服务的地方,找个可以上网的地方进行网络测试,比如说网吧包个机器 好了,网络测试完了。那么你已经确定去哪个IDC了吧。 然后你就可以电话或者自己提着礼品登门探望一下IDC服务商的老大了 当然,你也可以找代理服务商,因为他们拿到的价钱有时候比电信或者网通给你的价钱低,但是,关键还是一个服务,因为你终归服务器放在那,晚上关键焦急没人给你重启,机器出了问题其实按个F1就可以解决的问题,服务

13、商的值班人员不懂。你就只能打晚上的打飞机去机房维护吧。 提着东西探望一下服务商老大是礼节性的东西,东西不在多而在精,这样你将来谈事情人家也给你绿色通道,做事情要好做许多。当然,我也不反对你空手去,你一次租个100个机柜10G带宽,人家还是很实惠的。哈哈。大家都是混口饭吃,也不至于难为你什么。 最终你要知道现在的中国还是卖方市场,你给人家牛,那你买的产品只能是蒙牛 然后是起先去参观机房 细心的检查一下空调数量,空调出厂和最终维护日期,网络布线类型和架构,是否可扩展,主备从电力等。 基本都是特别关键的东西,出问题了,人家可以给你更换一个新的,服务很好,但是你服务器挂一天的损失是多少,你可以自己掂量

14、。 还有机柜电力,现在的机柜放置16台1U的服务器是正好,多了过于热,少了资源奢侈;但是你发觉人家只让你用10安培电力,过了要交钱买电; 或者不限制你用电,但是插线板只有10个,你还真买个托线板去转接?你要想想你一个托线板挂了,你服务器要挂几个? 最终,我的一个机房包间里140个机柜,2个空调,结果某天挂了一个空调,虽然6小时人家IDC商就给更换了一个空调机(这速度已经特别快了), 结果我机器至少被热死了100台以上,机器是HP的,机器过热,HP会自动关机,而且会不让你启动。你崩溃不?注:不是给hp做广告哈。 三,服务器上架 好了,要是你买的服务器到了,你会发觉你接到电话后,楼下一个N大的“擎

15、天柱”集装箱车给你送服务器来(某次我收2000台服务器就是这样的阵势);在这里有个重大的提示,你们财务给厂商下单的时候,收货地址肯定要写对。比如 XX路XX号XX大厦XX楼XX室,你写到xx号,送快递的会给你堆到院子里,你写到xx楼,送快递的会给你送到电梯口,你写到xx室,他们才会给你搬到室内。因为送货的都是服务器厂商找的,你因为这个事情去联系厂商修改送货地址,至少要多等N小时。而且他们视你的单子的数量和楼层,推断来多少搬运人员。而且,肯定要把服务器搬到你指定的地方再签字收货,否则嘿嘿 我最霉气的是:来了20台机器(还好不多),下着大雨人家给我往院子里一丢,让我自己搬上19楼,我没推车没啥的

16、你可以说,找电信的帮忙撒,废话,这个我还不知道。那我告知你,我在某电信大楼工作时,从CCIE到机房主管到机房工作人员,全部是美女 虽然我在这个地方只干了5天活,我的同事们口水都有3尺长你还叫人家给你搬机器不? 你可以说,雇民工撒,我又不是没雇过,钱得你自己支付,公司不给你报销的话,爽不? 下面是拆箱子,面对着积累如山的2000台服务器,我是连抬手的力气都拿不出来当时机房只有我们公司3个人电信值班2个人 这时候,我的方法是我打电话找来了2队收废品的: 这么多箱子,除了机器和电源线留下,里头的导轨光盘等等你全部拿走,谁拆的多谁拿的多 最终根据我的要求帮忙搬到机柜上于是我们5个人是监工看人家拆箱子搬

17、机器。 于是人家2队人找来了30多号人,一早上把2000台机器全部拆箱子完毕放到机柜上。 要是我们几个人拆,估计 最终再说个行价,服务器箱子一个价值5块钱甚至更多。你服务器到了,卖卖箱子请大家吃饭吧。别让扫地的阿姨拿走,几个无所谓,10来个箱子,够大伙儿吃顿烤肉了还有EMC的木箱子拿去养个小鸡小鸭的 42U机柜1U的服务器最好是16台。你就看着上吧。呵呵 四,安装系统和布线 好了,面对几千台服务器起先装系统,我不知道你会怎么想 全部是1U服务器有什么方法安装系统?(我们公司穷,买不起刀片;而且电信不协作,要是上刀片,电路你们自己拉线,价钱还是原来的价钱;最重要的我们公司以人为本,宁愿多养个人也

18、不情愿买个好服务器让人失业),而且不允许GHOST,因为你这是服务器,不是网吧GHOST出来的系统,我不知道谁用过,爽不。我自己是郁闷郁闷到了,莫名问题的时候,你就知道GHOST还是靠不住的。 其次,我们公司平安部要求:必需得一台一台安装,先安装光板的系统(比如没有SP的WIn2000),然后手工打SP4补丁,不能网络打补丁。于是我们就光盘堆成山。最扯淡的,为了快,我做了一个补丁共享的服务器,全部的补丁CP的本地来打。结果遗忘拔网线,导致人家说我们是插了网线打补丁,有中毒的危急,须要重装。我干脆崩溃 方法1,你可以1台1台渐渐装,反正这么多机器,你可以管公司要更多的时间。但是我们公司一般是机器

19、到了,最多23天就要要,一向是那种安排不如改变快的没有安排没有进度管理的“小”公司,项目组拿着鸡毛当令箭,牛x哄哄的公司。郁闷! 这个时候前期的打算就比较重要了(我公司多用windows2003),因为首先我要装一个光系统,再打驱动,再打补丁,再安装远程限制软件。一台机器装完大约要1小时多点。那么机器多了怎么办?光盘不够怎么办?等等问题就来了。 我的方法是,我一看TMD全部是DVD,IBM的机器干脆佩combo,公司给我们发的全部是CD,娘的,典型的没有最慢只有更慢,出了问题闲你慢的领导班子。于是只好自己出钱买了DVD,用软件把RAID,网卡,显卡其他驱动做到光盘里,须要安装的软件也干脆做成自

20、动安装的方式,补丁也刻录到光盘里(我们要求补丁必需单打,不能安装集成补丁的ISO,shit),这样弄,你只用把光盘往光驱里一丢,分区一分,就可以下一台机器了。然后等你在去关注这个机器的时候,已经可以设置IP插网线了。灵感来自番茄花园。吼吼。 当然这时候你最好是买个KVM,16口的KVM,一次打算16张光盘就可以用一套键盘鼠标操作16台机器。当然啦,KVM是可以级联的,我最牛一次一次一套键盘安装166台机器。郁闷的是,塞光盘塞死,插KVM线插死,配置IP配死,有时候还会弄错 方法2,你可以用NETKVM去远程安装,但是你插那些NETKVM的线路,2000个插下来,爽不?然后你接着扎KVM和网线的

21、时候,看着和瀑布一样的网线和KVM线交织在一起。估计干脆崩溃。远程KVM有的牛x的是可以分发ISO的,就是传闻中的远程分发安装。可以自己买一个探讨探讨了,我们公司以人为本,从来不买这类高科技。 方法3,我犯贱时候独创的:我们的机器全部是RAID1,于是我安装一台raid1的机器,系统全部安装好,然后拔掉一个硬盘,插上一个新硬盘自动复原镜像,基本10来分钟复原好一个硬盘,插到机器上去。这样,还是比装系统来的快。当然啦,型号是一模一样的 方法4,HP的ILO2功能,实现远程分发。前提你得一台一台配置好BIOS里的ILO2。也是蛮苦痛的。IBM和DELL现在也都有这个功能,但是你在分发以前,还是得一

22、台一台机器插上网线,配置好BIOS的IP,苦痛。然后把操作系统和机器的驱动程序和后续的软件全部做到一张DVD里,让他自动运行。然后全部的服务器远程运营这一个ISO,最好多弄几台,否则一台机器弄的慢死。 方法5,肯定最简洁的方法!就是买机器前,让厂家给你在硬盘里灌好系统,和你买笔记本一样,打开是个安装完成须要你输入序列号的系统。但是弱点是后续的软件须要自己装。因为服务器厂商是不会帮你安装别的软件的。 还有更多的方法,只是短暂没想到,大家也可以谈论自己的方法。相互沟通嘛。(51CTO编辑注:其实现在已经有许多无人值守安装系统的管理软件,比如KickStart和现在流行的Cobbler,都是不错的批

23、量安装工具,而且都是开源的。现在都追求自动化,希望越来越多的运维们将不必面对一台一台装机的困扰) 所以我喜爱linux,可以用N种方法安装系统。 windows就是个让IT人当装机男,挨踢人当民工。 好了系统装好了,电源线和网线连接完,和瀑布一样的。这时候还是尽量把他扎一下吧。 否则机器通风不畅,会导致热死。 简洁方法就是电源线扎一边,网线扎一边。有钱的公司可以买个网线序号标,没钱就自己拿胶布标。 你可以随意扎,或者和给你老婆梳头一样,好好扎。哈哈 插交换机的时候,从上往下,从124往后,这样网络异样,数一下就知道了。 想来想去这里也没啥值得关注的地方。所以就几行带过。 五,资产统计 假如你的

24、机器只有2000台反而好简单管理了,但是现在我要管理的全国IDC有31个,平均每个机房有不同品牌服务器1500台。 一共大约有45000台的样子(我的资产管理系统里的数字,不包含交换机,防火墙等) 这时候怎么办? 每季度和财务小MM一起出去旅游盘点IDC资产,华蜜啊(我们财务小mm很PL的哦) 到了机房就是我一个人干活点资产,小mm带着大口罩,披着双层的放辐射服 可怜我们这些干活的,短裤背心,IDC里一呆就是好几个月(IDC办公室就在机房边上),不知道精子被辐射杀死多少 1,必需有资产管理系统,虽然这个其实是个很简洁的数据库,但是你可以把每一台机器的品牌,硬件信息,操作系统信息,购买年限,质保

25、年限等,你特别关注的东西做一个具体记录,并配发同一的资产编号。 比如我们的资产号,FWQ-123456 服务器123456,这是一个总的资产号,这个服务器哪怕搬到美国,也是这1个资产,直到丢失,或者抛弃,都是这一个资产,恒久不会变。 比如我现在的凳子就是一个资产号是:服务器000010的一个4U服务器,配置是P2 300*2 256M内存 16G硬盘4 购买时间是1999年10月,从中修理过1次,升级过1次,在哈尔滨机房广州机房河南机房北京网通机房上海公司内部测试机房上海库房服役过。 有历史吧.2,送到机房 看过我这个服务器去过的地方,艳羡不?见证我们公司的发展史。9年过去了,最终成了我的凳子

26、 服务器在购买合同确定以后,就应当根据配置记录资产,并且在财务备案,资产编号肯定和财务记录相同。这样这个服务器走到哪里,都有备案和记录。现在要把这个服务器送到某个机房去,搬着走吧汗 送到机房,我们要给服务器根据财务给的表格粘贴资产编号,选个顺眼的地方,不会磨损的地方。 一般是机器正面某个地方,然后是机器屁股后面某个地方,然后机器侧面把手的地方,粘贴3个,以防掉了就烦了。 然后在粘贴这个机器的应用资产号和IP标签: 应用资产号举例:FWQ-SH-XX-B31-WEBSERVER 意思是:服务器上海xx机房B列31号机柜-web服务器 IP标签举例:外123.234.123.234内10.0.0.

27、1。这2个标签你可以分开也可以在一张标签上写清晰。 并且在安装服务器的时候。把FWQ-SH-XX-B31-WEBSERVER-123-234 把这个作为你的HOSTS信息,windows里叫做计算机名 这样远程上来都特别清楚自己在哪个服务器上,出问题时候也特别简单找到这个机器,不要闲麻烦,一切的麻烦都是为了以后快速的解决down机问题而做的。 当然啦,甚至在密码管理上你也可以用这个规则来设置密码,但是最好规则别让别人知道了 3,把这些信息全部录入你的资产管理系统 系统无非服务器名,IP信息,用途,机架位置,或者是否在运用一类的,我就不多讲了 4,资产系统软件交互,也可以说是监控系统。 企业可以

28、开发一个软件,在装机的时候安装到服务器上。然后资产管理系统定时去取服务器上的信息,比如网络流量,CPU内存硬盘负载一类的东西,这样你的资产管理系统又变成了一个监控系统; 当然啦,你也可以在资产系统里集成一个远程桌面管理系统,自动载入用户名和密码,还有随机码,就可以登录系统。省的还得管理服务器密码。 然后用户的访问权限不同,看到的节面权限就不同。 比如说,监控人员没有登录权限,或者IDC人员没有登录权限一类。权限安排你自己探讨好了。 5,还是IDC的工作。 话题接着回到我和财务小mm去盘点(你公司比较大的话,你可以多派几个人分开去各个地方) 小mm一看我们机房服务器黑压压的一片,遮天蔽日的,干脆

29、无语。为啥,因为要拿着资产表一个一个核对,面对几千个机器,干脆晕倒。 虽然根据资产管理系统里导出的信息,机柜号,IP号,机器从上到下的依次都特别精确,但是你一个一个核对,还是慢。 怎么办? 库房管理的工作用上了,哈哈。你买服务器或者买笔记本电脑的时候有没有留意到箱子上的条码? 那个条码特别清晰的记录了这个机器的具体信息。所以黑莓手机或者NOKIA手机(别的我没用过)都有扫描条码的功能似乎与主题无关 那么剩下的就简洁了。 去买个这种条码标签的打印机,编辑成自己须要的条码,一个一个贴好,上面有你全部须要盘点的信息 比如我们是从资产到机柜号到服务器名字到内外网IP都要盘点小崩溃 打印出来贴上去。然后

30、买个扫描枪,和超市那种一样,不过你要买有存储功能的,否则你要端着笔记本去扫描,SB了。 然后我和财务mm原来须要一个人念号码一个人核对(你要直到在机房里大喊资产号,喊一天的结果是啥,自己想),现在一个人拿一个扫描枪,根据规则一个一个扫描。完成后把数据导出后重新整理分析。干脆和数据库核对(当然这个也须要你自己开发),核对完成生成一张表。 表上写的特别清晰你哪个机架没有哪个机器,哪个机器不在特定的位置上,哪个机器缺少等等 这样比如说,机器位置不对扣5块钱工资,机器IP不对扣2块钱工资,或者反正扣到最终这月不给发工资了,还得倒贴点哈哈哈 六,监控架构 监控架构其实每个地方都有自己的做法,我也知道我的

31、方法不是很先进,但是仍旧拿出来和大家一起探讨 首先谈谈监控软件,一说起这个常用的东西MRTG,cacti一类的就都可以用了。只要略微归类一下,流量展示看的还是很清晰的。 要是要监控服务一类的,那就只好启用大名鼎鼎的nagios,和一些牛x人基于这个做的一些别的商业软件。 或者就是自己做个脚本去定时探一下,不通了给你发邮件了啥的,你vim一下nagios的chack_xxx ,学习一下里头人家探测的方法,自己也能搞出来个啥东西,都还是很不错的了。 作为IDC工程师,我们所要关注的东西就是个流量了,我们要很清晰某台65下的某台35上每个口的应用,当遭遇攻击或者流量异样的时候,一眼就能知道是怎么回事

32、。我不信任你每天看着10M的流量,某天突然一下给你来个80M,你说这是正常事务吧。哪怕正常,你也找相关的人确认一下吧,一个100m口跑 80M,估计电信的人都来找你了。 每天看着这些流量图是很枯燥的事情,那么我们没事只能想方法让他自动报警给我们了,于是EMAIL报警,然后把他发送到一个有手机提示新邮件的邮箱,你手机就有了。MSN报警,还是不错的吧,手机报警一类的方法都是不错的。这样你你可以和我一样放心的去打网游了。 这里只谈阅历,不谈具体的技术,因为我一说我的系统架构地球人都知道我是哪个公司的了,虽然已经离职,但是咱也有个职业道德,感谢。 当然了,有些公司是有网络监控部门的。但是我就始终在想这

33、个问题,全部的数值都可以用短信报警,你随时都可以收到信息。用这个部门干啥,让一群可怜的家伙 8小时纹丝不动盯着屏幕,公司又在他们电脑上安装了抓屏软件,上班事务闲聊上网就扣钱我估计他们每天最期望的事情也莫过于服务器挂了,可以给我们打个电话重启个服务器或者连到服务器上检查一下啥问题,重启个服务了啥的。当然了,这些兄弟最终的职业方向也只能是进入运维部门了,至少公司服务器宕机维护的流程性东西驾驭的特别娴熟了。但是这是用好几年时间换来的阅历,太所以我是奉劝兄弟们有发觉监控部门聘请人,就别去了吧。面前8台显示器,猛一看还以为是黑客帝国呐,结果细致一看全tmd是流量图。常年对着8个显示器,那个辐射 我就不清

34、晰设置个节点,出现问题告知人,人去操作会死啊,非要让人和机器一样纹丝不动的盯着显示器,TMD,官僚。虽然我没经验过,但是想也能想到。做SA,最大的要点是懒,把一些须要人做的事情都自动化但是话说回来,我公司以人为本,人海战术嘛,可以理解。 上面的帖子位子已经满了,下来的帖子在这里写。 企业实际面对的一些问题 我也许通读了veyron 大侠的文章,认为系统架构方面的我肯定不如他。我就不在这里卖艺了,那么我卖企业都会实际面对的一些问题。 1,自动化,流程化你的信息管理 为什么要自动化,这年头流行办公自动化,你丫没事还拿着工单四处签字,老土了吧。 为什么要流程化,这念头流行流程管理,假如你公司没有一个

35、固定的流程管理,出了事情,大家都不知道怎么做,各个部门的电话乱打,大家都一锅粥没有效率。所以,有备无患,在没有出问题的时候,模拟出问题,多多打算,建立规范的流程,公司的每个人都要遵守,这样,流程化的管理+办公自动化,大家只用在电脑上翘翘键盘,点击确定,流程就发出去,一路审批,OK,流程发送到做事的人地方,或许这个做事的人在美国,也一样便利。 上面说的是一个原理和意思,用这样的理念去管理你的服务器应当如何去做?当然了,你假如只有10来台服务器,就不用考虑这个了.首先服务器选购录入资产管理系统(具体见上面有写),服务器的去向和调度都在管理系统里有提现。 这里说的是:如何去上架,修理,下架等流程限制

36、 先说上架下架:服务器到机房以后,别人要用服务器怎么办?先可以到你的资产管理系统里,看你机房还有什么配置的机器多少台,然后让他们选择自己项目服务器的配置,数量。在流程管理系统中,把这些机器选中,生成一个表单,表单名字为xx项目上架需求,写清晰谁用,做什么,数量,哪个机房等。然后提交给他们部门领导,他们部门领导同意后,转给须要审批的领导,一层层下来,流转到我们部门领导,我们部门领导流转给部门机房员工,员工收到流程,检查上架下架服务器;如要上架,安装完系统后填写IP,机器名,机架等相关信息。如要下架,删除相关信息,提交给流程限制的人员,流程限制人员确认后,这个流程完成。届时,全部的人审批过的数据,

37、经手人,数据库里都有,出现什么问题找相关责任人,一下就找到了,省的和某些XX部门JJYY。 修理也一样了,机器坏了,或者须要重装系统,根据上面的流程,一步步走一遍,就可以了。年底统计机房一天要干多少活,省的某些领导认为机房人TMD都在闲着。机房的人呢?没有流程不干活,否则白干。 在流程系统里重启服务器,重启服务器要是要流程,就太慢了,那么你可以做一个绿色通道,写清晰缘由,重启哪个机器,干脆提交给相关机房人员,在你的流程系统里绑定一个短信网关,机房人员可以收到须要重启服务器的短信。精确无误。 这样代替了无纸化办公,既有自己做的事情的每一个记录,又有相关人员管理,可以量化自己的工作,免得年终奖的时

38、候xx人有说你干的少,发的少。你把记录拉出来对比对比就知道谁多谁少了。 2,如何升级你的服务器 服务器老了,或者须要加内存加硬盘,怎么升级。 虽然说是很简洁换个CPU,加个内存,加个硬盘很简洁。 但是,如何限制你的配件不丢失,确定的安装到机器上利用了呢? 简洁,在服务器上做一个探测服务器配置的客户端,每天探测一次硬件配置发送到资产管理服务器上。 与资产管理系统的硬件配置做对比,出了问题就报错发一封邮件到机房工作人员,抄送流程限制人员一封就可以了。 至于的加内存的时候留意型号啥的问题就不说了,大家应当都没问题了 要说的是,假如你一个机柜上放的机器比较多,比如4个6个机器一摞,恰巧坏了,恰巧一个人

39、在机房,非得解决,怎么办? 简洁,一个方法,但是还是须要你有力气,虽然有力学原理 比如有4台服务器,最下面的坏了, 你可以拽住最下面的把4台一起往出拉,拉出来一点,把上面3台往后推,这样一点一点的拉出来, 下面最关键: 拉到最终,前面要留出来一点,轻轻的把上面3台的尾巴着地,然后一只手抬住上面3台机器,一只手拉出下面一台机器。 上面3台肯定要留出来一点,否则放下的时候,机器和机柜托板会压住你的手,你一松手,机器震一下,硬盘就挂了 所以在推动去的最终照旧要留一点在外面,最终放下来了再推动去这最终一点。 然后就可以换或者加内存了。相对比较省劲,不危急,不会压倒自己,不会砸坏服务器的方法就是这样了。 漫谈运维运维工程师 系统运维工程师 运维工程师工作规范 运维工程师实习报告 运维工程师转正申请 linux运维工程师简历 运维工程师张戌 运维工程师岗位报告 运维工程师面试题 岗位描述_网站运维工程师 本文来源:网络收集与整理,如有侵权,请联系作者删除,谢谢!第28页 共28页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页第 28 页 共 28 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 策划方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com