AIX高级系统管理培训手册.pptx

上传人:莉*** 文档编号:87118078 上传时间:2023-04-16 格式:PPTX 页数:141 大小:3.11MB
返回 下载 相关 举报
AIX高级系统管理培训手册.pptx_第1页
第1页 / 共141页
AIX高级系统管理培训手册.pptx_第2页
第2页 / 共141页
点击查看更多>>
资源描述

《AIX高级系统管理培训手册.pptx》由会员分享,可在线阅读,更多相关《AIX高级系统管理培训手册.pptx(141页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、IBM Systems&Technology Group 2006 IBM Corporation第四章第四章磁盘管理磁盘管理第1页/共141页2学会描述LVM的信息解决ODM库的问题如何建立镜像可以解释quorum机制能够描述物理硬盘的状态第2页/共141页3LVM概念概念第3页/共141页4Mirror 概念概念第4页/共141页5Stripe的概念的概念第5页/共141页6Raid级别的介绍级别的介绍常用的raid级别0,1,5,10的区别不同的raid的不同的优势了解系统级raid0和raid1的概念介绍硬件级别的raid产品(fastT,ssa)第6页/共141页7基本的逻辑卷管理基

2、本的逻辑卷管理了解什么是LVM管理如何创建卷组如何识别pv如何使用pv如何创建lv如何创建文件系统Lv和fs的关系如何管理lv和fs第7页/共141页8概念概念Vgda(卷组描述区)Vgsa(由镜像产生)LVCB(逻辑卷控制块)AIX文件第8页/共141页9VGDA第9页/共141页10如何查看如何查看VGDA第10页/共141页11如何查看如何查看LVCB第11页/共141页12ODMandVGDA第12页/共141页13PV在在ODM中的信息中的信息第13页/共141页14续续第14页/共141页15续续第15页/共141页16与与VG相关的相关的ODM库库第16页/共141页17续续第1

3、7页/共141页18与与LV相关的相关的ODM第18页/共141页19ODM相关的相关的LV的错误的错误第19页/共141页20解决问题解决问题第20页/共141页21Rootvg的的ODM错误错误第21页/共141页22下面介绍下面介绍mirror第22页/共141页23系统级的镜像系统级的镜像Rootvg镜像镜像的方法镜像以后的工作如何完成一个完整的rootvg镜像第23页/共141页24非非rootvg的镜像的镜像概念Mklvcopy镜像的方法如何查询镜像的结果第24页/共141页25镜像中的问题镜像中的问题第25页/共141页26如何创建如何创建mirrorLV第26页/共141页27

4、VGDA的数量的数量第27页/共141页28Quorum的概念的概念第28页/共141页29如何理解一个没有如何理解一个没有quorum的卷组的卷组Quorum的用途Mirror不需要quorum(默认)第29页/共141页30如何如何varyonvg不正常的不正常的VG第30页/共141页31Mirror的联系的联系练习做rootvg的mirror练习做lv的copy联系作mklvcopy第31页/共141页32第四章磁盘管理第四章磁盘管理在任何情况下替换磁盘Vg fail的解决如何纠正不一致的错误导入导出卷组第32页/共141页33磁盘替代的过程磁盘替代的过程第33页/共141页34情况一

5、(情况一(disk mirror)第34页/共141页35在线应用的磁盘在线应用的磁盘第35页/共141页36特别对于特别对于rootvg第36页/共141页37磁盘彻底损坏磁盘彻底损坏第37页/共141页38续续第38页/共141页39非非rootvg磁盘的彻底损坏磁盘的彻底损坏第39页/共141页40磁盘删除问题磁盘删除问题第40页/共141页41解决方案解决方案第41页/共141页42Exportvg和和importvg第42页/共141页43importvg第43页/共141页44Importvg问题问题第44页/共141页45文件系统冲突文件系统冲突第45页/共141页46如何同时如

6、何同时mount两个同名两个同名fs第46页/共141页47续续Importvg之前没有使用exportvg解决方法第47页/共141页48第48页/共141页49第49页/共141页IBM Systems&Technology Group 2006 IBM Corporation第五章第五章备份恢复备份恢复第50页/共141页51VG的保存和恢复的保存和恢复创建,鉴别,恢复mksysb利用mksysb创建clone如何减小文件系统和逻辑卷替换磁盘安装备份,恢复非rootvg如何进行jfs的在线备份第51页/共141页52mksysb第52页/共141页53磁带中的内容磁带中的内容第53页/共

7、141页54验证系统备份验证系统备份验证系统备份的方法第54页/共141页55Mksysb的控制文件的控制文件第55页/共141页56磁带安装的恢复磁带安装的恢复第56页/共141页57续续第57页/共141页58用用mksysb克隆系统克隆系统第58页/共141页59恢复时修改恢复时修改pp第59页/共141页60恢复系统并减小文件系统恢复系统并减小文件系统第60页/共141页61硬盘克隆硬盘克隆第61页/共141页62第一种方法第一种方法第62页/共141页63通过通过smit完成完成第63页/共141页64磁盘的克隆磁盘的克隆第64页/共141页65通过通过smit进行进行第65页/共1

8、41页66删除删除第66页/共141页67如何备份非如何备份非rootvg第67页/共141页68Vgname.data第68页/共141页69Savevg的恢复的恢复第69页/共141页70在线的在线的fs备份备份第70页/共141页71分开这个分开这个mirror第71页/共141页72重新整合这个重新整合这个fs第72页/共141页73linux和和unix下常用解压和压缩命令:下常用解压和压缩命令:-.tar解包:tar xvf FileName.tar打包:tar cvf FileName.tar DirName(注:tar是打包,不是压缩!)-.gz解压1:gunzip FileN

9、ame.gz解压2:gzip-d FileName.gz压缩:gzip FileName.tar.gz解压:tar zxvf FileName.tar.gz压缩:tar zcvf FileName.tar.gz DirName第73页/共141页74linux和和unix下常用解压和压缩命令:下常用解压和压缩命令:.Z解压:uncompress FileName.Z压缩:compress FileName.tar.Z解压:tar Zxvf FileName.tar.Z压缩:tar Zcvf FileName.tar.Z DirName-.tgz解压:tar zxvf FileName.tgz解

10、压:tar zxvf FileName.tar.tgz压缩:tar zcvf FileName.tar.tgz FileName-.zip解压:unzip FileName.zip压缩:zip FileName.zip DirName第74页/共141页IBM Systems&Technology Group 2006 IBM Corporation第六章第六章系统系统DUMPDUMP第75页/共141页76本章目的本章目的了解在系统dump时保存的数据确认和改变主dump设备和第二dump设备创建系统的dump第76页/共141页77系统系统DUMP概述概述当发生一个意外的系统中断或系统故障

11、就会创建一个系统DUMPDUMP是指把系统物理内存中部分或全部内容复制到指定的设备,即把内核所使用的内存区域的数据保存。系统崩溃或手工执行,对操作系统状态的快照0c0:DUMP成功第77页/共141页78smitty dumpsysdumpdev lsysdumpdev esysdumpdev P p|-s lvnamesydumpdev L显示统计信息snap第78页/共141页79产生产生dump的途径的途径Copies kernel data structure to a dump deviceVia keyboard initiationVia reset buttonAt unexp

12、ected system haltVia smitVia comandClassial RS/6000 only第79页/共141页80Dump 里的内容里的内容不包含PAGED MEMORY的内容包含系统的变量和状态进程表当前运行的进程和其相关信息用户区当前用户运行的进程和其相关的详细信息文件描述表(FDT)虚拟文件系统的信息当前mounted的文件系统Inode tableopen file table第80页/共141页81Dump 里的内容里的内容(续续)内核堆栈系统Buffer终端信息MbufsThese are the memory buffers for data which h

13、ave been sent/received across a networkSocketsTimers第81页/共141页82命令命令sysdumpdev列出当前的dump设备及状态#sysdumpdev-lprimary /dev/hd6secondary /dev/sysdumpnullcopy directory /var/adm/rasforced copy flag TRUEalways allow dump FALSE第82页/共141页83命令命令sysdumpdev(续续)设置dump设备#sysdumpdev-P-p|-s device参数P代表永久的改变,参数p代表主du

14、mp设备查看当前系统的dump大小#sysdumpdev-e0453-041 Estimated dump size in bytes:31631360显示出以前dump的信息#sysdumpdev-L第83页/共141页84Methods of Starting a Dump第84页/共141页85通过通过smit产生产生dump#smit dump第85页/共141页86拷贝系统的拷贝系统的Dump第86页/共141页87发送发送dump到到IBM系统支持中心系统支持中心拷贝dump到磁带上#/usr/sbin/snap-gfkD-o/dev/rmtxdump磁带的标记PMR(Proble

15、m Management Record)号创建磁带的命令块大小IBM通过crash命令处理dump磁带第87页/共141页IBM Systems&Technology Group 2006 IBM Corporation第七章第七章错误分析和诊错误分析和诊断断第88页/共141页89本章目的本章目的了解AIX错误报告工具的组成部分解释错误报告监测和维护错误日志第89页/共141页90错误日志和系统日志错误日志和系统日志能够分析错误日志能够鉴别和维护产生的错误用syslogd纪录系统消息第90页/共141页91错误日志的目的错误日志的目的在监测到硬件、软件和操作错误时记录相应的信息用户其他的相关

16、信息被记录下来报告通过记录产生用户能够客户化错误信息当发生某些特定的错误时,系统发出指定信息可以查询到建议操作第91页/共141页92Errorlog过程过程第92页/共141页93syslogd配置文件:/etc/syslog.conf选择器:功能名,功能名.优先级;处理方法:接受信息目标位置(文件、用户、主机)循环:第93页/共141页94通过通过smit使用使用error log功能功能第94页/共141页95通过通过smit产生错误报告产生错误报告第95页/共141页96通过通过smit产生错误报告产生错误报告显示所有的错误报告#errpt打印错误报告的模板#errpt-t按时间产生报

17、告#errpt-a-s mmddhhmmyy只报告硬件错误#errpt-d-H描述ID为F49E2A17的错误报告#errpt-a-j F49E2A17第96页/共141页97报告实例报告实例#errpt 第97页/共141页98参数详解参数详解标识C:错误归类H:硬件S:软件O:系统信息已经记录U:不能确定标识T:错误类型PERM(并且C为H):显示系统遇到硬件问题并且无法自动修复PERD(并且C为H):系统硬件变为不可用并引起一系列错误系统PERM(并且C为S):显示系统遇到软件问题并且无法自动修复TEMP(并且C为S):显示系统遇到软件问题并且已经自动修复第98页/共141页99磁盘错误

18、类型磁盘错误类型DISK_ERR1(cd,disk or R/W optical operation failure)PERMfailure of physical volume mediaDISK_ERR2(cd,disk or R/W optical operation failure)PERMfailure in disk assembly(for example,poer loss)DISK_ERR3(cd,disk or R/W optical operation failure)PERMfailure was detected by the SCSI adapter第99页/共14

19、1页100磁盘错误类型磁盘错误类型(续)续)DISK_ERR4(cd,disk or R/W optical recovered error)TEMPerror caused by a bad block or event of a recovered errorDISK_ERR5(Undetermined Error)PERMSCSI device driver failure of unknown type第100页/共141页101磁盘错误的处理磁盘错误的处理诊断程序帮助确定问题的严重性可以格式化磁盘或进行磁盘片的检查磁盘片的检查检查在磁盘上的每一个块报告磁盘全面状况总结报告三种应该更换

20、磁盘的情况噪声很大(Noise)经常出错错误严重第101页/共141页102错误日志的清除(自动)错误日志的清除(自动)在root用户的cron表中,缺省有两个entry0 11*/usr/bin/errclear-d S,O 30每天清除一次,清除三十天以前的软件错误0 12*/usr/bin/errclear-d H 90 每天清除一次,清除九十天以前的硬件错误第102页/共141页103错误日志的清除错误日志的清除(手工)手工)root用户通过手工命令errclear直接清除错误日志#errclear 10清除10天以前的所有日志#errclear-d H 0清除所有硬件的错误#errc

21、lear-N disk 0删除所有资源组为disk的记录#errclear-T UNKN 0删除所有类型为unknown的记录#errclear 0删除所有记录第103页/共141页104在出错日志中加入信息在出错日志中加入信息#errlogger “(字符)”第104页/共141页105通过通过errdemon命令管理错误日志命令管理错误日志(壹)壹)显示error log的特性#/usr/lib/errdemon-lError Log Attributes-Log File /var/adm/ras/errlogLog Size 1048576 bytesMemory Buffer Siz

22、e 8192 bytes 第105页/共141页106通过通过errdemon命令管理错误日志(命令管理错误日志(贰贰)改变错误日志的存放文件#/usr/lib/errdemon-i filename改变文件的大小#/usr/lib/errdemon-s logsize改变内存缓冲区的大小#/usr/lib/errdemon-B buffersize第106页/共141页107出错处理命令软件包出错处理命令软件包bos.rte 包含errinstall,errupdate,errstop命令bos_sysmgt.serv_aid包含errmsg,errclear,errdead,errlogg

23、er,errmsg,errpt,sysdumpstart 命令第107页/共141页IBM Systems&Technology Group 2006 IBM Corporation第八章第八章性能监测和优性能监测和优化化第108页/共141页109本章目的本章目的通过AIX标准命令研究系统中CPU,内存和I/O瓶颈了解AIX相关的AIX命令使用PDT产生系统状况的报告使用perfpmr工具调整内核参数第109页/共141页110硬件资源和逻辑资源硬件资源和逻辑资源硬件资源硬件资源逻辑资源逻辑资源CPU时间片时间片内存内存页面桢页面桢堆栈堆栈缓存区缓存区队列队列表表磁盘空间磁盘空间逻辑卷逻辑卷

24、文件系统文件系统文件文件通信通信数据包数据包通道通道第110页/共141页111Performance Tools#nice#renice#ps#sar#vmstat#iostat#tprof#svmon#filemonPDT(Performance Diagnostic Tool)perfpmr(Performance Problem Management Report)第111页/共141页112CPUCPU瓶颈?瓶颈?瓶颈?瓶颈?内存瓶颈?内存瓶颈?内存瓶颈?内存瓶颈?I/OI/O瓶颈?瓶颈?瓶颈?瓶颈?网络瓶颈?网络瓶颈?网络瓶颈?网络瓶颈?vmstatvmstatpspslspsls

25、pssvmonsvmonvmstatvmstatsar sar nicenicepspsiostatiostatlslvlslvfilemonfilemonfileplacefileplaceMore testMore testnetstatnetstatnfsstatnfsstatnfsonfsononoifconfigifconfignetpmonnetpmonY YY YY YY YN NN NN NN N第112页/共141页113进程的生命周期图示进程的生命周期图示第113页/共141页114进程的生命周期说明进程的生命周期说明(一一)初始化(I)阶段Before a process

26、 is created,itneeds a slot in the process table;at this stage it is in the SNONE stateWhile a process is undergoing creation,waiting for resources to be allocated,it is in the SIDL state第114页/共141页115进程的生命周期说明进程的生命周期说明(二二)运行(A)阶段R:Ready to runS:等待I/O操作T:stop 与restart 中的暂停阶段Runing:运行阶段退出死亡(A)阶段When a

27、 process dies(exit)it becomes a zombie第115页/共141页116进程的优先级进程的优先级优先级由run-queue slot 确定最高的优先级为0,最低为127优先级分为两种:固定的:确定的内核进程通过setpri()设置为实时应用没有nice值不固定的:Run at initial priority level which subsequently changesCPU-intensive(running)processes not favoredI/O-intensive(sleeping)processes favored第116页/共141页11

28、7优先级的查看优先级的查看参数C:recent CPU usage value参数PRI:priority value优先级参数NI:nice value第117页/共141页118优先级的计算优先级的计算priority value=base value+nice value+(CPU penalty based on recent CPU usage)base value(the user-process-priority value):40在ksh下,默认的nice值:前台是20,后台是24CPU penalty=(recent CPU use value)*(r value/32)r

29、默认值为16第118页/共141页119nice行命令格式行命令格式#nice-i command 参数i(或者n):从默认的NI值中增加或减少相应的值。参数范围为-24到+19,缺省为10第119页/共141页120命令命令nice 示例示例#nice-10 sleep 100000&#nice-n-15 sleep 100000&#nice-n-10 sleep 100000&#nice-n-10 sleep 100000用ps-le|grep sleep命令输出如下:F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD200001 A

30、0 18112 2492 0 74 34 35fa 44 9ef72d8 pts/3 0:00 sleep200001 A 0 9666 2492 0 49 9 2bf5 44 9ef7658 pts/3 0:00 sleep200001 A 0 16068 2492 0 54 14 21f0 44 9ef7698 pts/3 0:00 sleep200001 A 0 10182 2492 0 50 10 fe7 44 9ef76d8 pts/3 0:00 sleep第120页/共141页121renice行命令格式行命令格式用来改变一个正在运行的进程NI值renice -p-u 第121页/

31、共141页122命令命令psps-efE选项:列出所有的用户进程l选项:列出优先级信息#ps aux查看所有进程占用CPU,内存,时间#ps-mo ThREADTID 参数:象PID一样是Thread-idBND 参数:使用数第122页/共141页123性能分析流程性能分析流程第123页/共141页124性能分析流程性能分析流程第124页/共141页125CPU 使用情况(一)使用情况(一)#sar 1 10 当%usr+%sys 80%时,CPU 紧张第125页/共141页126CPU 使用情况(二)使用情况(二)#sar-q 1 3系统队列活动情况runq-sz:average lengt

32、h of run queue%runocc:percentage of time run queue occupiedswpq-sz%swpocc:当runq-sz大于4时,CPU资源紧张第126页/共141页127sar a 3 5查看文件读/写情况iget/s:每秒调用I节点查找函数的次数lookuppn/s:每秒调用目录查找函数的次数dirblk/s:为一个文件调用目录查找函数的次数第127页/共141页128sar d块设备活动情况%busy 50%或 avwait avscrv则需要查看磁盘I/Osar c系统调用情况第128页/共141页129sar r 查看页面调度情况slots

33、:页面空间上空闲页数量cycle/s:每秒页面交换周期数fault/s:每秒页面错误个数odio/s:每秒非磁盘I/O页面调用数第129页/共141页130Paging 信息(一)信息(一)#vmstat 1 3当内存资源十分紧张时,将引起paging-stealing 和 paging-space activity,进而产生I/O 问题第130页/共141页131Paging 信息(二)信息(二)Kthrr:CPU运行的队列b:等待I/O的队列memory:avm:number of active virtual 4k pagesfre:size of the free list-the n

34、umber of free 4k frames of RAM第131页/共141页132Paging 信息(三)信息(三)pagere:pi/po:page-ins/page-outsusing the paging-spacefr/sr:pages freed/scanned by the page-straler,the program that free RAMcy:clock cycles used by page-replacement algorithm-very unlikely to be non-zero,as that would indicate frantic memo

35、ry cleansing behaviour!faultsin:设备中断次数sy:系统调用的次数cs:kernel thread context switches第132页/共141页133I/O 信息信息#iostat%tm_act is the percent of time the device was active over the periodKbps is the number of kilobytes per second transferred.tps is number of transfers per second第133页/共141页134确定确定CPU瓶颈瓶颈在确定了C

36、PU瓶颈之后,进一步确定程序使用CPU的情况在AIX中用tprof命令产生报告第134页/共141页135内存情况内存情况Pinned memory:不能被page-stealer的内存AIX内存中的三种类型:Persistent:This is used to hold pages read form filesystemsClient:For NFS data,and CD-ROM pages strangelyWorking:Here we hold the data and variables of a program第135页/共141页136查看内存整体的使用情况(一)查看内存整体

37、的使用情况(一)#svmon-G第136页/共141页137查看内存整体的使用情况(一)查看内存整体的使用情况(一)Memorysize:真正的内存大小inuse:使用的内存free:没使用的内存pin:pinned memory的 大小第137页/共141页138调整性能参数调整性能参数smitty chgsysAio(smitty etherchannel命令 调aio经验值范围1040,一般是数据库I/O接口速度)chpsvmo(vmtune)第138页/共141页139调整性能参数调整性能参数(2)lsattr El ent0tx_que_sizerx_que_size调整网络的工具:nochdev ifconfig第139页/共141页140调整性能参数调整性能参数(3)no ano o thewall设置mbuf为3MB:no o thewall=3072no o tcp_spendspace=16384no o tcp_recvspace=16384修改非永久,若需要则加入到/etc/文件第140页/共141页141感谢您的观看!第141页/共141页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com