资讯详情

转:AIX菜鸟成长日志

一、机器检查的基本知识

;X c2[!G7OFb0检查通常由制造商或代理商进行。B&XM7X%G;]0首先是检查机房的温度和湿度。当然,这些一般都没有问题。dCx;e5u x1J0参考值:温度(摄氏度℃)10℃-40℃g T [t HqqfJ3UV0湿度8%80%ITPUB个人空间\ ]5Y&F"f!f二是电源检测,只要不是新安装的,一般都没问题。ITPUB个人空间UH)upNH?*C)P3q(~参考值:零-地电压小于1V/|^ _$@2\? Y0-地电压200-240VmxTCw;YE T0补充:当然59系列的机器相间380V,相地240VITPUB个人空间_]G XO*ShcXM第三报错。,M d6ne%JOyZ/gq0主要检查硬件的永久性报错#errpt-dH|pg{i!k%OK6O0h F~I(i0永久性报错#errpt-dS|pg@si b _3n;k^f0还有系统又没又报警灯(如果不正常,在后面的帖子将会细讲)ITPUB个人空间'hM H Z,V U9I|第三:机器的序列号:#uname -MuITPUB个人空间 o+Qt{ Y.EJ.b(? ?"Y第四:操作系统版本:#oslevel -r      注:又时候不能使用是因为系统版本低的原因We.r{3uL5z T0第五:其他检测;v9~dA:Y0ITPUB个人空间 _Y(T+Fyq"}p?+e D执行sysdumpdev –l 检查dump是否设置为always allow sysdump'nWQ GxL+L*r0执行sysdumpdev –e检查当前dump大小应该为主dump设备的大小的80%以下^ a3E9N |6AGY0执行lsvg -l rootvg检查有否"stale"状态的逻辑卷%O){7~{/NX0执行lsps -s检查内存交换区占用情况g"b,k*kJ8q0执行df –k检查文件系统的分配状况,一般不要超过80%6nbDtxw0执行lsdev –Ccdisk检查硬盘状态为availableHhz1a*thQ0执行lsdev –Ccadapter检查PCI卡状态为availableITPUB个人空间`v&t.PR3ed!vU G执行lsdev –Cctape检查磁带机状态为availableITPUB个人空间#t7p.bA.s(r执行lsdev – Ccprocessor检查CPU状态为available,I[T KE6`0执行 lsattr –El sys0|grep autorestart  检查系统crash后是否自动重新启动 ITPUB个人空间Iy}(AT8d8X执行lsattr –El sys0|grep cpuguard检查CPU GUARD是否开启ITPUB个人空间%t;{ Y/H(GH\gQ1] I执行lsattr –El mem0检查内存状态正常size=goodsizeITPUB个人空间? r#~[)u{f8@执行 vmstat 2 (Yj wEMH6~ph0iostat,topas观察us,sy,pi,po,内存占用率,硬盘读写速度等检查是否有性能瓶颈U;uT&|1wI%W5tr0执行netstat –in和netstat –rn观察网络状态PR`nXkU%kJ0执行entstat –d enX检测网卡运行速率与交换机速率是否匹配(网卡速率由10M半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smitty route操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。)ITPUB个人空间p Z5ZEA执行ping命令检查网络连接状况ITPUB个人空间gWwas#B执行lsdev –C|grep aio 检查异步IO是否可用\#W$_,OHs?0X0执行lssrc –g cluster查看是否有三个进程均为active状态(这个主要看起了几个HA的进程了,有的时候是一个或两个)ITPUB个人空间)im jd"EE执行/usr/sbin/cluster/clstat –a查看cluster状态是否正常ITPUB个人空间&e*D7Ue rI @检查/etc/hosts, 确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ipITPUB个人空间0R ykss5s9?/X+o q执行4X ~u%c:j8_ @)~-i q0more /usr/es/adm/cluster.logITPUB个人空间_3rZ(v m^!b1Smore /usr/es/sbin/cluster/history/**@J)l-K-xhL0cat /tmp/hacmp.out+h0rc'O`8Tc-L q0检查这三个日志中是否有error或者fail.ITPUB个人空间-|i([lneV U jo检查7133面板上的指示灯,如果黄灯亮则需要诊断问题ITPUB个人空间'wycq&CC:qR_5gHOTspare 磁盘检测S$A(lT`]01、检查是否有raid保护 # smitty ssaraid---&gtList All Defined SSA RAID ArraysM[3vZA(^.G02、检查是否有Hot Spare # smitty ssaraid---&gtList Components in a Hot Spare Pool/h$ZRL}?C.r6I$z0 List All Defined SSA RAID Arrays查看7133à对于7133,执行Smitty ssaraid raid状态,正常应该为good状态。ITPUB个人空间i*e4Ld.cR%fChange/Show Use of an SSAà对于7133,执行Smitty ssaraid Physical Disk查看7133硬盘状态,正常应该为member或者spare状态ITPUB个人空间 g7],{J%Hy对于FastT,分别登录上两个controller (登陆方法后面详细讲解),查看是否有错误日志。GOX-hSc f)n0记录检查结果ru h0t!@p,~03X_ Z v*Q:n%J0基本就是这些命令吧,如果我有遗漏后面继续补充。&TE#Hz+aKR2~ _e\0ITPUB个人空间g:J w3jLf.g8b%Dh对了,如果是华为和的联合巡检就会多出几个项目:ITPUB个人空间 o4oP#j/} w6g6w8`}LX8?@r En0cpu (主频*数量)    #lsattr -El proc0!Cb.u[yF4M0内置磁盘个数:  #lsdev -Ccdisk     9np/V3B&L l/?0网卡信息:        #lsdev -CcadapterITPUB个人空间T7zJ#dd} S!u-------------------------------------------------------------------------------------------------------------

二、DS8300 硬盘更换 

当前状况:DS8300硬盘损坏[-nGH"?F9`E$}0:Wsu o}x5~ `0首先要在HMC上查看具体的报错信息,一般会有多个,先看最早的,因为一般可能几个错误报的都是同一个硬盘的错误。ITPUB个人空间N3a't*~XD在报错中我们可以看见报错的Location Code,上面一般都是U****-D*-P*-T* 还有笼子号ND^ d n4x ?0顺着这个号找到错误的硬盘,DS83003个机柜,里面有控制台和两台570的是主柜,一般编号是D0,顺着就是D1\D2J'iMK)p,yc$qe]d0每个笼子有16块硬盘,找到笼子以后按T后面的数字数就行了,这个是前话,因为这个时候你还不能把盘。ITPUB个人空间apNY:i6r3|Oy*I6?&vh5dU/[0现在你在报错信息上面右键 Repair,(后面的步骤必须看清楚系统提示)然后弹出一个确认,你next,它就会提示说要切断该硬盘的电源,然后的界面不要急着NEXT,应该这里提示你更换后NEXT,这个时候也会弹出一个系统的帮助文件EXg3eA}%O01Wni'y$l&MU0现在你就可以拔硬盘了,正确的方法就是将卡扣拉松后等待70秒,然后硬盘角度微向上将硬盘慢慢抽出,这样可以避免将盘底部的电路划伤,在弹出的HELP上有图示。vY#UO$GU0s?#BY [8H0然后插入新的硬盘,现在点NEXT,后面的基本就是漫长的等待了,大概2个小时左右会告诉你数据将会重建,如果有问题会CALL HOME等信息,关了走人就可以了,后面失败的几率很小了。zzfs$yi B0ITPUB个人空间k,E7h ^6[GV`|这个就是DS8300的换盘步骤,希望有错误请老鸟们提出,我好改正。

三、630机器升级微码

ITPUB个人空间NmRr9Z!hg,n)]O.X6kkITPUB个人空间h}!_?~L!GX^P这次是要将一台630微码升级到07045这个版本。ITPUB个人空间c5O,P"CX1h/b v&iV#L首先下载微码了,这个不用说了,到IBM的网站上一步一步找就可以了。%k tG#NF0下载完是一个70286C4F.BIN 的文件ITPUB个人空间bVT5]9I? f~+cITPUB个人空间,f.Kx}L,V]_|a然后在机器的  /tmp目录下新建 目录 /fwupdate  ,如果存在这个目录就一定要清空里面的内容,然后 把70286C4F.BIN 上传到这个目录。ITPUB个人空间_Fy/a~3?Hn)FaVM9^1T0Ftp的命令都会哈:7vU`'` ]m0ftpITPUB个人空间 eJ8R!IM2I/K.oopen ***.***.***.***r-y.bL3U+Py$^4H0user/passwordS$O9VM$n;S ?5{9Q0prompt          关回显ITPUB个人空间5t.j(rY(BH r-egbin                二进制*aH |4|#|c&ETz7T1{0lcd F:/ITPUB个人空间&M0SfhND1_#tcd /tmp/fwupdateITPUB个人空间9j1K L d x`R8p+emput 70286C4F.BINp i4AB#X jc0byeITPUB个人空间!mpkhz`0I-----------------------------------------------------------ITPUB个人空间3G`!Yz(H{Q&aF升级前需要注意几个问题:ITPUB个人空间 K)r;},[;X6K1.系统必须升级到5103版本以后9~4EW T#t3V b0e02.HMC的版本必须是3.12 或更高,我这里用KVM,所有不管这个事情ITPUB个人空间4o;}!y8t MITPUB个人空间3n$v!w4N~ m(M/E.\现在要确认客户已经停了所有业务,并且有除rootvg外其他的VG都没已经umount下去了。;U q#jI S&E'] x6T07t-mke:G#[0确认OK,如下:2]/z&okU#vl0#cd /tmp/fwupdateITPUB个人空间~/|8Q@G^Q;C#chmod +x 70286C4F.BIN           加上执行权限ITPUB个人空间YJsKW c8QN"D E3^|spoh_#k(u4Y,RY0#./70286C4F.BIN            解压缩ITPUB个人空间E?1i)G$P2Wpqn&_解压缩后会出来一个文件 3R070425.imgu^D2u{4N T ow0然后最好校验一下这个文件ITPUB个人空间e8~ O }-EG#sum 3R070425.img2|'Y7~3dRB/y0对比微码给出的校验值,这个最好还是要做,我们一个老大经常教导我们:警钟长鸣,事故为零j'm Hu|n9fx0这个的校验码好像是47728,详细的自己再查一下,以网站上的为准ITPUB个人空间2}[l:\]~ITPUB个人空间f1Q7q V;|#y"LmH校验没问题,现在就开始升微码Cr5g1@:bwoE+Yy0ITPUB个人空间7M {%L;ilL#cd /usr/lpp/diagnostics/bin4BG+Cq7wxXb/S0#./update_flash –f /tmp/fwupdate/3R070425.imgm7_(Uwb W^5[j0{6jUU5^2Op0这个两个命令下去,机器重新启动,要大概半个小时,启动后就是新的微码了。ITPUB个人空间'Hb@\*d[;b Q3jITPUB个人空间q(UY'q"Fc0nx启动后:;LdP'jr]0#lsmcode –cITPUB个人空间c IH4S![9WP/GR那么ITPUB个人空间L!v%R.ldqPlatform firmware level is 3R070425

四、DS4700更换硬盘

.P#KB1n#i d0首先谢谢各位的支持了。ITPUB个人空间YD/|2_&qX2} fY今天继续.......x!b-I&Z*ta0今天客户的一台DS4700一个硬盘挂了,拿到备件后就到现场了。ITPUB个人空间 A)vLK+~2WI9s$? }J Cq H} ?K?0先打开本本,然后找到那台出问题的DS4700,然后连到控制器A上。ITPUB个人空间#n/j^5xt0k R!F这里我细说一下,DS4700后面左面的是控制器A,右边的是控制器B6HL"z*I$I8VH0每个控制器有两个电口,右边的为1号,左边为2号。IP地址如下:&PD0A(vz~A,c|0Lu.P'f6q RT0控制器A--1 左口默认IP地址:  192.168.129 .101fKl;[ s:Np _/o0控制器A--1 右口默认IP地址:  192.168.128 .101#]4^6Xf pl4Ks(Z4] U0F#F/Y K*y0W yq dx m'A0控制器B--1 左口默认IP地址:  192.168.128 .1024MoQk/~0控制器B--1 右口默认IP地址:  192.168.129 .102ITPUB个人空间Wt7N1Q(Y(^6D5R-h2^0^3mPDt.Lz,NG1G0我连了控制器A的右口,然后配置IP地址为192.168.128 .102,掩码为255.255.255.0nW!Jmq0ITPUB个人空间q4r&N1l/ZQ*?YL;C#}先ping 192.168.128 .101 ,PING 的通的话打开Storage Manager ClientITPUB个人空间%X;?x/cL j可以直接让它自动检测,检测不到的话你输入192.168.128 .101就连上了ITPUB个人空间,QFh6cm ~ITPUB个人空间d;]4gSa|"et7y然后先点上面的听诊器图标,这里报了两个错误,一个是PowerSupply的,另一个是Disk FailedITPUB个人空间;K"P8b ^ {4l硬盘挂了是今天的主题,但是出了个电源的报错,先处理下)K/@+n&U1B:e0仔细看了一下说冗余电源没有连通什么什么的,仔细检查了下发现冗余电源的开关没打开,将开关按下,冗余电源点亮了,重新看出错,只剩下硬盘的。ITPUB个人空间1h l.R'Le LNyT a7n#Z:f)c2Il#Mx0这里多说一句,做任何操作最好严格的按照ServiceGuide一步一步来,不要急,尤其是搞硬盘这些,乱搞是会出问题的。$I gT b9q:fv7H0现在从SM里面先看看情况,明显的看到Slot 13上的硬盘已经是Failed的状态了,一个红色的叉,这个时候你千万要看清楚Hotspare盘是不是已经成功接管了,鼠标放到一个全灰底部有十字的盘上看看是不是写了已经是In Use状态,并且接管的是Slot13的盘,当这一切确认后,开始换盘。'A*[P \i5JV0ITPUB个人空间^8P@w@_&Ox-t:q先仔细确认坏盘的位置(有黄色警示灯的,这个拔错了就没法说你了)\d.E;Kl`0先把手在机架上随便摸摸,或者带上机架上的防静电手腕!E)~_;T'N:o[x(x0把卡扣拉松,等待70秒,然后把坏盘小心抽出,再等待70秒插入新盘,推紧,然后推上卡扣。H4GH.w%}'vfUny0ohn Z^g0这个过程中不要断开你的SM软件,这个时候你看SMSlot13上的那个盘上面会出现一个旋风的图案,那是盘开始Building了,等待大概2个小时左右,等这个盘的状态变成了和其他盘状态一样就可以了。这个时候Hotspare盘会恢复为空闲状态。8Mt)Jy#q;{0ITPUB个人空间x [2b+B}k~ iI整个过程就完了。

五、IBM SVC 的基本步骤

ITPUB个人空间}|0s%s ^ iSVC我还是先简单介绍一下吧,因为今天我也是第一次接触这个东西。f/M eXYM7tZw0"_,A{ L ]z.C1u&W0SVC通俗的理解可以认为是一个统一的容灾平台,就是可以把各个厂家的存储产品虚拟成IBM存储格式进行统一管理。SVC有一种Image mode运行模式,可以透明的加入SAN SVC的基本功能,当SVC被加入到一个现有的SAN 环境中时,不需要做数据迁移,SVC 把现有的磁盘配置原封不动的继承下来(这是SAN VCImage mode),这样对服务器上的应用是完全透明的。(_^:^I:j/UC\&e |8q0P+M~#i?4}0摘抄一段专业点的解释:ITPUB个人空间8|-v)J v|7u    – 高扩展性,可以多结点cluster结构并行扩展ITPUB个人空间DD+Ws9B    – 高开放性,支持所有主流的存储和主机ITPUB个人空间5]K/X)xx9K TxR    – 独立性,位于中间层,不占用主机的CPU和存储资源ITPUB个人空间J;L6E(or#@X [    – 高性能,IBM SVC目前具有业界第一的SPC-1性能,具有单独的处理器和CACHE帮助存储分担压力ITPUB个人空间L4U+z4gx2y    – 出色的功能,SVC具有统一的容灾和虚拟存储的功能等,是不同存储具有相同功能。ITPUB个人空间3Pp#~zN&d AR    – 集中管理,为用户提供统一的存储管理接口,不同存储平台可以统一管理ITPUB个人空间K(kZLo2XKuCl{ [0g5_7u0因为今天我的任务上架并调试OK,具体的配置慢慢来掌握吧。ITPUB个人空间K{'?V8Z3j现在客户这里是两套SVC,具体的组件有这些,一个X机的服务器,一套显示屏+鼠标键盘,两个UPS电池,两个SVC服务器。ITPUB个人空间)jGb'cA1W a&rt)RH!K k(y(p0^0上架没什么说的 ,我的方式就是,最下面是两个1UUPSUPS间空了一个U保证散热,然后装上管理的服务器和显示屏,最上面装两个SVC。对了,有一点就是UPS上架前需要把前面板拆下,然后把电源线接上,接的时候会蹦出火花,是正常的,我当时接的时候吓出一身冷汗 ,赶紧看ServiceGuide,上面说这是正常的,我才松了一口气。!Z4g_CxS`,BoR0rm$N7{yQ:Er3D`09eC"g6a@ {v0上架完了就比较重要了,这里有些讲究,SVC要最后上电!!!]qn$G:}hyS2HF0步骤如下:ITPUB个人空间;yJ*\E dy4`S1.先连接控制台服务器和显示屏还有鼠标键盘3?ZZ/N*o02.然后两个SVC与两个UPS分别用带的一个双头线连起来(每端一个视频接口一个电源接口)f$w&Zh&C9G03.将每个SVC的电口和控制台的电口接到一个交换机上!~2r o:t }n }$S04.分别将两台SVC13光纤口接入一台SAN交换机,另外的24口接入另一台SAN交换机。ITPUB个人空间:[.Cd1V\)q*ta$pITPUB个人空间/S G*ta^p p5W这样准备工作就基本完了,注意:你如果没做34步骤直接点SVC那么会提示出错的,后面再调很麻烦。Y/n5WN o @!{0F ^ V2qa@0{lx^3G0现在给UPS加电,理论上UPS加电后会充电3个小时才能起SVC,但是一般都是充好的,你点上个几分钟就看到绿灯正常了。Fxp SO0现在起控制台,控制台是装的Windows2003,一般不会有什么问题,直接就进系统了。ITPUB个人空间!}4ozi2`6W现在要起SVC了,确认上面34步骤已经完成。点亮SVC后,几分钟后如果正常就会在前面板上显示"Cluster"字样,这样整个安装就完成了。|/Z:m G }0,e)OH R;R(piJ0接下的就是添加节点和IP地址什么的了,都是在SVC的面板上完成,但是到现在为止我的工作就完成了,遗憾的是后面的安装没机会参加,也不太清楚了!ITPUB个人空间_K^j,Yy~7OoK$|6]#]0SVC目前的应用并不是很多,所有先写这些让大家了解一下,如果那位有更详细的安装经验,请共享吧!

六、DS4300控制器电池的更换

ITPUB个人空间 q$~QN9w|%W先对关注的朋友们说声抱歉,很久没更新了,年前前后实在太忙了,没有整块的时间来整理笔记,现在继续吧。I3F"w8h `X1bH!p,e0ITPUB个人空间_t%Nq!ypV下午是到一个客户现场更换一个Ds4300的控制器的电池,当然也叫FAStT600。这个是很简单的,但是我还是那句话,我写的是新手日记,让新手和我一起成长。ITPUB个人空间;C%{g+\?6}.HITPUB个人空间"GU1FeUsdk3ya我先说下概念的东西,一会FAStT600一会DS4300,也许很多新手会晕,其实这是同个型号的机器,DS4000系列原本叫FAStT系列,IBM2004年将其更名成DS4000系列。新的DS4200DS4700DS4800因为是在更名之后才推出市场的,因此没有所对应的FAStT型号。ITPUB个人空间2OfXT9m+\.d而旧的比如:ITPUB个人空间2Ex%UL9p5o*Z sFASt100——>DS4100ITPUB个人空间 p,c(q }1k,{z5Y6y;L:vFASt600——>DS4300ITPUB个人空间+V7O$Oj.Sl~J~qSFASt700——>DS4400ITPUB个人空间Nri.b vL/Z%b,kFASt900——>DS4500ITPUB个人空间3AF|cVc/~:h3MM`5C7E......H Ak?

标签: pi5c3257q集成电路

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台