Identificar un disco Failed en una NetApp

Estimados lectores,

En este nuevo artículo vamos a ver cómo identificar un disco Failed en una NetApp usando la línea de comandos. Cuando se produce un fallo de disco en una cabina de discos NetApp normalmente el disco averiado se ilumina de forma permanente así como el chasis de la controladora que lo posee (una alarma de sistema). De esta forma podemos detectar visualmente tanto la alarma del chasis que generalmente es un símbolo de exclamación ! como el disco averiado, ambos con luz naranja.

Cuando estamos a pocos metros del CPD o delante de la cabina está claro que podemos actuar de forma rápida mediante el procedimiento habitual: extraer el disco averiado, instalar el nuevo y asignarlo a la controladora. Ahora bien si estamos a kilómetros y necesitamos “tirar de manos remotas” entonces puede que nos venga bien identificar perfectamente de qué disco se trata y facilitar al máximo el trabajo de nuestros compañeros de manos remotas. Veamos, en primer lugar, un par de formas de ver qué disco (o discos) ha fallecido:

Controladora1> disk show -v
  DISK       OWNER                        POOL   SERIAL NUMBER         HOME                       CHKSUM
------------ -------------                -----  -------------         -------------              ------
0a.00.2      Controladora1(1890787246)    Pool0  6XR3E6VQ0000M238258K  Controladora1(1890787246)  Block
0b.00.0                                   FAILED 6XR3E6W80000M237QFP9                             Block
0a.00.8      Controladora1(1890787246)    Pool0  6XR3E5PZ0000B237BLJ5  Controladora1(1890787246)  Block
0a.00.10     Controladora1(1890787246)    Pool0  6XR3CF3P0000N3019S08  Controladora1(1890787246)  Block
0a.00.4      Controladora1(1890787246)    Pool0  6XR3CSJY0000B227933C  Controladora1(1890787246)  Block
0a.00.6      Controladora1(1890787246)    Pool0  6XR3D8BM0000N3025ET0  Controladora1(1890787246)  Block
0b.00.9      Controladora2(1890788300)    Pool0  6XR3CRLE0000N301CGLQ  Controladora2(1890788300)  Block
0b.00.11     Controladora2(1890788300)    Pool0  6XR3D84R0000N3022FZ2  Controladora2(1890788300)  Block
0b.00.1      Controladora2(1890788300)    Pool0  6XR3CF4W0000B239C519  Controladora2(1890788300)  Block
0b.00.7      Controladora2(1890788300)    Pool0  6XR3CR8M0000B229A190  Controladora2(1890788300)  Block
0b.00.5      Controladora2(1890788300)    Pool0  6XR3D8120000N3025FSD  Controladora2(1890788300)  Block
0b.00.3      Controladora2(1890788300)    Pool0  6XR3CSP60000M2268T03  Controladora2(1890788300)  Block

En el ejemplo tenemos un par HA que tiene el disco 0b.00.0 FAILED.

Controladora1> sysconfig -a
...
00.0 : NETAPP   X422_SCOMP600A10 NA00 560.0GB 520B/sect (Failed)
...

Este otro comando nos muestra mucha más información pero también nos dice que el disco 00.0 está Failed. Por tanto ya sabemos qué disco ha fallado pero antes un par de reflexiones:

1) ¿Se habrá iluminado el disco?

2) ¿Los compañeros de manos remotas lo identificarán correctamente?

Para estas dos preguntas NetApp nos ofrece dos respuestas en forma de comandos: uno para iluminar (led_on/off) y otro para parpadear (blink_on/off).

He pegado un par de vídeos para que veáis qué pasa al lanzar los comandos.

Iluminación fija

Controladora1> priv set diag
Controladora1*> led_on 0b.00.0

Iluminación parpadeante

Controladora1> priv set diag
Controladora1*> blink_on 0b.00.0
 
En el primero podemos ver cómo se han iluminado disco y chasis pero a veces, por la “naturaleza salvaje” de algunos CPDs, puede que esto no sea suficiente así que podemos usar el segundo método de identificación, el parpadeo. Me puedo imaginar a más de uno “oye, ¿parpadea el disco?”… “Sí, ¡ya lo veo!” … “¡Ok! Ya lo puedes cambiar”… La verdad es que nos aseguramos mejor y evitamos cambios erróneos pues no sería la primera vez que se cambia el disco de arriba, o el de abajo, …

¿Te ha gustado este artículo? ¡Suscríbete!

Identificar un disco Failed en una NetApp
5 (100%) 4 votos

Artículos Relacionados

  • Como forzar un fallo de disco en NetApp Estimados lectores, Hoy voy a escribir sobre como forzar un fallo de disco en NetApp, o mejor dicho un pre-fallo que es la operación que realmente hace la cabina. Aunque a priori suene un […]
  • Disk Bad Label Version Este error, en general poco frecuente, se puede dar cuando añadimos discos de reemplazo en nuestras controladoras NetApp. Con el paso del tiempo los discos se degradan y se tienen que […]
  • La importancia de los Raid Groups En esta nueva entrada destacaremos la importancia de los Raid Groups de las cabinas NetApp. Los que estéis acostumbrados a trabajar con estas cabinas ya sea en vuestras instalaciones o en […]
  • Directory reached the maxdirsize limit Estimados lectores, Aprovecho para desearos un feliz 2015 que espero sea un gran año para todos. En este primer artículo del año os voy a hablar de un error que me reportaron hace unos […]
  • Monitorizar estadísticas de una controladora NetApp con la instrucción stats Los sistemas operativos Data ONTAP implementan el comando stats mediante el cual podemos monitorizar estadísticas de una controladora NetApp listando un número elevado de valores […]
  • Problema al activar el adaptador iSCSI de un Host ESXi 5.5 Update 1 Estimados lectores, Recientemente he detectado un problema al activar el adaptador iSCSI de un Host ESXi 5.5 Update 1. Actualmente estoy desplegando un par de infraestructuras VMware […]
David Solé Pérez

Autor: David Solé Pérez

Services Director en ID Grup S.A. - Team Leading, Cloud Architect, Project Management, Solutions Architect, IT Consulting , Systems Integration & Deployment

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *