Recovering from disaster para aldeas
ADMIN   15 Septiembre 2008
Lo primero, qué es un desastre ???.
Ahora las máquinas todas tienen protección, nos tendríamos que remontar una década hacia detrás para ver un AS/400 sin ningún tipo de protección.
Se supone que nuestras posibilidades de tener un desastre por anomalías en los discos son mínimas.
Antes de meternos en faena convenía aclarar este punto. Qué pasa si se rompe un disco ???. Lo primero, el sistema manda un peazo aviso a la cola del operador, el aviso se repite cada cierto tiempo, ademas, la luz de atención deberá indicarnos que hay una anomalía en nuestro sistema. Si a pesar de todo esto seguimos sin enterarnos que tenemos un disco roto, lo que es definitivo es poner el marcha el ESA, os pongo un enlace con un documento que publiqué hace tiempo.
Enlace con la entrada
Ya lo tenemos claro, hay que cambiar el disco lo antes posible. Pero que pasa si antes de cambiar disco se rompe otro ???,
Las posibilidades son pocas, pero "haberlas hailas".
En un sistema bien configurado se pueden romper un varios discos, tenemos el "Spare" ???, el disco puede ser parte de otro array. Pero vamos a ponernos en lo peor, es del mismo array y no tenemos spare:
Esto se podría considerar un desastre.
De los otros tipo de desastres ya no hablo, me refiero a los naturales, incendios, etc,etc.
Bueno, nos ha pillado el toro, lo hemos perdido todo. Ya le habíamos comentado a nuestro jefe que necesitábamos una solución de "Alta disponibilidad", pero, o no hemos sido capaces de convencerle o el presupuesto no lo permite o realmente no lo necesitamos, nuestra empresa se puede permitir el lujo de tener el sistema parado el tiempo necesario hasta que, utilizando nuestras copias y nuestros procedimiento de recuperación lo podamos tener de nuevo operativo.
"Salvas todo lo necesario para restaurar tu máquina después de un desastre ???".
Lo tienes claro ???, igual alguien podría responder que aquí lo importante son tus datos, vale, casi de acuerdo, o casi totalmente de acuerdo, la respuesta va a misa, faltaría más. Tus datos no tienen precio, pero claro, no voy a añadir una entrada en mi blog para llegar a esta conclusión, lo que quiero aclarar en esta entrada son algunas cosas que son básicas a la hora de una restauración desde un desastre y que mucha gente parece que se han olvidado de ellas.
El tener en cuenta estas cosas, lo que puede cambiar subtancialmente es el tiempo que tardemos en levantar el sistema.
Lo primero, sabes qué es un SAVSYS y cuando es "muy conveniente hacerlo" ???, parece un pregunta un poco gilipolla (con perdón) pero es frecuente pedirlo y más frecuente que no lo tengan.
Tener un SAVSYS "bueno" es un seguro de vida, no solamente te permite restaurar la QSYS incluyendo las PTF's, ademas tienes el microcódigo y el firmware con sus parches. Puedes tener un problema en tu máquina que requiera hacer un "Restore" del microcódigo, si lo haces desde un SAVSYS actualizado ganarás mucho tiempo ( para los que tengáis HMC, este documento tiene alguna variante).
Qué es un SAVSYS "bueno" ???, Siempre que instales PTF's, cambies la versión o release en tu sistema, pierde unos minutos y actualiza esa cinta que tienes etiquetada con "SAVSYS" si no quieres perder unas horas en el caso que tengas un lío.

Continuará ..............................................

SIDRA400
Entrada