Please, dont disturb ¡¡¡, I’m sleeping.
Martín Ortega Novella
22 Julio 2010

El otro día bromeaba con un cliente:
Te voy a apagar el ESA, no hay derecho que una pila me saque de la cama a las cuatro de la mañana.

Ni te se ocurra, para mi es una tranquilidad saber que cualquier problema grave que tenga mi máquina va a ser tratado por el gigante azul en tiempo real, puedo dormir más tranquilo.


Cualquier problema grave ???

Si se rompe la batería del cache de una controladora de discos se puede considerar un problema grave ???, please, no me joda.
Bueno, vamos por partes, lo primero, cuando un AS/400 llama quejandose que tiene líos la bateria del IOA de los discos, normalmente es un error de umbral, el técnico planifica con el cliente cuando se puede cambiar (algunas baterías se pueden cambiar en concurrente).

Pero que pinta esa batería ??? para qué vale ???.

Si pasamos del mensaje y dejamos que la batería se agote el sistema mandará un mensaje a la cola del operador pero con más mala leche, el mensaje se convierte en un “cagamento”. Si usas el comando WRKDSKSTS y presionas PF11, verás una cosa rara, el sistema está degradado.
Pero porqué cogno está degradado ???.

La respuesta es fácil, el cache de IOA (controladora de discos) no funciona.
En este caso los datos son grabados directamente en los discos, claro, los tiempos de respuesta aumentan. El cache es un elemento que se encarga de decir mentiras, lo que hace es engañar al procesador, le dice que la operación ya se ha realizado pero realmente lo que hace es guardarlo en memoria, por esa razón tiene que tener una batería que mantenga los datos en el caso de un fallo de alimentación.
El procedimiento de cambio de batería obliga al técnico a apagarla antes de remplazarla.
El motivo está claro, la forzamos a modo de fallo para asegurarnos que no queda ningún dato sin volcar a los discos. Bueno, yo tengo mi propia teoria sobre este tema, de cualquier forma me parece perfecto que sigamos los procedimientos (para eso están).

Qué pasa si nos equivocamos de location y apagamos una buena ???.

“La jodimos”. Antes el IPL la encendía, pero ahora vamos a tener que hacer como si la cambiamos (me da igual que sea en concurrente o apagando el sistema).

Cómo podemos saber el estado de las baterías ???.

Hay dos formas, la primera es para listos. Hay que arrancar las herramientas de servicio. No se si de memoria me acordaré pero es algo así, “arrancar una herramienta de servicio”, “trabajar con hierros”, “Trabajar con recursos de …........ que requieren batería”, nos aparecen los nombres de recursos de todas las controladoras de discos, 5 “visualizar”, etc, etc, etc.
La otra es usando este programa, CALL QSYS/QSMBTTCC, te genera un listado con la información del estado de todas las baterías.

Cómo podemos hacer para que un error de umbral no nos saque de la cama ???.

Please, dont disturb ¡¡¡, I'm sleeping.


Eso tiene su parte mala, hay clientes que por razones “raras” no miran para la cola del operador, aunque parezca raro podría poner un montón de ejemplos que lo justifican.
No voy a entrar en esta guerra, quizás en otro momento, pero me parece fundamental que la gente tenga el ESA operativo aunque algunos suframos alguna llamada a altas horas de la madrugada por una triste pila (para eso nos pagan).
Desde luego, el ESA es configurable, podríamos quitarle que llame por este error, a gusto del consumidor, pero yo prefiero dejarlo como está.

Nota aclaratoria para Mauricio Herrera.

ESA, Electronic Service Agent.
En versiones anteriores este programa se llamaba Service Director, había que cargarlo como si fuera un programa producto, pero a partir de la versión 5.X (no me acuerdo del valor de la X) forma parte del sistema operativo.
Como puedes ver en el enlace que te pongo, si estás en 5.4 (que es tu caso) y tienes una acumulativa más o menos reciente, no deberías tener ningún problema en ponerlo operativo.


Quedará pendiente de aprobación
1
Mauricio Herrera
29/07/2010 0:55:52

Gracias Martín, ahora mismo veo el en lace y te cuento con salimos-

PD. No hay IBM como tal en El Salvador, pero tenemos a GMB que es una filial pero aveces no los entendemos te diré.

2
Martín
22/07/2010 17:58:05

Hola Mauricio, en un rato añado a esta misma entrada un texto esplicando como funciona el "ESA".

No se si en IBM El Salvador tenéis una estructura de soporte que permita usar esta herramienta, de cualquier forma, se puede configurar (o por lo menos en versiones anteriores se podía) para que lance un mensaje a otras colas (aparte de la QSYSOPR) alertando que tenemos un problema grave en el sistema. Imagínate que se rompe un disco y no se entera nadie, vaya problemón, dependiendo de como tengamos configurada nuestra máquina, si se rompe otro, nos podemos quedar tirados.

Lo dicho, ahora te pongo un texto de como configurar el ESA.

Un saludo

3
Mauricio Herrera
22/07/2010 17:31:36

Pues precisamente eso nos paso aquí. Nadie escucho nada, nadie vio la cola de mensajes y plup, una mañana perdida.

Como hacer para que no ocurra? Bueno mirando la cola del operador. Pero ninguno de los 200 programadores que tenemos tiene tiempo de ver eso. Ese programa que me cuentas fuera la leche pero no lo encuentro en el sistema. Es una herramienta especial?.

Estoy en la V5R4 con un 520...

Mucho te agradeceré el tip.

Saludos,


Autor SIDRA400

Mi nombre es Martín Ortega Novella, vivo en Asturias, casi toda mi vida laboral ha sido en IBM, pero ya estoy jubilado.
Siempre he utilizado Lotus Notes/Domino para mi blog, donde me he sentido más cómodo ha sido cuando estaba alojado en mi AS/400, ahora está en un iMac
Durante un año utilicé IBM WebSphere Portal Server, un gran producto pero volví a usar Lotus / Notes porque es lo que más gusta.
SIDRA400 es miembro del ESLUG (Spanish HCL Domino User Group).