Continuidad de Negocio, @Zynga y Computación en la nube

En una nueva y clara demostración de lo que significa la prestación de servicios en la computación en la nube (cloud computing), la empresa @Zynga nos demuestra la imperiosa necesidad que tenemos de hacer algunas preguntas adicionales al momento de decidir una inversión con un proveedor de servicios de computación en la nube.

Si bien @Zynga no vende servicios de TI, es una empresa de juegos sociales – y es realmente un caso de estudio por su fenomenal desarrollo -, al momento de realizar las inversiones necesarias para asegurar la continuidad del negocio frente a una falla de Tecnología y no afectar la prestación a los clientes, ¡parece que alguien se olvidó de considerarlo!

¿Por qué insisto con este tema?

Todos los grandes proveedores de Computación en la Nube; Amazon, Google, Microsoft 365, han sufrido en algún momento una falla de tecnología que significó pérdida de datos para sus clientes.

Algunos pueden decir que si se pierden mis mails en Gmail, por ejemplo, el impacto no es tan grande. Pensemos nuevamente, si mi empresa utiliza ese medio de comunicación para procesos de aprobación, ¿el impacto es mínimo?

Pero lo que más me asombró del caso de la empresa @Zynga, es la explicación oficial en el blog de @CityVille acerca de que ocurrió, voy a copiar el texto original en inglés;

Sorry for the Inconvenience! *UPDATE 2 * **** Update ***** 3/10/12 at 5 PM PST

The Neighbor Bar loading issues should now be resolved. Thanks for your patience! Los temas con la barra de carga de Vecinos ¿deberían? estar resueltos. Gracias por su paciencia

Update 2 **** 3/10/12 at 8 PM PST

please visit your City as we have credited you some rewards for the inconvenience. At this time we encourage you to start re-building. Please keep in mind the compensations awarded will make this process easier. Stay tuned for more helpful rewards to come.

Por favor visité su ciudad que le hemos acreditado ¡algunas! recompensas por el inconveniente. En este momento los alentamos a comenzar a re-construir ….

Check-in and Play! – Hotel Hank

Last night at approximately 9 pm PT, we experienced an outage in @CityVille that lasted through the evening. The game is up again and fully running, but unfortunately some recent player actions cannot be restored. – …. ¡Lamentablemente algunas acciones de los jugadores no pueden ser restauradas!

We apologize for the recent downtime that you recently encountered and the issues with your recent actions. Unfortunately, this will result in some inconsistencies since your last play session. … ¡Desgraciadamente, esto puede resultar en algunas inconsistencias desde su última sesión!

You will be receiving recently purchased City Cash and compensation for issues you have encountered very soon. – Recibirá muy pronto los City Cash (esto es plata que pagan los jugadores) y compensaciones ……

In the meantime we’d like to give you 10 Free Zoning Permits: http://zynga.tm/1J8 . Please stay tuned as there will be more compensation to come.

Note: Please be aware of inventory caps for this item before claiming.

Once again, we apologize for these inconveniences. Our team is investigating the root cause of this issue to help avoid this occurring again in the future.

We’d also like to remind you to take advantage of our St. Patrick’s Day Giveaway Contest too! Enter and you could win some of your favorite items for your City.

Thanks, Check-In and Play! -Hotel Hank”

Hay dos explicaciones en este escueto mensaje de @Zynga que merecen destacarse;

  1. Lamentablemente algunas acciones no pueden restaurarse.
    Para los que hace mucho tiempo que trabajamos con TI, esto se lee; No tenemos datos de respaldo actualizados como debería una empresa de servicios en línea y tiempo real, y si los tenemos no los podemos utilizar, por lo tanto he recuperado a la fecha que pude y si perdí algo en el camino, lo lamento después veo cómo te compenso y te pido por favor que reconstruyas lo que yo destruí.
  2. Recibirá muy pronto los citycash.
    Esto significa que las personas que han pagado con su tarjeta de crédito para recibir billetes llamados Citycash, al reponer el juego a un estado anterior han perdido todo ese dinero y en algún momento se lo repondremos o no, como ellos dicen ¡ten paciencia!
    Claramente esto nos habla de la irresponsabilidad de una empresa que le dice a sus clientes; Discúlpeme tuve un problema y no sé cuánta plata me pago, pero sea paciente si logro descubrirlo algún día lo compensaré.

Así como Blackberry, Google, Amazon, Microsoft 365, @Zynga no explica cuál fue el problema que tuvo y por qué no logro reponer su juego al estado que tenía antes de caerse.

Esta es una realidad de la computación en la nube que creo debemos tener muy presente cuando pensamos en trasladar nuestros servicios de TI a estas plataformas. Un poco de la explicación de lo ocurrido se puede encontrar en este tweet

Entonces algunas recomendaciones que seguramente impactarán el precio de los servicios que nos ofrecen;

  1. Simulación de funcionamiento del plan de continuidad de negocio.
    A diferencia de lo que estamos acostumbrados a realizar – pruebas planeadas con una frecuencia determinada – sorprende al proveedor con frecuencias al azar y que no tengan preparación alguna, será la única forma que no te engañen.
    Prueba de extremo a extremo, no solo la recuperación de los servicios del proveedor, también tus procesos.
  2. Cuando estés por firmar el contrato, establece claramente;
    1. El punto en el tiempo al que deben recuperarse los datos (Recovery Point Objective).
      Acordar cual es la perdida de datos soportada por mi organización ante un incidente del proveedor.
    2. El tiempo en el que deben recuperarse los servicios (Recovery Time Objective).
      Este tiempo es el que nos debe evitar las consecuencias no deseadas de un incidente como le pasó a @Zynga o @BlackBerry
    3. Pídele al proveedor de servicios su análisis de impactos y riesgos.
      Busca evidencias que el proveedor ha realizado el análisis de impacto y pide que te muestren las acciones de mitigación de riesgo, no te engañes cuando te hacen la recorrida por el magnífico centro de datos que tienen, pide las evidencias.
      Muchos centros de datos que operan en zonas propensas a terremotos, no lograron reaccionar hasta después de pasados 3 días del incidente.
    4. Acordar con el proveedor los tiempos de respuesta al incidente y en qué momento tendrán que declarar que hay que invocar el plan de recuperación.
      Recuerda que muchas veces los técnicos creen solucionar los problemas en minutos y, como en el caso de BlackBerry y muchos otros, ese tiempo son días.
      Creo que este es uno de los aspectos determinantes en muchos planes, no solo acordar el tiempo, sino quienes son las personas con responsabilidad y autoridad tanto en el proveedor como en tu organización de declarar la emergencia y disparar un plan de acción.

Como he escrito en la entrada @BlackBerry y la importancia de los planes de continuidad de negocio;

Si no hay un Plan de Continuidad de Negocios en tu organización, no esperes más, ¡llama a tu CEO ya! Explicale lo que le paso a @BlackBerry y @Zynga y que no quieres que pase en tu organización.

@BlackBerry, @Zynga y muchos otros están aprendiendo que pasado mañana puede ser tarde.

.

Anuncios

3 comentarios el “Continuidad de Negocio, @Zynga y Computación en la nube

  1. Pingback: Continuidad de Negocios – Amazon, Netflix y la computación en la nube « Gestión de Valor Inversiones IT

  2. Pingback: Zynga | TagHall

¿Qué opinan?

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s