WhatsApp, Facebook e Instagram sufren una caída de más de seis horas en un momento crítico para su reputación
Jordi Pérez Colomé
El País
Facebook, Instagram y WhatsApp se recuperan lentamente de la peor caída total de su historia reciente, que afectó este lunes a sus servicios durante más de seis horas y de forma global. Al contrario que en otras ocasiones, esta vez las distintas aplicaciones y herramientas de la empresa estuvieron completamente inaccesibles para los aproximadamente 3.500 millones de personas ―aproximadamente la mitad de la población mundial― que las utilizan. Pasada la medianoche (hora peninsular española, las 17.30, hora de México) las tres plataformas empezaron a recuperarse de manera desigual. Unos minutos después, Andy Stone, responsable de la comunicación oficial de la empresa, confirmaba en Twitter que los servicios y aplicaciones de la compañía estaban volviendo a ser accesibles y pedía disculpas por lo sucedido. “Gracias por su paciencia”, concluía su mensaje.
“Queremos dejar claro en este momento que creemos que la causa principal de esta interrupción fue un cambio de configuración defectuoso. Tampoco tenemos evidencia de que los datos de los usuarios se hayan visto comprometidos como resultado de este tiempo de inactividad”, informó Facebook en un comunicado. La caída afectó además a toda la empresa, desde las herramientas de comunicación internas a los pases electrónicos para entrar en salas. Adam Mosseri, jefe de Instagram, equiparó la actividad de la compañía a “un día de nevada”, en una publicación en Twitter.
La causa del apagón “afectó a muchas de las herramientas y sistemas internos que utilizamos en nuestras operaciones diarias, lo que complicó nuestros intentos de diagnosticar y resolver rápidamente el problema”, agregó la empresa. “Nuestros equipos de ingeniería han constatado que los cambios de configuración en los enrutadores troncales que coordinan el tráfico de red entre nuestros centros de datos generaron problemas que interrumpieron esta comunicación. Esta interrupción del tráfico de la red tuvo un efecto en cascada debido a la forma en que se comunican nuestros centros de datos, lo que paralizó nuestros servicios”, explicó la compañía.
Según expertos externos a Facebook que analizan el tráfico de internet, ese cambio de configuración provocó problemas en el sistema de asignación de dominios (DNS), también conocido como “listín telefónico de internet”, que traduce el nombre que escribimos en el navegador a una dirección de números donde está el servidor, en este caso de Facebook. El problema no era únicamente que el tráfico no supiera a qué dirección ir, porque no tenía acceso al DNS, sino que tampoco sabía qué camino tomar hacia allí: además de borrar el destino, se habría quemado el mapa. Esa ruta de navegación está gestionada por un oscuro protocolo llamado BGP (Border Gateway Protocol o “puerta de enlace frontera”), cuyos detalles de funcionamiento son a menudo desconocidos incluso para los informáticos y eran este lunes objeto de vivo debate entre ingenieros.
El gigantesco apagón de los servicios de Facebook coincide con unas semanas muy complicadas para la compañía. A las exclusivas sobre documentos internos de la empresa que ha ido revelando The Wall Street Journal se ha unido este domingo la salida a la luz de la garganta profunda, Frances Haugen, que proporcionó esa información al periódico. Haugen, ingeniera informática de Iowa de 37 años y empleada de Facebook entre 2019 y 2021, declaró su identidad este domingo por la noche en un programa de máxima audiencia de la cadena CBS, donde dijo que la compañía priorizaba siempre la búsqueda de beneficios por encima del interés del público. La coincidencia de la caída técnica con las revelaciones de la exempleada han provocado este lunes un desplome del 4,9% en las acciones de Facebook. De cara a las próximas sesiones, la situación puede empeorar.
Haugen declara este martes en el Congreso de Estados Unidos sobre su experiencia. Si no queda plenamente restablecido el servicio y aclarado el incidente, el ambiente para Facebook puede ser irrespirable. “Había constantes conflictos de interés entre lo que es bueno para el público y lo que es bueno para Facebook”, dijo la exempleada en su entrevista con la CBS. “Facebook siempre escogía optimizar su propio interés, ganar más dinero”, aseguró. La caída del servicio y la irrupción en escena de la ingeniera pueden hacer su testimonio potencialmente más peligroso para la empresa que el escándalo de Cambridge Analytica, cuando se descubrió que los datos de más de 50 millones de usuarios de la red social fueron utilizados sin consentimiento para comercializarlos ilegalmente con terceros.
La caída de Facebook comenzó poco antes de las seis de la tarde, hora peninsular española, en torno a las doce del mediodía en Washington, e impidió por completo el funcionamiento de las tres aplicaciones: no se podía actualizar la información ni enviar o recibir mensajes. Downdetector, página que registra los comentarios de los usuarios cuando falla alguna plataforma en internet, recogió cientos de miles de quejas procedentes de al menos 45 países. Los mensajes, entre la protesta y la broma, se multiplicaron en otras plataformas, muy especialmente en Twitter. La red social rival de Facebook se convirtió durante horas en canal de comunicación de la compañía fundada por Mark Zuckerberg, ante el colapso de sus propias herramientas. Twitter ironizó sobre este extremo en su cuenta principal. “Hola literalmente a todos”, tuiteó.
John Graham-Cumming, jefe de Tecnología de Cloudflare, una célebre empresa de servidores en la nube, detectó hacia las 17.50 (hora peninsular española) cómo Facebook desaparecía de internet cuando alguien escribía facebook.com en su navegador. Ese tráfico de usuarios pidiendo cargar un servicio de Facebook no desaparece de golpe, sino que produce un efecto dominó que generó problemas en otras páginas.
EL PAÍS consultó a dos especialistas que, sin tener lógicamente toda la información, opinaban que era perfectamente plausible que un error humano hubiera provocado la desconexión de Facebook, pero coincidían en que, sin más detalles, era difícil concretarlo. La restauración del servicio ha necesitado probablemente del acceso de ingenieros de la empresa a centros de datos, lo que habría alargado el proceso de subsanación al no ser factible la reparación remota.
Oculus, los servicios de realidad virtual de Facebook, también se vieron afectados por la caída. Que una aplicación falle es normal, pero que fallen varias interconectadas con la mayor red social del mundo sí es raro, aunque Facebook ha estado trabajando durante años en la integración de sus sistemas con los de WhatsApp e Instagram. Dos miembros del equipo de seguridad de Facebook han contado a The New York Times que es poco probable que un grupo de ciberdelincuentes haya causado el apagón precisamente porque la tecnología de cada aplicación es demasiado distinta como para verse afectada por un mismo ataque.
El pasado 22 de julio, un fallo en los servicios de la compañía estadounidense de servicios en la nube Akamai provocó interrupciones en el servicio de compañías como Airbnb, plataformas de videojuegos como Playstation Network o Steam, aerolíneas como Delta Air Lines, cadenas de distribución como Costco Wholesale y servicios financieros como American Express, además de numerosos bancos como BBVA o medios de comunicación como EL PAÍS, entre otros.
Más aparatoso fue el fallo global en la red de distribución de contenidos Fastly que el 8 de junio dejó fuera de juego a miles de páginas de todo el mundo. Sitios como los de Amazon, EL PAÍS, The New York Times, Twitch, Financial Times o Reddit sufrieron problemas y en algunos casos permanecieron inaccesibles para sus usuarios durante casi una hora. Al día siguiente, Fastly explicó que la acción inocente de un cliente activó un error de software que permanecía oculto en un programa informático y causó la caída generalizada.
Estos incidentes ―como la caída de los servicios de Google el pasado diciembre― han puesto en evidencia la vulnerabilidad de las conexiones digitales y la debilidad del sistema sobre el que se asienta el funcionamiento de la red en un momento en el que empresas y usuarios dependen más que nunca de ellas por el teletrabajo.