Amazon Web Services experimentó hoy problemas en sus servicios de almacenamiento en la nube 'S3' en el centro de datos US-East-1 en Virginia del Norte, causando problemas generalizados para muchos sitios web y aplicaciones.
Amazon es “una de las plataformas más requeridas por los usuarios”, especialmente a nivel de emprendedores, debido a su confiabilidad, su buena relación precio/rentabilidad y “la facilidad que ofrece para ir creciendo paulatinamente” la capacidad de los sitios web, dijo a EL UNIVERSAL Daniel Alfaro Vázquez, ingeniero en sistemas computacionales especializado en seguridad informática.
Al ser uno de los servicios de alojamiento web más utilizados en el mercado, cuando sus servidores sufren un fallo, muchos sitios web se ven afectados.
Alrededor de las 11 de la mañana (tiempo de México) Amazon Web Service (AWS) registró “altas tasas de error” en sus servicios de almacenamiento.
Los sitios afectados incluyen Hootsuite, Trello, Scribd, Splitwise, GroupMe, Nest e IFTTT, así como Expedia, Slack, Wix, Quora, Business Insider, Alexa, Giphy y SPAN también han reportado fallas en sus servicios.
HAY DE FALLAS A FALLAS
Pese a que AWS aloja servicios para grandes compañías como Pinterest, Airbnb, Netflix, Reddit, Buzzfeed, Spotify y de millones de sitios más pequeños, no todos presentaron una falla total de su servicios. En algunos sitios sólo se presenta un retraso en la conexión, mientras que en otros no se puede acceder. Unos más sólo reportaron problemas parciales, como en la carga de imágenes o en la conexión de sus aplicaciones móviles.
Alfaro Vázquez explica que, aunque muchas páginas cuentan con sus propios servidores, en ocasiones hacen uso de los servicios de compañías como Amazon para albergar ciertos contenidos, como sus bases de datos y procesamientos, por lo que muchos de los clientes de AWS pudieron presentar fallas parciales o no tan perceptibles.
“Algunas páginas no dependen por completo de un sólo servidor. A veces, el que se pueda ver una página, no significa que esté en pleno funcionamiento”, dijo el especialista, quien detalló que muchas veces las compañías albergan la presentación de la página y la parte visual, "mientras que toda la unidad de procesamiento, gestión y administración se la envían a Amazon, Microsoft Azure, Google u otro proveedor de estos servicios”.
LOS AFECTADOS
La agencia de noticias The Associated Press, reportó fallos en su red de fotografía, webfeeds y otros servicios en línea. También ha afectado el alojamiento de imágenes en muchos sitios, como en el sitio The Verge, y la conexión de aplicaciones móviles, la mayoría de iOS.
El problema afectó las operaciones "de interfaz" - lo que significa los sitios web y apps que ven los usuarios - y el procesamiento subyacente de datos, que se lleva a cabo fuera de vista.
Algunos servicios en línea más pequeños, como Trello, Scribd e IFTTT, durante un rato parecieron haberse caído, aunque ya todos se han restaurado.
En contraste, el servicio de mensajes corporativos Slack, se mantuvo funcionando aunque reportó "servicio degradado" en algunas de sus herramientas. Usuarios reportaron que, en particular, parecía congelarse al compartir archivos.
El Simple Storage Service, o S3, de Amazon, almacena archivos y datos para compañías en servidores remotos. Se utiliza para todo: desde la construcción de un sitio web y apps, hasta el almacenamiento de imágenes, datos y transacciones de clientes.
Entre los sitios que reportaron fallas parciales están Quora, Sailthru, Business Insider, Giphy, Slack, dispositivos IoT como bombillas conectadas, así como servicios de Adobe, Twitch, Buffer, Chef, Citrix, Codecademy, Coursera, Cracked, Docker, Expedia, Expensify, FiftyThree, Greenhouse, Heroku, Home Chef, iFixit, Imgur, isitdownrightnow.com, Lonely Planet, Mailchimp, Medium, HockeyApp de Microsoft, News Corp, Pantheon, Razer, Signal, Sprout Social, Travis CI, Trello, Twilio, Unbounce, Zendesk, Airbnb, Down Detector, Freshdesk, Pinterest, SendGrid, Bitmoji de Snapchat y Time Inc.
En un comunicado, Amazon dijo que a las 16:00 horas tiempo de México, todavía experimentaba "elevados índices de error" que "impactaban varios servicios AWS".
"Trabajamos duro para reparar S3, creemos que entendemos el origen y trabajamos en implementar lo que creemos que remediará la causa", dijo la compañía.
¿CUÁL ES LA CAUSA DE LA FALLA?
Ya que Amazon no ha explicado exactamente lo que sucede, es complicado saber la seriedad de las fallas. "Sabemos que es grave", dijo Mogull. "Simplemente no sabemos qué tanto".
“Amazon no ha dado un reporte puntual. Apenas recuperaron su panel de estatus, lo que nos permitirá saber en qué estado se encuentra”, señala el ingeniero Daniel Alfaro.
Pese a que fue muy claro en que puede haber varias causas para la falla, y que habrá que esperar el reporte oficial de AWS, Alfaro Vázquez detalló una de las posibles causas puede ser “un ataque de denegación de servicio, en el que se envía una gran cantidad de solicitudes de servicio, lo que ocasiona que la capacidad del sistema se sobrepase, colapse y, normalmente, se reinicie”.
NO ES LA PRIMERA VEZ
Importantes fallas en la computación en nube suceden de forma periódica. En 2015, el servicio DynamoDB de Amazon, una base de datos en nube, tuvo problemas que afectaron a compañías como Netflix y Medium. Pero, usualmente, los proveedores tienen métodos alternativos para que las cosas funcionen rápido otra vez.
"Lo que me sorprende mucho es que no hubiera un plan B - suele haber algún tipo de plan de respaldo para mover los datos y está disponible en cuestión de minutos", dijo Patrick Moorhead, analista en Moor Insights & Strategy.
*Con información de agencias
ae