Estado
Hola gente.
Durante los últimos 6 días venimos trabajando en los problemas de estabilidad, por lo que les vengo a contar más o menos qué estuvimos haciendo.
Durante los dos primeros días notamos que el servidor se comportaba bastante mal, no solo en la interacción entre el cliente y el server, sino también al procesar información de la base de datos cuando no habían usuarios onine. Analizando el tráfico entrante y saliente, descartamos la posibilidad de un ataque durante esos primeros días, por lo que nos centramos en revisar en tiempo real (y con herramientas especializadas) el tráfico y la forma en la que se procesaba todo del lado del servidor.
¿Qué problemas encontramos y solucionamos?
Se encontraron varios problemas relacionados con la programación que generaban que información basura quede dando vuelta en los datos recibidos desde el cliente, haciendo que posteriormente el servidor quedara inutilizable.
Encontramos un par de bugs que se venían arrastrando desde versiones pasadas
Recibimos el mensaje de parte de un usuario sobre un bug conocido del cual no estabamos enterados, asi que gracias a su aporte pudimos solucionarlo. (Gracias Mateo!)
Nuestro sistema de guardado de logs para errores trabaja con una base de datos remota, por lo que al darse el error antes mencionaba, generaba un sin fin de tráfico hacia esta base de datos, que bloqueaba el funcionamiento del servidor.
¿Por qué no se encontraron antes estos problemas durante los testeos internos?
Ninguno de estos problemas se dieron durante los testeos internos porque requieren de una gran cantidad de tráfico. Sabíamos que algo así podía llegar a pasar y es la razón principal por la cual pensamos en que abrir en modo BETA era la mejor opción.
La ayuda de todos ustedes para reportar los bugs que encuentran es lo que va a hacer que el servidor se convierta en una plataforma robusta, por lo que estamos muy agradecidos.
¿Es cierto que durante la semana se recibieron ataques?
Como mencioné arriba durante los dos primeros días no recibimos ataques, pero gracias a la importancia que tiene este servidor en el mundo de Argentum Online, ciertas personas se pusieron a hacer de las suyas y fueron molestando durante el día martes, miércoles y una parte del día de hoy.
Nosotros estamos monitoreando el tráfico constantemente y actuando casi al instante apenas se reciben, por lo que esperamos esto no sea un gran problema para el servidor.
Hoy podemos asegurar que el servidor está más estable que días atrás, y que ya llevamos casi 12 horas sin que el servidor muera de forma repentina.
Nosotros vamos a seguir monitoreando constantemente los errores y el tráfico del servidor, ya que nos restan identificar un par de problemas con el login de personajes que generan que el servidor procese una gran cantidad de informacón sin parar, generando para el usuario final una sensación de lag de varios milisegundos.
Como estamos más tranquilos, esta semana vamos a ir arreglando los errores que fueron reportando con respecto al cliente, asi que vamos a estar más activos en el foro pidiendoles información puntual.
Gracias, y esten atentos a más novedades.
Informacion: