pfSense, recuperándome de una falla en el disco duro

La semana pasada tuve un problema serio con mi instalación de pfSense. Los problemas empezaron de una forma muy sutil, incluso tenía Internet y eso era lo más desconcertante.

Al principio algunos usuarios me reportaban que no podía entrar a algunos sitios, pero otros si funcionaban. Otros me reportaban que sus celulares no se podían conectar a la red WiFi y eso estaba más raro todavía.

El colmo fue que para cuando quise entrar a la página de mi pfSense no lo pemitió !!!! okeeeey, quise entrar por SSH y tampoco. En ese momento se predieron todos los focos rojos.

Reinicié el servidor y funcionó bien por un tiempo, mismo que invertí para averiguar las causas del mal funcionamiento.

Disco duro agonizante

Tuve que trasladarme físicamente a la ubicación del servidor con un monitor y un teclado. Solamente al conectar la pantalla vi una imagen nada halagadora.

Mensajes de error de lectura en el disco.
Mensajes de error de lectura en el disco duro.

Durante la lucidez que le dió el reinicio del equipo logré conectarme a la página web y hacer una prueba SMART avisándome de una falla inminente en menos de 24 horas OKEEEEEY, ahora si ya estoy preocupado.

El disco duro fallará en menos de 24 horas ¡GUARDE TODA LA INFORMACIÓN!
¡Alerta roja! ¡Fallo inminente!

Aproveché para hacer un respaldo de la configuración que es producto de 3 años de pequeños ajustes que francamente no creo recordar.

Mientras tanto el internet seguía funcionando, claro que con el tiempo el servicio se degradaba cada vez más. Desactivé squid para evitar accesos al disco duro y ganar algo de tiempo. Es increíble el tiempo que logró funcionar solamente con lo que cargó en memoria.

Conseguí un disco duro de 120 GB, más que suficiente para los requerimientos de pfSense. Lo bueno de guardar todo es que este disco duro no sería útil para las necesidades de un usuario, pero para estos propósitos es excelente.

Ahora lo que necesitaba es un plan de acción.

Plan A. Clonar el disco duro

Me pareció que lo más sencillo y rápido era clonar el disco duro con Clonezilla. Ya lo había usado en otras ocasiones con excelentes resultados.

Para hacer todo más rápido intenté una copia de disco a disco pero no fue lo que esperaba. Tal parece que el sistema de archivos ZFS no esta soportado y en ese caso se hace un vaciado usando dd que ralentizó todo el proceso. En una estimación decía que tardaría más de 11 horas en clonar el disco y eso era inaceptable.

Plan B. Reinstalar y subir el respaldo

Como el plan A no funcionó como lo esperaba no me quedó más que hacer una instalación desde cero y subir el respaldo que había descargado anteriormente.

La instalación fue rápidisima y sin problemas. Inmediatamente entré a la página de administración (por cierto, las credenciales por default son: usuario: admin contraseña: pfsense ) y subir el respaldo.

¡ADVERTENCIA! Antes de subir el respaldo asegúrese de tener internet en el equipo.

Después de subir el respaldo me apareció un mensaje en el que me decía que comenzaría la descarga de los paquetes adicionales en segundo plano y que esperara un par de horas a que terminara el proceso.

Reinstalación de paquetes
A esperar.

Lamentablemente no hay un indicador de progreso. La única pista de que estaba trabajando fue el incesante parpadeo de las luces led de las tarjetas de red y los switches.

Pasaron un poco más de dos horas y nuevamente tuve un problema con el internet, el parpadeo de las luces led disminuyeron notablemente, era tiempo de reiniciar.

¡Habemus pfLazarus!

Al reiniciar mi servidor había vuelto a la vida. Todas las configuraciones, incluyendo la de los paquetes adicionales estaban como las había dejado.

Aunque no todo era idéntico. Al conectarme por SSH me lanzó la advertencia de que las claves habían cambiado, algo que es perfectamente normal.

También cambió el Device key en la opción de Auto Configuration Backup para que lo anoten nuevamente y lo tengan en cuenta. Esta opción te puede salvar la vida si no puedes descargar un respaldo.

¿Qué ha cambiado?

Afortunadamente hago copias de respaldo semanales de la configuración de pfSense, aparte tengo activada la opción de respaldo automático, en cierto modo, estaba protegido de un fallo catastrófico.

Pero para evitarme otra sorpresa como esta, puse el widget SMART Status en un lugar más visible del Dashboard.

Ahorita mismo estoy habilitando las notificaciones por correo electrónico que estan ocultas en el menú System – Advanced – Notifications. Aunque no se si me prevengan de un fallo en el disco duro.

El disco duro que puse es un gallito que espero que pase sus últimos años funcionando sin parar hasta que colapse, sólo que esta vez estaré mejor preparado.

¡Hasta la próxima!

3 comentarios en «pfSense, recuperándome de una falla en el disco duro»

  1. y un Raid 1 no te seria útil para darle mas seguridad a tu servidor, digo pensando en lo critico que es que este en linea 24/7 se me hace que esta justificado. Saludos Francisco.

    Responder
    • Y tienes toda la razón Antonio,

      Pero siendo honestos no es una misión 24/7, además el servidor esta hecho de equipos viejos jubilados que he acumulado con el tiempo. Como menciono en mi artículo, las capacidades de este equipo en particular, ya no es adecuada para un usuario, pero para la misión de administrar internet le sobra potencia.

      ¡Saludos!

      Responder

¡Me encantaría saber que opinas!

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.