Saber el motivo por el que se daña un disco duro no es tarea fácil, pero tampoco imposible. En este artículo, vamos a repasar las principales causas de fallo de los discos duros mecánicos (HDD) que se usan en ordenadores y servidores.
Seguro que alguna te sorprende, y además vamos a dar un repaso a los métodos de prevención de estos fallos, para que un daño del HDD no te afecte. ¡Comenzamos!
¿Cuál es el motivo por el que se daña un disco duro? Estas son las 4 posibles causas
Afortunadamente, podemos saber de forma muy sencilla los motivos por los que fallan los discos duros en la vida real. Todo gracias a los datos publicados por Backblaze. Esta compañía se dedica a las copias de seguridad, y aprovechan los millones de horas de uso de sus HDD para publicar información de interés sobre estas unidades.
En este caso, Backblaze publica los datos de DriveSaver, una firma de recuperación de datos. En el siguiente gráfico, vemos cuáles son los cuatro motivos de fallo de HDD determinados en sus laboratorios.
Como vemos, hay tres motivos principales por los que se daña un disco duro:
- Un daño del cabezal del disco, responsable en el 70% de las ocasiones.
- Un fallo del PCB del controlador, el 18% de las veces.
- Atascos del cabezal, un 11% de las veces.
- Y un fallo del motor, el 1% de las veces.
Daños en los platos del disco
Para explicar el fallo más común de los HDD, repasemos cómo funciona un disco duro mecánico. Grosso modo, todo se basa en un plato metálico que gira a unas revoluciones muy elevadas (5400 o 7200 rpm, típicamente). Para leer y escribir los datos, un cabezal se mueve a lo largo del plato (mientras este gira) y, en cuanto localiza la posición adecuada, realiza el proceso de lectura o escritura a base de magnetizar o desmagnetizar esa posición concreta.
Estamos, entonces, ante un funcionamiento realmente complejo, que además implica una precisión increíble, del orden de los micrómetros. Así, cualquier daño en los platos o en el cabezal del disco puede provocar moverse de estos pequeños márgenes, dejando al disco duro simplemente inutilizable.
Por ejemplo, una caída del HDD, o de un objeto sobre él, puede inutilizarlo completamente. Backblaze nos indica que, por mucho que se vea bien por fuera, en su interior podemos tener un plato dañado o incluso fracturado. También se puede dar el caso de que, internamente, el cabezal se golpee contra el plato, dando lugar a estos daños difíciles de recuperar que comentamos.
Fallo del PCB controlador
Si alguna vez te has fijado en un disco duro, habrás visto que tiene un pequeño circuito electrónico (PCB), justo donde se sitúan sus conectores.
Pues bien, este circuito tiene los componentes necesarios para recibir peticiones de lecturas/escrituras de bloques de datos del equipo y entregarlas, además de gestionar el funcionamiento del disco.
Y es que ni el procesador ni la placa base se responsabilizan de las tareas de gestión interna del HDD, sino que se aplica un nivel de abstracción sobre ello. Así, en el PCB del disco mecánico encontramos:
Una controladora, que es básicamente una CPU programada para gobernar el funcionamiento y comunicarse con el PC.
- Un chip de caché, para acelerar la velocidad efectiva un poco.
- Una BIOS para el arranque inicial del disco.
Todo esto sumado con muchísimos componentes necesarios (condensadores, diodos, etc). Vamos, una especie de microordenador dentro del propio disco duro 😉
A lo que quiero llegar, además de enseñar un poco sobre el funcionamiento de un HDD, es a que se entienda por qué es muy probable que la causa del fallo de un HDD esté en el PCB: con tantos componentes, un solo fallo con uno de ellos puede ser fatal.
En concreto, puede haber circunstancias externas (demasiada humedad, por ejemplo) que deterioren todo el PCB, o alguno de los componentes puede dejar de funcionar. Por mucho que estén preparados para durar, la electrónica es traicionera, y ni lo mejor de lo mejor se puede salvar de que esto ocurra.
De hecho, incluso hay fuentes que afirman que el 70% de los daños de los HDD no los causa el cabezal, sino que precisamente son daños en el PCB. Aunque en este sentido nos fiamos más de los datos de Backblaze.
Atascos del cabezal tras mucho tiempo sin usar el disco duro
Este es un problema que afecta a 1 de cada 10 fallos de HDD, por lo que no debemos pasarlo por alto. Se produce justamente cuando el disco duro ha estado un largo período sin funcionar.
Debido a esto, el mecanismo del cabezal puede quedarse obstruido e inmóvil, de forma que al no haber movimiento del mismo no podemos leer ningún dato.
Este es un problema conocido en inglés como stiction, o fricción estática en español. Se refiere a la fuerza que se opone al inicio del desplazamiento del cabezal, que ante un largo período de desuso puede ser demasiado grande. Es importante, entonces, no almacenar durante años un HDD sin usar, para evitar este problema.
Fallo de motor
El fallo menos común es justamente el que se nos vendrá a la cabeza al pensar en un HDD fallando: el motor solo es responsable el 1% de las veces, a pesar de que cualquiera diría que lo es casi siempre.
La cuestión es que los motores usados en los discos duros mecánicos suelen usar rodamientos muy buenos, como los de fluido dinámico. Así, pueden estar funcionando períodos de tiempo muy largos. O al menos lo suficiente hasta que se dé un fallo por otra causa.
¿Y qué hay de los fallos de los SSD?
Está claro que los discos duros mecánicos están perdiendo relevancia en entornos domésticos. Afortunadamente, estamos dejando de usarlos como nuestro almacenamiento principal, para quedarse relegados a un método de almacenamiento secundario.
Todo esto gracias a reemplazarlos por SSD. Pero, si sabemos los motivos por los que falla un disco duro mecánico, ¿por qué motivos falla un SSD?
Como un SSD no tiene partes mecánicas, los motivos son totalmente distintos a los que podemos encontrar en un HDD. El más común es un desgaste de las memorias NAND. Analicémoslo.
Las memorias NAND y su sensibilidad
El gran problema de las memorias NAND usadas en SSD es que tienen un número de escrituras limitado. En cada una de sus celdas, solo podemos escribir un número determinado de veces, hasta que la celda quede totalmente inutilizada.
Entonces, ¿significa que un SSD es más propenso a fallar sin previo aviso que un HDD? No, por dos motivos:
- No estamos hablando de un límite de escrituras que se alcance con facilidad. En el uso normal de un usuario puede ocurrir, por ejemplo, a los 10 años de uso.
- Los fabricantes de los SSD conocen esto, así que imponen un límite de escrituras al SSD (consulta qué son los TBW). A partir de ese límite, se queda en modo solo lectura, para poder leer esos datos con seguridad y evitar la pérdida.
Vamos, que un SSD es lo suficientemente sofisticado para «avisar» (quedando en modo solo lectura) antes de fallar completamente. En todo caso, es posible que se dañe, y no debemos olvidar la posibilidad de que aquí sí se dé también un fallo del PCB.
A un SSD también le afecta estar mucho tiempo sin uso
Ten en cuenta que pasar un largo tiempo sin uso no solo es problemático en los discos duros mecánicos. En el caso de un SSD, es cierto que no provocará un daño, pero sí algo que debemos tener en cuenta: un borrado de todos nuestros datos.
Y es que las memorias NAND de los SSD no tienen una retención de datos infinita en el tiempo. No solo eso, sino que además el tiempo de retención es menor según más densas sean las memorias, lo que lleva a que los SSD futuros aguanten menos tiempo aún los datos.
¿Y de cuánto podemos estar hablando? Todo depende de las condiciones operativas, del tipo de memoria, etc. ¡Puede ir desde 1 semana hasta varios años! En general, se podría decir que en un SSD normal es un tiempo superior a 1 año, pero podría llegar a ser de meses. ¡Tenlo muy en cuenta!
¿Cuándo fallará mi disco duro? ¿Puedo hacer algo para solucionarlo?
Veamos qué podemos hacer para:
- Prevenir un posible fallo para poder anticiparse.
- Estar preparados par aun fallo repentino e inesperado.
- Actuar si finalmente falla.
Prevención revisando el SMART
Todos los discos duros y SSD cuentan con un sistema denominado S.M.A.R.T. (Self Monitoring Analysis and Reporting Technology, o Tecnología de Análisis e Informes de Autosupervisión).
Este permite conocer el nivel de salud del disco duro, de forma que se puede detectar cualquier pequeño fallo antes de que se convierta en algo peor. Así, lo que conseguimos monitorizando el SMART es la prevención de la pérdida de los datos.
Generalmente, un HDD no falla de golpe, sino que primero llega a un estado de «Riesgo» según los datos del SMART. Esto lo podemos consultar con software como CrystalDiskInfo. También sirve para SSD, donde podremos consultar el nivel de desgaste de las memorias NAND, con todas las escrituras realizadas.
Prudencia manteniendo copias de seguridad
No podemos fiarnos al 100% del SMART, ya que no anticipa todas las posibles ocasiones en las que se daña un disco duro. Por ello, siempre se debe considerar un escenario de fallo del disco duro.
Así, debemos ser conscientes en todo momento de qué datos no nos podemos permitir perder bajo ningún concepto, y mantener copias de seguridad regulares y actualizadas de ello.
Por ejemplo, una empresa no puede perder datos de clientes, o un usuario normal no quiere perder sus fotos más preciadas. Lo recomendable es tener siempre un respaldo de estos datos, que se puede conseguir de varias maneras:
- Manualmente, copiando la información en otras unidades de almacenamiento.
- Mediante copias de seguridad en la nube, algo cómodo y escalable, aunque dependemos de Internet y de la fiabilidad del proveedor.
- Con un sistema sofisticado de copias de seguridad locales, ya sea con un NAS, una configuración con tecnología RAID 1, etc.
¿Qué hacer si se daña el disco duro?
Si llega el fatídico momento en el que se daña nuestro disco duro, y no nos hemos cubierto las espaldas correctamente (con las copias de seguridad), hay que intentar recuperarse del problema.
Todo esto depende de cómo se produzca el fallo. Por ejemplo, si el problema viene del cabezal o el motor lo más probable es que la única forma de recuperar el disco sea enviarlo a una compañía especializada en recuperación de datos. Ya te avisamos, no es algo precisamente barato.
En cambio, si observas un daño en el PCB del HDD, es posible que puedas reemplazarlo por otro PCB y que vuelva a la vida. Pero ojo, no solo no garantiza el arreglo, sino que debes asegurarte de que el número de PCB sea exactamente igual al del HDD.
Palabras finales y conclusión sobre el motivo por el que se daña un disco duro
Como hemos visto, el motivo por el que se daña un disco duro no es el mismo siempre. En concreto, estas son las cuatro principales razones de fallo, por orden de probabilidad:
- Daño del plato del disco, por ejemplo ante una caída accidental.
- Daños en el PCB del disco, es decir, en su circuitería de control. Esto se puede solucionar cambiando el PCB, y se debe al fallo de un componente concreto o a circunstancias externas (humedad, por ejemplo).
- Problemas de fricción estática que provocan un atasco del cabezal del disco al encenderlo.
- Fallo del motor que hace rotar el plato del HDD internamente.
Entonces, debemos tener siempre en mente esta posibilidad, y aplicar una buena estrategia de prevención, sobre todo si tenemos datos sensibles que no queremos perder. Las copias de seguridad, la monitorización del SMART del disco y los RAID 1 son nuestros aliados.
Te puede interesar: Motivos por los que un SSD DRAM-Less va a sustituir al NVMe de tu PC
[Información e imágenes tomadas de profesionalreview.com]