¿Por qué mi disco duro falló o se bloqueó tan rápido y sin razón aparente?

Se estima que más del 90% de toda la información nueva que se produce en el mundo se almacena en medios magnéticos, la mayor parte en unidades de disco duro. A pesar de su importancia, hay relativamente poco trabajo publicado sobre los patrones de falla de las unidades de disco(failure patterns of disk drives) y los factores clave que afectan su vida útil. La mayoría de los datos disponibles se basan en la extrapolación de experimentos de envejecimiento acelerado o de estudios de campo de tamaño relativamente modesto.

¿Por qué mi disco duro falló o se bloqueó?

Además, los estudios de población más grandes rara vez cuentan con la infraestructura para recopilar señales de estado de los componentes en funcionamiento, que es información crítica para el análisis detallado de fallas.

Los clientes reemplazan las unidades de disco a tasas mucho más altas que las sugeridas por el tiempo medio estimado entre fallas ( MTBF ) proporcionado por los proveedores de unidades, según un estudio de aproximadamente 100,000 unidades realizado por la Universidad Carnegie Mellon(Carnegie Mellon University) .

Falla del disco duro

Un estudio de Carnegie Mellon examinó grandes sistemas de producción, incluidos sitios de computación de alto rendimiento y sitios de servicios de Internet que ejecutan unidades SCSI(SCSI) , FC y SATA . Las hojas de datos de esas unidades enumeran MTBF entre 1 millón y 1,5 millones de horas, lo que según el estudio debería significar tasas de falla anuales "como máximo del 0,88%". Sin embargo, el estudio mostró tasas de reemplazo anuales típicas de entre 2% y 4%, “y hasta 13% observado en algunos sistemas”.

Entonces, ¿qué significa esto para usted, el consumidor que compra discos duros y computadoras con discos duros?

Tengo más de 25 años de experiencia en ingeniería, fabricación y desarrollo de software, así que primero examinemos un aspecto importante de los procesos de fabricación típicos, desde automóviles y aviones hasta discos duros y teléfonos inteligentes. El fabricante típico de cualquier producto final en realidad produce algunos de los componentes que componen el producto final. De hecho, subcontratan la fabricación y, a menudo, el diseño de casi todos los subcomponentes, lo que otorga al proveedor una supervisión que va desde ninguna hasta amplias especificaciones, pruebas y supervisión. El proveedor elegido para suministrar el componente suele ser el que ofrece la oferta más baja, mientras que algunos fabricantes eligen al mejor proveedor en función del valor, que es una combinación de precio, calidad y confiabilidad.

Este sistema de subcontratación a menudo se denomina base de proveedores escalonada. Un proveedor de primer nivel suministra directamente al fabricante del producto final. Los proveedores del proveedor de nivel uno son proveedores de nivel dos, y así desciende en la cadena alimentaria. Técnicamente, en el caso de un fabricante de discos duros, de hecho, es un proveedor de primer nivel para el fabricante de computadoras. Este sistema explica por qué cuando el gobierno de los Estados (Government)Unidos (United) estaba(States) debatiendo si rescatar a los fabricantes de automóviles(US Automobile Manufacturers) de los EE. UU. , se citaba a la gente diciendo que si se les permitía hundirse, cientos de miles de personas perderían sus trabajos. Se referían a los empleados de todos los proveedores de nivel.

En un sistema como este, la calidad del producto final es tan buena como el eslabón más débil de la cadena de suministro. La mayoría de los proveedores utilizan métodos de diseño y control de calidad muy(Very) complejos y rígidos para garantizar la calidad de sus productos, pero al final, todo se reduce a la posibilidad de un error humano. Incluso la planta de fabricación robotizada y controlada por computadora más sofisticada del mundo, que funciona las 24 horas, los 7 días de la semana, está sujeta a errores humanos. Es posible que la persona que programa el robot no se concentre en la tarea, lo que hace que el robot coloque un microchip a una fracción de un micrómetro fuera del objetivo cada 100 operaciones, lo que provoca que su disco duro tenga problemas cuando la computadora idéntica de su compañero de trabajo está bien.

Las fallas tempranas como esta no son infrecuentes. Es lo que todas las garantías denominan “defectos de fabricación”. El término interno de la industria es Fracaso de la Mortalidad Infantil(Infant Mortality Failure) ( FMI(IMF) ). Las garantías tienen un límite de tiempo porque están destinadas a protegerlo contra IMF(IMFs) . De hecho, existen diferentes niveles de FMI(IMFs) . La mayoría de los dispositivos electrónicos pasan por algún tipo de prueba, a menudo conocida como quemado. Esto es una prueba para una falla inmediata o una falla en los primeros minutos. Estos son causados ​​por defectos de fabricación graves que provocan fallas catastróficas casi de inmediato.

Los IMF más molestos son(IMFs) los que llegan hasta usted, el consumidor, funcionan sin problemas durante un corto período de tiempo y luego, bam, mueren. Los fabricantes odian estos fallos porque ahora su opinión sobre el fabricante está empañada. Nunca supo de las fallas durante el proceso de grabación y estaba feliz de no saber sobre ellas, pero cuando su disco duro muere la noche antes de una fecha límite crítica, se vuelve loco y exige una compensación al mundo. El costo de esta falla es a largo plazo y mayor que el costo de un nuevo disco duro. Puede resultar en un cliente perdido para siempre. Esta es la razón por la que nunca tendré otra computadora HP a pesar de que pueden ser excelentes computadoras. Obtuve uno malo y me empañaba contra HP para siempre.

Relacionado(Related) : ¡El disco duro se borró solo! ¿Qué hago ?

Entonces, ¿qué puedes hacer para protegerte?

Personalmente, siempre investigo mucho antes de comprar nuevos productos electrónicos. IMF puede ser un problema persistente con un fabricante o modelo hasta que se encuentre y corrija la causa raíz del problema. Incluso podría ser un defecto de diseño y no un problema de fabricación. Recientemente compré un nuevo televisor HD de pantalla grande y pensé que quería lo mejor de la línea Panasonic 3D Plasma hasta que me enteré al leer reseñas de varias fuentes que los modelos 2010 experimentan una pérdida temprana (dentro de 3 meses) de niveles de negro y no suficiente se disponía de información para determinar si se arregló en los modelos 2011. Así que compré mi segunda opción.

La otra cosa más obvia que puede hacer específicamente con el disco duro de una computadora es hacer una copia de seguridad de sus datos o crear una imagen de todo su sistema. Yo personalmente uso un producto llamado Acronis True Image . Hago una imagen de copia de seguridad de todo mi sistema y luego hago copias de seguridad incrementales todas las noches. Lo configuré para mantener 10 incrementos anteriores, por lo que siempre puedo restablecer a una versión anterior reciente. Hago una copia de seguridad de esto en un disco duro(Hard Drive) externo dedicado de 1 TB . ¿Qué pasa si ese disco duro falla, dices? Bueno, la probabilidad de que el disco duro de su computadora y su disco duro externo fallen al mismo tiempo es remota, pero soy dueño de mi propio negocio, así que tengo un disco duro externo redundante en el que hago copias de seguridad redundantes solo para estar seguro.

También le recomendaría que obtenga un protector contra sobretensiones de buena calidad, no del tipo que obtiene en Walmart junto a los cables de extensión, sino una unidad de buena calidad de un minorista como Best Buy o cualquier minorista de suministros informáticos. USO una unidad Belkin que cuesta alrededor de $ 40 USD .

Marque esto si necesita algún software gratuito para monitorear el disco duro en busca de fallas potenciales(Freeware to Monitor Hard Disk for Potential Failure) .(Check this if you need some Freeware to Monitor Hard Disk for Potential Failure.)

El autor de esta publicación invitada, Randy L. Miller, es el director ejecutivo de Alagad Incorporated.(The author of this Guest Post, Randy L. Miller is the C.E.O of Alagad Incorporated.)