Qué es SMART y cómo usarlo para predecir fallas de HDD o SSD

Muchos de nosotros hemos experimentado una falla en el disco duro o SSD. Algunos de nosotros incluso hemos tratado de averiguar más sobre la confiabilidad de los discos duros y su función de predicción oculta(hidden prediction function) que es parte de una tecnología llamada SMART . Se podría argumentar que SMART no es tan confiable ya que no predice fallas en todos los casos. Este hecho es parcialmente cierto, pero el funcionamiento interno real de este sistema de autocontrol no es tan simple, así que examinemos cómo funciona SMART . También le mostraremos cómo comprobar el estado SMART de la unidad de disco duro(HDD SMART status) , así como el estado SMART(SMART status) de la unidad de estado sólido :

¿Qué es SMART (HDD y SSD)?

SMART es un sistema que monitorea la información interna de su disco. (SMART is a system that monitors the internal information of your drive.)Su ingenioso nombre(clever name) es en realidad un acrónimo de Self-Monitoring, Analysis, and Reporting Technology . SMART , también escrito como SMART , es una tecnología que se encuentra dentro de los discos duros y SSD(HDDs and SSDs) . Es independiente de su sistema operativo(operating system) , BIOS u otro software.

¿Qué hace SMART para HDD y SSD(HDDs and SSDs) ?

SMART se inventó porque las computadoras necesitaban algo que pudiera monitorear el estado de salud(health state) de sus discos duros. Eso significa, hablando claramente, que SMART supuestamente debería poder decirle si su disco duro o unidad de estado sólido está a punto de dejar de funcionar(SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working) .

SMART proporciona información sobre el estado de la unidad

¿Cómo hace SMART eso? Puede sentirse tentado a pensar que SMART puede adivinar mágicamente si su unidad está en buen estado. 🙂 Sin embargo, lo que hace es una historia completamente diferente. SMART realiza un seguimiento de una serie de variables(SMART keeps track of a series of variables) cuyo número y tipo varían de un disco a otro, que son indicadores de su confiabilidad(indicators of its reliability) . Si desea obtener una idea detallada de todos los atributos SMART , ya que hay alrededor de 50 de ellos ( tasa de error de(error rate) lectura sin procesar , tiempo de activación, errores no corregibles informados, tiempo de encendido, recuento de ciclos(cycle count) de carga , etc.) , visite esta página web(visit this webpage) .

Sin embargo, sepa que, aparte de algunos intentos singulares ( Google , Backblaze ), la mayoría de los SMART . los datos no están documentados. El sistema proporciona una gran cantidad de datos internos. Aún así, hay muchas inconsistencias en las estadísticas porque muchos de los fabricantes de discos duros usan definiciones y medidas diferentes. Por ejemplo, algunos fabricantes almacenan los datos de tiempo de encendido como horas, mientras que otros los miden en minutos o segundos. Además, no explican cuáles de los diversos atributos o variables merecen nuestra atención, lo que nos ahoga en datos.

Antes de intentar comprender qué atributos SMART son relevantes, primero debemos diferenciar entre los principales tipos de fallas de SSD y HDD: predecibles y no predecibles(SSD and HDD failures: predictable and non-predictable) .

Detalles SMART para una unidad de estado sólido

Las fallas predecibles(Predictable failures) incluyen las fallas que aparecen a tiempo y son causadas por fallas en la mecánica del disco o daños en la superficie del disco en el caso de los discos duros. Para las unidades de estado sólido, las fallas predecibles pueden incluir el desgaste normal con el tiempo o una gran cantidad de intentos de borrado fallidos. Los problemas(Problems) empeoran con el tiempo y la unidad finalmente falla.

Las fallas no predecibles(Non-predictable failures) son causadas por eventos repentinos, de los cuales podemos mencionar, por ejemplo, subidas repentinas de energía o daños inesperados a los circuitos dentro del disco duro o unidad de estado sólido. Lo que es importante entender es que SMART solo puede ayudarlo a detectar fallas predecibles(S.M.A.R.T. can only help you detect predictable failures) .

Ahora que tiene una comprensión básica de lo que es y hace SMART , veamos cómo verificar el estado SMART(SMART status) de sus unidades desde Windows y luego también cómo leer e interpretar los detalles SMART :

Cómo verificar el estado de SSD y HDD SMART(SSD and HDD SMART status)

En computadoras y dispositivos con Windows , la forma más fácil de leer datos SMART desde un disco duro o desde un SSD es usando aplicaciones especializadas. Hay bastantes por ahí, pero muchos de ellos están mal desarrollados o cuestan dinero(cost money) . De todas las aplicaciones que pueden leer datos SMART , la mejor y la que le recomendamos que use es CrystalDiskInfo . Es gratis, puede leer atributos SMART y también es una de las pocas aplicaciones que puede obtener datos (SMART)SMART tanto de IDE ( PATA ), SATA y NVMe .unidades, así como de unidades portátiles que utilizan e SATA , USB o IEEE 1394 .

CrystalDiskInfo muestra información detallada sobre una unidad usando SMART

Otro excelente método para verificar el estado y los detalles SMART(SMART status and details) de un HDD o SSD(HDD or SSD) es usar las aplicaciones proporcionadas por su fabricante. Por ejemplo, la mayoría de las unidades de estado sólido vienen acompañadas de aplicaciones de soporte(support apps) que le permiten verificar información sobre ellas, verificar su estado, ejecutar diagnósticos, etc. Estas aplicaciones suelen incluir opciones para comprobar el estado SMART(SMART status) .

Los fabricantes de unidades ofrecen aplicaciones que pueden leer información SMART

Windows 10 ofrece una tercera forma de verificar el estado SMART(SMART status) de su unidad de disco duro o SSD(disk drive or SSD) . No muestra detalles, pero puede decirle si el estado SMART(SMART status) de sus unidades es correcto o no. Para verificar SMART , abra el símbolo del sistema(Command Prompt) y ejecute este comando: wmic diskdrive get model, status . El comando genera la lista de unidades conectadas a su PC y muestra el estado SMART(SMART status) de cada una de ellas.

Windows 10 le permite verificar el estado SMART de sus unidades

Este último método para verificar el estado SMART(SMART status) es probablemente la forma más rápida en Windows 10 de verificar si sus unidades están fallando.

Cómo ejecutar una prueba SMART SSD o HDD

Si no está satisfecho con solo leer el estado SMART(SMART status) de sus unidades, también puede ejecutar una prueba SMART SSD o HDD(SSD or HDD SMART test) . Es más fácil decirlo que hacerlo porque necesita una aplicación especializada para este propósito. Por ello, consideramos que este es un tema digno de un artículo aparte, al que puedes acceder a través de este enlace: Prueba tu HDD o SSD(HDD or SSD) y comprueba su estado de salud(health status) .

Cómo leer valores y atributos SMART

El estado de salud(health status) del disco duro se prueba y monitorea continuamente con múltiples sensores. Los valores se miden mediante el uso de algoritmos típicos y luego los atributos correspondientes se ajustan de acuerdo con los resultados.

En cualquier programa de monitoreo(monitoring program) SMART , debería ver atributos que contengan al menos algunos de estos campos:

  • Identificador:(Identifier:) la definición del atributo. Por lo general, tiene un significado estándar y está marcado con un número entre 1 y 250 (por ejemplo, 9 es Power-on Count ). Aún así, todas las herramientas de monitoreo y prueba de disco(disk monitoring and testing tools) proporcionan el nombre y una descripción textual del atributo.
  • Umbral:(Threshold:) el valor mínimo para el atributo. Si se alcanza este valor, la unidad está a punto de fallar.
  • Valor:(Value:) valor actual del atributo. El algoritmo calcula este número basándose en los datos sin procesar. Un disco duro nuevo debe tener un número alto, el máximo teórico (100, 200 o 253 según el fabricante), que va disminuyendo a lo largo de su vida útil.
  • Peor:(Worst:) el valor más pequeño del atributo jamás registrado.
  • Datos:(Data:) valores medidos sin procesar proporcionados por un sensor o un contador. Estos son los datos que utiliza el algoritmo diseñado por el fabricante del HDD o SSD(HDD or SSD) . Su contenido depende del atributo y del fabricante de la unidad. Los usuarios habituales deben omitir este.
  • Banderas:(Flags:) el propósito del atributo. Por lo general, lo establece el fabricante y, por lo tanto, varía(manufacturer and therefore varies) de una unidad a otra. Cada uno de los atributos es crítico y puede predecir una falla inminente (por ejemplo, recuento de sectores reasignados ID 5 ) o estadístico sin efecto directo en el estado (por ejemplo, recuento de pérdida de energía(power loss count) inesperada ID 174 ).

Los atributos SMART se describen mediante datos como su ID, valor actual, peor valor y umbral

Cuando intente comprender el estado de cualquier atributo SMART, verifique los valores de estos tres campos: valor, umbral y banderas(to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags) . Además, recuerde que, por lo general, los valores más pequeños son una indicación de una disminución en la confiabilidad(smaller values are an indication of a decrease in reliability) .

Cómo utilizar SMART para predecir el fallo de un HDD o SSD(HDD or SSD) (valores imprescindibles a comprobar)

No todo INTELIGENTE(S.M.A.R.T) . Los atributos son críticos para la predicción de fallas(failure prediction) . Los dos estudios mencionados anteriormente sobre las tasas de falla del disco duro(drive failure) y otras fuentes coinciden en que una ayuda importante para identificar las unidades que fallan es:

  • Recuentos de sectores reasignados(Reallocated sector counts) . La reasignación ocurre cuando la lógica de la unidad reasigna un sector dañado, como resultado de errores de software o hardware recurrentes, a un nuevo sector físico a partir de sus repuestos. Este atributo refleja el número de veces que ha ocurrido una reasignación. Si su valor aumenta, es una indicación de desgaste de HDD o SSD.

  • Recuento actual de sectores pendientes(Current Pending Sector Count) . Esto cuenta los sectores "inestables", es decir, los dañados con errores de lectura que esperan una reasignación, una especie de sistema de "prueba". Los algoritmos SMART tienen interpretaciones mixtas sobre este atributo en particular, ya que a veces no es convincente. Aún así, puede proporcionar una advertencia más temprana de posibles problemas.

  • Errores no corregibles informados(Reported Uncorrectable Errors) . Es el conteo de errores que son imposibles de recuperar, y es útil porque parece tener el mismo significado para todos los fabricantes.

  • Borrar recuento de fallas(Erase Fail Count) . Este es un excelente indicador de la muerte prematura de una unidad de estado sólido. Cuenta la cantidad de intentos fallidos de eliminación de datos, y un valor que aumenta le indica que la memoria flash dentro del SSD está cerca del final de su vida útil.

  • Recuento de nivelación de desgaste(Wear Leveling Count) . Esto también es especialmente útil para SSD. Los fabricantes establecen la vida útil esperada de un SSD en sus datos SMART. El recuento de nivelación de desgaste(Wear Leveling Count) es una estimación del estado de su unidad. Se calcula utilizando un algoritmo que tiene en cuenta la vida útil esperada predefinida y la cantidad de ciclos (escritura, borrado, etc.) que cada bloque de memoria flash puede realizar antes de llegar al final de su vida útil.

  • La temperatura del disco(Disk temperature) es un parámetro muy debatido. Aún así, se considera que valores superiores a 60°C pueden reducir la vida útil de un HDD o SSD y aumentar la probabilidad de daño. Recomendamos usar un ventilador para disminuir la temperatura de sus unidades y, con suerte, prolongar su vida útil.

Los valores SMART que están por encima del umbral pueden señalar posibles fallas futuras de la unidad

El mencionado SMART . Los atributos son relativamente fáciles de interpretar. Si nota un aumento en sus valores, es posible que su unidad esté fallando, por lo que será mejor que comience a hacer una copia de seguridad. Sin embargo, aunque estos son indicadores útiles de la confiabilidad de la unidad, no olvide que no son infalibles.

Nota histórica sobre SMART

SMART se desarrolló a partir del año 1992(year 1992) , aunque ahora sabe que está incluido en todas las unidades de estado sólido y unidades de disco duro modernas. Su historia abarca una serie de nombres como Predictive Failure Analysis o IntelliSafe(Predictive Failure Analysis or IntelliSafe) y aportes de todos los principales fabricantes de discos duros: IBM , Seagate , Quantum , Western Digital . Finalmente, su documentación se presentó por primera vez en 2004 dentro del estándar Parallel ATA y recibió revisiones periódicas posteriormente. El último se emitió en 2011.

¿Hay algo más que le gustaría saber sobre SSD y HDD SMART(SSD and HDD SMART) ?

Este fue nuestro breve estudio sobre el funcionamiento interno de SMART y sus capacidades para monitorear, probar y predecir fallas en el disco duro. El punto de vista principal que debe recordar es que este sistema de autocontrol puede ayudarlo a revisar el estado de salud(health status) de su disco duro(HDD) . Si desea utilizar estos datos SMART(S.M.A.R.T data) para ver si su propia unidad tiene problemas, lea los artículos que recomendamos en este tutorial. Además, si tiene preguntas, use el formulario de comentarios a continuación y hablemos.



About the author

Soy ingeniero de software con más de 10 años de experiencia en el campo de la ingeniería de Windows. Me especializo en el desarrollo de aplicaciones basadas en Windows, así como en hardware y controladores de sonido para el sistema operativo Windows de próxima generación de Microsoft, Windows 11. Mi experiencia en la creación de aplicaciones de Windows me convierte en un activo especialmente valioso para cualquier empresa que busque desarrollar productos tecnológicos innovadores.



Related posts