¿Qué es la minería de datos? Fundamentos y sus Técnicas.

La base de la cuarta revolución industrial dependerá en gran medida de los datos(Data) y la conectividad(Connectivity) . Los servicios de análisis(Analysis Services) capaces de desarrollar o crear soluciones de minería de datos jugarán un papel clave en este sentido. Podría ayudar a analizar y predecir los resultados del comportamiento de compra del cliente para dirigirse a compradores potenciales. Los datos(Data) se convertirán en un nuevo recurso natural y el proceso de extraer información relevante de estos datos sin clasificar asumirá una importancia inmensa. Como tal, una comprensión adecuada del término: minería de datos(Data Mining) , sus procesos y su aplicación podría ayudarnos a desarrollar un enfoque holístico para esta palabra de moda.

Fundamentos de la Minería de Datos(Data Mining Basics) y sus Técnicas

procesamiento de datos

La minería de datos, también conocida como Knowledge Discovery in Data ( KDD ), consiste en buscar grandes cantidades de datos para descubrir patrones y tendencias que van más allá del simple análisis. Esto, sin embargo, no es una solución de un solo paso sino un proceso de varios pasos y se completa en varias etapas. Éstos incluyen:

1] Recopilación y preparación de datos

Comienza con la recopilación de datos y su adecuada organización. Esto ayuda a mejorar significativamente las posibilidades de encontrar la información que se puede descubrir a través de la minería de datos.

2] Construcción y evaluación de modelos

El segundo paso en el proceso de minería de datos es la aplicación de varias técnicas de modelado. Estos se utilizan para calibrar los parámetros a valores óptimos. Las técnicas empleadas dependen en gran medida de las capacidades analíticas requeridas para abordar una gama de necesidades organizacionales y llegar a una decisión.

Examinemos brevemente algunas técnicas de minería de datos. Se encuentra que la mayoría de las organizaciones combinan dos o más técnicas de minería de datos para formar un proceso apropiado que cumpla con los requisitos de su negocio.

Leer(Read) : ¿Qué es Big Data?(What is Big Data?)

Técnicas de Minería de Datos

  1. Asociación:  la (Association – )asociación(Association) es una de las técnicas de minería de datos más conocidas. Bajo esto, se descifra un patrón basado en una relación entre artículos en la misma transacción. Por(Hence) lo tanto , también se conoce como la técnica de relación. Los minoristas de grandes marcas confían en esta técnica para investigar los hábitos/preferencias de compra de los clientes. Por ejemplo, al realizar un seguimiento de los hábitos de compra de las personas, los minoristas pueden identificar que un cliente siempre compra crema cuando compra chocolates y, por lo tanto, sugerir que la próxima vez que compre chocolates también querrá comprar crema.
  2. Clasificación(Classification) : esta técnica de minería de datos se diferencia de las anteriores en que se basa en el aprendizaje automático y utiliza técnicas matemáticas como la programación lineal(Linear) , los árboles de decisión , los (Decision)sistemas neuronales .(Neural)red. En la clasificación, las empresas intentan crear software que pueda aprender a clasificar los elementos de datos en grupos. Por ejemplo, una empresa puede definir una clasificación en la aplicación que "dados todos los registros de empleados que se ofrecieron a renunciar a la empresa, prediga la cantidad de personas que probablemente renunciarán a la empresa en el futuro". En tal escenario, la empresa puede clasificar los registros de los empleados en dos grupos, a saber, "salir" y "permanecer". Luego puede usar su software de minería de datos para clasificar a los empleados en grupos separados creados anteriormente.
  3. Agrupación(Clustering)Diferente(Different)los objetos que exhiben características similares se agrupan en un solo grupo a través de la automatización. Muchos de estos clústeres se crean como clases y los objetos (con características similares) se colocan en ellos en consecuencia. Para entender esto mejor, consideremos un ejemplo de gestión de libros en la biblioteca. En una biblioteca, la vasta colección de libros está completamente catalogada. Los elementos del mismo tipo se enumeran juntos. Esto nos facilita encontrar un libro de nuestro interés. De manera similar, al usar la técnica de agrupamiento, podemos mantener libros que tienen algunos tipos de similitudes en un grupo y asignarle un nombre adecuado. Entonces, si un lector está buscando un libro relevante para su interés, solo tiene que ir a ese estante en lugar de buscar en toda la biblioteca. Así, la técnica de agrupamiento define las clases y pone objetos en cada clase,
  4. Predicción(Prediction) : la predicción es una técnica de minería de datos que a menudo se usa en combinación con otras técnicas de minería de datos. Implica el análisis de tendencias, clasificación, coincidencia de patrones y relación. Al analizar eventos pasados ​​o instancias en una secuencia adecuada, uno puede predecir con seguridad un evento futuro. Por ejemplo, la técnica de análisis de predicción se puede utilizar en la venta para predecir la ganancia futura si se elige la venta como variable independiente y la ganancia como variable dependiente de la venta. Luego, con base en los datos históricos de ventas y ganancias, se puede dibujar una curva de regresión ajustada que se usa para la predicción de ganancias.
  5. Árboles de decisión(Decision trees) : dentro del árbol de decisión, comenzamos con una pregunta simple que tiene múltiples respuestas. Cada respuesta conduce a una pregunta adicional para ayudar a clasificar o identificar los datos para que se puedan categorizar o para que se pueda hacer una predicción basada en cada respuesta. Por ejemplo, usamos el siguiente árbol de decisiones para determinar si jugar o no al cricket ODI : Árbol de decisiones de minería de datos(Data Mining Decision Tree) : Comenzando en el nodo raíz, si el pronóstico del tiempo predice lluvia, debemos evitar el partido ese día. Alternativamente, si el pronóstico del tiempo es claro, deberíamos jugar el partido.

La minería de datos(Data Mining) está en el corazón de los esfuerzos analíticos en una variedad de industrias y disciplinas como comunicaciones, seguros(Insurance) , educación(Education) , manufactura(Manufacturing) , banca(Banking) y venta minorista(Retail) , entre otras. Por lo tanto, tener una información correcta al respecto es fundamental antes de aplicar las diferentes técnicas.



About the author

Soy técnico de Windows 10 y he estado ayudando a personas y empresas a aprovechar el nuevo sistema operativo durante muchos años. Tengo un gran conocimiento sobre Microsoft Office, incluido cómo personalizar la apariencia y las aplicaciones para diferentes usuarios. Además, sé cómo usar la aplicación Explorer para explorar y encontrar archivos y carpetas en mi computadora.



Related posts