¿Qué es la minería de datos? Fundamentos y sus Técnicas.
La base de la cuarta revolución industrial dependerá en gran medida de los datos(Data) y la conectividad(Connectivity) . Los servicios de análisis(Analysis Services) capaces de desarrollar o crear soluciones de minería de datos jugarán un papel clave en este sentido. Podría ayudar a analizar y predecir los resultados del comportamiento de compra del cliente para dirigirse a compradores potenciales. Los datos(Data) se convertirán en un nuevo recurso natural y el proceso de extraer información relevante de estos datos sin clasificar asumirá una importancia inmensa. Como tal, una comprensión adecuada del término: minería de datos(Data Mining) , sus procesos y su aplicación podría ayudarnos a desarrollar un enfoque holístico para esta palabra de moda.
Fundamentos de la Minería de Datos(Data Mining Basics) y sus Técnicas
La minería de datos, también conocida como Knowledge Discovery in Data ( KDD ), consiste en buscar grandes cantidades de datos para descubrir patrones y tendencias que van más allá del simple análisis. Esto, sin embargo, no es una solución de un solo paso sino un proceso de varios pasos y se completa en varias etapas. Éstos incluyen:
1] Recopilación y preparación de datos
Comienza con la recopilación de datos y su adecuada organización. Esto ayuda a mejorar significativamente las posibilidades de encontrar la información que se puede descubrir a través de la minería de datos.
2] Construcción y evaluación de modelos
El segundo paso en el proceso de minería de datos es la aplicación de varias técnicas de modelado. Estos se utilizan para calibrar los parámetros a valores óptimos. Las técnicas empleadas dependen en gran medida de las capacidades analíticas requeridas para abordar una gama de necesidades organizacionales y llegar a una decisión.
Examinemos brevemente algunas técnicas de minería de datos. Se encuentra que la mayoría de las organizaciones combinan dos o más técnicas de minería de datos para formar un proceso apropiado que cumpla con los requisitos de su negocio.
Leer(Read) : ¿Qué es Big Data?(What is Big Data?)
Técnicas de Minería de Datos
- Asociación: la (Association – )asociación(Association) es una de las técnicas de minería de datos más conocidas. Bajo esto, se descifra un patrón basado en una relación entre artículos en la misma transacción. Por(Hence) lo tanto , también se conoce como la técnica de relación. Los minoristas de grandes marcas confían en esta técnica para investigar los hábitos/preferencias de compra de los clientes. Por ejemplo, al realizar un seguimiento de los hábitos de compra de las personas, los minoristas pueden identificar que un cliente siempre compra crema cuando compra chocolates y, por lo tanto, sugerir que la próxima vez que compre chocolates también querrá comprar crema.
- Clasificación(Classification) : esta técnica de minería de datos se diferencia de las anteriores en que se basa en el aprendizaje automático y utiliza técnicas matemáticas como la programación lineal(Linear) , los árboles de decisión , los (Decision)sistemas neuronales .(Neural)red. En la clasificación, las empresas intentan crear software que pueda aprender a clasificar los elementos de datos en grupos. Por ejemplo, una empresa puede definir una clasificación en la aplicación que "dados todos los registros de empleados que se ofrecieron a renunciar a la empresa, prediga la cantidad de personas que probablemente renunciarán a la empresa en el futuro". En tal escenario, la empresa puede clasificar los registros de los empleados en dos grupos, a saber, "salir" y "permanecer". Luego puede usar su software de minería de datos para clasificar a los empleados en grupos separados creados anteriormente.
- Agrupación(Clustering) – Diferente(Different)los objetos que exhiben características similares se agrupan en un solo grupo a través de la automatización. Muchos de estos clústeres se crean como clases y los objetos (con características similares) se colocan en ellos en consecuencia. Para entender esto mejor, consideremos un ejemplo de gestión de libros en la biblioteca. En una biblioteca, la vasta colección de libros está completamente catalogada. Los elementos del mismo tipo se enumeran juntos. Esto nos facilita encontrar un libro de nuestro interés. De manera similar, al usar la técnica de agrupamiento, podemos mantener libros que tienen algunos tipos de similitudes en un grupo y asignarle un nombre adecuado. Entonces, si un lector está buscando un libro relevante para su interés, solo tiene que ir a ese estante en lugar de buscar en toda la biblioteca. Así, la técnica de agrupamiento define las clases y pone objetos en cada clase,
- Predicción(Prediction) : la predicción es una técnica de minería de datos que a menudo se usa en combinación con otras técnicas de minería de datos. Implica el análisis de tendencias, clasificación, coincidencia de patrones y relación. Al analizar eventos pasados o instancias en una secuencia adecuada, uno puede predecir con seguridad un evento futuro. Por ejemplo, la técnica de análisis de predicción se puede utilizar en la venta para predecir la ganancia futura si se elige la venta como variable independiente y la ganancia como variable dependiente de la venta. Luego, con base en los datos históricos de ventas y ganancias, se puede dibujar una curva de regresión ajustada que se usa para la predicción de ganancias.
- Árboles de decisión(Decision trees) : dentro del árbol de decisión, comenzamos con una pregunta simple que tiene múltiples respuestas. Cada respuesta conduce a una pregunta adicional para ayudar a clasificar o identificar los datos para que se puedan categorizar o para que se pueda hacer una predicción basada en cada respuesta. Por ejemplo, usamos el siguiente árbol de decisiones para determinar si jugar o no al cricket ODI : Árbol de decisiones de minería de datos(Data Mining Decision Tree) : Comenzando en el nodo raíz, si el pronóstico del tiempo predice lluvia, debemos evitar el partido ese día. Alternativamente, si el pronóstico del tiempo es claro, deberíamos jugar el partido.
La minería de datos(Data Mining) está en el corazón de los esfuerzos analíticos en una variedad de industrias y disciplinas como comunicaciones, seguros(Insurance) , educación(Education) , manufactura(Manufacturing) , banca(Banking) y venta minorista(Retail) , entre otras. Por lo tanto, tener una información correcta al respecto es fundamental antes de aplicar las diferentes técnicas.
Related posts
26 mejores software de minería de datos
Cómo utilizar Automatic Data Type feature en Excel
BitLocker Setup no pudo exportar la tienda BCD (Boot Configuration Data)
Cómo gestionar el Data Usage Limit en Windows 10
No se puede importar Registry File. No todo el Data fue escrito en el registro
¿Qué es Data Analytics y qué se usa para
Site Data claro para determinado sitio en Chrome or Edge usando Developer Tools
Renee Becca Data Backup Software PARA Windows PC
Cómo descargar Instagram Data usando Instagram Data Export Tool
¿Qué son USB Data Blockers? Mejor USB Data Blockers para comprar en Amazon
Best Free Online Data Visualization Tools
Microarchitectural Data Sampling (MDS) Vulnerabilidad explicada
¿Por qué las empresas recopilan, venden, compran o almacenan datos personales?
Desactive Telemetry & Data Collection en Windows 10 usando Task Scheduler
¿Cuál es la diferencia entre Data and Information?
¿Qué es la Big Data - una explicación simple con Example?
EaseUS Data Recovery Wizard Free le permite recuperar datos perdidos o eliminados
0xc0000098: Windows Boot Configuration Data no contiene OS entry
Borrar Cookies, Site Data, Cache para sitio web específico: Chrome Edge Firefox
Cómo descargar o extraer su Google Maps Data