Qué es Big Data: una explicación simple con un ejemplo

El término Big Data se usa cada vez más en casi todo el planeta, en línea y fuera de línea. Y no está relacionado solo con las computadoras. Viene bajo un término general llamado Tecnología(Information Technology) de la Información , que ahora es parte de casi todas las demás tecnologías y campos de estudios y negocios. Big Data no es gran cosa. El bombo que lo rodea es un gran problema para confundirlo. Este artículo echa un vistazo a lo que es Big Data . También contiene un ejemplo de cómo NetFlix utilizó sus datos, o mejor dicho, Big Data , para atender mejor las necesidades de sus clientes.

¿Qué es Big Data?

¿Qué es Big Data?

Los datos que se encuentran en los servidores de su empresa eran solo datos hasta ayer, ordenados y archivados. De repente, se popularizó el argot Big Data , y ahora los datos en tu empresa son Big Data . El término cubre todos y cada uno de los datos que su organización ha almacenado hasta ahora. Incluye datos almacenados en las nubes e incluso las URL(URLs) que marcó. Es posible que su empresa no haya digitalizado todos los datos. Es posible que aún no haya estructurado todos los datos. Pero entonces, todos los datos digitales, en papel, estructurados y no estructurados con su empresa ahora son Big Data .

En resumen, todos los datos, categorizados o no, presentes en sus servidores se denominan colectivamente BIG DATA . Todos estos datos se pueden utilizar para obtener diferentes resultados utilizando diferentes tipos de análisis. No es necesario que todos los análisis utilicen todos los datos. Los diferentes análisis utilizan diferentes partes de BIG DATA para producir los resultados y predicciones necesarios.

Big Data es esencialmente los datos que analiza para obtener resultados que puede usar para predicciones y otros usos. Al usar el término Big Data , de repente su empresa u organización está trabajando con tecnología de la información(Information) de primer nivel para deducir diferentes tipos de resultados utilizando los mismos datos que almacenó intencionalmente o no a lo largo de los años.

¿Qué tan grande es Big Data?

Esencialmente, todos los datos combinados son Big Data , pero muchos investigadores están de acuerdo en que Big Data, como tal, no se puede manipular utilizando hojas de cálculo normales y herramientas regulares de administración de bases de datos. Necesitan herramientas de análisis especiales como Hadoop (estudiaremos esto en una publicación separada) para que todos los datos puedan analizarse de una sola vez (pueden incluir iteraciones de análisis).

Contrariamente a lo anterior, aunque no soy un experto en el tema, diría que los datos con cualquier organización, grande o pequeña, organizada o no, son Big Data para esa organización y que la organización puede elegir sus propias herramientas para analizar la información. datos.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Normalmente, para analizar datos, las personas solían crear diferentes conjuntos de datos basados ​​en uno o más campos comunes para que el análisis fuera fácil. En el caso de Big Data , no es necesario crear subconjuntos para analizarlo. Ahora tenemos herramientas que pueden analizar datos independientemente de su tamaño. Probablemente, estas herramientas mismas clasifican los datos incluso mientras los analizan.

Me parece importante mencionar dos frases del libro “Big Data” de Jimmy Guterman :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-Y-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Entonces ves que tanto el volumen como el análisis son una parte importante de Big Data .

Leer(Read) : ¿Qué es la minería de datos?(What is Data Mining?)

Conceptos de grandes datos

Este es otro punto en el que la mayoría de la gente no está de acuerdo. Algunos expertos dicen que los Big Data Concepts son tres V:

  1. Volumen
  2. Velocidad
  3. Variedad

Algunos otros agregan algunas V más al concepto:

  1. Visualización
  2. Veracidad (Confiabilidad)
  3. Variabilidad y
  4. Valor

Cubriré los conceptos de Big Data en un artículo separado, ya que esta publicación ya se está haciendo grande. En mi opinión, las tres primeras V son suficientes para explicar el concepto de Big Data .

Ejemplo de Big Data: cómo NetFlix(Big Data Example – How NetFlix) lo usó para solucionar sus problemas

Hacia 2008 hubo un corte de energía en NetFlix por lo que muchos clientes quedaron a oscuras. Si bien algunos aún podían acceder a los servicios de transmisión, la mayoría no podía. Algunos clientes lograron obtener sus DVD(DVDs) alquilados , mientras que otros fallaron. Una publicación de blog en el Wall Street Journal dice que Netflix acababa de comenzar la transmisión bajo demanda.

La interrupción hizo que la gerencia pensara en los posibles problemas futuros y, por lo tanto; recurrió a Big Data . Analizó áreas de alto tráfico, puntos susceptibles y rendimiento de la red, etc. utilizando esos datos y trabajó en ellos para reducir el tiempo de inactividad si surge un problema futuro a medida que se globaliza. Aquí está el enlace(the link) al Blog del Wall Street Journal(Wall Street Journal Blog) , si desea ver los ejemplos de Big Data .

Lo anterior resume lo que es Big Data en el lenguaje de un profano. Puedes llamarlo una introducción muy básica. Planeo escribir algunos artículos más sobre factores asociados tales como conceptos(Concepts) , análisis(Analysis) , herramientas(Tools) y usos de Big Data(uses of Big Data) , Big Data 3 V , etc. Mientras tanto, si desea agregar algo a lo anterior, comente y comparta con nosotros.

Lea a continuación(Read next) : ¿Qué es Web Scraping ?



About the author

Soy un desarrollador de iOS con más de 10 años de experiencia. Me especializo en el desarrollo de aplicaciones para iPhone y iPad. Tengo experiencia en la creación de flujos de usuarios, la creación de kits de desarrollo personalizados (CDK) y el trabajo con varios marcos de desarrollo de aplicaciones. En mi trabajo anterior, también desarrollé herramientas para ayudar a administrar la App Store de Apple, que incluyen una herramienta de administración de productos y una herramienta de envío de aplicaciones.



Related posts