¿Te has preguntado alguna vez que es el Big Data o Datos Masivos? ¿Para qué sirve? ¿Por qué es tan importante para las empresas a nivel mundial? En este artículo te daré las respuestas a cada una de estas interrogantes.
El Big Data es un término que sirve para referirse a grandes volúmenes de datos generados en la operación diaria de un entorno empresarial o de orden público. Los datos se clasifican en estructurados y no estructurados.
Piensa en todas las operaciones que realizas diariamente con tu dispositivo móvil. Desde utilizar tu correo electrónico y navegar en internet hasta utilizar aplicaciones como whatsapp, telegram, netflix o subir contenido a redes sociales como facebook, instagram, tiktok, entre otros.
El Big Data describe el gran volumen de datos de gran valor que nos ayuda a obtener información relevante para tomar decisiones importantes a nivel empresarial, sacarle provecho y darle un excelente rumbo a un negocio en tiempo real.
Algunos datos citan que a finales de los años 80 es cuando se habla por primera vez de grandes flujo de datos.Esto se generó gracias al surgimiento del Internet en el año 1983. El cual se fija como el año en que nace la red de redes, cuando el Departamento de Defensa de Estados Unidos utiliza el protocolo TCP/IP en su infraestructura Arpanet creando así la red Arpa Internet.
Con el paso de los años se queda con el nombre de Internet. 10 años después, comenzaron a surgir los datos masivos y con él, la gran revolución de la recolección, almacenamiento y análisis de datos principalmente gracias a motores de búsquedas como Google, que nace en septiembre de 1998 y otros portales web de Comercio Electrónico.
Poco a poco fue aumentando el número de portales web. Algunos como Amazon y eBay empezaban a generar grandes volúmenes de datos.
A mediados del año 2007 se publican artículos que llevan el concepto de Big Data a las masas. También prolifera el uso de las redes sociales y aplicaciones móviles gracias al surgimiento de teléfonos inteligentes que superan a los ordenadores en cuanto a acceso a internet y movilidad.
Desde entonces son cada vez más los dispositivos conectados a internet. Desde computadoras, laptops, smartphones y tablets hasta televisores, sensores, hogares y ciudades inteligentes.
El Big Data es de gran utilidad para las empresas, porque les permite optimizar procesos, detectar problemas, reconocer patrones, tendencias y hasta incrementar su rentabilidad gracias a la utilización de técnicas y estrategias de manipulación, procesamiento y análisis de datos.
Mediante la recopilación y el análisis de los datos, las empresas pueden abordar problemas complejos de forma mucho más rápida y eficiente. Esto es un factor clave que les permite incrementar su rendimiento y su competitividad en el mercado.
Actualmente son muchos los sectores empresariales que sacan provecho del Big Data. Entre ellos está el sector industrial, el Comercio Electrónico, la banca, Telecomunicaciones, Telemedicina, Marketing, entre otros.
Cada uno de estos sectores utiliza las bases y técnicas del Big Data y Ciencia de Datos de la mejor manera posible y de acuerdo a sus necesidades empresariales. Esto implica que cada sector puede presentar problemas diferentes de distinta naturaleza y por lo tanto cada empresa abordará su contexto de forma personalizada.
En el caso del Comercio Electrónico, una tienda virtual puede sacar provecho de los datos en movimiento dentro de su portal web.
Esto permite desarrollar estrategias para responder a preguntas tales cómo: ¿Cuáles son los productos más solicitados? ¿En que horarios se tiene mayor volumen de usuarios? ¿Cuál es la tasa de conversión del portal web? ¿Desde que dispositivos los usuarios visitan nuestro portal web? ¿Cuáles productos se venden más y cuáles se venden menos?
En el caso del sector de las Telecomunicaciones, las estrategias de Big Data se pueden enfocar desde el punto de vista operativo en cuanto a la infraestructura de la red o desde el punto de vista comercial en base al tráfico de los usuarios.
De esta manera a las operadoras de Telecomunicaciones, les interesa saber de dónde viene el tráfico de la red, qué páginas visitan más los usuarios, que aplicaciones son las más utilizadas, cuáles de ellas generan más tráfico y en qué horarios, por poner algunos ejemplos.
Existen múltiples fuentes de datos. Diariamente millones de usuarios en el mundo, utilizan la mayoría de ellas. Desde Redes Sociales como Facebook, Twitter, Instagram o TikTok, aplicaciones como Whatsapp, Telegram, Skype, videojuegos en línea hasta plataformas de e-learning o plataformas de entretenimiento como Youtube o Netflix, entre otros.
Los tipos de fuentes de datos pueden ser diversos y existe una enorme cantidad en el mundo. Adicionalmente los objetos ahora también pueden conectarse a internet y realizar operaciones con datos. En un hogar inteligente, se pueden tener sensores inalámbricos de temperatura, humedad, movimiento que pueden estar capturando datos del entorno y enviarlos a una solución en Internet para monitoreo y control o bien para ser visualizados posteriormente a través de una aplicación en el dispositivo móvil del usuario.
Este fenomeno se da gracias al llamado Internet de las Cosas (IoT). Una filosofía que permite no solo la conectividad, sino también la interacción a través de internet entre objetos, personas, procesos y datos.
En general, los datos en base al usuario provienen del uso diario de sitios web, aplicaciones y otras operaciones con sus dispositivos móviles. Esto implica que la mayoría de la información de un usuario incluyendo su ubicación física, sus intereses, publicaciones, mensajes y hasta sus gustos se encuentran en su dispositivo móvil.
Por su parte, los datos en base a las empresas, provienen de sensores, bases de datos, informes, imágenes, archivos, mensajes, correos electrónicos, equipos de Tecnologías de Información y en general de cualquier otro tipo de operaciones o fuentes que generan datos no estructurados.
Los datos se miden normalmente en cantidades expresadas en bytes. 1 byte normalmente representa 8 bits de datos. A medida que los datos crecen en cantidades masivas, tenemos diferentes términos para expresar grandes volúmenes de datos.
De acuerdo a su tamaño, los datos de mayor tamaño pueden expresarse en:
De acuerdo a estimaciones realizadas por la empresa Cisco System, gracias al IoT y a tecnologías como el 5G y el Wi-Fi 6, se tendrán más de 50000 millones de dispositivos conectados a internet en los próximos años.
Otra cifra interesante está relacionada con el crecimiento global del tráfico IP en Internet. De acuerdo a un estudio realizado por Cisco System, se estima que el tráfico superará significativamente los 132 Exabytes por mes en el período 2021 a 2025.
Curso de Big Data
Aprende técnicas para la captura, limpieza, procesamiento y análisis de datos masivos.
VER CURSO AHORA. Telecapp C.A. Todos los derechos reservados.