Datos No Estructurados y Big Data: Su Importancia para las Empresas

La actual economía digital nos está convirtiendo en una sociedad que se mueve alrededor de los datos. La información fluye como no lo ha hecho antes y proviene de múltiples fuentes: internet, whatsapp, sms..Si de estos datos se puede extraer información clave a través de un análisis que revele complejos comportamientos, patrones y eventos a medida que ocurren, los datos se convertirán en una poderosa herramienta.

Pero con grandes volúmenes de datos viene grandes retos. El problema hoy es que la creciente avalancha de información, de petabytes a exabytes, amenaza con dejar gran cantidad de información potencialmente valiosa sin filtrar, sin estructurar y sin procesar.

Las características de Big Data:

Tradicionalmente las empresas han recurrido al análisis de datos para reforzar la eficacia de sus campañas, evitar el abandono por parte de sus clientes y luchar contra el fraude. Big Data, sin embargo, representa un avance revolucionario que va más allá del análisis de datos tradicional, definido por sus tres características principales: la variedad, el volumen y la velocidad (las 3 V de Big Data)

  • La variedad de datos: Los datos pueden provenir de muy diversas fuentes. Aquellos que están contenidos en documentos, archivos y hojas de cálculo se denominan datos estructurados. Estos son fácilmente introducidos, almacenados, consultados y analizados. La gran mayoría de los datos actuales, sin embargo, no son estructurados. Estos provienen de fuentes tales como Facebook, Twitter, Instagram, etc. Y pueden ser texto, foto o vídeo. Estos datos se producen al azar, de una forma masiva y son difíciles de analizar.
  • El gran volumen: la cantidad de datos que se producen diariamente es abrumador. Facebook, por ejemplo, informa que sus usuarios registran 30 billones de contenidos al mes. Para muchos, esta magnitud de datos resulta intimidante: no pueden mantenerse al día y mucho menos ordenarla, analizarla y extraer valor de la misma.
  • La velocidad: a la que se crean, almacenan, analizan y visualizan los datos es vertiginosa. En el pasado, cuando el procesamiento por lotes era una práctica común era normal recibir una actualización de la base de datos todas las noches o incluso una vez por semana. Ordenadores y servidores requieren bastante tiempo para procesar los datos y actualizar las bases de datos. Con Big Data los datos se crean en tiempo real o tiempo casi real. Con la gran disponibilidad de dispositivos conectados a Internet, las máquinas pueden transmitir sus datos en el momento en que se crean. Este gran volumen de datos puede ser difícil de manejar al producirse a una velocidad que para muchos supera con creces su capacidad de procesamiento. Con el fin de extraer valor a estos grandes volúmenes de datos éstos deben ser analizados a una velocidad que coincida con la vertiginosa velocidad a la que la información ingresa en los bancos de datos. En microsegundos es necesario tomar decisiones sobre si un determinado bit de datos merece ser capturado y si tiene relevancia cuando se combina con otros datos. Un  ejemplo de ello podría ser el rostro de un conocido delincuente en un flujo de miles de imágenes: su identificación podría desencadenar un “stop”; o bien señales de creciente abandono de clientes que  podría inspirar una oferta promocional. Siempre que haya una anomalía importante en los datos, ésta debe ser tenida en cuenta antes de que los datos sean almacenados, de modo que pueda llevarse a cabo una acción en tiempo real.

LAS 3 VDe acuerdo con el modelo de las 3 V, el reto de la gestión de Big Data no reside sólo en el volumen, sino en la expansión de las tres propiedades.

El valor está en los datos no estructurados 

Algunos expertos en negocios estiman que aproximadamente el 20% de los datos utilizados en las decisiones de negocio son datos estructurados. Éstos, en general, consisten en información numérica y son objetivos. Se trata de datos que existen, no hay una interpretación.

Los datos no estructurados pueden representar aproximadamente el 80% de la información que se utiliza para tomar eficaces decisiones de negocios, son más subjetivos y por lo general son texto y mensajes multimedia. Los ejemplos incluyen mensajes de correo electrónico, documentos de texto, vídeos, fotos, archivos de audio, presentaciones, páginas web, etc. Si bien este tipo de archivos pueden tener una estructura interna, se consideran “no estructurado”, porque los datos que contienen no encajan en una base de datos. Los datos estructurados son el qué, los datos no estructurados son el por qué.

Big Data está estrechamente asociado a datos no estructurados. IDC (International Data Corporation) estima que el 90% de Big Data son datos no estructurados.

Datos no estructurados
imagen: analyticbridge.com

Hoy en día, el entorno empresarial es tan dinámico y competitivo que las estrategias de marketing en base a datos históricos ya no es suficiente. Para tener éxito, las empresas deben tener un sistema de inteligencia de marketing que sea en tiempo real, si no predictivo.

Así, mediante el análisis de los datos no estructurados que incluyen comportamientos de navegación por la red, foros, sentimiento y opiniones online, combinados con datos estructurados tales como la lealtad del cliente y el historial de compras, las compañías podrían predecir cuándo, dónde y en qué segmentos la demanda será más grande. Esto permitiría  a los minoristas abastecerse y entregar el número correcto de unidades de producto a los canales adecuados.

Las organizaciones de hoy no deberían tener “miedo” a enfrentarse a datos no estructurados. En realidad, el auténtico temor real debe estar en no aprovechar esos recursos. Afortunadamente, en la actualidad hay herramientas para ayudar a manejar bien los datos no estructurados. La clave es empezar ahora y ver lo que puede suceder cuando se ponen los datos no estructurados a trabajar.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s