Tecnología

Big data

Bigdata

Si bien Big Data se puede entender por lo relativo a colectar y analizar muchos datos, no hay una cantidad exacta que indique cuando esta cantidad es suficiente para cumplir con el criterio preciso de su definición. Sin embargo, es claro que hablamos de big data cuando superamos las capacidades convencionales de las bases de datos.

Big Data es un término que se usa principalmente vinculado a la necesidad de analizar no solo grandes cantidades de datos, sino también la búsqueda de patrones que a menudo son contra intuitivos, es decir, que no pueden ser descubiertos a simple vista.

Uno de los puntos que debe entenderse en los análisis de Big Data es que no solo se refieren al efecto numérico de una muestra ­– como por ejemplo, muchas personas, muchas manzanas o muchos planetas – sino que puede hacer referencia a los datos que se generan respecto de atributos de la unidad de la muestra o de las relaciones diferentes que se pueden dar entre estos.

En tal sentido, si quisiéramos analizar durante una semana el contenido de las conversaciones de una familia de unos pocos miembros, y además, entender todas las interacciones entre sus componentes léxicos y no léxicos y la relación de todo esto con sus patrones de conducta, muy probablemente requeriríamos de metodologías y tecnologías de análisis de Big Data.

Tecnología

Análisis semántico

Relleno

Llamamos Análisis Semántico al conjunto de metodologías y tecnologías que hacen posible comprender el significado de los contenidos lingüísticos, relatos o discursos de las personas con las cuales interactuamos.

Entre las metodologías empleadas se usan diversos sistemas, como por ejemplo los de Corpus Lingüístico, que tienen variedades de módulos que permiten efectuar diversos análisis estadísticos. Ellos indicarían la significancia de asociaciones (relaciones aleatorias o que revisten alguna causalidad), apariciones, agrupaciones, etc. También se emplean sistemas de visualización de grafos que permiten inspeccionar visualmente las redes de conceptos, sus frecuencias, sus asociaciones y adyacencias.

Cuando los resultados de estos métodos de análisis se categorizan por variables (país, género o edad), se pueden desprender regularidades y anomalías que permiten comprender, sin pre-conceptos, ideas que son representativas de grupos particulares.