Qué es synthetic data y por qué debería saberlo el estratega digital

digital-data-synthetic data
Foto: Bigstock

Ya lo dijo Peter Sondergaard: “La información es la gasolina del siglo XXI, y la analítica de datos el motor de combustión”.

Según una encuesta realizada por Warc a 616 profesionales de marketing y publicidad de todo el mundo, hasta un 59 por ciento de los consultados prevé que Big Data será primordial para las agencias, mientras que otro 55 por ciento opina que lo será para las marcas y empresas.

Así lo confirma el top de tendencias digitales 2019 de IAB Spain, pero enfoca esta tenencia aún más, la señala en torno a synthetic data.

Y es que con la inclusión de la Inteligencia Artificial, la utilización de data se ha diversificado pero aún no se perfecciona más allá de la obtención de información.

Durante el año pasado el 89 por ciento de los equipos estratégicos incrementaron sus inversiones en herramientas de analítica enfocadas a Big Data, con el fin de que dicho tratamiento de los datos resultara en insigths mucho más predictivos y prescriptivos antes que descriptivos.

El “pero” radica en que hasta el momento sólo una cuarta parte de los profesionales del marketing asegura es capaz de hacer, según un informe de la World Federation of Advertisers.

Las tendencias

Ahí entra el enfoque de synthetic data, que es -en concreto- información fabricada artificialmente en lugar de generada por eventos del mundo real, por medio de algoritmos.

Se utilizan como soporte para los conjuntos de datos de prueba de producción u operativos, con miras a validar modelos matemáticos y, cada vez más, para capacitar modelos de machine learning.

El diccionario de McGraw-Hill, referente en el ámbito científico, lo resume en “un set de datos que no han sido recopilados directamente por la medición de eventos que han sucedido”.

Se han ido usando en varios ámbitos, principalmente ante la falta de datos recogidos por eventos que se pueden medir de forma directa y en permitir el uso de datos personales sin acceder directamente a ellos; es decir, sin violar la privacidad.

Acerca de esto, hay muchas compañías que están usando el Machine Learning para crear conjuntos de datos sintéticos para ayudar a la toma de decisiones sin incurrir en acercamientos a la intimidad de datos personales de los usuarios.

Desde la perspectiva de Rev Lebaredian, Vice President of Simulation Technology de NVIDIA, los datos simulados son demasiado costosos; sin embargo, la tendencia apunta hacia crecer esta práctica, de ahí que el estratega digital deba estar al tanto de esto más que nunca.