Dimensiones de trabajo en Data 2.0

Para madurar en el uso del dato, una organización debe construir una serie de dimensiones de trabajo que soportan esa madurez. Data 2.0 es el nombre que le damos a la conjunción de las siguientes dimensiones, que están muy profundamente interrelacionadas (cada una influye muy fuertemente sobre las demás), trabajando de forma orquestada y constituyendo un "todo" que, si abarca a toda la organización, nos permitiría calificar a esta como data driven company:

Datos

Si algo aporta la transformación digital, son datos... procedentes de todas partes (tantas, que decimos internet de todo, ya no solo internet de las cosas). Cuando se diseña una máquina, un producto, un proceso... una parte ya muy importante de ese diseño es pensar qué datos producirá y cómo se van a capturar.

Herramientas

Se ha hablado y se habla mucho de Big Data... siendo la mejor definición de Big Data un conjunto de arquitecturas que son capaces de trabajar con grandes volúmenes de datos estructurados (registros simples) y no estructurados (vídeos, imágenes, audios...).

Pues bien, si algo ha conllevado el auge de Big Data es, sin duda, una ingente cantidad de herramientas, que podemos "ver" en el gráfico siguiente, en el cual cada diminuto gráfico representa a una herramienta distinta:

Fuente: https://venturebeat.com/2020/10/21/the-2020-data-and-ai-landscape/

Confirmo al lector que el gráfico apenas puede verse... por enfatizar la enorme cantidad de herramientas disponibles (puede verse al detalle aquí: https://venturebeat.com/2020/10/21/the-2020-data-and-ai-landscape/). Tan y tan grande, que una organización no puede abarcarlas todas. 

Es un error tratar de dominar todas las herramientas de trabajo con datos, pero ni siquiera es recomendable dominar todas las que sirven para solucionar el mismo tipo de problema: tenemos disponibles docenas de herramientas para machine learning (aprendizaje automático); otras tantas para Deep learning (análisis del contenido de imágenes, por ejemplo); más aún para data mining (extraer insights de los datos). 

Y esta amalgama tan amplia es un problema en sí mismo: puede ser complicado decidir qué herramienta utilizar, hasta tal punto que muchas organizaciones desarrollan las suyas propias... lo cual hace incrementar más y más este gráfico anterior!!

Es por esto también que vivimos la época del auge de Smart data, es decir, poner algo más de control sobre esta explosión de Big data producida hasta 2021; ahora se busca simplificar la tecnología, simplificar las soluciones para poder aplicar mejores economías de escala en el tratamiento de los datos, que es precisamente un punto más a favor si queremos madurar como data driven company.

Infraestructura

En esta parte ya que da totalmente claro que la solución escalable, flexible, elástica y segura es el cloud; una empresa data driven company no puede basar sus recursos de infraestructura en un centro de proceso de datos local... puesto que no es escalable cuando llegue el momento necesario (no puede crecer debido a cierta demanda de almacenamiento o procesamiento de datos que debamos satisfacer).
Nos resultaría caro y difícil que sea flexible (decidir para qué proceso de almacenamiento o cálculo utilizamos los recursos disponibles) y elástica (aunque en ocasiones no utilicemos todos los recursos de los que disponemos en nuestro centro de proceso de datos, el coste de mantenimiento del mismo no disminuye).
Ni tampoco segura: las empresas proveedores de espacios en la nube garantizan la persistencia e inviolabilidad de nuestros espacios de nube privados; responsabilidad que tendremos que asumir y resolver con recursos propios en caso de trabajar con un centro de proceso de datos local.

Niveles de analítica (casos de uso)

Si no resolvemos casos de uso, toda infraestructura y esfuerzo en trabajar con los datos será, simplemente, un desperdicio. Data 2.0 significa también lanzar casos de uso, que generen ventaja y valor de negocio, que no serían posibles sin un uso maduro de los datos, por ejemplo:
  • ¿A quién podemos vender ciertos insights de datos que estamos generando?
  • ¿Podemos encontrar modelos en los datos que no solo apliquen a un proceso de nuestra organización, sino también a otros?
  • ¿Podemos combinar insights de forma que tengamos una visión más completa y más valiosa de cómo funciona nuestra organización?
  • ¿Podemos conocer las causas de una mejora, o un empeoramiento, en nuestras ventas, en relación con la mejora o empeoramiento de otros conjuntos de indicadores?
  • ¿Podemos detectar procesos o actividades que no están generando valor, y analizar qué ocurriría si dejamos de llevarlas a cabo, obteniendo un ahorro de costes?
Y todo caso de uso, pensando en ser aplicando desde un punto de vista descriptivo (qué ocurre), diagnóstico (por qué ocurre), predictivo (qué puede ocurrir) o prescriptivo (qué debemos hacer).