Archivo de la categoría: Data management

¿Como orientar mi empresa al dato?

La orientación al dato es uno de los pilares clave de la transformación digital. Las empresas que asumen este principio quieren que la veracidad y objetividad sean las que soporten sus decisiones y para lograrlo incorporan la cultura del dato como una parte integral de su modelo de negocio. Para lograrlo, todos los procesos de la empresa tienen que generar datos útiles que han de ser puesto en valor.

¿Significa esto suspender el papel de la intuición y el olfato en las decisiones empresariales? Para nada, la intuición y el olfato necesitan de un buen combustible para funcionar y ese es la información de calidad. Por otro lado la intuición no es infalible y si podemos disponer de información de calidad que nos permita determinar en qué medida nuestro instinto es certero, estaremos mucho más seguros. Sólo así seremos capaces de confirmar, mejorar y ampliar esa intuición y es aquí donde entra en juego el papel del dato de calidad.  

La orientación de una empresa al dato se basa en cuatro pilares fundamentales: generación, captura, procesamiento y análisis. En sí mismos estos cuatro aspectos encierran el ciclo de gestión del dato.

La generación y captura de datos

El punto de partida es la generación de datos, esta tiene que ser un objetivo deliberado y buscado activamente. Una empresa de transporte puede generar muchísimos datos provenientes de los viajes que realizan sus vehículos o simplemente no generarlos. Por ejemplo, en países donde los camiones no están obligados a utilizar tacometros, los desplazamientos de camiones no generan datos sobre velocidades, paradas, etc. Si no añadimos un dispositivo GPS tampoco tendremos datos sobre geolocalización. Nuestro objetivo por tanto debe de ser que todos los procesos de la empresa generen un torrente de datos continúo sobre aspectos interesantes del negocio.

Para obtener un modelo útil de generación de datos debemos de plantearnos muchas preguntas y profundizar en el análisis de nuestro modelo de negocio. No se trata de generar datos al tumtum sino de tener una trazabilidad del desarrollo continúo de los procesos. También es muy interesante incorporar fuentes de datos externas que combinadas con las propias puedan ofrecernos una visión analítica mucho más completa y rica de la realidad de nuestro negocio y de cómo este se relaciona con su entorno.

Todo ese flujo de datos tiene que ser recogido de manera centralizada en un repositorio. Debido a la naturaleza heterogénea de los mismos, el tipo de infraestructura más recomendable  sea un data lake pero existen múltiples alternativas. Lo importante es tener una política clara de gestión del dato, que nos permita tener una buena trazabilidad y evitar duplicidades y datos inservibles.

Organizando y explotando los datos

Los datos per se carecen de valor, no son más que puras anotaciones, su valor aparece cuando podemos asociarlos a hechos, conceptos e incluso otros datos. Durante la fase de procesamiento de los datos debemos de transferirlos a un repositorio final donde se encontrarán correctamente identificados, organizados y relacionados con el resto de datos de la empresa, ya que este será la base que nos permita su explotación rentable

A la hora de analizarlos debemos tener en cuenta los dos enfoques principales: los análisis estructurados y los análisis exploratorios. En los primeros identificamos kpi’s o indicadores que se obtienen mediante combinaciones y análisis predefinidos basados en nuestro conocimiento del negocio o en las prácticas de gestión asumidas por la empresa. Ejemplos de esto pueden ser la rentabilidad, el ROI, la tasa de devoluciones y otra variables que nos permiten obtener una valoración del desempeño de nuestra empresa en múltiples aspectos.

El análisis exploratorio se realiza mediante sofisticadas técnicas de análitica avanzada. En este tipo de análisis los modelos predefinidos se dejan a un lado y es el análisis estadístico de los datos el que nos permite detectar hallar modelos de relación, que nos permite identificar causas de problemas complejos.  También nos permite descubrir correlaciones y patrones ocultos que afloran hechos relevantes acerca de nuestro negocio que podemos utilizar para resolver problemas o generar ventajas competitivas.

Este es un análisis muy resumido y la aplicación de estas premisas de forma completa supone un reto para cualquier empresa, pero espero que sea de utilidad para todas las personas que quieran saber algo más acerca de este tema.  

Grandes mentiras tecnológicas(I): El volumen de información crece de forma exponencial

Esta es una de las grandes mentiras que podemos leer negro sobre blanco casi a diario y que se origina en la confusión habida entre datos e información. Según Wikipedia, que tampoco podemos considerar como un parangón de fidelidad, información es:un conjunto organizado datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje”.

La caída en los costes de almacenamiento, el abaratamiento de los procesadores y su consecuente difusión ha provocado que cada vez almacenemos más datos. Parece ser que la cosa no va a detenerse aquí y probablemente los tecnólogos de Silycon Valley no estarán contentos hasta que la plancha de casa almacene al menos un Terabyte de datos diario. Pero detrás de todo esto subyace algunas preguntas: ¿Cuántos de estos datos tienen algún valor? ¿Somos capaces de aprovecharlos? ¿Tendré que vaciar de datos la plancha para que no funcione a trompicones?

El sentido común sugiere que a mayor volumen de datos más conocimiento, pero como casi siempre se equivoca. En la mayoría de los casos la realidad funciona justo al revés. Por muchos petabytes, zetabytes y trilobites que seamos capaces empacar en nuestros smartphones, a menos que estos sean capaces de cambiar nuestro estado de consciencia nunca serán información. Y aún existe otro factor de fondo mucho más inquietante, la información puede tener efectos perniciosos, haciéndonos creer cosas que no son ciertas e incluso perjudiciales para nosotros.

La cuestión de fondo es que no existe ninguna correlación entre el volumen de datos y el volumen de información. El primer conjunto depende de la capacidad de nuestros cacharros y sistemas de registro de generar y capturar datos, el segundo depende de nuestra capacidad para interpretar nuestro torrente de información sensorial.

El verdadero volumen de datos y su verdadero valor

Aquí aparece el problema de la redundancia. Hace años yo tenía todos mis correos almacenados en mi ordenador, que a su vez también estaban almacenados en el servidor de la. Hoy en día también utilizo mi teléfono y el navegador web. Por tanto, tenemos la misma información repetida en varios dispositivos. Esto se agrava más todavía con el uso de correos masivos prácticamente idénticos y que a su vez son almacenados por cada usuario en sus respectivos dispositivos.

También hay que tener en cuenta que muchos contenidos que se producen son refritos sin sustancia de otros. Este hecho no es nuevo. Los medios tradicionales también lo han estado haciendo al hacerse eco de noticias de agencias que son repetidas con pocas modificaciones por parte de un gran número de medios. ¿Qué valor tiene toda esa información?  La verdad es que muy poco y a veces incluso negativo. En general se asume el principio de que no hay información mala y que todo depende de lo que seamos capaces de hacer con ella. Alguien avispado y con suficientes recursos podría ser capaz de extraer algo de valor de todo ese sin sentido, pero precisamente es ahí donde reside la verdadera raíz del problema.

La cuestión de la atención, cada vez más tontos

Un apóstol de los datos nos dirá que cualquier dato es útil sólo tenemos que encontrar la forma de extraerle valor. Sin entrar a discutir este punto que me parece totalmente falso, sólo apuntaré dos cuestiones que suelen ser pasadas por alto por los tecnólogos, debido a su arbitrariedad y alto componente abstracto, lo cual impide que sean contenidas en algoritmos, pero no por ello son menos trascendentales: el coste de oportunidad y escasez de recursos, concretamente de la escasez del recurso más preciado: la atención. Porque cuando prestamos atención a una cosa no prestamos atención a otra y puede que eso que ignoramos sea a la postre más interesante.

La tecnología contrariamente a lo que pensamos tiende a hacernos más inútiles. Es mucho mayor la destreza y atención que necesitaba un cazador del periodo lítico para obtener alimentos que a la de agricultor de la edad de bronce. A su vez un comprador de supermercado necesita todavía menos habilidades. Desde que la revolución mecánica se impuso la necesidad de fuerza ha sido cada vez menor, hasta el punto de tener que hacer ejercicio para no acabar convertidos en bolas de sebo. Desde que el uso de calculadoras y ordenadores se ha generalizado nuestra capacidad de cálculo mental se ha visto mermada.  Numerosos estudios apuntan a que Internet ha tenido un efecto parecido en nuestra capacidad de concentración y síntesis. A todo esto, se une el problema de la sobre estimulación. En una sociedad con un altísimo nivel de estímulos e información disponible resulta cada vez más difícil extraer algo de valor porque hay que escarbar cada vez más para separar el grano de la paja. Estudios conductuales llevados a cabo en el campo de la psicología sugieren que, a partir de un cierto nivel, cuanta más información tenemos peor decidimos. Lo cual explica como un taxista puede elegir mejores valores de inversión que un gestor de fondos.

El desarrollo de tecnologías como el Big Data y el Machine Learning no son más que la consecuencia inevitable de todos estos problemas planteados. Los sistemas tradicionales de gestión de información se han mostrado incapaces de procesar y aprovechar todo este maremágnum de datos que generamos cada día. Si las empresas hoy en día quieren evitar ahogarse en este mar datos o lo que es peor que les arrase como un tsunami deberían comenzar a plantearse el cambiar su forma de gestionar la información.

En este sentido las empresas deben incorporar sistemas cada vez más “inteligentes” no solamente capaces de procesar y estructurar toda la información, sino que además deben poder tomar decisiones en base a los datos obtenidos. Esta es la única forma posible de contar cada vez con más y mejor información además de trabajar y mejorar nuestra capacidad de información y atención.