El torrente de datos

Grandes mentiras tecnológicas(I): El volumen de información crece de forma exponencial

Esta es una de las grandes mentiras que podemos leer negro sobre blanco casi a diario y que se origina en la confusión habida entre datos e información. Según Wikipedia, que tampoco podemos considerar como un parangón de fidelidad, información es:un conjunto organizado datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje”.

La caída en los costes de almacenamiento, el abaratamiento de los procesadores y su consecuente difusión ha provocado que cada vez almacenemos más datos. Parece ser que la cosa no va a detenerse aquí y probablemente los tecnólogos de Silycon Valley no estarán contentos hasta que la plancha de casa almacene al menos un Terabyte de datos diario. Pero detrás de todo esto subyace algunas preguntas: ¿Cuántos de estos datos tienen algún valor? ¿Somos capaces de aprovecharlos? ¿Tendré que vaciar de datos la plancha para que no funcione a trompicones?

El sentido común sugiere que a mayor volumen de datos más conocimiento, pero como casi siempre se equivoca. En la mayoría de los casos la realidad funciona justo al revés. Por muchos petabytes, zetabytes y trilobites que seamos capaces empacar en nuestros smartphones, a menos que estos sean capaces de cambiar nuestro estado de consciencia nunca serán información. Y aún existe otro factor de fondo mucho más inquietante, la información puede tener efectos perniciosos, haciéndonos creer cosas que no son ciertas e incluso perjudiciales para nosotros.

La cuestión de fondo es que no existe ninguna correlación entre el volumen de datos y el volumen de información. El primer conjunto depende de la capacidad de nuestros cacharros y sistemas de registro de generar y capturar datos, el segundo depende de nuestra capacidad para interpretar nuestro torrente de información sensorial.

El verdadero volumen de datos y su verdadero valor

Aquí aparece el problema de la redundancia. Hace años yo tenía todos mis correos almacenados en mi ordenador, que a su vez también estaban almacenados en el servidor de la. Hoy en día también utilizo mi teléfono y el navegador web. Por tanto, tenemos la misma información repetida en varios dispositivos. Esto se agrava más todavía con el uso de correos masivos prácticamente idénticos y que a su vez son almacenados por cada usuario en sus respectivos dispositivos.

También hay que tener en cuenta que muchos contenidos que se producen son refritos sin sustancia de otros. Este hecho no es nuevo. Los medios tradicionales también lo han estado haciendo al hacerse eco de noticias de agencias que son repetidas con pocas modificaciones por parte de un gran número de medios. ¿Qué valor tiene toda esa información?  La verdad es que muy poco y a veces incluso negativo. En general se asume el principio de que no hay información mala y que todo depende de lo que seamos capaces de hacer con ella. Alguien avispado y con suficientes recursos podría ser capaz de extraer algo de valor de todo ese sin sentido, pero precisamente es ahí donde reside la verdadera raíz del problema.

La cuestión de la atención, cada vez más tontos

Un apóstol de los datos nos dirá que cualquier dato es útil sólo tenemos que encontrar la forma de extraerle valor. Sin entrar a discutir este punto que me parece totalmente falso, sólo apuntaré dos cuestiones que suelen ser pasadas por alto por los tecnólogos, debido a su arbitrariedad y alto componente abstracto, lo cual impide que sean contenidas en algoritmos, pero no por ello son menos trascendentales: el coste de oportunidad y escasez de recursos, concretamente de la escasez del recurso más preciado: la atención. Porque cuando prestamos atención a una cosa no prestamos atención a otra y puede que eso que ignoramos sea a la postre más interesante.

La tecnología contrariamente a lo que pensamos tiende a hacernos más inútiles. Es mucho mayor la destreza y atención que necesitaba un cazador del periodo lítico para obtener alimentos que a la de agricultor de la edad de bronce. A su vez un comprador de supermercado necesita todavía menos habilidades. Desde que la revolución mecánica se impuso la necesidad de fuerza ha sido cada vez menor, hasta el punto de tener que hacer ejercicio para no acabar convertidos en bolas de sebo. Desde que el uso de calculadoras y ordenadores se ha generalizado nuestra capacidad de cálculo mental se ha visto mermada.  Numerosos estudios apuntan a que Internet ha tenido un efecto parecido en nuestra capacidad de concentración y síntesis. A todo esto, se une el problema de la sobre estimulación. En una sociedad con un altísimo nivel de estímulos e información disponible resulta cada vez más difícil extraer algo de valor porque hay que escarbar cada vez más para separar el grano de la paja. Estudios conductuales llevados a cabo en el campo de la psicología sugieren que, a partir de un cierto nivel, cuanta más información tenemos peor decidimos. Lo cual explica como un taxista puede elegir mejores valores de inversión que un gestor de fondos.

El desarrollo de tecnologías como el Big Data y el Machine Learning no son más que la consecuencia inevitable de todos estos problemas planteados. Los sistemas tradicionales de gestión de información se han mostrado incapaces de procesar y aprovechar todo este maremágnum de datos que generamos cada día. Si las empresas hoy en día quieren evitar ahogarse en este mar datos o lo que es peor que les arrase como un tsunami deberían comenzar a plantearse el cambiar su forma de gestionar la información.

En este sentido las empresas deben incorporar sistemas cada vez más “inteligentes” no solamente capaces de procesar y estructurar toda la información, sino que además deben poder tomar decisiones en base a los datos obtenidos. Esta es la única forma posible de contar cada vez con más y mejor información además de trabajar y mejorar nuestra capacidad de información y atención.