¿Que información merece la pena almacenar?

shutterstock_131784386

 

La capacidad de recopilar y almacenar enormes volúmenes de información a bajo coste, no ha tenido parangón  en ninguna época de la humanidad. Se estima que en los cincuenta años posteriores que siguieron a la invención de la imprenta por parte de Gutenberg se imprimieron unos ocho millones de libros, más de lo que lo que consiguieron todos los escribas de Europa juntos durante los 1.200 años precedentes, desde la fundación de Constantinopla.

Se ha hablado mucho de la velocidad a la que se incrementan los registros disponibles así como la capacidad de computación, pero se ha reflexionado poco acerca de todas las implicaciones que puede tener esta fiebre del almacenamiento, que por cierto también pueden ser negativas.

Nadie niega por ejemplo que los humanos necesitamos de cosas materiales como ropa, utensilios o vehículos para gozar de un cierto bienestar. Esto era tan cierto en la edad de piedra y en las pocas sociedades tribales que sobreviven aisladas por el planeta como lo es en nuestras deslumbrantes ciudades. De hecho en las sociedades modernas muchas veces se intenta medir el bienestar con las capacidad de compra de productos o el valor acumulado de los mismos. El problema es que cualquiera puede acabar prácticamente enterrado en su propio bienestar material.

Entre un 2 y 5% de los adultos sufren en mayor o menor medida del síndrome de acaparamiento compulsivo, un trastorno de la conducta que consiste en acumular todo tipo de artículos u objetos, en muchos casos hasta basura, con dificultad manifiesta para deshacerse de ellos.   En su afán por acumular, muchas veces convierten sus viviendas en lugares impracticables en las que a duras penas se puede realizar las operaciones más sencillas de alimentación, limpieza y reposo, generando además importantes problemas de salubridad.

En los entornos empresariales a veces sucede lo mismo. Muchas veces nos encontramos con empresas que sufren lentitud en sus sistemas debido a la acumulación una gran cantidad de registros sin realizar las correspondientes purgas de bases de datos o que les cuesta una eternidad obtener los informes debido a que estos se obtienen directamente de la base de datos del transaccional sin utilizar ningún tipo de data warehouse o sistema de almacenamiento intermedio.

Los costes de acaparar almacenar información

Los costes de almacenar información han ido descendiendo a velocidades vertiginosas durante las últimas décadas, aunque parece que en los últimos años esta carrera se ha frenado, todavía no hemos sido capaces de digerir todo el poder que no ha conferido esa capacidad de almacenamiento. Simplemente nos dedicamos a almacenar y almacenar con la vaga noción de que un día nos servirá de algo.

Pero aunque los costes económicos de almacenar información hayan descendido estos no han desaparecido y tienen básicamente tres componentes, espacio de almacenamiento, capacidad de proceso y recursos humanos. Para almacenar información necesitamos hardware, software y energía, una infraestructura tanto física como lógica que requiere de un mantenimiento con costes crecientes, si tenemos en cuenta que la empresa va a generando y acumulando información continuamente. Por mucho que los costes de almacenamiento se reduzcan vamos a tener que ir incrementando los gastos si o si. Además la reducción de los costes de almacenamiento así como el coste computación parece ser que está frenando debido a las limitaciones físicas con las que se están encontrando los fabricantes de hardware  llegados a un cierto punto.

Pero además la acumulación de datos históricos en los mismos repositorios que utilizan los principales sistemas de la empresa tiende a ralentizar el acceso a la base de datos, el cual es uno de los principales problemas que encuentran las empresa una vez que sus sistemas llevan ya unos cuantos corriendo estables. Esto implica tener que mejorar la infraestructura  o resignarse a funcionamiento lento y con errores y caídas.

La alternativa es utilizar un sistema secundario de almacenamiento que tendrá sus propios costes adicionales. Cabe decir que la información inútil es una fuente potencial de distracción y en la economía del conocimiento el recurso más escaso es la atención.

Separando el grano de la paja

Tenemos que profundizar un poco más en la definición de información para captar su sentido. Una de las definiciones más comúnmente aceptadas de información es la de una colección de datos organizados que transmiten un mensaje.  Las bases de datos de empresariales en la mayoría de los casos están compuestas de anotaciones numéricas correspondientes a conceptos, tales como unidades del artículo X, precio del artículo Y, cantidad adeuda al proveedor Z, etc. Son por tanto colecciones de datos organizadas, pero su capacidad para transmitir un mensaje que tenga algún valor depende del procesamiento que seamos capaces de darle y de la vigencia de los datos contenidos.

Para saber si merece la pena conservar un dato debemos de hacernos las siguiente preguntas en primera instancia:

  • ¿Tenemos la obligación de conservarlo? Bien sea por imperativo legal, por requerimientos de auditoría o por estricta política de la empresa. En caso afirmativo no es necesario seguir haciéndonos preguntas.
  • ¿Tiene algún poder explicativo por sí solo? Si el dato es significativo por sí solo entonces simplemente tenemos que conservarlo. En caso negativo debemos de hacernos la siguiente pregunta.
  • ¿Tiene algún utilidad como componente agregado o agrupado de un conjunto? En caso afirmativo debemos computar esos conjuntos y documentar de manera fehaciente como han sido obtenidos esos registros “cocinados”. En caso negativo el dato debería de ser destruido.

 

Estos principios sencillos han de ser aplicados en base a las necesidades y circunstancias de cada empresa, por lo que su puesta en práctica nunca será tan fácil. No obstante la aplicación de unas medidas de “higiene informática” es tan necesaria y útil como la aplicación de medidas de higiene persona.