martes, 9 de octubre de 2012

Data WareHouse


Data WareHouse

En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenada en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos. El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea necesario.
Otra definición de Data Warehouse:
Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas específicos de negocios, para permitir nuevas consultas, análisis, reporteador y decisiones, siendo muy costoso.

Los usuarios de un Data Warehouse necesitan accesar a los datos complejos, frecuentemente desde fuentes múltiples y de formas no predecibles.
Los usuarios que accesan a los datos operacionales, comúnmente efectúan tareas predefinidas que, generalmente requieren acceso a una sola base de datos de una aplicación. Por el contrario, los usuarios que accesan al data warehouse, efectúan tareas que requieren acceso a un conjunto de datos desde fuentes múltiples y frecuentemente no son predecibles. Lo único que se conoce (si es modelada correctamente) es el conjunto inicial de datos que se han establecido en el depósito.
Por ejemplo, un especialista en el cuidado de la salud podría necesitar accesar a los datos actuales e históricos para analizar las tendencias de costos, usando un conjunto de consultas predefinidas. Por el contrario, un representante de ventas podría necesitar accesar a los datos de cliente y producto para evaluar la eficacia de una campaña de marketing, creando consultas base o ad-hoc para encontrar nuevamente necesidades definidas.








Conclusiones
Me sorprende la cantidad de memoria que se utilizaba años atrás como un diskette de 3,5 in (1.38Mb), siendo de gran utilidad para el usuario y actualmente micro SD de miles de veces más grandes en cuanto a capacidad y con un tamaño físico muy reducido o tambien los 1000 Gb aproximados a un piso de libros académicos. En algún momento me pregunte si los Zettabyte se utilizaban en algún proyecto o alguna empresa mundial, y viendo un ejemplo encontré que 5 Zettabytes son equivalentes a todas las palabras habladas siempre por los seres humanos, siendo algo de un tamaño inmenso, pero no imposible, en estos tiempos.
El Data Warehouse es un Almacén de datos centralizado donde requiere de un software que permite conocer mejor el perfil del cliente y poder dar respuesta a sus necesidades. En este sistema se basan las estrategias del Marketing One to One. Empresas reconocidas que utilizan el Data Warehouse son British Airways, Union Pacific, Air France, Coca-Cola, Adidas, Nike, 3M, Bosh Siemens... aquellas que manejan grandes volúmenes de datos relativos a clientes, compras, marketing, transacciones, operaciones. Es difícil encontrar pequeñas y medianas empresas que utilicen estos sistemas ya que es de muy alto costo.
1.- ¿Cómo eran al principio?, ¿Cumplían las mismas funciones que ahora?
La metodología de diseño de arriba hacia abajo genera puntos de vista dimensional muy consistente de los datos en los data marts ya que todos los puestos de datos se cargan desde el repositorio centralizado. Diseño top-Down también ha demostrado ser robustos frente a cambios en el negocio. La generación de nuevos puestos de datos dimensional frente a los datos almacenados en el almacén de datos es una tarea relativamente simple. La principal desventaja de la metodología de arriba hacia abajo es que representa un proyecto muy grande, con un alcance muy amplio.
2.- ¿Es costoso?
Si, además de que es difícil encontrar pequeñas y medianas empresas que utilicen estos sistemas ya que es de muy alto costo.


Cybergrafia

No hay comentarios:

Publicar un comentario