(saltar al contenido)
20 de Noviembre de 2008

El portal para las empresas de Navarra

disminuir | aumentar Tamaño

Buscar: Información sobre el buscador

Tecnologías de la Información

Formación y eventos

Noviembre 2008

L M X J V S D
     12
3456789
10111213141516
17181920212223
24252627282930

< Octubre Diciembre >

Monográficos

Conozca las empresas de Navarra
Todas las empresas del directorio de Navactiva aparecen aquí. Dese de alta. Es un servicio gratuito.

Portada > Tecnologías de la Información > Asesoría > Diseño y desarrollo de aplicaciones

02. Asesoría

Diseño y desarrollo de aplicaciones

Datawarehouse vs Base de Datos Corporativa

¿Cuales son las diferencias entre un DWH y una Base de Datos corporativa? Sabemos que ambas pueden existir en una organización, si solo se podría elegir uno, ¿qué razones tendría para elegir un DWH y/o qué razones tendría para escoger una Base de Datos corporativa?

20/06/2005 Lever Consulting
ver currículum

Un Data Warehouse (DW) es un almacén o repositorio de datos categorizados, que concentra un gran volumen de información de interés para toda una organización, la cual se distribuye por medio de diversas herramientas de consulta y de creación de informes orientadas a la toma de decisiones.

Existe muchas definiciones de distintos autores, pero una de las mas famosas puede ser la dada por Inmon[MicroSt96](considerado el padre de las Bases de Datos) en 1992: "Un Data Warehouse es una colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo, organizados para soportar necesidades empresariales".

Los Data warehouses a menudo almacenan gran cantidad de información, la cual está a veces subdividida en pequeñas unidades lógicas. Periodicamente, se importan estos datos de otros sistemas de información dentro del data warehouse, para realizar sobre ellos un procesamiento posterior.

Un Data Warehouse se diferencia de una Base de Datos operacional de una empresa, diremos que un data warehouse puede derivar de la Base de Datos corporativa, mediante la importación de información, pero el data warehouse no es esa BD operacional.

Las principales características o propiedades de un DW son las siguientes:
El DW está orientado a la toma de decisiones. Un buen diseño de la base de datos favorece el análisis y la recuperación de datos para obtener una ventaja estratégica y para facilitar las decisiones de marketing. El DW almacena datos categorizándolos o estructurándolos de forma que favorezcan el análisis de los datos y puedan proporcionar análisis históricos.

El DW no está orientado a procesos relacionados con la operativa de la empresa. El DW está preparado para ser explotado mediante herramientas específicas que permiten la extracción de información significativa y patrones de comportamiento que permanecen ocultos en un enorme repositorio de datos.

Esta explotación de los datos se suele realizar con herramientas de Data mining o minería de datos, que suelen realizar predicciones del funcionamiento futuro a partir de la evolución de los datos actualmente almacenados en el repositorio. Estas utilidades trasforman los datos en información útil para resolver cuestiones de negocio y marketing.

Software para un Data Warehouse
La información estratégica se almacena en gigabytes de datos de marketing o índice de transacciones de venta. La información debe ser extraída de alguna forma para la toma de decisiones.

En este caso se necesita software especializado que permita capturar los datos relevantes en forma rápida y pueda verse a través de diferentes dimensiones de los datos. El software no debería limitarse únicamente al acceso a los datos, si no también, al análisis significativo de los datos. En efecto, transformar los datos de la información cruda o no procesada, en información útil para la empresa.

Los softwares o herramientas de negocios inteligentes se colocan sobre la plataforma data warehousing y proveen este servicio. Debido a que son el punto principal de contacto entre la aplicación del depósito y la gente que lo usa, estas herramientas pueden constituir la diferencia entre el éxito o fracaso de un depósito.

Las herramientas de negocio inteligentes se han convertido en los sucesores de los sistemas de soporte de decisión, pero tienen un alcance más amplio. No solamente ayudan en las decisiones de soporte sino, en muchos casos, estas herramientas soportan muchas funciones operacionales y de misión-crítica de la compañía. Sin embargo, estos productos no son infalibles ya que sólo se consigue el máximo provecho del data warehouse, si elige las herramientas adecuadas a las necesidades de cada usuario final.

Veamos las herramientas software que existen:
1 Herramientas de consulta y reporte
Las herramientas de consulta al igual que la mayoría de herramientas visuales, permiten apuntar y dar un click a los menús y botones para especificar los elementos de datos, condiciones, criterios de agrupación y otros atributos de una solicitud de información. La herramienta de consulta genera entonces un llamado a una base de datos, extrae los datos pertinentes, efectúa cálculos adicionales, manipula los datos si es necesario y presenta los resultados en un formato claro. Se puede almacenar las consultas y los pedidos de reporte para trabajos subsiguientes, como está o con modificaciones. El procesamiento estadístico se limita comúnmente a promedios, sumas, desviaciones estándar y otras funciones de análisis básicas. Aunque las capacidades varían de un producto a otro, las herramientas de consulta y reporte son más apropiadas cuando se necesita responder a la pregunta ¿"Qué sucedió"? (Ejemplo: ¿"Cómo comparar las ventas de los productos X,Y y Z del mes pasado con las ventas del presente mes y las ventas del mismo mes del año pasado?").

2 Herramientas de base de datos multidimensionales / OLAP
Las primeras soluciones OLAP (On Line Analytical Processing), estuvieron basadas en bases de datos multidimensionales (MDDBS). Un cubo estructural (dos veces un hipercubo o un arreglo multidimensional) almacenaba los datos para que se puedan manipular intuitivamente y claramente ver las asociaciones a través de dimensiones múltiples Pero este enfoque tiene varias limitaciones:

Las nuevas estructuras de almacenamiento de datos requieren bases de datos propietarias. No hay realmente estándares disponibles para acceder a los datos multidimensionales.

La segunda limitación de un MDDB concierne al desarrollo de una estructura de datos. Las compañías generalmente almacenan los datos de la empresa en bases de datos relacionales, lo que significa que alguien tiene que extraer, transformar y cargar estos datos en el hipercubo.

Este proceso puede ser complejo y consumidor de tiempo pero, nuevamente, los proveedores están investigando la forma de solucionarlos. Las herramientas de extracción de datos y otras automatizan el proceso, trazando campos relacionales en la estructura multidimensional y desarrollando el MDDB sobre la marcha. Algunos proveedores ofrecen ahora la técnica OLAP relacional (Relational On Line Analytical Processing - ROLAP), que explora y opera en el data warehouse directamente usando llamadas SQL estándares. Los defensores de ROLAP argumentan que se usan estándares abiertos (SQL) y que se esquematiza (nivel de detalle) los datos para hacerlos más fácilmente accesibles. Por otra parte, argumentan que una estructura multidimensional nativa logra mejor performance y flexibilidad, una vez que se desarrolla el almacén de los datos.

3 Sistemas de información ejecutivos
Las herramientas de sistemas de información ejecutivos (Executive Information Systems - EIS), proporcionan medios sumamente fáciles de usar para consulta y análisis de la información confiable. Generalmente se diseñan para el usuario que necesita conseguir los datos rápidamente, pero quiere utilizar el menor tiempo posible para comprender el uso de la herramienta. El precio de esta facilidad de uso es que por lo general existen algunas limitaciones sobre las capacidades analíticas disponibles con el sistema de información ejecutivo. Además, muchas de las herramientas de consulta/reporte y OLAP/multidimensional, pueden usarse para desarrollar sistemas de información ejecutivos. El concepto de sistema de información ejecutivo es simple: los ejecutivos no tienen mucho tiempo, ni la habilidad en muchos casos, para efectuar el análisis de grandes volúmenes de datos. El EIS presenta vistas de los datos simplificados, altamente consolidados y mayormente estáticas.

4 Herramientas data mining
Data mining es una categoría de herramientas de análisis open-end. En lugar de hacer preguntas, se toma estas herramientas y se pregunta algo "interesante", una tendencia o una agrupación peculiar, por ejemplo. El proceso de data mining extrae los conocimientos guardados o información predictiva desde el data warehouse sin requerir pedidos o preguntas específicas. Las herramientas Mining usan algunas de las técnicas de computación más avanzadas para generar modelos y asociaciones como redes neurales, detección de desviación, modelamiento predictivo y programación genética. Mining es un dato-conducido, no una aplicación-conducida.

5 Sistemas de gestión de bases de datos
Estos software proporcionan procesamiento en paralelo y algo fuera de los aspectos ordinarios, que puedan ser especialmente interesantes para la gente de desarrollo de data warehouse y de sistemas de soporte de decisiones.

Ventajas y desventajas
La utilización de Datawarehouse proporciona una serie de ventajas:
Proporciona un gran poder de procesamiento de información.
Permite una mayor flexibilidad y rapidez en el acceso a la información.
Facilita la toma de decisiones en los negocios.
Las empresas obtienen un aumento de la productividad.
Proporciona una comunicación fiable entre todos los departamentos de la empresa.
Mejora las relaciones con los proveedores y los clientes.
Permite conocer qué está pasando en el negocio, es decir, estar siempre enterado de los buenos y malos resultados.
Transforma los datos en información y la información en conocimiento
Permite hacer planes de forma más efectiva.
Reduce los tiempos de respuesta y los costes de operación.
Resumiendo, el Datawarehouse proporciona una información de gestión
accesible, correcta, uniforme y actualizada. Proporciona un menor coste en la toma de decisiones, una mayor flexibilidad ante el entorno, un mejor servicio al cliente y permite el rediseño de los procesos.

Pero los Datawarehouse también tienen algunas desventajas:
Requieren una revisión del modelo de datos, objetos, transacciones y además del almacenamiento.
Tienen un diseño complejo y multidisciplinar.
Requieren una reestructuración de los sistemas operacionales.
Tienen un alto coste.
Requieren sistemas, aplicaciones y almacenamiento específico.

| ir al listado | formular consulta | versión para imprimir |

|© Copyright, Centro Europeo de Empresas e Innovación de Navarra. Aviso Legal