APLICACIONES DATA WAREHOUSE

Oracle Warehouse rompe las barreras de las soluciones existentes de Data Warehousing brindando a las corporaciones el acceso a la totalidad de su información, de cualquier forma y en cualquier lugar. El resultado es la capacidad de edificar depósitos de datos que escalan desde gigabytes hasta terabytes, y que satisfacen los requerimientos de la toma de decisiones en los negocios y la recuperación de información en cada nivel de la empresa corporativa.

 

Aspectos generales de un Data Warehuosing

Un Data Warehousing está diseñado para almacenar grandes cantidades de datos de referencia o de historial, que normalmente se utiliza como soporte para la toma de decisiones y las necesidades de recuperar información de una empresa.

Un Data Warehousing consiste en tres grandes componentes:

 

  1. Depósito para almacenar los datos;
  2. Herramientas para extraer, transformar y cargar fuentes de datos externos y opcionales
  3. Herramientas para hacer referencia y analizar los datos en el depósito.

Por el contrario, los sistemas de Procesamiento de Transacción En Línea (OLTP) están diseñados para mejorar la eficiencia operacional de una empresa. Se encargan del registro de las transacciones que reflejan el estado actual de los negocios. Los datos de transacción constituyen normalmente la mayor parte de la información en un Data Warehousing.

Oracle7 ya ha demostrado ser considerablemente más rápido y fácil de gestionar que otros productos de base de datos para aplicaciones de Data Warehouse. Oracle8 potencia todavía más el liderazgo de Oracle con las siguientes características:

  1. Mejora en el procesamiento de consultas en estrella
  2. Más operaciones en paralelo

Mejora en el procesamiento de consultas en estrella

Una consulta en estrella, o esquema de estrella, ocurre cuando existen una o más tablas muy grandes, denominadas a menudo tablas de eventos, que mantienen relaciones con varias tablas más pequeñas denominadas tablas de dimensiones. Oracle7 introdujo la funcionalidad de optimización de consultas en estrella, que proporciona mejores rendimientos para este tipo de consultas. En Oracle8 el procesamiento de las consultas en estrella se ha mejorado significativamente para aportar una optimización aún mayor de este tipo de consultas.

 

El algoritmo de optimización de consultas en estrella de Oracle8, a diferencia del utilizado en Oracle7, no produce combinaciones de producto cartesiano, procesa una consulta en estrella en dos fases:

 

  1. Recupera el número exacto de filas necesarias de la tabla de eventos, esta recuperación se realiza a través de índices de mapa de bits y es sumamente eficiente.
  2. Combina el conjunto de resultados de la tabla de eventos con las tablas de dimensiones pertinentes, lo cual permite una mejor optimización de consultas en estrella más complejas, como por ejemplo las que tienen varias tablas de eventos.

El nuevo algoritmo aprovecha los índices de mapa de bits, que ofrecen un considerable ahorro de espacio de almacenamiento en comparación con los métodos anteriores, que precisaban índices en arboles tipo B con columnas concatenadas. Este algoritmo. La exploración de estos índices puede realizarse en tablas tanto particionadas como no.

 

Nuevas opciones en paralelo

Las transacciones de inserción, actualización y eliminación se pueden ejecutar ahora en paralelo con Oracle8. Estas operaciones, denominadas DML, se ejecutan en paralelo a través de varios procesos. Al ejecutar estas operaciones en paralelo, la transacción se realiza con mayor rapidez que si la misma transacción se ejecutara en serie.. Las operaciones DML en paralelo resultan útiles en soporte para la toma de decisiones (DSS) o de data warehouse, en los que son habituales este tipo de operaciones DML. Sin embargo, las operaciones DML en paralelo también pueden agilizar los trabajos batch que se ejecutan en una base de datos OLTP.

Oracle8 admite inserciones, actualizaciones y eliminaciones en paralelo en tablas particionadas y no particionadas. La operación de inserción en paralelo es similar a la operación de carga por ruta directa disponible en Oracle7. La inserción en paralelo en una tabla mejora el rendimiento al dar formato y escribir los bloques de disco directamente en los archivos de datos, eludiendo los cuellos de botella que se producen en la memoria caché intermedia y en la gestión del espacio. En este caso, cada proceso de exploración de la consulta de inserción introduce datos en un segmento situado por encima del límite máximo de ocupación de la tabla. Cuando finalizan todos los procesos de inserción, la transacción se graba en la memoria y el límite máximo de ocupación se traslada más allá de los nuevos segmentos.

Normalmente, las operaciones DML en paralelo se realizan en programas de procesamiento batch o desde dentro de una aplicación que ejecuta una inserción, actualización o eliminación en masa. Hay disponibles nuevos parámetros para especificar el paralelismo de las instrucciones DML.