viernes, 25 de enero de 2013

Conceptos de Datawarehouse


El administrador de un Data Warehouse debe tener las siguientes características: 
  • Esta buscando usuarios potenciales
  • Elige el mejor modelo y el conjunto de datos para aplicarlo
  • Asegurar consistencia e integridad de los datos 
  • Monitorear los resultados.

Un esquema de Data Warehouse común tiene los siguientes componentes

 Sistemas fuente -> ETL -> DW -> reportes

ETL: Es el proceso que se hace para extraer y transformar los datos para cargarlos en otra fuente. Durante este procesa se reportar diferencias y problemas en la congruencia de los datos.

Consejos para el proceso de ETL:
  • Desactivar los triggers, in dices y de preferencia usar niveles de aislamiento.
  • Desactivar índices
  • Bloquear usuarios
  • Re indexar
  • Reabrir los puertos.

Datamart: Es un Data Warehouse pequeño, puede ser una región o un periodo de tiempo. Sirve también para distribuir la carga de trabajo.

sábado, 19 de enero de 2013



OLAP vs OLTP

Oltp:  es una base de datos transaccional para  control operacional,diseñada para las siguientes operaciones:
 Insert
Update
Delete
Selects de bajo volumen. 

Olap: Base de datos de consulta en donde se visualiza la operación, es multidimensional y contiene la verdad de los datos. En esta base de datos se realizan selects de alto volumen

Datawarehouse: definiciones según los distintos autores.

Curtis: Es una base de datos relacional diseñada parara consulta y análisis. 

Kingball: Es una copia de los fatos transaccionales , que se estructura pára consulta y análisis.

Inmon: es considerado el papa de los dadtawarehouse, define las siguientes características:
 Orientado a temas. 
Base de datos integrada. 
No volatil. 
Variante en el tiempo


viernes, 11 de enero de 2013

Antecedentes


Antecedentes del Datawarehouse

1960's

  • Nacen las  tarjetas perforadas y cintas magnéticas en donde el acceso se hacia de forma secuencial.

1970 's

  • Nacen los discos de acceso directo (dasd). 
  • Bases de datos jerarquicas y reticulares. 
  • Primeras arquitecturas de oltp trabajando en linea. 
  • Sistemas cliente, nacen las terminales tontas.
1980's. 
  • Surgen las pc y emulaciones. 
  • Nace 4gl que es sql con oltp y olap. 
  • Toman importancia los administradores de bases de datos, esto debido a que se empiezan a  separar los datos de las aplicaciones.

1990's 
  • Surgen problemas por hacer consulta en la misma base de datos en la cual se hacen las transacciones, por lo que surge la necesidad de separar las base de datos en olap y oltp.
Caracteristicas de OLAP y OLTP

OLTP:
  •  Dato primitivo. 
  • Se conserva a nivel de detalle cada operación.
  •  Actualizable.
  • Refleja el valor actual.
  •  Procesos repetitivos.

OLAP: 
  • Datos derivados.
  • se pierde el detalle por que se enfoca en estadística, es acumulable no actualizable, heuristicos

Estrategico, tactico, operativo, interorganizacional