Herramienta ETL

From: Ë®îÇk tåþîå þé®Ëz <hydra2099(at)hotmail(dot)com>
To: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Herramienta ETL
Date: 2005-09-05 04:56:56
Message-ID: BAY110-F222A6FCA44FDAFA8C73256ABA40@phx.gbl
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Hola lista les molesto de nuevo.

Saben ustedes de alguna herramienta ETL (Extraction Transform and Loading -
Extraccion Transformacion y Carga de informacion) he buscado en sourceforge,
pero no he tenido gran exito, lo mejorcito que he encontrado es Enhydra
Octopus pero dicha aplicacion extrae informacion de bases de datos y lo que
yo necesito es extraer informacion de archivos planos (texto y word)

La informacion viene de esta manera:
-----------------------archivo.txt-----------------
Unidad Acad...: LBM Biomedicina
Carrera : LBM Biomedicina
Periodo.......: 200503 Verano 2005
Curso.........: 11802 MCP -200 -001 FISIOLOGIA

DIAS Hora Inicio Fin Edificio Salon Ubicacion
LAMJ 1500 1650 327/314 Facultad de Medicina

Sec Matricula Nombre Alumno

001 200227379 Perengano Perez
001 200227378 Mengano Perez
.....
....

-----------------------------------------------------

Tengo que extraer cada uno de los campos que arriba se mencionan, ustedes
diran, pues copia pega y formatea la informacion y con un load data from
file ....

Si tal vez seria eso, pero lamentablemente tengo 400 archivos por carrera (3
carreras) y tengo otros 3 tipos de archivos similares, en los cuales no
todos los datos son insertados en la bd sino que todavia hay que hacer
chequeos varios y los archivos no siempre vienen con el mismo espaciado ni
con referencias iguales (a vecesi dice Sec otras dice Seccion; Mat otras
veces Matricula) lo cual dificulta la extraccion de informacion

Necesito delimitar la informacion con expresiones regulares, trate de
hacerlo con Xineo-XIL (Xineo-XML) pero simplemente no lo he podido hacer
funcionar

Alguna Idea???
Agradezco su ayuda de antemano. Gracias :-)

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Leonardo Porras Sánchez 2005-09-05 14:16:34 Subir parametros de memoria
Previous Message Erik De leon 2005-09-05 00:22:00 parametros para el createuser