RE: Herramienta ETL

From: "Edwin Quijada" <listas_quijada(at)hotmail(dot)com>
To: hydra2099(at)hotmail(dot)com
Cc: pgsql-es-ayuda(at)postgresql(dot)org
Subject: RE: Herramienta ETL
Date: 2005-09-05 17:10:59
Message-ID: BAY14-F93E117C9A66F198C15FDCE3A40@phx.gbl
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Bueno, lo que creo q deberas tu mismo hacer un parse. Puede ser en perl u
otra herramienta que te permita manejar esto.

*-------------------------------------------------------*
*-Edwin Quijada
*-Developer DataBase
*-JQ Microsistemas
*-809-747-2787
* " Si deseas lograr cosas excepcionales debes de hacer cosas fuera de lo
comun"
*-------------------------------------------------------*

>From: Ë®îÇk tåþîå þé®Ëz <hydra2099(at)hotmail(dot)com>
>To: pgsql-es-ayuda(at)postgresql(dot)org
>Subject: [pgsql-es-ayuda] Herramienta ETL
>Date: Mon, 05 Sep 2005 04:56:56 +0000
>
>Hola lista les molesto de nuevo.
>
>Saben ustedes de alguna herramienta ETL (Extraction Transform and Loading -
>Extraccion Transformacion y Carga de informacion) he buscado en
>sourceforge, pero no he tenido gran exito, lo mejorcito que he encontrado
>es Enhydra Octopus pero dicha aplicacion extrae informacion de bases de
>datos y lo que yo necesito es extraer informacion de archivos planos (texto
>y word)
>
>La informacion viene de esta manera:
>-----------------------archivo.txt-----------------
>Unidad Acad...: LBM Biomedicina
>Carrera : LBM Biomedicina
>Periodo.......: 200503 Verano 2005
>Curso.........: 11802 MCP -200 -001 FISIOLOGIA
>
>DIAS Hora Inicio Fin Edificio Salon Ubicacion
>LAMJ 1500 1650 327/314 Facultad de Medicina
>
>Sec Matricula Nombre Alumno
>
>001 200227379 Perengano Perez
>001 200227378 Mengano Perez
>.....
>....
>
>-----------------------------------------------------
>
>Tengo que extraer cada uno de los campos que arriba se mencionan, ustedes
>diran, pues copia pega y formatea la informacion y con un load data from
>file ....
>
>Si tal vez seria eso, pero lamentablemente tengo 400 archivos por carrera
>(3 carreras) y tengo otros 3 tipos de archivos similares, en los cuales no
>todos los datos son insertados en la bd sino que todavia hay que hacer
>chequeos varios y los archivos no siempre vienen con el mismo espaciado ni
>con referencias iguales (a vecesi dice Sec otras dice Seccion; Mat otras
>veces Matricula) lo cual dificulta la extraccion de informacion
>
>
>Necesito delimitar la informacion con expresiones regulares, trate de
>hacerlo con Xineo-XIL (Xineo-XML) pero simplemente no lo he podido hacer
>funcionar
>
>
>Alguna Idea???
>Agradezco su ayuda de antemano. Gracias :-)
>
>
>
>---------------------------(fin del mensaje)---------------------------
>TIP 6: ¿Has buscado en los archivos de nuestra lista de correo?
>
> http://archives.postgresql.org/pgsql-es-ayuda

_________________________________________________________________
Visita MSN Latino Noticias: Todo lo que pasa en el mundo y en tu paín, ¡en
tu idioma! http://latino.msn.com/noticias/

In response to

  • Herramienta ETL at 2005-09-05 04:56:56 from Ë®îÇk tåþîå þé®Ëz

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message jose fermin francisco ferreras 2005-09-05 18:35:48 problema con campo serial
Previous Message Leonardo Porras Sánchez 2005-09-05 14:16:34 Subir parametros de memoria