From: | "Edwin Quijada" <listas_quijada(at)hotmail(dot)com> |
---|---|
To: | hydra2099(at)hotmail(dot)com |
Cc: | pgsql-es-ayuda(at)postgresql(dot)org |
Subject: | RE: Herramienta ETL |
Date: | 2005-09-05 17:10:59 |
Message-ID: | BAY14-F93E117C9A66F198C15FDCE3A40@phx.gbl |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-es-ayuda |
Bueno, lo que creo q deberas tu mismo hacer un parse. Puede ser en perl u
otra herramienta que te permita manejar esto.
*-------------------------------------------------------*
*-Edwin Quijada
*-Developer DataBase
*-JQ Microsistemas
*-809-747-2787
* " Si deseas lograr cosas excepcionales debes de hacer cosas fuera de lo
comun"
*-------------------------------------------------------*
>From: Ë®îÇk tåþîå þé®Ëz <hydra2099(at)hotmail(dot)com>
>To: pgsql-es-ayuda(at)postgresql(dot)org
>Subject: [pgsql-es-ayuda] Herramienta ETL
>Date: Mon, 05 Sep 2005 04:56:56 +0000
>
>Hola lista les molesto de nuevo.
>
>Saben ustedes de alguna herramienta ETL (Extraction Transform and Loading -
>Extraccion Transformacion y Carga de informacion) he buscado en
>sourceforge, pero no he tenido gran exito, lo mejorcito que he encontrado
>es Enhydra Octopus pero dicha aplicacion extrae informacion de bases de
>datos y lo que yo necesito es extraer informacion de archivos planos (texto
>y word)
>
>La informacion viene de esta manera:
>-----------------------archivo.txt-----------------
>Unidad Acad...: LBM Biomedicina
>Carrera : LBM Biomedicina
>Periodo.......: 200503 Verano 2005
>Curso.........: 11802 MCP -200 -001 FISIOLOGIA
>
>DIAS Hora Inicio Fin Edificio Salon Ubicacion
>LAMJ 1500 1650 327/314 Facultad de Medicina
>
>Sec Matricula Nombre Alumno
>
>001 200227379 Perengano Perez
>001 200227378 Mengano Perez
>.....
>....
>
>-----------------------------------------------------
>
>Tengo que extraer cada uno de los campos que arriba se mencionan, ustedes
>diran, pues copia pega y formatea la informacion y con un load data from
>file ....
>
>Si tal vez seria eso, pero lamentablemente tengo 400 archivos por carrera
>(3 carreras) y tengo otros 3 tipos de archivos similares, en los cuales no
>todos los datos son insertados en la bd sino que todavia hay que hacer
>chequeos varios y los archivos no siempre vienen con el mismo espaciado ni
>con referencias iguales (a vecesi dice Sec otras dice Seccion; Mat otras
>veces Matricula) lo cual dificulta la extraccion de informacion
>
>
>Necesito delimitar la informacion con expresiones regulares, trate de
>hacerlo con Xineo-XIL (Xineo-XML) pero simplemente no lo he podido hacer
>funcionar
>
>
>Alguna Idea???
>Agradezco su ayuda de antemano. Gracias :-)
>
>
>
>---------------------------(fin del mensaje)---------------------------
>TIP 6: ¿Has buscado en los archivos de nuestra lista de correo?
>
> http://archives.postgresql.org/pgsql-es-ayuda
_________________________________________________________________
Visita MSN Latino Noticias: Todo lo que pasa en el mundo y en tu paín, ¡en
tu idioma! http://latino.msn.com/noticias/
From | Date | Subject | |
---|---|---|---|
Next Message | jose fermin francisco ferreras | 2005-09-05 18:35:48 | problema con campo serial |
Previous Message | Leonardo Porras Sánchez | 2005-09-05 14:16:34 | Subir parametros de memoria |