From: | "Fernando Hevia" <fhevia(at)ip-tel(dot)com(dot)ar> |
---|---|
To: | "'ALFONSO REYES'" <alfonsoreyescruz(at)hotmail(dot)com>, <baron(dot)rojo(dot)cuerdas(dot)de(dot)acero(at)gmail(dot)com> |
Cc: | <marcosnegrini(at)yahoo(dot)com(dot)ar>, <pgsql-es-ayuda(at)postgresql(dot)org> |
Subject: | RE: Buscar palabras dentro de Bytea o Text |
Date: | 2008-11-13 18:39:05 |
Message-ID: | B1BEF146DF3D4103A4F7B452C1D40479@iptel.com.ar |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-es-ayuda |
No estoy familiarizado con este tipo de aplicaciones, pero imagino que lo
eficiente no es almacenar el texto completo sino sólo las palabras claves.
Dependerá del volumen de archivos que pienses manejar, pero en principio
buscaría no subir los archivos a la BD y sólo almacenar el path ó url a cada
archivo asociado a las palabras claves aplicables en las búsquedas fts.
Otro punto es la conversión de archivos formateados (doc, pdf) a texto puro
a fines que puedas pre-parsearlos y generar las palabras claves.
Quizá te sirva ver alguna de las soluciones open-source en ese sentido:
http://www.searchtools.com/tools/tools-opensource.html
Saludos,
Fernando.
_____
De: pgsql-es-ayuda-owner(at)postgresql(dot)org
[mailto:pgsql-es-ayuda-owner(at)postgresql(dot)org] En nombre de ALFONSO REYES
Enviado el: Jueves, 13 de Noviembre de 2008 14:50
Para: baron(dot)rojo(dot)cuerdas(dot)de(dot)acero(at)gmail(dot)com
CC: marcosnegrini(at)yahoo(dot)com(dot)ar; pgsql-es-ayuda(at)postgresql(dot)org
Asunto: RE: [pgsql-es-ayuda] Buscar palabras dentro de Bytea o Text
Mil gracias Marco, quisiera saber si estoy claro en lo que me indicas :
1)Si deseo realizar busquedas tengo que guardar como text
2)Si deseo mantener el formato como bytea
Pero si deseo las 2 opociones tendría que duplicar, el archivo para poder
buscar y bajar en el formato que subio el cliente?, y si el usuario guarda
como PDF, me va a poder leer como texto o necesito hacer alguna
transaformación.
La búsqueda la haria con fts para los campos TEXT y creo que en la version
8.3.5 ya esta embebida en el motor de postgres
Por favor su ayuda ES VITAL PARA MI TRABAJO y muchas gracias a todos.. :)
> Date: Thu, 13 Nov 2008 09:33:54 -0300
> From: baron(dot)rojo(dot)cuerdas(dot)de(dot)acero(at)gmail(dot)com
> To: alfonsoreyescruz(at)hotmail(dot)com
> Subject: Re: [pgsql-es-ayuda] Buscar palabras dentro de Bytea o Text
> CC: marcosnegrini(at)yahoo(dot)com(dot)ar; pgsql-es-ayuda(at)postgresql(dot)org
>
> El día 13 de noviembre de 2008 9:16, ALFONSO REYES
> <alfonsoreyescruz(at)hotmail(dot)com> escribió:
> >
> > Hola lista soy nuevo en postgres y estoy desarrollando una aplicacion
para
> > almacenar documentos de tipo:
> > Word ,Excel,Pdf, etc.. la interfaz es punto net y no se como debo
almacemar
> > en la base es decir con que tipo para cuando el usuario ingrese una
palabra
> > clave esta sea buscada dentro del archivo que almaceno similar a una
> > busqueda con Like '%palabra%', pero el momento que exista un resultado
el
> > usuario pueda bajar el acrchivo.
> >
> > Desde ya mil gracias por su valiosa ayuda.
>
> mira acá
http://archives.postgresql.org/pgsql-es-ayuda/2008-06/msg00396.php
>
>
> OT: Como se las arreglara el grep, para hacer esto ????
>
> usuario(at)mipc:~/download/trabajo/doc_informix$ grep -i tablas *.doc
> Coincidencia en el fichero binario diccionario_datos.doc
> usuario(at)mipc:~/download/trabajo/doc_informix$ file diccionario_datos.doc
> diccionario_datos.doc: Microsoft Office Document
> usuario(at)mipc:~/download/trabajo/doc_informix$
> --
> TIP 2: puedes desuscribirte de todas las listas simultáneamente
> (envía "unregister TuDirecciónDeCorreo" a majordomo(at)postgresql(dot)org)
_____
Invite your mail contacts to join your friends list with Windows Live
Spaces. It's easy! Try it!
<http://spaces.live.com/spacesapi.aspx?wx_action=create&wx_url=/friends.aspx
&mkt=en-us>
From | Date | Subject | |
---|---|---|---|
Next Message | Gilberto Castillo Martínez | 2008-11-13 19:43:46 | Sobre el PGDAY |
Previous Message | Edwin Quijada | 2008-11-13 16:54:53 | RE: Buscar palabras dentro de Bytea o Text |