RE: Buscar palabras dentro de Bytea o Text

From: "Fernando Hevia" <fhevia(at)ip-tel(dot)com(dot)ar>
To: "'ALFONSO REYES'" <alfonsoreyescruz(at)hotmail(dot)com>, <baron(dot)rojo(dot)cuerdas(dot)de(dot)acero(at)gmail(dot)com>
Cc: <marcosnegrini(at)yahoo(dot)com(dot)ar>, <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RE: Buscar palabras dentro de Bytea o Text
Date: 2008-11-13 18:39:05
Message-ID: B1BEF146DF3D4103A4F7B452C1D40479@iptel.com.ar
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

No estoy familiarizado con este tipo de aplicaciones, pero imagino que lo
eficiente no es almacenar el texto completo sino sólo las palabras claves.
Dependerá del volumen de archivos que pienses manejar, pero en principio
buscaría no subir los archivos a la BD y sólo almacenar el path ó url a cada
archivo asociado a las palabras claves aplicables en las búsquedas fts.

Otro punto es la conversión de archivos formateados (doc, pdf) a texto puro
a fines que puedas pre-parsearlos y generar las palabras claves.
Quizá te sirva ver alguna de las soluciones open-source en ese sentido:
http://www.searchtools.com/tools/tools-opensource.html

Saludos,
Fernando.

_____

De: pgsql-es-ayuda-owner(at)postgresql(dot)org
[mailto:pgsql-es-ayuda-owner(at)postgresql(dot)org] En nombre de ALFONSO REYES
Enviado el: Jueves, 13 de Noviembre de 2008 14:50
Para: baron(dot)rojo(dot)cuerdas(dot)de(dot)acero(at)gmail(dot)com
CC: marcosnegrini(at)yahoo(dot)com(dot)ar; pgsql-es-ayuda(at)postgresql(dot)org
Asunto: RE: [pgsql-es-ayuda] Buscar palabras dentro de Bytea o Text

Mil gracias Marco, quisiera saber si estoy claro en lo que me indicas :

1)Si deseo realizar busquedas tengo que guardar como text
2)Si deseo mantener el formato como bytea

Pero si deseo las 2 opociones tendría que duplicar, el archivo para poder
buscar y bajar en el formato que subio el cliente?, y si el usuario guarda
como PDF, me va a poder leer como texto o necesito hacer alguna
transaformación.

La búsqueda la haria con fts para los campos TEXT y creo que en la version
8.3.5 ya esta embebida en el motor de postgres

Por favor su ayuda ES VITAL PARA MI TRABAJO y muchas gracias a todos.. :)

> Date: Thu, 13 Nov 2008 09:33:54 -0300
> From: baron(dot)rojo(dot)cuerdas(dot)de(dot)acero(at)gmail(dot)com
> To: alfonsoreyescruz(at)hotmail(dot)com
> Subject: Re: [pgsql-es-ayuda] Buscar palabras dentro de Bytea o Text
> CC: marcosnegrini(at)yahoo(dot)com(dot)ar; pgsql-es-ayuda(at)postgresql(dot)org
>
> El día 13 de noviembre de 2008 9:16, ALFONSO REYES
> <alfonsoreyescruz(at)hotmail(dot)com> escribió:
> >
> > Hola lista soy nuevo en postgres y estoy desarrollando una aplicacion
para
> > almacenar documentos de tipo:
> > Word ,Excel,Pdf, etc.. la interfaz es punto net y no se como debo
almacemar
> > en la base es decir con que tipo para cuando el usuario ingrese una
palabra
> > clave esta sea buscada dentro del archivo que almaceno similar a una
> > busqueda con Like '%palabra%', pero el momento que exista un resultado
el
> > usuario pueda bajar el acrchivo.
> >
> > Desde ya mil gracias por su valiosa ayuda.
>
> mira acá
http://archives.postgresql.org/pgsql-es-ayuda/2008-06/msg00396.php
>
>
> OT: Como se las arreglara el grep, para hacer esto ????
>
> usuario(at)mipc:~/download/trabajo/doc_informix$ grep -i tablas *.doc
> Coincidencia en el fichero binario diccionario_datos.doc
> usuario(at)mipc:~/download/trabajo/doc_informix$ file diccionario_datos.doc
> diccionario_datos.doc: Microsoft Office Document
> usuario(at)mipc:~/download/trabajo/doc_informix$
> --
> TIP 2: puedes desuscribirte de todas las listas simultáneamente
> (envía "unregister TuDirecciónDeCorreo" a majordomo(at)postgresql(dot)org)

_____

Invite your mail contacts to join your friends list with Windows Live
Spaces. It's easy! Try it!
<http://spaces.live.com/spacesapi.aspx?wx_action=create&wx_url=/friends.aspx
&mkt=en-us>

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Gilberto Castillo Martínez 2008-11-13 19:43:46 Sobre el PGDAY
Previous Message Edwin Quijada 2008-11-13 16:54:53 RE: Buscar palabras dentro de Bytea o Text