Re: Duda acerca Tsearch con acentos

From: Hugo César <hugocesar49(at)gmail(dot)com>
To: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: Duda acerca Tsearch con acentos
Date: 2011-08-16 12:21:52
Message-ID: CAHRUeDD3+cV6=Baat7qxDJ_pSZU1r31Szzv0+_AhcLC7evs26A@mail.gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Gracias Roberto y Rodolfo por interesarse en el tema...

Efectivamente, coincido con ustedes, de ahi que me decidi a enviar la duda a
la lista, esta funcionalidad de postgre se comporta
algo extraña, porque como comenta Roberto busca palabras "parececidas"
pero... entonces, que pasa con la palabra "funcion" ??
porque no sucede lo mismo??, es decir, de la palabra "funcion" podemos
obtener palabras parecidas como funcionalidad, funcional, etc.
sin embargo, cuando ejecuto select to_tsvector('spanish','función'); no me
devuelve "funci:1" me devuelve "funcion:1", es aqui
donde esta confuso... acaso esto quiere decir que no me arrojara palabras
parecidas ?? solo exactas ?? como saber que palabras
las encontrara exactas y cuales parecidas ?? que proceso adicional tengo que
realizar para solucionar este detalle ??

Saludos y ojala alguien con mucha mas experiencia que nosotros en el tema
nos pueda ayudar un poco mas.

Saludos!!

El 15 de agosto de 2011 20:48, Rodolfo Paparás <rodo(at)globalmargin(dot)com>escribió:

> Yo entiendo algo parecido a lo que dice Roberto. FTS compara cada palabra
> con un diccionario de lexemas y ahí hace la vinculación por familia de
> palabras más que por similitud.
>
> Pero también veo que se comporta raro con palabras con tilde o diéresis
> tanto en las búsquedas sobre campos de texto como en las que utilizan
> índices gin o gist.
>
> Si comparo un query usando FTS con otro usando LIKE en algunos casos el
> segundo me devuelve más resultados contrario a lo que uno creería, no?
>
> Si le encontrás la vuelta por favor postealo.
>
> Saludos
>
> PD.: Yo estoy trabajando sobre un 8.4.7 en CENTOS x64
>
>
> El 15/08/2011 05:11 p.m., Roberto M. Ruiz S. escribió:
>
> El 15/08/2011 14:53, Hugo César escribió:
>>
>>> Que tal lista!
>>>
>>>
>>> Les comento... recien he configurado Tsearch sobre PostgreSQL9 en
>>> Windows, sin embargo, al
>>> estar realizando algunas pruebas me aparecieron algunas dudas, las cuales
>>> les planteo a continuacion:
>>>
>>> Ejecuto las siguientes sentencias tsvector para probar lo que se refiere
>>> a los acentos y funcionan
>>> de maravilla!!!
>>>
>>> select to_tsvector('spanish','**función');
>>> 'funcion':1
>>>
>>> select to_tsvector('spanish','**funcion');
>>> 'funcion':1
>>>
>>>
>>> Sin embargo, al hacer la misma prueba, pero con la palabra
>>> "administración", los resultados son
>>> diferentes, en el primer resultado me arroja la palabra exactamente como
>>> la necesito (sin el acento),
>>> pero en el segundo resultado me trunca la palabra, alguien sabe porque??
>>> acaso no se supone que
>>> me deberia regresar la misma palabra pero sin el acento ?? o como se
>>> supone que funciona el
>>> diccionario ??
>>>
>>> select to_tsvector('spanish','**administracion');
>>> 'administracion':1
>>>
>>> select to_tsvector('spanish','**administracion');
>>> 'administr':1
>>>
>>> Este detalle me esta afectando al momento de hacer las consultas, ya que
>>> si busco esa
>>> palabra con acentos me arroja una cantidad diferente que si la busco con
>>> el acento.
>>>
>>> Acaso algo configure mal ?? Configure el diccionario unnacent siguiendo
>>> las instrucciones de la pagina
>>> oficial... http://www.postgresql.org/**docs/current/static/unaccent.**
>>> html <http://www.postgresql.org/docs/current/static/unaccent.html>
>>>
>>> Ojala alguno de ustedes me pudiera orientar mas al respecto...
>>>
>>> Saludos cordiales.
>>>
>>> Hugo.-
>>>
>>> No manejo bien el tema pero, observo que esta usando esa funcionalidad
>> para buscar con o sin acento pero lo que yo tengo entendido, es que la idea
>> es buscar cualquier palabra "PARECIDA", es decir con administración se puede
>> encontrar administrar, administrador, administradora, etc. la idea si no
>> estoy mal es que se genera como una palabra raíz que es común a todas
>> palabras "PARECIDAS" y así las encuentra.
>> -
>> Enviado a la lista de correo pgsql-es-ayuda (
>> pgsql-es-ayuda(at)postgresql(dot)org**)
>> Para cambiar tu suscripción:
>> http://www.postgresql.org/**mailpref/pgsql-es-ayuda<http://www.postgresql.org/mailpref/pgsql-es-ayuda>
>>
>>
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org
> **)
> Para cambiar tu suscripción:
> http://www.postgresql.org/**mailpref/pgsql-es-ayuda<http://www.postgresql.org/mailpref/pgsql-es-ayuda>
>

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Eduardo Arenas C. 2011-08-16 16:54:22 Re: Duda acerca Tsearch con acentos
Previous Message Rodolfo Paparás 2011-08-16 01:48:28 Re: Duda acerca Tsearch con acentos