Re: UTF 8 y Windows no se llevan ?

From: Alvaro Herrera <alvherre(at)commandprompt(dot)com>
To: Juan Martínez <jeugenio(at)umcervantes(dot)cl>
Cc: Gabriel Hermes Colina Zambra <hermeszambra(at)yahoo(dot)com>, pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: UTF 8 y Windows no se llevan ?
Date: 2007-05-16 12:54:04
Message-ID: 20070516125404.GB4582@alvh.no-ip.org
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Juan Martínez escribió:
> El Mie, 16 de Mayo de 2007, 3:52 am, Gabriel Hermes Colina Zambra escribió:
> > A parte de sacarme la duda, expongo este tema que ya
> > fue trillado, pero con un nuevo aporte.
> >
> > Segun entiendo de la nota de la documentacion de FAQ
> > de PostgreSQL en Windows punto 2.6
> > http://pginstaller.projects.postgresql.org/faq/FAQ_windows.html#2.6,
> > aparentemente PostgreSQL se apoya en el sistema
> > operativo, para el encoding y Windows los encoding que
> > tiene para UTF 8 son seudo Encoding, por lo tanto
> > PostgreSQL en Windows no deberia usarse con UTF 8.
>
> A ver, en el documento explica, segun no mal entiendo, que Postgres 8.0
> tiene problemas al usar UTF8 sobre windows. Al parecer desde 8.1 estarian
> corregidos estos problemas.

Es cierto; las facilidades del sistema operativo se usan solo para el
ordenamiento segun la configuracion local. Para hacer esto en Windows,
las cadenas se convierten de UTF8 a UTF16, se piden los ordenamientos, y
despues se convierten de vuelta a UTF8.

Lo que no se es que tan grande es el sobrecosto de la conversion.

Entiendo que hubo un par de bugs en alguna parte con el manejo de UTF8
en Windows, que han sido solucionados en las ultimas versiones, pero no
estoy seguro si las correcciones han sido propagadas hacia la rama 8.1.
Me parece mucho que 8.1 fue considerado no soportado en Windows.

> _Personalmente_ creo que UTF8 es la mejor opcion.
>
> Si lo que necesitas almacenar es solo texto en español, LATIN1 es buena
> opcion tambien.

La unica ventaja que tiene UTF8 sobre Latin1 es que verifica la
integridad de las cadenas, i.e. es "mas dificil" insertar cadenas que
estan en una codificacion que no es UTF8; en cambio en Latin1, es
frecuente que la gente inserte los datos en otras codificaciones y el
sistema no se queja, con el resultado de que despues se obtienen cadenas
erroneamente codificadas.

--
Alvaro Herrera http://www.CommandPrompt.com/
The PostgreSQL Company - Command Prompt, Inc.

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Mario Gonzalez 2007-05-16 13:17:43 Re: Software y Hardware recomendados (para evitar el cambio a Oracle)
Previous Message Conrado Blasetti 2007-05-16 12:52:21 plpgsql y arrays