Re: Acerca de UTF8 en una base de datos

From: Alvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>
To: Carolina Román Salgado <rossyr(at)abulafia(dot)ciencias(dot)uchile(dot)cl>
Cc: Lista PostgreSQL <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: Re: Acerca de UTF8 en una base de datos
Date: 2009-01-09 15:56:29
Message-ID: 20090109155629.GC20555@alvh.no-ip.org
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Carolina Román Salgado escribió:

> Ahora estoy intentando mover _solo los datos_ desde dos tablas en esa
> base de datos a una nueva base de datos con una versión superior de
> Drupal. Saqué los datos con pg_dump --encoding=UTF8 y se los di a la
> nueva db que tiene el mismo encoding. Por desgracia tuve que
> transformarlos un poco con Gnumeric, aunque me preocupé de decirle que
> eran UTF8 al exportarlos. Pero encontré, al verlos en la nueva web, que
> todos los acentos y eñes están destruidos.

Quizás lo que sucedió fue que Gnumeric se confundió con el manejo de los
encodings. Es posible que haya hecho una conversión latin1->utf8
creyendo que los datos originalmente estaban en latin1; pero como en
realidad estaban en utf8, el resultado es incorrecto.

Quizás podrías tomar el archivo de salida de Gnumeric, y aplicar iconv:

iconv -f utf8 -t latin1 tu_archivo > archivo_corregido

Esto debería deshacer la conversión incorrecta. A continuación deberías
poder importar esos datos nuevamente a la base de datos y debería
funcionar bien.

Mi sospecha va por ese lado porque lo que nos muestras:

> no debería yo ser capaz de ver "El País" y no "El País" en psql?

es justamente lo que se ve cuando conviertes un string UTF8 usando una
conversión latin1->utf8.

--
Alvaro Herrera http://www.amazon.com/gp/registry/DXLWNGRJD34J
"La rebeldía es la virtud original del hombre" (Arthur Schopenhauer)

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Carolina Román Salgado 2009-01-09 15:57:27 Re: Acerca de UTF8 en una base de datos
Previous Message Carolina Román Salgado 2009-01-09 15:22:08 Acerca de UTF8 en una base de datos