Re: Como evitar los caracteres raros cuando hago backup o importacion

From: Alvaro Herrera <alvherre(at)2ndquadrant(dot)com>
To: Francisco Olarte <folarte(at)peoplecall(dot)com>
Cc: Stephen Amell <StephenAmell(at)inbox(dot)lv>, Micky Khan <mcanchas(at)hotmail(dot)com>, FORO POSTGRES <pgsql-es-ayuda(at)postgresql(dot)org>, "pgsql-es-ayuda(at)lists(dot)postgresql(dot)org" <pgsql-es-ayuda(at)lists(dot)postgresql(dot)org>
Subject: Re: Como evitar los caracteres raros cuando hago backup o importacion
Date: 2018-10-24 13:52:14
Message-ID: 20181024135214.r2kx5j7bpbey3ntc@alvherre.pgsql
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Francisco Olarte escribió:
> Alvaro:

> > Otro tema, es que si tu base original era Latin1 (iso-8859-1) y metiste
> > bytes que eran caracteres UTF-8, va a salir mal. Ahí aparecen los à que
> > menciona Miguel.
>
> Realmente ahi lo que se hizo es interpretar una secuencia de byte somo
> latin-1, mismo problema que si tienes el texto en EBCDIC u otros, te
> saca lo mismo. Lo he visto pasar cuando miras los datos originales
> con, p.e., emacs que detecta el utf/iso y no miras la status-line. Lo
> unico bueno es que como latin-1 te deja meter todo se puede arreglar,
> un par de encode/decode astutos y to listo.

Sí. Lo otro bueno es que UTF8 *no* deja pasar datos "mal codificados",
lo que puede ser útil para distinguir en qué codificación viene cada
registro cuando tienes una mezcla.

En una ocasión me pasaron un volcado de datos en que una parte era
Latin1 y otra parte era UTF8. Para corregirlo, lo pasé por pgloader
indicándole que eran datos UTF8; una porción de los datos pasó bien,
pero otra porción arrojó errores de codificación. Esa porción con error
la mandé a la "tabla de líneas corruptas" que permite pgloader, y luego
pasé esa tabla de nuevo por pgloader, esta vez indicándole que eran
Latin1. Con eso quedaron todos cargados en la codificación correcta.
Después revisé al azar los datos para buscar cadenas mal codificadas y
no encontré nada mal, aunque teóricamente era posible.

--
Álvaro Herrera https://www.2ndQuadrant.com/
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Carlos Edward Grajales Marmolejo 2018-10-30 18:04:12 Tamaño de Query
Previous Message Francisco Olarte 2018-10-24 09:47:41 Re: Como evitar los caracteres raros cuando hago backup o importacion