From: | Alvaro Herrera <alvherre(at)2ndquadrant(dot)com> |
---|---|
To: | Francisco Olarte <folarte(at)peoplecall(dot)com> |
Cc: | Stephen Amell <StephenAmell(at)inbox(dot)lv>, Micky Khan <mcanchas(at)hotmail(dot)com>, FORO POSTGRES <pgsql-es-ayuda(at)postgresql(dot)org>, "pgsql-es-ayuda(at)lists(dot)postgresql(dot)org" <pgsql-es-ayuda(at)lists(dot)postgresql(dot)org> |
Subject: | Re: Como evitar los caracteres raros cuando hago backup o importacion |
Date: | 2018-10-24 13:52:14 |
Message-ID: | 20181024135214.r2kx5j7bpbey3ntc@alvherre.pgsql |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-es-ayuda |
Francisco Olarte escribió:
> Alvaro:
> > Otro tema, es que si tu base original era Latin1 (iso-8859-1) y metiste
> > bytes que eran caracteres UTF-8, va a salir mal. Ahí aparecen los à que
> > menciona Miguel.
>
> Realmente ahi lo que se hizo es interpretar una secuencia de byte somo
> latin-1, mismo problema que si tienes el texto en EBCDIC u otros, te
> saca lo mismo. Lo he visto pasar cuando miras los datos originales
> con, p.e., emacs que detecta el utf/iso y no miras la status-line. Lo
> unico bueno es que como latin-1 te deja meter todo se puede arreglar,
> un par de encode/decode astutos y to listo.
Sí. Lo otro bueno es que UTF8 *no* deja pasar datos "mal codificados",
lo que puede ser útil para distinguir en qué codificación viene cada
registro cuando tienes una mezcla.
En una ocasión me pasaron un volcado de datos en que una parte era
Latin1 y otra parte era UTF8. Para corregirlo, lo pasé por pgloader
indicándole que eran datos UTF8; una porción de los datos pasó bien,
pero otra porción arrojó errores de codificación. Esa porción con error
la mandé a la "tabla de líneas corruptas" que permite pgloader, y luego
pasé esa tabla de nuevo por pgloader, esta vez indicándole que eran
Latin1. Con eso quedaron todos cargados en la codificación correcta.
Después revisé al azar los datos para buscar cadenas mal codificadas y
no encontré nada mal, aunque teóricamente era posible.
--
Álvaro Herrera https://www.2ndQuadrant.com/
PostgreSQL Development, 24x7 Support, Remote DBA, Training & Services
From | Date | Subject | |
---|---|---|---|
Next Message | Carlos Edward Grajales Marmolejo | 2018-10-30 18:04:12 | Tamaño de Query |
Previous Message | Francisco Olarte | 2018-10-24 09:47:41 | Re: Como evitar los caracteres raros cuando hago backup o importacion |