RE: Como comprimir datos en postgresql

From: Lazaro Ruben Garcia Martinez <lgarciam(at)vnz(dot)uci(dot)cu>
To: "Guillermo O(dot) Burastero" <linux(dot)gb(at)gmail(dot)com>, Lista de PostgreSQL en Español <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RE: Como comprimir datos en postgresql
Date: 2013-11-01 14:45:47
Message-ID: 294D3D02D5E18D42827B2ECFEADEB688BA00F4BEF1@mx-interno.vnz.uci.cu
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Muchas gracias por las recomendaciones de todos, apenas pueda pruebo tanto las recomendaciones de alvaro, como el tema de djvu.

Un saludo a todos.
________________________________________
De: pgsql-es-ayuda-owner(at)postgresql(dot)org [pgsql-es-ayuda-owner(at)postgresql(dot)org] En nombre de Guillermo O. Burastero [linux(dot)gb(at)gmail(dot)com]
Enviado el: viernes, 01 de noviembre de 2013 9:20
Para: Lista de PostgreSQL en Español
Asunto: Fwd: [pgsql-es-ayuda] Como comprimir datos en postgresql

Por error se lo envíe a Álvaro Herrera y no a la lista.

---------- Mensaje reenviado ----------
De: Guillermo O. Burastero <linux(dot)gb(at)gmail(dot)com>
Fecha: 31 de octubre de 2013 21:16
Asunto: Re: [pgsql-es-ayuda] Como comprimir datos en postgresql
Para: Alvaro Herrera <alvherre(at)2ndquadrant(dot)com>

Para archivar muchos documentos recomiendo considerar el formato de
archivo contenedor djvu sobre el pdf. Es mucho más eficiente (comprime
mucho más a igual calidad) y rápido para mostrar. Se puede guardar
texto embebido en el pdf cuando se escanea y hace OCR automáticamente
para tener un archivo de imagen con texto buscable.

ref. http://djvu.org/
http://es.wikipedia.org/wiki/DjVu

El día 29 de octubre de 2013 11:59, Alvaro Herrera
<alvherre(at)2ndquadrant(dot)com> escribió:
> Lazaro Ruben Garcia Martinez escribió:
>> Buenas noches a todos en la lista. Me encuentro trabajando en un
>> proyecto donde es necesario almacenar en la base de datos un conjunto
>> de documentos necesarios para la realización de un trámite de
>> vivienda, sucede que no es posible personalizar los oficios en tablas
>> de la base de datos pues no poseen una plantilla común, y el traspaso
>> del documento al sistema mediante la aplicación puede generar error en
>> la entrada de datos, además existen clientes que en ocasiones llegan
>> con nuevos oficios, de ahi la necesidad de buscar una alternativa que
>> pudiera ser escanear los documentos y persistirlos en la base de
>> datos, pero esto traería como inconveniente que la base de datos
>> cresca considerablemente. Por tal razón, acudo a ustedes para ver si
>> me pueden dar nuevas ideas, o si es que existe algún mecanismo en
>> postgres o algún módulo extra que permita almacenar la información
>> comprimida en la base de datos, para de esta forma ahorrar espacio en
>> disco y por consecuente evitar que la base cresca muy rápido.
>
> Algunos formatos de archivo son comprimidos internamente, como los PDF
> (no sé si son todos o si depende de la herramienta que los genere).
> Puedes ganar un poco de espacio extra volviendo a comprimirlos con una
> herramienta externa de compresión, pero es poco.
>
> Lo que yo te sugeriría es almacenar los PDF dentro de la BD en un campo
> bytea (tamaño máximo 1GB si mal no recuerdo, lo cual debería acomodar
> cualquier documento normal). No exagerando con la calidad al escanear,
> el uso de espacio debería ser razonable. Ojo: Postgres comprime al
> insertar. Si vas a insertar datos ya comprimidos (PDFs), vas a gastar
> CPU tratando de comprimir infructuosamente. En estos casos puede ser
> buena idea desactivar la compresión de Postgres (ALTER TABLE .. SET
> STORAGE EXTERNAL).
>
> Si la BD crece, pues crece. Asúmelo (y asegúrate de tener suficiente
> espacio).
>
> --
> Álvaro Herrera http://www.2ndQuadrant.com/
> PostgreSQL Development, 24x7 Support, Training & Services
>
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org)
> Para cambiar tu suscripción:
> http://www.postgresql.org/mailpref/pgsql-es-ayuda

--
Guillermo O. Burastero

Bahía Blanca, Buenos Aires, Argentina
Tel. +54 (291) 454-6132 - Móvil [15] 574-3173

MSN: guillermo(dot)burastero(at)gmail(dot)com
ICQ: 97148268
Usuario GNU/Linux #84879 - https://linuxcounter.net/user/84879.html

--
Guillermo O. Burastero

Bahía Blanca, Buenos Aires, Argentina
Tel. +54 (291) 454-6132 - Móvil [15] 574-3173

MSN: guillermo(dot)burastero(at)gmail(dot)com
ICQ: 97148268
Usuario GNU/Linux #84879 - https://linuxcounter.net/user/84879.html

-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org)
Para cambiar tu suscripción:
http://www.postgresql.org/mailpref/pgsql-es-ayuda

Fin a la injusticia, LIBERTAD AHORA A NUESTROS CINCO COMPATRIOTAS QUE SE ENCUENTRAN INJUSTAMENTE EN PRISIONES DE LOS EEUU!
http://www.antiterroristas.cu
http://justiciaparaloscinco.wordpress.com

Fin a la injusticia, LIBERTAD AHORA A NUESTROS CINCO COMPATRIOTAS QUE SE ENCUENTRAN INJUSTAMENTE EN PRISIONES DE LOS EEUU!
http://www.antiterroristas.cu
http://justiciaparaloscinco.wordpress.com

-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org)
Para cambiar tu suscripción:
http://www.postgresql.org/mailpref/pgsql-es-ayuda

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Hellmuth Vargas 2013-11-06 03:14:14 Disco SSD y procedimientos de mantenimiento (VACUUM)
Previous Message Guillermo O. Burastero 2013-11-01 13:50:34 Fwd: Como comprimir datos en postgresql