RE: BigData con PostgreSQL

From: "Mario Soto Cordones" <marioa(dot)soto(dot)cordones(at)gmail(dot)com>
To: "'Edwin Quijada'" <listas_quijada(at)hotmail(dot)com>
Cc: <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RE: BigData con PostgreSQL
Date: 2015-11-04 13:39:43
Message-ID: !&!AAAAAAAAAAAYAAAAAAAAAPma+WVXT5NGnV/8+cC15lfCgAAAEAAAAK7iaS8jpMlFn8JXAksrDScBAAAAAA==@gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Hola Edwin

Mira éste link, acá encontrarás una explicación de las diferencias entre
BigData y DataWareHouse. Básicamente la implementación entre uno y otro va a
depender de lo que se requiere.

Por lo general La gente quiere una solución de BigData, porque en muchas
empresas existe una gran cantidad de datos. Y en aquellas corporaciones los
datos pueden contener mucha información valiosa que puede conducir a
mejores decisiones que, a su vez, puede conducir a mayores ingresos, mayor
rentabilidad y más clientes. Y eso es lo que quiere la mayoría de las
corporaciones.

Por otro lado, generalmente se quiere una solución de DataWareHouse , con el
fin de tomar decisiones informadas. Con el fin de saber realmente lo que
está pasando en su empresa, necesita datos que es confiable, creíble y
accesible para todos.

Cuando se quiere comparar una solución de BigData y otra de DataWareHpuse,
nos encontramos que una solución de BigData es una tecnología y que el
DataWareHouse es una arquitectura. Son dos cosas muy diferentes. Una
tecnología es sólo eso - un medio para almacenar y gestionar grandes
cantidades de datos. Un DataWareHouse es una forma de organizar los datos
para que haya credibilidad. Cuando alguien toma los datos de un
DataWareHouse, esa persona sabe que otras personas están usando los mismos
datos para otros fines.

El DataWareHouse viene acompañado de otros conceptos como etl, hechos,
dimensiones, modelo estralla, copo de nieve, cubos de información ,etc.

Ahora bien PostgreSQL permite de buena forma implementar tanto BigData como
DataWareHose, también te puedes ayudar de herramientas como por ejemplo
Pentaho entre otras.

Saludos Cordiales

Mario Soto

De: pgsql-es-ayuda-owner(at)postgresql(dot)org
[mailto:pgsql-es-ayuda-owner(at)postgresql(dot)org] En nombre de Edwin Quijada
Enviado el: martes, 03 de noviembre de 2015 20:28
Para: Lennin Caro <lennin(dot)caro(at)yahoo(dot)com>; pgsql-es-ayuda(at)postgresql(dot)org
Asunto: RE: [pgsql-es-ayuda] BigData con PostgreSQL

So pena de ser fusilado, que diferencias encontrarias entre BigData y
DataWarehouse, solamente el uso de JSON ??
La pregunta viene porque he implementado warehouse con Postgres y Mondrian y
me ha ido bien pero ahora este concepto aun no acabo de digerirlo por mas
que lo leo, sigo pensando que es warehouse con JSON, ignorancia mia talvez,
pero ahora como todo es nuevo pues no se

_____

Date: Tue, 3 Nov 2015 22:08:02 +0000
From: lennin(dot)caro(at)yahoo(dot)com <mailto:lennin(dot)caro(at)yahoo(dot)com>
To: listas_quijada(at)hotmail(dot)com <mailto:listas_quijada(at)hotmail(dot)com> ;
pgsql-es-ayuda(at)postgresql(dot)org <mailto:pgsql-es-ayuda(at)postgresql(dot)org>
Subject: Re: [pgsql-es-ayuda] BigData con PostgreSQL

On Tuesday, November 3, 2015 4:41 PM, Edwin Quijada
<listas_quijada(at)hotmail(dot)com <mailto:listas_quijada(at)hotmail(dot)com> > wrote:

Estoy tratando de implementar BigData en un cliente usando Postgres. Su
bases de ddatos estan en MSSQL y PostgreSQL necesito informacion sobre
BigData con Postgres. Anteriormente use mucho Mondrian para Warehouse con
Postgres pero al parecer hay diferencias con BigData. Alguien tiene algun
material sobre Postgres con BigData que me pueda facilitar o algun caso de
exito sobre esto.

Voy arriesgarme a responder en base a mi experiencia.

He trabajado con PostgreSQL para tener algo parecido a BigData, no es
realmente BigData en PostgreSQL ya que muchas de las cosas que se necesitan
para el analisis de los datos los hago con herramientas externas como
pyhton. Ahora he usado tipos de datos JSONB para almacenar los datos en
tablas logrando mezclar SQL con NoSQL, esto me a dado muy buenos resultados
en cuestion de tiempos de respuesta, los problemas que he encontrado hasta
el momento son:

Los indices en los campos tipo JSON no siempre son eficientes

No he enontrado una manera de aplicar procesamiento en cluster al estilos
MongoDB o Hadoop

Los objetos JSONB no tiene un metodo de actualizcion por nodos del arreglo,
hay que actualizar el campo completo lo cual genera una recarga de I/O

Para la version 9.5 hay mejoras para estos puntos ademas de funciones
(ROLLUP, CUBE y GROUPING SETS) para manipular los datos OLAP, adicionalmente
un nuevo tipo de indices de nombre BRIN aportado por Alvaro Herrera con lo
cual mejorara el consumo de recursoso al usar los indices.

Aun sigo trabajando e investigando con esto, cualquier cosa te ayudo en lo
posible

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Edwin Quijada 2015-11-04 16:42:55 Re: BigData con PostgreSQL
Previous Message Eduardo Morras 2015-11-04 06:51:33 Re: BigData con PostgreSQL