RE: Duda en consolidación de información

From: "Esneiker Enriquez Cabrera" <eenriquez(at)cav(dot)desoft(dot)cu>
To: "'Eduardo Arenas C(dot)'" <edomax(at)gmail(dot)com>
Cc: <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RE: Duda en consolidación de información
Date: 2018-11-13 20:57:47
Message-ID: 000101d47b93$891e72b0$9b5b5810$@cav.desoft.cu
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Muchas gracias, voy a revisarlo para ver que tal.

Saludos,

M.Sc. Ing. Esneiker Enriquez Cabrera
Esp. B en Ciencias Informáticas

Desoft en Ciego de Ávila. Joaquín de Aguero esq. Calle 2. Ciego de Ávila. Cuba.
Telf.: 266200 Ext 119, email.: eenriquez(at)cav(dot)desoft(dot)cu <mailto:eenriquez(at)cav(dot)desoft(dot)cu>

De: Eduardo Arenas C. [mailto:edomax(at)gmail(dot)com]
Enviado el: martes, 13 de noviembre de 2018 14:24
Para: eenriquez(at)cav(dot)desoft(dot)cu
Asunto: Re: Duda en consolidación de información

Esneiker,

Entonces https://www.openempi.org/ te sirve ya que contiene algoritmos automatizados y semi automatizados para des duplicar personas entregando un ID único que luego puedes manejar en todos sistemas. Quizás es muy específicos para salud y ahí tendrías que buscar otro para el área de negocio que manejas, sino ver si puedes incorporar las reglas de negocio basadas en el caso que quieres trabajar, o al menos intentar descubrir la lógica que hay detrás de un Maestro de Personas y sus algoritmos de des duplicación para hacer un desarrollo local.

pero creo que esto ya se sale un poco de esta lista de correos sobre postgresql, salvo que quieras implementar algún algoritmo basado tsearch2, y correctores ortográficos basados en postgresql como esto https://www.postgresql.org/docs/9.1/fuzzystrmatch.html que te permiten comprar palabras que están mal escritas o que el sonido de la pronunciación es similar pero que están escritas de otra forma para determinar si son la misma, ejemplo para comparar nombres, domicilios, etc... y determinar si dos personas son o parecen ser la misma persona.

Saludos

Eduardo

El mar., 13 de nov. de 2018 a la(s) 13:49, Esneiker Enriquez Cabrera (eenriquez(at)cav(dot)desoft(dot)cu <mailto:eenriquez(at)cav(dot)desoft(dot)cu> ) escribió:

Muchas gracias a todos los que me han ayudado con sus sugerencias. Respondiendo a algunas cuestiones que no dejé claras, el número de clientes registrados está en más de 4 millones y en bases de datos diferentes, por supuesto hay muchos metadatos que habría que analizar tales como nombre, dirección, etc. Imaginen una empresa de servicios que tenga varios sistemas independientes y en cada uno de ellos se registran los clientes, pero en cada uno se pueden registrar con incongruencias. Ese es el escenario.

Saludos,

M.Sc. Ing. Esneiker Enriquez Cabrera
Esp. B en Ciencias Informáticas

Desoft en Ciego de Ávila. Joaquín de Aguero esq. Calle 2. Ciego de Ávila. Cuba.
Telf.: 266200 Ext 119, email.: eenriquez(at)cav(dot)desoft(dot)cu <mailto:eenriquez(at)cav(dot)desoft(dot)cu>

--

Eduardo Arenas
+56 9 6629 1618

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Roberto Andrade Fonseca 2018-11-13 22:23:40 Re: Duda en consolidación de información
Previous Message Francisco Olarte 2018-11-13 17:20:16 Re: Duda en consolidación de información