From: | "Esneiker Enriquez Cabrera" <eenriquez(at)cav(dot)desoft(dot)cu> |
---|---|
To: | "'Eduardo Arenas C(dot)'" <edomax(at)gmail(dot)com> |
Cc: | <pgsql-es-ayuda(at)postgresql(dot)org> |
Subject: | RE: Duda en consolidación de información |
Date: | 2018-11-13 20:57:47 |
Message-ID: | 000101d47b93$891e72b0$9b5b5810$@cav.desoft.cu |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-es-ayuda |
Muchas gracias, voy a revisarlo para ver que tal.
Saludos,
M.Sc. Ing. Esneiker Enriquez Cabrera
Esp. B en Ciencias Informáticas
Desoft en Ciego de Ávila. Joaquín de Aguero esq. Calle 2. Ciego de Ávila. Cuba.
Telf.: 266200 Ext 119, email.: eenriquez(at)cav(dot)desoft(dot)cu <mailto:eenriquez(at)cav(dot)desoft(dot)cu>
De: Eduardo Arenas C. [mailto:edomax(at)gmail(dot)com]
Enviado el: martes, 13 de noviembre de 2018 14:24
Para: eenriquez(at)cav(dot)desoft(dot)cu
Asunto: Re: Duda en consolidación de información
Esneiker,
Entonces https://www.openempi.org/ te sirve ya que contiene algoritmos automatizados y semi automatizados para des duplicar personas entregando un ID único que luego puedes manejar en todos sistemas. Quizás es muy específicos para salud y ahí tendrías que buscar otro para el área de negocio que manejas, sino ver si puedes incorporar las reglas de negocio basadas en el caso que quieres trabajar, o al menos intentar descubrir la lógica que hay detrás de un Maestro de Personas y sus algoritmos de des duplicación para hacer un desarrollo local.
pero creo que esto ya se sale un poco de esta lista de correos sobre postgresql, salvo que quieras implementar algún algoritmo basado tsearch2, y correctores ortográficos basados en postgresql como esto https://www.postgresql.org/docs/9.1/fuzzystrmatch.html que te permiten comprar palabras que están mal escritas o que el sonido de la pronunciación es similar pero que están escritas de otra forma para determinar si son la misma, ejemplo para comparar nombres, domicilios, etc... y determinar si dos personas son o parecen ser la misma persona.
Saludos
Eduardo
El mar., 13 de nov. de 2018 a la(s) 13:49, Esneiker Enriquez Cabrera (eenriquez(at)cav(dot)desoft(dot)cu <mailto:eenriquez(at)cav(dot)desoft(dot)cu> ) escribió:
Muchas gracias a todos los que me han ayudado con sus sugerencias. Respondiendo a algunas cuestiones que no dejé claras, el número de clientes registrados está en más de 4 millones y en bases de datos diferentes, por supuesto hay muchos metadatos que habría que analizar tales como nombre, dirección, etc. Imaginen una empresa de servicios que tenga varios sistemas independientes y en cada uno de ellos se registran los clientes, pero en cada uno se pueden registrar con incongruencias. Ese es el escenario.
Saludos,
M.Sc. Ing. Esneiker Enriquez Cabrera
Esp. B en Ciencias Informáticas
Desoft en Ciego de Ávila. Joaquín de Aguero esq. Calle 2. Ciego de Ávila. Cuba.
Telf.: 266200 Ext 119, email.: eenriquez(at)cav(dot)desoft(dot)cu <mailto:eenriquez(at)cav(dot)desoft(dot)cu>
--
Eduardo Arenas
+56 9 6629 1618
From | Date | Subject | |
---|---|---|---|
Next Message | Roberto Andrade Fonseca | 2018-11-13 22:23:40 | Re: Duda en consolidación de información |
Previous Message | Francisco Olarte | 2018-11-13 17:20:16 | Re: Duda en consolidación de información |