Quick Links

Re: porque no emplea indice para algunas funciones agregadas (max,min)

From:	Diego <mrstephenamell(at)gmail(dot)com>
To:	Anthony Sotolongo <asotolongo(at)gmail(dot)com>, Hellmuth Vargas <hivs77(at)gmail(dot)com>
Cc:	POSTGRES <pgsql-es-ayuda(at)postgresql(dot)org>
Subject:	Re: porque no emplea indice para algunas funciones agregadas (max,min)
Date:	2019-11-29 17:03:42
Message-ID:	d806bb7d-d81b-d135-f563-9f77e3d98954@gmail.com
Views:	Whole Thread \| Raw Message \| Download mbox \| Resend email
Thread:
Lists:	pgsql-es-ayuda

Atentis que no hay un idx por id, sino que es el segundo campo de uno y
del otro lado es la PK de la tabla

On 29/11/19 13:31, Anthony Sotolongo wrote:
>
> Bueno en realidad te trae los datos empleando el indice, pero es más
> costoso que hacerlo recorriendo la tabla entera para las estadisticas
> que el tiene,
>
> y para su algoritmo de obtener los datos tambien lo es, pues demora
> un poco mas con el indices, pues tiene que hacer Bitmap Index Scan y
> Bitmap Heap Scan
>
> Saludos
>
>
>
> El 29-11-19 a las 12:55, Hellmuth Vargas escribió:
>> Hola Anthony
>>
>> NO, eso es claro que sale mas costoso.. pero la pregunta va a que si
>> tengo un indice por centro y id (este ordenado desc) no debería
>> poder sacar el máximo por cada centro empleando exclusivamente el
>> indice?
>>
>>
>>
>> El vie., 29 de nov. de 2019 a la(s) 10:54, Anthony Sotolongo
>> (asotolongo(at)gmail(dot)com <mailto:asotolongo(at)gmail(dot)com>) escribió:
>>
>> Creo que tu respuesta está ahí, para las estadísticas que tiene
>> esa tabla es más efectivo hacer un seq scan que usar el indice
>>
>> Saludos
>>
>> El vie., 29 de nov. de 2019 12:45 p. m., Hellmuth Vargas
>> <hivs77(at)gmail(dot)com <mailto:hivs77(at)gmail(dot)com>> escribió:
>>
>>
>> Hola Anthony!
>>
>> Asi me fue:
>>
>> set enable_seqscan = off;
>>
>>
>> HashAggregate (cost=21803.61..21803.63 rows=5 width=21)
>> (actual time=708.525..708.525 rows=5 loops=1)
>> Group Key: centrocodigo
>> -> Bitmap Heap Scan on
>> oportunidadcitas (cost=2769.30..21416.55 rows=387062
>> width=21) (actual time=143.449..538.962 rows=387034 loops=1)
>> Heap Blocks: exact=17099
>> -> Bitmap Index Scan on
>> idx_oportunidadcitas_desc (cost=0.00..2749.95 rows=387062
>> width=0) (actual time=140.236..140.236 rows=387300 loops=1)
>> Planning time: 0.118 ms
>> Execution time: 708.580 ms
>>
>>
>> ----
>> set enable_seqscan = on;
>>
>> HashAggregate (cost=19204.02..19204.04 rows=5 width=21)
>> (actual time=241.997..241.998 rows=5 loops=1)
>> Group Key: centrocodigo
>> -> Seq Scan on oportunidadcitas (cost=0.00..18813.62
>> rows=390405 width=21) (actual time=0.004..73.800 rows=390405
>> loops=1)
>> Planning time: 0.089 ms
>> Execution time: 242.030 ms
>>
>>
>> El vie., 29 de nov. de 2019 a la(s) 10:39, Anthony Sotolongo
>> (asotolongo(at)gmail(dot)com <mailto:asotolongo(at)gmail(dot)com>) escribió:
>>
>> Hola Hellmuth, puedes deshabilitar el seq_scan y ver que
>> retorna el explain analyze para es consulta
>>
>> set enable_seqscan = off;
>>
>>
>> Saludos
>>
>> El 29-11-19 a las 12:09, Hellmuth Vargas escribió:
>>>
>>> Hola lista
>>>
>>> tengo una tabla
>>>
>>> CREATE TABLE oportunidadcitas
>>> (
>>> id bigint NOT NULL,
>>> fechacreacion timestamp without time zone,
>>> fechamodificacion timestamp without time zone,
>>> centrocodigo character varying(255),
>>> especialidadcodigo character varying(255),
>>> medicocodigo character varying(255),
>>> CONSTRAINT oportunidadcitas_pkey PRIMARY KEY (id)
>>> )
>>>
>>> con el siguiente indice (entre otros)
>>>
>>> CREATE INDEX idx_ oportunidadcitas_desc
>>> ON oportunidadcitas
>>> USING btree
>>> ( centrocodigo COLLATE pg_catalog."default", id DESC);
>>>
>>> donde suponía que podrá apoyar una consulta recurrente
>>> que hacen:
>>>
>>> select centrocodigo,max( id ) as ultimo
>>> from oportunidadcitas
>>> group by 1
>>>
>>>
>>>
>>> Pero el motor siempre prefiere hacer el sequence scan:
>>>
>>>
>>> HashAggregate (cost=7307.83..7307.85 rows=5 width=21)
>>> (actual time=122.891..122.893 rows=5 loops=1)
>>> Group Key: centrocodigo
>>> -> Seq Scan on oportunidadcitas (cost=0.00..7159.26
>>> rows=148566 width=21) (actual time=0.011..43.675
>>> rows=148624 loops=1)
>>> Planning time: 0.101 ms
>>> Execution time: 122.928 ms
>>>
>>>
>>> La pregunta es: porque si tiene un indice por ambos
>>> campos e incluso esta ordenado por id desc porque no lo
>>> emplea para sacar el máximo??? ( ni el mínimo) como si
>>> lo emplea si solo se hace el max por id:
>>>
>>> select max( id )
>>> from subred.baseoportunidadcitabot sub
>>>
>>> Result (cost=0.14..0.15 rows=1 width=0)
>>> InitPlan 1 (returns $0)
>>> -> Limit (cost=0.08..0.14 rows=1 width=8)
>>> -> Index Only Scan Backward using idx_
>>> oportunidadcitas_desc on oportunidadcitas
>>> (cost=0.08..9988.24 rows=165172 width=8)
>>> Index Cond: (id IS NOT NULL)
>>>
>>>
>>> Postdata: la idea es sacarlo directamente porque
>>> varias publicaciones sugieren emplear trigger o vistas
>>> materializadas para almacenar el dato.
>>>
>>> de antemano Gracias!!!
>>>
>>> --
>>> Cordialmente,
>>>
>>> Ing. Hellmuth I. Vargas S.
>>> Esp. Telemática y Negocios por Internet
>>>
>>
>>
>> --
>> Cordialmente,
>>
>> Ing. Hellmuth I. Vargas S.
>> Esp. Telemática y Negocios por Internet
>> Oracle Database 10g Administrator Certified Associate
>> EnterpriseDB Certified PostgreSQL 9.3 Associate
>>
>>
>>
>> --
>> Cordialmente,
>>
>> Ing. Hellmuth I. Vargas S.
>> Esp. Telemática y Negocios por Internet
>> Oracle Database 10g Administrator Certified Associate
>> EnterpriseDB Certified PostgreSQL 9.3 Associate
>>

In response to

Re: porque no emplea indice para algunas funciones agregadas (max,min) at 2019-11-29 16:31:52 from Anthony Sotolongo

Browse pgsql-es-ayuda by date

	From	Date	Subject
Next Message	cesar@cayter.com	2019-11-29 18:03:44	Consulta sobre actualizacion
Previous Message	Anthony Sotolongo	2019-11-29 16:31:52	Re: porque no emplea indice para algunas funciones agregadas (max,min)