RE: ot rename temporary statistics file "pg_stat_tmp/pgstat.tmp" to "pg_stat_tmp/pgstat.stat": No such file or directory

From: Fabricio <fabrixio1(at)hotmail(dot)com>
To: <alvherre(at)alvh(dot)no-ip(dot)org>
Cc: pgsql-es-ayuda <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RE: ot rename temporary statistics file "pg_stat_tmp/pgstat.tmp" to "pg_stat_tmp/pgstat.stat": No such file or directory
Date: 2012-06-07 20:29:20
Message-ID: SNT139-W3803ED544364A78A3931FAFEF30@phx.gbl
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Gracias por la respuesta Alvaro.

> CC: pgsql-es-ayuda(at)postgresql(dot)org
> Subject: Re: [pgsql-es-ayuda] ot rename temporary statistics file "pg_stat_tmp/pgstat.tmp" to "pg_stat_tmp/pgstat.stat": No such file or directory
> From: alvherre(at)alvh(dot)no-ip(dot)org
> To: fabrixio1(at)hotmail(dot)com
> Date: Thu, 7 Jun 2012 15:16:59 -0400
>
>
> Excerpts from Fabricio's message of jue jun 07 13:34:13 -0400 2012:
> >
> >
> > Buenos dias todos.
> >
> > Tengo este problema:
> >
> > Tengo instalado postgres 9.1.3 y anoche la base de datos fallo debido al siguiente error:
> >
> >
> > Este fue el primer error despues de un autovacuum:
> >
> > <2012-06-06 00:59:07 MDT 814 4fceffbb.32e >LOG: autovacuum: found orphan temp table "(null)"."tmpmuestadistica" in database "dbRX"
>
> Hmm, esto debería ser más o menos inocuo, pero puede ser indicativo de
> que el sistema se cayó en algún momento.
>
> > <2012-06-06 01:05:26 MDT 1854 4fc7d1eb.73e >LOG: could not rename temporary statistics file "pg_stat_tmp/pgstat.tmp" to "pg_stat_tmp/pgstat.stat": No such file or directory
>
> Esto no tiene mucha importancia, y ciertamente no tiene mucha relación
> con el error que viene después. Sí puede ser otro indicador de una
> caída anterior.
>
> > <2012-06-06 01:05:28 MDT 1383 4fcf0136.567 >ERROR: tuple concurrently updated
> > <2012-06-06 01:05:28 MDT 1383 4fcf0136.567 >CONTEXT: automatic vacuum of table "global.pg_catalog.pg_attrdef"
>
> Esto ya es un problema más o menos serio. Seguramente quedó una tupla
> con la cabecera en mal estado en esta tabla, por alguna razón.
>
> > <2012-06-06 01:06:09 MDT 1851 4fc7d1eb.73b >ERROR: xlog flush request 4/E29EE490 is not satisfied --- flushed only to 3/13527A10
> > <2012-06-06 01:06:09 MDT 1851 4fc7d1eb.73b >CONTEXT: writing block 0 of relation base/311360/12244_vm
> > <2012-06-06 01:06:10 MDT 1851 4fc7d1eb.73b >ERROR: xlog flush request 4/E29EE490 is not satisfied --- flushed only to 3/13527A10
> > <2012-06-06 01:06:10 MDT 1851 4fc7d1eb.73b >CONTEXT: writing block 0 of relation base/311360/12244_vm
> > <2012-06-06 01:06:10 MDT 1851 4fc7d1eb.73b >WARNING: could not write block 0 of base/311360/12244_vm
> > <2012-06-06 01:06:10 MDT 1851 4fc7d1eb.73b >DETAIL: Multiple failures --- write error might be permanent.
>
> .. y este es el peor problema. Creo que indica que te falta un segmento
> de WAL completo por algún motivo. Suena como que el sistema de archivos
> lo perdió .. ¿quizás estaba en lost+found después de la caída, y no te
> diste cuenta?

La carpeta lost+found esta vacia.

>
> ¿Qué sistema operativo estás usando? ¿Qué sistema de archivos? ¿Tienes
> fsync=off? Describe el sistema de almacenamiento: ¿RAID? ¿Hay caché de
> escritura que pueda haber fallado?
>

Slackware 13.1
ext4
fsync=on
Son dos discos en RAID 1, el RAID es por hardware HP ciss

Quizas si fue esta la causa, su hay un mensaje de error sobre la particion y la cache:

Jun 7 01:32:55 SERVIDOR kernel: IRQ 71/cciss0: IRQF_DISABLED is not guaranteed on shared IRQs
Jun 7 01:32:55 SERVIDOR kernel: cciss/c0d0: p2 size 1127850720 exceeds device capacity, limited to end of disk
Jun 7 01:32:55 SERVIDOR kernel: JBD: barrier-based sync failed on cciss!c0d0p2-8 - disabling barriers
Jun 7 01:32:55 SERVIDOR kernel: JBD: barrier-based sync failed on cciss!c0d0p2-8 - disabling b

Despues de los primeros errores el servidor se reinicio y al entrar marco esos mensajes y fue cuando ya no estaban los archivos del pg_xlog

> >
> > Anoche la base de datos fgue terminada por señal 6 y no quizo levantar:
> >
> > <2012-06-07 01:36:44 MDT 2509 4fd05a0c.9cd >LOG: startup process (PID 2525) was terminated by signal 6: Aborted
> > <2012-06-07 01:36:44 MDT 2509 4fd05a0c.9cd >LOG: aborting startup due to startup process failure
> > <2012-06-07 01:37:37 MDT 2680 4fd05a41.a78 >LOG: database system shutdown was interrupted; last known up at 2012-06-07 01:29:40 MDT
> > <2012-06-07 01:37:37 MDT 2680 4fd05a41.a78 >LOG: could not open file "pg_xlog/000000010000000300000013" (log file 3, segment 19): No such
> > file or directory
> > <2012-06-07 01:37:37 MDT 2680 4fd05a41.a78 >LOG: invalid primary checkpoint record
> >
> > La unica opcion para levantarla fue usando pg_resetxlog
>
> Espero que hayas tenido un respaldo previo de los datos.
> >
> > Despues de levantarla muchas consultas me carcaban este error:
> > <2012-06-07 09:24:22 MDT 1306 4fd0c7a6.51a >ERROR: missing chunk number 0 for toast value 393330 in pg_toast_2619
> > <2012-06-07 09:24:31 MDT 1306 4fd0c7a6.51a >ERROR: missing chunk number 0 for toast value 393332 in pg_toast_2619
> >
> > Algunas bases de datos las pude recuperar, otras las perdi.
> >
> > Cre una nueva carpeta data y la reinicialice con initdb restaurando las bases de datos que pude recuperar y las demas del ultimo respaldo.
> >
> >
> > No es problema de espacio en disco duro, no es problema de permisos, no es problema de error en el sistema de archivos o en en el hardware, no hay ningun mensaje de error a nivel sistema operativo o a nivel hadrware.
>
> ¿cómo sabes que no es problema de filesystem?

no hay algun mensaje de corrupcion del filesystem, pero ya encontre lo que te comente arriba.

>
> --
> Álvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org)
> Para cambiar tu suscripci�n:
> http://www.postgresql.org/mailpref/pgsql-es-ayuda

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Alvaro Herrera 2012-06-07 21:06:52 RE: ot rename temporary statistics file "pg_stat_tmp/pgstat.tmp" to "pg_stat_tmp/pgstat.stat": No such file or directory
Previous Message Alvaro Herrera 2012-06-07 19:16:59 Re: ot rename temporary statistics file "pg_stat_tmp/pgstat.tmp" to "pg_stat_tmp/pgstat.stat": No such file or directory