From: | Sébastien DINOT <sebastien(dot)dinot(at)free(dot)fr> |
---|---|
To: | pgsql-fr-generale(at)postgresql(dot)org |
Subject: | Calcul de médiane |
Date: | 2007-02-21 10:12:13 |
Message-ID: | 1172052733.45dc1afd99d1f@imp.free.fr |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-fr-generale |
Bonjour à tous,
Je souhaite calculer la médiane d'un ensemble de valeurs et je ne vois
pas comment le faire simplement. Une âme charitable aurait-elle une
solution à me proposer ?
Pour mémoire, la médiane est différente de la moyenne :
http://fr.wikipedia.org/wiki/M%C3%A9diane_(centre) :
----------------------------------------------------------------------
Médiane (centre)
En théorie des probabilités et en statistiques, la médiane est un nombre
qui divise en deux parties l'échantillon, la population ou la
distribution de probabilités. Chaque partie contient le même nombre de
valeurs.
Dans une liste finie de valeurs, il suffit d'ordonner les valeurs dans
un ordre croissant et de choisir la valeur au milieu comme médiane. S'il
y a un nombre pair de valeurs, la moyenne arithmétique est souvent
prise.
Contrairement à la moyenne arithmétique, la valeur médiane permet
d'atténuer l'influence perturbatrice des valeurs extrêmes enregistrées
lors de circonstances exceptionnelles.
[...]
Médianes en statistiques descriptives
La médiane est principalement utilisée pour les distributions
asymétriques, car elle les représente mieux que la moyenne arithmétique.
Considérons l'ensemble { 1, 2, 2, 2, 3, 9 }. La médiane est 2, tout
comme le mode, ce qui est une meilleure mesure de tendance centrale que
la moyenne arithmétique de 3.166
.
Le calcul de la médiane est couramment effectué pour représenter
différentes distributions et elle est facile à comprendre, tout comme à
calculer. Elle est aussi plus robuste que la moyenne en présence de
valeurs extrêmes.
----------------------------------------------------------------------
Par exemple, voici une distribution de 200 valeurs :
Valeur | Occurrences
--------+-------------
0.00 | 5
10.00 | 45
12.00 | 1
20.00 | 75
25.00 | 19
30.00 | 25
50.00 | 29
480.00 | 1
La moyenne est de 25.585.
La médiane est de 20 (100 valeurs sont <= 20 et 100 valeurs sont >= 20).
On m'a déjà signalé une solution en PL/R :
http://www.joeconway.com/plr/doc/plr-aggregate-funcs.html
mais je préfèrerais passer par une requête SQL ou une procédure stockée
en PL/PgSQL.
Je vous remercie par avance,
Sébastien
--
Sébastien Dinot, sebastien(dot)dinot(at)free(dot)fr
http://sebastien.dinot.free.fr/
Ne goûtez pas au logiciel libre, vous ne pourriez plus vous en passer !
From | Date | Subject | |
---|---|---|---|
Next Message | Stephane Bortzmeyer | 2007-02-21 11:22:58 | Re: Calcul de médiane |
Previous Message | Guillaume Lelarge | 2007-02-21 09:22:19 | Re: Conseil Livre |