Encore un autre
USAPiste convaincu
- Inscrit
- 16 Octobre 2018
- Messages
- 205
- Réactions
- 186
On a fait des commentaires après le match Bayonne, présenté parfois comme un match déjà determinant, puis sur le match contre Montpellier qui doit être décisif…il reste 25x7=175 matches à jouer, la masse d’évènements à venir est immense, on voit bien la difficulté d’extrapoler chaque résultat dans ce contexte. Pourtant on a envie (c’est humain) de tirer des conséquences des défaites et des victoires : ca nous met ou, en quoi ça change les espérances ? On se demande comment concilier les deux aspects, comment utiliser le connu malgre une masse énorme d’inconnu. Pour cela une seule méthode : structurer l’inconnu, d’où l'algorithme du « classement final projectif ». J’ai fait un le travail ci-dessous a la demande de quelqu’un, je vous en met ici un résumé pour avoir vos commentaires/suggestions.
D’abord des stats utiles : dans la phase régulière du top 14, on compte sur les 17 dernières saisons 72.5% de victoires a domicile, 24.5% de victoires a l’extérieur et 3% de nuls, et on distribue 0,66 point de bonus en moyenne par match, donc en moyenne une équipe a un bonus tous les 3 matches.
A un point donné du championnat, chaque équipe doit encore jouer un certain nombre de rencontres à domicile et a l’extérieur, il est donc facile de calculer l’espérance de points pour ces matches et de les ajouter au nombre de points acquis. Ça donne un classement final théorique, il ne tient pas compte des forces des équipes et il est donc très regroupé, mais ce n’est qu’une base, le « tout statistique ». Après la première journée ça donne :
Qui n’est pas une projection puisque ça suppose que les forces sont égales. Evidemment Vannes n’aura jamais 57 points ni Toulouse 64. C’est la base pour la suite.
A partir de la on introduit les forces des différentes équipes. La force joue de deux manières : plus une équipe est forte, plus on attend de points. Mais les points attendus sont aussi fonction du calendrier spécifique de chacune (selon contre qui elle a déjà joué, elle aura plus ou moins de points dans un calendrier plus ou moins facile). Et comme au-dessus, l’équilibre domicile/extérieur joue. Les forces sont initialement calculées a partir des points obtenus dans la saison 2024 (c'est le plus objectif a priori) Vannes héritant des points d’Oyo par convention. J’appelle l’indicateur qui combine la force et la facilite/difficulté du calendrier restant a jouer la « cote ».
Cet indicateur est dynamique : les performances de cette saison influent sur la cote des équipes, qui est mise a jour après chaque journée en fonction des résultats : selon qu’une équipe donnée a fait une performance contre une équipe mieux cotée, une contreperformance contre une équipe moins cotée, à domicile ou à l’extérieur, etc. sa cote va s’améliorer ou se dégrader avec un double impact : sur sa propre prévision de points et, via le calendrier, sur la prévision de points pour les équipes qu’elle rencontrera. Les points prévus ainsi sont ajoutes a ceux déjà acquis.
Donc on combine les cotes dynamiques avec le tout statistique. Mais si on corrige totalement le statistique avec les forces des équipes on implique que la saison va se dérouler en gros comme la précédente, seulement corrigée des résultats réels enregistres. Pour conserver l’impact des aléas et impondérables…il faut définir une proportion entre ce qui dérive mathématiquement des indicateurs de force et ce qui est purement statistique et résulte des paramètres globaux estimes. J’ai mis 2/3-1/3, choix subjectif mais qui me parait intéressant après divers essais. Cela donne après la première journée un classement qui, forcement, ressemble encore au tableau final de 2023-2024 (on n’a d’ailleurs aucune raison de le chambouler apres une seule journee) mais va progressivement prendre les couleurs de la saison en cours en projetant le connu a date au bout des 26 journees :
On voit que le point essentiel de la premiere journée est la victoire du LOU au MHRC, le reste est anecdotique. USAP passe de 10e a 11e du coup, mais USAP creuse un écart sur le MHRC alors même qu’on fait, comme eux, 1 point au classement ! C'est l'effet de perdre a domicile, ca fait baisser la cote. On perd a Bayonne mais on reste devant eux, pas d’affolement.
Pour tester le système j’ai fait quelques simulations sur les journées d’apres, pour la 2e par exemple avec les résultats suivants (on perd a Narbonne, juste pour voir ce que ca fait!) :
Voici le classement projectif après cette journée 2 maudite:
Bayonne nous passe devant alors qu’on marque 1 point et eux 0 ! C’est normal, on crame une opportunité a domicile contre un suppose faible, et eux ne crament rien en perdant a l’extérieur contre un réputé moyen, l’algorithme quantifie ça en points finaux. Le MHRC maintenant nous talonne, on a perdu la marge mais on mais reste 12e virtuel. Le LOU continue de monter car l’algo voit qu’il bat UBB (un fort) a domicile et en tire une serie de consequences. Voila les trois enseignements qui seraient à tirer. Le reste n’appelle pas commentaire.
Ce classement (tout est calculé automatiquement) voit plus loin que le classement britannique. Il donne un classement final virtuel et évolutif en prenant en compte les résultats et en adaptant dynamiquement les paramètres de prévision avec les résultats enregistres. En fait il fait les calculs qui correspondent aux elucubrations d'apres-match.
Un sous-produit : le calcul de probabilité de victoire pour chaque match. Pour la journée 2 ça me sort (ça suppose qu’on joue a AG, hélas. A Narbonne… ?) :
C'est assez coherent avec les cotes Winamax, c'est un bon test de la stabilite du modele.
D’abord des stats utiles : dans la phase régulière du top 14, on compte sur les 17 dernières saisons 72.5% de victoires a domicile, 24.5% de victoires a l’extérieur et 3% de nuls, et on distribue 0,66 point de bonus en moyenne par match, donc en moyenne une équipe a un bonus tous les 3 matches.
A un point donné du championnat, chaque équipe doit encore jouer un certain nombre de rencontres à domicile et a l’extérieur, il est donc facile de calculer l’espérance de points pour ces matches et de les ajouter au nombre de points acquis. Ça donne un classement final théorique, il ne tient pas compte des forces des équipes et il est donc très regroupé, mais ce n’est qu’une base, le « tout statistique ». Après la première journée ça donne :
1 | Toulouse | 64.2 |
2 | LOU | 63.2 |
3 | ASM | 62.3 |
4 | Bayonne | 61.3 |
| UBB | 61.3 |
| CO | 61.3 |
| La Rochelle | 61.3 |
8 | USAP | 60.2 |
| R92 | 60.2 |
| Toulon | 60.2 |
11 | SF | 59.2 |
| SP | 59.2 |
13 | MHRC | 58.3 |
14 | Vannes | 57.3 |
Qui n’est pas une projection puisque ça suppose que les forces sont égales. Evidemment Vannes n’aura jamais 57 points ni Toulouse 64. C’est la base pour la suite.
A partir de la on introduit les forces des différentes équipes. La force joue de deux manières : plus une équipe est forte, plus on attend de points. Mais les points attendus sont aussi fonction du calendrier spécifique de chacune (selon contre qui elle a déjà joué, elle aura plus ou moins de points dans un calendrier plus ou moins facile). Et comme au-dessus, l’équilibre domicile/extérieur joue. Les forces sont initialement calculées a partir des points obtenus dans la saison 2024 (c'est le plus objectif a priori) Vannes héritant des points d’Oyo par convention. J’appelle l’indicateur qui combine la force et la facilite/difficulté du calendrier restant a jouer la « cote ».
Cet indicateur est dynamique : les performances de cette saison influent sur la cote des équipes, qui est mise a jour après chaque journée en fonction des résultats : selon qu’une équipe donnée a fait une performance contre une équipe mieux cotée, une contreperformance contre une équipe moins cotée, à domicile ou à l’extérieur, etc. sa cote va s’améliorer ou se dégrader avec un double impact : sur sa propre prévision de points et, via le calendrier, sur la prévision de points pour les équipes qu’elle rencontrera. Les points prévus ainsi sont ajoutes a ceux déjà acquis.
Donc on combine les cotes dynamiques avec le tout statistique. Mais si on corrige totalement le statistique avec les forces des équipes on implique que la saison va se dérouler en gros comme la précédente, seulement corrigée des résultats réels enregistres. Pour conserver l’impact des aléas et impondérables…il faut définir une proportion entre ce qui dérive mathématiquement des indicateurs de force et ce qui est purement statistique et résulte des paramètres globaux estimes. J’ai mis 2/3-1/3, choix subjectif mais qui me parait intéressant après divers essais. Cela donne après la première journée un classement qui, forcement, ressemble encore au tableau final de 2023-2024 (on n’a d’ailleurs aucune raison de le chambouler apres une seule journee) mais va progressivement prendre les couleurs de la saison en cours en projetant le connu a date au bout des 26 journees :
1 | 79.4 | Toulouse |
2 | 71.2 | SF |
3 | 68.1 | UBB |
4 | 67.3 | La Rochelle |
5 | 67.3 | Toulon |
6 | 62.6 | ASM |
7 | 62.4 | CO |
8 | 61.6 | LOU |
9 | 61.4 | R92 |
10 | 58.8 | SP |
11 | 58.0 | USAP |
12 | 54.4 | Bayonne |
13 | 43.5 | MHRC |
14 | 33.1 | Vannes |
On voit que le point essentiel de la premiere journée est la victoire du LOU au MHRC, le reste est anecdotique. USAP passe de 10e a 11e du coup, mais USAP creuse un écart sur le MHRC alors même qu’on fait, comme eux, 1 point au classement ! C'est l'effet de perdre a domicile, ca fait baisser la cote. On perd a Bayonne mais on reste devant eux, pas d’affolement.
Pour tester le système j’ai fait quelques simulations sur les journées d’apres, pour la 2e par exemple avec les résultats suivants (on perd a Narbonne, juste pour voir ce que ca fait!) :
RCT | CO | 4 | 0 |
SF | RCV | 5 | 0 |
R92 | ASM | 4 | 1 |
SP | AB | 4 | 0 |
USAP | MHRC | 1 | 4 |
LOU | UBB | 4 | 1 |
ST | SR | 4 | 0 |
Voici le classement projectif après cette journée 2 maudite:
1 | 81.0 | Toulouse |
2 | 70.8 | SF |
3 | 67.4 | UBB |
4 | 67.4 | Toulon |
5 | 66.0 | LOU |
6 | 64.3 | La Rochelle |
7 | 62.7 | ASM |
8 | 62.5 | R92 |
9 | 61.5 | CO |
10 | 57.2 | SP |
11 | 54.3 | Bayonne |
12 | 50.8 | USAP |
13 | 49.8 | MHRC |
14 | 32.7 | Vannes |
Bayonne nous passe devant alors qu’on marque 1 point et eux 0 ! C’est normal, on crame une opportunité a domicile contre un suppose faible, et eux ne crament rien en perdant a l’extérieur contre un réputé moyen, l’algorithme quantifie ça en points finaux. Le MHRC maintenant nous talonne, on a perdu la marge mais on mais reste 12e virtuel. Le LOU continue de monter car l’algo voit qu’il bat UBB (un fort) a domicile et en tire une serie de consequences. Voila les trois enseignements qui seraient à tirer. Le reste n’appelle pas commentaire.
Ce classement (tout est calculé automatiquement) voit plus loin que le classement britannique. Il donne un classement final virtuel et évolutif en prenant en compte les résultats et en adaptant dynamiquement les paramètres de prévision avec les résultats enregistres. En fait il fait les calculs qui correspondent aux elucubrations d'apres-match.
Un sous-produit : le calcul de probabilité de victoire pour chaque match. Pour la journée 2 ça me sort (ça suppose qu’on joue a AG, hélas. A Narbonne… ?) :
RCT | 74% | CO | 23% |
SF | 100% | Vannes | 0% |
R92 | 71% | ASM | 26% |
SP | 73% | AB | 24% |
USAP | 75% | MHRC | 22% |
LOU | 67% | UBB | 30% |
ST | 79% | SR | 18% |
C'est assez coherent avec les cotes Winamax, c'est un bon test de la stabilite du modele.