An attempt to predict the earning status of a thoroughbred in France by genealogical data
Open Access
- 1 January 2003
- journal article
- Published by EDP Sciences in Animal Research
- Vol. 52 (1) , 79-85
- https://doi.org/10.1051/animres:2003006
Abstract
International audienceThe objective of this study was to create indicators to predict which horses had more chances to be placed in races than others. The study was limited to genealogical independent variables (i.e. concerning sires, dams, paternal and maternal half sibs of the horse). It concerned the racing career of 60 851 thoroughbreds born in France between 1980 and 1995 (i.e. annual earnings in flat races of 2 to 5 year-olds and in jumping races of 3 to 5 year-olds). The earning status is the dependent variable; since it is bi-modal, a logistic regression was chosen as the appropriate statistical method. A stepwise procedure with a threshold of 0.001 allows to select adequate independent variables. The out coming figure of this purely phenotypical approach leads to the following conclusions: it is not possible to predict the probability of being placed as a thoroughbred in France only from genealogical data; the most valuable information available to predict this probability, is the previous performance of the horse itself; there is a great dissymetry between the information given by the dams' performances and that given by the sires' performances, which can be ignored; it is also noticeable that the best predictors of a given earning status are those obtained for the family for the same age and discipline. It can be inferred that genetic correlations between age and discipline are different from 1; these correlations are clearly negative between flat and jumping races. This may also be the case in flat races for the correlations between performances at 2 years and performances at 4 and 5 years. These negative relations never appeared in earlier studies since they were based on selected data of placed horses.Essai de prédiction du statut gagnant/non gagnant d'un Pur-sang en France à partir de données généalogiques. L'objectif était de créer des indicateurs pour prédire quels chevaux avaient plus de chance d'être gagnants. L'étude s'est limitée à des variables prédictrices généalogiques (c'est-à-dire concernant le père, la mère et les demi-frères paternels et maternels du cheval). Elle porte sur la carrière de course de 60 851 Pur-sang nés en France entre 1980 et 1995 (c'est-à-dire les gains annuels en plat de 2 à 5 ans et en obstacles de 3 à 5 ans). Le statut gagnant/non gagnant est la variable prédite, comme elle est bi-modale la régression logistique a été choisie comme méthode statistique adaptée. Une procédure pas à pas avec un seuil de 0,001 a permis de choisir les variables prédictrices appropriées. Les grandes lignes qui se dégagent de cette approche purement phénotypique sont les suivantes : il n'est pas possible de prédire correctement si un cheval sera gagnant ou pas uniquement à partir de données généalogiques ; l'information la plus utile pour cela est celle qui peut être obtenue sur le cheval lui-même ; il y a une grande dissymétrie entre l'information apportée par les mères et par les pères, cette dernière pouvant être ignorée ; on peut aussi remarquer que les meilleurs prédicteurs d'un statut gagnant/non gagnant pour un âge et une discipline donnée sont ceux obtenus par la famille pour le même âge et la même discipline. On peut en inférer que les corrélations génétiques entre âge et disciplines sont différentes de 1 ; ces corrélations sont clairement négatives entre courses plates et à obstacles. Cela semble aussi être le cas pour le plat entre statut à 2 ans et statut plus âgé (4 et 5 ans). Ces relations négatives ne sont jamais apparues dans les études antérieures concernant les données sélectionnées des seuls gagnantsKeywords
This publication has 0 references indexed in Scilit: