On allele frequency computation from DNA typing data

Abstract
Forensic applications of DNA typing data require the estimation of the frequencies of all observed alleles, which is currently done by a fixed set of groupings (binning) of alleles in a database. Recently it's validity has been questioned on the ground that when a DNA fragment size is close to a bin boundary, the frequencies of all adjacent bins should be added. On the contrary, the current forensic database indicates that when the match window of a DNA fragment overlaps 2 bins, it is enough to consider the bin with the larger frequency, and thisnever underestimates the frequency within the match interval with the current choice of fixed-bin widths. On average, the current fixed-bin procedure yields an allele frequency at least 2-fold higher than that of a floating-bin. Forensische Anwendungen von DNA-Befunden erfordern die Bestimmung der Häufigkeiten aller beobachteten Allele. Dies erfolgt gegenwärtig durch einen fixierten Satz von Gruppierungen (binning) von Allelen in einer Datenbank. Kürzlich wurde die Geeignetheit dieses Ansatzes in Frage gestellt mit der Begründung, daß wenn eine Fragmentgröße nahe bei einer bin-Grenze ist, die Frequenzen aller angrenzenden bins addiert werden sollten. Im Gegensatz hierzu weist die gegenwärtige forensische Datenbank darauf hin, daß bei Überlappung von 2 bins durch einen sog. match window es ausreicht, das bin mit der höheren Frequenz zu berücksichtigen und daß dies nie zu einer Unterschätzung der Frequenz innerhalb des match-Intervalls führt, unter Berücksichtigung der gegenwärtigen Auswahl der Weiten der „fixed-bins”. Im Durchschnitt führt das gegenwärtige „fixed-bin”-Verfahren zu einer Allelfreqenz, welche mindestens 2fach höher ist als jene eines „gleitenden bin”.