Phobos - Tandem Repeat Suchwerkzeug für komplette Genome
Suchprogramm für DNA-Satelliten
Phobos ist ein ziemlich verbeulter Mond, der den Planeten Mars umkreist. Den Namen dieses natürlichen Satelliten trägt auch ein Softwareprogramm zur Identifikation von DNA-Satelliten, welches Sequenzen bis hin zur Größe von Gesamtgenomen verarbeiten kann. Phobos 3.3.10 zeichnet sich durch seine Genauigkeit und Geschwindigkeit aus.
Tandem Repeats sind einfach strukturierte DNA-Sequenzen, die aus wenigen bis sehr vielen Sequenzwiederholungen aufgebaut sind. Sie werden auch als DNA-Satelliten bezeichnet und nach der Anzahl ihrer Wiederholungen in Satelliten, Minisatelliten oder Mikrosatelliten unterschieden. Erst in den letzten Jahren wurde klar, dass diese Elemente nicht nur in intergenischen Regionen vorkommen, sondern auch in kodierenden Bereichen, in Introns und insbesondere in regulatorischen Elementen eine Rolle spielen können. In vielen eukaryotischen Genomen kommen sie massenhaft vor (rund 1,5 % des menschlichen Genoms bestehen aus Tandem Repeats). Ihre Funktion ist in weiten Teilen noch immer ungeklärt.
Für den Forscher ist das Schöne an den Satelliten ihre große Variabilität. Mutationen und Rekombinationen können zu gewaltigen Unterschieden in der Anzahl der Wiederholungen zwischen verschiedenen Arten und sogar Individuen führen.
Längere, sich wiederholende Sequenzbereiche mit hoher Variabilität werden als Variable-Number Tandem Repeats (VNTR) bezeichnet. Bei Short Tandem Repeats (STR) sind die sich wiederholenden Einheiten nur ein bis sechs Basenpaare lang (z.B. GATA). Da selbst verwandte Individuen deutliche Unterschiede in der Anzahl der Wiederholungen von STRs aufweisen, werden sie heute routinemäßig zur Identifizierung von Straftätern oder in Vaterschaftstests untersucht (s. Labor&more 2/10)). Bei der Entwicklung von Suchprogrammen für DNA-Satelliten treten zwei besondere Probleme auf. Zum einen sollten nicht nur perfekte sondern auch unvollkommene Wiederholungen gefunden werden. Zum andern sollten auch Sequenzabschnitte identifiziert werden, die mehreren Tandem Repeats zugeordnet werden können. Phobos löst beide Probleme ohne dabei auf heuristische (probabilistische) Methoden zurückzugreifen. W Der Phobos-Algorithmus sucht ausgehend von jedem Punkt einer DNA-Sequenz und versucht in beide Richtungen eine Wiederholung fortzusetzen. So werden auch verborgene, kürzere Tandem Repeats, die innerhalb eines größeren Tandem Repeats liegen, aufgefunden.
Der Anwender kann die Genauigkeit der Suche beeinflussen. Dazu stehen drei Optionen zur Verfügung: Imperfect Search toleriert fehlende Übereinstimmungen. Perfect Search findet, wie der Name schon sagt, exakte Übereinstimmungen. Unbestimmte Nukleotide (die z.B. auftreten, wenn die Sequenzierung an dieser Stelle mehrdeutig war) können hier als neutral behandelt werden. Extend Exact Search benötigt eine genaue Übereinstimmung an der Basis einer Suche, erlaubt aber Abweichungen „weiter außen“. Die Qualität eines gefundenen Tandem Repeats wird durch ein Punkte-System(Score) bewertet. Der Anwender kann die Vergabe von Strafpunkten verändern und damit die Bewertung der Treffer beeinflussen. Phobos läuft auf allen Plattformen (Win, Mac, Linux oder auch den exotischeren). Das Programm kann in zwei Versionen kostenlos von der Website des Autors heruntergeladen werden: entweder zur Bedienung per Kommandozeile oder mit einer grafischern Bedieneroberfläche. In der zuletzt genannten Version erleichtern Auswahlfenster und Voreinstellungen den schnellen Einstieg in die Anwendung. Nur beim Bedienungskomfort müssen in der bestehenden Version noch kleinere Abstriche gemacht werden. Größeren Komfort bieten zwei Molekularbiologie-Softwarepakete, in die Phobos eingebaut wurde.
1: Mit dem Ziel einer besonders komfortablen Bedienung wurde von der Firma Biomatters in Zusammenarbeit mit Christoph Mayer, dem Autor von Phobos, ein Phobos-Plugin für die molekulare Analysesoftware Geneious entwickelt.
2: Phobos wurde außerdem in die Mikrosatelliten-Pipeline STAMP integriert [1], mit der sich schnell und im Hochdurchsatzverfahren Primer für Mikrosatelliten entwickeln lassen, z.B. für populationsgenetische Untersuchungen. Phobos empfiehlt sich damit sowohl für Genomprojekte als für den alltäglichen Gebrauch im Labor, etwa für das Primer-Design. Mit der aktuellen Version 3.3.10 befindet sich das Programm noch in der Entwicklung, doch kann Phobos bereits zahlreiche Referenzen aufweisen. So wurde Phobos schon in Genomprojekten [2,3] oder zur Genomcharakterisierung [4] eingesetzt.
Literatur
[1] Kraemer et al. (2009)STAMP: Extensions to the STADEN
sequence analysis package for high throughput interactive
microsatellite marker design. BMC Bioinformatics 10: 41
[2] Mayer Genome-wide analysis of tandem repeats in Daphnia
pulex – a comparative approach. (angenommen)
[3] Adelson (2009) Characterization and distribution of retrotransposons
and simple sequence repeats in the bovine
genome. 106: 12855-12860
[4] Philips (2009) Spontaneous mutational and standing genetic
(co)variation at dinucleotide microsatellites in
Caenorhabditis elegans. 26: 659-669
Stichwörter:
Suchwerkzeug, Analysesoftware, Tandem repeat, Primer, Primerentwicklung, Mikrosatelliten
|