[font="Times New Roman"] [font="Arial"]Tiefer Einblick in ein Stockschwämmchen
Untertitel:
Der Fluch und der Segen der Sequenzierung und deren Entmystifizierung?
[/font][/font][font="Arial"]
Liebe Pilz-Freunde,
nachdem mein letzter Bericht einen kleinen Wirbelsturm hier im Forum ausgelöst hat habe ich festgestellt, dass das Thema Sequenzierung recht hohen Anklang hier im Forum findet, deshalb möchte ich kurz etwas mehr über dieses spannende Thema erzählen - muss aber unbedingt dazu sagen dass auch ich ein blutiger Anfänger bin und Euch hier nur mitteilen möchte was ich so alles auf dem Weg vom Total-Anfänger zum Anfänger herausgefunden habe.
Ich bin sicher, dass hier Profis mitlesen werden, denen der eine oder andere Fehler auffällt, oder alles was ich hier schreibe mit einem müden Gähner ganz schnell durchscrollen.
Bitte, liebe Profis, ich bin für jede Anregung und Fehlerkorrektur immer offen. Vielen Dank für jeden keinen Tipp. Ich fasse alles immer als konstruktive Kritik auf - also immer ran an die Tastatur. Dies ist einfach nur die Geschichte der ersten Geh-Versuche. Fremdwörter vermeide ich bewusst, wo es geht oder erkläre sie ganz kurz.
Als Forums-Lesestoff gibt es hier schon mal was:
http://www.pilzforum.eu/board/…quenzierung-wissenswertes
Wenn Ihr das gelesen habt, wisst Ihr schon einiges (wie das Sequenzieren technisch geht, etc.) ---> deshalb schreibe ich dazu nichts weiter im folgenden Text.
Einleitung:
Meiner Meinung nach schadet es überhaupt nicht sich als Feld-Schwammerer mit dem Thema Sequenzierung zu befassen. Wer es einigermaßen sorgfältig vorgeht (wohl auch autodidaktisch akribisch bei einem Kasten Bier) angeht, dem wird es ein spannendes, hilfreiches Werkzeug sein. Wer aber schlampig arbeitet - dem wird es gar nichts nützen.
Auf jeden Fall muss ich sagen, dass es sehr viel Spaß machte Sequenzierungen in das Hobby unwissenschaftlich(!) einfließen zu lassen - warum - das werdet Ihr gleich sehen.
Ich muss dazu zusätzlich sagen, dass es mir nicht wirklich wichtig ist einen Pilz 100% (richtig) bestimmen zu können. Für mich war und ist das ein spannendes Hobby.
Der Kandidat der für das heutige Thema herhalten muss ist ein ganz normales Stockschwämmchen.
Und zwar einfach um nicht mit einem schwer bestimmbaren Pilz daherzukommen um den dann gestritten wird ob es denn überhaupt der von mir behauptete Pilz ist.
Es handelt sich um Fundnummer: 2016-04-30-1349
Zweifellos das Gemeine Stockschwämmchen (Kuehneromyces mutabilis).
Oder etwa doch nicht zweifellos? - wir werden es herausfinden....
Und so sahen sie am 30.04.2016 aus:
[/font]
[font="Arial"]
[/font]
[font="Arial"]
[/font]
[font="Arial"]
[/font]
[font="Arial"]
Einfach nur lecker schmeckten sie!
[/font]
[font="Arial"]Ich nahm wieder zum Spaß zuhause ein paar Daten auf:
Sporenpulverfarbe: Pantone 181U = ████
Mikrodaten:
Sporen:
(6.7) 7 - 7.6 (8.2) x (4) 4.1 - 4.4 (4.6) µm
Q = (1.6) 1.7 (2) ; N = 8
V = (60) 61 - 76 (84) µm ³
Me = 7.3 x 4.2 µm ; Qe = 1.7 ; Ve = 70 µm ³
Cheilozystiden:
mit Schleimkappe
(15.6) 16.7 - 24.1 (24.3) x 2 - 4.1 (4.2) µm
Q = (4.3) 5.2 - 7.8 (12.2) ; N = 7
Me = 19.6 x 3.2 µm ; Qe = 6.7[/font]
Vor der Sequenzierung:
Ihr kennt mich - ich trug lange, lange unter meinem Avatar den Namen "Makroskopierer" - und dieser bin ich immer noch.
Ich kann jeden den Hinweis geben, dass die gründliche Datenaufnahme des (frischen) Pilzes und dessen Standort wichtiger ist, als das Mikroskopieren und Sequenzieren.
Oft halfen mir kleine solcher morphologischen Details um schnell ans Ziel zu gelangen. Ein 8 Meter entfernt stehender Nussbaum, der leichte Geruch nach Anis oder das gilbende Fleisch im Anschnitt ist oft wichtiger als die Mikro-Daten und DNA-Sequenz. Deshalb:.... siehe hier den Beitrag von Ingo den ich auch jetzt immer noch vor dem geistigen Auge habe und bei jedem Fund standardmäßig abarbeite: http://www.pilzforum.eu/board/…ngaben-zur-pilzbestimmung
Ein gutes, scharfes, farbechtes Bild vom Schammerl (auch unten und im Schnitt) hilft natürlich immer.
Scheitert die eindeutige Bestimmung durch die aufgenommenen Daten, ist das Nächste bevor man sequenziert die mikroskopische Datenaufnahme. Gattungsspezifische Merkmale sollten aufgenommen und dokumentiert werden.
Macht man diese beiden Schritte nicht, ist meiner Meinung nach eine Sequenzierung zur weiteren Bestimmung nicht geeignet. Natürlich kann man zum Spaß, so wie ich es tat hier in diesem Beispiel bereits eindeutig bestimmte Schwammerln sequenzieren und mit den Sequenzen allen Schabernack treiben, sie also durch diverse Suchmaschinen und Programme jagen, Diagramme und 3D-Modelle erzeugen, usw, usw. Gerade bei diesen spielerischen Übungen habe ich das eine oder andere herausgefunden was mir dann im "Ernstfall" half eine Fehldiagnose zu erkennen. Konzentriert man sich nämlich nur auf die Bestimmung eines unbekannten Pilzes anhand einer Sequenz - wird man wahrscheinlich scheitern, denn man kennt die Eigenarten und Fehleinträge in den Gendatenbanken zunächst nicht und unterschätzt sie.
Sammeln, Trocknen und Lagern:
Normale Basidiomyceten:
Der Pilz sollte in "ausreichender Menge" entnommen werden. Wie viel das ist ist natürlich von der Pilzgröße abhängig, und davon ob man etwas davon selbst behalten will oder alles zur Sequenzierung geben will.
Dass man den Pilz "nach Vorschrift" trocknen und lagern muss versteht sich wohl von selbst. Zu beachten ist hier eine Trocknungstemperatur von unter 40 °C.
Mit Fremdsporen und anderer Verschmutzung hatte ich bislang keine Probleme, aber vielleicht ist es gar nicht verkehrt den Sequenzier-Pilz gleich nach der Entnahme von Erde, Blättern usw. zu säubern und in Alufolie separat zu packen.
Bei Ascos muss (wie ihr aus früheren Beiträgen ja schon wisst) in der Regel eine Kultur angelegt werden. Dieses Thema kann ich noch nicht näher erklären weil ich es noch nicht gut kenne - folgt aber später falls ich Lust dazu habe.
Die Sequenzierung:
Ich denke man sollte sich vorher mit einem Experten der Gattung unterhalten um sicher zu gehen, auch den DNA-Abschnitt zu wählen der wahrscheinlich zum Ziel führt.
Auch ob überhaupt Vergleichs-Sequenzen vorhanden sind sollte im Vorfeld geklärt werden.
Dieses Wissen besitze ich nicht, und kann hier nur den Rat geben sich an Gattungs-Experten zu wenden, welche einschätzen können ob eine Sequenzierung zum Ziel führen wird oder nicht. Wenn nicht - lasse ich es gleich ganz sein.
Eine übliche Region welche zur Bestimmung verwendet wird ist die so genannte "ITS-Region" (was das ist könnt ihr ja im Internet nachlesen). Auch bei dem Stockschwämmchen in diesem Beispiel ist das so.
Das Ergeb[font="Arial"]nis der Sequenzierung:
[/font][font="Arial"]Über die Sequenzierverfahren könnt Ihr zum Beispiel hier mehr erfahren: https://de.wikipedia.org/wiki/DNA-Sequenzierung
Wer nun glaubt, dass man nach der Sequenzierung die Bestimmung auf einen Silbertablett geliefert bekommt der irrt.
Der Messaufnehmer des Sequenzers nimmt nichts anderes auf als die Rohdaten die ungefiltert erst mal so aussehen:[/font][font="Arial"][/font]
[font="Arial"]Herausgezoomt schaut das so aus:[/font]
[font="Arial"]
Zunächst jagt man dieses so genannten "Chromatographie-Rohdaten" durch ein "Tiefpass-Filter" mit "Threshold" um das Signal-Rauschen zu entfernen.
Ebenso werden die Abschnitte in denen nur Rauschen aufgenommen wurde abgeschnitten.
Beides macht jede Sequenz-Analyse-Software per Knopfdruck.
Das Ergebnis ist die geglättete und grob beschnittene Sequenz die bei unserem Stockschwämmchen nun so aussieht:
[/font]
[font="Arial"]Diese Darstellung der Daten nennen man "Chromatogramm".
In alten Beiträgen wurde einmal gefragt was die schönen bunten Buchstaben (A, C, G, T) bedeuten.
Das zu erklären bringt an dieser Stelle aber noch nichts, denn dazu müssen wir erst den nächsten und übernächsten Punkt anschauen.
[/font]
[font="Arial"]Herausfinden der Ausrichtung und deren Korrektur:
Chromatogramme und die daraus erstellten "Nukleobasen-Sequenzen" (das sind die tollen Buchstabenreihen) werden üblicher Weise vom so genannten 5'-Ende zum 3'-Ende geschrieben, jedoch können sie so nur zufällig aufgenommen werden.
Der Sequenzierautomat weiß ja nicht von welchen Ende die DNA durch den Datenaufnehmer (z.B. die Nanopore) gelaufen ist. Das heißt, dass die Sequenz rückwärts und komplementär aufgezeichnet worden sein kann.
Die erste Aufgabe ist also, herauszufinden in welcher Richtung die Sequenz also 3' --> 5' (unüblich) oder 5' --> 3' (üblich) aufgezeichnet wurde.
Das kann man (wenn man schnell arbeiten will) entfallen lassen indem man die Sequenz einfach so nimmt wie sie ist und Alignement-Maschinen die Arbeit automatisiert überlassen will.
Lässt man solch eine so genannte Rückwärts-komplementär-Sequenz z.B. durch eine "BLAST"-Maschine laufen, erkennt Sie die falsch herum geschriebene Sequenz.
Das Problem aber ist, dass sie die Sequenzen in der Datenbank umdreht und das Vergleichsergebnis wird dann auch verkehrt herum angezeigt.
Nicht so, toll... denn wir wollen ja noch mehr mit unserer Sequenz herumspielen und im Forum damit angeben...
Wie finden wir also heraus ob die Sequenz verkehrt herum ist?
Das geht mit den so genannten "Primer-Sequenzen" oder indem man bei quasi bekannten Pilzen die Sequenz mit bereits richtig herum geschriebenen Sequenzen (z.B. per BLAST) vergleicht.
Ich wähle jetzt mal die eigentlich korrekte Methode mit den "Primer-Sequenzen" bei dem Beispiel hier.
Erst mal lesen was das ist - z.B. hier: http://sites.biology.duke.edu/fungi/mycolab/primers.htm - Ahaaa... alles klar, oder?
Nun muss man nur nach dem Primer suchen, bzw. nach dessen komplementärer Rückwärtssequenz und schon weiß man, ob die aufgenommene Sequenz richtig oder falsch herum geschrieben ist. Wie machen wir das?
[/font]
[font="Arial"]Erstellen einer Primer Map
Nicht nur wegen dem vorherigen Punkt sondern auch um sich in der Sequenz zu orientieren erstellt man sich eine Primer Map.
Das bedeutet man vergleich bekannte Primer-Sequenzen mit der Sequenz. Das kann auch wieder jedes gute Sequenzanalyse-Tool.
Gut geeignet sind der 5.8SR-Primer oder der ITS1 - aber Vorsicht! Der 5.8-Primer wird rückwärts gelesen, deshalb muss man der Rückwärts-Primer "5.8SR" mit der Sequenz vergleichen um herauszufinden welche Ausrichtung die Sequenz hat. Verwirrt? macht nichts - einfach mal ausprobieren...
Meine Original-Sequenz-Primer-Map sieht so aus:
[/font]
[font="Arial"]Vorwärts-Primer habe ich hier magenta markiert. Rückwärts-Primer orange. Man erkennt sofort: In diesem Fall ist die Sequenz verkehrt herum.
[/font]
[font="Arial"]Ich drehte die also zunächst um, und bildete auch deren "Komplementär". Der Vorgang ist einfach und gar kein Hexenwerk.
Die DNA besteht ja aus einem Doppelstrang von so genannten "Basenpaaren". "Nukleobase" A gehört immer zu T und C immer zu G. Man muss also nur den DNA-Strang komplett umdrehen und dann aus A --> T machen und aus C --> G. Das geht in jeder DNA-Analysis-Software in Handumdrehen.
Und was sagt uns nun die Primer-Map?:
[/font]
[font="Arial"]Jawoll - alles prima. Nun ist die Sequenz richtig herum.
[/font]
[font="Arial"]Zurück ins Chromatogramm. Man kann sich an dieser Stelle schon einmal kleine Amplituden (das sind die Signalausschläge) ansehen und die Doppel-Ausschläge.
Denn hier könnte ein Fehler verborgen sein der einen später beim "Alignen" (das ist das Ausrichten an anderen Sequenzen) verwirrt.
Base Nummer 498 ist hier so einer:
Die bunten Buchstabenkolonnen
So und nun wissen wir auch, dass die Buchstaben, nach denen in alten Beiträgen gefragt wurde erst einmal zweideutig sind und erst NACH der Kontrolle bzw. Korrektur der Richtung eindeutig werden.
Sie bedeuten folgendes:
[/font]
[font="Arial"]Die für uns wichtigen habe ich rot dargestellt. In alten Beiträgen wurde gefragt wofür z.B. "Y" steht. In Primern wird manchmal die Mehrdeutigkeits-Schreibweise benötigt, also z.B. darf an einer bestimmten Stelle des Primers C oder T stehen --> in der Primersequenz schreiben wir also dann z.B. das "Y". Der Basdiomyceten-Primer "bRPB2-7.1R" ist so ein Exot.
Viel wichtiger sind aber die Doppeldeutigkeiten für die Auswertung wie wir gleich sehen werden.
[/font]
[font="Times New Roman"][font="Arial"]Schreiben einer .fasta-Datei
[/font][font="Arial"]Die so vorbereitete Sequenz schreibt man in eine Textdatei mit Endung ".fasta". das ist nichts anderes wie ein ">" gefolgt von der Bezeichnung der Sequenz, dann ein Zeilenumbruch gefolgt von der Sequenz in Form "CGGTAGTT...".
So schaut die bei meinem Schwammerl aus:[/font]
[/font][font="Courier New"]>DW201604301349[/font][font="Courier New"]
TTTGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAA
GGATCATTATTGAATGAACTTGGTAGTGGTTGTAGCTGGCTCTCTCGAGA
GCATGTGCACACCCGCCATCTTTATCTTTCCACCTGTGCACTTCTTGTAG
ACTTTGGGATTTGAAAACTTATCCGGGGCAACTCGGTCGGGAGGAGCTGC
TGTAGCAATACGGCTCTCCTTGACAAGTCTTCAAAGTCTATGTTTTTCAT
ATACCCCATAGTATGTAACAGAATGTATACAAATGAGCCTTAGTGCTTAT
AAAACTTATACAACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGA
AGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAAT
CATCGAATCTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATG
CCTGTTTGAGTGTCATTAAATTCTCAACCTTATTAGCTTTTGCTGATGAT
GGCTTGGATTTGGGGGTCTTTTGCCGGCTTTTAACAAAGTCAGCTCCCCT
TAAATGCATTAGCTGGTACCCTCTGGTGGAACCGTCTATTGGTGTGATAA
TTATCTACGCCGTGGACATCTGCCCTTAGAGTAGGTGTGCTGCTTCTAAC
CGTCTGTTCATTCGGACAATACATATGACATTTGACCCCCAAA
[/font][font="Times New Roman"]
[font="Arial"]Das macht natürlich auch jede DNA-Software automatisch.
Automatisches Alignen und mal ein Bisschen Auswerten
Für das "Alignen" oder zu Deutsch "Ausrichten" gibt es viele Methoden, die ich nicht im Detail kenne und natürlich nicht beschreiben kann. Wichtig für uns Schwammerer ist vor allem die "BLAST-Methode". Wie diese funktioniert steht hier: https://de.wikipedia.org/wiki/BLAST-Algorithmus
Auch das ist kein Hexenwerk wie ihr seht und die Theorie dahinter braucht uns Praktier wohl auch nicht weiter zu interessieren.
Ich probierte verschiedene Tools aus und am besten kam ich mit der ncbi-Maschine hier zurecht:
https://blast.ncbi.nlm.nih.gov…Search&LINK_LOC=blasthome
Als Database wählt man dort "Nucleotide collection (nr/nt)" und als Organism gibt man "fungi (taxid:4751)" ein.
Aber auch Unite sollte nicht unversucht gelassen werden: https://unite.ut.ee/analysis.php
Und nicht zu vergessen ENA: http://www.ebi.ac.uk/ena/data/sequence/search
Als Ergebnis bekommt man eine Liste von Funden. Diese kann man nun Auswerten nach Lust und Laune.
Ich beginne gerne damit, mir einen groben Überblick über ein "Phylogenetischen Baum" (Genbäumchen, Baumdiagamm) zu verschaffen.
Was das ist, kann man z.B. hier nachlesen: http://kaktus42.spline.de/mate…hylogenetische-baeume.pdf
Weiter unten gehe ich noch mal kurz auf diesen Punkt ein.
Es ist zunächst ein ganz grober, sicher nicht richtiger Baum der mir die so genannten "Distanzwerte" - also den Grad der Nicht-Übereinstimmung zu anderen Sequenzen in der Datenbank anzeigen soll.
Hier ein kleiner Ausschnitt davon:[/font][/font][font="Arial"]
[/font]
[font="Arial"]Was sehen wir...
Bei diesem Fund wissen wir ja (hier absichtlich) dass es ein Stockschwämmchen ist.
Wüssten wir das nicht - könnten wir das nun über die Ausschlussmethode und nähere Untersuchung der Sequenzen ebenso leicht erkennen.
Überraschender Weise scheint es aber ein weiteres Stockschwämmchen zu geben, wie wir an dem oberen Ast ja sehen können.
Nun könnte (oder besser sollte) man z.B. untersuchen was der Unterschied dieses Astes zu meinem Stockschwämmchen ist.
[/font]
[font="Arial"]Na und das tun wir doch gleich mal:
[font="Times New Roman"][font="Courier New"]Query_37803 17 TCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATTGAATGAACTTGGTAG 76
AF345807 1 ............................ 28
KR673464 1 ............................................................ 60
KR673487 1 ................................................. 49
KR673561 1 ....................................................... 55
KR673658 1 ................................................. 49
KR673562 1 ..................................... 37
Query_37803 77 TGGTTGTAGCTGGCTCTCTCGAGAGCATGTGCACACC-CGCCATCTTTATCTTTCCACCT 135
AF345807 29 .-................................G..T.T.................... 87
KR673464 61 ..................................G..T.T.................... 120
KR673487 50 ..................................G..T.T.................... 109
KR673561 56 ..................................G..T.T.................... 115
KR673658 50 ................C.................G..T.T.................... 109
KR673562 38 G.................................G..T.T.................... 97
Query_37803 136 GTGCACTTCTTGTAGACTTT-GGGATTTGAAAACTTATCCGGGGCAACTCGGTCGGGAGG 194
AF345807 88 ....................T........---.-..-....A.............T.... 142
KR673464 121 ....................T........---.-..-....A.............T.... 175
KR673487 110 ....................T........---.-..-....A.............T.... 164
KR673561 116 ....................T........---.-..-....A.............T.... 170
KR673658 110 ....................T........---.-..-....A.............T.... 164
KR673562 98 ....................T........---.-..-....A.............T.... 152
AB907596 1 ....A.............T.... 23
Query_37803 195 AGCTGCTGTAGCAATACGGCTCTCCTTGA-CAAGTC-TTCAAAGTCTATGTTTTTCATAT 252
AF345807 143 ..T..........................A......T....G.................. 202
KR673464 176 ..T.........G................A......T....G.................. 235
KR673487 165 ..TAT........................A......T....G.................. 224
KR673561 171 ..T..........................A......T....G.................. 230
KR673658 165 ..T..........................A......T....G.................. 224
KR673562 153 ..T.........G................A......T....G.................. 212
AB907596 24 ..T..........................A......T....G.................. 83
Query_37803 253 ACCCCATAGTATGTAACAGAATGTATACAAATGAGCCTTAGTGCTTATAAAACTTATACA 312
AF345807 203 ............................-............................... 261
KR673464 236 .T..........................-............................... 294
KR673487 225 ............................-............................... 283
KR673561 231 ............................-............................... 289
KR673658 225 ............................-............................... 283
KR673562 213 .T..........................-............................... 271
AB907596 84 ............................-............................... 142
Query_37803 313 ACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGCGAAATGCGATAA 372
AF345807 262 ............................................................ 321
KR673464 295 ............................................................ 354
KR673487 284 ............................................................ 343
KR673561 290 ............................................................ 349
KR673658 284 ............................................................ 343
KR673562 272 ............................................................ 331
AB907596 143 ............................................................ 202
Query_37803 373 GTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTTGCGCTCCTT 432
AF345807 322 ............................................................ 381
KR673464 355 ............................................................ 414
KR673487 344 ............................................................ 403
KR673561 350 ............................................................ 409
KR673658 344 ............................................................ 403
KR673562 332 ............................................................ 391
AB907596 203 ............................................................ 262
Query_37803 433 GGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATTAAATTCTCAACC-TTATTAGCTTTT 491
AF345807 382 ...............................................T............ 441
KR673464 415 ...............................................T............ 474
KR673487 404 ...............................................T............ 463
KR673561 410 ...............................................T............ 469
KR673658 404 ...............................................T............ 463
KR673562 392 ...............................................T............ 451
AB907596 263 ...............................................T............ 322
Query_37803 492 GCTGATGATGGCTTGGATTTGGGGGTCTTTTGCCGGCTTTTAACAAAGTCAGCTCCCCTT 551
AF345807 442 ......A..........C...............G........-.T-.............. 499
KR673464 475 ......A..........C........................-.T-.............. 532
KR673487 464 ......A..........C........................-.T-.............. 521
KR673561 470 ......A..........C........................-.T-.............. 527
KR673658 464 ......A..........C........................-.T-.............. 521
KR673562 452 ......A..........C........................-.T-.............. 509
AB907596 323 ......A..........C........................-.T-.............. 380
Query_37803 552 AAATGCATTAGCTGGTACCCTCTGGTGGAACCGTCTATTGGTGTGATAATTATCTACGCC 611
AF345807 500 ................CA.......................................... 559
KR673464 533 ...C............CA.......................................... 592
KR673487 522 ...C............CA.......................................... 581
KR673561 528 ...C............CA.......................................... 587
KR673658 522 ...C............CA.......................................... 581
KR673562 510 ...C............CA.......................................... 569
AB907596 381 ...C............CA.......................................... 440
Query_37803 612 GTGGACATCTGCCCTTAGAGTAGGTGTGCTGCTTCTAACCGTCTGTTCATTCGGACAATA 671
AF345807 560 ................G........................................... 619
KR673464 593 ................G......................... 634
KR673487 582 ................G......................... 623
KR673561 588 ................G......... 613
KR673658 582 ....... 588
KR673562 570 ................G......... 595
AB907596 441 ................G........................................... 500
Query_37803 672 CATATGACATTT-GACC 687
AF345807 620 ............T.... 636
AB907596 501 ............-.... 516[/font][/font]
[/font]
Oha! Ja da scheint es doch tatsächlich noch eine weitere "Art" Kuehneromyces mutabilis zu geben die nur zu 90% identisch ist.
Also tatsächlich ein Kuehneromyces mutabilis variata xyz?
Aber schauen wir uns die Sequenzen (Hyperlinks oben) genauer an erkennen wir - sie stammen alle aus in Korea.
Na gut - diesen Ast können wir also absägen, denn wir sind ja nicht in Korea, aber das ist doch mal eine interessante Sache.
Ab sofort könnt Ihr sagen wenn ihr ein Stockschwämmchen findet: "Das ist das Gemeine Stockschwämmchen - es könnte aber auch das Koreanische Stockschwämmchen sein dass gerade erst eingeschleppt wurde" ;-))) Natürlich nur spaßig gemeint, aber für unsere Kritiker: Ja, dieser theoretische Sachverhalt ist nicht 100% auszuschließen.
Mehr will ich in diesem kurzen wirklich nur oberflächlichen Beitrag nicht über Genbäumchen und über die Auswertung beschreiben - andere schreiben ja Doktorarbeiten über das Thema.
Kommen wir zurück zu dem Stockschwämmchen-Ast in dem wir gelandet sind und sehen uns die am besten passende Sequenz einmal genauer an.
Das ist die mit der ID-Nummer "GU062262".
Was lesen wir nach dem Alignment mit dieser Sequenz...
Kuehneromyces mutabilis 18S ribosomal RNA gene, partial sequence; internal transcribed spacer 1, 5.8S ribosomal RNA gene, and internal transcribed spacer 2, complete sequence; and 28S ribosomal RNA gene, partial sequence
Sequence ID: GU062262.1 --> das ist die Sequenz ID
Score: 1199 bits(649) --> die Wertung
Identities: 653/656(99%) --> 653 von 656 Basen stimmen überein, das sind 99%
Gaps: 1/656(0%) --> 1 Leerstelle (Gap) mussten in die Sequenz eingefügt werden um sie passend zu machen
Strand: Plus/Plus --> das ist wichtig! Wir sehen: beide DNA-Stränge laufen in die gleiche Richtung --> Unsere Sequenz ist richtig herum.
[font="Courier New"]Query 4 GAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATTGA 63
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 3 GAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATTGA 62
Query 64 ATGAACTTGGTAGTGGTTGTAGCTGGCTCTCTCGAGAGCATGTGCACACCCGCCATCTTT 123
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 63 ATGAACTTGGTAGTGGTTGTAGCTGGCTCTCTCGAGAGCATGTGCACACCCGCCATCTTT 122
Query 124 ATCTTTCCACCTGTGCACTTCTTGTAGACTTTGGGATTTGAAAACTTATCCGGGGCAACT 183
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 123 ATCTTTCCACCTGTGCACTTCTTGTAGACTTTGGGATTTGAAAACTTATCCGGGGCAACT 182
Query 184 CGGTCGGGAGGAGCTGCTGTAGCAATACG[/font][font="Courier New"]G[/font][font="Courier New"]CTCTCCTTGACAAGTCTTC[/font][font="Courier New"]A[/font][font="Courier New"]AAGTCTATGT 243
||||||||||||||||||||||||||||| ||||||||||||||||||| ||||||||||
Sbjct 183 CGGTCGGGAGGAGCTGCTGTAGCAATACG[/font][font="Courier New"]A[/font][font="Courier New"]CTCTCCTTGACAAGTCTTC[/font][font="Courier New"]R[/font][font="Courier New"]AAGTCTATGT 242
Query 244 TTTTCATATACCCCATAGTATGTAACAGAATGTATACAAATGAGCCTTAGTGCTTATAAA 303
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 243 TTTTCATATACCCCATAGTATGTAACAGAATGTATACAAATGAGCCTTAGTGCTTATAAA 302
Query 304 ACTTATACAACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGCGAA 363
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 303 ACTTATACAACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGCGAA 362
Query 364 ATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTT 423
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 363 ATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTT 422
Query 424 GCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATTAAATTCTCAACCTTAT 483
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 423 GCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATTAAATTCTCAACCTTAT 482
Query 484 TAGCTTTTGCTGAT[/font][font="Courier New"]G[/font][font="Courier New"]ATGGCTTGGATTTGGGGGTCTTTTGCCGGCTTTTAACAAAGTCAG 543
|||||||||||||| |||||||||||||||||||||||||||||||||||||||||||||
Sbjct 483 TAGCTTTTGCTGAT[/font][font="Courier New"]R[/font][font="Courier New"]ATGGCTTGGATTTGGGGGTCTTTTGCCGGCTTTTAACAAAGTCAG 542
Query 544 CTCCCCTTAAATGCATTAGCTGGTACCCTCTGGTGGAACCGTCTATTGGTGTGATAATTA 603
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 543 CTCCCCTTAAATGCATTAGCTGGTACCCTCTGGTGGAACCGTCTATTGGTGTGATAATTA 602
Query 604 TCTACGCCGTGGACATCTGCCCTTAGAGTAGGTGTGCTGCTTCTAACCGTCTGTTC 659
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 603 TCTACGCCGTGGACATCTGCCCTTAGAGTAGGTGTGCTGCTTCTAACCGTCTGTTC 658[/font]
[font="Arial"]In der Sequenz sehen wir nun etwas dass wir oben schon gelernt haben.
Die Doppeldeutigkeit R (Purin) kann A oder G sein --> also nur scheinbar eine Abweichung.
Gedanklich zurück zu einer echten Sequenz-Analyse eines unbekannten Pilzes:
Ich kann und will an dieser Stelle nicht behaupten ob das Ergebnis einer Sequenz-Analyse (mit welcher Suchmaschine auch immer) eindeutig ist oder total falsch.
Hier sollte man nach erfolgreichen Funden nochmals mit Gattungs-Experten Rücksprache halten.
Gehen wir für unser Beispiel nun mal davon aus, dass wir den wahrscheinlichsten Pilz herausgefischt haben - also eben ein Gemeines Stockschwämmchen - und betrachten das Ergebnis als "so eindeutig dass wir davon ausgehen können dass es dieser ist".
[/font]
[font="Times New Roman"][font="Arial"]Beschneiden der beiden Enden[/font][font="Arial"]
Den Anfang und das Ende, welches immer noch die niedrigen Ausschläge enthält schneidet ncbi-BLAST für uns schon "richtig" weg.
Es ist kein Muss, das auch nachträglich zu tun, aber der Sauberkeit halber machen wir das mal.
Zuerst muss man herausfinden welche anderen Sequenzen noch Teilweise den Enden entsprechen, dass wir nicht zu viel weg schneiden.
Man nimmt also eine Menge der Sequenzen des "bestimmten" Pilzes und schaut sich die Enden und Anfänge an:[/font]
[font="Arial"]Die erste enthält hier noch am meisten von meinem Anfang - sie beginnt mit[/font] [/font][font="Courier New"]GAGGAAGTA...[/font][font="Times New Roman"][font="Times New Roman"]
[font="Arial"]Vom Anfang schneide ich also weg ich weg:[/font] [font="Times New Roman"][font="Courier New"]TTT[/font][/font][/font][/font]
[font="Arial"]Die langen enden mit [/font][font="Courier New"]TTTTGACC[/font][font="Times New Roman"]
[font="Arial"]Vom Ende schneide ich also ab:[/font][/font] [font="Times New Roman"][font="Courier New"]CCCAAA[/font][/font]
[font="Times New Roman"][font="Arial"]Das mache ich in der .fasta-Datei und nenne dies "bereinigte Sequenz". Analyse-Software kann diesen Schritt auch automatisch machen, aber je nach Einstellung schneidet die Software zu viel oder zu wenig ab, weshalb ich noch keine andere Methode wie die manuelle Korrektur kenne. Falls jemand einen zuverlässigen automatisierten Weg kennt --> bitte mir sagen.
Diese bereinigte .fasta-Datei sieht nun so aus:[/font]
[font="Courier New"]>DW201604301349[/font]
[/font][font="Courier New"]GAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAA
GGATCATTATTGAATGAACTTGGTAGTGGTTGTAGCTGGCTCTCTCGAGA
GCATGTGCACACCCGCCATCTTTATCTTTCCACCTGTGCACTTCTTGTAG
ACTTTGGGATTTGAAAACTTATCCGGGGCAACTCGGTCGGGAGGAGCTGC
TGTAGCAATACGGCTCTCCTTGACAAGTCTTCAAAGTCTATGTTTTTCAT
ATACCCCATAGTATGTAACAGAATGTATACAAATGAGCCTTAGTGCTTAT
AAAACTTATACAACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGA
AGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAAT
CATCGAATCTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATG
CCTGTTTGAGTGTCATTAAATTCTCAACCTTATTAGCTTTTGCTGATGAT
GGCTTGGATTTGGGGGTCTTTTGCCGGCTTTTAACAAAGTCAGCTCCCCT
TAAATGCATTAGCTGGTACCCTCTGGTGGAACCGTCTATTGGTGTGATAA
TTATCTACGCCGTGGACATCTGCCCTTAGAGTAGGTGTGCTGCTTCTAAC
CGTCTGTTCATTCGGACAATACATATGACATTTGACC[/font]
[font="Arial"]
Mit dieser korrigierten .fasta-Datei gehe ich wenn ich Lust habe nochmal zurück in BLAST. Dadurch werden die werte für die prozentuale Identität zu den Pilzen in der Datenbank genauer.
Nun sagen wir mal: Die Identität des Pilzes ist so gut es geht per Sequenzierung durch Vergleich mit ähnlichen Sequenzen ermittelt.
Manuelle Nachkontrolle mit weiteren vorhandenen Sequenzen
Tja, nun kann man sich hinsetzen und stundenlang mit einer ganzen Fülle von verschiedensten Programmen vorhandene Sequenzen die sich in einigen Datenbanken finden mit der des Fundes vergleichen. Unterschiede herausarbeiten, "Konsensussequenzen" berechnen (Das ist die logische vereinheitlichte Sequenz mehrerer Sequenzen einer Art), usw., usw. Je nach Seltenheit des Fundes kann das wohl sehr Zeitaufwändig werden. Eine genaue Beschreibung wie das geht habe ich nicht, denn ich habe das noch nicht so exzessiv gemacht... Vielleicht finde ich einmal ein Pilzchen wo das nötig wird, dann können wir uns hier tagelang im Forum damit auseinandersetzen...
Denkt auch immer an die von Ditte beschriebene Grenze nach der alles was unter 97% Übereinstimmung bei der Gattung Inocybe war als neue Art beschrieben wurde.
Im Umkehrschluss kann man zwar nicht sagen dass man alles über 97% als eine Art durchgehen lassen kann, aber es zeigt auf, dass es eine gewisse Toleranz gibt in der man sich in Abhängigkeit der Gattung bewegen "darf".
Für heute soll diese kleine Geschichte, über die echte Profis wohl ganze Bücher schreiben können erst mal genügen.
Was nun folgt sind Spielereien die ich mit den Sequenzen so angestellt habe... (ohne genaue Erklärung wie es geht denn das ist teilweise schon ein bisschen komplizierter....)
"Spielerei" 1: Phylogenetischer Baum (Phylogram)
Was das ist, habe ja oben schon kurz überflogen.
"Spielerei" nur für mich - für Profis wohl ein wichtiges Werkzeug. Natürlich probierte ich mit diversen Methoden für die Berechnung von Genbäumchen herum.
Je nach Berechnungsmethode, Toleranzen, Vergleichsdatensätzen usw. kommt man jedoch auf ganz unterschiedliche Ergebnisse.
Nützlich waren diese Bäumchen für mich bislang um der "Abstand" zu anderen Arten deuten zu können und diese dadurch wie in dem Beispiel oben zu sehen auszuschließen.
Die Frage ist für mich momentan noch, ob die von mir ausgewählten Vergleichsdaten überhaupt stimmten, ob ich sie richtige gedeutet habe, usw.
Deshalb sehe ich dieses Thema vorläufig bei mir im Abschnitt "Spielerei". Eben deshalb weil ich Anfänger bin und hier noch keine wirklich aussagekräftigen Ergebnisse oder Erkenntnisse erzielen kann. Die Profis unter Euch werden diese Methode bestimmt besser Anwenden und deren Ergebnisse auswerten können als ich.
Die Diagramme von mir dürfen also ruhig erst einmal den Stempel "dilettantisch" tragen...
Hier ein Beispiel für die Gattung Kuehneromyces inkl. ausländischer Arten aus Konsensussequenzen dass ich schnell mal beispielhaft gemacht habe:
Profis werden merken dass hier eine Art fehlt... ja, ja... warum wohl
Spielerei 2: Base-4 Walk Diagramme
Etwas unbekannter sind die "Base-4 Walk Diagramme".
Ganz einfach gesagt: Die Sequenz steuert quasi einen farbigen Cursor der je nach Abfolge der Sequenz die Richtung und Farbe ändert.
Vielleicht könnten diese ein weiteres Werkzeug für die Artenbestimmung sein.
Ich sehe es als weitere Art "Fingerabdruck" der Art - und ich konnte durch PC-gestützten Vergleich der Diagramme schon interessantes herausfinden.
Ich werde vielleicht nochmals etwas ausführlicher darüber berichten.
Hier das Base-4 Walk Diagramm von unserem Stockschwämmchen:
[/font]
[font="Arial"]Totale Spielerei 3: 3D-Modelle der DNA
Eine wirklich vollkommen unnütze aber sehr schöne Spielerei ist das generieren von 3D-DNA-Modellen. Besonders meiner 5-jährigen Tochter hat es sehr viel Spaß bereitet durch das DNA-Molekül des Pilzes mit der Mouse hindurch zu zu fliegen während sie immer wieder auf den Pilz schaute und mich mehr oder weiniger zitierend erklärte "das sind jetzt die ganz winzigen Atome von dem Schwammer da - und wir fliegen da jetzt durch..." "das ist noch kleiner als die Sporen - die überall in der Luft herumfliegen und die wir immer im Mikroskop anschauen, gell Papi!" "da ist alles gespeichert was der Schwammer wissen muss"...
Ja besser könnte ich es hier im Forum wirklich auch nicht erklären.
Diesen vielleicht einmaligen Einblick in den Pilz will ich Euch natürlich nicht vorenthalten.
Hier habt ihr das echte 3D-Modell von Kuehneromyces mutabilis (ja, wirklich berechnet aus der Sequenz des Fundes) und könnte wie meine Tochter einmal durch den Pilz hindurch fliegen.
Wahrscheinlich die naheste Nahaufnahme eines Pilzes welche ich bislang hier im Forum gesehen habe... viel Spaß damit....
Wegen der Ladezeit habe ich das Molekül verkürzt - ihr seht den Beginn der ITS1 Region "AGGATCATTATTGAAT"
[/font]
[font="Arial"]ACHTUNG! Die Daten brauchen einige Zeit zum laden! (Minuten!)[/font]
[font="Arial"]
Navigation: [/font]
[font="Arial"]Molekül bewegen: linke Mouse-Taste und bewegen
Molekül verschieben: Shift + linke Moustaste und bewegen
Rein und raus zoomen: Scrollrad
Für all diejenigen die einen veralteten Rechner, Steinzeit-Browser oder eine schlechte Internetverbindung haben habe ich das Modell in eine kurze Animation umgewandelt:[/font]
[font="Arial"]
[/font]
[font="Arial"]Ich hoffe Ihr hattet ein bisschen Spaß an meiner kurzen Darstellung des viel umfangreichern Themas.
Vielleicht hat es dem einen oder andern etwas gebracht.
Beste Grüße
Dieter[/font]