Gensequenzierung - wissenswertes?

Es gibt 62 Antworten in diesem Thema, welches 19.245 mal aufgerufen wurde. Der letzte Beitrag () ist von Craterelle.

    • Offizieller Beitrag

    Hallo, Craterelle!


    Sehr erstaunlich. 8|
    Ich habe natürlich keine Ahnung, wie es zu diesen Abweichungen kommt. Dazu müsste ich erstmal den technischen Hintergrund verstehen.
    Was mich noch interessieren würde: Kannst du in dem Bäumchen die prozentualen Abweichungen in den jeweiligen Sequenzen anzeigen lassen?


    Das Folgende ist jetzt frei zusammenfantasiert, aber: Wenn das Programm je nach ausgewählten Sequenzen unterschiedliche Parameter hätte, wie sich die Bäumchen verzweigen müssen?
    Also wenn du Sequenzen mit besonders großen Abweichungen in einem Bäumchen vereinigen willst, wird es anders angezeigt als wenn du ein Bäumchen aus der selben Anzahl an Sequenzen mit stärkerer Übereinstimmung bilden lässt. Weil: Die "leeren" Äste des Bäumchens lässt das Programm einfach weg. Also bezogen auf das beispiel von Typopilus felleus und Boletus spec.: Theoretisch müssten dazwischen noch ganz viele Verzweigungen des Bäumchens angezeigt werden, aber für die "Arten" die da angezeigt werden müssten, hast du keine Sequenzen ausgewählt. Das wären die "leeren Äste", und die blendet das Programm aus und setzt einfach da an, wo wieder eine "Zielsequenz" vorhanden ist. Dadurch wird das Bild verzerrt, zwei Arten erscheinen viel näher verwand, als sie eigentlich sind. Wäre dann ein Problem der Darstellung, während sowohl die Sequenzen als auch die Bestimmungen ok sind.
    Würde an den einzelnen Ästen des Bäumchens die prozentuale Abweichung dran stehen, wäre es vielleicht klarer.



    LG, Pablo.

  • Hi Pablo,


    Hm, ich habe auch einen leisen Verdacht, was vielleicht schiefgelaufen sein könnte, bin aber noch nicht sicher, ob das mit deiner Idee übereinstimmt.


    Eine Möglichkeit, den Grad der Abweichung darzustellen, also eine Skala für die X-Achse, habe ich bisher noch nicht entdeckt. Zumindest nichts, was über die Länge der Verbindungen in X-Richtung, die ja bereits ein relatives Mass für die Veränderung sein sollte, hinausginge.


    Aber wenn man sich nochmals vor Augen führt, dass bereits zwischen den in Beitrag #46 verglichenen Arten Abweichungen von über 40% vorkamen, erscheint es mir nicht undenkbar, dass es bei derartigen oder noch größeren Abweichungen zu fehlerhaften Alignments kommen könnte, also eine zufällige Übereinstimmung eine engere Verwandtschaft vortäuschen könnte, als eigentlich gegeben ist.


    Bei einer rein zufälligen Anordnung der Basen in einer durchschnittlichen Länge der ITS-Sequenz von 750 würde sich eine Abfolge von 3 Basen immerhin ca. 12x wiederholen, also absolut nicht zweifelsfrei zuzuordnen sein, 4 bestimmte Basen hintereinander kommen immerhin noch ca. dreifach vor, und sogar 5 hintereinander könnten sich mit einiger (ca. 70%) Wahrscheinlichkeit noch ein zweites Mal in derselben Sequenz wiederholen. Bei noch längeren Ketten von 6, 7 und 8 Basen sinkt die Wahrscheinlichkeit einer zufälligen Wiederholung dann auf ca. 20%, 5% und 1%. Das nur mal so als theoretische Erwägung.


    Evtl. würde das auch die vermeintliche Nähe zwischen Dieters Stockschwämmchen und einer Tricholoma-Art teilweise erklären? Das Thema wollte ich von hier ja ohnehin noch verlinken:
    http://www.pilzforum.eu/board/…chen?pid=354209#pid354209


    Ich habe daraufhin noch etwas bei den Alignment-Methoden herumgesucht. Eine von den sehr viel langsamen iterativen (Q-INS-i) wird explizit für stark divergente Sequenzen empfohlen, und sie scheint dann auch stabilere Bäume zu ergeben. Ich habe damit die beiden Boletales-Bäumchen erneut erzeugt, und zumindest wirft die eine zusätzliche Base am Ende der Tylopilus-Sequenz nun nicht mehr den ganzen Baum um. Soweit bin ich also schon ganz zufrieden.


    Und dem Wurzelknoten sollte man evtl. noch etwas Beachtung schenken, die von MAFFT erstellten Bäume sind nämlich unbewurzelt (unrooted) bzw. das, was sich als Wurzelknoten darstellt, ist vermutlich nur der "genetische Mittelpunkt" (-> mid-point rooted), was irreführend sein kann. Auf dieser Seite ist das sehr gut erklärt, zwar auf englisch, aber die Grafiken allein sagen schon eine ganze Menge:
    http://cabbagesofdoom.blogspot…ot-phylogenetic-tree.html


    LG, Craterelle

  • Hi Craterelle,


    ich vermute, dass Du für einen stabilen Baum einfach zuwenig Sequenzen in jedem Zweig drin hast. Der Algorithmus sucht ja nach Ähnlichkeiten, aber ob die systematisch oder zufällig sind, kann der Algorithmus anhand nur einer Art pro Gattung gar nicht entscheiden.


    Ich bin aber nicht tief genug im Thema - auf Wunsch (per E-Mail oder PN) kann ich den Kontakt mit einem Experten herstellen, der ggf. auch mal Einzelunterricht gibt.


    Gruß,
    Wolfgang

  • Der Hauptgrund, warum ich angefangen habe, mich mit der Thematik zu beschäftigen, war eigentlich, dass ich die Notwendigkeit für die vielen Umbenennungen, Gattungswechsel und Neuerschaffung von Gattungen besser verstehen wollte.


    In Teilen gelingt dies auch im obigen Bäumchen (die engere Ex-Boletus-Xerocomus-Verwandschaft, also das 2. Bild in diesem Beitrag https://www.pilzforum.eu/board…rtes?pid=355241#pid355241) auch sehr gut: wenn es korrekt ist, dass die Satans-Hexen-Schönfuß-Gruppe näher bei der Ex-Xerocomus-Gattung steht als bei Steinpilzen, kann man sie natürlich nicht weiterhin der Gattung Boletus zugeordnet lassen.


    Was ich aber schwerer nachvollziehen kann, ist die Aufsplittung in gleich vier neue Gattungen. Es gibt ja anscheinend bei Gattungen noch weniger als bei Arten etablierte Grenzen, wie stark die genetische Abweichung sein sollte, um eine Trennung zu rechtfertigen, aber - alles unter der Annahme, dass die Baumstellung die Verhältnisse ungefähr richtig wiedergibt - die vier liegen doch ähnlich dicht oder sogar dichter beieinander als die verbleibenden "echten" Boletus-Arten.


    Ähnlich die Ex-Xerocomus-Gattung: die hätte man mit Ausnahme von X. rubellus doch vielleicht auch so belassen können?


    LG, Craterelle


    P.S.: Für Volavariella, Volvopluteus und Pluteus habe ich so etwas jetzt auch noch einmal gemacht und kann mich dadurch besser mit der neuen Gattung anfreunden.

  • Dann habe ich noch die Frage, wie man die prozentuale Abweichung üblicherweise berechnet.


    Ich bin bisher so vorgegangen, dass ich in zwei verglichenen Gensequenzen nach dem Alignment den in beiden vorhandenen Teil von der ersten bis zur letzten übereinstimmenden Base als Gesamtzahl genommen habe, dann jeweils die Übereinstimmungen als Treffer (1) die Abweichungen (entweder zwei verschiedene Basen oder Base und Lücke) als Niete (0) gewertet und die Summe der Treffer durch n geteilt habe.


    Ist die Methode legitim oder sollte ich besser eine Software benutzen und falls ja welche (und wie erfolgt die Berechnung darin)?

    • Offizieller Beitrag

    Hallo, Craterelle!


    Ich sage mal nur was zu einem Punkt, bei den technischen Details kennen sich andere viel besser aus als ich:

    Was ich aber schwerer nachvollziehen kann, ist die Aufsplittung in gleich vier neue Gattungen. Es gibt ja anscheinend bei Gattungen noch weniger als bei Arten etablierte Grenzen, wie stark die genetische Abweichung sein sollte, um eine Trennung zu rechtfertigen, aber - alles unter der Annahme, dass die Baumstellung die Verhältnisse ungefähr richtig wiedergibt - die vier liegen doch ähnlich dicht oder sogar dichter beieinander als die verbleibenden "echten" Boletus-Arten.


    Ähnlich die Ex-Xerocomus-Gattung: die hätte man mit Ausnahme von X. rubellus doch vielleicht auch so belassen können?


    Gerade in dem Bereich (Aufspaltung von Boletus s.l. und Xerocomus s.l.) kann ich persönlich die neue Taxonomie morphologisch sehr gut nachvollziehen.
    Xerocomus im früheren, weiteren Sinne war so heteromorph, daß die Trennung in mehrere Genera schon morphologisch Sinn macht.
    An einigen Stellen wurde mit den ursprünglich enthaltenen Arten die Gattungsgrenze so weich und dehnbar, daß man im Grunde sogar alles (inklusive einiger Raustielröhrlinge) in einer Riesengattung hätte vereinen müssen, wenn man nicht konsequent eine Trennung verfolgt.
    Ein Beispiel: Maronenröhrlinge kannst du morphologisch sowohl als "Boletus" verstehen, als auch als "Xerocomus". Oder eben als keines von beidem, macht also schon irgendwie Sinn, die als Imleria zu isolieren um die Gattungsgrenzen zu schärfen. Ziegenlippen und vor allem Braune Filzröhrlinge haben im Grunde wenig gemein mit Bereiften Rotfußröhrlingen und Starkblauenden Rotfußröhrlingen. Theoretisch hätte man die jetzt als Hortiboletus geführten "Garten-Arten" (vorwiegend Eichen-Filzröhrling, Blutroter Röhrling, Blassgelbbrauner Filzröhrling) bei Xerocomellus belassen können, aber da gibt es schon auch wieder einige morphologische und ökologische Kopnstanten, die für zwei Gattungen sprechen.


    Noch etwas klarer finde ich das bei den ehemaligen Boletus - Arten:
    Ohne Verfärbungen, Stiel genetzt Poren anfangs weiß, Fleisch immer weiß ---> Boletus
    Schwach (oder gar nicht) verfärbend, Stiel genetzt, Poren anfangs gelb, nie rot, Geschmack mild ---> Butyriboletus
    Deutlich verfärbend Im Schnitt Hut und Stielfleisch), Stiel genetzt, Poren gelb, Geschmack bitter ---> Caloboletus
    +/- Schwach verfärbend (nie Huthaut auf Druck), Stiel genetzt (fein, teils nur Stielspitze), Poren rot ---> Rubroboletus (Der Wolfsröhrling gehört da auch rein, für mich der einzige morphologische Kritikpunkt)
    Deutlich verfärbend (frisch auch Huthaut auf Druck), Stielnetz fein, Poren rot ---> Imperator
    Deutlich verfärbend, Stielnetz grob (oder fehlend), Fleisch auffallend weich, oft deutlich rot von der Stielbasis her, Poren rot ---> Suillellus
    ...+ ein paar Zwerggattungen für ein paar Arten, die sonst wirklich nirgendwo reinpassen.


    Ergibt schon irgendwie Sinn, für den alltäglichen Gebrauch tut's bei mir aber auch noch ganz gut "Boletus s.l." und "Xerocomus s.l." ;)



    LG; Pablo.

  • Ahoi Pablo,


    danke für die Antwort.


    Ergibt schon irgendwie Sinn, für den alltäglichen Gebrauch tut's bei mir aber auch noch ganz gut "Boletus s.l." und "Xerocomus s.l." ;)


    Für den Hausgebrauch genügen mir sogar die deutschen Namen, da bin ich ganz bescheiden. Und die sind außerdem so angenehm beständig ;)



    Ich sage mal nur was zu einem Punkt, bei den technischen Details kennen sich andere viel besser aus als ich:


    Wenn du mehr weißt als ich (wovon ich ausgehe), bringt mich das auch schon weiter. Hilft ja nichts, wenn andere noch mehr wissen, es aber nicht schreiben.


    LG, Craterelle

    • Offizieller Beitrag

    Moin!


    Stimmt, mit den deutschen Namen gehtes auch, aber mit Einschränkungen. "Falscher Satansröhrling" ist ein ganz konfuser Begriff, der schon für mehrere Arten verwendet wurde. Spricht man vom "Kiefernsteinpilz" denken gleich viele, daß der tatsächlich nur bei Kiefern wachsen würde (was nicht stimmt), nennt man ihn "Rothütiger Steinpilz" weiß keiner mehr, was gemeint ist.
    Aber ich finde, auch Boletus funktioniert ja noch gut, da sollte wirklich jede/r wissen, was gemeint ist. Egal ob beim Blaufleckenden Purpurröhrling oder beim Anhängselröhrling. ;)


    Ich habe von den technischen Prozessen und Details bei Sequenzierungsverfahren wirklich kaum eine Ahnung. Und vermutlich auch nicht mehr als du.
    Antworten wären schön, ich kann sie auf deine Fragen allerdings nicht geben.



    LG; Pablo.


  • Dann habe ich noch die Frage, wie man die prozentuale Abweichung üblicherweise berechnet.


    Ich bin bisher so vorgegangen, dass ich in zwei verglichenen Gensequenzen nach dem Alignment den in beiden vorhandenen Teil von der ersten bis zur letzten übereinstimmenden Base als Gesamtzahl genommen habe, dann jeweils die Übereinstimmungen als Treffer (1) die Abweichungen (entweder zwei verschiedene Basen oder Base und Lücke) als Niete (0) gewertet und die Summe der Treffer durch n geteilt habe.


    Ist die Methode legitim oder sollte ich besser eine Software benutzen und falls ja welche (und wie erfolgt die Berechnung darin)?


    Die Frage war eigentlich schon beantwortet (durch den von Wolfgang vermittelten Kontakt), ich hatte es nur wieder vergessen :shy:


    Wenn man Sequenzen paarweise mit BLAST vergleicht ("Global Align" auf blast.ncbi.nlm.nih.gov), wird die prozentuale Übereinstimmung bei "Percent Ident" bzw. "Identities" ausgegeben.


    Dafür gibt es noch eine neue: wenn die ITS-Region nur innerhalb von Arten(gruppen) und bei nahe verwandten gute Ergebnisse bringt, wovon ich inzwischen ausgehe, welche Abschnitte benutzt man dann für die weitläufigere bucklige Verwandschaft?


    Beim Stöbern in einem Artikel zur Neubearbeitung von Pluteus/Volvariella* sind mir die Begriffe nLSU und nSSU begegnet, was wohl für nuclear Large SubUnit und nuclear Small SubUnit steht. Ob das wohl eine heiße Spur ist?


    Welche Abschnitte bei Ascos benutzt werden, würde mich auch nach wie vor interessieren.


    LG, Craterelle


    * Justo et al. 2010: "Phylogeny of the Pluteaceae (Agaricales, Basidiomycota): taxonomy and character evolution"

  • Offen geblieben war z.B. auch noch, welche DNS-Abschnitte verwendet werden, wenn die ITS-Sequenzen nicht funktioniert.


    Problematisch bei ITS:

    • In einigen Fällen (Leccinum, evtl. auch andere) schwierig durch repetitive DNS; ein Artikel hierzu: http://edepot.wur.nl/16760
    • Bei Basidiomyceten i.A. hochgradig variant, deshalb zum Vergleich eng verwandter Arten sehr gut geeignet, für genetisch weiter voneinander entfernte jedoch nicht
    • Für Ascomyceten (und einzelne Basidiomyceten?) ungeeignet, weil invariant


    Jetzt kamen mir aktuell in einer anderen Arbeit noch RPB2, LSU and mtSSU unter.


    LSU und SSU kamen schon mal vor, ersteres hatte ich insbesondere als hilfreich für weniger eng verwandte Arten im Kopf behalten. RPB2 war mir neu, dazu habe ich diesen Artikel gefunden (nur Abstract): The rpb2 gene represents a viable alternative molecular marker for the analysis of environmental fungal communities. - PubMed - NCBI Das scheint auch für Ascomyceten zu funktionieren, wenn ich es richtig verstehe.

  • Hier wird die Kapillarelektrophorese erklärt: https://www.uni-bielefeld.de/teutolab/fachorientiert/biotechnologie/arbeitsmaterial/kapillarelektrophorese


    Ich ergänze das doch nochmal hier, weil genau dieser Schritt mir bis dahin am rätselhaftesten war. Aber vielleicht hat dieser alte und unübersichtliche Thread jetzt auch mal Ruhe verdient.

  • Hallo zusammen,


    Doch nochmal eine Fortsetzung, u.a. als Übung, wie die in Gendatenbanken hinterlegten Sequenzen zu bewerten sind.


    Ich hatte ja gelernt, dass ITS nur für den Vergleich von genetisch nah verwandten Arten geeignet ist.


    Also habe ich mir mal den Fliegenpilz i.w.S. vorgeknöpft, weil es von dem recht viele Sequenzen aus aller Welt gibt.


    Ausgewählt habe ich zwei von Unite als Referenz ausgewählte Gruppen

    UNITE - Species Hypothesis (weiter unten im Baumdiagramm grün)

    UNITE - Species Hypothesis (gelb)

    außerdem die Referenz für den Königsfliegenpilz

    UNITE - Species Hypothesis (orange)

    sowie noch einige als A. muscaria bezeichnete Einzelproben (weiß)

    Amanita muscaria voucher AM08S3-1 internal transcribed spacer 1, parti - Nucleotide - NCBI

    Amanita muscaria voucher AM09S4-3 internal transcribed spacer 1, parti - Nucleotide - NCBI

    Amanita muscaria voucher AM09S5-5 internal transcribed spacer 1, parti - Nucleotide - NCBI


    Gleich verworfen habe ich daraus die als Fungi spec. oder Amanita spec. benannten.


    Verdächtig erscheinen außerdem eine als A. gemmata bezeichnete in der ersten Muscaria-Clade sowie zwei vermeintliche A. muscaria bei den Fliegenpilzen (im Baumdiagramm hervorgehoben). Bei der vermeintlichen A. gemmata aus Kanada (AF335440) handelt ein "Class project" einer Universität, hier würde ich eine Fehlbestimmung für nicht ausgeschlossen halten. Die beiden norwegischen Proben (UDB037204 und UDB035790) dagegen stammen aus dem botanischen Museum der Universität Oslo, was mir wie eine seriöse Quelle erscheint.


    Diese Sequenzen habe ich ins Fasta-Format gebraucht (ich habe es angehängt, falls jemand damit herumspielen will) und mit MAFFT ausgerichtet ("multiple Alignment"). Die Baumdarstellung dazu sieht so aus:


    Da gibt es jetzt so einiges, was auffällt:


    1) Die drei mexanischen Einzelproben ganz oben sind von allem anderen sowie zueinander so extrem verschieden (10% und einiges darüber*), dass das unmöglich die gleiche Art sein kann. Ich gehe hier davon aus, dass bei Probennahme, Bestimmung oder Sequenzierung irgendetwas fatal schiefgelaufen ist.


    2) Die beiden als Referenz für A. muscaria ausgewählten Gruppen weichen ebenfalls erstaunlich weit (5%) voneinander ab. Die Proben der gelben Gruppe stammen alle aus dem nordamerikanisch-pazifischen Raum, und zumindest bei einigen davon scheint es sich um die gelbe Varietät zu handelt. Eine ist jedoch auch explizit als var. muscaria bezeichnet. Es bleibt also unklar, ob die Abweichung nun an die räumliche Verteilung oder an die Varietät gekoppelt sind.


    3) Im Baumdiagramm liegt ein Teil der gelben Gruppe (blassgelb) auf einen anderen Ast als die dunkler gelbe, grüne und orangefarbene Gruppe, obwohl die absolute Ähnlichkeit zwischen den hell- und dunkelgelben weit größer ist (um 1% Abweichung). Kann das ein Artefakt/Fehler in der Berechnung des Baumdiagramms sein?


    4) In der grünen Gruppe finden sich Exemplare aus Europa, Kolumbien, USA, Japan und "Downunder". In den USA und Japan kommt dieser Typus also neben dem anderen auch vor, genetisch zwischen beiden liegende Mischformen jedoch anscheinend nicht**.


    5) Erstaunlicherweise sind nach diesen Daten Königs- und der in Europa heimische Fliegenpilz näher verwandt (3% genetische Abweichung) als die beiden Varianten des gemeinen Fliegenpilzes miteinander.


    LG, Craterelle


    * Die prozentualen Angaben entstammen dem paarweisen Vergleich von Einzelproben mit BLAST: blast.cgi?page_type=blastsearch&prog_def=blastn&blast_prog_def=blastn&blast_spec=globalaln

    ** (bzw. nicht in den von mir ausgewählten Daten)