Gensequenzierung - wissenswertes?

Es gibt 62 Antworten in diesem Thema, welches 19.203 mal aufgerufen wurde. Der letzte Beitrag () ist von Craterelle.


  • Hallo Stefan,


    Das war ja bis jetzt noch gar keine Kritik. Allerdings wundert es mich etwas, dass es einen Grenzwert gibt, mit dem auch gearbeitet wird, aber unveröffentlicht ist, wer den festgelegt hat und auf welcher Basis.


    Ich würde mich freuen, wenn du in der Richtung etwas herausfinden kannst.


    LG, Craterelle

    • Offizieller Beitrag


    Hallo Stefan,


    Die DGfM-Tagung ist ja nun vorbei. Hast du etwas herausfinden können?


    LG, Craterelle


    Hi,


    in gewisser Weise ja. Laut Dittes Vortrag ist alles, was bei den Inocyben unter 97% Übereinstimmung fällt bisher immer eine neue Art gewesen. Ihr Vortrag war sehr spannend und hat einen Einblick in Ihre Arbeittsweise gegeben.


    Bei den Hebelomen war dies etwas schwieriger z.T. Hier mussten andere Sequenzen, als die ITS für die Unterscheidung der Arten herhalten.


    Leider konnte ich nicht mit Marco und Bernd über dieses Thema weiter sprechen. Was ich aber sehr stark vermute: diese "Grenze" wird wohl von Gattung zu Gattung verschieden sein. Wiss. Untersuchungen zu dieser Thematik gibt es aber nicht; siehe Hebelomen oben. Da mussten erst weitere Sequenzen als die ITS gesucht werden, welche für eine Artunterscheidung taugen; selbiges gilt für viele Ascos.


    l.g.
    Stefan


  • in gewisser Weise ja. Laut Dittes Vortrag ist alles, was bei den Inocyben unter 97% Übereinstimmung fällt bisher immer eine neue Art gewesen. Ihr Vortrag war sehr spannend und hat einen Einblick in Ihre Arbeittsweise gegeben.


    Hallo Stefan,
    das hört sich doch ziemlich seriös an, aber die Grenzen werden tatsächlich sehr unterschiedlich gehandhabt.


    In der letzten ZfM 82(2) wird mit Entoloma milthaleri M. Kamke & Lüderitz eine Art neu beschrieben, die mit 98% Ähnlichkeit zu E. conferendum und 99% Ähnlichkeit zu E. luteofuscum K. N. A. Raj & Manim steht. Der Name E. luteofuscum taucht in der Artendiskussion überhaupt nicht auf.


    Die in der ZfM 77(2) neu beschriebene Entoloma venustum Wölfel & F. Hampe wurde 2014 wegen "nur" 1,8% Abweichung von E. callichroum E. Horak & Noordel. zur Varietät E. callichroum var. venustum (Wölfel & F. Hampe) O.V. Morozova, Noordel. & Vila zurückgestuft.


    LG Karl

  • Also bei uns im Labor kostet eine DNA Extraktion 5-7 EUR (man braucht eine Zentrifuge). Eine PCR vielleicht 2 EUR, aber man braucht halt den Cycler. Dann das Aufreinigen nochmal 2 EUR. Die Sequenzierung kostet 4,5 EUR, man nimmt in der Regel immer 2 pro Sequenz. Für Privat kommt mit Sicherheit noch Umsatzsteuer und weiß der Geier was dazu.


    An der Extraktion kann man noch was drehen und nen Protokoll anpassen, zBsp CTAB, aber da braucht man erweiteres Laborwissen. Dann bekommt man das auf 1 EUR runter. Die Squenzierung kann man auf 2,50 drücken wenn man das in 96er Paketen wegschickt undn Kumpel hat in der Forschung der das mitlaufen lassen kann. Das Aufreinigen kann man auf 50 cent mit ExoSap drücken, aber da braucht man auch wieder nen Protokoll zu.


    Idealerweise braucht man aber auch noch Agarose und ein Netzteil, sowie diverse Chemikalien und eine UV Lampe um die PCR zu überprüfen.
    Naja dann braucht man noch das Wissen die Dateien die man von der Sequenzierung zurückbekommt zusammenzusetzen und zu überprüfen.


    Wenn es nicht bei Genbank steht, dann ist es auch nicht auffindbar. Es gibt kein Geheimspeicherort für Wissenschaftler.


    Naja mit den Daten die man dann bekommt kann man dann Stammbäume machen oder checken ob man das hat was man denkt. Aber wie schon erwähnt man brauch das richtige Gen dafür. ^^

  • Es ist echt toll, was hier alles zusammengekommen ist. Praktisch damit anfangen wollte ich noch gar nicht, erstmal "nur" die Zusammenhänge verstehen.
    Jetzt habe ich mal in den von Pablo verlinkten Datenbanken gesucht. Mit der ersten kam ich nicht recht klar, bei Unite finde ich immerhin die gesuchten Arten. Mein Übungsopfer: Sarcodon, insbesondere S. imbricatus und S. squamosus, die ja noch gar nicht so lange überhaupt getrennt werden.


    Da habe ich dann zu jeder Probe eine Sequenz von knapp 1000 Basenpaaren (das scheint auch immer die gleiche Anzahl zu sein, genau 979 nein, die Anzahl ist doch nicht gleich, so 750-1000 sind es wohl).


    In den vergleichenden Ansichten ist von dieser Sequenz am Anfang und am Ende großzügig etwas weggelassen, und der mittlere Teil mit Hilfe von Bindestrichen in Blöcke gruppiert.


    Und dieser mittlere Teil passt dann auch sehr hübsch zu anderen Proben der gleichen Art, und im Vergleich zur eng verwandten Art erkennt man sowohl identische Gruppen als auch abweichende (und zwar systematisch abweichende, also bei allen der einen Art Muster x, bei denen der anderen Muster y). Das sieht doch alles schon ganz nett aus.


    Trotzdem brauche ich nochmal ein bisschen Hilfe, und zwar zu allererst mal zur Bedeutung der Bindestriche. Gruppieren macht sicherlich Sinn, auch hinsichtlich der Beobachtung, dass Abschnitte bei benachbarten Arten abweichen können. Aber es sind unterschiedlich viele Bindestriche. Vielleicht, weil die "Austauschobjekte" zwischen den Arten unterschiedlich lang sein können?


    Und was bedeutet der Buchstabe N, auf den ich gelegentlich statt der üblichen ATGC gestoßen bin?


    Ein großes Dankeschön schonmal an alle!
    LG, Craterelle

  • Und was, wieviel genau wird da weggeschnipselt am Anfang und am Ende? Und warum?


    Eine Möglichkeit wäre, dass der Teil nicht immer vorhanden ist. Zumindest ist er sehr unterschiedlich lang bei den Sequenzen, die ich mir angeschaut habe.


    Warum setzen dann aber zwar die meisten aneinander ausgerichteten Sequenzen im einer Gegenüberstellung (wie z.B. hier, in der Tabelle ganz rechts) bei einer bestimmten Folge an, aber einige eben doch später oder früher? Vielleicht erklärt sich ja alles fast von selbst, wenn ich die Bedeutung der Bindestriche verstehe?



    Stefan, wollen wir versuchen, noch etwas nach Art der Maus zu beschreiben? Z.B.
    - ...
    - Bioinformatik (Sequenz-Alignments, Datenbanken)


    An diesem Punkt bin ich wirklich wohl gerade. Vielleicht kann nochmal jemand etwas Licht machen?


    LG, Craterelle

    • Offizieller Beitrag

    Hallo,


    nur ganz kurz. Bei den Bindestrichen bin ich mir nicht sicher, was die genau bedeuten. Buchstaben wie N und Y z.B. bedeuten, dass die Base nicht ganz eindeutig aus der Sequenzierung hervorgegangen ist. Ich habe leider gerade nicht den Code da, was welches Zeichen bedeutet, aber es gibt Buchtaben für A oder T, C oder G usw.


    Dass "vorne" und "hinten" Basen fehlen ist den "chromatograpischen" Gesetzmäßigkeiten geschuldet. Du hast bei solchen Trennverfahren immer einen "Lösungsmittelpeak"; egal welches Verfahren angewendet wird. Das bedeutet, dass das Lösungsmittel und sehr kleine Molekülfragmente nicht mit dem Säulenmaterial interagieren und demzufolge auch ungenügend zurückgehalten werden. Du bekommst da keine verlässlichen Daten raus. Danach kommen die Molekülfragmente, welche dann mit dem Säulenmaterial ausreichend interagieren. Da funktioniert die Größentrennung der DNA-Fragmente sehr gut. Wenn die Moleküle aber zu groß werden gibt es keine scharfe Trennung mehr, denn die Moleküle binden zu stark an die Säule und du bekommst Peaks, die sich zu sehr überschneiden. Eine richtige Trennung, bzw. Unterscheidung der Moleküle ist dann nicht mehr möglich.


    Um das genau zu vertehen wäre eine ganze Vorlesungsreihe in Instrumenteller Analytik notwendig. Um es ganz einfach und kurz zu sagen. Das ist kein Problem der Sequenzierung an sich, sondern ein Problem des analytischen Auftrennens der DNA-Fragmente.


    l.g.
    Stefan

  • Hallo Craterelle,


    einer meiner Funde wurde näher beäugt, ev. findest Du hier eine Antwort zu Deinen Fragen,


    Molekulargenetische Untersuchungen
    Die Methodik für DNS-Isolierung, Amplifizierung, Sequenzierung und Analyse der ITS1-5.8S-ITS2- Barcoding-Region ist in MENTRIDA & al. (2015) beschrieben. Mithilfe des NCBI-BLAST-Programms (http://www.ncbi.nlm.nih.gov/BLAST) wurde die ITS-Sequenz mit den ähnlichsten Sequenzen verglichen um die taxonomische Einordnung zu bestätigen. Die Sequenz ist in der GenBank hinterlegt mit der Registrierungsnummer KY315920.


    , wie schon von BOROVICKA et al. (2011) festgestellt, ...nicht in ihre Varietäten trennen. Die Sequenz der Kollektion stimmt zu 99% mit fünf in GenBank, teilweise noch als Arten, hinterlegten Sequenzen überein, nämlich mit und P., ..... (NCBI blast). Da drei Polymorphismen innerhalb der Sequenz vorliegen, beträgt die Übereinstimmung nicht 100%. BOROVICKA et al. (2011) bestätigten die Eigenständigkeit von einerseits P. und andererseits P. als hinsichtlich ihrer DNA-Merkmale gut fundierte Art in einer Multigenanalyse (Teilsequenzen des nukle- ären LSU-rRNS-Gens, der ITS1-5.8S-ITS2-Barcoding-Region und des EF1α- Gens). Die Sequenzen lassen jedoch keine weitere Untergliederung in Varietäten erkennen. Eine solche Trennung könnte, falls überhaupt, eventuell mit Hilfe der Analyse weiterer Loci, erreicht werden.


    LG
    Peter

    "Die, die Kriege von oben führen sind feige Schreibtischtäter, die nicht wissen wie schrecklich Krieg ist".

    Quelle: "Masters Of War", Bob Dylan

  • Hallo Kletterstefan,


    Ein Y ist mir bisher noch nicht untergekommen.


    Ich nehme N mal als "aNy base" entsprechend dieser Auflistung und ignoriere den Rest, bis ich tatsächlich darauf stoße.


    Das weitere: die Bestimmung der Basen erfolgt also chromatografisch? Ich hatte gedacht, chromatografische Verfahren würden bestenfalls Mengenanteile für enthaltene Moleküle liefern können, womit uns hier allerdings nicht so recht geholfen wäre, weil wir ja die Reihefolge brauchen.


    Tatsächlich hat mein Vorstellungsvermögen an diesem Punkt noch einen blinden Fleck: mit welcher Methode lese ich aus meiner vorbereiteten Probe, die nur noch den ITS-5.8S-ITS2-Abschnitt enthalten sollte, die Abfolge der Basen aus? Oder: ich welche Kiste stecke ich's, damit hinten die Buchstaben rausfallen?


    Habichtspeter: vielen Dank! Der dort erwähnte Artikel MENTRIDA & al. (2015) würde mich sehr interessieren. Ist evtl. auch noch der genaue Artikel angegeben und wo er veröffentlicht wurde?


    LG, Craterelle

    • Offizieller Beitrag


    Hi,


    der Möglichkeiten für die Chromatographie gibt es viele, wobei ich mir gerade nicht sicher bin, ob das über eine wirkliche Chromatogrpahie funktioniert oder über Kapillarelektrophorese. Macht aber nix, denn die Grundprinzipien sind ähnlich. Es werden Moleküle der Molekülgröße nach aufgetrennt. Inzwischen ist die Technik sogar schon so weit vorangeschritten, dass es für jede Base spezifische Floureszensmarker gibt, so dass du aus einem Ansatz alle Basen erfassen kannst. Früher wurden für jede Base einen eigenen Ansatz geamcht und separat aufgetrennt.


    X=beliebig lange Kette


    XA = Molekül 1 mit Molmasse 1 = Peak 1
    XAG = Molekül 2 mit Molmasse 2 =Peak 2
    XAGT = Molekül 3 mit Molmasse 3 =Peak 3
    XAGTC = Molekül 4 mit Molmasse 4 =Peak 4 usw.


    l.g.
    Stefan

  • Der dort erwähnte Artikel MENTRIDA & al. (2015) würde mich sehr interessieren. Ist evtl. auch noch der genaue Artikel angegeben und wo er veröffentlicht wurde?



    Hallo Cratrerelle,


    veröffentlicht wurde er von der Österreichische Mykologische Gesellschaft in der ÖZP 24,


    MENTRIDA, S., KRISAI-GREILHUBER, I., VOGLMAYR, H., 2015: Molecular evaluation of species delimitation and barcoding of Daedaleopsis confragosa specimens in Austria. –“ Österr. Z. Pilzk. 24: 173–“179.


    LG
    Peter

    "Die, die Kriege von oben führen sind feige Schreibtischtäter, die nicht wissen wie schrecklich Krieg ist".

    Quelle: "Masters Of War", Bob Dylan

  • veröffentlicht wurde er von der Österreichische Mykologische Gesellschaft in der ÖZP 24,


    MENTRIDA, S., KRISAI-GREILHUBER, I., VOGLMAYR, H., 2015: Molecular evaluation of species delimitation and barcoding of Daedaleopsis confragosa specimens in Austria. –“ Österr. Z. Pilzk. 24: 173–“179.


    Danke, Peter! Dann werde ich mal versuchen, das aufzutreiben. Den Wikipedia-Artikel (https://de.m.wikipedia.org/wiki/DNA-Sequenzierung) habe ich mehrmals gelesen, finde ihn aber eher schwere Kost.


    LG, Craterelle

  • Den Artikel habe ich mir dann doch nicht besorgt, 30,- schien mir zu viel für etwas, wo allenfalls der allgemeine/einführende Teil von Interesse sein konnte und mich die speziellen Erkenntnisse zur untersuchten Art gar nicht interessieren.


    Die Sache mit den Bindestrichen ist noch nicht aufgeklärt, deshalb formuliere ich mal meine Hypothese dazu:


    Dies könnte vielleicht das sagenumwobene Alignment sein.


    Also: man hat zwei eng verwandte Arten, deren Sequenzen fast übereinstimmen und nur in einem Teilbereich abweichen. Diese abweichenden Basenpaare sind aber unterschiedlich lang, deshalb muss man bei der kürzeren mit Bindestrichen auffüllen. Ob am Anfang, am Ende oder mittendrin wäre erstmal egal wenn man nur zwei Arten betrachtet, dass ergibt sich wenn man immer mehr Arten hinzunimmt. So werden schließlich auch entfernt verwandte Arten, die noch wenig übereinstimmende Abschnitte aufweisen, direkt in der linearen Gegenüberstellung miteinander vergleichbar.


    Wie klingt das?


    LG, Craterelle

  • Jetzt habe ich mal kräftig in der Buchstabensuppe herumgeführt, um ein bisschen Gefühl dafür zu bekommen, wie variabel die Sequenzen innerartlich sowie innerhalb von Gattungen ist.


    Übungsopfer: diesmal der Maronenröhrling. Knapp 30 Datensätze sind als Xerocomus badius (firmiert der nicht aktuell unter Imleria?) einsortiert.


    Recht große Übereinstimmung in den Sequenzen, die wenigen Abweichungen über die gesamte Sequenz verstreut, nicht selten ist der bei allen Datensätzen vorhandene Abschnitt sogar identisch.

    (gelb hinterlegt sind die Abweichungen)
    Systematische Abweichungen immer an bestimmten Stellen kommen nur bei 4 Proben vor, die aus Nordamerika stammen und untereinander wiederum nur minimal abweichen. Hübsch, das wirkt nachvollziehbar.



    Die Abweichungen kann man sich auch noch als absolute Zahl oder prozentual ausgeben lassen, wobei ich auf den bei allen vorhandenen Abschnitt beschränkt habe, also am Anfang und am Ende ausgeklammert, was nicht bei allen Proben vorhanden war.


    Als nächstes habe ich mir zwei aus der Gattung Boletus angeguckt, der die Marone ja auch mal zugeordnet war. B. edulis über 60 Datensätzen aus aller Welt. Hier erstaunliche Homogenität ohne erkennbare regionale Abweichungen.


    Dann noch B. erythropus dazu, mit etwas dünnem Datenbestand, nur 7 Sequenzen aus Europa. Aber auch hier ist ein typisches Sequenzmuster deutlich erkennbar.


    Diese drei also untereinandergelegt und ... Buchstabensalat. Das Alignment wird offenbar doch nicht artübergreifend gemacht und erschwert damit die Vergleichbarkeit zwischen verschiedenen Arten eher, statt sie zu erleichtert. Also habe ich es ganz entfernt und selbst versucht, ähnliche Abschnitte zu identifizieren.


    Immerhin habe ich einen lange übereinstimmenden Abschnitt gefunden, über 100 Basenpaare, und dazu viele kürzere Schnipsel. Wenn ich Zeit finde, will ich auch noch Filzröhrlinge dazunehmen, in der Gattung hat die Marone ja auch mal gewohnt.



    (jetzt schon mit X. submentosus - die bei allen identische Sequenz von 159 Basen, bei X. submentosus mit einer Abweichung, ist gelb hinterlegt)


    Meine Fragen im Moment:


    1) Wieder zurück zu den Bindestrichen. Meine Hypothese hat sich in Teilen offensichtlich als falsch erwiesen. Die sind zwar Platzhalter, wo in einer Sequenz eine Base ist und in der anderen keine, aber wenn das Alignment nur dem innerartlichen Vergleich dient und nicht dem zwischen Arten, verwundert mich immer noch oder wieder, dass häufig eine Vielzahl an Bindestrichen gesetzt wird, wo einer genügt hätte.


    2) Wie funktionieren die Regeln für das Alignment genau? Wenn z.B. zwischen zwei identischen Abschnitten einmal die Basenfolge CAATGTAGC und im anderen stattdessen TTG, würde die kürzere TTG-Gruppe zerstückelt als ---T-T-G-, um die bestmögliche Übereinstimmung (3 Basen) zu erreichen, oder lässt man sie zusammen (--TTG---- oder -----TTG-, je 2 Basen oder gar TTG------ bzw. ------TTG, 0 Basen)?


  • Den Teil bis zu deinen Fragen habe ich leider nicht nachvollziehen können, das müsste man wohl sehen, was du da gemacht hast.


    zur 1) Das Alignment dient durchaus dem Vergleich zwischen verschiedenen Arten, nur sollten da natürlich die Unterschiede größer sein, als "innerartlich". Du wirst also mehr "Bindestriche" (man sagt besser "gaps" dazu) bekommen, aber das sollte ja auch so sein. Im Idealfall hast du also keine "mismatches" (nicht zueinander passende Basen) innerhalb einer Art, wohl aber zu anderen Arten und zwar je mehr, desto weiter sollte die Art im Verwandtschaftsverhältnis entfernt stehen. Soweit nachvollziehbar?


    zur 2) Die Regeln gibt ein Algorithmus an, der Strafpunkte verteilt. Das kann man beim Alignment dann einstellen, wie einem das beliebt. Es gibt da die Möglichkeit Strafpunkte für nichtpassende Basen (also dass ein "A" in der Sequenz mit einem "G" alignt) zu vergeben. Außerdem kann man Strafpunkte vergeben für "mache ein Gap" und "erweitere das Gap".
    In deinem Beispiel würde also -TTG---- oder ----TTG- oder TTG------- entstehen, wenn die Strafpunkte für die Erweiterung eines gaps niedrig, für die Einführung eines gaps allerdings recht hoch sind (dann "kostet" es weniger die bereits entstehende Lücke zu erweitern, als ein neues gap einzuführen). ---T-T-G- hingegen wäre dann das Gegenteil, da müssten die Kosten für die Erweiterung eines gaps sehr hoch sein, für die Einführung eines neuen gaps hingegen niedrig.
    Soweit auch einigermaßen verständlich?


    Liebe Grüße,
    Florian

  • Hallo Florian,


    Ich habe in den letzten Beitrag noch ein paar Screenshots eingefügt, um das ganze etwas zu illustrieren.


    Die Erklärung zu 2 ist sehr hilfreich, danke!


    1 wird zumindest auch etwas klarer. Das Alignment aus der Unite-Datenbank passt zumindest für den Vergleich der von mir gewählten Arten nicht (s. 3. Screenshot), dafür müsste man es noch stark modifizieren. Ich denke, als nächstes schnuppere ich mal in der Software herum, die es zu diesem Zweck gibt.


    LG, Craterelle

  • Hallo Craterelle,


    da scheint etwas wirklich nicht so ganz zu passen.


    Zuerst einmal dein Alignment der Maronenröhrlinge, das sieht ganz gut aus. Ich habe mal in rot eingekastelt, was wohl Sequenzierungsfehler/Auswertungsfehler sein könnten, in grün scheint wirklich eine Abweichung der nordamerikanischen Arten zu sein, das wirkt ganz realistisch.



    Nachtrag: Was nicht so ganz Sinn macht sind die Gaps an Stellen, an denen bei keiner der Sequenzen eine Base steht. Warum sollte da eine Lücke sein?


    Auf die Schnelle habe ich mal ein eigenes Alignment von zwei Penicillium-Arten mit einer Phoma-Art gebastelt (Sternchen zeigen die zueinander passenden Basen):



    Ein schnelles Bäumchen zeigt das, was wir erwarten, die beiden Penicillium-Arten stehen näher beieinander, als bei der Phomar-Art:



    Es ist wichtig, dass man die richtigen Abschnitte übereinanderlegt. Inwiefern du das bei deinem Alignment der verschiedenen Röhrlinge getan hast, das weiß ich natürlich nicht ;) . Da solltest du auf jeden Fall darauf achten.


    Liebe Grüße,
    Florian

  • Hallo Florian,


    das Alignment hatte ich so aus der Unite-Datenbank übernommen.



    Nachtrag: Was nicht so ganz Sinn macht sind die Gaps an Stellen, an denen bei keiner der Sequenzen eine Base steht. Warum sollte da eine Lücke sein?


    Die langen Abfolgen von Bindestrichen (Gaps), wo aber in keiner Sequenz eine Base vorkommt, waren genau das, was mich so irritiert hat.



    Ich habe mal in rot eingekastelt, was wohl Sequenzierungsfehler/Auswertungsfehler sein könnten...


    Sind das denn zwingend Fehler? Ich hatte das bisher für Abweichungen gehalten, wie sie zwischen verschiedenen Individuen einer Art normal sein könnten, es sind ja keine Klone.


    LG, Craterelle


  • Ich habe mal in rot eingekastelt, was wohl Sequenzierungsfehler/Auswertungsfehler sein könnten...


    Sind das denn zwingend Fehler? Ich hatte das bisher für Abweichungen gehalten, wie sie zwischen verschiedenen Individuen einer Art normal sein könnten, es sind ja keine Klone.


    LG, Craterelle


    Hallo Craterelle,


    deswegen hatte ich extra "könnte" geschrieben ;) . Also die "R" sind auf jeden Fall Fehler in der Sequenzierung, die anderen halte ich zumindest für wahrscheinlich. Wenn du 10 Sequenzen hast, die exakt zueinander passen und dann eine, die in einer Base abweicht, dann sollte man da nochmal in die Rohdaten schauen, ob das tatsächlich eine Abweichung ist, oder ob die Sequenzierung an dieser Stelle nicht so genau war.


    Hier mal so ein Beispiel:


    Im ersten roten Kasten könnte das "N" entweder "A" oder "T" bedeuten, im zweiten roten Kasten könnte sich ein "T" zwischen den beiden "A" verstecken. Das muss man dann eben nochmal von Hand nacheditieren, sonst können schnell mal solche einzelnen Fehler passieren.


    Liebe Grüße,
    Florian

  • Danke, Florian!


    Die Grafik ist sehr anschaulich. Beim zweiten Kasten wundert es mich fast, dass die Software da kein T sieht.


    Ich habe noch etwas weitergemacht und das Alignment zwischen verschiedenen Arten (inzwischen sind noch weitere hinzugekommen) von MAFFT (http://mafft.cbrc.jp/alignment/server/) machen lassen (Standardeinstellungen). Das Ergebnis sieht für mich insgesamt recht anständig aus für den ersten Versuch.




    Ein Bäumchen gibt's gratis dazu, und ich habe die Übereinstimmungen auch noch einmal tabellarisch dargestellt, allerdings ganz einfach berechnet (gleiche Base (oder Gap) => Treffer; jegliche Abweichung, andere Base, Gap statt Base, etc. => nichts, und wieder beschränkt auf "gemeinsamen Mittelteil").


    Nachtrag: Für mich ist das Bäumchen übrigens schon ein wenig erstaunlich.


    Beispielsweise, dass die Marone der Ziegenlippe näher zu stehen scheint als diese den beiden Rotfußröhrlings-Arten. Oder auch, dass die beiden Hexenröhrlinge näher an dieser Gruppe sind als an den Steinpilzen.

  • Dann mal weiter hinein in die Baumschule.


    Das Bäumchen aus dem letzten Beitrag ist auch vom MAFFT-Server, wiederum mit den Standardeinstellungen.


    Als nächstes habe ich mir exemplarische Vertreter aus der Boletales-Familie angeguckt, die bucklige Verwandtschaft quasi. Den Boletus-Xerocomus-Zweig hatte ich dabei auf zwei Arten reduziert, damit es nicht unübersichtlich wird.


    Dann noch einmal Boletus/Xerocomus u.ä. im Detail. Hinzugenommen habe ich noch den Gallenröhrling, weil der nach obigem Baum auch in diesem Ast landet.


    Was mich jetzt aber irgendwie gewaltig stört:


    Einmal scheint T. felleus näher mit B. edulis verwandt als mit X. chrysenteron, nach dem anderen Diagramm steht er näher an X. chrysenteron als an B. edulis.


    Klar, das Alignment fällt verschieden aus, wenn man mehr oder weniger Arten vergleicht. Ich hätte aber erhofft, dass die errechneten Verwandtschaftsverhältnisse zumindest vergleichbar blieben, wenn die Datensätze und die Methodik identisch sind.


    Oder lese ich vielleicht die Bäumchen ganz falsch?


    Bisher bin ich davon ausgegangen, dass in erster Linie die Pfade und die gemeinsamen Knoten wichtig sind. Die Einrückung, also die Position in horizontaler Richtung, hatte ich als genetische Abweichung zu jenen hypothetischen Vorläufer am Knotenpunkt gedeutet.


    Die vertikale Position, also sowohl welcher Ast jeweils oben und unten ist als auch wie weit diese in vertikaler Richtung vom Knotenpunkt entfernt sind, halte ich dagegen für unbedeutend.


    Die Daten habe ich angefügt, falls es jemand gelüsten sollte, das Vorgehen nachzuvollziehen.

    • Offizieller Beitrag

    Hallo, Craterelle!


    Ja, Tylopilus hat in dem Bäumchen eigentlich nichts verloren.
    Der ist weder mit Boletus s.str. noch mit Xerocomus s.l. näher verwand (rosa Sporenpulver!).
    Müsste man mal gucken, was das für eine Sequenz ist und wo die her kommt. Kann natürlich eine Fehlbestimmung sein. Gibts eine morphologische Doku zu der Sequenz? Weil wenn nein und wenn es nmicht zufällig die Typus - Sequenz ist, dann wäre das so ein Fall für eine zu löschende Sequenz.
    Aber was du mal machen kannst: Die Sequenz vom Typus raussuchen und vergleichen. Wenn die identisch wäre, kann das zwei Dinge bedeuten: Die Sequenz ist fehlerhaft oder auch hier kann man den Verwandschaftsgrad nicht aus der ITS - Sequenz ableiten.


    Ählniches gilt auch für den Strobilomyces im Bäumchen. OK, der verzweigt sich relativ weit "unten". Aber ob weit genug für eine Gattung mit dick grobnetzig ornamentierten Sporen und völlig abweichenden Makromorphologischen Parametern? :/



    LG; Pablo.

  • Moin Pablo,


    danke für deine Antwort.


    Ich werde die Sequenzen auf jeden Fall kritisch prüfen. Mir fehlt definitiv auch noch einige Erfahrung im Umgang mit den Gendatenbanken.


    Das ist allerdings haarscharf neben dem Punkt, an dem ich gerade herumknabbere:


    Nämlich das 3 Sequenzen (B. edulis, T. felleus, X. chrysenteron - egal ob korrekt oder nicht, man könnte sie auch als Probe1, Probe2 und Probe3 anonymisieren) in unterschiedliche verwandtschaftliche Beziehung zueinander gesetzt werden abhängig davon, welche andere Sequenzen ich zusätzlich noch betrachte.


    Das ist etwas, was ich so nicht erwartet hätte.


    LG & gute Nacht,
    Craterelle

  • Arrgh, das Ganze wird immer wirrer.


    Also, die Tylopilus-Sequenz stammt aus der Sequenz UDB000680. Identisch ist sie außerdem noch in den Datensätzen mit folgenden Kennungen vorhanden:


    FR877523(1)
    HM146887
    **KM576327
    **UDB027183
    HM146886(5)


    Die sind alle nur auf Gattungsebene bestimmt, stammen aber allesamt aus Europa, so dass T. felleus naheliegend erscheint.


    Dann habe ich die Sequenz auf die Weise bearbeitet, wie ich es auch mit denen vorher gemacht habe: Aus der "Species Hypothesis" alle Sequenzen herangezogen, die als dieselbe Art bezeichnet wurden, und aus diesen nach der "Mehrheitsmeinung" eine Art hypothetische normalisierte Sequenz gebildet. Diese weicht hier aber nur in einer einziger Base von der ab, mit der die Bäumchen erstellt wurde, sie ist am Ende um einen Buchstaben kürzer.


    Das "kleine" Boletus-Xerocomus-Tylopilus-Bäumchen bleibt weitgehend stehen, zumindest bleiben die Positionen und die Entfernungen zueinander erhalten. Nur in der Einrückung gibt es kleinere Abweichungen, allerdings nicht bei Tylopilus, sondern am deutlichen bei X. badia und B. luridus.

    Aber der "große" Boletales-Baum sieht jetzt komplett anders aus. Dass der so instabil ist, erschreckt mich. Das alles wegen einer einzigen Base Unterschied? 8|


    Meine vorsichtige Hypothese ist, dass die Vorgehensweise für stärker voneinander abweichende Sequenzen nicht geeignet ist.


    Ob Tylopilus nun so stehen bleiben darf wie im "kleinen" Baum oder ob die Sequenzen doch falsch sind, vermag ich nicht zu beurteilen.