Gensequenzierung - wissenswertes?

**Craterelle** · 9. September 2016

Zitat von Climbingfreak

Zitat von Craterelle

Hallo Stefan,

Danke für deine Antwort.

"Willkürlich" lässt erstmal aufhorchen

Es gibt aber dann sicherlich wissenschaftliche Untersuchungen, die sich mit dieser Festlegung beschäftigen?

LG, Craterelle

Alles anzeigen

Hallo,

na ja. Das ganze steckt noch mehr oder minder in den Kinderschuhen. Aber diese Kritik ist auf alle Fälle berechtigt. Es geht ja nicht nur um die abwechende Gensequenz, sondern auch um die makro- und mikromorphologischen Unterschiede. Inwieweit neue Arten definiert werden, die alle die gleiche morphologischen Merkmale haben, nur stark unterscheidliche Gensequenzen. Ich werde die Frage gern mal mit Marco Thines und/oder Bernd Oertel diskutieren. Die sehe ich ja auf der DGfM-Tagung.

Übrigens fällt mir zu dem Thema auch noch eine Aussage von Heinrich Dörfelt ein. "Es gibt eigentlich keine Arten". Er hat das etwas provokant formuliert, hat aber im Grunde recht. Der Mensch will/muss alles in Schubladen stecken. Dem Pilz ist es egal, wie er heißt...

l.g.
Stefan

Alles anzeigen

Hallo Stefan,

Das war ja bis jetzt noch gar keine Kritik. Allerdings wundert es mich etwas, dass es einen Grenzwert gibt, mit dem auch gearbeitet wird, aber unveröffentlicht ist, wer den festgelegt hat und auf welcher Basis.

Ich würde mich freuen, wenn du in der Richtung etwas herausfinden kannst.

LG, Craterelle

**Craterelle** · 21. Oktober 2016

Hallo Stefan,

Die DGfM-Tagung ist ja nun vorbei. Hast du etwas herausfinden können?

LG, Craterelle

**Climbingfreak** · 21. Oktober 2016

Zitat von Craterelle

Hallo Stefan,

Die DGfM-Tagung ist ja nun vorbei. Hast du etwas herausfinden können?

LG, Craterelle

Hi,

in gewisser Weise ja. Laut Dittes Vortrag ist alles, was bei den Inocyben unter 97% Übereinstimmung fällt bisher immer eine neue Art gewesen. Ihr Vortrag war sehr spannend und hat einen Einblick in Ihre Arbeittsweise gegeben.

Bei den Hebelomen war dies etwas schwieriger z.T. Hier mussten andere Sequenzen, als die ITS für die Unterscheidung der Arten herhalten.

Leider konnte ich nicht mit Marco und Bernd über dieses Thema weiter sprechen. Was ich aber sehr stark vermute: diese "Grenze" wird wohl von Gattung zu Gattung verschieden sein. Wiss. Untersuchungen zu dieser Thematik gibt es aber nicht; siehe Hebelomen oben. Da mussten erst weitere Sequenzen als die ITS gesucht werden, welche für eine Artunterscheidung taugen; selbiges gilt für viele Ascos.

l.g.
Stefan

**Karl W** · 21. Oktober 2016

Zitat von Climbingfreak

in gewisser Weise ja. Laut Dittes Vortrag ist alles, was bei den Inocyben unter 97% Übereinstimmung fällt bisher immer eine neue Art gewesen. Ihr Vortrag war sehr spannend und hat einen Einblick in Ihre Arbeittsweise gegeben.

Hallo Stefan,
das hört sich doch ziemlich seriös an, aber die Grenzen werden tatsächlich sehr unterschiedlich gehandhabt.

In der letzten ZfM 82(2) wird mit Entoloma milthaleri M. Kamke & Lüderitz eine Art neu beschrieben, die mit 98% Ähnlichkeit zu E. conferendum und 99% Ähnlichkeit zu E. luteofuscum K. N. A. Raj & Manim steht. Der Name E. luteofuscum taucht in der Artendiskussion überhaupt nicht auf.

Die in der ZfM 77(2) neu beschriebene Entoloma venustum Wölfel & F. Hampe wurde 2014 wegen "nur" 1,8% Abweichung von E. callichroum E. Horak & Noordel. zur Varietät E. callichroum var. venustum (Wölfel & F. Hampe) O.V. Morozova, Noordel. & Vila zurückgestuft.

LG Karl

**andzandz** · 23. Oktober 2016

Also bei uns im Labor kostet eine DNA Extraktion 5-7 EUR (man braucht eine Zentrifuge). Eine PCR vielleicht 2 EUR, aber man braucht halt den Cycler. Dann das Aufreinigen nochmal 2 EUR. Die Sequenzierung kostet 4,5 EUR, man nimmt in der Regel immer 2 pro Sequenz. Für Privat kommt mit Sicherheit noch Umsatzsteuer und weiß der Geier was dazu.

An der Extraktion kann man noch was drehen und nen Protokoll anpassen, zBsp CTAB, aber da braucht man erweiteres Laborwissen. Dann bekommt man das auf 1 EUR runter. Die Squenzierung kann man auf 2,50 drücken wenn man das in 96er Paketen wegschickt undn Kumpel hat in der Forschung der das mitlaufen lassen kann. Das Aufreinigen kann man auf 50 cent mit ExoSap drücken, aber da braucht man auch wieder nen Protokoll zu.

Idealerweise braucht man aber auch noch Agarose und ein Netzteil, sowie diverse Chemikalien und eine UV Lampe um die PCR zu überprüfen.
Naja dann braucht man noch das Wissen die Dateien die man von der Sequenzierung zurückbekommt zusammenzusetzen und zu überprüfen.

Wenn es nicht bei Genbank steht, dann ist es auch nicht auffindbar. Es gibt kein Geheimspeicherort für Wissenschaftler.

Naja mit den Daten die man dann bekommt kann man dann Stammbäume machen oder checken ob man das hat was man denkt. Aber wie schon erwähnt man brauch das richtige Gen dafür.

**Craterelle** · 25. Januar 2017

Es ist echt toll, was hier alles zusammengekommen ist. Praktisch damit anfangen wollte ich noch gar nicht, erstmal "nur" die Zusammenhänge verstehen.
Jetzt habe ich mal in den von Pablo verlinkten Datenbanken gesucht. Mit der ersten kam ich nicht recht klar, bei Unite finde ich immerhin die gesuchten Arten. Mein Übungsopfer: Sarcodon, insbesondere S. imbricatus und S. squamosus, die ja noch gar nicht so lange überhaupt getrennt werden.

Da habe ich dann zu jeder Probe eine Sequenz von knapp 1000 Basenpaaren (~~das scheint auch immer die gleiche Anzahl zu sein, genau 979~~ nein, die Anzahl ist doch nicht gleich, so 750-1000 sind es wohl).

In den vergleichenden Ansichten ist von dieser Sequenz am Anfang und am Ende großzügig etwas weggelassen, und der mittlere Teil mit Hilfe von Bindestrichen in Blöcke gruppiert.

Und dieser mittlere Teil passt dann auch sehr hübsch zu anderen Proben der gleichen Art, und im Vergleich zur eng verwandten Art erkennt man sowohl identische Gruppen als auch abweichende (und zwar systematisch abweichende, also bei allen der einen Art Muster x, bei denen der anderen Muster y). Das sieht doch alles schon ganz nett aus.

Trotzdem brauche ich nochmal ein bisschen Hilfe, und zwar zu allererst mal zur Bedeutung der Bindestriche. Gruppieren macht sicherlich Sinn, auch hinsichtlich der Beobachtung, dass Abschnitte bei benachbarten Arten abweichen können. Aber es sind unterschiedlich viele Bindestriche. Vielleicht, weil die "Austauschobjekte" zwischen den Arten unterschiedlich lang sein können?

Und was bedeutet der Buchstabe N, auf den ich gelegentlich statt der üblichen ATGC gestoßen bin?

Ein großes Dankeschön schonmal an alle!
LG, Craterelle

**Craterelle** · 27. Januar 2017

Und was, wieviel genau wird da weggeschnipselt am Anfang und am Ende? Und warum?

Eine Möglichkeit wäre, dass der Teil nicht immer vorhanden ist. Zumindest ist er sehr unterschiedlich lang bei den Sequenzen, die ich mir angeschaut habe.

Warum setzen dann aber zwar die meisten aneinander ausgerichteten Sequenzen im einer Gegenüberstellung (wie z.B. hier, in der Tabelle ganz rechts) bei einer bestimmten Folge an, aber einige eben doch später oder früher? Vielleicht erklärt sich ja alles fast von selbst, wenn ich die Bedeutung der Bindestriche verstehe?

Zitat von Drosophila

Stefan, wollen wir versuchen, noch etwas nach Art der Maus zu beschreiben? Z.B.
- ...
- Bioinformatik (Sequenz-Alignments, Datenbanken)

An diesem Punkt bin ich wirklich wohl gerade. Vielleicht kann nochmal jemand etwas Licht machen?

LG, Craterelle

**Climbingfreak** · 27. Januar 2017

Hallo,

nur ganz kurz. Bei den Bindestrichen bin ich mir nicht sicher, was die genau bedeuten. Buchstaben wie N und Y z.B. bedeuten, dass die Base nicht ganz eindeutig aus der Sequenzierung hervorgegangen ist. Ich habe leider gerade nicht den Code da, was welches Zeichen bedeutet, aber es gibt Buchtaben für A oder T, C oder G usw.

Dass "vorne" und "hinten" Basen fehlen ist den "chromatograpischen" Gesetzmäßigkeiten geschuldet. Du hast bei solchen Trennverfahren immer einen "Lösungsmittelpeak"; egal welches Verfahren angewendet wird. Das bedeutet, dass das Lösungsmittel und sehr kleine Molekülfragmente nicht mit dem Säulenmaterial interagieren und demzufolge auch ungenügend zurückgehalten werden. Du bekommst da keine verlässlichen Daten raus. Danach kommen die Molekülfragmente, welche dann mit dem Säulenmaterial ausreichend interagieren. Da funktioniert die Größentrennung der DNA-Fragmente sehr gut. Wenn die Moleküle aber zu groß werden gibt es keine scharfe Trennung mehr, denn die Moleküle binden zu stark an die Säule und du bekommst Peaks, die sich zu sehr überschneiden. Eine richtige Trennung, bzw. Unterscheidung der Moleküle ist dann nicht mehr möglich.

Um das genau zu vertehen wäre eine ganze Vorlesungsreihe in Instrumenteller Analytik notwendig. Um es ganz einfach und kurz zu sagen. Das ist kein Problem der Sequenzierung an sich, sondern ein Problem des analytischen Auftrennens der DNA-Fragmente.

l.g.
Stefan

**Habicht (†)** · 27. Januar 2017

Hallo Craterelle,

einer meiner Funde wurde näher beäugt, ev. findest Du hier eine Antwort zu Deinen Fragen,

Molekulargenetische Untersuchungen
Die Methodik für DNS-Isolierung, Amplifizierung, Sequenzierung und Analyse der ITS1-5.8S-ITS2- Barcoding-Region ist in MENTRIDA & al. (2015) beschrieben. Mithilfe des NCBI-BLAST-Programms (http://www.ncbi.nlm.nih.gov/BLAST) wurde die ITS-Sequenz mit den ähnlichsten Sequenzen verglichen um die taxonomische Einordnung zu bestätigen. Die Sequenz ist in der GenBank hinterlegt mit der Registrierungsnummer KY315920.

, wie schon von BOROVICKA et al. (2011) festgestellt, ...nicht in ihre Varietäten trennen. Die Sequenz der Kollektion stimmt zu 99% mit fünf in GenBank, teilweise noch als Arten, hinterlegten Sequenzen überein, nämlich mit und P., ..... (NCBI blast). Da drei Polymorphismen innerhalb der Sequenz vorliegen, beträgt die Übereinstimmung nicht 100%. BOROVICKA et al. (2011) bestätigten die Eigenständigkeit von einerseits P. und andererseits P. als hinsichtlich ihrer DNA-Merkmale gut fundierte Art in einer Multigenanalyse (Teilsequenzen des nukle- ären LSU-rRNS-Gens, der ITS1-5.8S-ITS2-Barcoding-Region und des EF1Î±- Gens). Die Sequenzen lassen jedoch keine weitere Untergliederung in Varietäten erkennen. Eine solche Trennung könnte, falls überhaupt, eventuell mit Hilfe der Analyse weiterer Loci, erreicht werden.

LG
Peter

**Craterelle** · 28. Januar 2017

Hallo Kletterstefan,

Ein Y ist mir bisher noch nicht untergekommen.

Ich nehme N mal als "aNy base" entsprechend dieser Auflistung und ignoriere den Rest, bis ich tatsächlich darauf stoße.

Das weitere: die Bestimmung der Basen erfolgt also chromatografisch? Ich hatte gedacht, chromatografische Verfahren würden bestenfalls Mengenanteile für enthaltene Moleküle liefern können, womit uns hier allerdings nicht so recht geholfen wäre, weil wir ja die Reihefolge brauchen.

Tatsächlich hat mein Vorstellungsvermögen an diesem Punkt noch einen blinden Fleck: mit welcher Methode lese ich aus meiner vorbereiteten Probe, die nur noch den ITS-5.8S-ITS2-Abschnitt enthalten sollte, die Abfolge der Basen aus? Oder: ich welche Kiste stecke ich's, damit hinten die Buchstaben rausfallen?

Habichtspeter: vielen Dank! Der dort erwähnte Artikel MENTRIDA & al. (2015) würde mich sehr interessieren. Ist evtl. auch noch der genaue Artikel angegeben und wo er veröffentlicht wurde?

LG, Craterelle

**Climbingfreak** · 28. Januar 2017

Zitat von Craterelle

Hallo Kletterstefan,

Ein Y ist mir bisher noch nicht untergekommen.

Ich nehme N mal als "aNy base" entsprechend dieser Auflistung und ignoriere den Rest, bis ich tatsächlich darauf stoße.

Das weitere: die Bestimmung der Basen erfolgt also chromatografisch? Ich hatte gedacht, chromatografische Verfahren würden bestenfalls Mengenanteile für enthaltene Moleküle liefern können, womit uns hier allerdings nicht so recht geholfen wäre, weil wir ja die Reihefolge brauchen.

Alles anzeigen

Hi,

der Möglichkeiten für die Chromatographie gibt es viele, wobei ich mir gerade nicht sicher bin, ob das über eine wirkliche Chromatogrpahie funktioniert oder über Kapillarelektrophorese. Macht aber nix, denn die Grundprinzipien sind ähnlich. Es werden Moleküle der Molekülgröße nach aufgetrennt. Inzwischen ist die Technik sogar schon so weit vorangeschritten, dass es für jede Base spezifische Floureszensmarker gibt, so dass du aus einem Ansatz alle Basen erfassen kannst. Früher wurden für jede Base einen eigenen Ansatz geamcht und separat aufgetrennt.

X=beliebig lange Kette

XA = Molekül 1 mit Molmasse 1 = Peak 1
XAG = Molekül 2 mit Molmasse 2 =Peak 2
XAGT = Molekül 3 mit Molmasse 3 =Peak 3
XAGTC = Molekül 4 mit Molmasse 4 =Peak 4 usw.

l.g.
Stefan

**Habicht (†)** · 28. Januar 2017

Zitat von Craterelle

Der dort erwähnte Artikel MENTRIDA & al. (2015) würde mich sehr interessieren. Ist evtl. auch noch der genaue Artikel angegeben und wo er veröffentlicht wurde?

Hallo Cratrerelle,

veröffentlicht wurde er von der Österreichische Mykologische Gesellschaft in der ÖZP 24,

MENTRIDA, S., KRISAI-GREILHUBER, I., VOGLMAYR, H., 2015: Molecular evaluation of species delimitation and barcoding of Daedaleopsis confragosa specimens in Austria. –“ Österr. Z. Pilzk. 24: 173–“179.

LG
Peter

**Craterelle** · 29. Januar 2017

Zitat von Habicht

veröffentlicht wurde er von der Österreichische Mykologische Gesellschaft in der ÖZP 24,

MENTRIDA, S., KRISAI-GREILHUBER, I., VOGLMAYR, H., 2015: Molecular evaluation of species delimitation and barcoding of Daedaleopsis confragosa specimens in Austria. –“ Österr. Z. Pilzk. 24: 173–“179.

Danke, Peter! Dann werde ich mal versuchen, das aufzutreiben. Den Wikipedia-Artikel (https://de.m.wikipedia.org/wiki/DNA-Sequenzierung) habe ich mehrmals gelesen, finde ihn aber eher schwere Kost.

LG, Craterelle

**Craterelle** · 17. Februar 2017

Den Artikel habe ich mir dann doch nicht besorgt, 30,- schien mir zu viel für etwas, wo allenfalls der allgemeine/einführende Teil von Interesse sein konnte und mich die speziellen Erkenntnisse zur untersuchten Art gar nicht interessieren.

Die Sache mit den Bindestrichen ist noch nicht aufgeklärt, deshalb formuliere ich mal meine Hypothese dazu:

Dies könnte vielleicht das sagenumwobene Alignment sein.

Also: man hat zwei eng verwandte Arten, deren Sequenzen fast übereinstimmen und nur in einem Teilbereich abweichen. Diese abweichenden Basenpaare sind aber unterschiedlich lang, deshalb muss man bei der kürzeren mit Bindestrichen auffüllen. Ob am Anfang, am Ende oder mittendrin wäre erstmal egal wenn man nur zwei Arten betrachtet, dass ergibt sich wenn man immer mehr Arten hinzunimmt. So werden schließlich auch entfernt verwandte Arten, die noch wenig übereinstimmende Abschnitte aufweisen, direkt in der linearen Gegenüberstellung miteinander vergleichbar.

Wie klingt das?

LG, Craterelle

**Craterelle** · 28. Februar 2017

Jetzt habe ich mal kräftig in der Buchstabensuppe herumgeführt, um ein bisschen Gefühl dafür zu bekommen, wie variabel die Sequenzen innerartlich sowie innerhalb von Gattungen ist.

Übungsopfer: diesmal der Maronenröhrling. Knapp 30 Datensätze sind als Xerocomus badius (firmiert der nicht aktuell unter Imleria?) einsortiert.

Recht große Übereinstimmung in den Sequenzen, die wenigen Abweichungen über die gesamte Sequenz verstreut, nicht selten ist der bei allen Datensätzen vorhandene Abschnitt sogar identisch.

(gelb hinterlegt sind die Abweichungen)
Systematische Abweichungen immer an bestimmten Stellen kommen nur bei 4 Proben vor, die aus Nordamerika stammen und untereinander wiederum nur minimal abweichen. Hübsch, das wirkt nachvollziehbar.

Die Abweichungen kann man sich auch noch als absolute Zahl oder prozentual ausgeben lassen, wobei ich auf den bei allen vorhandenen Abschnitt beschränkt habe, also am Anfang und am Ende ausgeklammert, was nicht bei allen Proben vorhanden war.

Als nächstes habe ich mir zwei aus der Gattung Boletus angeguckt, der die Marone ja auch mal zugeordnet war. B. edulis über 60 Datensätzen aus aller Welt. Hier erstaunliche Homogenität ohne erkennbare regionale Abweichungen.

Dann noch B. erythropus dazu, mit etwas dünnem Datenbestand, nur 7 Sequenzen aus Europa. Aber auch hier ist ein typisches Sequenzmuster deutlich erkennbar.

Diese drei also untereinandergelegt und ... Buchstabensalat. Das Alignment wird offenbar doch nicht artübergreifend gemacht und erschwert damit die Vergleichbarkeit zwischen verschiedenen Arten eher, statt sie zu erleichtert. Also habe ich es ganz entfernt und selbst versucht, ähnliche Abschnitte zu identifizieren.

Immerhin habe ich einen lange übereinstimmenden Abschnitt gefunden, über 100 Basenpaare, und dazu viele kürzere Schnipsel. Wenn ich Zeit finde, will ich auch noch Filzröhrlinge dazunehmen, in der Gattung hat die Marone ja auch mal gewohnt.

(jetzt schon mit X. submentosus - die bei allen identische Sequenz von 159 Basen, bei X. submentosus mit einer Abweichung, ist gelb hinterlegt)

Meine Fragen im Moment:

1) Wieder zurück zu den Bindestrichen. Meine Hypothese hat sich in Teilen offensichtlich als falsch erwiesen. Die sind zwar Platzhalter, wo in einer Sequenz eine Base ist und in der anderen keine, aber wenn das Alignment nur dem innerartlichen Vergleich dient und nicht dem zwischen Arten, verwundert mich immer noch oder wieder, dass häufig eine Vielzahl an Bindestrichen gesetzt wird, wo einer genügt hätte.

2) Wie funktionieren die Regeln für das Alignment genau? Wenn z.B. zwischen zwei identischen Abschnitten einmal die Basenfolge CAATGTAGC und im anderen stattdessen TTG, würde die kürzere TTG-Gruppe zerstückelt als ---T-T-G-, um die bestmögliche Übereinstimmung (3 Basen) zu erreichen, oder lässt man sie zusammen (--TTG---- oder -----TTG-, je 2 Basen oder gar TTG------ bzw. ------TTG, 0 Basen)?

**Florian1986** · 28. Februar 2017

Zitat von Craterelle

Diese drei also untereinandergelegt und ... Buchstabensalat. Das Alignment wird offenbar doch nicht artübergreifend gemacht und erschwert damit die Vergleichbarkeit zwischen verschiedenen Arten eher, statt sie zu erleichtert. Also habe ich es ganz entfernt und selbst versucht, ähnliche Abschnitte zu identifizieren.

Immerhin habe ich einen lange übereinstimmenden Abschnitt gefunden, über 100 Basenpaare, und dazu viele kürzere Schnipsel. Wenn ich Zeit finde, will ich auch noch Filzröhrlinge dazunehmen, in der Gattung hat die Marone ja auch mal gewohnt.

Meine Fragen im Moment:

1) Wieder zurück zu den Bindestrichen. Meine Hypothese hat sich in Teilen offensichtlich als falsch erwiesen. Die sind zwar Platzhalter, wo in einer Sequenz eine Base ist und in der anderen keine, aber wenn das Alignment nur dem innerartlichen Vergleich dient und nicht dem zwischen Arten, verwundert mich immer noch oder wieder, dass häufig eine Vielzahl an Bindestrichen gesetzt wird, wo einer genügt hätte.

2) Wie funktionieren die Regeln für das Alignment genau? Wenn z.B. zwischen zwei identischen Abschnitten einmal die Basenfolge CAATGTAGC und im anderen stattdessen TTG, würde die kürzere TTG-Gruppe zerstückelt als ---T-T-G-, um die bestmögliche Übereinstimmung (3 Basen) zu erreichen, oder lässt man sie zusammen (--TTG---- oder -----TTG-, je 2 Basen oder gar TTG------ bzw. ------TTG, 0 Basen)?

Alles anzeigen

Den Teil bis zu deinen Fragen habe ich leider nicht nachvollziehen können, das müsste man wohl sehen, was du da gemacht hast.

zur 1) Das Alignment dient durchaus dem Vergleich zwischen verschiedenen Arten, nur sollten da natürlich die Unterschiede größer sein, als "innerartlich". Du wirst also mehr "Bindestriche" (man sagt besser "gaps" dazu) bekommen, aber das sollte ja auch so sein. Im Idealfall hast du also keine "mismatches" (nicht zueinander passende Basen) innerhalb einer Art, wohl aber zu anderen Arten und zwar je mehr, desto weiter sollte die Art im Verwandtschaftsverhältnis entfernt stehen. Soweit nachvollziehbar?

zur 2) Die Regeln gibt ein Algorithmus an, der Strafpunkte verteilt. Das kann man beim Alignment dann einstellen, wie einem das beliebt. Es gibt da die Möglichkeit Strafpunkte für nichtpassende Basen (also dass ein "A" in der Sequenz mit einem "G" alignt) zu vergeben. Außerdem kann man Strafpunkte vergeben für "mache ein Gap" und "erweitere das Gap".
In deinem Beispiel würde also -TTG---- oder ----TTG- oder TTG------- entstehen, wenn die Strafpunkte für die Erweiterung eines gaps niedrig, für die Einführung eines gaps allerdings recht hoch sind (dann "kostet" es weniger die bereits entstehende Lücke zu erweitern, als ein neues gap einzuführen). ---T-T-G- hingegen wäre dann das Gegenteil, da müssten die Kosten für die Erweiterung eines gaps sehr hoch sein, für die Einführung eines neuen gaps hingegen niedrig.
Soweit auch einigermaßen verständlich?

Liebe Grüße,
Florian

**Craterelle** · 28. Februar 2017

Hallo Florian,

Ich habe in den letzten Beitrag noch ein paar Screenshots eingefügt, um das ganze etwas zu illustrieren.

Die Erklärung zu 2 ist sehr hilfreich, danke!

1 wird zumindest auch etwas klarer. Das Alignment aus der Unite-Datenbank passt zumindest für den Vergleich der von mir gewählten Arten nicht (s. 3. Screenshot), dafür müsste man es noch stark modifizieren. Ich denke, als nächstes schnuppere ich mal in der Software herum, die es zu diesem Zweck gibt.

LG, Craterelle

**Florian1986** · 2. März 2017

Hallo Craterelle,

da scheint etwas wirklich nicht so ganz zu passen.

Zuerst einmal dein Alignment der Maronenröhrlinge, das sieht ganz gut aus. Ich habe mal in rot eingekastelt, was wohl Sequenzierungsfehler/Auswertungsfehler sein könnten, in grün scheint wirklich eine Abweichung der nordamerikanischen Arten zu sein, das wirkt ganz realistisch.

Nachtrag: Was nicht so ganz Sinn macht sind die Gaps an Stellen, an denen bei keiner der Sequenzen eine Base steht. Warum sollte da eine Lücke sein?

Auf die Schnelle habe ich mal ein eigenes Alignment von zwei Penicillium-Arten mit einer Phoma-Art gebastelt (Sternchen zeigen die zueinander passenden Basen):

Ein schnelles Bäumchen zeigt das, was wir erwarten, die beiden Penicillium-Arten stehen näher beieinander, als bei der Phomar-Art:

Es ist wichtig, dass man die richtigen Abschnitte übereinanderlegt. Inwiefern du das bei deinem Alignment der verschiedenen Röhrlinge getan hast, das weiß ich natürlich nicht . Da solltest du auf jeden Fall darauf achten.

Liebe Grüße,
Florian

**Craterelle** · 2. März 2017

Hallo Florian,

das Alignment hatte ich so aus der Unite-Datenbank übernommen.

Zitat von Florian1986

Nachtrag: Was nicht so ganz Sinn macht sind die Gaps an Stellen, an denen bei keiner der Sequenzen eine Base steht. Warum sollte da eine Lücke sein?

Die langen Abfolgen von Bindestrichen (Gaps), wo aber in keiner Sequenz eine Base vorkommt, waren genau das, was mich so irritiert hat.

Zitat von Florian1986

Ich habe mal in rot eingekastelt, was wohl Sequenzierungsfehler/Auswertungsfehler sein könnten...

Sind das denn zwingend Fehler? Ich hatte das bisher für Abweichungen gehalten, wie sie zwischen verschiedenen Individuen einer Art normal sein könnten, es sind ja keine Klone.

LG, Craterelle

**Florian1986** · 2. März 2017

Zitat von Craterelle

Zitat von Florian1986

Ich habe mal in rot eingekastelt, was wohl Sequenzierungsfehler/Auswertungsfehler sein könnten...

Sind das denn zwingend Fehler? Ich hatte das bisher für Abweichungen gehalten, wie sie zwischen verschiedenen Individuen einer Art normal sein könnten, es sind ja keine Klone.

LG, Craterelle

Hallo Craterelle,

deswegen hatte ich extra "könnte" geschrieben . Also die "R" sind auf jeden Fall Fehler in der Sequenzierung, die anderen halte ich zumindest für wahrscheinlich. Wenn du 10 Sequenzen hast, die exakt zueinander passen und dann eine, die in einer Base abweicht, dann sollte man da nochmal in die Rohdaten schauen, ob das tatsächlich eine Abweichung ist, oder ob die Sequenzierung an dieser Stelle nicht so genau war.

Hier mal so ein Beispiel:

Im ersten roten Kasten könnte das "N" entweder "A" oder "T" bedeuten, im zweiten roten Kasten könnte sich ein "T" zwischen den beiden "A" verstecken. Das muss man dann eben nochmal von Hand nacheditieren, sonst können schnell mal solche einzelnen Fehler passieren.

Liebe Grüße,
Florian

**Craterelle** · 2. März 2017

Danke, Florian!

Die Grafik ist sehr anschaulich. Beim zweiten Kasten wundert es mich fast, dass die Software da kein T sieht.

Ich habe noch etwas weitergemacht und das Alignment zwischen verschiedenen Arten (inzwischen sind noch weitere hinzugekommen) von MAFFT (http://mafft.cbrc.jp/alignment/server/) machen lassen (Standardeinstellungen). Das Ergebnis sieht für mich insgesamt recht anständig aus für den ersten Versuch.

Code

B.edulis            -----TCGAATCCTACCAGGGAGGGGAGGGAAGACGGATGGAGGAGTCAAGGCTGTCGCC
B.pinophilus      -----TCGAATCCTACCAGGGAGGGAGGGAAAATGGACAAGGACCCTCAAGGCTGTCGCC
B.erythropus      CATTATCGAATTCTGAGG------GGGGAAGAT-------GGTGAGTGAGGACAGTCGCT
B.luridus          -----TCGAATTCTGGAGTGGAGTGGGGAACAC------GTCGAGTGGGAGACTGTCGCT
X.chrysenteron   -----TCGAACTTCGAGG------------------------GCGAGGCGGACTGTCGCT
X.pruinatus       -----TCGAATTTCGAGG--------GGGGGAA------GATGAAGGGGAGACTGTCGCT
I.badia             TC-------------------------GAACAA------GAAGGGGGAAAGACTGTCGCT
X.subtomentosus TCG-ATTCCATTCTGAAG-----------------------AGGTAGAGAGACTGTGGCT
S.bovinus          AAG-AATAATTCTTGATC------CGACCAAAG------AAAGGAGGGAGAGTTGTAGCT
S.grevillei       -----TCGAATTATAATC------CGGCGAGGG-------GAAAGGGGGGAGTTGTCGCT
                                                                                                 .... ** **.


B.edulis            GGCA------------------------ACGT-GCACGCCCCTTTCTCTTTCGTGGAACC
B.pinophilus      GGCA------------------------ACGT-GCACG--CCTTCCTCTTTCATGGACC-
B.erythropus      GGCCTGAGC----------TTCTTGGGCATGT-GCACG--TCTTTGCTTGTCGTCGACCT
B.luridus          GGCC---------------TCTCGGGGCATGTCGCACG--TCTTCCCTTTTCGTTGACCT
X.chrysenteron   GGCTTCGGC--------------------CGT-GCACG--TCC-------------ACCT
X.pruinatus       GGCGTTCGC--------------------TGT-GCACG--TCTTT-CTTTTCGTCGACCT
I.badia             GGCG-------------------AAAGCATGT-GCACG--TCC------------AACCT
X.subtomentosus GGCCGTCTATATACCTATATAAGACCGCATGT-GCACG--TCC-----------------
S.bovinus          GGCCCT------------------AGGCACGT-GCACG--CTTTCTTTC----TGGACTT
S.grevillei       GGCCTT-------------TTACGAGGCATGT-GCACG--CTCTCCTT-----GGAACCT
                        ***                                       .** *****   ...                         


B.edulis            T----CCCCT----------------TTCTAGTTTCCTTATCCACCTGTGCACCCTTTGT
B.pinophilus      -----CCCCT----------------TTCTAGTTTCCTTATCCACCTGTGCACCCTTTGT
B.erythropus      T--------------------------TCTCTCTCATACACACACCTGTGCACCCATTGT
B.luridus          TTCTCCTTCT----------------CTCTCTCTCTCTCACACACCTGTGCACCCGTCGT
X.chrysenteron   T----------------------------TCTCTTACTCTCACACCTGTGCACACATTGT
X.pruinatus       T----------------------------TCTCTTACTCTCACACCTGTGCACACACTGT
I.badia             T-------------------------------TTCTATTACACACCCGTGCACCTTTTGT
X.subtomentosus ----CCTCGC----------------CTTTTCTATCTACACACACCTGTGCACCTATTGT
S.bovinus          TG-GTCGTATGGGCGCGGAGGGTCAACCTCTGCGTCTTCATATGCCCCTCTTCGTGTAGA
S.grevillei       TT-GCCTTATGGGCGCGGGGCGAC-----CCGCGTCTTCATATACC--TCTTCGTGTAGA
                                                                        . .    . . ..**   * . * . . * 


B.edulis            AGGCC-CTC----------------------GAAAGAGGATCTACGTTTTCTCTATATAC
B.pinophilus      AGGCC-CTC----------------------GAAAGAGGTTCTATGTT-----TATCTAT
B.erythropus      AGGTC-CTC----------------------GGAAGAGGATCTATGTT-----TTTCACA
B.luridus          AGGTC-CTC----------------------GAAAGAGGATCTATGTATT---TTTCATA
X.chrysenteron   AGGTC-CTC----------------------GAAAGAGGATCTATGTT-----TCAATCG
X.pruinatus       AGGTCTCTC----------------------GAAAGAGGATCTATGTT-----TTCATCA
I.badia             AGGTC-CTC----------------------GAAAGAGGATCTATGTAT----TTCATCA
X.subtomentosus AGATC-CCCATCCCCTTTTGCCTTTGAAAGAGGGAGGGAACCTATGTTTT--TCATCACA
S.bovinus          AAGTC-TTT--------------------------GAATGTTTTTACTAT---CATCGAG
S.grevillei       AAGTC-TTC--------------------------GAATGTTTATATTAT---CATCGAG
                        *...* ...                                       *..   ..* ...         .         


B.edulis            GCTTTTTGCTACGCATGTCCA--GAATGTATAC---------------------------
B.pinophilus      CTACTACCACATGTATGTCCA--GAATGTATAC---------------------------
B.erythropus      TCACA-CCCGTCGTATGTCTATAGAATGTATTG---------------------------
B.luridus          TCACACCCCATCGTATGTCTATAGAATGTATTGAAAACGTCGACCTGTCTTGACAGGCCT
X.chrysenteron   TCACA-CACATCGTATGTCTA--GAATGTATTACGATCGTCGTTCGACCTCGCGGTCGTG
X.pruinatus       TCACA-CACACTGTATGTCTA--GAATGTATCACGATCGTCGACCGGCCTTGCGGTCGGG
I.badia             TCACA-CCTATCGTATGTCTA--GAATGT-----CATCGTCGACCA------------CT
X.subtomentosus TCACACACAATTGTATGTCTA--GAATGTAATTTCATTGATCATTGATC-----------
S.bovinus          TCGCG---------ACTTCTAGGAGATGCGATT--------------------------C
S.grevillei       CCGCG---------ACTTCTAGGAGACGCGGTT--------------------------C
                         . .               *. **.*   ..*.*.                                              


B.edulis            -------------AAACTTTACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
B.pinophilus      -------------AAATTTTACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
B.erythropus      -AGAAAAATAA--AAATCATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
B.luridus          GACGGTTCATA--AATCCATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
X.chrysenteron   GGGCGGTCTAA--AACAAATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
X.pruinatus       TGGCGGTCAAATGAATAAATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
I.badia             GGGCGGCGAAAT-AAATAATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
X.subtomentosus -ATTGATAAAA--ATATAATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATG
S.bovinus          TTTGAGACAAA--AGTTATTACAACTTTCAGCAATGGATCTCTTGGCTCTCGCATCGATG
S.grevillei       TTTGAGACAAA--AGTTATTACAACTTTCAGCAATGGATCTCTTGGCTCTCGCATCGATG
                                           *       ***************.*************************


B.edulis            AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
B.pinophilus      AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
B.erythropus      AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
B.luridus          AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
X.chrysenteron   AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
X.pruinatus       AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
I.badia             AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTTCAGTGAATCATCGAAT
X.subtomentosus AAGAACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGATTTCCAGTGAATCATCGAAT
S.bovinus          AAGAACGCAGCGAATAGCGATATGTAATGTGAATTGCAGATCTACAGTGAATCATCGAAT
S.grevillei       AAGAACGCAGCGAATCGCGATATGTAATGTGAATTGCAGATCTACAGTGAATCATCGAAT
                        *************** ****** ******************.* ****************


B.edulis            CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCA-TC
B.pinophilus      CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCA-TC
B.erythropus      CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATTT
B.luridus          CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCA-TC
X.chrysenteron   CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCA-TG
X.pruinatus       CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCA-TG
I.badia             CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCA-TT
X.subtomentosus CTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATTT
S.bovinus          CTTTGAACGCACCTTGCGCTCCTCGGTGTTCCGAGGAGCATGCCTGTTTGAGCGTCA-GT
S.grevillei       CTTTGAACGCACCTTGCGCTCCTCGGTGTTCCGAGGAGCATGCCTGTTTGAGCGTCA-GT
                        ***********************.***.************************.****    


B.edulis            GAATTCTCAACCATGTCTTGAAT------------TAGG-CATGGCTTGGACTTGGGGGT
B.pinophilus      GAATTCTCAACCATGTCTTGAAT------------GAGG-CATGGCTTGGACTTGGGGGT
B.erythropus      GAATTCTCAACCATGTCTTGATTGATTTC------GAGG-CATGGCTTGGACTTGGGGGT
B.luridus          GAATTCTCAACCATGTCTTGATCGATTTC------AAGGCCATGGCTTGGAGTTGGGGGT
X.chrysenteron   TAATTCTCAACCATGTCTTGATTGATTTC------GGGG-CATGGCTTGGAAGTGGGGGT
X.pruinatus       TAATTCTCAACCACGTCTCGATTGATTTC------GAGG-CATGGCTTGGACTTGGGGGC
I.badia             AAATTCTCAACCATGACTTTGTTGA---------------CATGGCTTGGAGTTGGGGGT
X.subtomentosus TAATCCTCAACCATTCTTTCTTCTTTCTTGGATGGAAAG-TATGGCTTGGAGTTGGGAGT
S.bovinus          AAATTCTCAACT-CCTCTCGATTGACTTC------GAGT-GGAGCTTGGATAGTGGGGGC
S.grevillei       AAATTCTCAACC-CCTCTCGATTAGCTTC------GAAAGGGCGCTTGGATAGTGGGGGC
                         ***.******. .   .*.    .                           . * .* *.    ****.*.


B.edulis            TGCTGGCAC----------------ACGTTGTCAAGCTCTCCTGAAATGCATTAGCGAT-
B.pinophilus      TGCTGGCAC----------------ACGTCTGTCAGCTCTCCTGAAATGCATTAGCGAT-
B.erythropus      TGCTGGCGGCGA-------------AATGCTGTCGGCTCTCCTGAAATGCATTAGCAAA-
B.luridus          TGCTGGCGGCGA-------------CGAGCTGTCGGCTCTCCTGAAATGCATTAGCAAA-
X.chrysenteron   TGCTGGCGGCG--------------AAGGCTGTCGGCTCTCCTGAAATGCATTAGCGAC-
X.pruinatus       TGCTGGTGGCG--------------AAAGCTGTCAGCTCTCCTGAAATGCATTAGCAAC-
I.badia             TGCTGGC------------------TTGTTTGTCAGCTCTCCTGAAATACATTAGCGGT-
X.subtomentosus TGCTGGCAGAG-----------------ACTGTCAGCTCTCCTTAAATGCATTAGCAATC
S.bovinus          TGCCGGAGACCTGAATATTCGTGTTCGGGACTCGGGCTCCTCTGAAATGTATTGGCTTG-
S.grevillei       TGCCGGAGATCTGGAC-TTTTCGTCTGGGACTCGGGCTCTCCTGAAATGAATGGGCTTG-
                        ***.**                                       . .****..** ****. ** .**      


B.edulis            -GTTCAGCAA--GCCT--GAACGTG-CACGGCCTTTTCGACGTGATAACGATCGTCGTGG
B.pinophilus      -GGTCAGCAA--GCCT--G-ACGTG-CACGGCCTTTTCGACGTGATAACGATCGTCGTGG
B.erythropus      GGGGCTGCAA--GTCTTTGGACGTG-CACGGCC--TTCGACGTGATAATGATCGTCGTGG
B.luridus          -GGGCAGCAA--GTCTTTG-ACGTG-CACGGCC--TTCGACGTGATAATGATCGTCGTGG
X.chrysenteron   -GGACAGCAA--GTCT--G-ACGTG-CACGGCC---TCGACGTGATAATGATCATCGTGG
X.pruinatus       -GGACAGCAAT-GTCT--G-ACGTG-CACGGCC---TTGACGTGATAATGATCGTCGTCG
I.badia             -GGACAAGCA-----------------AGGCCT--TCCGACGTGATAATGATCGTCGTGG
X.subtomentosus GAGTTGGCTA--GTCTTTG-ACGTG-CACGGCC--TCGGACGTGATAATGATCGTCGTAG
S.bovinus          CGGTCTGTTTTCGACTTT--GCATGACAAGGCT--TTTGGCGTGATAATGATCGCCGCTC
S.grevillei       CGGTCGGCTTTCGACTAT--GCATGACAAGGCT--TTTGGCGTGATAATGATCGCCGCTC
                         .   . .                              * * *.    . *.********.****..**.   


B.edulis            GCTGGAGCGTA-------GGGTG-------AGCAGTGAATCGCTTCTAATCTATACCTCA
B.pinophilus      GCTGGAGCGGT------AGGGTG-------AGCGGTGAATCGCTTCTAATCTA-------
B.erythropus      -CTGGAGCGTC-------GGACATGCATGAATGGTCCCATTGCTTCCAATTCCTA-----
B.luridus          -CTGGAGCGTC-------GGACATGCATGAATAGGTCCTGTGCTTCTAATCTCTCCCAT-
X.chrysenteron   -CTGGAGCGTC-------GGACGAGCGCGATACGTCCCTTTGCTTCCAATCCT-------
X.pruinatus       -CTGGAGCGTC-------GGACGTGCAC-ACGAGTCCGTTTGCTTCGAATCCT-------
I.badia             GGCGGAGCATC-------------------AACGTCTGTCTGCTTCTAAATCCCA-----
X.subtomentosus -CTGGAGCGTCTTTCCTAGACTGTGCACACATGGTAGATTTGCTTCTAATCAA-------
S.bovinus          GCCGAAGTGCA------------TGAATGAAACCGTGCCGTGCCTCTAATCCGTC-----
S.grevillei       GCCGAAGTGCA------------TGAATG-AACGGTCCCGTGCCTCTAATGCGTC-----
                           .*.**..                                              .**.** **                


B.edulis            GTTACTAGTCGGTCGTGAGACTGACGAACGCGCGAGGCTTGATCTTGGACCCCAAGCCTT
B.pinophilus      -----AAGTCGGTCGTGAGACTGACTGAGG----------------------CTAGCCTT
B.erythropus      -----------------ATCCAAGTCTAGA----------------------GTCGC-TC
B.luridus          ------------------------------------------------------------
X.chrysenteron   ---TTGACTTGGGAATAGGAC-TTTCGAGC----------------------GAAGCTTT
X.pruinatus       --ATTGACTTGAGACTTGGACATTTCGAGA----------------------GAAGCGTC
I.badia             --GATGCCTTAGCTAGACATCATTTCGAAC------------------------------
X.subtomentosus -----------------GAAGAGATAAGAG----------------------TTAGC-TT
S.bovinus          --GATGCCTCTATGG-------------------------------------GGCGTCTT
S.grevillei       --GATGCCTTCT----------------------------------------GGCGTCTT
                                                                                                                  


B.edulis            AGTTACTAGTC-------------GGTCGTGAGGCCGACGAACGC----GCAGGGTTAGG
B.pinophilus      AGTTACTAGTC-------------GGTCGTGAGGCTGACGAACGC----GCAGGGTCTAG
B.erythropus      AGCTACTAGTCA------------GGTCGTGAGGCCGACGAACGTTGG---GTGGTCAAG
B.luridus          ------------------------------------------------------------
X.chrysenteron   AGTTACTAGTC-------------GGTCGTGAGACCGACGAACGCAGG-GCGGGATCGAA
X.pruinatus       AGCTACTAGTC-------------GGTCATGAGGCCGGCGAACGT-GG-GCTTGCTCGGA
I.badia             ------------------------------------------------------------
X.subtomentosus AGCTACTAGGCAGTCGAACTATTTATTTATTTGACTGGCGAACACAAGCAAAAAATCTTG
S.bovinus          CTTTAC------------------------------------------------------
S.grevillei       CCTTATTGACT-------------------------------------------------
                                                                                                                  


B.edulis            ACCATTTG-------------------AACT
B.pinophilus      G--TTTTG-------------------AACT
B.erythropus      G--CTTTGGCTGTTTTCGA-----------A
B.luridus          ---GCCTGACGGCGTGTGT-----TTCGAAA
X.chrysenteron   G--GTCGGAAGGCCCTCGTCTTTCTTGATGA
X.pruinatus       G--GTCAG-AGTCCCTCGTCTTTTTTCATGA
I.badia             ------------------------------G
X.subtomentosus A--TCTTG---ATCTTTGA------------
S.bovinus          ----------------------------GCA
S.grevillei       -------------------------------

Alles anzeigen

Ein Bäumchen gibt's gratis dazu, und ich habe die Übereinstimmungen auch noch einmal tabellarisch dargestellt, allerdings ganz einfach berechnet (gleiche Base (oder Gap) => Treffer; jegliche Abweichung, andere Base, Gap statt Base, etc. => nichts, und wieder beschränkt auf "gemeinsamen Mittelteil").

Nachtrag: Für mich ist das Bäumchen übrigens schon ein wenig erstaunlich.

Beispielsweise, dass die Marone der Ziegenlippe näher zu stehen scheint als diese den beiden Rotfußröhrlings-Arten. Oder auch, dass die beiden Hexenröhrlinge näher an dieser Gruppe sind als an den Steinpilzen.

**Craterelle** · 5. März 2017

Dann mal weiter hinein in die Baumschule.

Das Bäumchen aus dem letzten Beitrag ist auch vom MAFFT-Server, wiederum mit den Standardeinstellungen.

Als nächstes habe ich mir exemplarische Vertreter aus der Boletales-Familie angeguckt, die bucklige Verwandtschaft quasi. Den Boletus-Xerocomus-Zweig hatte ich dabei auf zwei Arten reduziert, damit es nicht unübersichtlich wird.

Dann noch einmal Boletus/Xerocomus u.ä. im Detail. Hinzugenommen habe ich noch den Gallenröhrling, weil der nach obigem Baum auch in diesem Ast landet.

Was mich jetzt aber irgendwie gewaltig stört:

Einmal scheint T. felleus näher mit B. edulis verwandt als mit X. chrysenteron, nach dem anderen Diagramm steht er näher an X. chrysenteron als an B. edulis.

Klar, das Alignment fällt verschieden aus, wenn man mehr oder weniger Arten vergleicht. Ich hätte aber erhofft, dass die errechneten Verwandtschaftsverhältnisse zumindest vergleichbar blieben, wenn die Datensätze und die Methodik identisch sind.

Oder lese ich vielleicht die Bäumchen ganz falsch?

Bisher bin ich davon ausgegangen, dass in erster Linie die Pfade und die gemeinsamen Knoten wichtig sind. Die Einrückung, also die Position in horizontaler Richtung, hatte ich als genetische Abweichung zu jenen hypothetischen Vorläufer am Knotenpunkt gedeutet.

Die vertikale Position, also sowohl welcher Ast jeweils oben und unten ist als auch wie weit diese in vertikaler Richtung vom Knotenpunkt entfernt sind, halte ich dagegen für unbedeutend.

Die Daten habe ich angefügt, falls es jemand gelüsten sollte, das Vorgehen nachzuvollziehen.

**Beorn** · 5. März 2017

Hallo, Craterelle!

Ja, Tylopilus hat in dem Bäumchen eigentlich nichts verloren.
Der ist weder mit Boletus s.str. noch mit Xerocomus s.l. näher verwand (rosa Sporenpulver!).
Müsste man mal gucken, was das für eine Sequenz ist und wo die her kommt. Kann natürlich eine Fehlbestimmung sein. Gibts eine morphologische Doku zu der Sequenz? Weil wenn nein und wenn es nmicht zufällig die Typus - Sequenz ist, dann wäre das so ein Fall für eine zu löschende Sequenz.
Aber was du mal machen kannst: Die Sequenz vom Typus raussuchen und vergleichen. Wenn die identisch wäre, kann das zwei Dinge bedeuten: Die Sequenz ist fehlerhaft oder auch hier kann man den Verwandschaftsgrad nicht aus der ITS - Sequenz ableiten.

Ählniches gilt auch für den Strobilomyces im Bäumchen. OK, der verzweigt sich relativ weit "unten". Aber ob weit genug für eine Gattung mit dick grobnetzig ornamentierten Sporen und völlig abweichenden Makromorphologischen Parametern?

LG; Pablo.

**Craterelle** · 5. März 2017

Moin Pablo,

danke für deine Antwort.

Ich werde die Sequenzen auf jeden Fall kritisch prüfen. Mir fehlt definitiv auch noch einige Erfahrung im Umgang mit den Gendatenbanken.

Das ist allerdings haarscharf neben dem Punkt, an dem ich gerade herumknabbere:

Nämlich das 3 Sequenzen (B. edulis, T. felleus, X. chrysenteron - egal ob korrekt oder nicht, man könnte sie auch als Probe1, Probe2 und Probe3 anonymisieren) in unterschiedliche verwandtschaftliche Beziehung zueinander gesetzt werden abhängig davon, welche andere Sequenzen ich zusätzlich noch betrachte.

Das ist etwas, was ich so nicht erwartet hätte.

LG & gute Nacht,
Craterelle

**Craterelle** · 6. März 2017

Arrgh, das Ganze wird immer wirrer.

Also, die Tylopilus-Sequenz stammt aus der Sequenz UDB000680. Identisch ist sie außerdem noch in den Datensätzen mit folgenden Kennungen vorhanden:

FR877523(1)
HM146887
**KM576327
**UDB027183
HM146886(5)

Die sind alle nur auf Gattungsebene bestimmt, stammen aber allesamt aus Europa, so dass T. felleus naheliegend erscheint.

Dann habe ich die Sequenz auf die Weise bearbeitet, wie ich es auch mit denen vorher gemacht habe: Aus der "Species Hypothesis" alle Sequenzen herangezogen, die als dieselbe Art bezeichnet wurden, und aus diesen nach der "Mehrheitsmeinung" eine Art hypothetische normalisierte Sequenz gebildet. Diese weicht hier aber nur in einer einziger Base von der ab, mit der die Bäumchen erstellt wurde, sie ist am Ende um einen Buchstaben kürzer.

Das "kleine" Boletus-Xerocomus-Tylopilus-Bäumchen bleibt weitgehend stehen, zumindest bleiben die Positionen und die Entfernungen zueinander erhalten. Nur in der Einrückung gibt es kleinere Abweichungen, allerdings nicht bei Tylopilus, sondern am deutlichen bei X. badia und B. luridus.

Aber der "große" Boletales-Baum sieht jetzt komplett anders aus. Dass der so instabil ist, erschreckt mich. Das alles wegen einer einzigen Base Unterschied?

Meine vorsichtige Hypothese ist, dass die Vorgehensweise für stärker voneinander abweichende Sequenzen nicht geeignet ist.

Ob Tylopilus nun so stehen bleiben darf wie im "kleinen" Baum oder ob die Sequenzen doch falsch sind, vermag ich nicht zu beurteilen.