Genomische Anpassung des Pikoeukaryoten Pelagomonas calceolata an Eisen

Blog

HeimHeim / Blog / Genomische Anpassung des Pikoeukaryoten Pelagomonas calceolata an Eisen

Jun 03, 2023

Genomische Anpassung des Pikoeukaryoten Pelagomonas calceolata an Eisen

Communications Biology Band 5, Artikelnummer: 983 (2022) Diesen Artikel zitieren 2102 Zugriffe 4 Zitate 20 Details zu altmetrischen Metriken Die kleinsten Phytoplanktonarten sind Schlüsselakteure in Ozeanen

Communications Biology Band 5, Artikelnummer: 983 (2022) Diesen Artikel zitieren

2102 Zugriffe

4 Zitate

20 Altmetrisch

Details zu den Metriken

Die kleinsten Phytoplanktonarten sind Schlüsselakteure im biogeochemischen Kreislauf der Ozeane und ihr Vorkommen und ihre Verbreitung werden durch globale Umweltveränderungen beeinflusst. Zu den Algen der Pelagophyceae-Klasse gehören Küstenarten, die schädliche Algenblüten verursachen, während andere kosmopolitisch und häufig vorkommen. Das Fehlen einer genomischen Referenz in dieser Abstammungslinie ist eine wesentliche Einschränkung bei der Untersuchung ihrer ökologischen Bedeutung. Hier analysierten wir die relative Häufigkeit, die ökologische Nische und das Anpassungspotenzial von Pelagomonas calceolata in allen Ozeanen anhand einer vollständigen assemblierten Genomsequenz im Chromosomenmaßstab. Unsere Ergebnisse zeigen, dass P. calceolata eine der am häufigsten vorkommenden eukaryotischen Arten in den Ozeanen ist, deren relative Häufigkeit durch hohe Temperaturen, wenig Licht und eisenarme Bedingungen begünstigt wird. Prognosen zum Klimawandel, die auf der relativen Häufigkeit basieren, deuten auf eine Ausweitung des Lebensraums von P. calceolata in Richtung der Pole am Ende dieses Jahrhunderts hin. Schließlich beobachteten wir ein spezifisches Genrepertoire und Variationen im Expressionsniveau, die möglicherweise den ökologischen Erfolg in Umgebungen mit niedrigem Eisen- und Nitratgehalt erklären. Zusammengenommen verdeutlichen diese Ergebnisse die ökologische Bedeutung von P. calceolata und legen den Grundstein für eine globale Analyse der Anpassungs- und Akklimatisierungsstrategien dieses kleinen Phytoplanktons in einer sich verändernden Umwelt.

Marines Phytoplankton macht mehr als 45 % der photosynthetischen Primärproduktion auf der Erde aus und spielt eine wesentliche Rolle bei der Versorgung mariner Nahrungsnetze mit organischem Material1. Sie sind weltweit wichtige Akteure bei der CO2-Aufnahme und versorgen die Atmosphäre mit gasförmigem Sauerstoff. Im vergangenen Jahrhundert wurde über einen weltweiten Rückgang der Phytoplankton-Biomasse berichtet (1 % der Chlorophyll-a-Konzentration pro Jahr), was in vielen ozeanischen Regionen zu einem Rückgang der Nettoprimärproduktion führte2. Dieser Rückgang ist wahrscheinlich eine Folge der globalen Erwärmung der Ozeane, die die Schichtung der Wassersäule vorantreibt und die Nährstoffversorgung der Oberflächengewässer verringert. Temperaturbedingte Verringerungen der Phytoplanktonproduktivität in tropischen und gemäßigten Regionen haben wahrscheinlich kaskadierende Auswirkungen auf höhere trophische Ebenen und die Ökosystemfunktion3.

Photosynthetische Pikoeukaryoten (PPEs), definiert durch einen Zelldurchmesser <3 µm, gehören zu verschiedenen Phyla, darunter Chlorophyta, Cryptophyta, Haptophyta und Stramenopiles4. PSA kommen in allen Ozeanen vor und sind die dominierenden Primärproduzenten in warmen und oligotrophen Regionen5. Die Erwärmung der Ozeane und die Ausbreitung oligotropher Regionen in den nächsten Jahrzehnten könnten die ökologische Nische von PSA erweitern, und es wird eine globale Verlagerung von großen photosynthetischen Organismen hin zu kleineren Primärproduzenten erwartet3,6. Beispielsweise wurde das Schmelzen des Meereises im kanadischen Arktisbecken mit einer Zunahme der Häufigkeit von PSA wie Micromonas auf Kosten größerer Algen in Verbindung gebracht7. Im Labor ist diese Alge in der Lage, ihre optimale Wachstumstemperatur in nur wenigen hundert Generationen zu ändern, was darauf hindeutet, dass sie von der globalen Erwärmung weniger betroffen sein wird als viele größere Organismen8. Darüber hinaus ist das größere Zelloberflächen-zu-Volumen-Verhältnis von PPEs im Vergleich zu größeren Phytoplanktonzellen vorteilhaft für die Ressourcenbeschaffung und das Wachstum in nährstoffarmen Umgebungen9,10.

Eisen ist eine Schlüsselverbindung, die für die Aktivität der Atmungskette, die Photosynthese und die Stickstofffixierung benötigt wird10. Da bioverfügbares Eisen in mehr als einem Drittel der Meeresoberfläche extrem gering ist, hat das kleine Phytoplankton mehrere Strategien entwickelt, um die Eisenaufnahme zu optimieren und den Eisenbedarf zu senken11. In Kieselalgen sind an reduktiven und nicht-reduktiven Eisenaufnahmemechanismen viele Proteine ​​beteiligt, darunter Phytotransferrine, Transmembran-Eisenreduktasen, Eisenpermeate und Siderophor-bindende Proteine12. Der Eisenbedarf kann durch die Variation der Genexpressionsniveaus zwischen eisenbenötigten Proteinen und ihrem eisenfreien Äquivalent moduliert werden. Zu diesen Proteinschaltern gehören Elektronentransfer (Flavodoxin/Ferredoxin), Gluconeogenese (Fructose-Bisphosphat-Aldolase Typ I oder Typ II) und Superoxiddismutasen (Mn/Fe-SOD, Cu/Zn-SOD oder Ni-SOD)13,14,15.

Das PSA-Wachstum wird auch durch die Verfügbarkeit von Stickstoff (N) in großen Teilen der Weltmeere begrenzt16. Ammonium (NH4+), Nitrat (NO3−) und Nitrit (NO2−) sind die Hauptquellen für anorganischen N für PSA. Mehrere Studien haben jedoch gezeigt, dass gelöster organischer N, wie Harnstoff, in N-limitierten Umgebungen metabolisiert werden kann17. Beispielsweise werden mehrere membranlokalisierte Harnstofftransporter in der Kieselalge Phaeodactylum tricornutum unter stickstofflimitierten Bedingungen maximal exprimiert18 und die schädlichen Algenblüten der Pelagophyceae Aureococcus anophagefferens können durch Harnstoff angeheizt werden19.

Trotz ihrer großen taxonomischen Verbreitung beschränken sich die meisten molekularen Studien zur ökologischen Rolle von PSA und ihrer Anpassung an die Umwelt auf einige wenige Arten. Es wird vermutet, dass PPEs über hochentwickelte Akklimatisierungs-/Anpassungskapazitäten verfügen, die zugrunde liegenden molekularen Mechanismen sind jedoch aufgrund fehlender genomischer Referenzdaten noch unzureichend charakterisiert.

Unter den PPEs war Pelagomonas calceolata das erste beschriebene Mitglied der Pelagophyceae-Klasse20. Seitdem wurde es in vielen ozeanischen Regionen anhand seiner 18 S-rRNA-Sequenz und seines Chloroplastengenoms identifiziert21,22,23. Mehrere Studien haben die Fähigkeit von P. calceolata gezeigt, sich an unterschiedliche Umweltbedingungen anzupassen. Im Labor wurde gezeigt, dass P. calceolata ein hohes Maß an Akklimatisierung an Lichtschwankungen mit schneller Aktivierung des lichtschützenden Xanthophyllzyklus und nicht-photochemischer Löschung zeigt24. Im Marquesas-Archipel ist P. calceolata eine der am stärksten auf Eisendüngung reagierenden Arten mit einer Hochregulierung von Genen, die an der Photosynthese, Aminosäuresynthese und Stickstoffassimilation beteiligt sind13. Eine globale Analyse der Pelagophyten-Gene ergab, dass sie an eisenarme Bedingungen angepasst sind14. Im subtropischen Pazifik exprimiert P. calceolata Stressgene in Oberflächenproben und Gene, die an der Stickstoffassimilation beteiligt sind, werden im Tiefchlorophyllmaximum überexprimiert25. Eine Laborstudie legt nahe, dass P. calceolata auch die Fähigkeit besitzt, die Transkriptionsniveaus von Spaltungsenzymen für organisch-stickstoffhaltige Verbindungen (Cathepsin, Urease, Arginase) bei niedriger Stickstoffkonzentration zu erhöhen26. Somit scheint die Genexpression je nach Stickstoffquelle und -menge kontrolliert zu werden. Zusammengenommen könnte diese offensichtliche adaptive Plastizität das Vorkommen von P. calceolata in vielen verschiedenen ozeanischen Umgebungen erklären. Eine umfassende Analyse der genetischen Kapazität dieser Art und die In-situ-Charakterisierung ihrer ökologischen Nische fehlen jedoch.

Hier haben wir das Genom von Pelagomonas calceolata mit einer Kombination aus langen und kurzen Lesevorgängen sequenziert, zusammengestellt und kommentiert. Wir untersuchten seine Genomstruktur und seinen Gengehalt im Vergleich zu anderem einzelligem Phytoplankton. Wir haben dieses Genom verwendet, um P. calceolata in Umweltdatensätzen von Tara-Expeditionen über alle Ozeane nachzuweisen, seine ökologische Nische zu charakterisieren und die Umweltbedingungen zu identifizieren, die seine relative Häufigkeit steuern. Schließlich wurden die Umweltexpressionsniveaus von Genen untersucht, die an Stickstoffverbindungen sowie der Eisenaufnahme und dem Eisenstoffwechsel beteiligt sind.

Um die Häufigkeit von P. calceolata in den Ozeanen zu messen und seine genetische Fähigkeit zu untersuchen, unter verschiedenen Umweltbedingungen zu wachsen, haben wir das Genom von P. calceolata RCC100 mithilfe von Long Reads von Oxford Nanopore Technologies (ONT) und Short Reads von Illumina sequenziert und zusammengesetzt. Unter Verwendung der k-mer-Verteilung kurzer Lesevorgänge wurde geschätzt, dass das Genom mit einer Größe von 31 MB homozygot ist (ergänzende Abbildung S1a). Die ONT-Long-Reads wurden mit Flye in sechs Kern-Contigs für insgesamt 32, 4 MB, 1 plastidären zirkulären Contig (90 Kb) und 1 mitochondrialen zirkulären Contig (39 Kb) zusammengesetzt (Abb. 1, ergänzende Abb. S1b, c und ergänzende). Daten 1). Zwei große und sehr ähnliche duplizierte Regionen (> 99 % der Identität) wurden am Ende von Contig 1 und 5 (393 Kb) und an den Enden von Contig 3 und 6 (192 Kb) entdeckt; Ergänzende Anmerkung 1 und ergänzende Abbildung S1d) . An beiden Enden der Contigs 2, 3, 4 und 6 wurden (TTAGGG) n-Telomerwiederholungen nachgewiesen, was darauf hinweist, dass diese vier Contigs vollständige Chromosomen darstellen (ergänzende Abbildung S1d). Für Contig 1 und Contig 5 wurden Telomersequenzen nur an einem Ende identifiziert, das andere Ende endete in der duplizierten Region. Wir verwendeten die Hi-C-Langstreckentechnologie, um den Aufbau der Genomsequenz von P. calceolata zu validieren. Die Interaktionskarte ergab eine hohe Anzahl von Kontakten innerhalb von Contigs und sehr wenige zwischen Contigs (Ergänzende Abbildung S2 und Ergänzende Anmerkung 2). Es wurden keine Chimären oder Fragmentierungen festgestellt. Dieses Ergebnis bestätigt, dass die sechs Contigs sechs Chromosomen von P. calceolata entsprechen.

Darstellung der 6 Kernkontigs von P. calceolata. Die obere Schicht gibt die Anzahl der Gene pro 100 Kb an (schwarze Balken), die mittlere Schicht stellt den GC-Gehalt in Prozent über ein Fenster von 200 Kb dar und die untere Schicht zeigt die Position von DNA-Wiederholungen mit mehr als 500 Basen, die sich mindestens fünf Mal wiederholen mal über das gesamte Genom. Rote, orange und gelbe Balken zeigen drei verschiedene Wiederholungen in Regionen mit niedrigem GC an, die in mindestens drei verschiedenen Contigs vorhanden sind. Gestrichelte rote und blaue Rechtecke sind duplizierte chromosomale Regionen.

Insgesamt wurden 16.667 Gene im Genom von P. calceolata vorhergesagt (siehe „Methoden“), was für eine PPE eine hohe Zahl darstellt (Tabelle 1 und ergänzende Daten 2). Es gab durchschnittlich 0,45 Introns pro Gen, und die Verteilung ihrer Längen zeigt einen Peak bei etwa 210 bp, was der charakteristischen Länge der Introner-Elemente entspricht, die in A. anophagefferens27 beschrieben werden (Ergänzende Abbildung S3, Ergänzende Daten 3 und Ergänzende Anmerkung). 3). Insgesamt sind 9812 von P. calceolata vorhergesagte Proteine ​​(58%) mit mindestens einem Gen in einem Stramenopile-Genom homolog, darunter 2631 (16%), die nur mit dem Pelagophyten A. anophagefferens geteilt werden (ergänzende Abbildung S4). Eine konservierte funktionelle Domäne (Pfam, KO oder InterProScan) wurde in 11.240 Proteinen (67 %) gefunden. Auch wenn Schätzungen der Genvollständigkeit für Arten, die von Modellorganismen entfernt sind, ungenau sind, erreichten wir mit BUSCO28 eine Vollständigkeit von 94,0 % (88 % Einzelkopie- und 6 % duplizierte Gene), was zeigt, dass unser Genom nahezu vollständig ist (Supplementary Data 4).

Ein bemerkenswertes Merkmal im Genom von P. calceolata ist die Verteilung des GC-Gehalts entlang der Chromosomen von P. calceolata (Abb. 1). Während der durchschnittliche GC-Gehalt des Kerngenoms 63 % beträgt, weist eine große Region in jedem Contig (259 Kb im Durchschnitt) 52 % GC auf. Diese einzigartigen großen Täler im GC-Gehalt in jedem Chromosom legen nahe, dass diese Regionen Zentromere umfassen. Das Hi-C-Ergebnis bestätigt Zentromerpositionen mit dem Vorhandensein von Kontakten zwischen Regionen mit niedrigem GC-Gehalt über Chromosomen hinweg, was auf die physische Nähe dieser Regionen im Zellkern schließen lässt (ergänzende Abbildung S2). Interessanterweise beobachteten wir in diesen Regionen mit niedrigem GC keine Anhäufung wiederholter Elemente oder Transposons und nur eine leichte Abnahme der Gendichte. Die genomischen Spezifitäten und der Gengehalt von Regionen mit niedrigem GC-Gehalt sind in den Ergänzenden Daten 5, S6 und der Ergänzenden Anmerkung 4 detailliert beschrieben. Muster mit niedrigem GC in Zentromeren könnten durch die Hemmung der Rekombination erklärt werden, was darauf hindeutet, dass P. calceolata zur Meiose fähig ist Rekombination. Unter 23 Meiose-spezifischen Genen, die in anderen Arten 31, 32, 33 charakterisiert wurden, sind 18 Homologe im Genom von P. calceolata vorhanden (Supplementary Data 7). Zu diesen Genen gehören der Initiator des Doppelstrang-DNA-Bruchs (DSB) SPO11; RAD50, RAD52 und MRE11 zur Bindung von DSBs; HOP2, MND1, DMC1 und RAD51, um die Paarung sicherzustellen und in den homologen Strang einzudringen; MSH2-, MSH3-, PMS1- und MSH6-Gene, die am syntheseabhängigen Strang-Annealing-Weg beteiligt sind, und MUS81, das für den nicht störenden (Klasse II) Crossover erforderlich ist. Die fünf fehlenden Gene fehlen in vielen zur Meiose fähigen Organismen, was darauf hindeutet, dass sie für die Durchführung einer genetischen Rekombination nicht erforderlich sind (Ergänzende Anmerkung 5). Zusammengenommen deuten die genomische Struktur und der genetische Inhalt von P. calceolata stark darauf hin, dass diese Art eine Meiose durchführt.

Um die relative Häufigkeit von P. calceolata in allen Ozeanen abzuschätzen, verwendeten wir zunächst die Häufigkeit der V9-Region der 18 S-rRNA, die aus allen Proben der Tara Oceans-Expedition sequenziert wurde. Die am häufigsten vorkommende operative taxonomische Einheit (OTU) von P. calceolata in der Größenfraktion 0,8–5 µm beträgt durchschnittlich 0,80 % für die 104 Oberflächenproben und 1,23 % für die 61 Proben mit tiefem Chlorophyllmaximum (DCM) (Ergänzungsdaten 8). Gemäß dieser Abundanzschätzungsmethode ist P. calceolata nach zwei mit Ankistrodinium verbundenen Dinophyceae-OTUs und einer unbekannten Gymnodiniaceae die dritthäufigste Eukaryoten-OTU der Größenfraktion 0,8–5 µm.

Um die Häufigkeit von P. calceolata unabhängig von PCRs und der 18 S rRNA-Kopienzahl-Verzerrung abzuschätzen, verwendeten wir die Kartierung metagenomischer Lesevorgänge im Genom von P. calceolata. Für die Größenfraktion 0,8–5 µm beträgt der Prozentsatz der auf dem Genom ausgerichteten sequenzierten Lesevorgänge 1,39 % (n = 93, sd = 1,5) in Oberflächenproben und 2,67 % (n = 55, sd = 1,6) in DCM-Proben. In der Größenfraktion 0,8–2000 µm macht P. calceolata 1,01 % (n = 80, sd = 1,2) aller Messwerte in Oberflächenproben und 1,56 % (n = 39, sd = 1,3) in DCM-Proben aus. Im Nordindischen Ozean (Station TARA_38) am DCM wurde eine maximale relative Häufigkeit von 6,7 % in der Größenfraktion 0,8 – 5 µm beobachtet (Abb. 2a). Im Indischen Ozean, im Roten Meer und im Mittelmeer kommt P. calceolata im DCM deutlich häufiger vor als an der Oberfläche (Abb. 2b). In kalten Gewässern (unter 10 °C) wird P. calceolata oberhalb unseres Schwellenwerts von 25 % der horizontalen genomischen Abdeckung nicht nachgewiesen. Es werden erhebliche Unterschiede zwischen und innerhalb jedes Ozeanbeckens beobachtet, was darauf hindeutet, dass viele biotische oder abiotische Faktoren die Häufigkeit von P. calceolata beeinflussen.

Eine Weltkarte der relativen Häufigkeit metagenomischer P. calceolata-Lesungen. Der Farbcode gibt den Prozentsatz der sequenzierten Lesevorgänge an, die auf dem Genom ausgerichtet sind. Dargestellt sind die DCM-Proben der Größenfraktionen 0,8–5 µm (Kreise) bzw. 0,8–2000 µm (Dreiecke). P. calceolata gilt als nicht vorhanden, wenn die horizontale Abdeckung weniger als 25 % des Genoms beträgt (graue Punkte). b Boxplot der relativen Häufigkeit in jeder ozeanischen Region in Oberflächen- und DCM-Proben. Rote Sterne zeigen einen signifikanten Unterschied zwischen SUR- und DCM-Proben an (Wilcoxon-Test, P-Wert <0,01).

Abschließend haben wir die beiden Methoden zur Häufigkeitsschätzung verglichen (ergänzende Abbildung S5). Die auf Metagenomen basierende relative Häufigkeit korreliert stark mit der auf Metabarcoding basierenden relativen Häufigkeit (Pearson-Korrelationen von 0,91 und 0,70 für die Größenfraktionen 0,8–2000 bzw. 0,8–5 µm). Allerdings ist die auf Metabarcoding basierende Häufigkeit in der Größenfraktion von 0,8–5 µm im Durchschnitt um 2,3 niedriger und in der Größenfraktion von 0,8–2000 um 3,1 geringer als die auf Metabarcodierung basierende Häufigkeit (ergänzende Abbildung S5).

Um Faktoren zu identifizieren, die die Häufigkeit von P. calceolata in den Ozeanen steuern, verwendeten wir physikalisch-chemische Parameter, die für jede ozeanische Station verfügbar waren (siehe „Methoden“). Die Hauptkomponentenanalyse ergab einen positiven Zusammenhang zwischen der metagenomischen P. calceolata-Häufigkeit, der Temperatur und der Küstenentfernung sowie einen negativen Zusammenhang mit der Eisenkonzentration (Abb. 3a, b). Dieses Ergebnis stimmte über die beiden Größenfraktionen mit P. calceolata-Zellen überein (Größenfraktionen von 0,8–5 µm und 0,8–2000 µm; ergänzende Abbildung S6). Trotz der zahlreichen Faktoren, die möglicherweise die Häufigkeit von P. calceolata beeinflussen, beobachteten wir eine schwache, aber signifikante positive Korrelation nach Pearson mit der Temperatur, eine negative Korrelation mit der photosynthetisch aktiven Strahlung (PAR, Mittelwert über 30 Tage) und eine negative Korrelation mit den Eisenkonzentrationen (Tabelle 2). . In der Größenfraktion 0,8–5 µm ist die relative Häufigkeit von P. calceolata in eisenarmen Umgebungen (<0,2 nmol/l, 54 Proben) mit durchschnittlich 2,3 % der metagenomischen Messwerte höher als in eisenreichen Umgebungen (>0,2). nmol/l, 88 Proben) mit durchschnittlich 1,7 % metagenomischer Messwerte (Wilcoxon-Test, P-Wert = 0,02). In der Größenfraktion 0,8–2000 µm beobachten wir die gleiche Tendenz mit einer relativen Häufigkeit von durchschnittlich 1,9 % der metagenomischen Messwerte in eisenarmen Gewässern (49 Proben) und einer geringeren relativen Häufigkeit von durchschnittlich 0,78 % der metagenomischen Messwerte in Gewässern mit hohem Eisengehalt -Eisenumgebungen (59 Proben) (Wilcoxon-Test, P-Wert = 9,6e−7). Darüber hinaus korreliert die relative Häufigkeit von P. calceolata schwach mit der 9'-Butanoyloxyfucoxanthin-Konzentration, einem charakteristischen Pigment für Pelagophyten (Pearson 0,22, P-Wert = 0,02 und Pearson 0,41, P-Wert = 4,82e−05 in den Bereichen 0,8–5 µm und 0,8). –2000 µm Größenfraktion). Wir verwendeten ein allgemeines additives Modell, um den Beitrag von Temperatur, PAR und Eisenkonzentration zur relativen Häufigkeit von P. calceolata abzuschätzen (Tabelle 2). Die drei Faktoren erklären 32,3 % der Variationen der P. calceolata-Häufigkeit in der Größenfraktion 0,8–5 µm und 56,8 % in der Größenfraktion 0,8–2000 µm.

a Hauptkomponentenanalyse der metagenomischen relativen Häufigkeit von P. calceolata in der Größenfraktion 0,8–5 µm. Die durch die einzelnen Achsen erklärten Prozentsätze der Varianz sind in den Achsentiteln angegeben. Oberes Feld: Jeder Punkt stellt eine Probe dar, deren Größe proportional zur relativen Häufigkeit von P. calceolata ist, und die Farben zeigen die ozeanischen Becken an. Unteres Feld: Neun Umweltparameter werden als Vektoren neben der relativen Häufigkeit von P. calceolata (blauer Vektor) dargestellt. b Blasendiagramm der relativen Häufigkeit von P. calceolata für die Größenfraktion 0,8–5 µm gemäß den neun Umweltparametern. c Delta der modellierten relativen Häufigkeit von P. calceolata zwischen 2010 und 2099. Grüne Bereiche entsprechen einer Abnahme, während violette Bereiche einer Zunahme der relativen Häufigkeit von P. calceolata entsprechen. Kleine Sterne zeigen Orte an, an denen mindestens einer der Prädiktortreiber außerhalb des Bereichs im Vergleich zu den Werten des Trainingsdatensatzes liegt.

Schließlich prognostizierten wir die relative Häufigkeit von P. calceolata am Ende des Jahrhunderts nach Frémont et al. Methodik35. Wir haben die ökologische Nische von P. calceolata mithilfe der Datensätze des Weltozeanatlas (WOA18) zum Zeitpunkt und am Ort der Probenahme oder mithilfe der prognostizierten Klimatologie im Jahr 2099 mithilfe des RPC8.5-Szenarios modelliert (siehe „Methoden“). Wir verwendeten vier Techniken des maschinellen Lernens: Generalized Additive Models (GAM), Neural Networks (nn), Random Forest (rf) und Gradient Boosted Trees (bt) und bewerteten ihre Leistung mit zwei Parametern. Der Pearson-Korrelationskoeffizient gibt die Korrelation zwischen dem Modell und In-situ-Messungen der Häufigkeit von P. calceolata an. Die vier Tools für maschinelles Lernen weisen basierend auf Pearsons Korrelationen ähnliche Leistungen auf (nn = 0,676; gam = 0,621; bt = 0,683; rf = 0,694). Der zweite Parameter ist der mittlere quadratische Fehler (rmse) und spiegelt die Größe der Fehler in den Modellen wider (die Anzahl der Standardabweichungen vom Mittelwert). Unter Verwendung dieser Metrik ist der GAM-Ansatz weniger gut (rmse = 1,04) als die drei anderen Tools (nn = 0,964; bt = 0,952; rf = 0,941). Diese Ergebnisse deuten darauf hin, dass wir über genügend In-situ-Daten verfügen, um die globalen Trends zur relativen Häufigkeit von P. calceolata zu erfassen, diese Modelle könnten jedoch hinsichtlich der Amplitude der Häufigkeitsschwankungen ungenau sein. Darüber hinaus sind die Vorhersagen in den tropischen Gewässern unsicher, da diese Umgebung im Jahr 2099 außerhalb des Bereichs des Trainingsdatensatzes liegt. Da die Leistungen der vier Modelle ähnlich sind, haben wir sie kombiniert, um die genaueste Projektion zu erhalten (Abb. 3c und ergänzende Abb. S7). Trotz dieser Einschränkungen prognostizierten wir einen Anstieg der relativen Häufigkeit von P. calceolata um bis zu 1,12 % vom 40. Breitengrad bis zum 50. Breitengrad auf der Nord- und Südhalbkugel und einen Rückgang in gemäßigten und tropischen Gewässern (maximal −0,8 %).

Eisen ist ein kritisches Metall für alle photosynthetischen Organismen, das für die Photosynthese, den Stickstoffkreislauf und den Schutz vor reaktiven Sauerstoffspezies benötigt wird. Da P. calceolata in eisenarmen Gewässern zu gedeihen scheint, identifizierten wir P. calceolata-Gene, die für die Eisenaufnahme und -speicherung kodieren, und verglichen dann ihre Expressionsniveaus bei niedrigem (<0,2 nmol/l) und hohem (>0,2 nmol/l) Eisen Bedingungen mithilfe von Metatranskriptomen von Tara Oceans. P. calceolata verfügt über fünf Gene, die das Phytotransferrin ISIP2A kodieren, das an der Fe3+-Aufnahme über endosomale Vesikel beteiligt ist, und zwei mutmaßliche Eisenspeicherproteine ​​ISIP3. In eisenarmen Umgebungen werden drei ISIP2A und ein ISIP3 überexprimiert (Abb. 4a und ergänzende Daten 9). Dieses Ergebnis weist darauf hin, dass ISIP ähnlich wie bei Kieselalgen nach Eisenmangel bei P. calceolata hochreguliert wird und möglicherweise das Zellwachstum in eisenarmen Umgebungen verbessert. Drei Gene kodieren für den Eisentransporter Ferroportin, werden jedoch je nach Umgebung nicht unterschiedlich exprimiert (ergänzende Abbildung S8a). Diese Proteine ​​sind Eisenexporteure in mehrzelligen Organismen, ihre Funktion in Mikroalgen muss jedoch noch untersucht werden36. Schließlich identifizierten wir acht Zink/Eisen-Permeasen, die möglicherweise an der Eisenaufnahme aus der Umwelt im Genom von P. calceolata beteiligt sind. Davon sind zwei in Umgebungen mit hohem Eisengehalt und eines in Umgebungen mit niedrigem Eisengehalt überexprimiert. Interessanterweise stellen wir das Fehlen der Eisenpermease FTR1, des Eisenspeichers Ferritin und des Hunger-induzierten Proteins ISIP1 (beteiligt an der Endozytose von Siderophoren in Kieselalgen) fest. Im Vergleich zu P. calceolata haben die Küstenpelagophyceae A. anophagefferens kein ISIP3-Gen und eine geringere Anzahl an Zink-Eisen-Permeasen.

a Relative Genexpressionsniveaus normalisiert im Transkript pro Million (TPM) von fünf Phytotransferrinen (ISIP2A) und zwei mutmaßlichen Eisenspeichern (ISIP3) in ozeanischen Stationen mit niedrigem Eisengehalt (<0,2 nM) und hohem Eisengehalt (>0,2 nM). Für jedes Gen sind die P-Werte der statistischen Wilcoxon-Tests zwischen Bedingungen mit niedrigem und hohem Eisengehalt angegeben. Signifikante P-Werte (<0,01) sind fett gedruckt. b Relative Expressionsniveaus (TPM) von Genen, die für Ferredoxin (orange) und sein Nichteisenäquivalent Flavodoxin (lila) in jeder Probe von Tara Oceans kodieren. Die Proben werden von eisenarmen (links) zu eisenreichen (rechts) Bedingungen sortiert. Eisenkonzentrationen werden in nM auf dem farbigen horizontalen Balken angezeigt. c Dieselbe Darstellung für Gene, die für Fructose-Bisphosphat-Aldolase II (orange) und ihr Nichteisenäquivalent Fructose-Bisphosphat-Aldolase I (lila) kodieren.

Mehrere wichtige Eisenproteine ​​können in eisenarmen Umgebungen durch Nichteisenäquivalente ersetzt werden14. Im P. calceolata-Genom identifizierten wir 11 Flavodoxin-Gene, die am Elektronentransfer während der Photosynthese beteiligt sind und möglicherweise Ferredoxine ersetzen (17 Gene; Ergänzende Daten 9). Diese Anzahl an Genen ist im Vergleich zu anderen Algen, einschließlich A. anophagefferens (5 Flavodoxine und 9 Ferredoxine), wichtig. Die Expressionsniveaus dieser Gene in den Ozeanen zeigten eine Überexpression von Flavodoxin-Genen in Umgebungen mit niedrigem Eisengehalt, die in Umgebungen mit hohem Eisengehalt durch Ferredoxine ersetzt wurden (Abb. 4b). Die Fruktose-Bisphosphat-Aldolase (FBA), die für die Gluconeogenese und den Calvin-Zyklus notwendig ist, wird in P. calceolata von sechs Genen kodiert. Zwei Gene sind von einem zweiwertigen Kation abhängig (FBA Typ II), die vier anderen sind Zink/Eisen-unabhängig (FBA Typ I). FBA Typ I ist unter Bedingungen mit hohem Eisengehalt überexprimiert und unter Bedingungen mit niedrigem Eisengehalt quasi nicht vorhanden (Abb. 4c). Schließlich kommen alle Arten von Superoxiddismutasen (SOD) im Genom von P. calceolata vor. Nichteisen-SODs (Cu/Zn und Ni), die von drei Genen kodiert werden, und Mn/Fe-SOD, die von zwei Genen kodiert werden, werden je nach Eisenkonzentration nicht unterschiedlich exprimiert (ergänzende Abbildung S8b). Der Geninhalt und die transkriptomische Flexibilität lassen auf wichtige Kapazitäten für das Wachstum von P. calceolata in eisenarmen Umgebungen schließen.

Da P. calceolata ein wichtiger Akteur im Stickstoffkreislauf (N) in ozeanischen Ökosystemen sein könnte, untersuchten wir seinen Geninhalt und analysierten die Expressionsniveaus von Genen, die am Stickstoffstoffwechsel in der Umwelt beteiligt sind, mithilfe von Metatranskriptomen von Tara Oceans (Abb. 5 und ergänzende Daten). 9). Die Aufnahme stickstoffhaltiger anorganischer Verbindungen wird durch 11 Gene in P. calceolata unterstützt. Drei Gene kodieren Nitrat-/Nitrittransporter, drei Gene kodieren Formiat-/Nitrittransporter und fünf Gene kodieren Ammoniumtransporter. Ein Formiat/Nitrit- und zwei Nitrat/Nitrit-Transportergene werden unter Bedingungen mit niedrigem Nitratgehalt deutlich überexprimiert (ergänzende Abbildung S9). Ein Ammoniumtransporter wird in Umgebungen mit niedrigem Ammoniumgehalt überexprimiert (ergänzende Abbildung S9). Wir identifizierten eine Nitratreduktase und zwei Nitritreduktasen im Genom von P. calceolata (Supplementary Data 9). Das Expressionsniveau ist in Umgebungen mit hohem Nitratgehalt für die Nitratreduktase und eine Nitritreduktase signifikant höher (ergänzende Abbildung S10). Aber die zweite Nitritreduktase wird unter Bedingungen mit hohem Nitratgehalt überraschenderweise weniger exprimiert. Die Anzahl der Enzyme, die Ammonium in organische Verbindungen einbauen (GS/GOGAT-Weg), ist bei P. calceolata höher als bei anderen Arten: Im Genom von P. calceolata sind fünf Gene für Glutaminsynthetase (GS) und vier Gene für Glutamatsynthase (GOGAT) vorhanden. Zwei GS-Gene werden in Proben mit hohem Nitratgehalt stärker exprimiert, und ein GOGAT-Gen wird in Proben mit niedrigem Nitratgehalt stärker exprimiert (ergänzende Abbildung S10).

a Schematische Darstellung des N-Transports und der N-Assimilation in P. calceolata anhand des Geninhalts. Der Farbcode zeigt an, ob die Anzahl der Genkopien für eine bestimmte Funktion im P. calceolata-Genom im Vergleich zum Mittelwert von acht Pico-Nano-Photosynthesevorgängen überrepräsentiert (grün), gleichmäßig vertreten (blau), unterrepräsentiert (orange) oder nicht vorhanden (rot) ist Eukaryoten. Die Anzahl der Genkopien für jede Funktion ist in den Zusatzdaten 9 angegeben. b Domänenorganisation von NIT-sensierenden Proteinen in P. calceolata. Orangefarbene Kästchen sind NIT-Sensordomänen (IPR13587), blaue Kästchen sind Serin-Threonin/Tyrosinkinase-Domänen (IPR20635) und gelbe Rechtecke sind Transmembrandomänen. c Relative Expressionsniveaus (TPM) von drei NIT-sensierenden Genen in Umgebungen mit niedrigem Nitratgehalt (<2 µM) und hohem Nitratgehalt (>2 µM). Für jedes Gen sind die P-Werte der Mann-Withney-Wilcoxon-Tests zwischen Proben mit niedrigem und hohem Nitratgehalt angegeben. Signifikante P-Werte (<0,01) sind fett gedruckt.

Wir identifizierten drei Gene, die die Nitrat- und Nitrit-Sensing-Domäne (NIT) (IPR013587) im Genom von P. calceolata tragen. Unter Verwendung nichtredundanter NCBI-Proteine ​​und mariner Genomdatenbanken (siehe „Methoden“) wurden 60 homologe Proteine ​​der NIT-Sensing-Domänen von P. calceolata identifiziert. Diese Homologen sind auf die Klasse Pelagophyceae (16 Transkriptome), die Klasse Dictyochophyceae (6 Transkriptome) und ein mutmaßliches Kryptophyten-Transkriptom beschränkt. Der phylogenetische Baum dieser Proteinfamilie zeigt drei Unterfamilien, die vor der Trennung von Dictyochophyceae und Pelagophyceae auseinandergehen (ergänzende Abbildung S11). Ein P. calceolata-Protein trägt eine NIT-Sensing-Domäne, die von zwei Transmembrandomänen umgeben ist, was auf eine Fähigkeit zur externen Nitrat-/Nitrit-Sensierung schließen lässt, während die beiden anderen NIT-Gene eine Proteinkinase-Domäne (IPR000719) tragen, was auf eine auf Phosphorylierung basierende Signaltransduktion in Abhängigkeit von intrazellulärem Nitrat hindeutet oder Nitritkonzentration (Abb. 5b). Um diese Möglichkeit zu untersuchen, haben wir die Expressionsniveaus von NIT-sensierenden Genen untersucht. Das potenzielle externe NIT-Sensing-Gen ist in nitratarmen Umgebungen tatsächlich deutlich überexprimiert. Im Gegensatz dazu ist in nitratreichen Umgebungen nur eines der intrazellulären NIT-Sensing-Gene hochreguliert (Abb. 5c). Dieses Ergebnis legt nahe, dass die NIT-sensierenden Gene eine wichtige Rolle bei der Anpassung an die Nitratkonzentrationen in der Umgebung spielen.

Schließlich haben wir Gene identifiziert, die am Stickstoffrecycling aus organischen Verbindungen beteiligt sind und bei mehreren Arten im Falle eines Mangels an anorganischem Stickstoff wichtig sind. Im Genom von P. calceolata wurden eine Arginase und eine Cyanatlyase nachgewiesen, jedoch kein für Formamidase kodierendes Gen. Darüber hinaus ist die Anzahl der Genkopien für Enzyme, die am Harnstoffzyklus beteiligt sind (Carbamoylphosphat-Synthetase, Ornithin-Carbamoyltransferase, Argininosuccinat-Synthase und Argininosuccinat-Lyase), gleich oder geringfügig niedriger als bei anderen Algen (Abb. 5a und ergänzende Daten 9). Von diesen Genen wird unter Bedingungen mit niedrigem Nitratgehalt nur die Cyanatlyase überexprimiert, was darauf hindeutet, dass Cyanat eine wichtige alternative Quelle für organischen Stickstoff für P. calceolata ist (ergänzende Abbildung S10).

Die wesentliche Rolle des Phytoplanktons in ozeanischen Ökosystemen wurde schon oft veranschaulicht. Zahlreiche Abstammungslinien sind jedoch noch wenig erforscht und Modellorganismen sind auf wenige Taxa (hauptsächlich Kieselalgen, Prasinophyten und Haptophyten) beschränkt, was das globale Verständnis der Phytoplanktonaktivität einschränkt. Das in dieser Studie zusammengestellte und kommentierte Genom von P. calceolata offenbart eine bisher unterschätzte hohe Häufigkeit von P. calceolata in den Ozeanen und bringt neue Einblicke in spezifische genomische Merkmale dieser Algenklasse im Zusammenhang mit ihrer Anpassung an bestimmte Umgebungen.

Wir haben in dieser Studie gezeigt, dass P. calceolata in ozeanischen Proben über 10 °C kosmopolitisch ist und eine relative Häufigkeit von im Allgemeinen >1 % aller sequenzierten Lesevorgänge aufweist. Im Gegensatz zu den Pelagophyceae A. anophagefferens an der Küste, die hohe Abundanzspitzen aufweisen können37, wurden keine P. calceolata-Blüten gemeldet, aber P. calceolata ist gut an eine Vielzahl von Umweltbedingungen angepasst, wie aus früheren Studien hervorgeht21,23. Obwohl die anhand von Metabarcoding- oder metagenomischen Daten berechnete Häufigkeit eines Organismus nur eine indirekte und relative Quantifizierung der Häufigkeit von Organismen liefert, deuten beide Methoden darauf hin, dass P. calceolata einer der am häufigsten vorkommenden Pico-Nano-Eukaryoten in Offshore-Daten ist. Die hohe relative Häufigkeit von P. calceolata, gemessen mit einem Metabarcoding-Ansatz, wurde kürzlich mit einer qPCR-Methode bestätigt (durchschnittlich 5.882 ± 2.855 rRNA-Genkopien ml−1 auf der Oberfläche des östlichen Nordpazifiks)21. Darüber hinaus haben wir gezeigt, dass der Metabarcoding-Ansatz aufgrund der geringen Kopienzahl von rRNAs in diesem Organismus wahrscheinlich die relative Häufigkeit von P. calceolata im Vergleich zur metagenomischen Analyse unterschätzt. Wir können jedoch nicht ausschließen, dass die große Genomgröße von P. calceolata im Vergleich zu Bakteriengenomen, die in der Größenfraktion von 0,8–5 µm vorhanden sind, ihre relative Häufigkeit in metagenomischen Datensätzen überschätzt. Weitere Studien könnten mikroskopische und Fließsortierungsansätze mit Genomdaten kombinieren, um die Anzahl der Zellen und die Biomasse dieses Organismus in den Ozeanen zu bestimmen. Unsere Modellanalyse hat einen wahrscheinlichen Anstieg der relativen Häufigkeit von P. calceolata am Ende des Jahrhunderts in hohen Breiten ergeben, wo die Meerwassertemperatur derzeit für diese Art zu niedrig ist. Dieses Ergebnis steht im Einklang mit früheren Studien, die auf eine globale Zunahme des Phytoplanktons in subpolaren Regionen hinweisen38,39.

Eisen ist für Wachstum, Photosynthese, Primärproduktion, Stickstofffixierung und -reduktion von PSA40 unerlässlich. Unsere Ergebnisse zeigen, dass P. calceolata in eisenarmen Gewässern gedeiht und somit eine große ökologische Nische für eine PSA besetzt. Es gibt zwei Hauptstrategien gegen Eisenmangel: die Optimierung der Eisenaufnahme und die Modulation des Eisenbedarfs. Gene, die für Eisenchelatoren und Ferritin kodieren, fehlen im Genom von P. calceolata, und Gene, die für passive Eisentransporter kodieren, sind im Vergleich zu anderen PPEs unter- oder gleich stark vertreten. Im Gegensatz dazu sind Phytotransferrine (ISIP2A), mutmaßliche Eisenspeicherproteine ​​(ISIP3) und Ferroportine im Genom von P. calceolata überrepräsentiert. Die Expressionsniveaus der ISIP-Gene korrelieren nicht mit der Eisenkonzentration in P. calceolata und zeigen eine Gewöhnung an Bedingungen mit niedrigem Eisengehalt. Da Phytotransferrine von Carbonationen abhängig sind, kann die Versauerung der Ozeane die Effizienz der Eisenaufnahme bei vielen Arten, einschließlich P. calceolata41,42, verringern. Im Vergleich zu P. calceolata ist die geringe Häufigkeit von A. anophagefferens in offenen Ozeanen, in denen Eisen begrenzt ist, mit dem Fehlen von Genen vereinbar, die an der Eisenaufnahme und -speicherung beteiligt sind, einschließlich Eisenpermeasen und ISIP3-Genen. Das Vorhandensein von drei Ferroportin-Genen in P. calceolata ist interessant, da diese Transmembran-Eisenexportproteine ​​eine wichtige Rolle bei der Eisenhomöostase in mehrzelligen Organismen spielen36. Die Funktion von Ferroportin in Mikroalgen ist unbekannt, könnte aber dazu dienen, Eisen aus Endosomen in das Zytoplasma zu exportieren43. In der Grünalge Chlamydomonas reinhardtii wird ein Ferroportin-Gen unter Bedingungen mit niedrigem Fe-Gehalt überexprimiert44. Auch wenn wir keine signifikanten Veränderungen in der Expression der drei Ferroportin-Gene von P. calceolata in Abhängigkeit von der Eisenkonzentration fanden, konnte die Funktion dieser Gene untersucht werden, um ihre Rolle bei variablen Eisenkonzentrationen zu verstehen.

Die Modulation des Eisenbedarfs scheint eine wichtige Akklimatisierungsstrategie für P. calceolata in eisenarmen Umgebungen zu sein. Alle bekannten molekularen Schalter zwischen Eisen- und Nichteisenproteinen sind im Genom von P. calceolata vorhanden, und die transkriptomische Regulation dieser Gene legt nahe, dass diese Proteine ​​eine zentrale Rolle für ihr Wachstum in eisenarmen Umgebungen spielen.

Pelagophyten exprimieren mehr als 90 % aller Nitrattransporter-Transkripte und könnten die Nitrataufnahme und -assimilation im Nordpazifik dominieren25. Tatsächlich enthält P. calceolata eine große Sammlung von Genen für anorganische Stickstofftransporter. Der Hauptunterschied zum küstennahen A. anophagefferens besteht in der verringerten Anzahl von Ammoniumtransportern in P. calceolata.

Organische Stickstoffverbindungen könnten auch eine wichtige Stickstoffquelle für P. calceolata sein. Wir haben gezeigt, dass die Cyanat-Lyase- und Urease-Gene in vielen Umgebungen exprimiert werden, aber nur die Cyanat-Lyase unter Bedingungen mit niedrigem Nitratgehalt überexprimiert wird. Diese beiden Gene, die größtenteils in Phytoplanktonlinien vorkommen, könnten wichtige Komponenten der Akklimatisierung an nitratarme Umgebungen sein45. Darüber hinaus wächst A. anophagefferens auf organischen Stickstoffsubstraten (Harnstoff und Glutaminsäure) schneller als auf Nitrat oder Ammonium, was darauf hindeutet, dass die Dominanz von Pelagophyceae in nitratarmen Umgebungen auf eine optimierte Nutzung dieser organischen Moleküle zurückzuführen sein könnte46.

Ein bemerkenswertes Merkmal des Genoms von P. calceolata ist das Vorhandensein von drei Genen, die NIT-Domänen tragen (PF08376). Diese NIT-Domäne wurde erstmals in bakteriellen Nitrit- und Nitratsensorproteinen beschrieben47. Bei diesem Sensor handelt es sich um ein Alpha-Helix-Protein, das eine Signaltransduktionsrolle bei der Regulierung der Genexpression, Zellmotilität und Enzymaktivität in Klebsiella oxytoca48 spielt. In Pico-Nano-Algen können NIT-Sensordomänen mit einer Serin-Threonin/Tyrosinkinase-Domäne assoziiert sein, was auf eine Signalübertragung entsprechend der intrazellulären Nitrat-/Nitritkonzentration hindeutet, oder von zwei Transmembrandomänen umgeben sein, was auf eine extrazelluläre Sensorik schließen lässt. Obwohl NIT-Sensing-Domänen in verschiedenen Phyla zu finden sind, sind Homologe der NIT-Proteine ​​von P. calceolata auf Pelagophyten und Dictyochophyten beschränkt. Die NIT-Gene in P. calceolata werden in subtropischen pazifischen N-armen Gewässern stark exprimiert, was darauf hindeutet, dass diese Proteine ​​je nach Nitratverfügbarkeit eine Rolle bei der Transkriptionsregulation spielen25. Unsere Ergebnisse legen nahe, dass NIT-empfindliche Proteine ​​unterschiedlich auf den Nitratmangel in der Umgebung reagieren. Wir können die Hypothese aufstellen, dass das NIT-empfindliche Protein, das in nitratreichen Umgebungen überexprimiert wird, eine Rolle bei der intrazellulären Regulierung des gespeicherten Stickstoffs spielt und Signalwege aktiviert, wenn die Nitrat- oder Nitritvorräte ausreichend sind. Im Gegensatz dazu könnte es sich bei der mutmaßlichen extrazellulären NIT-Erkennung um einen Nitrat- oder Nitritsensor in der Umgebung handeln, der aktiviert wird, um die Expression von Genen zu regulieren, die an der Gewöhnung an Bedingungen mit niedrigem Nitratgehalt beteiligt sind.

Zusammenfassend lässt sich sagen, dass Pelagomonas calceolata aufgrund seiner weiten Verbreitung und seines hohen Vorkommens in den offenen Ozeanen als ökologisch relevantes Modell für die Untersuchung mariner photosynthetischer Protisten dienen kann. Wir haben die in dieser Studie generierte Genomsequenz im Chromosomenmaßstab, hauptsächlich von Telomer zu Telomer, verwendet, um deren Häufigkeit in Umweltdatensätzen abzuschätzen. Wir haben gezeigt, dass das Genom von P. calceolata spezifische genomische Merkmale aufweist, die möglicherweise seinen ökologischen Erfolg in offenen Ozeanen erklären. Im Vergleich zu den Küstenpelagophyceae A. anophagefferens enthält das Genom von P. calceolata spezifische Gene, die an der Gewöhnung an eisenarme Bedingungen beteiligt sind. Das große Repertoire an Genen, die an der Nährstoffaufnahme aus der Umwelt beteiligt sind, steht im Einklang mit dem weit verbreiteten Muster der relativen Häufigkeitsverteilung in verschiedenen Umgebungen. Die ökologische Nische von P. calceolata legt nahe, dass diese Alge vom globalen Klimawandel mit der Ausbreitung oligotropher Regionen und der globalen Erwärmung der Ozeane profitieren wird. Zukünftige Studien könnten das Genom von P. calceolata nutzen, um Anpassungs- und Akklimatisierungsprozesse zu untersuchen, die die Verbreitung und Häufigkeit dieser Alge steuern.

Die Pelagomonas calceolata RCC100-Kultur wurde in einer Licht-Dunkel-Photoperiode von 12:12 Stunden in K-Medium auf natürlicher Meerwasserbasis bei 20 °C gezüchtet. In der Roscoff Culture Collection wurden die Zellen bei einer Lichtintensität von ~80 μmol Photon m−2 s−1 gehalten und das Kulturvolumen wurde in der mittleren exponentiellen Wachstumsphase vor der Ernte auf 1 Liter erhöht. Die RCC100-Kultur war nicht axenisch und wuchs in Gegenwart undefinierter bakterieller Mikrobiota.

Wir pelletierten Zellen aus 500 ml Kultur durch zwei aufeinanderfolgende Zentrifugationen bei 10.000 × g für 15 Minuten bei 4 °C. Genomische DNA wurde mit dem NucleoSpin Plant II Mini-Kit gemäß den Anweisungen des Herstellers (Macherey-Nagel, Hoerdt, Frankreich) extrahiert, mit der folgenden Ausnahme für den Lyseschritt: 400 µL Lysepuffer PL1 und 25 µL Proteinase K 25 mg/ml wurden zu den Stammpellets gegeben und die Lysate wurden 1 Stunde lang bei 55 °C und 900 U/min inkubiert. DNA-Menge und -Integrität wurden jeweils mit einem Qubit 2.0-Spektrofluorometer (Invitrogen, Carlsbad, CA, USA) und einem Nanodrop1000-Spektrophotometer (Thermo Fisher Scientific, MA, USA) bewertet.

Für die Illumina-Sequenzierung wurde DNA (1,5 μg) mit einem Covaris E220-Ultraschallgerät (Covaris, Woburn, MA, USA) beschallt. Fragmente wurden am Ende repariert, 3'-adenyliert und Illumina-Adapter (Bioo Scientific, Austin, TX, USA) unter Verwendung des Kapa Hyper Prep Kit (KapaBiosystems, Wilmington, MA, USA) hinzugefügt. Ligationsprodukte wurden mit AMPure XP-Perlen (Beckmann Coulter Genomics, Danvers, MA, USA) gereinigt. Die Bibliothek wurde dann durch qPCR unter Verwendung des KAPA Library Quantification Kit für Illumina Libraries (KapaBiosystems) quantifiziert und das Bibliotheksprofil wurde unter Verwendung eines High Sensitivity DNA Kit auf einem Agilent Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA) bewertet. Die Bibliothek wurde auf einem Illumina NovaSeq-Gerät (Illumina, San Diego, CA, USA) unter Verwendung einer Lesechemie mit einer Länge von 150 Basen im Paired-End-Modus sequenziert.

Für die ONT-Sequenzierung wurde die Bibliothek unter Verwendung der genomischen 1D-Native-Barcoding-DNA (mit EXP-NBD104 und SQK-LSK109) vorbereitet. Genomische DNA-Fragmente (1 µg) wurden mit dem NEBNext FFPE DNA Repair Mix und dem NEBNext® Ultra™ II End Repair/dA-Tailing Module (New England Biolabs, Ipswich, MA, USA) repariert und 3'-adenyliert. Von ONT bereitgestellte Adapter mit Barcodes wurden dann mit dem NEB Blunt/TA Ligase Master Mix (NEB) ligiert. Nach der Reinigung mit AMPure XP-Perlen (Beckmann Coulter, Brea, CA, USA) wurden die Sequenzierungsadapter (ONT) unter Verwendung der NEBNext Quick T4 DNA-Ligase (NEB) hinzugefügt. Die Bibliothek wurde mit AMPure XP-Beads (Beckmann Coulter) gereinigt, dann mit dem Sequenzierungspuffer (ONT) und dem Loading Bead (ONT) gemischt und auf eine MinION R9.4.1-Durchflusszelle geladen. Lesevorgänge wurden mit Guppy 3.1.5 als Basecall durchgeführt.

Für die Hi-C-Sequenzierung wurde die Bibliothek mit dem Dovetail Omni-C-Kit (Dovetail Genomics, Scotts Valley, CA, USA) vorbereitet. Eine P. calceolata RCC100-Kultur (60 ml, entsprechend etwa 6 × 107 Zellen) wurde zunächst 10 Minuten lang bei 5000 × g zentrifugiert. Das Pellet wurde als Säugerzellen gemäß dem Mammalian Cell Protocol for Sample Prepared (Version 1.4) ohne Verwendung von DSG-Vernetzungsreagenz verarbeitet. Kurz gesagt, das Chromatin wurde mit Formaldehyd fixiert, zufällig mit DNase I verdaut und dann extrahiert. Chromatinenden wurden repariert und an einen biotinylierten Brückenadapter ligiert, gefolgt von einer Proximity-Ligation der adapterhaltigen Enden. Nach der Proximity-Ligation wurden die Vernetzungen umgekehrt und die DNA gereinigt. Gereinigte DNA wurde behandelt, um Biotin zu entfernen, das sich nicht in den ligierten Fragmenten befand, und eine Sequenzierungsbibliothek wurde unter Verwendung von NEBNext Ultra-Enzymen und Illumina-kompatiblen Adaptern erstellt. Biotinhaltige Fragmente wurden vor der PCR-Anreicherung der Bibliothek mithilfe von Streptavidin-Kügelchen isoliert. Die Qualität der Dovetail Hi-C-Bibliothek wurde wie oben beschrieben überprüft und auf einem Illumina MiSeq-Gerät (Illumina, San Diego, CA, USA) im Paarmodus (2*150 bp) sequenziert, was 2.832.092 Lesevorgänge ergab. Die Hi-C-Rohlesevorgänge wurden mithilfe von Juicer (Juicer Version 1.5.6 – Juicer Tools Version 1.9.9)49 mit der Assembly abgeglichen (Option „-s none“). Die Kontaktkartendarstellung wurde mit R Version 4.1.1 unter Verwendung der zusammengeführten Nodups-Datei generiert.

Als die Zellkonzentration in der mittleren exponentiellen Wachstumsphase 10 Millionen Zellen/ml erreichte, wurden 160 ml Kultur durch drei aufeinanderfolgende Filtrationen auf 1,2-µm-Polycarbonatfiltern von 47 mm gesammelt, um eine prokaryontische Kontamination zu vermeiden. Um die Zell- und RNA-Integrität zu bewahren, haben wir die Filtrationszeit und den Filtrationsdruck unter 10 Minuten bzw. 20 mmHg gehalten. Anschließend wurden die Filter in 15-ml-Falcon-Röhrchen mit 3 ml Trizol (Invitrogen, Carlsbad, CA, USA) gelagert, gemischt und zur weiteren Verarbeitung in flüssigem Stickstoff schockgefroren. Die RNA wurde durch 15-minütige Inkubation bei 65 °C und anschließende Chloroformextraktion extrahiert. Die wässrige Phase wurde mit einem Purelink RNA Isolation Kit (Ambion Invitrogen, Carlsbad, CA, USA) gemäß den Anweisungen des Herstellers gereinigt. Die DNA-Kontamination wurde durch Verdauung mit dem TURBO DNA-free™ Kit (Ambion Invitrogen) gemäß dem DNase-Behandlungsprotokoll des Herstellers entfernt. Nach zwei 30-minütigen Inkubationsrunden bei 37 °C wurde die Effizienz der DNase-Behandlung mittels PCR bewertet. Menge und Qualität der extrahierten RNA wurden mit RNA-spezifischer fluorimetrischer Quantifizierung auf einem Qubit 2.0 Fluorometer unter Verwendung des Qubit RNA HS Assay (Invitrogen) analysiert. Die Qualität der Gesamt-RNA wurde durch Kapillarelektrophorese auf einem Agilent Bioanalyzer unter Verwendung des RNA 6000 Nano LabChip-Kits (Agilent Technologies, Santa Clara, CA) überprüft.

Die Vorbereitung der RNA-Seq-Bibliothek wurde aus 1 µg Gesamt-RNA unter Verwendung des TruSeq Stranded mRNA-Kits (Illumina, San Diego, CA, USA) durchgeführt, was die Orientierung des mRNA-Strangs ermöglichte. Kurz gesagt, Poly(A)+-RNAs wurden mit Oligo(dT)-Kügelchen ausgewählt, chemisch fragmentiert und unter Verwendung von zufälligem Hexamer-Priming in einzelsträngige cDNA umgewandelt. Nach der Synthese des zweiten Strangs wurde die doppelsträngige cDNA 3'-adenyliert und an Illumina-Adapter ligiert. Ligationsprodukte wurden gemäß den Empfehlungen des Herstellers PCR-amplifiziert. Schließlich wurde die sequenzierungsbereite Illumina-Bibliothek durch qPCR unter Verwendung des KAPA Library Quantification Kit für Illumina-Bibliotheken (KapaBiosystems, Wilmington, MA, USA) quantifiziert und mit einem Agilent 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA) ausgewertet ). Die Bibliothek wurde mithilfe der 101-bp-Paired-End-Read-Chemie auf einem HiSeq2000-Illumina-Sequenzer sequenziert. Nukleotide geringer Qualität (Q < 20) von beiden Enden der Lesevorgänge wurden verworfen. Illumina-Sequenzierungsadapter und Primersequenzen wurden entfernt und Lesevorgänge, die nach dem Trimmen kürzer als 30 Nukleotide waren, wurden verworfen. Diese Trimm- und Reinigungsschritte wurden mithilfe einer eigens entwickelten Software auf Basis des FastX-Pakets (https://www.genscope.cns.fr/externe/fastxtend/) durchgeführt. Der letzte Schritt identifiziert und verwirft Lesepaare, die dem Phagen-PhiX-Genom zugeordnet sind, unter Verwendung des SOAP-Aligners50 und der Enterobacteria-Phagen-PhiX174-Referenzsequenz (GenBank: NC_001422.1). Diese in Lit. beschriebene Verarbeitung. 51, führte zu qualitativ hochwertigen Daten. Darüber hinaus wurden ribosomale RNA-ähnliche Lesevorgänge mithilfe der Datenbanken SortMeRNA52 2.1 und SILVA ausgeschlossen.

Rohe Nanoporen-Reads wurden für die Genomassemblierung verwendet. Die taxonomische Zuordnung wurde mit Centrifuge53 Version 1.0.3 durchgeführt, um mögliche Kontaminationen zu erkennen. Genomgröße und Heterozygotierate wurden mithilfe von Genomescope54- und Illumina-Kurzablesungen geschätzt. Für die Genomassemblierung haben wir drei Sätze von ONT-Reads generiert: alle Reads, 30-fache Genomabdeckung mit den längsten Reads und 30-fache Genomabdeckung der Reads mit der höchsten Qualität, geschätzt vom Filtlong-Tool (https://github.com/rrwick). /Filtlong). Wir haben die Filtlong-Filterung mit Standardparametern angewendet und dabei kurze Pelagomonas Illumina-Lesevorgänge als Referenz verwendet (von Illumina-Lesevorgängen abgedeckte ONT-Lesevorgänge haben höhere Werte). Anschließend haben wir vier verschiedene Assembler mit Standardeinstellungen, Smartdenovo, Redbean, Flye und Ra, auf diese drei Lesesätze angewendet (Supplementary Data 1)55,56,57,58. Nach der Assemblierungsphase haben wir basierend auf der kumulativen Größe und Fragmentierung die beste Assemblierung (Flye mit allen Lesevorgängen) ausgewählt. Tatsächlich erzeugten der Wtdbg2- und der Smartdenovo-Assembler fragmentierte Baugruppen mit niedrigerem N90. Raven und Flye lagen sehr nahe beieinander, aber nur die Flye-Anordnung mit allen ONT-Werten enthielt sowohl die mitochondrialen als auch die chloroplastischen kreisförmigen Contigs. Um Verbindungen anzuzeigen, die nicht in der Contigs-Datei vorhanden sind, haben wir das Bandage-Tool59 verwendet. Die ausgewählte Flye-Baugruppe wurde dreimal mit Racon60 mit ONT-Reads und zweimal mit Hapo-G61 und Illumina-Reads poliert. Die Genvollständigkeit der Zusammenstellung wurde mithilfe der orthologen Einzelkopie-Genanalyse von BUSCO v5 mit dem Stramenopile-Datensatz Version 10, der 100 Gene enthielt, geschätzt.

Repetitive Regionen im Genom wurden mit dem Tandem Repeat Finder-Tool62, dem Dust-Tool zur Erkennung von Regionen mit geringer Komplexität63 und RepeatMasker64 zur Identifizierung eingestreuter Wiederholungen basierend auf der Homologiesuche innerhalb der Stramenopile-Gruppe und anderen Sequenzen mit geringer Komplexität maskiert. Die Positionen der erkannten Wiederholungen wurden zusammengeführt und im Genom hartmaskiert, was 8 % seiner Länge ausmachte. Die Ab-initio-Identifizierung von Wiederholungsfamiliensequenzen wurde mit RepeatScout65 durchgeführt. Der Algorithmus berechnet zunächst die Häufigkeit aller k-mere im Genom und entfernt dann Regionen mit geringer Komplexität und Tandem-Wiederholungen. In >80 % der Fälle überlappen sich wiederholende Familien, die mit Ab-initio-Ansätzen identifiziert wurden, nicht mit repetitiven Regionen, die durch Homologiesuche identifiziert wurden. Der GC-Gehalt entlang des Genoms wurde mit Bedtools nuc Version 2.29.266 und die Abdeckung über ein nicht überlappendes Fenster von 2 Kb mit Mos Depth Version 0.2.867 berechnet.

RNA-Sequenzierungsablesungen von P. calceolata RCC100 wurden mit Velvet 1.2.07 und Oases 0.2.08 mit einer k-mer-Größe von 63 bp68,69 zusammengestellt. Lesevorgänge wurden mit BWA-mem70 wieder den Contigs zugeordnet und nur konsistente Paired-End-Lesevorgänge wurden beibehalten. Unbedeckte Regionen wurden entdeckt und zur Identifizierung chimärer Contigs verwendet. Darüber hinaus wurden offene Leserahmen (ORF) und Domänen mit TransDecoder (http://transdecoder.sourceforge.net) bzw. CDDsearch71 durchsucht. Contig-Extremitäten ohne vorhergesagte ORFs oder funktionelle Domänen wurden entfernt. Zuletzt nutzten wir die gelesenen Stranginformationen, um die RNA-Contigs auszurichten. Wir haben den RNA-Contigs-Datensatz mit den beiden Transkriptom-Assemblierungen des RCC100-Stamms von P. calceolata aus der Marine Eukaryotes Transcriptomes-Datenbank (METdb) (http://metdb.sb-roscoff.fr/metdb/)72 vervollständigt.

Die Vorhersage nuklearer Gene wurde mithilfe von 23.696 Pelagomonadales-Proteinen (hauptsächlich A. anophagefferens) durchgeführt, die von der NCBI-Website heruntergeladen wurden. In einer zweistufigen Strategie wurden Proteine ​​am Genom ausgerichtet. Zunächst wurde BLAT73 (Version 36 mit Standardparametern) verwendet, um entsprechende mutmaßliche Regionen dieser Proteine ​​​​schnell im Genom zu lokalisieren. Die beste Übereinstimmung und die Übereinstimmungen mit einer Punktzahl von mindestens 90 % der besten Übereinstimmungspunktzahl wurden beibehalten. Dann wurden die Regionen mit BLAT-Alignments maskiert und wir haben den gleichen Proteinsatz mithilfe von BLAST74 ausgerichtet, wodurch divergentere Übereinstimmungen identifiziert werden können. Zweitens wurden die Alignments mithilfe von Genewise75 verfeinert (Standardparameter der Version 2.2.0, mit Ausnahme der Modelloption -splice zur Erkennung nichtkanonischer Spleißstellen), was für die Erkennung von Intron-/Exon-Grenzen genauer ist. Ausrichtungen wurden beibehalten, wenn mehr als 50 % der Länge des Proteins auf dem Genom ausgerichtet sind. Darüber hinaus wurden die in der METdb enthaltenen Transkriptomassemblierungen von P. calceolata RCC969, RCC2362, RCC706 und RCC981 in Proteine ​​übersetzt und mithilfe von BLAT, einem BLAT-Score > 50 %-Filter, und Alignments mit Genewise verfeinert, wie zuvor beschrieben, auf das Genom ausgerichtet.

Wir haben Alignments aus der neu generierten Transkriptomassemblierung und den beiden in METdb verfügbaren Assemblies ausgewählt, die zum Stamm P. calceolata RCC100 gehören, um einen Trainingssatz für den AUGUSTUS-Ab-initio-Genprädiktor zu erstellen76. Für das Training wurden nur Genmodelle mit vollständigen kodierenden DNA-Sequenzen beibehalten und 1000 Gene wurden zum Testen der AUGUSTUS-Genauigkeit reserviert. Das anfängliche Training ergab Exon- und Intron-Parameter für P. calceolata-Arten. Die Parameter wurden mithilfe aufeinanderfolgender Trainings- und Testschritte optimiert. Wir haben die Genauigkeit der Genvorhersage berechnet, indem wir AUGUSTUS auf dem Testsatz ausgeführt haben. Auf Exon-Ebene schnitt AUGUSTUS hinsichtlich Sensitivität (0,619) und Spezifität (0,669) gut ab. Daher führen wir AUGUSTUS auf dem maskierten Genom basierend auf trainierten Parametern aus.

Die Ab-initio-Vorhersage und alle transkriptomischen und Protein-Alignments wurden mit Gmove kombiniert, einem benutzerfreundlichen Prädiktor, für den kein Vorkalibrierungsschritt erforderlich ist77. Kurz gesagt wurden mutmaßliche Exons und Introns, die aus Vorhersagen und Alignments extrahiert wurden, verwendet, um einen Graphen zu erstellen, in dem Knoten und Kanten Exons bzw. Introns darstellen. Aus diesem Diagramm extrahiert Gmove alle Pfade und durchsucht offene Leserahmen (ORFs), die mit dem Proteinnachweis übereinstimmen. Wir haben nichttranslatierte transkribierte Regionen, die den kodierenden Teil eines Nachbargens überlappten, gekürzt und die Gene entsprechend der Standardnomenklatur umbenannt. Modelle monoexonischer Gene, die Proteine ​​mit weniger als 200 Aminosäuren ohne signifikante Proteinübereinstimmung kodieren (1006 Gene), wurden ausgeschlossen. Chloroplasten- und Mitochondriengene (Contig 7 und 8) wurden anhand zuvor veröffentlichter Anmerkungen für P. calceolata vorhergesagt23,78. Nach dieser Pipeline haben wir 16.667 Gene mit durchschnittlich 0,45 Introns pro Gen vorhergesagt.

Vorhergesagte Genmodelle des Kerngenoms von P. calceolata (Contig 1 bis Contig 6) wurden mit InterProScan v5.41-78.079 hinsichtlich der Proteinfunktion annotiert. Ein Proteinabgleich mit der NR-Datenbank (Version 01.12.2021) wurde mit Diamond v0.9.2480 durchgeführt. Die beste Proteinübereinstimmung mit einer funktionellen Annotation und einem E-Wert < 10−5 wurde beibehalten. KEGG-Orthologe (KO) wurden mit dem HMM-Suchtool KofamKoala v1.3.0 identifiziert und KO-Anmerkungen mit einem E-Wert < 10–5 und einem Wert über dem HMM-Schwellenwert wurden beibehalten81. Schließlich wurden die Begriffe der Genontologie (GO) und die Zahlen der Enzymkommission (EC) aus der Interproscan- bzw. KO-Analyse wiederhergestellt. Zuvor veröffentlichte Chloroplasten- und Mitochondrien-Gennamen und -Funktionen wurden für die entsprechenden Gene angegeben23,78. Alle funktionellen Genanmerkungen von P. calceolata sind in Supplementary Data 2 verfügbar.

Um die funktionelle Annotation von P. calceolata mit anderen kleinen frei lebenden photosynthetischen Eukaryoten zu vergleichen, haben wir dieselbe Analyse auf die vorhergesagten Proteine ​​angewendet, die für die folgenden Arten verfügbar sind: Aureococcus anophagefferens, Thalassiosira pseudonana, Phaeodactylum tricornutum, Nannochloropsis ozeanica, Bathycoccus prasinos, Micromonas pusilla, Ostreococcus lucimarinus und Emiliania huxleyi (Referenzen sind in Tabelle 1 angegeben).

Wir haben anhand von drei früheren Studien eine Liste von 23 Meiose-spezifischen Genen erstellt31,32,33. KO-Annotationen und Interproscan-Domänen wurden verwendet, um diese Gene im Genom von P. calceolata wiederherzustellen. Transkriptomische Lesevorgänge von P. calceolata wurden mit BWA-MEM v 2.2.1 auf die vorhergesagten Gene zurückgeführt. Über mehr als 80 % ihrer Länge ausgerichtete Lesevorgänge wurden beibehalten, um die relativen Expressionsniveaus der Meiose-Gene abzuschätzen.

Gene, die die NIT-Sensing-Domäne enthalten, wurden basierend auf Interproscan-Annotationen identifiziert. Eukaryotische Homologe der drei NIT-Sensing-Gene von P. calceolata wurden mit einem BLASTP (E-Wert < 10−5, Abdeckung > 100 aa) gegen 27,7 Millionen Proteine ​​aus NR, der METdb72-Transkriptomdatenbank und eukaryotischen Algenproteomen aus der JGI-Datenbank abgerufen , Einzelzell-amplifizierte Genome und metagenomassemblierte Genome (SMAGs) von Tara Oceans82. Die 60 abgerufenen Proteine ​​​​und die 3 Proteine, die die NIT-Domäne von P. calceolata enthalten, wurden dann mit Mafft v7.0 (https://mafft.cbrc.jp/alignment/server/) und einem phylogenetischen Maximum-Likelihood-Baum (Jones-Taylor) abgeglichen –Thornton-Substitutionsmodell und 100 Bootstraps) wurde mit der MEGAX-Software erstellt. Transmembranregionen in NIT-sensierende Domänen enthaltenden Proteinen wurden mit TMHMM v 2.055 identifiziert.

Wir verwendeten metagenomische Datensätze von Tara Oceans- und Tara Polar Circle-Expeditionen, um die relative Häufigkeit von P. calceolata in den Ozeanen zu ermitteln und abzuschätzen. Datensätze von Wasserproben, die in der photischen Zone gesammelt wurden: Oberfläche (SUR) und tiefes Chlorophyllmaximum (DCM) wurden analysiert. Es wurden größenfraktionierte Wasserproben mit Pico-Nano-Algen (Organismen < 5 µm Zelldurchmesser) ausgewählt: 0,2–3 µm (100 Proben), 0,8–2000 µm (119 Proben) und 0,8–5 µm (148 Proben)51. Metagenomische Lesevorgänge wurden mit dem in dieser Studie zusammengestellten P. calceolata-Genom mit BWA-mem Version 0.7.15 mit Standardparametern abgeglichen83. Ausrichtungen mit mindestens 90 % Identität über 80 % der Leselänge wurden zur weiteren Analyse aufbewahrt. Bei mehreren möglichen besten Übereinstimmungen wurde eine zufällige ausgewählt. Um mutmaßliche PCR-Duplikate zu entfernen, wurden mehrere Lesepaare, die an derselben Position im Genom von P. calceolata ausgerichtet waren, mit samtools rmdup Version 1.10.270 entfernt. Für die metagenomische Häufigkeit haben wir die Gesamtzahl der auf dem in dieser Studie zusammengestellten P. calceolata-Genom ausgerichteten Lesevorgänge durch die Gesamtzahl der sequenzierten Lesevorgänge für jede Probe dividiert. Für die Metabarcoding-Häufigkeit haben wir die 2019 veröffentlichte 18SV9-rRNA-OTU-Tabelle verwendet, die hier verfügbar ist: https://zenodo.org/record/3768510#.YEX2S9zjJaQ34. Für diese Analyse wurden Bakterien- und Archaeen-OTUs entfernt.

Zwei Modelle der relativen Häufigkeit von P. calceolata wurden basierend auf den zum Zeitpunkt der Probenahme gemessenen In-situ-Umweltbedingungen oder unter Verwendung der WOA18-Datensätze durchgeführt. Die während der Expedition gemessenen Umweltparameter sind in der Pangea-Datenbank (https://www.pangaea.de/) verfügbar und in Lit. beschrieben. 84. Eisenkonzentrationen sind jährliche Mittelwerte, die aus dem PISCES2-Modell85 abgeleitet und in Lit. beschrieben sind. 13. Die Ammoniumkonzentrationen zum Zeitpunkt und am Ort der Probenahme wurden aus dem MITgcm-Darwin-Modell abgeleitet und sind in der Pangaea-Datenbank86 verfügbar. Umweltparameter für jede Probe sind in den Zusatzdaten 10 verfügbar. Wir betrachten ozeanische Proben als „eisenarm“, wenn sie weniger als 0,2 nM Eisen enthalten, als „nitratarm“, wenn sie weniger als 2 µM Nitrat enthalten, und als „nitratarm“. Ammonium“, wenn sie weniger als 25 nM Ammonium enthalten. Diese Schwellenwerte wurden anhand der Verteilung der Nährstoffkonzentrationen im Datensatz und früheren Studien definiert13,14. Pearsons Korrelationen zwischen der relativen Häufigkeit von P. calceolata und allen Umweltparametern wurden mit der Cor-Funktion des R-Pakets FactoMineR Version 2.4 und des GGally-Pakets Version 2.1.0 berechnet. Die Hauptkomponentenanalyse (PCA) wurde mit 9 Parametern durchgeführt, die signifikante Pearson-Korrelationen aufzeigten. Wir verwendeten ein Generalized Additive Model (GAM) wegen seiner Fähigkeit, nichtlineare und nichtmonotone Funktionen anzupassen und wegen seiner geringen Empfindlichkeit gegenüber Extremwerten, um die relative Häufigkeit von P. calceolata als Funktion der Eisenkonzentration, der Temperatur und des PAR-Lichts zu modellieren87 . Diese Funktion ist im mgcv R-Paket Version 1.8–33 implementiert.

Der Mittelwert mehrerer Klimatologien der Erdsystemmodelle unter dem RCP8.5-Szenario (ESM8.5) wurde verwendet, um die Umweltbedingungen am Ende des Jahrhunderts nach der Methode von Ref. zu definieren. 35. Modelle der relativen Häufigkeit von P. calceolata basierend auf WOA18 an Standorten, Tiefen und Monaten von Proben aus Tara-Ozeanen oder ESM8.5 wurden mithilfe von vier maschinellen Lerntechniken erhalten, wie in Lit. beschrieben. 35. mit einigen Unterschieden. Die vier Tools wurden im Regressionsmodus trainiert, wir verwendeten das Neuralnet R-Paket88 mit den folgenden Parametern: versteckt = 1, Zerfall = 0,1, mxit = 1e6 und Größe = 5, 6 Splines wurden für das GAM ausgewählt. Wir haben für jedes Modell eine 100-fache zufällige Kreuzvalidierung durchgeführt und ihre Leistung mithilfe des Pearson-Korrelationskoeffizienten und des RMSE bewertet. Wir verwendeten die Ensemble-Modellansätze35 für endgültige globale Modelle der relativen Häufigkeit von P. calceolata (dh die mittleren Projektionen der validierten Techniken des maschinellen Lernens). Die Abbildungen 2a, 3c und die ergänzende Abbildung S7 wurden unter Verwendung der Weltkarte der R-Pakete „maps“, „mapdata“ und „ggmap“ erstellt. Weltkartendaten werden aus dem gemeinfreien Natural Earth-Projekt importiert.

Metatranskriptomische Lesevorgänge aus Tara Oceans-Datensätzen wurden mit BWA-mem 2.2.1 unter Verwendung von Standardparametern an vorhergesagten Kodierungssequenzen des P. calceolata-Genoms ausgerichtet. Wir haben Lesevorgänge ausgewählt, die zu mehr als 95 % der Identität über 80 % der Leselänge ausgerichtet sind. Wir haben dafür gesorgt, dass Kerngene durch mindestens zehn Lesevorgänge in mindestens zehn Proben abgedeckt wurden, und diejenigen entfernt, die in mehr als 90 % der Proben nachgewiesen wurden und wahrscheinlich metagenomische Lesevorgänge von anderen Organismen aggregieren (Kreuzkartierung). Um robuste relative Expressionswerte zu erhalten, haben wir Proben entfernt, in denen weniger als 25 % der P. calceolata-Gene nachgewiesen wurden. Wir haben schließlich die Expression von 15.679 Genen von P. calceolata in 167 Proben erhalten. In allen Genexpressionsanalysen haben wir die Genexpressionsniveaus in Transkripten pro Kilobase Million (TPM) normalisiert. Die Genexpressionsniveaus von P. calceolata in allen Tara Oceans-Proben sind hier verfügbar: https://doi.org/10.5281/zenodo.6983365.

Die Probengrößen werden in den Methoden, in den Bildunterschriften oder im Haupttext angegeben. Nichtparametrische Wilcoxon-Signed-Rank-Tests wurden mit der zweiseitigen Alternativhypothese und nicht gepaart angewendet. Für die Genanreicherungsanalyse wurden zwei statistische Fisher-Tests angewendet. Alle statistischen Tests im Manuskript wurden mit R Version 4.0.3 erstellt und P-Werte < 0,01 gelten als signifikant.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Research Reporting Summary.

Genomische und transkriptomische Lesevorgänge von Pelagomonas calceolata, Genomassemblierung und Genvorhersage sind auf der Website der ENA (EMBL-EBI) unter der Zugangsnummer PRJEB47931 verfügbar. P. calceolata-Transkriptome sind unter der Zugangsnummer PRJEB34158, den Läufen ERR3497221 und ERR3497222 verfügbar. Die metagenomischen Sequenzen der Tara-Ozeane und des Tara-Polarkreises sind bei der ENA unter den folgenden Zugangsnummern archiviert: PRJEB9740, PRJEB9691, PRJEB4352 und PRJEB1787. Alle weiteren Daten sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Field, CB, Behrenfeld, MJ, Randerson, JT & Falkowski, P. Primärproduktion der Biosphäre: Integration terrestrischer und ozeanischer Komponenten. Science 281, 237–240 (1998).

Artikel CAS PubMed Google Scholar

Boyce, DG, Lewis, MR & Worm, B. Globaler Rückgang des Phytoplanktons im letzten Jahrhundert. Natur 466, 591–596 (2010).

Artikel CAS PubMed Google Scholar

Henson, SA, Cael, BB, Allen, SR & Dutkiewicz, S. Zukünftige Phytoplanktonvielfalt in einem sich verändernden Klima. Nat. Komm. 12, 5372 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Vaulot, D., Eikrem, W., Viprey, M. & Moreau, H. Die Vielfalt des kleinen eukaryotischen Phytoplanktons (≤3 μm) in Meeresökosystemen. FEMS Mikrobiol. Rev. 32, 795–820 (2008).

Artikel CAS PubMed Google Scholar

Agawin, NSR, Duarte, CM & Agustí, S. Nährstoff- und Temperaturkontrolle des Beitrags von Picoplankton zur Phytoplanktonbiomasse und -produktion. Limnol. Ozeanogr. 45, 591–600 (2000).

Artikel CAS Google Scholar

Moran, XAG, Lopez-Urrutia, Á., Calvo-Diaz, A. & Li, WKW Zunehmende Bedeutung von kleinem Phytoplankton in einem wärmeren Ozean. Globus. Biol. ändern 16, 1137–1144 (2010).

Artikel Google Scholar

Li, WKW, McLaughlin, FA, Lovejoy, C. & Carmack, EC Kleinste Algen gedeihen, wenn sich der arktische Ozean erfrischt. Wissenschaft 326 https://doi.org/10.1126/science.1179798 (2009).

Benner, I., Irwin, AJ & Finkel, ZV Fähigkeit des in der Arktis verbreiteten Pikoeukaryoten Micromonas, sich an einen sich erwärmenden Ozean anzupassen. Limnol. Ozeanographie Lett. 5, 221–227 (2020).

Sunda, WG & Huntsman, SA Eisenaufnahme und Wachstumsbegrenzung im ozeanischen und küstennahen Phytoplankton. Mar. Chem. 50, 189–206 (1995).

Artikel CAS Google Scholar

Raven, JA Die zwölfte Tansley-Vorlesung. Klein aber fein: das Pikophytoplankton. Funktion. Ökologisch. 12, 503–513 (1998).

Artikel Google Scholar

Morel, FMM & Price, NM Die biogeochemischen Kreisläufe von Spurenmetallen in den Ozeanen. Wissenschaft 300, 944–947 (2003).

Artikel CAS PubMed Google Scholar

Gao, X., Bowler, C. & Kazamia, E. Eisenstoffwechselstrategien in Kieselalgen. J. Exp. Bot. 72, 2165–2180 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Caputi, L. et al. Reaktionen auf Gemeindeebene auf die Eisenverfügbarkeit in Planktonökosystemen im offenen Ozean. Globus. Biogeochemische Kreisläufe 33, 391–419 (2019).

Artikel CAS Google Scholar

Carradec, Q. et al. Ein globaler Ozeanatlas eukaryontischer Gene. Nat. Komm. 9, 373 (2018).

Artikel PubMed PubMed Central CAS Google Scholar

Morrissey, J. et al. Ein neuartiges Protein, das im marinen Phytoplankton allgegenwärtig ist, konzentriert Eisen an der Zelloberfläche und erleichtert die Aufnahme. Curr. Biol. 25, 364–371 (2015).

Artikel CAS PubMed Google Scholar

Moore, CM et al. Prozesse und Muster ozeanischer Nährstofflimitierung. Nat. Geosci. 6, 701–710 (2013).

Artikel CAS Google Scholar

Kumar, A. & Bera, S. Überprüfung der Stickstoffverwertung in Algen: ein Überblick über den Prozess der Regulierung und Assimilation. Bioresour. Technol. Rep. 12, 100584 (2020).

Artikel Google Scholar

Smith, SR et al. Entwicklung und Regulierung des Stickstoffflusses durch kompartimentierte Stoffwechselnetzwerke in einer Meeresdiatomee. Nat. Komm. 10, 4552 (2019).

Artikel PubMed PubMed Central CAS Google Scholar

Berg, GM, Glibert, PM, Lomas, MW & Burford, MA Organische Stickstoffaufnahme und Wachstum durch den Chrysophyten Aureococcus anophagefferens während einer Braunflut. Mar. Biol. 129, 377–387 (1997).

Artikel CAS Google Scholar

Andersen, RA, Saunders, GW, Paskind, MP & Sexton, JP Ultrastruktur und 18s rRNA-Gensequenz für Pelagomonas calceolata gen. et sp. Nov. und die Beschreibung einer neuen Algenklasse, der Pelagophyceae classis nov. J. Phycol. Rev. 29, 701–715 (1993).

Artikel CAS Google Scholar

Choi, CJ et al. Saisonale und geografische Übergänge in der Struktur der eukaryotischen Phytoplanktongemeinschaft im Atlantischen und Pazifischen Ozean. Vorderseite. Mikrobiol. 11, 542372 (2020).

Artikel PubMed PubMed Central Google Scholar

Duerschlag, J. et al. Nischenaufteilung durch photosynthetisches Plankton als Treiber der CO2-Fixierung im oligotrophen subtropischen Ozean des Südpazifiks. ISME J 1–12 https://doi.org/10.1038/s41396-021-01072-z (2021).

Worden, AZ et al. Globale Verbreitung einer Wildalge durch gezielte Metagenomik aufgedeckt. Curr. Biol. 22, R675–R677 (2012).

Artikel CAS PubMed Google Scholar

Dimier, C. é, Brunet, C., Geider, R. & Raven, J. Wachstums- und Photoregulationsdynamik des Picoeukaryoten Pelagomonas calceolata bei schwankendem Licht. Limnol. Ozeanogr. 54, 823–836 (2009).

Artikel CAS Google Scholar

Dupont, CL et al. Genome und Genexpression über Licht- und Produktivitätsgradienten in mikrobiellen Gemeinschaften im östlichen subtropischen Pazifik. ISME J. 9, 1076–1092 (2015).

Artikel CAS PubMed Google Scholar

Kang, Y. et al. Transkriptomische Reaktionen von vier Pelagophyten auf Nährstoff- (N, P) und Lichtstress. Vorderseite. Mar. Sci. 8, 636699 (2021).

Huff, JT, Zilberman, D. & Roy, SW Mechanismus für DNA-Transposons zur Erzeugung von Introns auf genomischer Ebene. Natur 538, 533–536 (2016).

Artikel PubMed PubMed Central CAS Google Scholar

Waterhouse, RM et al. BUSCO-Anwendungen von Qualitätsbewertungen bis hin zu Genvorhersage und Phylogenomik. Mol. Biol. Entwicklung 35, 543–548 (2018).

Artikel CAS PubMed Google Scholar

Nambiar, M. & Smith, GR Unterdrückung schädlicher meiotischer Rekombination in zentromeren Regionen. Semin Cell Dev. Biol. 54, 188–197 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Pessia, E. et al. Hinweise auf eine weitverbreitete GC-verzerrte Genumwandlung in Eukaryoten. Genombiol. Entwicklung 4, 675–682 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Chi, J., Mahé, F., Loidl, J., Logsdon, J. & Dunthorn, M. Das Meiose-Geninventar von vier Ciliaten zeigt die Prävalenz eines synaptonemalen Komplex-unabhängigen Crossover-Signalwegs. Mol. Biol. Entwicklung 31, 660–672 (2014).

Artikel CAS PubMed Google Scholar

Ramesh, MA, Malik, S.-B. & Logsdon, JM Ein phylogenomisches Inventar meiotischer Gene; Hinweise auf Sex in Giardien und einen frühen eukaryotischen Ursprung der Meiose. Curr. Biol. 15, 185–191 (2005).

CAS PubMed Google Scholar

Schurko, AM & Logsdon, JM Verwendung eines Meiose-Erkennungs-Toolkits zur Untersuchung alter asexueller „Skandale“ und der Entwicklung des Geschlechts. Bioessays 30, 579–589 (2008).

Artikel CAS PubMed Google Scholar

Ibarbalz, FM et al. Globale Trends in der Vielfalt des Meeresplanktons in allen Lebensbereichen. Zelle 179, 1084–1097.e21 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Frémont, P. et al. Umstrukturierung der genomischen Planktonbiogeographie im Oberflächenozean unter dem Klimawandel. Nat. Aufstieg. Chang. 12, 393–401 (2022).

Artikel Google Scholar

Ward, DM & Kaplan, J. Ferroportin-vermittelter Eisentransport: Expression und Regulierung. Biochim Biophys. Acta 1823, 1426–1433 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Gobler, CJ, Lonsdale, DJ & Boyer, GL Ein Überblick über die Ursachen, Auswirkungen und mögliche Behandlung schädlicher Braunflutblüten, die durch Aureococcus anophagefferens (Hargraves et sieburth) verursacht werden. Estuaries 28, 726–749 (2005).

Artikel Google Scholar

Agusti, S., Lubian, LM, Moreno-Ostos, E., Estrada, M. & Duarte, CM Projizierte Veränderungen im photosynthetischen Picoplankton in einem wärmeren subtropischen Ozean. Vorderseite. Beschädigen. Wissenschaft. Rev. 5, 506 (2019).

Artikel Google Scholar

Anderson, SI, Barton, AD, Clayton, S., Dutkiewicz, S. & Rynearson, TA Marine Phytoplankton-Funktionstypen zeigen unterschiedliche Reaktionen auf thermische Veränderungen. Nat. Komm. 12, 6413 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Martin, JH et al. Testen der Eisenhypothese in Ökosystemen des äquatorialen Pazifischen Ozeans. Nature 371, 123–129 (1994).

Artikel CAS Google Scholar

Shi, D., Xu, Y., Hopkinson, BM & Morel, FMM Einfluss der Ozeanversauerung auf die Eisenverfügbarkeit für marines Phytoplankton. Wissenschaft 327, 676–679 (2010).

Artikel CAS PubMed Google Scholar

McQuaid, JB et al. Karbonatempfindliches Phytotransferrin kontrolliert die hochaffine Eisenaufnahme in Kieselalgen. Natur 555, 534–537 (2018).

Artikel CAS PubMed Google Scholar

Turnšek, J. et al. Proximity-Proteomik in einer marinen Kieselalge zeigt einen mutmaßlichen Eisentransportweg von der Zelloberfläche zum Chloroplasten. eLife 10, e52770 (2021).

Artikel PubMed PubMed Central Google Scholar

Urzica, EI et al. Die Analyse auf System- und Transsystemebene identifiziert konservierte Eisenmangelreaktionen in der Pflanzenlinie[W][OA]. Plant Cell 24, 3921–3948 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Mao, X. et al. Vielfalt, Prävalenz und Expression von Cyanase-Genen (cynS) in planktonischen Meeresmikroorganismen. ISME J. 16, 602–605 (2022).

Artikel CAS PubMed Google Scholar

Ou, L., Cai, Y., Jin, W., Wang, Z. & Lu, S. Verständnis der Stickstoffaufnahme und -assimilation des chinesischen Stammes von Aureococcus anophagefferens (Pelagophyceae). Algenres. 34, 182–190 (2018).

Artikel Google Scholar

Shu, CJ, Ulrich, LE & Zhulin, IB Die NIT-Domäne: ein vorhergesagtes Nitrat-responsives Modul in bakteriellen sensorischen Rezeptoren. Trends Biochemie Sci. 28, 121–124 (2003).

Artikel CAS PubMed Google Scholar

Wu, SQ, Chai, W., Lin, JT & Stewart, V. Allgemeine Stickstoffregulation der nasR-Expression des regulatorischen Nitratassimilationsgens in Klebsiella oxytoca M5al. J. Bakteriol. 181, 7274–7284 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Durand, NC et al. Juicer bietet ein Ein-Klick-System zur Analyse von Hi-C-Experimenten mit Schleifenauflösung. Zellsystem 3, 95–98 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Li, R., Li, Y., Kristiansen, K. & Wang, J. SOAP: kurzes Oligonukleotid-Alignment-Programm. Bioinformatik 24, 713–714 (2008).

Artikel CAS PubMed Google Scholar

Alberti, A. et al. Nukleotidsequenzen von viralem bis metazoischem Meeresplankton von der Tara Oceans-Expedition. Wissenschaft. Daten 4, 170093 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Kopylova, E., Noé, L. & Touzet, H. SortMeRNA: schnelle und genaue Filterung ribosomaler RNAs in metatranskriptomischen Daten. Bioinformatik 28, 3211–3217 (2012).

Artikel CAS PubMed Google Scholar

Kim, D., Song, L., Breitwieser, FP & Salzberg, SL Zentrifuge: schnelle und empfindliche Klassifizierung metagenomischer Sequenzen. Genomres. https://doi.org/10.1101/gr.210641.116 (2016).

Vurture, GW et al. GenomeScope: schnelle referenzfreie Genomprofilierung aus kurzen Lesevorgängen. Bioinformatik 33, 2202–2204 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Vaser, R. & Šikić, M. Noch ein De-novo-Genomassembler. BioRxiv. https://doi.org/10.1101/656306 (2019).

Liu, H. et al. SMARTdenovo: ein De-novo-Assembler, der lange, verrauschte Lesevorgänge verwendet. Gigabyte 2021, 1–9 (2021).

Artikel Google Scholar

Kolmogorov, M., Yuan, J., Lin, Y. & Pevzner, PA Zusammenstellung langer, fehleranfälliger Lesevorgänge mithilfe von Wiederholungsdiagrammen. Nat. Biotechnologie. 37, 540–546 (2019).

Artikel CAS PubMed Google Scholar

Ruan, J. & Li, H. Schnelle und genaue Long-Read-Assemblierung mit wtdbg2. Nat. Methoden 17, 155–158 (2020).

Artikel CAS PubMed Google Scholar

Wick, RR, Schultz, MB, Zobel, J. & Holt, KE Bandage: interaktive Visualisierung von De-novo-Genomassemblierungen. Bioinformatik 31, 3350–3352 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Vaser, R., Sović, I., Nagarajan, N. & Šikić, M. Schnelle und genaue De-novo-Genomassemblierung aus langen unkorrigierten Lesevorgängen. Genome Res 27, 737–746 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Aury, J.-M. & Istace, B. Hapo-G, Haplotyp-bewusstes Polieren von Genomassemblierungen mit genauen Lesevorgängen. NAR Genomics Bioinform. 3, lqab034 (2021).

Benson, G. Tandem Repeats Finder: ein Programm zur Analyse von DNA-Sequenzen. Nukleinsäuren Res. 27, 573–580 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Morgulis, A., Gertz, EM, Schäffer, AA & Agarwala, R. Eine schnelle und symmetrische DUST-Implementierung zur Maskierung von DNA-Sequenzen geringer Komplexität. J. Comput Biol. 13, 1028–1040 (2006).

Artikel CAS PubMed Google Scholar

Smit, AFA, Hubley, R. & Green, P. RepeatMasker. http://repeatmasker.org/ (2013).

Price, AL, Jones, NC & Pevzner, PA De-novo-Identifizierung von Wiederholungsfamilien in großen Genomen. Bioinformatik 21, i351–i358 (2005).

Artikel CAS PubMed Google Scholar

Quinlan, AR & Hall, IM BEDTools: eine flexible Suite von Dienstprogrammen zum Vergleich genomischer Merkmale. Bioinformatik 26, 841–842 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Pedersen, BS & Quinlan, AR Mos Depth: schnelle Abdeckungsberechnung für Genome und Exome. Bioinformatik 34, 867–868 (2018).

Artikel CAS PubMed Google Scholar

Schulz, MH, Zerbino, DR, Vingron, M. & Birney, E. Oases: Robuste De-novo-RNA-seq-Assemblierung über den dynamischen Bereich der Expressionsniveaus. Bioinformatik 28, 1086–1092 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Zerbino, DR & Birney, E. Velvet: Algorithmen für die De-novo-Short-Read-Assembly unter Verwendung von De-Bruijn-Graphen. Genomres. 18, 821–829 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Li, H. et al. Die Sequenz Alignment/Map-Format und SAMtools. Bioinformatik 25, 2078–2079 (2009).

Artikel PubMed PubMed Central CAS Google Scholar

Marchler-Bauer, A. et al. CDD: Die konservierte Domänendatenbank von NCBI. Nukleinsäuren Res. 43, D222–D226 (2015).

Artikel CAS PubMed Google Scholar

Niang, G. et al. METdb: Eine genomische Referenzdatenbank für Meeresarten. F1000Research, https://doi.org/10.7490/f1000research.1118000.1 (2020).

Kent, WJ BLAT – das BLAST-ähnliche Ausrichtungswerkzeug. Genomres. 12, 656–664 (2002).

CAS PubMed PubMed Central Google Scholar

Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Einfaches Suchwerkzeug für die lokale Ausrichtung. J. Mol. Biol. 215, 403–410 (1990).

Artikel CAS PubMed Google Scholar

Birney, E., Clamp, M. & Durbin, R. GeneWise und genomwise. Genomres. 14, 988–995 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Stanke, M. et al. AUGUSTUS: Ab-initio-Vorhersage alternativer Transkripte. Nukleinsäuren Res. 34, W435–W439 (2006).

Artikel CAS PubMed PubMed Central Google Scholar

Dubarry, M. et al. Gmove ist ein Tool zur Vorhersage eukaryotischer Gene anhand verschiedener Beweise. F1000Research, https://doi.org/10.7490/f1000research.1111735.1 (2016).

Sibbald, SJ, Lawton, M. & Archibald, JM Mitochondriale Genomentwicklung in Pelagophytenalgen. Genombiol. Entwicklung 13, evab018 (2021).

Quevillon, E. et al. InterProScan: Proteindomänen-Identifikator. Nukleinsäuren Res. 33, W116–W120 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

Buchfink, B., Reuter, K. & Drost, H.-G. Empfindliche Proteinausrichtungen im Lebensbaummaßstab mit DIAMOND. Nat. Methoden 18, 366–368 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Aramaki, T. et al. KofamKOALA: KEGG Ortholog-Zuweisung basierend auf Profil-HMM und adaptivem Score-Schwellenwert. Bioinformatik 36, 2251–2252 (2020).

Artikel CAS PubMed Google Scholar

Delmont, TO et al. Konvergenz des funktionellen Repertoires entfernt verwandter eukaryotischer Planktonlinien, die im sonnenbeschienenen Ozean häufig vorkommen. Zellgenomik 2, 100123 (2022).

Artikel CAS Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Pesant, S. et al. Offene wissenschaftliche Ressourcen für die Entdeckung und Analyse von Daten aus den Tara-Ozeanen. Wissenschaft. Daten 2, 150023 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Aumont, O., Ethé, C., Tagliabue, A., Bopp, L. & Gehlen, M. PISCES-v2: ein biogeochemisches Ozeanmodell für Kohlenstoff- und Ökosystemstudien. Geowissenschaftliche Modellentwickler. 8, 2465–2513 (2015).

Artikel CAS Google Scholar

Clayton, S. et al. Biogeochemische versus ökologische Konsequenzen der modellierten Ozeanphysik. Biogeowissenschaften 14, 2877–2889 (2017).

Artikel CAS Google Scholar

Ravindra, K., Rattan, P., Mor, S. & Aggarwal, AN Verallgemeinerte additive Modelle: Beweise für Luftverschmutzung, Klimawandel und menschliche Gesundheit liefern. Umgebung. Int. 132, 104987 (2019).

Artikel CAS PubMed Google Scholar

Günther, F. & Fritsch, S. neuralnet: Training neuronaler Netze. RJ 2, 30–38 (2010).

Artikel Google Scholar

Gobler, CJ et al. Nische der schädlichen Alge Aureococcus anophagefferens durch Ökogenomik entdeckt. Proz. Natl Acad. Wissenschaft. USA 108, 4352–4357 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Guo, L. et al. Die Genomassemblierung von Nannochloropsis ozeanica liefert den Beweis für die Zerstörung des Wirtskerns durch den Symbiontenkern während der Artbildung. Komm. Biol. 2, 1–12 (2019).

Artikel CAS Google Scholar

Bowler, C. et al. Das Phaeodactylum-Genom enthüllt die Evolutionsgeschichte der Diatomeengenome. Natur 456, 239–244 (2008).

Artikel CAS PubMed Google Scholar

Armbrust, EV et al. Das Genom der Kieselalge Thalassiosira pseudonana: Ökologie, Evolution und Stoffwechsel. Wissenschaft 306, 79–86 (2004).

Artikel CAS PubMed Google Scholar

Worden, AZ et al. Grüne Evolution und dynamische Anpassungen anhand der Genomen der marinen Picoeukaryoten micromonas. Wissenschaft 324, 268–272 (2009).

Artikel CAS PubMed Google Scholar

Palenik, B. et al. Der winzige Eukaryote Ostreococcus liefert genomische Einblicke in das Paradoxon der Planktonartbildung. PNAS 104, 7705–7710 (2007).

Artikel CAS PubMed PubMed Central Google Scholar

Moreau, H. et al. Genfunktionen und Genomstruktur in Bathycoccus prasinos spiegeln zelluläre Spezialisierungen an der Basis der grünen Abstammungslinie wider. Genombiol. 13, R74 (2012).

Artikel PubMed PubMed Central Google Scholar

Read, BA et al. Das Pangenom des Phytoplanktons Emiliania untermauert seine weltweite Verbreitung. Natur 499, 209–213 (2013).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken den folgenden Personen, die diese Arbeit ermöglicht haben, für ihr Engagement: dem Genoskop/CEA, dem CNRS (insbesondere der Federation de Recherche R2022/Tara Oceans GO-SEE), Marie-José Garet-Delmas von der Roscoff Culture Collection für den Anbau der RCC100-Stamm, Claude Scarpelli für die Unterstützung im Hochleistungsrechnen und Linda Sperling für die Sprachbearbeitung. Die Berechnungen wurden mit der Cobalt-HPC-Maschine durchgeführt. Wir danken FRANCE GENOMIQUE (ANR-10-INBS-09–08) und Oceanomics (ANR-11-BTBR-0008) für die finanzielle Unterstützung. Wir danken auch der Tara Expedition Foundation und ihren Partnern für die Organisation meereswissenschaftlicher Expeditionen (http://oceans.taraexpeditions.org). Dieser Artikel ist Beitrag Nr. 139 von Tara Oceans.

Metabolische Genomik, Genoskop, François-Jacob-Institut, CEA, CNRS, Universität Evry, Université Paris-Saclay, 91057, Evry, Frankreich

Nina Guérin, Marta Ciccarella, Elisa Flamant, Paul Frémont, Sophie Mangenot, Benjamin Istace, Benjamin Noel, Caroline Belser, Laurie Bertrand, Eric Pelletier, Adriana Alberti, Olivier Jaillon, Patrick Wincker, Jean-Marc Aury und Quentin Carradec

Research Federation for the Study of Global Ocean Systems Ecology and Evolution, R2022/Tara Oceans GO-SEE, 3 rue Michel-Ange, 75016, Paris, Frankreich

Nina Guérin, Elisa Flamant, Paul Frémont, Sophie Mangenot, Laurie Bertrand, Karine Labadie, Corinne Cruaud, Eric Pelletier, Adriana Alberti, Olivier Jaillon, Patrick Wincker und Quentin Carradec

Genoskop, François-Jacob-Institut, CEA, Universität Paris-Saclay, 2 Rue Gaston Crémieux, 91057, Evry, Frankreich

Karine Labadie & Corinne Cruaud

Sorbonne-Universität, CNRS, Roscoff Biological Station, AD2M, UMR7144, Place Georges Teissier, 29680, Roscoff, Frankreich

Sarah Romac & Charles Bachy

Universität Sorbonne, CNRS, FR2424, Station Biologique de Roscoff, 29680, Roscoff, Frankreich

Charles Bachy & Martin Gachenot

Universität Paris-Saclay, CEA, CNRS, Institut für Integrative Biologie der Zelle (I2BC), 91198, Gif-sur-Yvette, Frankreich

Adriana Alberti

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

SR, CB und MG führten P. calceolata-Kulturen und DNA/RNA-Extraktionen durch. AA-, EP- und CC-koordinierte DNA/RNA-Sequenzierung. BI, BN und JMA führten die Zusammenstellung und Annotation des Genoms durch. MC, SM, QC und JMA führten eine Genomanalyse durch. NG, EF und QC analysierten Umweltdatensätze. PF und OJ arbeiteten an P. calceolata-Modellen. QC und NG verfassten das Papier mit starker Unterstützung von JMA und PWCB, LB und KL führten jeweils die Vorbereitung, Sequenzierung und Analyse der Hi-C-Bibliothek durch. Alle Autoren haben zur Erstellung des Manuskripts beigetragen und die endgültige Fassung des Papiers genehmigt.

Korrespondenz mit Quentin Carradec.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Communications Biology dankt Senjie Lin, Ana Cabello und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Hauptredakteure: Linn Hoffmann und Luke R. Grinham. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Guérin, N., Ciccarella, M., Flamant, E. et al. Genomische Anpassung des Pikoeukaryoten Pelagomonas calceolata an eisenarme Ozeane, aufgezeigt durch eine Genomsequenz im Chromosomenmaßstab. Commun Biol 5, 983 (2022). https://doi.org/10.1038/s42003-022-03939-z

Zitat herunterladen

Eingegangen: 13. Dezember 2021

Angenommen: 02. September 2022

Veröffentlicht: 16. September 2022

DOI: https://doi.org/10.1038/s42003-022-03939-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Wissenschaftliche Berichte (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.