百合:最大植物基因組背後的秘密

轉自:中國科學報

百合(Lilium spp.)以其迷人、芳香的花朵和營養豐富的鱗莖而被譽爲“球根花之王”,具有很高的觀賞、食用和藥用價值。然而,百合龐大的基因組給高質量的基因組組裝帶來了挑戰。此前該屬尚無參考基因組。

近日,南京農業大學園藝學院教授滕年軍團隊、副教授薛佳宇團隊,聯合華中農業大學園藝林學學院教授寧國貴團隊與福建農林大學教授明瑞光團隊等國內10多家科研團隊,公佈了百合高質量染色體級別基因組,成爲世界上首個正式報道的最大植物基因組。相關文章11月4日正式發表在《細胞》集團旗下的《創新》(The Innovation)上。

該研究創新性地解析了TE擴增和全基因組複製(WGD)對基因組膨脹的影響,發現了超長基因的獨特表達模式,並通過多組學整合分析揭示了百合小鱗莖的碳水化合物代謝機制。

國際期刊《園藝學研究》主編、南京農業大學教授程宗明說,這些成果爲理解巨型基因組的形成機制提供了新視角,併爲百合及其他百合科藥、食、觀賞多用植物(如川貝母)的基因組研究和分子設計育種打開了大門,尤其是在超大和超複雜基因組組裝、多倍化進化和代謝調控機制探索等方面提供了新方法、新思路、新洞見。非常高興這一研究由中國科學家領銜,聯合國際學者協同完成。

生物體複雜性與基因組大小是否相關?

基因組存儲了一個物種的完整遺傳信息,是理解其生物學特性和進化歷程的關鍵。“自然界中,不同生物的基因組揭示了生命之樹上基因組大小的巨大差異,其中一些植物擁有超大的基因組。然而,這些超大基因組的起源和形成機制卻不盡相同。”論文通訊作者滕年軍告訴《中國科學報》。

由於技術困難和高成本,迄今爲止,僅有少數大型基因組被解析。“生物體基因組大小的顯著多樣性具有重要的生物學意義,但生物體複雜性與基因組大小之間的相關性仍然不明確。”滕年軍說,大型複雜基因組的測序和組裝因多倍體、高雜合度和高重複序列比例等問題而具有挑戰性。

百合(Liliumspp.)是單子葉百合目百合科多年生植物,全世界約115種,其中中國有55個種和18個變種。中國百合的豐富多樣性有助於其廣泛利用,併爲科學研究提供了寶貴的資源。

論文共同通訊作者薛佳宇說,由於基因組遠大於其他真核生物,幾乎所有的百合物種都可以作爲研究生物體複雜性和基因組大小關係的理想模型。

蘭州百合(L. davidiivar. unicolor)是唯一可食用的甜百合品種,已在中國蘭州種植約150年,爲當地農民提供了重要的收入來源。然而,經過長期栽培,蘭州百合種性開始退化,降低了鱗莖產量與品質。

如何保存併發揚好我國這一優秀的種質資源,科學家試圖從基因的角度找到答案。“我們選擇蘭州百合進行基因組測序,一是顯示中國特色,二是希望獲得其巨大基因組的寶貴數據,從而促進其遺傳改良和育種工作,爲我國百合產業高質量發展提供重要理論指導。”滕年軍說。

超大型基因組因何形成?

論文共同第一作者、南京農業大學鐘山青年研究員徐素娟介紹,利用流式細胞實驗和K-mer分析,他們預估蘭州百合基因組的大小分別爲38.01 Gb左右,雜合率爲2.18%。細胞核型分析顯示其爲二倍體,具有12對巨型染色體。

隨後,結合Nanopore、Illumina和Hi-C數據,他們成功組裝得到了36.68 Gb的超大型基因組,96.99%的序列被掛載到12條染色體上。他們註釋87501個蛋白編碼基因,其中功能註釋比率爲89.54%。評估結果顯示,蘭州百合的基因組的高完整性、準確性和連續性。

這個百合基因組是2000年破譯的人類基因組的10倍以上,是迷你小巧的擬南芥基因組的293倍。

爲什麼百合會形成超大型基因組?薛佳宇,基因組大小的主要影響因素包括重複序列的積累和基因組多倍化。在蘭州百合基因組中,重複序列佔比高達88.31%,其中長末端重複反轉錄轉座子(LTR-RTs)佔64.40%。

分析顯示,蘭州百合的長末端重複反轉錄轉座子在近五百萬年以來發生急劇擴張。約165萬年前和約89萬年前,分別爆發了兩種擴張,其中的一些轉座子甚至發生了特異性的快速擴張。這些擴張對異染色質區域有偏好,抑制重組,降低長末端重複反轉錄轉座子去除率,從而造成短時間內長末端重複反轉錄轉座子的海量插入且無法去除,形成了蘭州百合超大的巨型基因組。

“全基因組複製也是基因組擴張的潛在原因。”論文共同通訊作者寧國貴說,百合經歷了兩輪全基因組複製事件,與金錢蒲、蘆筍等植物的共線性分析支持了這一結論。基於核基因的系統發育分析,將百合置於天門冬目的姊妹羣,兩者分化於7200萬年前。基於此係統框架,儘管近緣的洋蔥和大蒜都額外多經歷了兩輪全基因組複製,它們的基因組卻不到蘭州百合的一半大,表明百合在進化過程中展現出與它們不同的模式。

特有的基因形成和表達規律

“蘭州百合基因組中的長基因非常常見。”寧國貴說,其平均長度爲57.61 Kb。而長度超過50 Kb的基因被定義爲“超長基因”,佔33.88%。

“然而蘭州百合基因編碼序列的平均長度僅爲847.17 bp,提示我們其長內含子纔是形成超長基因的主要原因。”寧國貴說,百合基因的平均內含子長度約爲19.13 Kb,在所有已發表的植物基因組中僅次於攀枝花蘇鐵。

對基因表達模式的分析發現,百合基因長度與表達水平顯著相關,但表現出變化的趨勢:短於50 Kb的基因表達水平隨基因長度變長而持續上升,而長於50 Kb的基因則表達持續下降。他們推測,50 Kb可能是限制基因轉錄或內含子剪接效率的轉折點,這種表達變化尚未在其他物種中見到,可能爲百合獨有的特徵。

此外,他們還重點關注了與百合鱗莖相關的基因。百合鱗莖是儲存營養的器官,是東亞地區藥品和食品工業的重要資源。爲了研究百合小鱗莖發育過程中營養積累及其潛在機制,他們收集了五個發育階段的小鱗莖樣本,進行了全面的細胞學、轉錄組和代謝組分析。

研究發現,在小鱗莖發育的整個過程中,澱粉和蔗糖積累都在持續進行,而大量參與糖酵解代謝途徑的基因在小鱗莖中呈現出高度表達,表現出明顯的器官特異性表達模式。

此外,在五個發育階段的小鱗莖中檢測到總計870種代謝物,包括碳水化合物、脂類和酚酸等,展現出豐富的代謝多樣性。代謝組與轉錄組的關聯分析顯示,碳水化合物代謝物與一個基因表達模塊顯著相關,該模塊可能包含了編碼碳水化合物和澱粉代謝途徑酶的基因。

相關論文信息:https://doi.org/10.1016/j.xinn.2024.100726