月季是世界上重要的觀賞植物,具有經濟,文化和象征意義。月季在全世界種植,并以花園月季,切花和盆栽植物的形式出售。月季是遠親種,可以有各種倍性。我們的目標是通過對雙單倍體進行測序,為月季開發(fā)高質量的參考基因組,結合長短reads,并錨定到高密度遺傳圖上,并研究其主要觀賞性狀的基因組結構和遺傳基礎.。我們從Rosa chinensis 'Old Blush'產生了一個雙單倍體月季('HapOB')并產生一個月季基因錨定到7個偽染色體(512 Mb,N50為3.4 Mb和564個contig)。512Mb代表估計的月季單倍體基因組大小的90.1-96.1%。在組裝中,95%僅包含在196個contigs中。使用高密度二倍體和四倍體遺傳圖驗證掛載率。我們描述了染色體特征,包括周圍區(qū)域,通過注釋轉座元件家族和使用熒光原位雜交定位著絲粒重復序列。月季基因組與草莓屬基因組顯示出廣泛的同線性,我們只劃定了兩個重要的重組。從不同的屬種選擇七種二倍體和一種四倍體重測序數(shù)據分析遺傳多樣性。結合遺傳和基因組的方法,確定了關鍵裝飾性狀的潛在遺傳調控因子,包括刺的密度和花瓣數(shù)量。認為月季APETALA2 / TOE同系物是月季花瓣數(shù)量的主要調節(jié)者。這個參考序列是研究多倍體化,減數(shù)分裂和發(fā)育過程的重要資源,正如針對花和刺的發(fā)展所展示的。它還將通過開發(fā)與性狀相關聯(lián)分子標記以加速育種,識別基因,探索薔薇科的共線性關系。
結果:
1.高質量的參考基因組
從二倍體雜合品種'Old Blush'中到晚期的單核小孢子發(fā)育階段使用花藥培養(yǎng)物開發(fā)了單倍體愈傷組織細胞系(HapOB)。該用分布在七個連鎖群的10個微衛(wèi)星標記驗證HapOB系的純合性。 Illumina和PacBio測序技術用來組裝雙單倍體HapOB基因組序列。 PacBio測序數(shù)據用CANU組裝,產生551contig(N50為3.4 Mb),總長度為512 Mb。所獲得的序列,95%僅包含在196個contig中。K-mer譜分析(K = 25)表明532.7 Mb的基因組大小. 而流式細胞儀分析估計的基因組大小1C = 568±9 Mb。 因此,組裝的序列代表96.1%或90.1%。
開發(fā)了高密度的雌性和雄性遺傳圖譜從R. chinensis ‘Old Blush’和Rosa wichurana (OW)雜交中。其中196個contig手動錨定到七個連鎖群上,大部分在雌性和雄性遺傳圖譜上(分別為174和143 contig)。總之,466 Mb因此錨定在遺傳圖譜上并組裝成7條偽染色體,代表90%的組裝contig長度(表1)。
在基因組組裝中定位著絲粒
使用生物信息學和細胞遺傳學方法鑒定著絲粒區(qū)域。 發(fā)現(xiàn)了一個非常豐富的串聯(lián)重復的單體(159 bp長),我們稱之為OBC226(圖2a)。PCR證實了這種重復的串聯(lián)組織(圖2b)。FISH分析明確確認了重復的位置在七條染色體中的四條中(Chr2,Chr5,Chr6和Chr7(圖2c)。比對 OBC226的重復序列揭示了所有HapOB偽染色體覆蓋率很高除Chr1外,這就解釋了為什么沒有明顯的著絲粒區(qū)域檢測到(圖2d)。在Chr3和Chr4上,OBC226的拷貝數(shù)可能也是很低以至于沒有被FISH檢測到。 此外,核心OBC226著絲粒重復側翼有其他重復序列,而這些在染色體上分布不均勻,核心著絲粒區(qū)域密度較高(圖2d)。 這些著絲粒區(qū)域也富集Ty3 /Gypsy轉座元素。 總之,這些結果證實了這七個偽染色體上的著絲粒區(qū)域并揭示當前分配給Chr0的高重復序列含量和低基因含量。
相關文章: