微生物基因組學(xué)(Genomics)是利用全基因組DNA序列研究微生物基因及其功能的學(xué)科。近年來,由于DNA測序自動化與信息技術(shù)的飛躍發(fā)展,用1~2年時間就可完成一種微生物的全基因組序列測定。自1995年美國首次將第一個原核細菌—流感嗜血桿菌的全基因組序列公布以來,目前至少已有32種病原菌的全基因組測序已告完成,另有超過20多種病原菌的全基因組測序正在進行,數(shù)以萬計的病原菌基因?qū)⒈昏b定出來。
細菌是一大群原核細胞型微生物,其基因組比真核生物的基因組要小得多,僅為人類基因組(31.647億堿基對)的百分之一到千分之一,而且沒有內(nèi)含子結(jié)構(gòu),是試驗基因測序及分析方法的理想系統(tǒng)。多年來,科學(xué)家對細菌的生理學(xué)、細胞學(xué)、分子生物學(xué)和致病性研究所獲得的大量知識,使細菌成為研究和分析基因組序列與相關(guān)生物學(xué)功能關(guān)系的理想模式。細菌基因組研究的關(guān)鍵方法與策略,對完成多細胞真核生物,如美麗線蟲(Caenorhabditiselegans)、果蠅、小鼠、基準(zhǔn)野草(Arabidopsis thalians)乃至人類全基因組的草圖具有重要指導(dǎo)意義。
絕大多數(shù)細菌的基因組是單一閉合環(huán)狀的雙鏈DNA分子,大多數(shù)細菌基因組的大小介于0.6~4.7Mb,最大的大腸埃希菌含有4.64Mb。最近研究發(fā)現(xiàn),霍亂弧菌的基因組由兩個環(huán)狀染色體組成,大小分別為2.96Mb與1.07Mb。原核細胞型微生物基因組的大小與其代謝及形態(tài)學(xué)的復(fù)雜程度成比例。支原體、疏螺旋體、密螺旋體和立克次體的基因組大小均小于1.5Mb,如生殖器支原體染色體為0.58Mb。它們有些是專性細胞內(nèi)寄生的微生物,另一些則要求苛刻的培養(yǎng)條件才能生長。在同種或同屬的細菌中,它們的基因組大小的差別不大。
細菌基因組的排列特征是:一些基因可在染色體上單獨存在,轉(zhuǎn)錄為一種mRNA,翻譯為一種蛋白質(zhì);而大多數(shù)情況下,編碼相關(guān)功能的一小串基因位于一個操縱子上,自一個啟動子開始,轉(zhuǎn)錄成多基因的mRNA分子,翻譯成多種功能相關(guān)的蛋白質(zhì)。細菌蛋白質(zhì)的分子量平均為45kDa,因此可推算出編碼蛋白質(zhì)的基因的平均長度為1.1kb。細菌染色體序列分析表明,大腸埃希菌有4288個基因,其中1/3基因的功能不清楚。基因之間的距離大約為118bp,距離大于600bp的基因很可能含有獨立的調(diào)節(jié)序列。細菌基因組分析真實反映了細菌染色體編碼的產(chǎn)物。在大腸埃希菌中鑒定的蛋白質(zhì)為細菌的動力、趨向性、物質(zhì)轉(zhuǎn)運、生物合成、生物氧化等多種生命活動所必需。
病毒基因組的化學(xué)成分為DNA或RNA,籍此分為DNA病毒和RNA病毒兩大類。病毒核酸與細菌核酸不同,可呈線型或環(huán)型,分為雙鏈RNA、單鏈RNA、分節(jié)段RNA、單鏈DNA或雙鏈DNA。病毒核酸的大小差別懸殊,例如,人類細小病毒僅由5kb組成,而最大的痘類病毒則含有4Mb。病毒基因的轉(zhuǎn)錄與轉(zhuǎn)譯均需在細胞內(nèi)進行,因此,病毒基因組的組成與真核細胞的基因組相似,而不同于細菌等原核細胞的基因組。例如,細菌基因組無內(nèi)含子,而病毒基因組中有內(nèi)含子,需通過轉(zhuǎn)錄后剪接和加工;病毒核酸存在基因重疊現(xiàn)象。
病毒的核酸是決定病毒的感染性、復(fù)制特性和遺傳性的基礎(chǔ)。隨著病毒基因克隆、序列分析及基因表達等技術(shù)的應(yīng)用,目前幾乎對所有病毒科的代表病毒進行了基因克隆與核苷酸測序。病毒基因的序列對于了解可能編碼的病毒蛋白的數(shù)量和性質(zhì)、病毒基因復(fù)制和表達的調(diào)控機制具有重要意義。
由于大多數(shù)細菌的基因組大小一般在0.6~4.7Mb之間,快速核苷酸序列測序的策略需借助于經(jīng)典的鳥槍法(shot gun)建立基因文庫,然后進行隨機克隆測序。這種方法首先用于流感嗜血桿菌全基因組序列測定,目前幾乎成為微生物全基因組序列測定的標(biāo)準(zhǔn)方法。其基本步驟為:先將細菌染色體DNA機械性隨機切割成一定大小的DNA片段,分別插入質(zhì)粒載體以構(gòu)建二套DNA文庫,即:
(1)小片段文庫:選擇平均約為2kb的切割產(chǎn)物,將末端補平,克隆到經(jīng)Smal處理過的克隆載體(如pUC18/pUC19、pBluescript系列)上。選擇這種分子量范圍的小片段,其目的是盡量減少單個插入片段中存在完整基因的可能性。因為某些基因表達毒性產(chǎn)物可導(dǎo)致宿主菌死亡,使該片段丟失,導(dǎo)致測序過程中缺口總數(shù)增多。
(2)大片段文庫:包含15~20kb的隨機切割產(chǎn)物,克隆到λ噬菌體載體中。
此外,還可以用多種限制性內(nèi)切酶分別消化細菌染色體DNA,回收一定大小的DNA片段,將這些片段克隆到相應(yīng)的限制性內(nèi)切酶消化過的測序載體中。這樣就可以獲得多種內(nèi)切酶的不完全文庫。文庫構(gòu)建完后,可進行大規(guī)模的測序。
每個從DNA測序儀上讀取的原始序列,首先經(jīng)過一個簡單的程序,將兩端載體序列切除,然后集中到一個數(shù)據(jù)庫中。目前用于組裝全基因組的計算機程序主要是美國基因組研究所所編制的TIGRASSEMBLER軟件。高質(zhì)量的序列片段和每條序列片段的長度為400bp是該軟件成功拼接的保證。但組裝后的序列片段之間仍有缺口存在,需用DNA印跡法、蛋白質(zhì)連接法、大片段文庫法和長距PCR等方法才能將所有缺口補平。
DNA序列拼接工作完成后,經(jīng)過計算機分析,完成全基因組各個區(qū)域的編號和注釋,最后存入數(shù)據(jù)庫,并在互聯(lián)網(wǎng)上發(fā)表以供全世界的科學(xué)家參考和使用。
截止2001年底,已完成55種微生物的基因組測序工作,其中包括29種病原菌(表1-1),有130余種微生物的基因組序列正在測定中。在多個互聯(lián)網(wǎng)中(如www.tigr。org/tdb/mdb/mdbinprogress.html)中,可以查閱到有關(guān)微生物全基因組序列測定完成的最新資料。
表1-1 已完成基因組測序的致病菌及其所致疾病
病原菌株 | 所致主要疾病 |
流感嗜血桿菌(H.influenzae)Rd 幽門螺桿菌(H.pylori)26695和J99 大腸埃希菌 K12(E.coli K12)MG1655 大腸埃希菌O157:H7 結(jié)核分枝桿菌(M.tuberculosis)H37Rv 麻風(fēng)分枝桿菌(M.laprae) 胎兒彎曲菌(C.fetus)NCTC11169 產(chǎn)單核細胞李氏菌(L.monocytogens)EGD-2-e 腦膜炎奈瑟菌(M.meningitides)A型Z2491和B型MC58 淋病奈瑟菌(N.gonorrhoeae)FA1090 化膿性鏈球菌(S.hemolyticus) 福氏志賀菌(S.flexneri)2a * 表皮葡萄球菌(S.epidermidis) * 銅綠假單胞菌(P.aeruginosa)PA01 霍亂弧菌(V.cholerae)N1696 肺炎鏈球菌(S.pneumoniae) 產(chǎn)氣莢膜梭菌(C.perfringens) 空腸彎曲菌(C.jejuni) 鼠疫耶氏菌(Y.petis)C092 杜氏嗜血桿菌(H.ducreyi) 百日咳鮑特菌(B.pertussis) 傷寒沙門菌(S.typhi) 腸炎沙門菌(S.enteritidis) 白喉棒狀桿菌(C.diphtheriae) 伯氏疏螺旋體(B.burgdorferi)B31 梅毒螺旋體(T.pallidum)Nicholas 鉤端螺旋體(L.interrogans) * 普氏立克次體(P.prowazekii)MadridE 康氏立克次體(R.conarii)Malish7 肺炎衣原體(C.pneumoniae)CWL029和AR39 沙眼衣原體(C.trachomatis)D/UW-3/Ck和Mopn 生殖器支原體(M.genitalium)G-37 肺炎支原體(M.pneumoniae)M129 溶脲脲原體(U.urealyticum) | 腦膜炎、中耳炎 胃炎、消化性潰瘍 腸道感染、泌尿系統(tǒng)感染 出血性結(jié)腸炎、溶血性尿毒綜合征 結(jié)核病 麻風(fēng) 胃腸炎 李斯特菌病、流產(chǎn) 腦膜炎 淋病 化膿性感染,敗血癥 泌尿系統(tǒng)感染、細菌性心內(nèi)膜炎、敗血癥 局部化膿性感染等 霍亂 肺炎、菌血癥、腦膜炎 氣性壞疽、食物中毒 鼠疫 百日咳 腸熱癥 腸炎 白喉 梅毒 鉤體病 鈕扣熱 急性呼吸道感染、動脈硬化癥 沙眼 呼吸道疾病 |
*:為我國科學(xué)家完成的測序項目
細菌全基因組序列測定完成后,更重要的任務(wù)是鑒定基因及盡可能確定基因的功能,稱之為后基因組學(xué)。通常采用開放讀碼框(ORF)推定、密碼子使用和同源性比較等技術(shù)鑒定基因。應(yīng)用新近出現(xiàn)的軟件BLOCK、PROSITE、BEAUTY、MOTIFFINDER等,將基因組中的功能性序列序區(qū)鑒定出來。主要分析內(nèi)容包括:①發(fā)現(xiàn)開放讀碼框和排除重復(fù)序列;②查詢基因和蛋白數(shù)據(jù)庫;③檢查用碼傾向;④檢查功能位點。
病原菌全基因組測序的重要用途是:研究和鑒定有關(guān)的毒力基因,尋找抗菌藥物作用的靶位以及編碼保護性抗原的基因。例如,采用BLAST軟件,將預(yù)期的編碼序列與GenBank數(shù)據(jù)庫中已知基因的序列作比較,在蒼白螺旋體1041個基因中搜查出可能是毒力因子的有70個,而其中只有半數(shù)認定與毒力相關(guān)。采用PHD軟件可以預(yù)示細菌基因組中的跨膜蛋白序列,用SIGNALP軟件可將一些基因的信號序執(zhí)業(yè)獸醫(yī)列識別出來。此外,應(yīng)用基因敲除法(knock-out)、條碼標(biāo)記誘變(signature-taggedmutagenesis)技術(shù),以及遺傳性足跡試驗等方法,亦可發(fā)現(xiàn)一系列與細菌致病作用有關(guān)的基因。
將種屬密切相關(guān)的細菌全基因組序列進行比較,可以獲知細菌基本代謝的保守基因和特異性基因。利用高密度寡核苷酸微陣列(high density oligonucleotide arrays)雜交技術(shù),即DNA芯片(DNA chip)技術(shù),可以確定病原菌基因在宿主中的表達情況。
微生物基因組序列測定完成后,后基因組學(xué)的主要目標(biāo)應(yīng)是,綜合利用各學(xué)科的優(yōu)勢與技術(shù),闡明各個基因的功能,找出毒力因子和具有保護宿主功能的因子,為開發(fā)新的治療藥物和新型疫苗奠定基礎(chǔ),為防治疾病找到更加理想的途徑。目前,后基因組研究采用的主要技術(shù)有:
DNA芯片技術(shù) 美國1998年正式啟動“BIOCHIP”計劃。DNA芯片技術(shù)的基本原理是:①合成成千上萬特異的寡核苷酸探針,密集點布并固定在只有郵票大小的硅片、玻片或尼龍膜等固相支持物上,即制成DNA芯片;②抽提不同條件下的樣本mRNA,用熒光染料標(biāo)記后,與DNA芯片上的列陣探針雜交;③應(yīng)用共聚焦顯微鏡掃描,記錄雜交結(jié)果,對雜交位點及其信號強弱進行分析,找出差異表達的基因。通過電腦分析,可以判別標(biāo)本中的特異性病原。
DNA芯片可用于基因診斷、設(shè)計基因藥物等。例如,結(jié)核分枝桿菌H37RV株全基因組序列為4.41Mb,有3 924個開放讀碼框編碼蛋白質(zhì),用含97%開放讀碼框的DNA芯片檢測結(jié)核分枝桿菌對異煙肼反應(yīng)的基因,發(fā)現(xiàn)異煙肼誘導(dǎo)表達的基因包括一個操縱子基因簇,由5個基因組成。利用DNA芯片,比較結(jié)核分枝桿菌H37Rv、牛型結(jié)核分枝桿菌和卡介苗3個菌株之間的差異,分析卡介苗保護效果不一致的原因,得到一些有意義的結(jié)果,證明卡介苗菌株一直在不斷演變。
體內(nèi)表達技術(shù)(in vivo expression technology) 首先要建立DNA文庫,將DNA片段與某www.med126.com些缺失了啟動子的基因連接,只有插入的DNA片段具有啟動子活性,細菌才能在宿主體內(nèi)生存。識別這些基因,可以初篩不同入侵階段表達的基因及其對致病的影響程度,以及宿主如何控制致病菌基因的表達。
基因中斷技術(shù)(gene disruption) 包括條碼標(biāo)記轉(zhuǎn)座子誘變(signature-tagged transposon)和等位交換(allelic exchange)等方法,其原理是:帶標(biāo)記的具有不同特征的轉(zhuǎn)座子或質(zhì)粒DNA片段稱為tag。tag一般約為80bp,可分為臂和可變區(qū)兩部分,臂位于兩端,可供設(shè)計PCR引物。用帶tag的轉(zhuǎn)座子或質(zhì)粒構(gòu)建不同基因被中斷的突變株,獲得的突變株各有一個特異的tag。用一組帶不同tag的突變株接種動物模型,篩選突變后毒力減弱或消失的突變株,從而鑒定出毒力基因。
基因互補法(gene complement) 將毒力株的基因克隆到同種或近種無毒/弱毒株中,觀察毒力的改變及程度,篩選使后者毒力增強的基因。應(yīng)用該方法發(fā)現(xiàn)結(jié)核分枝桿菌H37Rv株有EIS(enhanceintracellular survival)基因,而在牛型結(jié)核分枝桿菌和卡介苗中不存在。
差異熒光誘導(dǎo)法(differential fluorescent induction) 用于識別被宿主特定細胞和特定條件誘導(dǎo)的病原體基因及其啟動子。常用綠色熒光蛋白(GFP)作為標(biāo)記,可以自動化、高通量篩選,不涉及代謝營養(yǎng)要求。
雙向凝膠電泳與質(zhì)譜技術(shù) 蛋白質(zhì)是生物功能的主要表現(xiàn)者,是致病微生物主要的致病因子之一。細胞內(nèi)全部蛋白質(zhì)及其活動方式稱為蛋白質(zhì)組。蛋白質(zhì)組學(xué)(proteomics)是在基因組學(xué)基礎(chǔ)上形成的新興學(xué)科,是以蛋白質(zhì)組為研究對象,從分子水平上研究細胞內(nèi)蛋白質(zhì)的組成及其生命活動的規(guī)律。蛋白質(zhì)組可以分析非轉(zhuǎn)錄水平控制的細胞過程,補充DNA芯片等技術(shù)的不足。同基因組相比,蛋白質(zhì)組在時間、空間上具多樣性,變化性大。蛋白質(zhì)組學(xué)的研究主要包括:①細菌新蛋白質(zhì)及蛋白質(zhì)翻譯后修飾的鑒定;②細菌在不同狀態(tài)下的蛋白組學(xué)的比較;③細菌蛋白質(zhì)之間的相互作用,有助于設(shè)計新的防治微生物感染的方案。
蛋白質(zhì)組學(xué)需要各種類型的技術(shù)支撐,包括分離蛋白質(zhì)的凝膠電泳技術(shù)如雙向聚丙烯凝膠電泳(2D-PAGE),確定蛋白質(zhì)特性的質(zhì)譜(MS)分析技術(shù)等,并在不斷發(fā)展新的研究技術(shù),可以一次分離幾千甚至上萬蛋白質(zhì)點和鑒定出翻譯后加工的機制。
獲得微生物全基因組序列是認識微生物完整生物學(xué)功能的基礎(chǔ)。完整的基因組序列資料有助于更精確地研究微生物的形態(tài)發(fā)生、生長代謝、遺傳變異,鑒定有關(guān)的毒力及致病基因和抗微生物藥物作用的靶位,為研制和發(fā)展特異的診斷試劑和疫苗提供參考。
闡明病原微生物致病基因及其產(chǎn)物,對于了解其致病機制至關(guān)重要。根據(jù)病原微生物的全基因序列,應(yīng)用現(xiàn)代生物信息軟件對基因序列進行分析,可以確定哪些基因與毒力有關(guān),那些與體內(nèi)定居有關(guān),哪些與體內(nèi)持續(xù)感染有關(guān)。例如,流感嗜血桿菌的全基因序列測定完成后,很快就鑒定出25種與脂多糖生物合成相關(guān)的新基因,而在此之前僅發(fā)現(xiàn)7個基因。又如,研究發(fā)現(xiàn),結(jié)核分枝桿菌異枸櫞酸裂解酶基因和環(huán)丙烷合成酶編碼基因是造成持續(xù)感染的關(guān)鍵基因。異枸櫞酸裂解酶在細菌利用脂肪酸為碳源的代謝中十分重要。當(dāng)結(jié)核分枝桿菌侵入機體后,免疫系統(tǒng)介入,感染則由急性轉(zhuǎn)入持續(xù)感染,該菌轉(zhuǎn)為利用脂肪酸作為碳源這一代謝旁路。
通過全基因組測序及菌種(株)間基因組比較,發(fā)現(xiàn)一些可在細胞表面定居的細菌(如流感嗜血桿菌)的表面粘附分子受多重重復(fù)序列(multiple repeating sequences)控制,故可將該序列作為細菌粘膜定居的標(biāo)記基因。比較結(jié)核分枝桿菌與卡介苗的全基因組序列時發(fā)現(xiàn),卡介苗的一些菌株有16個區(qū)段存在核苷酸缺失,長度為1903~12 733bp不等。
由于細菌的致病基因往往有特殊的核苷酸序列,因此,在全基因組序列測定的基礎(chǔ)上,用計算機分析可找出毒力基因的熱點區(qū)—毒力島(pathogenicity island)。毒力島是一組編碼細菌毒力的基因簇,為染色體上一個分子量較大(>30kb)的DNA片段,常位于tRNA位點內(nèi)或其附近,兩側(cè)可有重復(fù)序列(RS)或插入序列(IS)。毒力島的發(fā)現(xiàn)為研究細菌的致病性和毒力因子提供了有效的途徑。但有關(guān)細菌毒力島的來源及其在不同細菌間水平轉(zhuǎn)移的機制尚不清楚。
對病原菌致病基因研究的傳統(tǒng)方法是采用單個基因敲除或突變的方法,即通過觀察某一基因的喪失或突變對病原菌功能的影響,然后通過動物模型,確定該基因與細菌致病作用的關(guān)系。但該方法具有明顯的局限性,難以從病原菌眾多的基因中鑒定出致病基因及致病基因間的相互關(guān)系。近年發(fā)展的條碼標(biāo)記誘變技術(shù)可同時誘變多至100個基因,產(chǎn)生基因敲除突變庫,并在各個被敲除的基因原位插入各自獨特的易被鑒定的條碼。將這些突變菌株分別接種動物,并觀察它們在動物中的致病能力。通過鑒定該突變菌的特定條碼,即可從基因敲除突變庫中篩選出某一致病相關(guān)基因。應(yīng)用這種“條碼標(biāo)記誘變”技術(shù)已成功地應(yīng)用于多種重要病原菌(如傷寒沙門菌、金黃色葡萄球菌及霍亂弧菌等)的致病性研究。
目前,對病毒的基因組研究已進入后基因組階段,即從全基因水平研究病毒的生物學(xué)功能,發(fā)現(xiàn)與致病及誘發(fā)免疫應(yīng)答相關(guān)的基因,從而揭示病毒與宿主之間的相互作用。例如,對病毒基因組或基因變異研究,有可能揭示致腫瘤病毒的部分致病機制,揭示與持續(xù)性感染相關(guān)的基因、基因變異或調(diào)控因子。
可以預(yù)見,在微生物基因組學(xué)的基礎(chǔ)上,細胞微生物學(xué)、微生態(tài)學(xué)、微生物生理學(xué)將從分子水平和細胞水平上揭示微生物之間、微生物與宿主之間、微生物和宿主與環(huán)境之間的相互作用,更深入地闡明病原微生物的致病機制,諸如細胞中微生物的受體,侵入細胞內(nèi)微生物的定位和新表位的發(fā)現(xiàn),對細胞器的影響和作用,宿主神經(jīng)系統(tǒng)和免疫系統(tǒng)的反應(yīng)等,從而更好地維持人體微生態(tài)平衡,提高機體抵抗力。
傳統(tǒng)的病原學(xué)監(jiān)測和診斷依賴于致病微生物的形態(tài)和培養(yǎng)特征。通過測定多種致病與非致病微生物的基因組序列,可以獲得大量的基因信息。如特異DNA序列用于診斷,菌株特異性基因用于分型,特異性毒力基因用于判斷疾病進展,耐藥基因用于預(yù)測臨床治療效果等。
近年來,微生物全基因序列測定工作的進展,使微生物的分子診斷技術(shù)發(fā)生了革命性的變化。例如,運用多對引物同時對多個可能的靶DNA片段進行擴增的“多重PCR”技術(shù),不僅大大提高了診斷效率,還可對單一標(biāo)本作出多種常見病原體的診斷。最近發(fā)展的DNA芯片技術(shù)更是核酸雜交技術(shù)的一次革命性飛躍,其用途包括:①鑒定病原微生物種類,進行臨床診斷;②用特異的寡核苷酸探針對病原微生物進行型或亞型分類;③用毒性基因或抗性基因特異的寡核苷酸探針預(yù)測疾病進展,監(jiān)測抗微生物藥物的療效等。
自1973年以來新現(xiàn)病原微生物有30多種,再現(xiàn)病原微生物有20多種,對人類的生存和發(fā)展構(gòu)成巨大的威脅。但是,人類迄今未能研制出特效抗病毒藥物,抗生素的泛用和濫用導(dǎo)致耐藥菌株不斷增加。因此,迫切需求發(fā)展新型高效的抗微生物藥物。
病原菌全基因組序列的測定,一方面能揭示細菌耐藥的確切機制,對現(xiàn)有抗菌藥物進行改造或開發(fā)新型藥物;另一方面可找到對細菌生存必不可少并在感染過程中常優(yōu)先表達的因子,選擇這些因子作為抗菌藥物的靶位點,可設(shè)計出具有針對性很強的藥物。通過與人類基因組序列比較,還可及早排除與人類同源的靶位,避免對人的毒副作用,降低藥物開發(fā)風(fēng)險。
病原微生物全基因組序列的測定還可大大加速新疫苗的研制。通過先進的計算機軟件對全基因組序列進行分析,可以預(yù)測出病原體的保護性抗原。這類蛋白抗原通常表達于細胞表面,并具有很高的免疫原性。從病原微生物全基因組序列中直接篩選高免疫原性的分析系統(tǒng)的開發(fā)與應(yīng)用,將為預(yù)防及治療性疫苗的研制提供極大便利。
本世紀(jì)初,微生物基因組學(xué)的成就將很快體現(xiàn)在微生物產(chǎn)業(yè)中。通過構(gòu)建更多高效的基因工程菌,可生產(chǎn)出各種外源基因表達的產(chǎn)物,包括抗癌、抗病毒、調(diào)節(jié)宿主免疫功能的藥物,以基因為靶標(biāo)的新藥物(包括反義寡核苷酸、核酶和DNA疫苗等)也將投放市場。
微生物全基因組序列的測定和分子生物學(xué)技術(shù)的飛速發(fā)展及應(yīng)用,將為人們提供更多的關(guān)于微生物致病性及其與宿主之間相互關(guān)系的信息。深入研究病原微生物如何利用宿主細胞功能,將有助于加深對細胞微生物學(xué)的認識。
某些蛋白與人類一些遺傳性疾。ㄈ邕z傳性非息肉性結(jié)腸癌、肝豆?fàn)詈俗冃?/a>、腎上腺腦白質(zhì)營養(yǎng)不良癥等)關(guān)系密切。微生物基因組序列的分析表明,在某些微生物中存在這些蛋白的類似物。通過以這些微生物為模型,可以研究這些蛋白及其編碼基因在人類遺傳性疾病中的作用。例如,腎上腺腦白質(zhì)營養(yǎng)不良癥患者的神經(jīng)退行性病變,是由長鏈脂肪酸代謝障礙引起的。研究發(fā)現(xiàn),與此代謝有關(guān)的兩個基因的類似序列在釀酒酵母菌中也存在。通過對酵母菌相關(guān)基因的研究,表明這兩個基因與激活長鏈脂肪酸的轉(zhuǎn)運有關(guān)。據(jù)此推測該基因缺陷在腎上腺腦白質(zhì)營養(yǎng)不良癥發(fā)生中起類似的作用。因此,微生物全基因組序列測定及相關(guān)基因功能研究,有助于推測特定基因變異在人類遺傳性疾病中的作用,提高對人類遺傳性疾病的診斷和治療水平。
據(jù)新近的估計,微生物的生物量占整個地球生物量的60%,而目前已知的微生物物種數(shù)占地球上實際存在的數(shù)量還不到10%,因此,尋找和鑒定微生物的工作將是微生物學(xué)家的一項重要任務(wù)。隨著微生物基因組全序列數(shù)據(jù)的迅速增加,人們對微生物在生命世界中的進化地位將有更準(zhǔn)確的界定,對微生物之間的親緣關(guān)系會有更深刻的了解,鑒定新發(fā)現(xiàn)微生物的能力迅速得到提高,并加深對基因功能的認識,發(fā)現(xiàn)更多的前所未有的新功能。例如,新近對詹氏甲烷球菌(Methanococcusjannaschii)全序列測定的結(jié)果證實了微生物學(xué)家曾經(jīng)提出的第3生物的科學(xué)預(yù)見,并有助于從分子水平上了解產(chǎn)生甲烷的遺傳性狀和基因調(diào)控。又如。對特別能耐受輻射的耐輻射球菌(Deinococcusradiodurans)基因組序列的測定和功能的研究,發(fā)現(xiàn)該菌具有超常的修復(fù)輻射損傷的能力,有可能利用其來消除環(huán)境中的重金屬和毒物污染。同樣,可以利用那些能夠生活在極冷、極熱或高壓、高鹽、高酸等極端環(huán)境中的細菌的功能基因,通過基因工程來改良農(nóng)作物和家畜,甚至有可能讓人類“學(xué)會”細菌的這些生活能力。
結(jié)束語
隨著為數(shù)眾多的微生物基因組被解碼和微生物功能基因組的研究與開發(fā),微生物學(xué)正面臨著革命性的飛躍。微生物基因組研究所獲得的信息將迅速地轉(zhuǎn)化為生產(chǎn)力,主要表現(xiàn)為微生物感染性疾病的防治與診斷將會徹底得到改觀,微生物作為模式生物將進一步促進生物學(xué)和生命科學(xué)的發(fā)展。
微生物基因組學(xué)的研究為生命科學(xué)開辟了新的研究領(lǐng)域,如生物信息學(xué)、比較基因組學(xué)、功能基因組學(xué)等,也帶來了新的研究思路和策略。生物信息學(xué)是用數(shù)理和信息科學(xué)的觀點、理論和方法,研究蛋白質(zhì)和核酸序列的結(jié)構(gòu)與功能的一門生物學(xué)與計算機信息交叉的學(xué)科,其主要內(nèi)容有二個:一是收集基因組和蛋白質(zhì)組的數(shù)據(jù);二是分析、解釋基因組和蛋白質(zhì)組的內(nèi)涵?梢,生物信息學(xué)將生命科學(xué)由傳統(tǒng)的實驗科學(xué)提升為理論科學(xué),將成為21世紀(jì)生物技術(shù)的核心。
通過對多種微生物的基因組作比較,可以鑒定出哪些基因是某些特定功能所必需的,確定哪些基因與病原菌的致病或毒力有關(guān),而這些基因的蛋白產(chǎn)物可能是具有很高免疫原性或抗菌藥物作用的靶位點。比較基因組學(xué)研究對進一步了解微生物的起源、進化和種系發(fā)育等帶來契機。
近年新興的微生物蛋白組學(xué)(microbial proteomics)技術(shù)與遺傳學(xué)、分子生物學(xué)、蛋白質(zhì)生化與生物物理學(xué)方法結(jié)合一起,可以從復(fù)雜的蛋白質(zhì)混合物中高通量分離、純化、檢測和鑒定微量蛋白質(zhì)。微生物蛋白組分析法將為進一步研究微生物基因功能、蛋白質(zhì)與基因、蛋白質(zhì)與蛋白質(zhì)的相互作用提供有用的工具。
(郭輝玉 中山大學(xué)中山醫(yī)學(xué)院)