技術服務熱線:800-820-5086 | 400-880-5086 登錄 | 注冊 ENGLISH

疾病研究服務

2019-06-04點擊398次
分享:
 

疾病研究的科學思維

表型是一類能夠被人們觀察鑒定的生命體形態。從形態學層面到細胞學層面甚至分子生物學層面,此類形態伴隨著生命體的生老病死。可以說對表型的觀察是生命科學研究的根本。無論是遺傳學之父孟德爾還是進化論之父達爾文,無不通過對表型的觀察提出了杰出的理論。如果說臨床醫學主要聚焦于疾病表型的診斷,那么醫學生物學則在表型的基礎上著重于對內在本質的研究。使用合適的研究策略,透過現象看本質,是醫學生物學研究的重點所在。

正向遺傳學:從表型到基因型

正向遺傳學是在獲得疾病組織與正常組織的表型差異前提下,從表型入手,尋找產生表型的突變基因并且研究其具體分子機制。一個完整的正向遺傳學研究包括以下幾個主要步驟:疾病選擇,樣本收集,突變基因篩查以及分子機制研究。該方法的一大優勢在于臨床樣本有顯著的疾病表型,對后續的突變基因篩查和分子機制研究有著良好的生物學意義上的支持。然而,相比較其優勢,正向遺傳學的劣勢也是顯而易見的。正向遺傳學研究需要大量的符合用于科學研究的臨床樣本,這針對那些罕見疾病的研究,卻反而成為限制正向遺傳學應用的瓶頸。

反向遺傳學:從基因型到表型

由于正向遺傳學在科學研究中對樣本需求的局限性,人們同時也提出了反向遺傳學的研究思路。一個完整的反向遺傳學研究包括以下幾個主要步驟:基因篩選,表型觀察,分子機制研究。該方法相比于正向遺傳學,其優勢在于前期的基因篩選無需大量臨床樣本作為表型支撐。具有快速簡單的特征。然而,反向遺傳學的難點也恰恰在于此。對于一個完整的生命科學工作,沒有表型數據的支撐充其量只是一個有趣的化學實驗。因此,為了使整個工作提升生物學價值并且降低整個項目進展的風險性,在確定待研究的基因后,首先需要對該基因進行細胞系的過表達或者敲降實驗,配合臨床樣本的表型分析,在確認表型之后,再進行大規模功能研究。

 

生命科學的發展促進了現代醫學的進步

自20世紀70年代以來,現代生物學技術迅猛發展,從而極大地推動了現代醫學的發展,特別是以分子生物學為代表的現代生命科學理論和實驗技術,是的我們對疾病的認識深入到分子水平。20世紀80年代研發并逐漸應用的重組DNA技術和PCR技術,應用異常基因作為對象,借PCR技術可將基因拷貝數擴增至天文數字;用實時定量PCR(qPCR)檢測基因的轉錄產物,靈敏度達10-11g(0.01ng)。開始于1990年由美、英、法、德、日合作進行的人類基因組計劃,要將人體細胞的23對染色體中的30億個堿基對進行識別和測序。此項工作原預期在2003年全部完成,但在2000年6月26日已提前公布了人類基因組圖譜及初步分析結果,2003年4月30日宣布人類基因組的精細測序工作全部完成。這將闡明基因如何在決定人類生長、發育、衰老和患病中起作用提供結構基礎,也為深入到基因和分子水平來認識遺傳性疾病和遺傳有關的疾病提供條件。進入21世紀后,隨著人類基因組測序的完成,醫學研究已從基因組學(genomics medicine)進入到后基因組時代(post genome era)。基因芯片和蛋白芯片等高通量技術的日臻成熟和應用,將為疾病的研究提供動態深入的綜合信息,開展功能基因的研究,有助于發現疾病基因和抗病基因。生物信息學技術、生物芯片技術、轉基因和基因敲除技術、酵母雙雜交技術、基因表達譜分析、蛋白組學、結構基因組學和高通量細胞篩選技術等的應用為現代醫學對疾病的認識提高到一個新水平。

 

高通量組學技術助力精準醫療

隨著人類基因組計劃(Human Genome Project)的完成,基因組測序技術取得了長足的進步,這直接導致了每兆基因組成本的大幅下降以及檢測的基因組數量越來越多。人們對基因組的復雜性深感震驚,這也引導著測序技術的進一步發展。近期的一些突破性技術使得測序技術在更短的時間內可以獲得更多的數據量。與之對應的是,還有一些技術的進步使得單條序列的測序讀長變得更長——這對解析結構性的復合區段是非常必要的。這些進展給科研人員以及醫療診斷人員提供了一個技術平臺使得人們對基因組變異導致的表型變化以及疾病發生有了進一步的了解。

自從DNA的雙螺旋結構被人們解析開始,人們在探究健康與疾病的基因組的復雜性與差異性上做出了巨大的努力。為了支持人類基因組計劃的順利進行,人們在儀器和試劑上做出了巨大的改進。該計劃的完成使得人們強烈的意識到人們需要更多更好的技術與數據分析能力來回答隨之而來的一系列生物學問題。然而,通量的限制以及高昂的測序成本成為了人們進一步了解基因組的一道坎。2000年之后推出的高通量測序平臺很好地解決了這個問題,人類基因組測序的成本直接因此下降50000倍,并且由此產生了一個新的名詞:下一代測序(next-generation sequencing,NGS)。在過去的十年中,NGS技術不停的在進步,根據National Human Genome Research Institute的數據,人類基因組測序的成本也已經下降到1000美元/人。隨著Illumina在2017年推出新一代的測序儀NovaSeq,人類基因組測序的成本甚至有望降到100美元。

 

基因組學研究

全基因組測序(Whole genomics sequencing)正在成為NGS在醫學研究中最廣泛的應用之一。通過該技術并且結合生物學應用,研究人員可以獲得基因組信息中值得注意的信息。舉例來說,2012年,Ellis等報道了基因與乳腺癌患者芳香酶抑制劑(aromatase inhibitor)治療法之間的關聯。他們指出突變,后果與診斷之間的關聯,同樣還有癌癥相關基因的突變的富集。這提供了一個可能性,即:乳腺癌有不同的突變造成不同的表型,具有復雜的病理學。近期的NGS平臺的改進使得研究人員發現了一些幾年前難以想象的新觀點與機會。在2010年,1000例基因組計劃(1000 genomes project)開放了其從179個個體中獲得的WGS原始數據以及697個個體的測序數據。到2015年,研究人員已經構建了26個不同人群的2504個人的基因組群體。給人們從種群的角度來觀察人類的變異。但這還不是該項目的終點,越來越多的人的基因組正在被得以測序。種群水平的測序已經成為人們更好的理解人類疾病的一個重要的工具,同樣也得到了意想不到的結果。一個例子是,Sidore等對2120個撒丁島人(Sardinians)的WGS研究發現了一些新的和脂肪相關的基因以及炎癥的標志物,給人們對血液膽固醇的分子機制的研究提供了新思路。

全外顯子組測序(Whole-exome and targeted sequencing)同樣也廣泛應用于測序的研究中。受制于基因組材料大小的局限,更多的個人樣本可以在一個測序中實現,增加了基因組研究的寬度以及深度。使用外顯子測序,Iossifov等對超過2500個單一的家庭進行測序,每個家庭都有一個小孩患有自閉癥(autism spectrum disorder, ASD)。研究人員在30%的樣本中發現了錯意突變(missense mutations),基因干擾的突變(gene-disrupting mutations)以及拷貝數的變異。該工作與其他的工作一道鑒定到了ASD相關的基因突變。其他證據表明,高覆蓋度的WGS也可以解決復雜的變異以及臨床樣本的分析。2015年,Griffith等認為可以使用一個跨平臺的方法(包含靶向測序)來鑒定腫瘤中高可信度的SNPs。該方法中,作者認為10000×的覆蓋度可以鑒定到稀有突變。由于10000×的覆蓋度對于WGS而言實在過高,靶向測序便在臨床中得到了廣泛的應用。

測序的方法除了能夠應用于SNPs的高通量檢測,目前也同時用于拷貝數變異(Copy Number Variation,CNV)和其它結構變異的研究。CNV作為一種介于染色體變異和DNA序列變異中間尺度的變異類型,已被證明與多種遺傳性疾病和腫瘤密切相關。目前,在產前遺傳病篩查和新生兒疾病診斷領域中,CNV變異已成為必不可少的檢測項目;在癌癥研究領域,CNV也已被多項研究證明參與了癌癥的發生和發展,其數量和復雜程度更是許多癌癥的預后指標。目前,相對于測序,基因芯片是檢測CNV變異最為常用的方法之一,有著可靠、重復性好、分辨率高的特點。

 

轉錄組學研究

在對轉錄水平上的研究也因為組學技術受益匪淺。轉錄組是指特定組織或細胞在某一發育階段或功能狀態下轉錄出來的所有RNA的集合。近10年來,高通量測序技術得到了突飛猛進的發展,在此基礎上,出現了高通量RNA 測序。與基因芯片技術相比,RNA-seq 無需設計探針,能在全基因組范圍內以單堿基分辨率檢測和量化轉錄本,并且具有更高的檢測靈敏度和動態范圍。在快速獲得mRNA表達譜的同時,根據測定的序列同時可以對cSNP、可變剪接等轉錄本的序列及結構信息進行精確地分析;另外對于檢測低豐度轉錄本和發現新轉錄本具有其獨特優勢。隨著測序成本的不斷下降,RNA-seq成為了越來越受歡迎的轉錄組分析方法。

人類基因組只有不到2%的序列編碼蛋白質,十多年前普遍認為基因組中那些剩余的序列大多都是進化過程中產生的“垃圾”和“噪音”。然而ENCODE計劃證明人類基因組剩余的“垃圾”序列至少80%都是有功能的,這些序列的轉錄產物就包括大量的非編碼RNA。ncRNA中除了眾所周知的tRNA、rRNA等,多種具有調控功能的ncRNA越來越被大家所關注,例如研究非常成熟的miRNA。緊接著,lncRNA,circRNA等非編碼RNA也開始進入大家的視野,并且迅速成為研究的新熱點。這些ncRNA往往具有組織和細胞特異性,在表觀遺傳調控、轉錄及轉錄后調控等水平參與蛋白編碼基因的調控。

今天,研究人員甚至能夠使用深度測序對單個細胞進行研究。2014年,Treutlein等使用了組織發育過程中不同細胞類群的單細胞RNA測序發現了用于鑒定細胞亞群的標志物。此外,盡管長讀長測序相對而言在對轉錄本的定量上不占優勢,但是,長讀長可以在研究轉錄組的結構上有所幫助。舉例來說,近期的人類長讀長轉錄組測序研究表明 >10%的reads是新的可變剪切體。

 

表觀組學研究

組學技術同樣在表觀遺傳修飾研究中有廣泛的應用。表觀基因組學(Epigenomics)主要研究基因組水平上的表觀遺傳學改變,即研究非DNA序列改變的化學修飾所導致的基因表達水平的變化。在基因組學中,表觀遺傳修飾主要包括DNA甲基化、組蛋白修飾、染色體重塑等。

DNA甲基化在人類表觀遺傳、胚胎發育、基因組印記及腫瘤發生中的重要作用。近些年,隨著DNA甲基化研究的深入,DNA甲基化分析方法層出不窮,按其原理的不同,主要可分為依賴于甲基化敏感的限制性內切酶技術、依賴于DNA序列分析的檢測技術和依賴于甲基化芯片、質譜的檢測技術等。2010年,Flusberg等發表了一個概念性的研究方法,即:使用PacBio來區分甲基化與非甲基化的堿基。由于聚合酶即便是甲基化的堿基也能夠延伸,但在甲基化位點上會停留更多的時間,因此這里改變的信號可以認為含有甲基化修飾。

RNA的修飾和DNA修飾相比,其組成更加復雜,有研究報道,包括m6A甲基化修飾在內的修飾種類就已經達到了上百種之多。如何能夠最大程度的鑒定這些修飾位點是RNA的表觀轉錄組學研究的關鍵所在。除此之外,針對RNA上百種的修飾,其生物學意義也是值得我們去廣泛研究的。針對此,我們可以使用針對RNA的高通量測序技術結合正向遺傳學與反向遺傳學研究思路,對RNA的修飾進行大規模的鑒定與生物學研究。

 

宏基因組學研究

在人體內“定居”的微生物對人類健康的影響深遠。人體內微生物的數量是人類細胞的10 倍之多,這些微生物的編碼基因總量是人類基因數目的 50-100倍,被統稱為宏基因組(metagenome)。基于NGS技術,宏基因組測序避開了微生物分離培養的過程,為微生物的研究提供了高效的研究工具。隨著測序通量和數據分析能力的不斷提高,宏基因組測序液從16S rRNA測序發展到全基因組鳥槍測序,從而能夠在基因水平上研究微生物之間以及微生物與宿主之間的相互作用,更好的詮釋人體微生物與人類健康的關系,同時也有助于疾病的預防和治療。

 

多組學整合研究

生命現象的發生和調控過程是非常復雜的,在腫瘤、自身免疫疾病、代謝疾病等復雜疾病的發生發展過程中,在干細胞分化、胚胎發育與物種進化等生命現象中,會涉及到基因組、轉錄組、蛋白質組及表觀遺傳等多層面的變化及調控。在大數據時代,將多個組學數據結合起來的整合研究——多組學(Multi-omics)研究,是一大趨勢。對于一個復雜的疾病或生命現象的研究,要綜合考慮其表型以及生理生化指標以及基因組、轉錄組、蛋白質組、表觀遺傳及代謝組等多層面的變化。將上述多組學的數據整合分析,以掌握其全局的變化過程,為研究其調控機制和精準醫療提供綜合解決方案。

多組學的數據分析中涉及到甲基化對mRNA與lncRNA乃至miRNA的轉錄前調控作用;lncRNA對mRNA的轉錄前及轉錄后調控作用;miRNA對mRNA的轉錄后降解和抑制的調控作用;內源競爭性RNA(ceRNA)通過對miRNA的結合而對mRNA的調控作用;CNV對基因表達的劑量效應;SNV對基因功能的影響以及對信號通路基因的激活和抑制作用,等等。




 

一、Biomarker研究介紹

1998年,美國NIH將生物標志物(Biomarker)定義為:一種可客觀檢測和評價的特性,可作為正常生物學過程、病理過程或治療干預藥理學反應的指示因子。生物標志物作為最直接快速有效的診斷手段之一,其篩選與獲得可在疾病預防、早期診斷、分子分型、個體化治療、療效監測、預后評估等多個方面發揮重要的作用,同時也是藥物開發的重要靶標。尋找和發現有價值的生物標志物是科研與臨床運用結合的重要途徑之一,已經成為精準醫療中非常重要的一部分。

高通量的芯片和測序技術為在全基因組水平上繪制高分辨率的基因組變異、RNA轉錄、轉錄因子結合、DNA甲基化、組蛋白修飾等研究提供了前所未有的機遇。這些技術產生了海量的多平組學數據,為生物標志物的開發提供了大量的“素材”,然而,如何有效地進行數據挖掘(Data Mining)仍然是一個巨大的挑戰。如果僅僅使用傳統的統計方法對這樣龐大的數據量進行處理分析,并要揭示分析結果呈現出來的規律和趨勢,以便對應到實際應用中,這顯然是非常困難的。數據挖掘主要是應用相關技術,從大量不完整的、無序的、冗余的數據中,挖掘其中可能隱含的、還沒有被人們發現但是對研究結果和深層次研究有重要意義的信息。與生物信息學類似,數據挖掘也是一門交叉學科,綜合了人工智能、數據庫、可視化、并行計算等方向。

機器學習(Machine Learning)是一種實現人工智能的方法。目前對于機器學習的定義并不統一,比較具有權威性的是 H.Simon 的觀點:學習是指通過不斷改進,使得系統在再次遇到同樣或類似的工作時可以更好的完成的過程。不同層面的組學數據為發現疾病進程中不同的分子標志物和調控機制提供了基礎,結合高通量組學測序技術和機器學習算法各自的優勢, 可繪制出一幅全面的生物標志物圖譜,為疾病預防、早期診斷、分子分型、個體化治療、療效監測、預后評估等多個方面提供幫助。

 

二、研究思路

生物標志物研究的思路

 

三、研究內容

1、發現階段——應用組學技術,高通量篩選差異基因

(1)差異基因初步篩選

根據技術手段的不同,按照實驗分組,初步篩選在統計學上顯著差異的基因或位點,包括差異mRNA、miRNA、lncRNA、circRNA,差異CNV,或者差異CpG位點,也包括差異的微生物種類等。對于不同層面的組學數據,以及不同平臺產生的數據,應選擇合適的數據分析方法,對原始數據進行過濾、歸一化,然后根據實驗目的和樣本分組,應用正確的統計學算法找出差異顯著的基因。

 (2)特征選擇——利用機器學習的方法進行特征識別,對以上差異基因或位點進行排序

特征選擇(Feature Selection)是數據挖掘領域的一個熱門研究課題。在機器學習應用過程中,特征數量龐大、特征之間的關聯關系相對復雜、關聯關系間依賴性影響等問題,使得學習產生了諸多問題,比如:分析數據、訓練模型時間長,數據量大導致“維度災難”,模型過于復雜等等。通過特征選擇可以在保證數據原有屬性的同時,挑選出合適的屬性子集,去掉數據集中不相關和多余的屬性,減少特征數量,降低特征空間維數,從而提高數據質量,提高結果精度,使挖掘得到的屬性更易理解,并且加快挖掘的速度,縮短訓練時間。并且通過特征選擇可以分析出具有相關聯系的特征,方便研究人員理解整個數據的產生過程。對于生物標志物研究來說,由于高通量組學數據具有高維度的提點,我們必須從大量基因中選取一些特定的特征基因用于分類,才能取得較好的識別和分類效果。因此,特征選擇是整個生物標志物開發過程中關鍵的步驟之一。

特征選擇的常用算法有Lasso(Least Absolute Shrinkage and Selection Operator),遞歸特征消除 (Recursive Feature Elimination,RFE)等。

 

2、訓練階段——應用分類器算法建立分類模型,用于新樣本的分類預測

(1)平臺間驗證

從檢測成本和準確性上考慮,通常在臨床應用階段的Biomarker數目都不會太多,所以檢測平臺一般都會選擇中低通量的技術,比如qRT-PCR,焦磷酸測序等。而不同平臺之間存在系統誤差,因此就需要在建立模型之前先對特征選擇后的基因進行平臺間的驗證。在此階段,樣本上也應該使用區別于發現階段的一組新的樣本作為訓練集,從而擴大樣本以提高建模的準確性。在平臺間驗證的過程中,候選基因的范圍也會進一步縮小。

(2)建立分類模型

Biomarker從本質上來說是一種分類的工具,包括二分類和多分類。二分類的Biomarker主要用于早期診斷(疾病與否)、預后評估(轉移與否、復發與否)、療效監控(耐藥與否)等;多分類的比如早期診斷(不同腫瘤的診斷)、個體化用藥(腫瘤的分子分型)等。而機器學習這時候的主要功能就是分類器(Classifier),即在已有數據的基礎上構造出一個分類模型,并應用于新數據的分類預測。

建立分類模型的主要步驟包括:①將所有樣本分成訓練樣本(Training Set)和測試(Testing Set)樣本兩部分。②在訓練樣本上執行分類器算法,生成分類模型。③在測試樣本上執行分類模型,生成預測結果。④根據預測結果,計算必要的評估指標,評估分類模型的性能。以上過程叫做交叉驗證(Cross Validation)。

在整個過程中的核心是分類器算法,目前主要可以分為單模型算法和集成算法(Ensemble Algorithms)。前者主要有邏輯回歸(Logistic Regression),樸素貝葉斯(Naive Bayes),支持向量機(Support  Vector  Machine,SVM)等。

(3)模型評估

對于二分類問題,經常會用到ROC曲線來衡量模型分類的效果。ROC曲線指受試者工作特征曲線(Receiver Operating Characteristic Curve), 是反映敏感性和特異性連續變量的綜合指標,是用構圖法揭示敏感性和特異性的相互關系,它通過將連續變量設定出多個不同的臨界值,從而計算出一系列敏感性和特異性,再以敏感性為縱坐標、(1-特異性)為橫坐標繪制成曲線,曲線下面積越大,診斷準確性越高。在ROC曲線上,最靠近坐標圖左上方的點為敏感性和特異性均較高的臨界值。

 

3、驗證階段——通過擴大樣本的驗證評估分類模型的性能

在驗證階段,通常需要擴大樣本量,用另一組獨立樣本對模型進行進一步的驗證。對于候選的biomarker,同樣采用qRT-PCR等中低通量的方法進行定量,并放入模型中進行驗證。對于分類問題,一般也是通過ROC曲線來評估模型的分類效果。

另外,生存曲線可以作為腫瘤或其他疾病客觀可評價的終點指標來進行療效或者預后評價的指標。在腫瘤療效或者預后研究中我們可以用生存曲線進一步證明所篩選驗證的biomarker其臨床意義。

 

四、應用案例

1、局部晚期鼻咽癌轉移mRNA標志物

  • 客戶單位:中山大學腫瘤防治馬駿教授團隊
  • 期刊: Lancet Oncology
  • 影響因子:33.9
  • 發表時間:2018
  • 伯豪提供服務:表達譜芯片,數據分析

研究背景

鼻咽癌是我國常見的頭頸腫瘤,其中以華南為高發地區。約70%的鼻咽癌患者在就診時已經處于局部區域晚期(無遠處轉移),嚴重威脅著我國人民的生命健康。目前局部區域晚期鼻咽癌患者仍有20-30%的在治療后會出現遠處轉移,成為治療失敗的主要原因。采取傳統的腫瘤臨床N分期方法,預測遠處轉移的準確性僅為57%左右;并且,相同分期的患者接受同樣的治療后常常出現不同的生存結局,臨床上缺乏有效的標志物指導鼻咽癌患者的治療方案選擇。

研究思路

研究結果

針對上述情況,馬駿教授團隊開展了大規模的鼻咽癌分子標志物研究,團隊通過表達譜芯片對接受治療后有無出現遠處轉移的鼻咽癌組織全基因組表達水平進行對比分析,從數萬個基因中初步鎖定137個差異表達基因,再用Lasso回歸算法從410例患者中篩選13個遠處轉移相關的基因構建分子標簽,用Cox回歸構建風險模型,將病人分為高風險組和低風險組。結果顯示,高風險組患者5年遠處轉移率高達37%,低風險組則僅為9%。

原文出處:Tang XR, Li YQ, Liang SB, et al. Development and validation of a gene expression-based signature to predict distant metastasis in locoregionally advanced nasopharyngeal carcinoma: a retrospective, multicentre, cohort study. Lancet Oncology 2018, 19(3):382-393.

 

2、DNA甲基化預測早期肝癌術后復發

  • 客戶單位:中山大學腫瘤防治中心元云飛和李斌奎教授團隊
  • 期刊: Journal of clinical oncology
  • 影響因子:20.982
  • 發表時間:2017
  • 伯豪提供服務:450k甲基化芯片,數據分析

研究思路

 

研究結果

研究者首先對66例病人的樣本采用450K甲基化芯片檢測,過濾得到2550個差異CpG位點。為區分高風險和低風險的病人,采用LASSO和SVM-RFE算法分別得到了30個顯著差異的CpG位點。通過將這兩種算法得到的CpG位點進行聯合,共篩選出46個不同的CpG位點。

研究者隨后采用Cox回歸模型在訓練組中進一步縮小了病人的甲基化檢測位點,發現三個甲基化位點(cg20657849(SCAND3), cg19406367(SGIP1)和cg19931348(PI3))與病人復發高度相關。

 

隨后研究者采用焦磷酸測序技術,分別在訓練組和鑒定組中量化這一發現。另外一組內部樣本和兩組外部樣本對這一模型進行驗證。ROC分析發現,預測模型預測早期肝癌病人復發比三個CpG位點單獨檢測更有效。為了建立臨床上適用的用來預測個體復發的模型,綜合考慮了協變量后,研究者用諾模圖建立了可以用來預測的模型。研究者生成了一個諾模圖預測患者的5年生存率,通過三個校正點的檢測均得到理想結果。

原文出處:Qiu J, Peng B, Tang Y, et al. CpG Methylation Signature Predicts Recurrence in Early-Stage Hepatocellular Carcinoma: Results From a Multicenter Study. J Clin Oncol 2017, 35(7):734-742.

 

3、肝癌早期診斷miRNA

  • 客戶單位:中山醫院樊嘉院士團隊
  • 期刊:Journal of clinical oncology.
  • 影響因子:18.97
  • 發表時間:2011
  • 伯豪提供服務:Agilent miRNA芯片,數據分析

研究背景

目前常用的肝癌診斷方法有影像學和生物標志物法,但靈敏性和準確率都不夠,以至于只有約30%的肝癌能被早期診斷出來。復旦大學附屬中山醫院、復旦大學肝癌研究所樊嘉教授課題組利用microRNA芯片從不同人群血漿中篩選到了由7個microRNA組成的早期肝癌診斷分子標記物,將其整合后建立起診斷模型,可用來成功“區分”健康人、慢性乙肝患者、乙肝肝硬化患者和肝癌患者。

研究思路

研究結果

選取137個血清樣本(57個肝癌患者(HCC)、33個健康人、22個慢性乙型肝炎患者(CHB)、25個肝硬化患者),用miRAN芯片(可檢測723個miRNAs位點)對其進行檢測。發現了15個差異miRNAs用于后續的qRT-PCR驗證。

擴大樣本在上述15個miRNAs中qRT-PCR驗證,7個miRNAs入選預測模型 ,建立回歸模型,使用ROC曲線對這個模型預測HCC的準確性進行了評估,AUC =0.864 (95% CI, 0.826 to 0.895;靈敏性68.6%;特異性90.1%)。隨后,用309個血清樣本進行了模型的驗證,ROC曲線分析結果為:AUC =0.888 (95% CI, 0.852至0.917;靈敏性81.8%;特異性83.5%)。

此外,為了觀察此模型的預測效果與疾病發展歷程的關系,對不同疾病階段(BCLC階段分別為0、A、B、C)進行了預測,預測結果準確性分別為0.888、0.888、0.901、0.881,表明此預測模型可用于不同發病階段HCC的疾病診斷。研究人員利用microRNA芯片篩選、RT-PCR驗證等方法尋找到7個microRNA的組合,這一組合能對乙型肝癌(hepatitis B virus related HCC)患者進行早期診斷。

原文出處:Zhou J, Yu L, Gao X, et al. Plasma microRNA panel to diagnose hepatitis B virus-related hepatocellular carcinoma. J Clin Oncol 2011, 29(36):4781-8.

 

4、血小板RNA-seq早期診斷不同癌癥

  • 期刊: Cancer Cell
  • 影響因子:23.214
  • 發表時間:2015

研究背景

作為血液中第二豐富的細胞類型,血小板是由骨髓造血組織中的巨核細胞產生。多功能造血干細胞在造血組織中經過定向分化形成原始的巨核細胞,又進一步成為成熟的巨核細胞。成熟的巨核細胞膜表面形成許多凹陷,伸入胞質之中,相鄰的凹陷細胞膜在凹陷深部相互融合,使巨核細胞部分胞質與母體分開。這些被細胞膜包圍的與巨核細胞胞質分離開的成分脫離巨核細胞,經過骨髓造血組織中的血竇進入血液循環成為血小板。

外界刺激如血小板表面受體的激活和脂多糖介導的血小板激活,甚至在癌細胞和腫瘤微環境的基質細胞和免疫細胞的刺激條件下,血小板的pre-mRNA能被剪接為成熟RNA,然后轉化為功能性蛋白應對外部刺激。

研究結果

Myron的研究團隊,從283名對象身上抽血,分離血小板并提取RNA,隨后進行高通量測序,通過差異基因篩選和SVM建模,基于腫瘤血小板的RNA測序能夠區分出228名是腫瘤患者(包括局部和轉移腫瘤)和55名是健康個體,其準確率達96%。也可以區分6種不同類型的腫瘤,其準確率達到了71%。結果表明,腫瘤血小板mRNA為泛癌癥檢測、腫瘤分類和腫瘤突變基因診斷提供了一個有價值的平臺,并促進了基于血液的液體活檢的發展。

伯豪改進

伯豪生物的生物信息團隊首先通過計算機對多種不同的特征選擇和分類模型算法進行大規模計算評估,不斷優化算法。

根據計算機模擬結果,特征選擇模型為SVM,biomarker數量為400,邏輯回歸作為分類模型。結果顯示,伯豪算法的預測準確性為76%,由于文獻中的71%。

原文出處:Best MG, Sol N, Kooi I, et al. RNA-Seq of Tumor-Educated Platelets Enables Blood-Based Pan-Cancer, Multiclass, and Molecular Pathway Cancer Diagnostics. Cancer Cell 2015, 28(5):666-676.

 

 

 

相扑君的逆袭电子游戏 t腾讯游戏现在那款赚钱 6粒复式二中二多少组 516李逵劈鱼下载官网 重庆时时全天计划群 无错30码特围 时时彩后二八码怎么倍投 北京pk赛车8码稳赚技巧 上涨股票推荐 微信上有什么关注可以赚钱的 北京十一选五预测推荐 双色球是假的,不要上当 四个号码复式三中三多少组 开赌塘怎么赚钱 黑红梅方下载 街机西游争霸内购破解版 红树林时时彩平台