您所在的位置: 網站首頁 >> 科學研究 >> 科技創新 >> 科研成果 >> 正文

3044永利集团彭小甯教授課題組在《Briefings in Bioinformatics》發表論文

(李尋亞)近日國際生物信息學頂級期刊《Briefings in Bioinformatics》在線發表了3044永利集团彭小甯教授課題組研究長文(Article)“Improving feature selection performance for classification ofgene expression data usingHarris Hawks optimizer withvariable neighborhood learning”。該研究采用了一種新的智能算法-哈裡斯鷹優化算法(variable neighborhood learning Harris Hawks optimizer,VNLHHO)并結合樸素貝葉斯分類器選擇腫瘤特征基因,為腫瘤關鍵基因的識别提供了一種新的思路。

從基因表達數據中挖掘出與腫瘤相關的關鍵基因在癌症的診斷和治療中起着至關重要的作用。然而,由于表達數據的高維性和樣本數量的有限性,從表達數據中獲得這些關鍵基因一直是一項具有挑戰性的難題。課題組采用VNLHHO算法對8種腫瘤基因表達數據集(數據來源:http://csse.szu.edu.cn/staff/zhuzx/Datasets.html)的研究顯示:VNLHHO在Colon、Central Nervous System和Lung 3種腫瘤的平均分類精度都達到了96.128%以上,對另外5種腫瘤(Leukemia, Lymphoma, Myeloid/Lymphoid Leukemia(MLL), Ovarian, andSmall Round Blue Cell Tumors (SRBCT))的分類精度達到了100%。與其它目前常用算法的對比,結果顯示VNLHHO在分類精度和AUC值方面都具有明顯優勢。對測試樣本的基因表達譜數據進行了層次聚類分析,熱圖顯示采用VNLHHO法所篩選出的基因能夠很好的區分各種不同類型的樣本。通過對所篩選出的特征基因進行醫學驗證,進一步驗證了VNLHHO算法的正确性和有效性。

我校3044永利集团彭小甯教授為該文的通信作者,彭小甯教授指導的生物資源與環境科學學院2019級碩士張露鵬、李金龍為該文并列第1作者。《Briefings in Bioinformatics》為中科院SCI期刊分區生物大類一區,在Mathematical & Computational Biology小類中排名第2,在Biochemical Research Methods小類中排名第3,2020年影響因子為11.622。

下一條:Reaction of pyridoxamine with malondialdehyde Mechanism of inhibition of formation of advanced lipoxidation end-products

關閉