新闻中心

EEPW首页 > 测试测量 > 设计应用 > 基于Alpha-NMF的AD样本分类及特异性基因选择方法

基于Alpha-NMF的AD样本分类及特异性基因选择方法

作者:时间:2012-05-25来源:网络收藏

由于NMF算法受初值和维数r的影响,因此对每组实验分别取r=2,3,4,5时运行NMF算法20次。为了衡量由于r值选取不同导致的聚类的稳定性问题,定义了一个共表型相关系数(图3稳定性比较),共表型相关系数越接近于1,越稳定。

本文引用地址:http://www.eepw.com.cn/article/193834.htm

h.jpg


观察图3和图4的结果,通过比较可以发现,随着r的增加,其相关系数和正确率普遍降低,当r=2时,其分类稳定性和识别正确率明显高于r=3,4,5时的情况。此时,算法相比标准NMF算法具有较高的分类准确性和稳定性。尤其当α=0.5时,效果最佳。因此,选择算法α=0.5,r=2处理后的集合基因,如图2所示,选择某一阈值(此处阈值为50),可以分别提炼出268个(HIP)、172(EC)个探针表达变化具有显著差异。

4 讨论
4.1 特异性基因及其功能分类
将上节提炼出的探针号与AD基因组进行比对,共确定有320个基因为特异性基因。这些基因主要于细胞信号传导、物质代谢、物质传输等生物过程有关。
MiMI(Michigan Molecular Interactions)是国家卫生研究所疾病预防控制综合生物情报中心中的一部分。它可以提供蛋白质间的相互作用,并且利用这些数据进行融合,集合成一个复杂的网络;还能检索大量基因的生物功能。
使用MiMI对上上述特异性基因进行功能分类,其中有88基爵在GO(Gene Ontology)上没有注释,因此没有对其分类,仅对其余的232个基因进行分类,根据分类结果,主要分为以下几类:1)物质代谢过程;包括蛋白质代谢、细胞氮化合物代谢、核苷酸代谢;2)细胞周期过程,包括细胞形态发生和发展、细胞自动调节机能、生殖细胞形成;3)定位过程,包括蛋白质定位、细胞定位、大分子定位;4)细胞成分组织,包括细胞内大分子聚集、细胞膜组织以及细胞内各器官组织;5)生物合成过程,包括核苷酸合成、小分子合成;6)基因表达、转录、翻译;7)神经系统调节,包括神经元的形成、神经突触传导、神经元变异、神经传导素生成及传输;8)细胞凋亡;9)物质运输,包括ATP水解耦合质子运输、阳离子运输、胞内蛋白质运输、离子跨膜运输。上述基因功能分类如表1所示。

j.jpg



评论


相关推荐

技术专区

关闭