基因疾病搜索系统-电动液压滚圆机滚弧机折弯机张家港倒角机数控
作者:lujianjun | 来源:欧科机械 | 发布时间:2019-06-12 10:14 | 浏览次数:

随着现代测序技术的发展,产生海量生物数据,快速发展的生物信息学也在不断剖析这些数据的隐藏生物信息。通过生物网络研究基因型与疾病表型的关联关系从而实现致病基因的预测和寻找基因导致的疾病。基于疾病基因模块性特征,提出整合蛋白质相互作用网络、疾病表型相似性网络、疾病-基因对应网络,构建异构生物网络,改进网页排序算法TrustRank,对候选基因与疾病进行优先级排序,实现预测功能。本文还将通过Spark平台开发基因疾病搜索系统,数据存储在HBase中,形成大数据存储、处理、分析的解决方案,对临床诊断和疾病治疗提供新思路。 后的转移概率满足:MDG=p(gi|dj)=Ai,j/∑jAi,j(3)同理基因疾病搜索系统-电动液压滚圆机滚弧机折弯机张家港倒角机数控倒角机滚圆机,从基因到疾病的转移矩阵MGD满足:MGD=p(dj|gi)=Aj,i/∑iAj,i(4)首先构建生物信息的异构网络表明来自多个公共资源的先验信息,表示成G=(V,E),其中V表示节点集合本文由公司网站弯管机滚圆机滚弧机网站采集转载中国知网整理! http://www.gunyuanji.wang ,E表示边集合,蛋白质相互作用网络是无向无权图;疾病-基因对应网络是有向无权图;疾病表型相似性网络是无向有权图。在异构网络中存在着4种状态转移,抽象出来即如图1所示。1.2改进TrustRank算法本文设计疾病表型-基因关联算法YSearch是基于网页排序算法TrustRank的设计改进,算法包括2种形式:查询疾病的致病基因以及查询基因导致的疾病。分别是在疾病表型相似性网络与蛋白质相互作用网络随机游走,还有疾病-基因二分网络的迭代处理。算法的设计代码描述如下图1整合后的异构网k算法:YSearch输入:G为蛋白质相互作用转移矩阵;D为疾病表型相似性转移矩阵;M为疾病-基因对应转移矩阵;α为调整参数;n为算法迭代次数输出:TR为分数Begins=SelectSeed()//种子集T算法的工作原理可概括为:先人工识别高质量节点(即种子集),种子集指向的节点质量也可能高,即TR值高,与种子集节点连接越远,节点的TR值越低。综上可知,TR算法也就是一个利用网络的拓扑性质动输入疾病或基因名称,也可以点击示例输入,再点击搜索,生成如图6所示的结果页面。比如搜索疾病寻找致病基因,通过输入疾病表型名称,在结果页面中展示了相关联的蛋白质名称与其相关度,然后可以点击蛋白质名称跳转到HPRD数据库中相关蛋白质的详尽解读内容。链接HRRD效果界面则如图7所示。同样查询基因导致的疾病也是类似操作。图5系统首图6搜索结果页面Fig.1期杨勤,等:基于内存计算的基因疾病搜索系统572基因疾病搜索系统-电动液压滚圆机滚弧机折弯机张家港倒角机数控倒角机滚圆机本文由公司网站弯管机滚圆机滚弧机网站采集转载中国知网整理! http://www.gunyuanji.wang