简介:摘要目的通过加权基因共表达网络分析(WGCNA)识别脓毒症发生发展过程中的关键基因。方法从基因表达数据库(GEO)中下载基因表达数据集GSE154918,其中包含对照40例、无症状感染12例、脓毒症39例、脓毒症随访14例,共105例芯片数据。采用R软件筛选出脓毒症差异表达基因(DEG),用分布式访问视图集成数据库(DAVID)、检索交互基因的搜索工具(STRING)和可视化软件Cytoscape进行基因功能和通路富集分析、蛋白质-蛋白质相互作用(PPI)网络分析及关键基因分析,筛选出脓毒症发生发展过程中的关键基因。结果通过WGCNA并结合DEG表达分析得到46个候选基因,对这46个基因进行基因本体(GO)、京都市基因与基因组百科全书(KEGG)途径富集分析得到基因功能和参与的信号通路。进一步使用STRING数据库构建PPI网络,通过PPI网络可视化软件Cytoscape选出5个关键基因,包括肥大细胞表达膜蛋白1基因(MCEMP1)、S100钙结合蛋白A12基因(S100A12)、脂肪因子抵抗素基因(RETN)、c型凝集素结构域家族4成员基因(CLEC4D)、过氧化酶增殖因子活化受体基因(PPARG),对这5个基因分别进行表达差异分析,结果显示,在脓毒症患者中上述5个基因的表达水平较健康对照者显著性上调。结论本研究通过构建WGCNA方法筛选出有关脓毒症的5个关键基因,可能成为潜在的脓毒症诊疗相关候选靶点。
简介:【摘要】目的:通过肿瘤基因组图谱和基因共同表达网络鉴定乳腺癌的关键基因。方法:利用肿瘤基因组图谱(TCGA)和加权基因共表达网络分析(WGCNA)寻找乳腺癌的关键基因,并使用免疫组化或PCR对其进行验证,从而鉴定出该癌症新的生物标志物或潜在的治疗靶点。结果:从WGCNA中,我们发现了53个与乳腺癌转移相关的基因。其中,ACTB和DDX5基因在乳腺癌循环肿瘤细胞中表现出高表达,而DDX5在TCGA伴转移的乳腺癌样本中也有高表达。结论:ACTB和DDX5基因在乳腺癌循环肿瘤细胞中表现出高表达,可能为乳腺癌的关键基因。
简介:【摘要】目的:通过肿瘤基因组图谱和基因共同表达网络鉴定乳腺癌的关键基因。方法:利用肿瘤基因组图谱(TCGA)和加权基因共表达网络分析(WGCNA)寻找乳腺癌的关键基因,并使用免疫组化或PCR对其进行验证,从而鉴定出该癌症新的生物标志物或潜在的治疗靶点。结果:从WGCNA中,我们发现了53个与乳腺癌转移相关的基因。其中,ACTB和DDX5基因在乳腺癌循环肿瘤细胞中表现出高表达,而DDX5在TCGA伴转移的乳腺癌样本中也有高表达。结论:ACTB和DDX5基因在乳腺癌循环肿瘤细胞中表现出高表达,可能为乳腺癌的关键基因。
简介:动态贝叶斯网络(dynamicbayesiannetwork,DBN)是一种基于时序表达数据构建基因调控网络的重要方法。然而目前的DBN方法因计算时间太长,结构不稳定,准确度低,对有效性有很大影响。根据动态贝叶斯网络的度量可分解性质,将动态贝叶斯网络分为初始网络与转移网络分别进行结构寻优,在寻优时将基于静态贝叶斯网络的最大权重生成树算法与贪婪搜索算法相结合,移植入动态贝叶斯网络中,建立基因调控网络模型。提出了一种从时序数据中构建基因调控网络的方法,克服了贝叶斯网络不能描述循环调控的缺陷,也从规模上简化了网络构建问题。通过与相关实验文献的对照,验证了提出方法的有效性,网络学习时间明显缩短,网络结构更加稳定。
简介:目的研究银屑病特异表达microRNA(miRNA)与靶基因及基因功能之间调控网络及作用机制。方法采用基因芯片技术筛选银屑病皮损组织和健康皮肤组织中差异性表达的miRNA,并通过生物信息学对差异表达的miRNA进行靶基因预测及靶基因功能富集分析,构建银屑病差异表达miRNA与靶基因及基因功能调控网络,得到网络核心调控的miRNA和受调控作用的核心靶基因及关键性基因功能。结果得出银屑病皮损组织中明显上调的关键miRNA10个,调控的关键基因12个,主要功能21项,明显下调的关键miRNA21个,调控的关键基因22个,主要功能28项结论特异性表达的miRNA主要调控的靶基因及其基因功能与银屑病发病密切相关,为银屑病基因层面的机制研究提供了有效的依据。
简介:摘要目的基于加权基因共表达网络分析(WGCNA)筛选卵巢上皮性癌(卵巢癌)预后相关关键基因,并建立基因预后模型。方法(1)从美国国家生物技术信息中心(NCBI)基因表达综合(GEO)数据库下载基因表达谱数据集GSE26712,共有185份卵巢癌组织标本和10份正常卵巢组织标本的数据,采用limma软件包筛选出卵巢癌的差异表达基因,与WGCNA筛选出的卵巢癌预后相关模块基因绘制韦恩(Venn)图,取其交集,得到交集基因;再结合基因本体(GO)、京都基因和基因组百科全书(KEGG)进行信号通路富集分析,构建交集基因相应蛋白之间的相互作用网络。(2)在交集基因中,采用单因素及多因素Cox回归模型分析筛选出与卵巢癌患者总生存时间显著相关的关键基因,据此构建基因预后模型,预后模型风险评分为各关键基因的表达水平乘以相应权重值后求和,以风险评分的中位数为界分为高风险组和低风险组。使用癌症基因组图谱(TCGA)数据库(共有379份卵巢癌组织标本)进行验证;并对TCGA数据库中的高风险组、低风险组采用基因集富集分析(GSEA)进行KEGG信号通路富集、基因突变分析和免疫特征分析。结果(1)数据集GSE26712筛选出的1 024个卵巢癌差异表达基因与WGCNA筛选出的523个卵巢癌预后相关模块基因绘制韦恩图,取其交集获得378个交集基因。(2)单因素及多因素Cox回归模型分析共筛选出6个与预后显著相关的关键基因,即BNC1、CERK、FOXO1、GALNT6、MRPL2、PRSS2基因,构建基因预后模型,风险评分=BNC1基因表达水平×0.06+CERK基因表达水平×0.24+FOXO1基因表达水平×0.14+GALNT6基因表达水平×(-0.22)+MRPL2基因表达水平×(-0.20)+PRSS2基因表达水平×(-0.07)。训练集(GSE26712数据集)和验证集(TCGA数据库)中低风险组总生存率均显著高于高风险组(P<0.001,P=0.003)。采用GSEA进行的KEGG信号通路富集发现,低风险组的基因在氧化磷酸化相关通路中富集,高风险组的基因在恶性肿瘤、钙离子等信号通路中富集;基因突变分析发现,TP53和TTN基因在高风险组(分别为82%、23%)和低风险组(分别为85%、24%)中的突变率均高于15%;免疫特征分析发现,低风险组浆细胞、滤泡辅助性T淋巴细胞、M1型巨噬细胞的浸润比例均显著高于高风险组(P均<0.05),而休眠记忆CD4 T淋巴细胞的浸润比例显著低于高风险组(P<0.05)。结论基于WGCNA筛选的卵巢癌关键基因建立的基因预后模型能有效预测卵巢癌患者的预后,基因预后模型中的6个关键基因为研究卵巢癌的发生、发展及治疗靶点提供了参考依据。
简介:摘要目的筛选与老年肺腺癌患者肿瘤浸润免疫细胞相关的关键基因。方法回顾性分析,训练集的基因表达数据来源于癌症基因组图谱数据库,验证集来源于基因表达综合数据库的GSE72094数据集,筛选年龄≥75岁的肺腺癌患者91例,14例匹配的正常样本。肿瘤浸润免疫细胞水平由反卷积算法计算,训练集采用加权基因共表达网络分析筛选与肿瘤浸润免疫细胞水平相关的关键基因,并应用外部数据集验证。结果在老年肺腺癌患者中,IKZF1和PRKCB的高表达与自身免疫疾病和T细胞受体信号通路等相关,其编码的蛋白可与IL2RB、LCK和CD5等多种免疫调节因子相互作用。在IKZF1和PRKCB基因高表达患者中,PD-L1、PD-1和CTLA-4等免疫检查点基因的表达高于低表达患者(均P<0.01)。验证集结果表明,CD8+T细胞水平与IKZF1(r=0.75)和PRKCB(r=0.65)的表达相关(均P<0.01)。结论老年肺腺癌患者肿瘤组织中的IKZF1和PRKCB表达与肿瘤浸润CD8+T细胞和免疫检查点基因的表达相关。
简介:摘要目的通过对创伤性脑损伤(TBI)后脑组织的基因表达谱数据进行权重基因共表达网络分析(WGCNA),筛选具有重要意义的基因集,并明确其涉及的功能及信号通路,为TBI的机制研究和治疗提供参考。方法在基因表达数据库(GEO)中下载大鼠TBI基因表达谱数据GSE2871,将全部47个大鼠脑组织样本的8 799个基因的表达情况进行WGCNA分析;计算选择β加权软阈值后,对全部基因构建无向加权基因网络,识别具有高度绝对相关性的基因集;从数据库中获取样本信息并计算样本特征与模块间的相关性,选取与损伤程度及取样部位相关的模块进行基因本体(GO)分析和京都基因与基因组百科全书(KEGG)通路分析,从而获悉上述关键模块中基因涉及的生物学过程和通路;计算关键模块内基因的模块相关度和性状相关度,进而遴选关键模块中的核心基因。结果将GSE2871表达谱数据库中的所有大鼠脑组织样本和基因纳入WGCNA,共得出22个模块,分别标记为模块A~V。其中模块E、G、T、U与取样部位显著相关,模块E和模块G同时与损伤程度显著相关;GO分析和KEGG通路分析提示,与损伤程度和取样部位均显著相关的模块E、G中的基因主要参与白细胞迁移、细胞趋化及各种免疫反应调控等相关生物学过程,涉及抗原处理与呈递、细胞因子-细胞因子受体相互作用及白细胞介素(IL)-17信号等信号通路。与取样部位显著相关的模块T、U主要参与低氧反应、细胞代谢、细胞膜离子通道调控和信号传导等生物学过程,涉及神经退行性疾病信号通路、核糖体、自噬、神经活性的配体-受体相互作用等信号通路;Tuba1b/1c、Ifitm3、Cebpd、Nfkbia、Serinc3、Pmpcb、Cyp4a8等为上述关键模块的核心基因。结论与大鼠TBI显著相关的基因主要参与免疫激活、炎症反应、能量代谢异常、钙离子通道失调、自噬异常及细胞凋亡等病理生理环节。
简介:摘要目的采用加权基因共表达网络分析法,筛选影响脓毒症预后的关键基因。方法从美国生物技术信息中心的基因表达数据库中,获取脓毒症患者和健康志愿者外周血基因芯片数据GSE54514,采用R语言加权基因共表达网络分析包构建脓毒症患者与健康志愿者差异基因的共表达网络,筛选与脓毒症预后相关的模块与枢纽基因,并对与脓毒症预后相关性最高的模块中的基因进行富集分析。结果通过对脓毒症患者与健康志愿者的622个差异表达基因构建共表达网络,筛选得到与脓毒症预后相关性最高的模块。GO富集分析显示该模块中的基因与髓系细胞的激活、中性粒细胞的激活相关;而KEGG通路富集分析显示这些基因在病毒感染过程中具有重要作用。最后通过构建蛋白质互相作用网络在与脓毒症预后相关性最高的模块中筛选得到15个枢纽基因。结论通过生物信息学方法挖掘出与脓毒症预后高度相关的15个关键基因,这些基因与调节机体对感染的免疫应答有关。
简介:摘要目的通过生物信息学分析探究儿童神经母细胞瘤中与MYCN(N-myc)基因相关的共表达基因。方法下载TARGET数据库神经母细胞瘤表达数据共179例,WGCNA分析筛选MYCN扩增共表达基因模块;针对目标基因模块个基因行GO、KEGG富集分析筛选MYCN扩增相关基因可能参与生物过程及信号通路;以MYCN扩增状态将神经母细胞瘤表达数据分为扩增组65例、非扩增组114例,行差异表达基因分析;筛选的差异表达基因同MYCN扩增相关基因取交集后运用K-M法行生存分析(log-rank检验),筛选预后相关基因,Logistics回归探究MYCN扩增状态同预后基因的关系。结果WGCNA分析提示MEgreenyellow模块同MYCN基因扩增状态相关性最强(R=0.46,P<0.05),为共表达基因,包含基因1 216个,富集分析提示MYCN扩增共表达基因多参与RNA相关通路(RNA的转运、剪切、修饰,RNA相关酶的活性等过程);差异表达基因分析显示,MYCN扩增组相较于非扩增组,基因表达上调47个,表达下调123个;WGCNA分析同差异表达基因取交集筛选出22个关键基因,行生存分析显示同预后相关的基因(P<0.05)有12个,其中DDX1与其他关键基因相关性相对较弱,或为神经母细胞瘤独立预后因素。结论LINC00839、ATP结合盒亚家族C4(ABCC4)、亚甲基四氢叶酸脱氢酶(NADP+依赖)2(MTHFD2)、磷酸甘油酸脱氢酶(PHGDH)、序列相似性家族13 A(FAM11A)、磷酸丝氨酸转氨酶1 (PSAT1)、假尿苷酸合酶7(PUS7)、DEAD-box解旋酶1(DDX1)、溶质载体有机阴离子转运蛋白家族5A1(SLCO5A1)、Junctophilin 1(JPH1)、溶质载体家族16 1(SLC16A1)、MYCN Opposite Strand(MYCNOS)为神经母细胞瘤中MYCN扩增的共表达基因,与较差的预后相关,是神经母细胞瘤潜在的治疗靶点及预后指标。
简介:摘要目的通过加权基因共表达网络分析揭示腹主动脉瘤(AAA)发生的潜在机制。方法对数据库编号GSE47472和数据库编号GSE57691两个AAA转录组测序数据合并,进行基因差异表达分析得到差异基因,加权基因共表达网络分析(WGCNA)得到中心基因,两者取交集得到差异中心基因,并对其进行功能富集分析。建立小鼠AAA模型进行定量聚合酶链反应(qPCR)验证差异中心基因表达。使用GraphPad Prism 8进行统计分析。Kolmogorov-Smirnov检验数据正态性,采用独立样本t检验分析基因差异表达。结果共筛选出745个差异表达基因,建立16个基因共表达模块,其中中心模块包含119个基因,取交集后共得到60差异中心基因。对差异中心基因进行功能富集分析结果示AAA中平滑肌增殖分化功能和细胞黏附功能相关基因低表达。低表达的细胞黏附相关基因为钙黏着蛋白-2(CDH2),(钙黏着蛋白-13)CDH13,整合素相互作用蛋白-2(FERMT2),Rho关联含卷曲螺旋结合蛋白激酶1(ROCK1),层黏蛋白α5(LAMA5),进行qPCR验证其表达差异显著性。相对表达倍数分别为FERMT2=0.31 (t=2.454,P<0.05),ROCK1=0.22(t=3.686,P<0.05),LAMA5=0.45(t=3.168,P<0.05),CDH13=1.36(t=0.103,P>0.05),CDH2=1.71(t=0.702,P>0.05)。结论FERMT2、ROCK1、LAMA5低表达可能通过介导血管平滑肌细胞与细胞外基质间黏附作用异常参与AAA形成。
简介:摘要目的结合应用加权基因共表达网络分析(WGCNA)和差异基因表达分析2种方法筛选结肠癌mRNA表达谱中的差异共表达基因,并分析差异共表达基因与预后的关系。方法基于生物信息学方法从癌症基因组图谱(TCGA)和基因表达综合(GEO)数据库分别下载TCGA结肠腺癌数据集的转录组学数据和GSE68468数据集的芯片表达谱数据,筛选出两者在正常组织与结肠癌组织之间的差异表达基因(DEG)和最显著相关的加权基因模块,通过差异基因和加权基因取交集筛选出结肠癌相关差异共表达基因。构建蛋白质-蛋白质相互作用(PPI )网络,利用最大派系中心度(MCC)计算方法筛选出MCC评分排名前10位的核心差异共表达基因,使用TCGA结肠腺癌数据集验证核心基因在正常组织和结肠癌组织中的表达,采用Kaplan-Meier生存分析探索核心基因与患者总生存期和无病生存期之间的关系。使用人类蛋白质图谱(HPA)数据库,对生存相关的差异共表达基因进行免疫组织化学染色验证。结果TCGA结肠腺癌数据集中DEG共3 481个,GSE68468数据集中DEG共7 275个,共获得237个差异共表达基因。使用PPI网络的MCC计算方法得到10个核心的差异共表达基因,分别为氯离子通道附件1(CLCA1)、MAPK3、胰高血糖素(GCG)、溶质载体家族26成员3(SLC26A3)、核受体亚家族1组H成员4(NR1H4)、脂肪酸结合蛋白1(FABP1)、鸟苷酸环化酶激活因子2A(GUCA2A)、二磷酸尿苷葡糖醛酸糖基转移酶家族2成员A3(UGT2A3)、肉碱棕榈酰转移酶2(CPT2)和跨膜4域A12(MS4A12)。与正常组织相比,TCGA结肠腺癌数据集结肠癌组织的CLCA1、GCG、SLC26A3、NR1H4、FABP1、GUCA2A、UGT2A3、CPT2和MS4A12 9个核心基因均下调(P均<0.05),其中CLCA1高表达结肠癌患者的总生存期和无病生存期均长于低表达组(P均<0.05),免疫组织化学染色结果在蛋白质水平也验证了结果的准确性。结论CLCA1可能在结肠癌的发展中起关键作用,可作为进一步诊断和治疗的潜在生物标志物。
简介:为解决大规模本体理解问题,提出了一个从复杂网络分析的角度研究大规模本体结构信息和重要概念挖掘的方法.通过将基因本体的各种视图转换为网络进行全面分析,证明了整个基因本体具有明显的复杂网络特征,尤其是"小世界特性"和"无标度特性";但其子本体的复杂网络特性没有这么明显,往往只具有"无标度特性"而没有"小世界特性".同时,利用网络分析中常用的节点重要性度量算法对本体中的重要概念进行挖掘.在此基础上,提出了基于MEDLINE信息检索结果的概念重要性评价算法,评估几种节点重要性算法用于本体重要概念挖掘任务的正确性.实验结果表明介数中心性算法在各种节点重要性度量算法中最适合于本体重要概念挖掘.
简介:摘要:遗传学研究生物的遗传、变异及其规律;人类对遗传的研究从性状开始的,遗传因子的发现到证明遗传密码的存在并破译遗传密码的过程是人们认识遗传的物质基础并揭示遗传规律的过程,在此过程当中遗传基因这个抽象的概念在思维上和实质上逐渐接近染色体、DNA;然后科学家们证明基因是有遗传效应的DNA的片段,从此基因不再是抽象的概念,以后人们又发现性状的表达离不开蛋白质(酶)合成,于是科学家们推测并证明基因通过指导蛋白质的合成而控制生物的性状,于是最终孟德尔的假设得到了科学解释。人民对遗传学的研究是实质上揭示基因表达的过程,这是生物学史上的重大发现。
简介:Nkx2.5,Mef2c,Gata4/5/6,Tbx5和Hand1等基因作为脊椎动物心脏发育相关基因调控网络的核心基因,对脊椎动物的心脏发育起核心调控作用。本研究主要通过对小鼠心脏发育相关核心基因的生物信息学分析,研究Nkx2.5,Mef2c,Gata4,Gata6,Tbx5和Hand1等核心转录因子之间的相互调控关系,得到小鼠心脏发育的核心基因调控网络(GRNs)。与文献中总结的小鼠的GRNs作比较,发现Nkx2.5在小鼠心脏发育基因调控网络中的核心地位没有改变,并且Nkx2.5在网络中主要扮演了调控者的角色,它直接调控很多转录因子。Gata4是另一个主要起调控者作用的转录因子。另外小鼠的Mef2c和Hand1处于被多个转录因子调控的地位。变化比较大的是Tbx5所涉及的调控网络,主要有两点:Nkx2.5对Tbx5的表达有没有调控作用以及Tbx5对自身的表达有没有调控作用。研究表明生物信息学分析对具体实验研究有一定方向性指导意义。
简介:目的筛选肾透明细胞癌进展相关基因。方法通过构建共表达网络筛选肾透明细胞癌进展相关基因并进行初步验证。结果基于GSE36895数据得到2173个差异基因用于构建共表达网络。通过共表达网络确定与肾透明细胞癌进展最相关的棕色模块(r=0.52)为枢纽模块,进一步筛选得到6个枢纽基因TOP2A、CDK1、CDC20、KIF11、CCNB2、BUB1。通过测试集GSE73731数据对枢纽基因进行验证,各枢纽基因表达量与肾透明细胞癌进展均呈显著正相关(P<0.0001);其中CDC20、BUB1对于低级别(gradeⅠ、Ⅱ)及高级别(gradeⅢ、Ⅳ)肾透明细胞癌有较高的诊断效能(AUC>0.7,P<0.0001)。另外基于TCGA数据,各枢纽基因表达量与肾透明细胞癌病理分期及预后均显著相关。GO富集及KEGG通路分析显示枢纽模块基因显著富集于细胞周期相关生物过程及通路。GSEA显示枢纽基因高表达组主要富集于细胞周期及免疫相关通路。结论通过WGCNA构建共表达网络筛选得到的6个枢纽基因与肾透明细胞癌进展及预后密切相关,枢纽基因可能通过细胞周期相关通路来影响肾透明细胞癌进展及预后。