目的:结直肠癌(colorectal cancer,CRC)是一种发病率和死亡率都很高的消化道癌症,其中有40%的患者发生KRAS(Kirsten rat sarcoma viral oncogene homolog)基因突变。KRAS基因也是预测抗EGFR治疗耐药性的主要生物标志物,KRAS突变型CRC还没有有效的治疗方案,因此需要探索KRAS突变型CRC的发病机制,寻找更可靠的标志物和潜在的药物靶点。本研究利用转录组数据,通过生物信息方法筛选KRAS突变相关基因,并探索KRAS突变、KRAS突变相关基因与临床特征的关系和预后价值,为寻找新的KRAS突变型CRC的生物标志物和潜在靶点提供依据。方法:(1)KRAS突变相关CRC表达谱数据集下载自GEO(Gene Expression Omnibus),最终筛选出两个数据集(GSE156915和GSE75316)。利用R limma包对KRAS突变组与野生组进行差异表达分析,获得差异表达基因,并由在线分析工具进行功能富集分析,两基因集的交集基因作为KRAS突变相关基因进行后续研究。在cBioPortal数据库中对选取的KRAS突变相关差异表达基因进行表达验证,并分析KRAS突变与临床特征和预后相关性。利用String数据库的蛋白互作关系数据,绘制PPI(Protein-protein interaction network)网络图,确定KRAS突变相关基因在网络中蛋白质互作关系。(2)收集自2019年至2021年,来我院胃肠外科进行住院治疗的123例CRC患者,同时整理这些患者的临床信息和随访资料等。对筛选出来的KRAS突变相关基因进行免疫组化染色确定蛋白表达。利用假设检验,研究KRAS突变相关基因的蛋白表达水平和CRC患者预后及临床特征的关系。生存曲线的比较采用log rank检验,并对相关基因进行多因素生存分析后构建临床预后预测模型。结果:(1)对芯片数据集GSE156915和GSE75316中的差异表达基因取交集,得到两个芯片共享的KRAS突变相关基因KRT6A和CEMIP,并且它们在CRC的KRAS突变型患者中显著上调。GSE156915数据集富集到29条GO术语,涉及KRT6A的GO术语有1条,涉及CEMIP的GO术语有3条;GSE75316数据集富集到34条GO术语和1个KEGG通路(hsa04310:Wnt signaling pathway),涉及KRT6A相关的GO术语有2条,涉及CEMIP相关的GO术语有3条。KRT6A功能主要富集在细胞溶质(GO:0005829),CEMIP功能主要富集在细胞外区域(GO:0005576)的GO术语上,提示两差异基因功能在KRAS突变型CRC细胞外成分起调节作用。(2)cBioPortal数据库中KRT6A和CEMIP在KRAS突变组的表达量都相较于KRAS野生组高,进一步验证了GY-27632小鼠EO芯片数据的结果。KRAS突变组与野生组在CRC四种分LXH254作用子亚型构成比存在差异(P<0.05),KRAS突变组和野生组的无进展生存期(progression-free survival,PFS)的生存曲线有差异(P<0.05),且KRAS突变为危险因素;对于总生存期(overall survival,OS),KRAS突变组与野生组的生存曲线无明显统计学差异。差异基因形成的PPI网络图中包含节点410个,边689个,平均连接度为3.36,PPI富集P值<1.0e-16。利用Cytoscape对KRT6A和CEMIP相关的功能互作蛋白进行可视化后,发现与KRT6A功能互作的蛋白有20个,与CEMIP功能互作的蛋白有2个。(3)通过对123例CRCmedication characteristics患者分析,发现发生KRAS突变的患者有60例,KRAS的突变率为48.78%,其中G12D为最常见的突变类型,突变率为41.67%。KRAS突变与性别有关,与年龄、TNM分期等临床特征无显著关联。KRAS突变组术后无进展生存曲线下降更快,预后表现明显较KRAS野生组更差。(4)KRT6A蛋白阳性表达率在癌症组织中(与癌旁相比)显著升高(X~2=4.75,P<0.05)。KRT6A蛋白表达和CRC患者的TNM分期中的N分期有关;存在淋巴结转移的患者中KRT6A的蛋白阳性率更高(X~2=15,P<0.05)。KRT6A的蛋白表达水平和KRAS的突变状态无统计学关联,未发现与其他临床特征和预后有统计学关联。(5)CEMIP蛋白在CRC癌症组织中阳性表达率高于癌旁,且在癌症与癌旁间的表达差异具有显著性(X~2=7.79,P<0.05)。CEMIP和CRC患者的TNM分期中的N分期、M分期有关,存在淋巴结转移及远处转移的患者CEMIP的阳性表达率更高。此外,KRAS突变型CRC患者的CEMIP的蛋白表达阳性率较KRAS野生型CRC更高(X~2=5.4,P<0.05)。CEMIP阳性、阴性表达组的术后无进展生存曲线有显著差异(X~2=25.28,Log rank P<0.05),CEMIP阴性表达组具有更好的预后,且CEMIP阳性表达是不良预后(术后PFS)的独立危险因素。结论:通过结直肠癌转录组数据筛选出KRAS突变相关基因KRT6A和CEMIP,这两个基因都与CRC患者的TNM分期有关,尤其CEMIP蛋白的阳性表达预示着CRC患者可能有更差的预后,这两个基因可能作为KRAS突变型CRC的靶基因或者潜在治疗靶点。然而关于KRT6A和CEMIP在CRC,尤其是在KRAS突变CRC的作用机制尚不明确,有待进一步研究。