第一部分胆汁挥发性有机物及基于其构建的诊断模型在胆囊癌早期诊断中的表现研究背景:胆囊癌(gallbladder cancer,GBC)是起源于胆囊上皮细胞的一种具有高度侵袭性的胆道系统恶性肿瘤,占胆道系统恶性肿瘤的80-95%。因早期临床症状特异性低,患者确诊时往往处于癌症中晚期阶段或淋巴转移状态,使得患者生存率低,预后差。早诊断、早治疗仍是提高患者生存率,改善预后的有效手段。目前,胆囊癌诊断仍主要依赖于影像学检查如 B 超、CT、MRCP(magnetic resonance cholangiopancreatography)等,与实验室检查项目血清CA19-9、AFP的联合应用,其中多层螺旋CT检查的准确率可达80%及以上,然而在胆囊癌的早期诊断中有一定限制。挥发性有机物(volatile organic compounds,VOCs),作为代谢组学的重要成员之一,已被证明可在不同的生物样本:呼出气、血液、尿液中检测到。目前已有多项研究表明通过使用不同的检测技术,如气相色谱-质谱仪(Gas chromatography-mass spectrometry,GC-MS),气相色谱-离子迁移光谱(Gas chromatography-ion mobility spectrometry,GC-IMS),可在生物样本中检测到特异的 VOCs作为不同肿瘤的诊断生物标志物,并且基于VOCs所建立的各种诊断模型在不同癌症中具有优秀的诊断效力。但胆汁VOCs在胆囊癌早期诊断中的研究鲜有报道,因此本研究旨在分析鉴别特异的胆汁VOCs并构建诊断模型评估其在胆囊癌早期诊断中的表现。目的:通过使用气相色谱-离子迁移光谱GC-IMS技术对胆汁样本进行VOCs的检测分析。运用统计学方法筛选出GBC与良性胆囊疾病(benign gallbladder diseases,BGD)之间的差异VOCs并评估每一 VOCs对于胆囊癌的诊断能力。应用机器学习算法构建基于差异VOCs的诊断模型,并评判诊断模型在GBC中的诊断效力。方法:本研究于2018-2021年间在山东大学齐鲁医院共募集受试者86名,包括GBC患者32名,BGD患者54名。在患者术前第一次接受内镜逆行胰胆管造影术(Endoscopic Retrograde Cholangiography and Pancreatography,ERCP)或经皮肝穿刺胆管引流(Per寻找更多cutaneous Transhepatic Cholangio-Drainage,PTCD)时完成患者的胆汁引流并进行收集。将胆汁离心,留取胆汁上清于-80℃贮存。冷冻胆汁在室温下自然融化后取500μl置于样本瓶中待测,胆汁VOCs检测由GC-IMS完成。使用同一样本测试室温放置时长和反复冻融对于胆汁VOCs分析结果的影响进行评估。将GC-IMS数据导出得到每一样本中所有VOCs特征信息即保留指数,峰体积和迁移时间。根据VOCs的峰体积进行定量,对定量数据进行统计学分析对比筛选出P值<0.05的VOCs,并应用ROC曲线分析每一VOCs的诊断GBC的能力。将所有样本随机划分为70%的训练集和30%的测试集,应用不同的机器学习算法,决策树(decision tree,DT)、支持向量机算法(support vector machines,SVM)、线性判别分析(linear discriminant analysis,LDA)、梯度增强机(gradient enhanautoimmune liver diseasecement machines,GBMs)和 k-近邻算法(K-nearest neighbor,KNN)在训练集中构建基于筛选出的胆汁VOCs的诊断模型,并应用测试集进行诊断模型的评估。结果:临床特征数据收录了年龄、性别、白蛋白(ALB)、碱性磷酸酶(AKP)、谷草转氨酶(AST)、谷丙转氨酶(ALT)等。室温放置时长测试和反复冻融实验测试结果提示胆汁样本应在室温溶解后3小时内完成VOCs检测。经GC-IMS检测后,86份胆汁样本共检测出VOCs信号峰43个,VOCs表达谱分析结果显示,在GBC和BGD之间存在具有明显差异的VOCs,并且主成分分析和非监督聚类结果均支持VOCs具有区分鉴别GBC与BGD能力。据特征信息确定VOCs物质共19个,根据VOCs峰体积定量后应用非参非配对t检验分析发现12种VOCs具有统计学意义,其中4个胆汁VOCs:环己酮,2-乙基-1-己醇,苯乙酮和苯甲酸甲酯在癌症患者中明显升高,其余8个VOCs:乙酸甲酯,(E)-2-庚烯醛,己醛,(E)-2-己烯醛,(E)-2-戊烯醛,1-戊醇,1-辛烯-3-酮,(E)-2-辛烯醛,明显下降。ROC曲线分析比较12种VOCs与CA19-9的GBC诊断能力,结果示其诊断能力均优于CA19-9,其中以(E)-2-庚烯醛表现最佳。基于12种有意义VOCs构建诊断模型DT、LDA、SVM、GBMs和KNN并在测试集进行模型评估,ROC曲线分析结果示诊断模型SVM的诊断效力最优。结论:(1)胆汁中存在VOCs并具有将GBC与BGD区分鉴别的能力。(2)胆汁VOCs诊断GBC的能力优于CA19-9。(3)基于差异胆汁VOCs建立的诊断模型具有较好的GBC诊断能力,有望成为GBC早期诊断的有效方法。第二部分胆汁挥发性有机物鉴别诊断肝门部胆管癌及其模型构建与评估研究背景:肝门部胆管癌(perihilar cholangiocarcinoma,PHCCA)是胆管上皮细胞恶性肿瘤,起源于左、右肝管、左右肝管汇合部及胆囊管开口以上,约占所有胆管癌的50%。PHCCA侵袭性强,早期症状不明显,大多数患者因肝门部梗阻出现皮肤黄染、瘙痒等症状时多已处于癌症晚期,致使PHCCA患者生存率低,预后差。早期诊断并开展手术治疗提高患者生存率改善患者预后的有效手段。目前PHCCA的术前诊断依据多来自于影像学检查,包括磁共振胰胆管造影术,内镜逆行胰胆管造影术等以及实验室检查如荧光原位杂交分析和胆道刷细胞学检查。但总体而言,由于selleck激酶抑制剂癌症早期症状不明显,以上方法的诊断效力均受到限制。CA19-9是临床上胆管癌的传统血清标志物,但其低特异性和敏感性限制了其广泛的应用。因此迫切需要开发用于PHCCA早期鉴别诊断的新方法。目的:肝门部胆管癌的早期诊断及鉴别诊断目前仍十分困难,本研究旨在评估胆汁中是否存在VOCs可作为肝门部胆管癌新兴的诊断标志物,并基于胆汁VOCs构建PHCCA诊断模型评估模型诊断效力。方法:采用二阶段方法,2018-2021年间于山东大学齐鲁医院共募集受试者140名,包括PHCCA患者73名,良性胆道疾病(benign biliary diseases,BBD)患者67名,作为训练组。2021-2022年间募集受试者60名,其中PHCCA患者29名,BBD患者39名作为测试组。应用GC-IMS检测所有患者胆汁VOCs,并在训练组中对VOCs进行定量。在训练组中,应用统计学方法筛选有意义的差异VOCs进行ROC曲线分析胆汁VOCs对于PHCCA的鉴别诊断能力。基于差异VOCs应用机器学习算法:DT、LDA、SVM、KNN、PLS-DA,构建诊断模型并应用测试集胆汁VOCs数据评估诊断模型在PHCCA中的鉴别诊断能力。结果:(1)训练组中,经GC-IMS检测,最后成功检测到胆汁VOCs信号峰共43个,其中根据43个信号峰确定VOCs物质19种,无法被确定为具体VOCs物质的信号峰有5个。经Mann-Whitney U检验提示32个VOCs信号峰在PHCCA和BBD患者之间具有显著差异,基于32个信号峰的主成分分析和无监督分层聚类分析结果显示在胆汁VOCs在PHCCA和BBD之间具有明显的分离趋势。(2)32个有意义的VOCs信号峰中共囊括确定的VOCs物质12种,包括3种新的VOCs物质:2-甲氧基呋喃,异丙酸戊酯和丙二酸二乙酯。该12种VOCs物质经定量分析后示其中4个VOCs物质在PHCCA中含量明显升高,分别是:2-乙基-1-己醇、异戊酸丙酯、环己酮和苯乙酮,其余8个含量明显减低。ROC曲线分析结果提示,每一胆汁VOCs对于PHCCA的鉴别诊断能力均十分出色,其种以(E)-2-庚烯醛表现最有,其曲线下面积(AUC)为0.934,敏感度90.1%,特异性88.4%。(3)基于12种差异VOCs构建机器学习模型DT、SVM、PLS-DA、LDA、KNN用以PHCCA鉴别诊断,应用测试组胆汁VOCs数据进行模型评估,其中以SVM表现最优,其灵敏度为93.1%,特异性为100%,AUC为0.966。(4)在测试集中,某些VOCs与PHCCA的一些病理特征具有相关性,如己烯醛和2-甲氧基呋喃在肿瘤分化程度和TNM分期均存在显著差异,异戊酸丙酯、环己酮和(E)-2-己烯醛在TNM分期中均为增加趋势。结论:(1)胆汁VOCs具有PHCCA的鉴别诊断能力,但在良性胆道疾病中无法鉴别诊断具体的良性疾病。(2)12种胆汁VOCs在PHCCA和BBD患者之间存在浓度差异,经ROC曲线分析12种胆汁VOCs均具有较好的PHCCA鉴别诊断效力。(3)基于12种胆汁VOCs建立的诊断模型具有较好的PHCCA诊断能力,有望成为PHCCA早期鉴别诊断的有效方法。