制订胰腺外科手术后并发症的定义和分类共识的目的和意义
胰腺外科因技术要求高、手术风险大、并发症多、围手术期管理复杂等因素,一直被视为外科领域的难点和重点。建设一个优秀的胰腺疾病专科,培养一个成熟的胰腺外科医生,须要经过多年的规划、培训和经验积累。总结胰腺手术后并发症的相关数据并据此促进水平提升是最直接的办法。
医学发展到今天,循证理念日渐深入人心,一切以证据为基础。要开展研究并产生高级别的证据,随机双盲对照是基本要素,然而外科手术很难做到随机和双盲,更大程度上须要依赖对照。但在检索到的文献中发现,由于评判标准、统计方法的不同,虽同为对照研究,各地区或单位针对同一议题得到的结论却有可能千差万别乃至背道而驰。这种不一致性的坏处是, 极大地限制了对临床应用不同技术(包括临床试验)进行客观地比较的研究。
比如术后胰瘘,由于各中心采用的定义标准不同,在不同的报告中发生率数据差异极大。究竟孰是孰非?该采信谁的数据?为了尽量消除这种观察者偏倚,确定统一的评判标准就成为所有研究的先决条件。本文所要介绍的胰腺手术后并发症的定义和分类共识就是以此为出发点制订的。
国际胰腺疾病研究小组的诞生过程,目前已制订的共识及产生过程
所谓共识,意义体现在「共」字上,涵盖范围大,参与者众,发出的声音必然多且杂,意见统一的难度就大。共识要有权威性,必须要有科学、严谨、专业的特质。胰腺外科的专家自然而然成为制订这些共识的人选。
国际膜腺疾病研究小组(International Study Group of Pancreatic Surgery,ISGPS)起步于一个关于术后胰瘘的国际工作组(International Study Group of Pancreatic Fistula,ISGPF),最初的目标是达成一个关于术后胰瘘客观的国际性的共识,以便对不同来源的外科临床研究进行比较。由来自意大利、希腊、 法国、美国、英国、日本、德国、西班牙、瑞典、荷兰、南斯拉夫、巴 西、澳大利亚、波兰、匈牙利的 30 多名胰腺外科医生组成,基本上都是各国顶级的胰腺外科专家,都来自国际著名的、大手术量的中心,他们的临床经验都以经同行评议的科学论文的形式有案可稽。
正因如此,该小组制订并最终发表出来的共识具备极强的指导性和实际可操作性,每份共识的出台都经历了细致严谨的讨论和审核,确保了质量,因此一面世即得到了广泛的认可和赞誉。回顾其产生过程,可以深入体会到共识制订过程的严谨和不易。
到目前为止,ISGPS 制订发表了关于:术后胰瘘( postoperative pancreatic fistula,POPF )、膜腺切除术后出血(postpancreatectomy hemorrhage,PPH)、胃排空延迟(delayed gastric emptymg,DGE)、胰腺吻合报告标准,共 4 份共识。
以 POPF 为开端,首先小组专家们各自检索、回顾分析文献和各自机构的经验;然后提出术后胰瘘的定义和严重度分级标准草稿,送交各参与者审改;审定的修改稿再送交各参与者批准或进一步审改。在经过 1 年多的电子邮件,或者偶尔面对面地讨论交流后,最终版的 POPF 定义在 2004 年 3 月于希腊雅典举行的国际研究生课程「HPB Marathon」上经过了讨论,2004 年 4 月在意大利蒂雷尼亚举行的「胰腺癌会议」和 2004 年 6 月在美国华盛顿举行的「国际肝胆胰协会第 6 届全球大会」以及同月在意大利帕多瓦举行的「欧洲胰腺会议」上做了完善。
PPH 共识的产生过程与之大同小异。在 ISGPS 标准问世之前,国际上对 PPH 缺乏一种清晰、简明,且可量化的分级标准。各个「定义」彼此之间千差万别,对发病时间、等级、严重程度和临床影响的认识也不尽相同。参与专家们就 PPH 的定义在 Medline 进行了大范围的文献检索,在过去 20 年间,所有可用的主要刊物,特别是来自大手术量外科中心的文献,都被用作参考。所有的参与者都回顾了这些文献。草稿在成员间交流达八个月,所有意见和建议都被慎重考虑,最终由 ISGPS 的所有签署者达成共识,产生了一种客观的、普遍适用的,且无偏袒的胰腺术后出血的分级标准。
同样的,在 ISGPS 标准之前,重大胰腺手术后 DGE 的定义也没有一个被广为接受的、客观、统一的标准;实际上,不同的临床研究采用了众多不同的标准,使得无法对这些研究成果进行比较。ISGPS 在 Medline 对现有的与 DGE 相关的文献和定义进行了扩大检索。将文本词与医学主题词相结合建立检索式,并将检索到的文献的参考文献进行交叉检索以获得更多的相关资料。过去 20 年间,所有大手术量外科中心发表的具有合适病例数的主要文献都被用作制订定义的基础。所有参与者都对这些文献进行了审查,制订出的多项草案在小组成员间分发,所有的建议都被考虑在内,最终形成 DGE 定义的共识。
胰腺吻合报告标准同样也相当复杂,涉及的因素主要有胰腺残端相关因素,包括胰管大小、游离长度、腺体质地;吻合方法相关因素,包括选择胰腺空肠吻合、胰腺胃吻合、胰管黏膜吻合、胰腺残端插人(空肠或胃)吻合、是否使用支架管(内或外)等。ISGPS 同样检索了几乎全部的相关文献,设计多种关键词组合,利用 Medline、Embase,以及 Cochrane 对照试验登记中心对 1983~2008 年间的科学文献进行系统检索,获得所有出版物资料,最终制订了涵盖上述因素的记录和报告的标准化分类系统,使得科学比较不同的术式成为可能,为将来按照循证医学的理念制订胰腺吻合操作指南提供了依据。
共识在实际应用中的效果
这些共识自发布以来,使用效果令人满意, 得到了众多的赞誉。最主要的特点就是使得在特定的背景条件下,不同的术式或治疗措施之间可以进行精确的比较,因此产生的结论具备极强的说服力。
以 POPF 为例,在 ISGPF 的标准问世之前,在胰腺外科文献中,几乎无法找到两篇 POPF 定义相同的文章。文献报道中胰十二指肠切除术后 POPF 的发生率差异极大,从 2% 到超过 20% 不等。确认不同外科经验的临床应用价值,并允许对其进行精确的比较存在极大的困难。但 ISGPS 系列共识的发布,使比较成为可能且更具说服力。比如,Wang 等采用新式定义标准对使用生长抑素能否降低 POPF 发生率进行研究,得出否定的结论;Sachs 等对胰腺空肠吻合术使用支架管能否降低 POPF 发生率进行研究,得出否定的结论。
既往,此种研究结论受到的质疑会比较多,特别是如果研究涉及到商业团体施加的压力时,更容易出现主观性的偏倚;但是现在,由于 POPF 判定标准的标准化,使得该结果可重复性显著增强,有效避免了不同研究结论抵触的现象。
另外,Zureikat 等将其用作说明计算机辅助机器人胰腺手术安全性和可用性的评估工具;Topal 等发现,针对胰头部或壶腹部肿瘤行胰十二指肠切除后,在减少 POPF 发生率方面,胰胃吻合要优于胰空肠吻合;Palani 等和 Ansorge 等发现腹腔引流液的淀粉酶水平可以用作 POPF 发生的预测因子;Pratt 等综合了胰腺吻合相关因素及失血量等指标,确认可将其用作 POPF 发生的预测因子,提醒外科医生在术中对高危腺体采取恰当的处理;Matsumoto 等证实胃次全切除的胰十二指肠切除和保留幽门的胰十二指肠切除术后 DGE 发生率相似, 患者术后长期营养状态也无区别。
即便不是对照研究,而只是单纯的回顾性分析,不同背景条件下的临床研究数据也得以按照标准记录,便于日后进一步总结。而且,除了惠及胰腺外科,在胃外科领域,ISGPS 的 POPF 标准也已经被采纳,用于评估胃癌根治手术后胰瘘发生率的差异。
当然不可避免,这些共识也存在一些问题,有进一步提升的空间。最主要的一条就是,ISGPS 的共识还只停留在对结果、对既往的总结和对数据的标准化统一化方面,更深入的一些问题尚不能解决。
比如,Sato等发现在行胃次全切除的胰十二指肠切除患者中,DGE 的发生率与腹腔内其他并发症如胰瘘的发生率密切相关。原发性 DGE 的发生率达 4%,虽然 ISGPS 的 DGE 标准很易于使用,但是它只能用于分级,并不能明确 DGE 的发生原因,须要额外注明原发性和继发性的区别,因此对预防 DGE 提供有价值的指导意见作用有限。
共识对于胰腺外科进步的影响及意义
胰腺外科的复杂性使得在该领域取得任何的进展都显得举步维艰。这些共识的发布,在胰腺外科学界应该说具有里程碑式的意义。
临床实践方面,对个体而言,有了这些共识作为参考,手术者可以主动有目的地收集相应的数据指标,总结病例资料,汇总分析,形成结论,避免既往因认识不足遗漏某个指标造成弥补困难的遗憾。比如,术中没有记录胰管的具体尺寸,事后想要研究胰管黏膜吻合术后胰瘘的发生率与之的相关性,数据就存在先天的缺陷,无法进行。按照标准,这些数据将在术中及时得到记录,方便日后研究。
科学研究方面,对群体而言,各中心在汇报各自的经验时,就某些特定的问题有了准确一致的评判标准,因此可以对各自的研究数据进行横向比较,摆脱了以往各自的数据存在观察者偏倚太大没有可比性的缺点。比如说,针对同一手术,术后并发症发生率数据一览无余,哪家中心的数据最令人满意,自然哪家的经验就越值得学习推广。不难想象 ISGPS 的这些共识和分类体系将催生部分研究,并可能据此发展出有循证医学理论支持的指南。
我国胰腺外科整体水平落后于发达国家不少距离。在几代人的努力下,虽然一些大流量的中心胰腺外科水平已经得到显著的提高,胰腺手术并发症发生率已经接近甚至低于国际平均水平,胰腺疾病的诊治已经具备相当的水准,一些业内知名专家的学术水平、手术能力也已经得到国际同行的承认和肯定,但是这毕竟不能代表全国的平均水平。
事实是,虽然我国人口众多,胰腺疾病病例众多,但是从中提炼出原创性学术观点的并不多,提炼出有充分的证据支持、有强大的说服力的学术观点就更少。究其根本原因,还是学术交流的程度不够,与外界联系不够紧密。素材多,但要从素材中整理出好的学术资料并拿得出手,这并不是一件容易的事,很大程度上,各家中心仍然是在各自为政,谁都无法说服谁。
要正视并解决这个问题,第一步就是要建立统一的标准,以此为依据进行深入研究,对照比较各自的数据,然后在此基础上提出有充分证据支持的观点。
ISGPS 的系列共识性文章为世界各中心之间的研究数据比较、手术技术点评提供了参照标准。对我国的胰腺外科发展具有同样的参考意义。将这些共识汉化并标准化程序化,制订一个大家都能够熟练参考执行的判断标准,推广并鼓励临床应用,让所有人都能据此将自己的研究结果量化为一组组数据,再纠结的人也能迅速把握住重点,明白孰优孰劣。从长远来看,这将有助于胰腺外科从业者抛弃各自原本的执念,真正按照循证医学的理念进行研究,在数据信息中提炼原创性的观点,利于学科的发展。
注:本文由杨桂元、钱祝银制定,发布于《临床肝胆病杂志》杂志 2014 年 8 月第 30 卷第 8 期。