在返朴发表《有些癌症筛查,无用甚至有害》和《体检中盛行的肿瘤标志物筛查,无一获批却已大行其道》之后,有许多读者关心究竟有哪些肿瘤筛查是有益的,并且想进一步了解其依据。本文试图回答这一问题。
撰文 | 李长青(医学博士、旅美执业医师)
当前很多医疗机构和查体公司推荐的癌症筛查是没有必要的,很多筛查手段缺乏足够的科学依据,但并不是所有癌症筛查都没有必要,早期筛查依然是癌症防治的重要手段之一。
那么,医学科学界认为值得推荐的癌症筛查有哪些?推荐这些筛查的依据何在?以下就这些有筛查价值的癌症所必须符合的几大条件逐一分析。这里说的筛查,指的是向健康人群推荐的癌症筛查,包括对特定年龄和性别的健康人群;而对某些特殊的高危人群,比如放射和感染源暴露,或者具有特定遗传家族史的筛查,则不属于本文讨论的范围。
条件一:高发病率和死亡率
推荐普通人筛查的癌症应该是常见的、发病率较高的癌症。高发病率意味着筛查能够更大概率发现“隐藏”的癌症患者,也就能够给更多人带来收益。如果是发病率很低的癌症,筛查只能发现很少的患者,与大范围筛查造成的成本和风险不成比例。医疗资源是有限的,不可能兼顾所有的癌症,优先选择发病率高、对人群和社会影响大的癌症进行筛查是现实的做法。
所以那些向健康人推荐的癌症筛查几乎都是常见和高发的癌症。以美国公共卫生协作组(U.S. Preventive Services Task Force, USPSTF)为例,向公众推荐的癌症筛查都是常见和死亡率较高(注意:这里说的不是病死率,病死率是特定区域内死于某种疾病的人数和该疾病的总患病人数之比,死亡率是特定区域内死于某种疾病的人数和该地总人数之比)的癌症,包括乳腺癌、宫颈癌、结直肠癌、前列腺癌和肺癌。具体的筛查建议如下:
肺癌:年龄50-80岁之间,有超过20年包吸烟史(每天吸烟的包数与吸烟的年数相乘大于20)者,以及吸烟达到此量且戒烟不足15年者,建议每年一次的低剂量胸部CT扫描。
肠癌:年龄45-75岁,每10年一次的全结肠镜检查,或每年一次的高敏感度隐血检查,或每5年一次的乙状结肠镜检查。如果结肠镜检查发现息肉,要根据息肉的数量和病理类型缩短筛查间歇。
乳腺癌:年龄50-74岁的女性,每两年一次的乳腺钼靶筛查。
宫颈癌:年龄21-29岁,每三年一次的宫颈涂片检查;30-65岁,每三年一次的宫颈涂片检查,或每五年一次高风险人乳头状瘤病毒筛查(可单独做,也可以每五年一次结合宫颈涂片检查)。
前列腺癌:对于55-69岁之间的男性,是否进行规律的前列腺癌筛查应该个体化,个体需要了解筛查可能带来的益处和伤害。对于70岁以上的男性,不建议常规筛查。
如果对比发病率和死亡率最高的癌症和推荐筛查的癌症,你会发现一些发病率和死亡率较高的癌症并不在筛查推荐范围之内,比如胰腺癌和肝癌。也就是说,高发病率和死亡率不是筛查推荐的充分条件,还需要结合其它条件。
条件二:癌症的停留时间
兵法讲究知己知彼,对人类健康的敌人癌症也是如此。不管是筛查、诊断还是治疗,都受限于我们对某种癌症的认识程度,包括它们的病因、发生机制、生长规律、不同阶段的形态,以及不同阶段对人类寿命和生活质量的影响等。
在癌症筛查方面,一个关键的问题是知道癌症的停留时间(Sojourn Time)。一个癌灶可能在引发症状、威胁健康之前已经存在了好多年甚至好几十年,停留时间指的是癌灶从(在形态上)可被当前技术手段检测出,一直到表现出症状,之间的持续时间。这个时间不能太短,也不能太长。停留时间太短就很难发现早期病变,或者需要密集反复的筛查;停留时间太长,则癌灶在很多人有生之年都不会引起症状,那么筛查就只会导致过度诊断和治疗。最适合筛查的停留时间一般是几年。
确定一种癌症的平均停留时间并不容易,往往需要基础、临床以及公共卫生多个领域多年的协作研究和观察。即便是同一种肿瘤,一些细微的差异也可能导致停留时间的长短不一,所以只能取一个平均值。比如一般认为乳腺癌的停留时间为1-2年,结直肠癌2-4年,前列腺癌3-7年,肺癌报道不一,可能在几个月到数年之间。
对于很多癌症,目前还无法确定停留时间,也就无法给予合适的筛查建议,比如肝癌、胰腺癌、卵巢癌等,这些癌症大多数直到出现症状时才能得到诊断。对这些癌症难以筛查,还涉及到关于筛查的另一个关键问题,那就是早期病变的识别和消除。
条件三:早期病变可以被发现和消除
癌症筛查的目的是发现早期病变并消除它,从而预防晚期癌症的发生。早期病变可以指相对局限的癌症,比如没有转移的乳腺癌,以及有较高癌变风险、但还没有癌变的病变,比如结直肠腺瘤。
从这个角度要达到早期筛查的目的,需要有三个条件:存在早期病变,早期病变能被发现,早期病变容易被移除。
理论上任何癌症都有早期病变,包括早期癌症和癌前病变。但限于医学发展水平,对大多数癌症来说,我们目前还不知道它们的早期病变是什么样子。即便有,限于技术水平,我们也很难发现。被推荐筛查的癌症,大多是知识和技术结合下的“幸运儿”。
以结直肠癌筛查为例,不管是粪便潜血、DNA检测之后的结肠镜检查,还是直接进行结肠镜检查,主要目的都是为了发现结直肠腺瘤。有统计认为70%-90%的结直肠癌由腺瘤发展而来,结直肠腺瘤是结直肠癌明确的癌前病变。而结直肠腺瘤又可以在结肠镜下直观地观察到,切除也很方便,结肠镜就成为了结直肠癌筛查的理想手段。
乳腺癌的癌前病变虽然不如结直肠癌那么直观,但不管是超声还是钼靶检查,都是无创和便捷的,局部病变的移除对于外科医生来说难度也不高。
而对于肝癌、胰腺癌和卵巢癌来说,我们不光对它们的早期病变知之甚少,而且如果发现可疑病变,进一步确诊和移除的难度都不小。肝脏穿刺需要超声或CT引导,胰腺穿刺需要经过超声内镜引导,技术难度高,而且有很高的假阴性和假阳性率。手术移除病灶则需要创伤较大的手术,对手术者的要求也比较高,且有手术后并发症的风险。
那么有了对于癌前病变或早期癌症的认识和消除技术,是不是就值得推荐筛查了?还不够,还需要涉及到本文探讨的最后一个问题:循证医学证据。
条件四:循证医学证据
医学科学界针对一种具体的诊疗手段采用的是有罪推定原则,即:如果没有找到足够证据证明这种手段对人类(或某个特定人群)安全有益,则默认为其无益有害。癌症筛查,以及其它查体手段,也同样适合这一原则。
癌症筛查是针对普通健康人的保健措施,不仅要考虑到对整体人群的健康影响,还要考虑到成本收益,以及医疗保险的问题,需要格外谨慎。一种癌症筛查要通过专业权威机构的推荐,以及政府和商业保险的认可,需要循证医学证据,来证明筛查比不筛查有好处。
最佳的循证医学证据是多个设计良好、样本量足够大的随机对照试验;基于癌症筛查的特殊性,还需要相当长的观察时间——即便是最有效的癌症预防手段,要看到效果也需要好几年的时间。
当积累了一定的临床试验之后,一些研究机构、学术组织就会对这些数据进行汇总分析,其中重要的内容有两个,一个是评价临床试验的质量,一个是对汇总的数据进行荟萃分析。
以USPSTF对结肠癌筛查的意见为例,当前最新版的意见是基于2021年发表于《美国医学会杂志》(JAMA)的一篇系统性综述。在这篇系统性综述中,作者们搜集了追踪日期截止到2021年3月的结肠癌筛查研究。
研究者先海量搜索得到了11306篇关于结直肠癌筛查的论文,通过题目和摘要剔除了10804篇不符合要求的论文后,纳入了502篇论文。对这502篇论文全文通读之后,USPSTF的专家团队将其分成了三类,对应三个关键问题:
问题一,筛查相对于不筛查有没有好处,包括随机对照和非随机对照试验;
问题二,以结肠镜作为标准,不同筛查方式的准确度如何,包括粪便检查和CT成像检查;
问题三,筛查造成的不良反应,包括死亡风险。
对于人们普遍关心的结肠镜筛查问题,推荐意见主要基于两项大样本的前瞻性队列观察:一项来自对医务人员包括护士和男医生跨度达24年的追踪调查;另一项时间跨度较短,为8年,是通过分析Medicare的病人数据。结果显示结肠镜筛查降低结肠癌死亡风险六成多(调整风险比值,Adjusted Hazard Ratio,0.32)。
基于对证据的分析,USPSTF分别把50-75岁和45-49岁人群的结肠癌筛查推荐分别标为A和B。A意味着USPSTF非常确定进行筛查可以带来显著的好处,B则表示USPSFT确定筛查可以带来中等到显著的好处。另外还有C和D,对应确定性和推荐度的降低,其中D表示反对进行某项筛查,认为不会带来收益。
不同的推荐等级不仅影响医疗实践,关键的是还要和医疗保险挂钩。对于A级推荐的医疗手段,保险公司需要提供全额的保险。
需要指出的是,这些推荐意见并非一成不变,每过几年就有可能更新。如果有更新更好的证据,与当前的推荐意见不一致,之前的意见就可能被推翻。2022年10月《新英格兰医学杂志》(NEJM)发表了一项欧洲多中心研究,发现结肠镜检查能够降低结肠癌的发病率(风险比0.82,95%可信区间0.7-0.93),但对结肠癌死亡风险却没有明显影响(风险比0.90,95%可信区间0.64-1.16,一般认为可信区间跨越1就没有显著意义)。这项研究会不会影响到下一次的筛查修订尚不可知。
在正式修订发表之前,医生依然可以合理合法地向病人推荐这些筛查手段。可能有人担心这样不够“循证”,认为医生应该紧跟最新的医学进展。但实际上医生个体的精力都是有限的,而医学信息不光现有的永远学不完,新出的也永远看不完。个人基本不可能去做上面那种耗时耗力的证据收集、整理、甄别和统计工作。
其它癌症筛查意见也都有类似的产生过程,也都可能在新证据的情况下被修订甚至推翻。这也许会让公众产生一丝不安:原来这些经过权威机构认证和推荐的筛查都是不确定的。在涉及健康问题时我们都想得到确定的答案,心情很可以理解,但并不现实,毕竟医学的发展需要过程。
《返朴》之前已经有文章讨论癌症筛查的乱象,造成这种乱象的原因很多,缺少权威机构的推荐意见,以及与其配套的教育、培训、医保等措施缺失,是其主要因素。不同国家和地区的癌症种类和风险人群不尽相同,照搬其它国家的癌症筛查意见也不是办法。要做到真正科学有效的筛查,还是得从基础做起。
参考链接
[1] https://www.uspreventiveservicestaskforce.org/uspstf/recommendation/colorectal-cancer-screening
[2] https://www.uspreventiveservicestaskforce.org/uspstf/about-uspstf/methods-and-processes/grade-definitions
[3] https://jamanetwork.com/journals/jama/fullarticle/2779987
[4] https://www.nejm.org/doi/full/10.1056/nejmoa1301969
[5] https://www.nejm.org/doi/full/10.1056/NEJMoa2208375
本文受科普中国·星空计划项目扶持
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
0
推荐