您的位置：首页 > 社会 > 正文

世界信息:生物医学研究中，被忽视的性别影响

来源：NaturePortfolio© 时间：2023-03-01 12:17:14

2016年，药理学家Susan Howlett写完了一项研究，内容是孕期激素水平如何影响心脏功能，然后她把研究投给期刊。

(资料图片仅供参考)

审稿人意见返回后，三个中有两个都问了一个出乎意料的问题：雄性小鼠组织在哪？

Howlett就职于加拿大达尔豪斯大学，因为她和团队在研究妊娠相关的高激素水平，所以他们只用了雌性小鼠。“审稿人想让我们在雄性小鼠上重复所有实验，我真的很惊讶。”她说。

尽管如此，他们还是答应了，结果于2017年发表。跟预期一样，他们没有发现孕激素对雄性小鼠的心脏功能影响；但对雌性小鼠，孕激素会影响心脏细胞的活性。

Howlett对于增加雄性小鼠这个要求感觉喜忧参半。“这个要求很高，而且要做更多的实验。”但她补充说，一般而言把性别因素纳入研究确实很重要。“我非常赞成在雄性和雌性小鼠身上都做实验。”

插图：Kasia Bojanowska

许多科学的守门人——基金机构和学术期刊——都有同样的感受。过去十年左右，越来越多的资助人和发行商，包括美国国立卫生研究院和欧盟在内，都在要求研究者在其使用细胞和动物模型的研究中纳入两种性别。

推动这项政策的有两个催化因素。一方面人们逐渐发现，激素谱或性染色体上的基因相关的性别差异，会影响药物反应及其他治疗反应；另一个是人们意识到纳入性别因素，能提高科学探究的严谨性、增强可重复性，并为科学研究提出问题。

研究纳入两种性别后，可能会有重要的健康结果。例如，已得知性别能影响患者的常用药反应，包括某些抗生素，还有在较低血压下，女性心血管疾病风险较之男性似乎会增加。

新冠肺炎提供了另外一个现成的例子，说明为什么应考虑性别。死于新冠肺炎的男性更多，但女性似乎更易受到一系列持续症状的影响，也叫“长新冠”。

Sabine Oertelt-Prigione说，研究不止一种性别的很大好处是，“你也许会发现别处找不到的潜在通路、解决方法或新问题。”她是专门研究性别医学的临床医师，任职于荷兰拉德堡大学医学中心。

但人们期望的可重复性和严谨性提升未能一蹴而就。这些政策引起了许多困惑和争论，问题在于，应何时且如何把不同性别纳入实验设计中，且有些研究者认为目前的“性别”定义过于二元化和生硬。

“认同研究性别重要性的科学家数量正在增加。”NIH女性健康研究办公室主任Janine Clayton在给《自然》的评论邮件中写道。“但仍有进步空间。”

女性代表者消失

20世纪中后叶，越来越多的女性进入科研领域，一些人开始注意到很多临床研究都未能纳入两种性别。

缺少女性受试者，部分源自一场悲剧后的应对措施：孕期使用沙利度胺这种镇静剂被发现能引起先天畸形。一个结果是在1977年，美国食品药品监督管理局推荐可能怀孕的几乎所有女性都应排除在早期临床试验之外——就是那些在健康志愿者中检测药物安全性和疗效的试验。一项本是保护女性的政策，结果却留下了信息空白，导致不知这些药物对女性的影响。

研究者和资助人开始明白，不管是在研究中排除掉一大部分人群，还是混合性别分析，都可能产生临床后果。NIH于1990年对此作出应对，成立了ORWH，三年后开始要求把女性纳入临床研究。

但在基础科学领域，性别偏向直到最近几年才靠边站。十几年前，资助人和发行商开始着手应对这一失衡。2010年，加拿大卫生研究所实施一项措施，要求把生物性别及社会性别纳入研究；2013年，欧盟引入类似指南，并于2020年将其升级成一项强制要求。2016年，也就是Howlett团队被要求其工作中纳入另一性别那一年，NIH通过一项政策，号召涉及细胞、组织、动物的研究都纳入两种性别，这部分是为了在所有临床试验前发现性别效应的迹象。

出版方也在试图明确要求。2016年，科学研究生物和社会性别平等指南发表，阐述了发表研究应如何报道基于性别的差异。各个出版商，包括施普林格·自然，也有自己的政策，鼓励研究者按性别报告结果，这里性别定义为一组生物学特征，或有时根据gender，即社会定义的性别。

即便是做到这点也不容易。Clayton从2012年开始，在ORWH带头努力推行把“性别作为生物变量”。“我看着她一年又一年地做着这些，她和同事们”，Londa Schiebinger说，她是斯坦福大学的科学史专家，也密切参与到这项工作中。“就说让各个研究所接受把性别作为生物学变量，她就得到每个研究所里论证观点。”

Clayton 认为，NIH的SABV政策希望研究者寻找性别或性别差异带来的影响——或者为仅研究单一性别提供明确的正当理由。“寻找性别或性别差异带来的影响，是个机遇，而非阻碍。”她写道。

但即便是这项政策已经实施，部分研究者感到它就是个阻碍。

复杂的性别

在动物和细胞研究中解释清楚性别的作用，没有听上去那么简单。

基于解剖学这类宽泛指标来描述性别，忽略了其更深层次的激素复杂性，而这是带来确定或潜在雌雄差异的关键作用物质。不是受过培训的内分泌学家“可能不会知道这些事情”，Jessica Tollkuhn说。她是冷泉实验室的分子生物学家。

根据携带的染色体、或依据解剖特征粗浅地把性别定为二元分类，可能有很大局限。部分物种，比如秀丽隐杆线虫，一种性别只产生精细胞，另一种性别既产生精细胞也产生卵细胞。也有很大一部分物种性别由环境而非染色体决定。此外还有许多物种会在其生活史中改变性别。这种情况下，把细胞、组织甚至整个有机体放进二元分类里太困难了。

批评者还认为，这种政策还有一个动物管理问题：研究中纳入两种性别，需要更多的动物。

“假设你做小鼠研究，想纳入雌雄两性，你就得把小鼠数目翻倍。”Irene Miguel-Aliaga说，她是英国帝国理工学院的遗传学家，协助制定了使用两种性别进行研究的规范，该举措今年早些时候由英国医学研究委员会颁布实施。若性别差异构成研究假设，那可能需要双倍的小鼠，但若出于探索目的，“你只要有足够的动物数量来判断你的发现是否与性别有关。”她说。

平均而言，达到这个要求，样本大小需要增加三分之一。贝斯以色列女执事医疗中心内分泌糖尿病与代谢方向的主任Evan Rosen说，问题在于，“小鼠研究很贵，这些新政策让人沮丧的地方是，NIH要求我们做雌性小鼠的研究，但又不能提供足够经费。”

今年早些时候，他和团队发表了一张全面的人和小鼠白色脂肪组织图谱，他们遇到了一个有趣的问题：这个领域多数研究都在雄性小鼠身上完成，因为雄鼠比雌鼠脂肪多。但是，多数人类样本在减重手术中获取，所以女性患者数量占大多数。当团队开始进行图谱工作时，他们意识到自己的小鼠和人类样本组成相反，所以他们必须确保纳入来自雌鼠和男性人类的组织样本。Rosen说最后“确实发现了瘦人和胖人、瘦鼠和胖鼠之间存在着很大的差异，但是性别作为对比项没有结果。”

Miguel-Aliaga说，即便是这类没发现差异的“阴性”结果，也包含了很多信息。她指出，“不管研究的是什么，知道所研究的内容没有性别差异、或是所实施的治疗可应用于两性，这仍是个很好的结果。”做这些研究是“双赢”的。

前路艰难

这些政策本是为了推进改变，但多数科学家很难日常遵守，或将性别恰当地纳入研究。Clayton在发给《自然》的电子邮件中写道，截至2015年——NIH设置其临床试验要求的22年后——受评估的NIH资助随机对照试验中，不到三分之一报道了依据性别的结果，或解释了为何不报道。2018年一篇综述发现，过去14年情况基本保持不变。

女性纳入临床试验后，比例上通常不符合在这一群体某种疾病的现实发病率。2019年发表的一篇研究发现，从2014年到2018年作者分析的11种疾病种类中，女性在7种疾病中代表性不足，包括肝脏和肾脏疾病。

动物和细胞研究中遵守这项新政策的情况更是参差不齐。Nicole Woitowich是西北大学医学院医学社会学系SABV的研究者，她合作完成了一篇报道，研究了动物研究中在2009到2019年间纳入性别情况的变化。她和同事发现，在34本期刊的9个研究领域中，纳入两种性别的研究比例在提高。但其中8个领域，基于性别的数据分析并未增多，且文章作者很少解释忽略的原因。

Woitowich单独提到了神经科学。这个领域包含两种性别的研究数量大增，但只有不到半数花费篇幅说明了每种性别的具体数量。这是个可重复性的问题。纳入性别“非常好”，她说，但“如果我们不做基于性别的分析，基本上是把这一半数据放着不用。”

另一团队的后续研究更进一步，观察同一批研究如何处理数据。其中只有少部分报道了性别分类的数据，但其中未基于性别作适当分析——70%的研究甚至没有比较性别间的处理效应差异——或是结果解释不当。

一个常见错误是，根据在一个性别显著而另一个中并不显著的结果，从而推论出性别差异，即便并未直接对比两种性别。例如，有可能是因为个体间差异，一组值可能会比另一组值在均值附近范围更大。单独检验各组的显著性并不能显示两组是否有差异；二者必须用统计检验方法彼此比较。

但他们的研究还报道了另一种相反的偏倚：埋没真正性别效应的风险。当作者没有把性别作为因子纳入分析，而是把性别混合起来分析时就会增加这一风险，甚至有时初步计算显示出性别差异，他们还是会这么分析。

新冠肺炎再度提供了一个近期事例，说明错误的分析多么混淆视听。2020年一篇报道发现患新冠肺炎后男女免疫及炎症相关的分子水平存在差异。但Sarah Richardson和同事随后的研究指出这些分析中存在错误，她是科学史专家，在哈佛性别科学实验室任主任。Richardson和同事指出，其中三个结果的差异在同性别内，而非性别间。比如说，女性病情加重和病情稳定患者之间，有某个信号分子水平基线值差异显著，但这一模式在男性中未见。

原作者得出的结论是，该结果体现了“性别间”差异，但两种性别并没有直接进行对比。Richardson和同事则做了直接比较，发现两种差异值没有显著差别，表明性别并没有影响。他们得到结论，社会性别和种族这样的社会因素，而非生物性别，可能是这些被归于性别差异的背后因素。

部分研究者支持临床试验中应考虑这类社会因素。但这些变量更难以量化和纳入。像NIH的优先政策纳入生物性别的过程“对社会性别会更难，即使生物性别和社会性别作为两个健康决定因素已经难以分开。”洛桑大学的社会学家Madeleine Pape说。

Schiebinger的团队花费数年制定了一份调查表，应对临床试验中社会性别的应用。她希望有朝一日，NIH会把社会性别纳入社会文化因素中。但这“需要更好的量化方法”，她说。

SAGER指南和出版商关于生物和社会性别的政策，是为了鼓励作者纳入两种性别并报道其结果。但是期刊对于政策的遵守程度很松散。2021年一项非正式的综述表明，部分期刊编辑仍拒绝实施SABV政策，坚称这些政策对其领域并不适用。

Eliza Bliss-Moreau说，关于规则遵守不足、接受缓慢的抱怨并不意外，她是位心理学家，就职于加州大学戴维斯分校加州国家灵长类动物研究中心。“人们不擅于改变。”她指出。她还说NIH的资助周期为政策跟进带来了一个滞后期。“写到政策里的很多内容，人们都会抱怨，但10年、15年后，人们会接受事情一贯如此。”

些许进步

虽然进步道路曲折，但20世纪90年代初实施的联邦指南，也引出了一些重要的医学发现。或许这些发现是个信号，几年后基础研究也能产生一些重要发现。

例如，心脏对几种药物产生的电信号反应具有性别差异，包括抗抑郁药和抗生素。因此，部分药物如今推荐基于性别进行剂量调整。

类固醇激素，比如雌激素和雄激素，被认为是男女间多种差异的主要作用因素。例如，普萘洛尔属于β受体阻断剂这类降压药，女性代谢这种药物比男性慢。研究者认为性别相关的类固醇激素作用于肝脏能产生这些效应。其他因素可有体格大小和组成，比如女性脂肪肌肉比高。

男女间的风险界线值也可能不同。2021年一篇收缩压相关心血管风险分析，显示了混合两种性别的数据而非恰当分析的后果。作者发现，混合数据分析显示增加风险的收缩压范围是120~129毫米汞柱。但是性别特异分析显示，女性风险开始攀升实际上是在收缩压达到110mmHg时。若其他研究证实这些发现，这一结果将是心血管疾病风险计算的巨大变化。

这个研究正是“受到NIH要求所启发”，NIH要求将性别差异应用于健康结果，该研究的主要作者Susan Cheng说，她是西达赛奈医学中心的心脏学家。她说，如果没有要求研究专门设计探究性别差异的话，“我们有很多其他的想法，但不会集中于单一的主题。”他们这项发现“真是灵光乍现”，Cheng说。“我会想，‘我们之前怎么没发现呢？’”她把这些结果归功于NIH的新政策。“他们使之发生。”