应用机器学习建立产后女性压力性尿失禁风险预测模型
2025-08-15 来源:中国实用妇科与产科杂志

作者:杨晴晴,朱珏,汪期明,杨名洁等,宁波大学附属妇女儿童医院


根据国际尿控协会(ICS)定义,压力性尿失禁(SUI)是指进行引起腹压增高的动作如咳嗽、大笑、喷嚏或运动时尿液不自主漏出。流行病学调查显示,全球成年女性SUI患病率为20%~50%,最常见于产后和40岁以上的女性[1-2]。我国成年女性SUI的患病率达18.9%,其中50~59岁女性患病率最高,达28.0%[3]。妊娠分娩是导致SUI主要原因[4]。然而,患者发生SUI的风险程度无法预知,亟需预测产后女性SUI发生风险的预测工具,为临床实施精准干预提供依据。在计算机科学中,机器学习具有强大的数据提取、自我学习能力和更高的预测准确性,为医疗数据的采集、分析、存储和预测提供了大量有价值的工具[5],可用于预测疾病的患病率和治疗效果。本研究旨在运用提取到的影响因素数据构建产后女性SUI风险预测模型,运用机器学习算法中的随机森林、支持向量机、XGBoost、KNN(k近邻)和决策树等5种方法构建模型,选择最优模型作为本研究的预测模型,以期为临床评估产后女性SUI发生风险并提供提前干预的依据[6-7]。


1    资料与方法


1.1   研究对象    以2022年10月至2023年6月在宁波大学附属妇女儿童医院盆底中心接受产后42d盆底功能筛查的516例产妇为研究对象。依据ICS关于SUI的诊断标准,发生SUI 82例,未发生SUI 434例。纳入标准:(1)单胎妊娠。(2)产后42~90d。(3)无生殖及泌尿系统感染。(4)无盆腔手术史及放疗史。(5)无神经肌肉系统病史。(6)足月妊娠。(7)既往无尿失禁病史。排除标准:(1)四次及以上分娩史。(2)双胎分娩史。(3)孕前盆底功能障碍(PFD)病史及家族史。(4)妊娠。(5)流产早产。(6)若为经产妇,两次分娩方式不一致。本研究已通过宁波大学附属妇女儿童医院伦理委员会审批(批件号:EC2024-104)。


1.2    研究方法


1.2.1    手测肌力    即分类型盆底肌力测试,是国内外比较通用的方法之一,根据盆底肌肉收缩强度及持续的时间,来测定盆底肌力,能收缩并持续4~5s为正常,此方法既可以了解盆底肌收缩的质量,也可以了解盆底肌Ⅰ类肌纤维持续收缩能力和Ⅱ类肌纤维在一定时间内的快速重复收缩能力。其中任1项肌力≤3级即为肌力异常[8]。见表1。


1.2.2    盆底三维超声检查    所有受检者均完成盆底三维超声检查。使用深圳迈瑞公司Resona 8T超声诊断仪,配套使用DE10-3U腔内探头和D8-2U容积探头(扫查角度120°)。受检者排空大小便,取膀胱截石位。将探头紧贴患者会阴部,显示盆底正中矢状切面,可见耻骨联合、尿道、膀胱、直肠肛管及肛直肠角,采集患者静息、最大Valsalva动作时的超声图像。采用4D View软件进行后处理分析,观察静息及最大Valsalva动作时有无膀胱后壁膨出及尿道内口漏斗化形成,测量膀胱颈活动度、膀胱尿道后角度、尿道倾斜角度、尿道旋转角度、膀胱颈移动度等盆底超声参数(见图1)。以上指标均测量3次,取平均值。


1.2.3    盆底肌电生理检查    所有受检者均完成盆底肌电生理检查,使用南京伟思公司9801型盆底肌电生物反馈仪的Glazer评估程序,获得受检者5个阶段的盆底肌电信号:(1)前静息阶段:受检者在盆底肌肉收缩前放松60s,记录前静息阶段平均值,>4μV 提示前基线高张。(2)快速收缩阶段:受检者快速收紧盆底肌肉后快速放松,间隔10s测量1次,重复5次,取最大值为快肌收缩结果(Ⅱ类肌纤维最大值),<35μV提示盆底快肌肌力不足。(3)紧张收缩阶段:受检者快速缩紧阴道肌肉并保持10s后放松,间隔10s测量1次,重复5次,取平均值为紧张收缩平均值(Ⅱ和Ⅰ类肌纤维收缩平均值),<30μV提示盆底混合肌肌力不足。(4)盆底耐力收缩阶段:受检者持续缩紧盆底肌肉60s后放松,测量1次,取平均值为盆底耐力收缩平均值(Ⅰ类肌纤维收缩平均值),<25μV提示盆底耐力肌肌力不足。(5)后静息阶段:受检者在盆底肌肉收缩后放松60s,记录后静息阶段平均值,>4μV 提示后基线高张。


1.3    分组    采用交叉验证的方法进行模型评估,按7∶3的比例划分训练集和验证集,抽取70%样本作为训练集,30%的样本作为验证集。


1.4    资料收集    根据前期研究筛选出的危险因素,收集以下数据和信息:年龄、分娩方式、产次、第一产程时长、第二产程时长、是否无痛分娩、会阴损伤情况、体重指数(BMI)、最大新生儿体重、孕前是否健身、孕期及产后是否Kegel运动、手测肌力、盆底三维超声指标、盆底肌电生理检查等因素。


1.5    方法


1.5.1    一般特征和SUI危险因素分布描述    采用R 4.3.3对数据进行处理与分析。对于连续型变量,如符合正态分布,采用均数±标准差进行统计描述,组间比较采用独立样本t检验,不符合正态分布则采用中位数(M)和四分位数间距(P25,P75)进行描述,组间比较采用秩和检验。组间比较采用χ2检验,不满足χ2检验时使用Fisher确切概率法。所有研究对象使用sample函数7∶3随机划分为训练集和验证集,训练集用于模型训练,验证集用于模型验证。对于少量缺失值,采用“missRanger”包进行多重插补。


1.5.2    机器学习模型预测模型构建    训练集用于构建模型和选择特征,基于特征选择和特征排序的逐步融合对特征进行过滤,随后将数据输入5种机器学习算法并进行调参:随机森林、支持向量机、XGBoost、KNN(K近邻)和决策树,计算受试者工作特征(ROC)-曲线下面积(AUC)值、准确度、精确度和F1评分,评价最佳预测模型并进行内部验证。


1.5.3    评价标准    本研究主要根据混淆矩阵计算得到的精确度、召回率、F1值和ROC参数选择效果最佳的模型,再通过AUC对最佳模型的鉴别能力进行评估,AUC代表由特异度及灵敏度为横纵坐标所绘制的曲线下面积。


2    结果


2.1    产后女性SUI单因素分析    本研究纳入的516例患者中,产后SUI发生率为15.89%(82/516)。两组在年龄、产次、分娩方式、第一产程时长、第二产程时长、是否无痛分娩、会阴损伤情况、手测肌力Ⅰ类肌异常、膀胱颈活动度增加、膀胱后壁中度膨出、子宫脱垂、尿道内口漏斗形成、会阴体活动过度、肛提肌裂孔增大、前静息阶段、快速收缩阶段、紧张收缩阶段、耐力收缩阶段、后静息阶段等之间的差异有统计学意义(P<0.05)。


2.2    模型分析结果


2.2.1    不同模型比较    将所有样本按照7∶3的比例划分为训练集(361例)和验证集(155例)。采用机器学习的5种方法,根据以上影响因素等情况,对患者是否发生产后SUI进行分类预测研究。采用十折交叉验证的方法计算五种机器学习算法的准确率、精确度、召回率、F1值,对模型进行评估和验证,最大可能使模型性能更具可信性。其中,F1值是精确度和召回率的调和平均数,提供同时考虑假阳性和假阴性的评估方式。其通过在两者之间取得一个平衡点,使得我们能够在不偏袒任何一方的情况下评估模型的性能。最终使用预测结果与实际结果的F1值作为评价指标,F1值越高模型越好。通过模型训练得出随机森林、支持向量机、XGBoost、KNN(K近邻)和决策树5种模型在训练集和测试集的F1值均在0.7以上,具体数值见表2。


2.2.2    ROC对五种模型预测能力评估    综合以上结果可以看出,随机森林在训练集上的F1值1.000,验证集上F1值0.776,受试者曲线下面积AUC训练集1.000,验证集0.837,内部验证效果最好。因此,以随机森林模型预测效果最好。见图2a~b。


2.2.3    随机森林预测模型结果    随机森林模型将纳入的特征根据重要性评分结果进行算法排序,以紧张收缩阶段、年龄、耐力收缩阶段、前静息阶段、后静息阶段、快速收缩阶段、BMI、会阴损伤情况、最大新生儿体重、产次这些特征在预测产后SUI起到了关键作用。见图3。


3    讨论


3.1    机器学习在疾病预测中的优势显著    首先,机器学习能处理大量复杂数据,构建高精度预测模型,超越传统列线图方法。其次,机器学习可以基于个体特征定制风险评估,提高治疗针对性,避免盲目治疗带来的社会经济负担。五种机器学习模型预测效能比较,结果显示以上模型当中,随机森林和XGBoost预测效能最高,而随机森林在训练集1.000,验证集0.776,内部验证效果最好,精确度最高。因此,随机森林较其他四种模型具有更高的预测效能。


3.2    根据随机森林算法对产后SUI预测模型的特征解释         研究发现,在随机森林模型中,排名前6的特征中有5项来自盆底肌电生理检查。表明该指标在预测产后 SUI 中具有关键价值。其中,紧张收缩阶段,快速收缩阶段,耐力收缩阶段,后静息阶段,前静息阶段OR值均小于1,可见以上指标数值越小,可募集的盆底肌纤维越少,越容易引发产后SUI。盆底肌电生理检查操作简便,在疾病评估中应用普遍,价值突出。推荐对产后女性及时进行该项检查,筛选出高危人群,必要时给予盆底肌的锻炼或者电刺激生物反馈等治疗,可帮助该类人群减少发生SUI的风险。


年龄在本预测模型中排在第2位,几乎绝大多数流行病学调查都认为年龄因素与SUI的发病密切相关,有学者研究发现随着年龄的增加,SUI患者的尿道括约肌厚度和功能明显下降,且女性大于35岁后,体内雌激素水平逐渐下降,膀胱颈、尿道周围及盆底肌胶原蛋白含量下降,导致尿道闭合及盆底支持机制的双重削弱而发生。随着我国二孩、三孩政策开放后,育龄妇女的分娩年龄也逐渐增加,对SUI患病高危人群,需加强随访及健康指导,避免疾病进展或延迟进展。


目前绝大多数调查表明BMI与SUI患病率密切相关,BMI每增加5,SUI的风险增加1.26倍。肥胖人群患SUI的机制尚不十分清楚。一般认为肥胖女性腹压会相应增加,对盆底支持组织造成损伤,影响泌尿生殖道神经肌肉功能[9]。产妇经会阴侧切分娩是垂直于肌纤维将球海绵体肌、会阴横肌甚至包括部分肛提肌、阴道神经等切断,因此会阴侧切导致盆底肌肉、神经损伤;会阴裂伤也可能导致盆底的肌肉、筋膜发生机械性的损伤,直接的损伤、瘢痕的形成均使盆底组织的功能降低[10],进而导致SUI的发生。有研究认为,妊娠期胎儿体重过大会增加母体盆底肌负担,产程中胎头持续压迫盆底组织,使分娩过程更加困难,并增加第二产程延长及软产道损伤的风险,进一步加重产后盆底功能障碍,导致产后SUI的发生[11]。且无论阴道分娩或剖宫产,新生儿出生体重与产后SUI均呈正相关[12]。


妊娠和分娩通常被认为是SUI的独立危险因素,Danforth等[13]提出,美国初次分娩妇女的SUI患病率为9.7%,有2次分娩史的妇女为16.3%,有3次以上分娩史的妇女为23.9%,而未分娩妇女为6.5%,本研究结果支持这一观点。


在本次研究中,盆底超声指标贡献排名相对靠后,参考价值偏小。这一结果可能与产妇对该动作认知有偏差,或每次用力屏气做Vasava动作幅度不一致有关。也有学者认为,盆底三维超声联合盆底肌电生理检查,更具有临床实用价值[14]。


本研究存在一定的局限性:(1)本次研究纳入的人群是产后42~90d的女性,缺乏远期观察随访。对远期是否发生SUI,还需开展前瞻性队列研究。(2)由于收集到的患者数据来自同一单位。在以后的工作中可以扩大样本量,或进行多中心外部验证使模型预测具有普遍性和通用性。


综上所述,产后女性SUI发生率较高,严重影响患者生活质量。既往研究主要采用传统的logistic回归模型或Cox比例风险回归模型。但随着人工智能的发展,构建基于机器学习的疾病风险预测模型,为早期识别高危人群提供了一种新的方法。在本研究结论里,随机森林算法预测效能表现出色。该算法对于数据分布并无特定要求,面对多元共线性问题时,也不会产生过度敏感的反应。在处理高维特征变量时,随机森林算法能够精准地识别出关键的相关变量。除此之外,随机森林算法的随机性能使得其不容易发生过拟合。


利益冲突    所有作者均声明不存在利益冲突


作者贡献声明    杨晴晴:论文撰写、数据收集与分析;朱珏,汪期明,杨名洁,钱苗红:数据收集;张晶:论文修改


参考文献略


来源:杨晴晴,朱珏,汪期明,等.应用机器学习建立产后女性压力性尿失禁风险预测模型[J].中国实用妇科与产科杂志,2025,41(7):734-737.

(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)

0
收藏 分享