近日,人工智能专业两名本科生谭泳森和黄嘉慧同学以共同第一作者身份向IEEE International Conference on Bioinformatics and Biomedicine (BIBM) 投稿的文章被接收,论文题目为 “Generalizable Deep Clustering Based on Bi-LSTM with Applications to Sepsis and Acute Kidney Disease Populations “。余夏夏老师为通讯作者,大红鹰499555为第一完成单位。
IEEE 生物信息学和生物医学国际会议 (BIBM) 已成为生物信息学和生物医学领域首屈一指的研究会议。 IEEE BIBM 2022于 2022年12月6日至8日在美国内华达州拉斯维加斯和中国长沙(线上)举行。IEEE BIBM 2022 为传播生物信息学和健康信息学的最新研究提供了一个顶尖的论坛。它汇集了来自计算机科学、生物学、化学、医学、数学和统计学的学术和工业科学家。该会议被CCF收录为B类会议。
亚表型被定义为疾病实体中的亚组,它们具有相似的潜在生物学因素或对医疗措施的不同反应。 源自亚表型不同病理生理机制的异质性是个性化护理不可避免的障碍。为了克服它,我们的目标是对危重病人进行分组,以发现独特的预后和/或治疗意义。
首先,我们利用双向长短期记忆来挖掘深层信息并捕获时间生物标志物的波动。 此外,我们通过联合训练将预测任务引入到表征学习过程中,以将表征与疾病严重程度联系起来。 最后,我们从不同维度的表示中集成集群,以结合全局和局部信息。
在这项研究中,我们提出了一种集成结果驱动的双向长短期记忆自动编码器架构,并使用自监督和时间序列数据识别疾病亚表型。 我们使用 BiLSTM-AE 捕获双向时间信息,然后将数据投影到低维表征空间。通过自编码器与死亡标签和弱预测器的协同训练关联表征与疾病严重程度。我们集成各种表征维度的集群以结合全局和本地信息,从而提高鲁棒性和可迁移性。在实现上,将每个模型的簇按照死亡率排序,使多个模型的每个簇对应。然后,我们可以通过硬投票获得集成集群。
我们对不同研究人群的每个亚表型进行统计分析。AKI或脓毒症患者的各种亚表型之间的死亡率存在显着差异。 这表明我们的方法在小型数据集和超过 10,000 人的大型数据集中均有效。24小时内生物标志物的平均值在亚表型之间表现出显着差异,并且生物标志物和亚表型之间存在近似线性关系。