研究人员仅通过文本数据就能准确地识别出PTSD患者
阿尔伯塔大学的研究人员训练了一个机器学习模型,通过分析文本数据,该模型能以80%的准确率识别创伤后应激障碍患者。该模型有一天可以作为一种方便和廉价的筛查工具,支持卫生专业人员通过远程卫生平台检测和诊断创伤后应激障碍或其他精神健康障碍。
领导这个项目的精神病学博士候选人Jeff Sawalha对来自南加州大学创新技术研究所Jonathan Gratch创建的数据集的文本进行了情感分析。情绪分析包括获取大量数据,比如一系列推文的内容,并对它们进行分类——例如,看看有多少人在表达积极的想法,有多少人在表达消极的想法。
“我们想要严格地观察情绪分析看看我们是否能仅仅通过这些采访的情感内容就正确地识别或区分PTSD患者,”Sawalha说道。
南加州大学的文本数据集是通过250个半结构化的访谈收集到的,访谈对象是一个人造人物Ellie,时间是视频会议188名没有创伤后应激障碍的患者和87名患有创伤后应激障碍的患者。
Sawalha和他的团队能够通过分数来识别PTSD患者,分数表明他们的语言主要以中性或消极的反应为特征。
“这与许多关于情感和创伤后应激障碍的文献一致。有些人倾向于中立,麻木自己的情绪,可能不会说太多。还有一些人会表达他们的负面情绪。”
这个过程无疑是复杂的。例如,即使是像“我不讨厌那个”这样的简单短语也可能被证明是具有挑战性的分类,该研究的合著者、计算科学系教授和阿尔伯塔机器智能研究所的创建科学主任Russ Greiner解释道。然而,Sawalha能够仅从文本数据中收集到哪些人患有创伤后应激障碍的信息,这一事实为将类似模型应用到考虑到其他精神健康疾病的其他数据集的可能性打开了大门。
Sawalha说:“文本数据是如此无处不在,它是如此容易获得,你有如此多的数据。”“从机器学习的角度来看,有了这么多数据,它可能能够更好地了解一些复杂的模式,帮助区分患有特定精神疾病的人。”
下一步包括与亚利桑那大学的合作者合作,看看是否集成其他类型的数据,如语音或运动,可以帮助丰富模型。此外,一些神经疾病,如阿尔茨海默氏症和一些精神健康障碍比如精神分裂症,都有很强的语言成分,Sawalha解释说,这使它们成为另一个潜在的分析领域。
这项研究发表在精神病学前沿.
进一步探索