码迷,mamicode.com
首页 > 其他好文 > 详细

有没有精神病,和这个模型聊聊就能确认

时间:2020-09-21 11:47:15      阅读:38      评论:0      收藏:0      [点我收藏+]

标签:ant   learning   分析   基于   选择   想法   anti   基线   自己   

https://mp.weixin.qq.com/s/aAh5DUXaQQSukLIYHYvjug

By 超神经

场景描述:精神疾病和语言之间,存在着一些微妙的关系,但即便是经验丰富的医生,也不足以完全掌握这一联系。但从数据的角度出发,机器学习算法有望被利用在语言分析中,从那些异常的语言特征中,找到会演变成精神疾病的个体,从而帮助精神健康的建设和预防。

关键词:精神疾病  文本分析 医疗诊断

精神健康逐渐在威胁着更多人的生活。甚至有专业人士断言,二十一世纪最大的威胁就是精神疾病。

精神疾病,也称精神障碍、心理疾病。主要是指大脑功能出现失调,导致认知、情感、意志和行为等活动出现问题。常见的的精神疾病包括:精神分裂、抑郁症、自闭症、痴呆症、人格障碍等。

技术图片
精神疾病患者往往承受着污名化等问题
精神疾病之间和犯罪行为之间也总是道不清说不明

精神疾病严重影响个人的生活,还会成为社会的不安定因素。

精神疾病的传统诊断:依赖专家

精神疾病的诊断也很重要,若能及时地诊断出来,能帮助患者更好的应对和治疗,而对那些想假借「精神判定」而开脱的人,用证据则能让他们接受正义的制裁。

技术图片
在章莹颖被害案件中,
狡猾的凶手就妄图用精神疾病来为自己开脱

但常规的诊断方式比较繁琐,在经过详尽的精神检查、躯体及神经系统检查、脑影像学检查和神经心理学评估后,医生给出一个初步判断,还要再结合完整的病史资料,特别是个人生活史、发病史、相关社会心理因素,进行分析归纳,给出最后的判定结果。

传统的方式也存在弊端,比如缺乏直接可见的生物学客观指标,还依赖于症状学的临床观察,以及专业医生的个人经验。

技术图片
针对不同群体,不同功能,不同流派中,
心理量表有着不同的诊断标准和规范

而一些研究表明,语言的细微特征,能够用来预测一个人是否会患有精神病病的风险。但这些特征通常不能被人为观察到,需要借助一些技术手段,而机器学习就成了最好的选择。

「即便是有经验的医生,在交谈中试图听出这些细微差别,也十分困难,就像在用眼睛去看微小的细菌,几乎不太可能。」

哈佛医学院神经学系的研究者 Neguine Rezai 说到,「但机器学习等计算方法,用来揭示隐藏在语言中的细微之处是可行的」。她补充说:「这些方法就像是加上了显微镜,可以准确地发现那些征兆。」

在 Nuture 子刊,专门报道精神疾病的 NPJ Schizophrenia 杂志上,埃默里大学和哈佛大学的研究人员发表了一篇论文《A machine learning approach to predicting psychosis using semantic density and latent content analysis》,他们利用机器学习技术,揪出了语言方式和精神疾病的隐秘联系, 能够准确地预测出精神疾病的早期现象。

文章链接地址:
https://www.nature.com/articles/s41537-019-0077-9

新的诊断方式:从文本分析找出语言的秘密

为了从语言中发掘出判断的依据,他们使用了两个语言变量:语义密度和声音相关词汇的使用。

语义密度是用来对「内容匮乏」或模糊性进行度量的一项指标。使用 vector unpacking 的数学方法,获得语义密度的语言标记:将句子的含义分解为其核心思想。
技术图片
vector unpacking 的过程:单词嵌入(黑色向量)在句子中求和,以产生该句子的结果向量(蓝色向量) ,最终分解找到意义向量(红色向量)

为了让模型建立起判断的基准,从 Reddit 网站上的 3 万个帖子,抓取对话内容,使用 Word2Vec 程序,分析出对话中的词汇。对单词进行处理分析,使那些具有相似含义的单词在「语义空间」中靠近,含义差异较大的则距离很远。

技术图片
使用 Word2vec 通过两层神经网络处理大量文本来创建单词嵌入

接下来,将埃默里大学北美前驱症状纵向研究(NAPLS)中 40 名患者的言语样本输入,并进行了为期两年的随访。为了训练模型,还采集了第二阶段研究的另外 30 名参与者的信息。

最后,研究小组将来自 NAPLS 的会话信息,通过机器学习分析,与基线数据进行了比较。再综合与后续数据的比较,包括那些最终患上了精神疾病的数据。就得到了语言和患病几率之间的联系。

技术图片
基于语义密度和声音的转变为精神病的可能性

结果显示,分析的人群中,最终患上精神病的人员,有一些共同的特征,在他们的谈话内容中,与声音相关的(如语气词)的使用率高于正常标准,而且会很频繁地使用含义相似的词汇。

在他们的方法中,通过语言内容预先推测精神疾病,在实验中的准确率达到了 93%。

研究者之一 Elaine Walker 教授说到,如果能更早地识别出有风险的个体,并采取预防性干预措施,就能够极大地改观精神问题。

不止于精神疾病,前方是大脑的奥秘

虽然实验得到了很高的精确度,但由于样本数有限,实验还处于研究层面上的成功。而研究者也表示,他们正在朝着完善和产品化的目的前进,未来计划用更多的数据,来测试和改进这一技术。

无论如何,新技术的应用,再次印证了可以从数据中,听出自然语言的「弦外之音」。

在最近的 Nuture 杂志上,封面文章刊登了一项惊人的成就。哥伦比亚大学的研究人员用八年的时间,完整描绘了秀丽隐杆线虫的所有神经网络及连接。

技术图片
线虫的完整神经图谱

这种线虫的有三分之一的细胞都是脑细胞,所以绘制出线虫脑细胞的神经连接,是人类第一次解密关于脑部的详细运作方式。

对精神疾病的研究,也有助于对脑部的探索,虽然说 AI 发展模仿神经连接的方式的道路,现在式微了,但探索大脑的奥秘,是人工智能诞生之处就存在的一个梦想。

有关精神疾病的这些探索,只是小小的发现,但它在揭示精神疾病的信息之外,还有助于理解大脑是如何工作的,比如演绎大脑是如何将各种想法组合在一起。不可否认,这些发现堆积在一起,终将带来新的篇章。

更厉害的算法、技术的使用,让诊断和治疗都带来了新的突破,但技术还没有神话到可以接管一切的地步。只是期望着,更多方法的介入,能够让越来越多的人,拥有更健康的生活。

技术图片
强烈建议川普用这个模型确认一下病情,23333

—— 完 ——
技术图片
技术图片
扫描二维码,加入讨论群
获得更多优质数据集
回复「进群」自动入群
更多精彩内容(点击图片阅读)
技术图片

有没有精神病,和这个模型聊聊就能确认

标签:ant   learning   分析   基于   选择   想法   anti   基线   自己   

原文地址:https://blog.51cto.com/14929242/2535150

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!