标签:ant learning 分析 基于 选择 想法 anti 基线 自己
https://mp.weixin.qq.com/s/aAh5DUXaQQSukLIYHYvjugBy 超神经
场景描述:精神疾病和语言之间,存在着一些微妙的关系,但即便是经验丰富的医生,也不足以完全掌握这一联系。但从数据的角度出发,机器学习算法有望被利用在语言分析中,从那些异常的语言特征中,找到会演变成精神疾病的个体,从而帮助精神健康的建设和预防。
关键词:精神疾病 文本分析 医疗诊断
精神健康逐渐在威胁着更多人的生活。甚至有专业人士断言,二十一世纪最大的威胁就是精神疾病。
精神疾病,也称精神障碍、心理疾病。主要是指大脑功能出现失调,导致认知、情感、意志和行为等活动出现问题。常见的的精神疾病包括:精神分裂、抑郁症、自闭症、痴呆症、人格障碍等。
精神疾病患者往往承受着污名化等问题
精神疾病之间和犯罪行为之间也总是道不清说不明
精神疾病严重影响个人的生活,还会成为社会的不安定因素。
精神疾病的诊断也很重要,若能及时地诊断出来,能帮助患者更好的应对和治疗,而对那些想假借「精神判定」而开脱的人,用证据则能让他们接受正义的制裁。
在章莹颖被害案件中,
狡猾的凶手就妄图用精神疾病来为自己开脱
但常规的诊断方式比较繁琐,在经过详尽的精神检查、躯体及神经系统检查、脑影像学检查和神经心理学评估后,医生给出一个初步判断,还要再结合完整的病史资料,特别是个人生活史、发病史、相关社会心理因素,进行分析归纳,给出最后的判定结果。
传统的方式也存在弊端,比如缺乏直接可见的生物学客观指标,还依赖于症状学的临床观察,以及专业医生的个人经验。
针对不同群体,不同功能,不同流派中,
心理量表有着不同的诊断标准和规范
而一些研究表明,语言的细微特征,能够用来预测一个人是否会患有精神病病的风险。但这些特征通常不能被人为观察到,需要借助一些技术手段,而机器学习就成了最好的选择。
「即便是有经验的医生,在交谈中试图听出这些细微差别,也十分困难,就像在用眼睛去看微小的细菌,几乎不太可能。」
哈佛医学院神经学系的研究者 Neguine Rezai 说到,「但机器学习等计算方法,用来揭示隐藏在语言中的细微之处是可行的」。她补充说:「这些方法就像是加上了显微镜,可以准确地发现那些征兆。」
在 Nuture 子刊,专门报道精神疾病的 NPJ Schizophrenia 杂志上,埃默里大学和哈佛大学的研究人员发表了一篇论文《A machine learning approach to predicting psychosis using semantic density and latent content analysis》,他们利用机器学习技术,揪出了语言方式和精神疾病的隐秘联系, 能够准确地预测出精神疾病的早期现象。
文章链接地址:
https://www.nature.com/articles/s41537-019-0077-9
为了从语言中发掘出判断的依据,他们使用了两个语言变量:语义密度和声音相关词汇的使用。
语义密度是用来对「内容匮乏」或模糊性进行度量的一项指标。使用 vector unpacking 的数学方法,获得语义密度的语言标记:将句子的含义分解为其核心思想。
vector unpacking 的过程:单词嵌入(黑色向量)在句子中求和,以产生该句子的结果向量(蓝色向量) ,最终分解找到意义向量(红色向量)
为了让模型建立起判断的基准,从 Reddit 网站上的 3 万个帖子,抓取对话内容,使用 Word2Vec 程序,分析出对话中的词汇。对单词进行处理分析,使那些具有相似含义的单词在「语义空间」中靠近,含义差异较大的则距离很远。
使用 Word2vec 通过两层神经网络处理大量文本来创建单词嵌入
接下来,将埃默里大学北美前驱症状纵向研究(NAPLS)中 40 名患者的言语样本输入,并进行了为期两年的随访。为了训练模型,还采集了第二阶段研究的另外 30 名参与者的信息。
最后,研究小组将来自 NAPLS 的会话信息,通过机器学习分析,与基线数据进行了比较。再综合与后续数据的比较,包括那些最终患上了精神疾病的数据。就得到了语言和患病几率之间的联系。
基于语义密度和声音的转变为精神病的可能性
结果显示,分析的人群中,最终患上精神病的人员,有一些共同的特征,在他们的谈话内容中,与声音相关的(如语气词)的使用率高于正常标准,而且会很频繁地使用含义相似的词汇。
在他们的方法中,通过语言内容预先推测精神疾病,在实验中的准确率达到了 93%。
研究者之一 Elaine Walker 教授说到,如果能更早地识别出有风险的个体,并采取预防性干预措施,就能够极大地改观精神问题。
虽然实验得到了很高的精确度,但由于样本数有限,实验还处于研究层面上的成功。而研究者也表示,他们正在朝着完善和产品化的目的前进,未来计划用更多的数据,来测试和改进这一技术。
无论如何,新技术的应用,再次印证了可以从数据中,听出自然语言的「弦外之音」。
在最近的 Nuture 杂志上,封面文章刊登了一项惊人的成就。哥伦比亚大学的研究人员用八年的时间,完整描绘了秀丽隐杆线虫的所有神经网络及连接。
线虫的完整神经图谱
这种线虫的有三分之一的细胞都是脑细胞,所以绘制出线虫脑细胞的神经连接,是人类第一次解密关于脑部的详细运作方式。
对精神疾病的研究,也有助于对脑部的探索,虽然说 AI 发展模仿神经连接的方式的道路,现在式微了,但探索大脑的奥秘,是人工智能诞生之处就存在的一个梦想。
有关精神疾病的这些探索,只是小小的发现,但它在揭示精神疾病的信息之外,还有助于理解大脑是如何工作的,比如演绎大脑是如何将各种想法组合在一起。不可否认,这些发现堆积在一起,终将带来新的篇章。
更厉害的算法、技术的使用,让诊断和治疗都带来了新的突破,但技术还没有神话到可以接管一切的地步。只是期望着,更多方法的介入,能够让越来越多的人,拥有更健康的生活。
强烈建议川普用这个模型确认一下病情,23333
—— 完 ——
扫描二维码,加入讨论群
获得更多优质数据集
回复「进群」自动入群
更多精彩内容(点击图片阅读)
标签:ant learning 分析 基于 选择 想法 anti 基线 自己
原文地址:https://blog.51cto.com/14929242/2535150