在英国布里斯托一座低调的维多利亚风格住宅内部,有一群人正在被全天候地拍摄、监控和追踪。不管他们在干什么,身上的传感器都会持续保持记录。虽然这些人因此丧失了隐私,但他们所产生的数据对于人类预期寿命的延长意义重大。这个耗资1500万英镑的研究项目名叫SPHERE,其核心元素是安装在房屋内的十多个摄像头和测试者身上的可穿戴设备,而它的最终目标是观察每天的生活方式和生活状况对于健康的影响。
这栋智能房屋会观察一切,比如测试者看电视、行走或是锻炼的时间,然后将其进行对比。它还会注意测试者进食和饮水的频率,以及他们所使用的应用程序,甚至是他们的睡眠时间和室内温度。
这可能已经是个人数据收集的极致了,但这种追踪方式正变得越来越普及,侵入性也降低了许多。举个例子,苹果在本月的发布会上宣布自己已经拥有超过10亿部活跃设备。而在过去的几年里,他们也利用了这些设备来进行健康相关的数据收集。他们的开源工具ResearchKit帮助开发了帕金森氏病的诊断应用,并在不到一年时间里促成了“历史上最大规模的帕金森氏病研究”。而现在,他们又推出了另一款开源工具CareKit,它能够以相同的方式来帮助疾病治疗,而帕金森氏病应用这一次又出现在了首发名单当中。
科技驱动的自动化健康数据收集显然开启了无尽的可能。但如果没有有效的存储、分析、区别和应用方式,这些信息则几乎没有用武之地。而在处理如此大规模的数据时,人工智能自然也就成为了一个理想的候选。但这项问世已逾20年的技术能否真正开始挽救生命呢?
更大、更健康的数据
随着SPHERE项目的持续拓展,研究者正在开发额外的方式来挖掘其所收集的数据。在拥有了更为丰富的数据之后,他们希望研究报告的品质也能够随之提升。
对于任何健康数据收集而言,其关键都是发现这些数据的意义。所幸的是,人工智能和机器学习正在开始在该领域内展现出自己的影响力。除了可以提供数据的概要报告之外,研究者们还在研发可以评估、理解、同时提供建议和预测的自动化技术。
这些技术研发并非全都是为普通医疗保健所准备的。卡里生态系统研究所的研究科学家Barbara Hann就在使用机器学习对伊波拉病毒的传播进行建模和预测。
生物学家已识别的动物种类超过1600万,而追踪可能携带病毒的野生动物是一项非常适合大数据及机器学习的任务。“我们的算法可以处理不完整的数据集,”Hann在报告中写道,“机器学习同样可以很好地处理复杂性问题。生态分析经常会包含几十种变量,但这些变量相互作用的方式并不总是明确的。”
“取样偏好会让传染病研究产生偏离,而我们的方法可以抵消其所产生的影响。”她说。这也就是说,拥有来自美洲和欧洲的更高质量数据并不会推翻来自非洲更加相关的数据。
Hann这种基于算法的追踪方式已经成功辨别了一种携带伊波拉式病毒的蝙蝠种类,而这一种群并非只有非洲才有。
社交噪音中的信号
智能数据挖掘的另一种非常规方式体现在社交媒体的分析当中。在2009年,美国疾控中心(CDC)就使用了传统和社交媒体相结合的方式邀请公众报告和H1N1相关的症状。这让CDC得以同时监控疫病症状和受感染区域,也帮助他们引导了健康服务的反应。
把这个概念向前推进一步,研究者们目前正在调查使用社交媒体网络收集精神健康数据的方式,以建立可被社会政策决策者所使用的人口模型。通过基于交叉引用关键字所触发的危险信号,系统将可了解到自杀趋势。而在商业应用方面,机器学习也可以在社交媒体当中收集和有害药物反应相关的信息,以增强制药公司快速回应的能力,从而避免了相关副作用的遗漏。
如果把社交媒体作为信息来源,那么这些原始数据的品质自然也让人怀疑。医疗数据的收集有许多更为准确的方式,比如使用移动和可穿戴设备。腕带和智能手机之所以对于医疗领域如此有价值,不仅因为它们广泛的普及率,还包括其自身高度联网的特性和多样的功能。
就拿常规的眼部检查为例。它不仅可以用来进行视力障碍治疗,还能披露一些更为宽泛的问题,包括容易治疗的眼部疾病和糖尿病的发作。而在新技术的帮助下,眼部检查无需笨重的专业设备,只需使用普通的便携设备(比如智能手机)便可完成,对于当地没有眼科医生的偏远地区而言,它所带来的好处显然十分巨大。
目前,一款名叫PEEK的产品正在肯尼亚、马里、马拉维、坦桑尼亚、博茨瓦纳、马达加斯加、印度和英国进行实地测试。它由智能手机应用和廉价的视网膜成像装置所组成,可用于测试核心的视觉能力,比如视敏度、色彩/对比度敏感度、白内障影响分级等等。
目前,PEEK可以发现一些明显的眼部问题,让操作者把视网膜图像传回实验室。它并没有基于人工智能的自动分析功能,因此无法进行独立诊断。但是,它代表了一种由手持/可穿戴设备进行高质量数据收集的典型方式。
本文来源:不详 作者:佚名