“我的宠物到底在想什么?”相信这是不少养宠人士一直困扰的未解之谜。“毛孩子们”不会用人类的语音与我们对话,我们只能从它们的眼睛、耳朵、身体、尾巴等一切细节的变化来解读它们的想法。比如:狗摇晃尾巴是表示友好和开心,猫摇晃尾巴则是表示生气或不耐烦。虽然动物的行为确实能反映它们的内心想法和情绪,但尾巴弯曲的角度、站立姿势的微妙不同,都可能代表着完全不同的内心情绪。这些细微的差异单凭人类的肉眼几乎是无法分辨的。所以,为了捕捉到动物们的每一个小动作,我们需要一双更强大的“火眼金睛”。
今年5月,中国科学院深圳先进技术研究院王立平、蔚鹏飞团队发表的研究论文中表示,他们研发出了一个动物三维行为分析软件系统——Behavior Atlas,可以更深层地理解动物行为。
那么,这个系统究竟是如何实现“读心术”的呢?
多只眼睛进行升维打击
近年来,动物姿态追踪方法为行为量化打开了新的思路,但多数的动物行为采集还停留在二维空间,而动物行为发生在三维空间中,这不仅会因为动物身体遮挡产生误差和假信号,还丢失了一个维度的信息。例如,它们无法准确分辨出动物是否处于攀爬状态。
于是,研究人员为了能全面获取动物的行为信息,使用了“机器学习+三维重建”的方法,由此突破了二维视频分析框架,提出并构建了全自动的行为三维捕捉系统。该系统使用多视角相机的捕捉无惧遮挡,以极低成本在计算机中稳定获取动物三维数据,可以重建动物行为的三维运动结构。
时间动态序列分割
过去的大部分行为分析方法通常都会忽略神经活动的动态性,只采用单帧或定长滑窗的方法进行分割。这些方法不仅破坏了行为的动态结构,还不具备灵活的时间尺度,使对行为的识别效果受到了限制。就好比我们在说话的时候,即使是同一个人重复说同一句话,由于语速不同,音节和句子的持续节奏和停顿位置都难以相同。如果简单粗暴地对语音进行分割与识别,就会很难进行语言理解。
于是,研究人员应用了无监督的时间动态序列分割算法,保留了行为在时间上的自然结构。这样可以将不同行为对应准确分割到其相应的时间长度,不管是长达10秒的奔跑行为,还是几百毫秒的转向抬头,不同时间尺度下的行为尽收囊中。
海量数据无需人工标注
动物三维行为分析软件系统可以直接输出经过无监督学习客观分类的行为,不需要人工标注,研究者需要做的不过是在输出后进行简单的主观行为类别标记,即可在极短时间内获取大量优质数据集。这不仅推动了计算神经行为学的发展,从大数据及商业应用方面来讲,动物三维行为分析软件系统大大解放了科研工作者的生产力。
教你读懂动物的“单词”
如果将动物行为比喻成人类语言,那么动物的姿态就是最基础的字母,组成有意义的动作(单词),最终构成行为谱(句子)。
研究人员遵循动物行为的自然结构设计,基于层次化方法,利用无监督分类算法自底向上构建三层行为框架,将底层对应为每帧中的动物姿态,并向上组合成有意义的动作如奔跑、左转、站立、嗅探等,进而组成行为图谱,避免了人类依靠主观印象对行为的粗暴划分。
促进脑科学领域突破
在动物三维行为分析软件系统的火眼金睛下,动物们的小动作再也无所遁形。随着动物行为分析技术的发展,小动物们的心思迟早有一天会被暴露得一干二净。
不过,该系统的用处远不止这些,它对动物行为的观测在现代生命科学研究中也具有重要意义。比如,脑科学的核心目标就是研究大脑与行为的关系,比起传统的观测分析手段,动物三维行为分析软件系统能更准确、客观、高效地量化行为,帮助科研人员全面理解动物行为与脑功能、脑疾病的关系,从而促进人们对大脑认知机制、类脑智能以及脑疾病诊疗等研究领域的突破。