杜克大学和麻省理工学院林肯实验室的研究人员训练神经网络以人类看待事物的方式,即根据事物的特征来识别其含义,对图像进行识别,从而将机器视觉提升到一个新的水平:不仅使图像识别更准确,且使结论可解释。

当我们看到某物的新图像时,我们根据一系列可识别的特征来识别它的含义。例如,我们可以根据鸟喙的轮廓、羽毛的颜色和脚的形状来确定鸟的种类。然而,一般神经网络只是简单地在整个图像中寻找像素模式,而不区分实际的鸟和它的背景。这使得神经网络更容易出错,也使得人类更难诊断它们。

根据麻省理工技术评论的报道,杜克大学和麻省理工学院林肯实验室的研究人员没有用完整的鸟类图像来训练神经网络,而是训练它识别不同的特征,比如鸟的喙和头的形状,以及羽毛的颜色。当新图像出现时,该算法会搜索这些可识别的特征,并判断它们属于哪个物种。它使用累积的证据做出最终的决定。

比如,对于一只红腹啄木鸟的图片,该算法可能会找到经过训练的两个可识别特征:羽毛的黑白图案和头部的红色。第一个特征可能与两种可能的鸟类相匹配:红腹啄木鸟或红啄木鸟。但是第二个功能将与前者最匹配。根据这两个证据,算法推断出图片更有可能是前者。然后,它会展示它发现的特征的图片,向人类解释它是如何做出决定的。

这一研究成果意义重大。为了让图像识别算法在高风险环境中更有用,它们需要能够以人类可理解的方式解释如何得出结论。对人类来说,信任它们不仅很重要,而且还能帮助人类更容易地识别逻辑错误时的情况。

通过测试,研究人员还证明,将这种可解释性纳入他们的算法不会影响其准确性。在鸟类识别汽车模型识别任务中,他们发现他们的方法接近——在某些情况下甚至超过了——用非解析算法得到的最新结果。

【数字叙事 黎雾】