不久前,在浏览最新的人工智能新闻时,我偶然发现一家公司声称使用“机器学习和先进人工智能”来收集和分析数百个数据触点,以改善用户在移动应用中的体验。就在同一天,我还读到另一家公司利用“机器学习和人工智能”及“人工智能预测分析”来预测客户行为。

(我就不提这些公司名称了,以避免让它们难堪,因为我相信它们的产品能解决实际问题,即使他们是在以欺骗的方式进行营销。)

关于人工智能(AI)和机器学习(ML),有许多混淆概念的东西。有些人将人工智能和机器学习当作同义词来互换使用,而另一些人则将它们作为独立的并行技术看待。在很多情况下,谈论技术和撰写技术文章的人不知道 AI 和 ML 之间的区别,在另一些情况下,他们故意忽略这些差异,为营销目的制造兴奋点,或进行炒作。

在这篇文章中,我将尝试厘清人工智能和机器学习之间的区别,以帮助你区分人工智能的事实和围绕 AI 的虚构。

我们知道机器学习是什么

我们从机器学习开始,这是 AI 和 ML 方程中比较简单的部分。机器学习是人工智能的一个子集,是能运行人工智能的众多方式中的一种。机器学习依赖于定义行为规则,通过检查和比较大数据集来寻找常见的模式。这是一种对解决分类问题特别有效的方法。

例如,如果你提供具有大量 X 射线图像及其相应症状的机器学习程序,它将能够帮助(也可能自动化)对未来 x 射线图像进行分析。机器学习应用程序将比较所有这些不同的图像,并找出在被标记为类似症状的图像中发现的常见模式。当你为它提供新的图像时,它会将内容与它所归纳的模式进行比较,并告诉你这些图像有多大可能包含了它之前研究过的任何症状。

这种类型的机器学习被称为“监督学习”,在这个过程中,算法会通过人标记的数据进行训练。“非监督学习”是另一种类型的机器学习,依赖于给算法无标记的数据,并让它自己找到模式。例如,您提供了一个恒定网络流量的 ML 算法,并让它自己学习并掌握什么是基线、正常的网络活动,以及在网络上发生的异常和可能的恶意行为。

强化学习是第三种流行的机器学习算法,它依赖于为其提供的一套规则和约束,学习如何最好地实现它的目标。强化学习通常包括一种奖励,比如在游戏中得分,或者减少设备的耗电量。ML 算法在为其提供的约束条件下尽可能地最大化它的回报。强化学习在教学 AI 算法中很有名,可以玩不同的游戏,比如《星际争霸》、《DotA》,以及围棋、扑克等类型游戏。

机器学习是很吸引人的,特别是更高级的子集,比如深度学习和神经网络。但这并不是魔法,即使我们常常搞不清楚它的内部是如何运作的。从本质上说,ML 是对信息进行分类或预测未来趋势的数据研究。事实上,尽管许多人喜欢将深度学习、神经网络与人类大脑的运作方式进行比较,但事实上两者之间存在巨大的差异。

简而言之,关于机器学习,我们起码应该知道它是人工智能的一个子集。另外,我们也需要了解它能做什么,不能做什么。

我们不知道人工智能是什么

另一方面,“人工智能”这个概念的范畴很广。按照卡内基梅隆大学计算机科学学院院长安德鲁·摩尔的说法,“人工智能是使计算机以直到最近我们才认为需要人类智能的方式运行的科学和工程。”

这是在一个句子中定义人工智能的最好说法之一,但它仍然显示了这个领域的广泛性和概念的模糊性。例如,“直到最近”是随着时间而改变的。几十年前,一个袖珍计算器也被认为是人工智能,因为计算是只有人类大脑才能完成的事情。今天,计算器是您在每台电脑上都能找到的最傻瓜的应用程序之一。

正如《近似正确》的编辑 Zachary Lipton 所解释的那样,“AI”这个术语“有一个雄心勃勃的基于人类能力的目标,而这一能力是机器本身所不具有的”。

人工智能还包含了许多我们知道的技术。机器学习只是其中之一。早期的人工智能使用了其他的方法,比如老式的 AI(GOFAI),它与我们在其他应用程序中使用的 if-then 规则相同。其他方法包括 A*、模糊逻辑和专家系统等等。1997 年击败国际象棋世界冠军的人工智能,使用了一种名为“树搜索算法”的方法,在每一个回合中对数以百万计的动作进行评估。

许多有关人工智能的参考资料都涉及到一般性 AI 或人类级别的智能。这就是您在科幻电影里看到的那种技术,比如《黑客帝国》或者《2001:太空漫游》。但我们仍然不知道如何创造出与人类思维一致的人工智能,而深度学习,最先进的人工智能,也只能与人类孩子的大脑相媲美。它非常适合执行狭隘的任务,而不适宜于作出一般的、抽象的决定,但这并不是一件坏事。

正如我们所知道的,今天的人工智能是由 Siri 和 Alexa 所代表的,它们通过精确的电影推荐系统为 Netflix 和 YouTube 提供支持,通过对冲基金用来进行每年数百万美元的微交易。这些技术在我们的日常生活中已经越来越重要。事实上,它们是增强我们的能力和提高我们效率的一种增强智能技术。

与机器学习不同,人工智能有一个变化的目标,随着相关技术的发展,它的定义也将发生变化。什么是人工智能或什么不是人工智能很容易引起争论,但机器学习的定义是非常明确的。也许在几十年后,今天的尖端人工智能技术将被认为是愚蠢和乏味的,就像现在的计算器一样。

因此,如果我们回到文章开头提到的例子,“机器学习和高级人工智能”到底是什么意思呢?机器学习和深度学习不是目前最先进的 AI 技术吗?“人工智能预测分析”是什么意思呢?预测分析不是也使用机器学习,是人工智能的一个分支吗?

为什么科技公司喜欢将 AI 和 ML 互换使用?

自从“人工智能”这个词被创造出来以来,这个行业经历了许多起伏。在最初的几十年里,围绕着这个行业进行了大量的宣传,许多科学家承诺,人类级别的人工智能即将到来。但未兑现的承诺引起了人们对该行业的普遍失望,并导致了人工智能进入了寒冬,这一时期的资金和对该领域的兴趣大大减弱。

后来,科技企业试图将自己与“人工智能”一词分开——因为 AI 已经成为毫无根据的炒作的同义词——并使用其他术语来指代他们的工作。例如,IBM 将“深蓝”描述为一台超级计算机,并明确表示它不使用人工智能,而从技术上讲也确实如此。

在此期间,诸如大数据、预测分析和机器学习等术语开始流行起来。在 2012 年,机器学习、深度学习和神经网络取得了巨大的进步,并开始在越来越多的领域中使用。企业突然开始使用“机器学习”和“深度学习”来推销他们的产品。

深度学习开始执行基于规则的编程无法完成的任务。语音、人脸识别、图像分类和自然语言处理等领域,在非常粗糙的阶段,突然间有了巨大的飞跃。

这也许就是为什么我们看到了人工智能转变并回归的原因。对于那些习惯了老式软件极限的人来说,深度学习的效果几乎是一种魔力,特别是因为神经网络和深度学习正在进入的一些领域一直被认为是计算机的禁区。机器学习和深度学习工程师的薪水是 7 位数,即使他们在非营利组织工作,这也说明了这个领域的热度。

再加上对神经网络的误导性描述,声称这个结构模仿了人类大脑的工作,使人突然有了一种感觉,我们又开始转向人工智能了。许多科学家(尼克·波斯托姆、埃隆·马斯克等)开始警告说,世界末日即将来临,超级智能电脑会将人类推向被奴役和灭绝的境地。对技术失业的担忧再度浮现。

所有这些元素都帮助重新点燃了围绕人工智能的兴奋和炒作。因此,企业的销售部门发现使用“AI”这个模糊的术语更有利可图,因为人工智能有很多的包袱,并且散发出一种神秘的光环。于是,他们便有意不具体说明他们使用的是哪种技术,这有助于他们对产品的功能进行过度宣传或再营销,而无需明确其功能限制。

事实上,这些公司所声称使用的“先进人工智能”,通常是机器学习或其他已知技术的变体。

遗憾的是,科技媒体常常未经深入了解和审查便随意报道,甚至为引人注目而有意夸大其词,他们经常会在有关人工智能的文章中加入水晶球的图像,以及其他一些神奇的表现形式。这将帮助这些公司围绕其产品进行炒作。但在这条路上,由于他们无法达到预期,他们不得不用人来弥补其人工智能的缺陷。最终,他们可能会在这个领域引起不信任,并为了短暂的收益而引发又一个 AI 冬季。

【数字叙事 原作:Ben Dickson;编译:Lighting】