AI小知识人工智能技术如何分类你知道吗?

2018-08-29 08:45:37 点击数:

我在人工智能领域已经有一段时间了,我意识到,有多种分类、区别、风景和信息图,可以用来代表和追踪思考人工智能的不同方式。然而,我不喜欢那些分类练习,主要是因为我倾向于认为分类动态数据点的努力在预先确定的固定框通常是不值得拥有这样一个“明确”框架的好处(当然这是一个概括,有时他们是非常有用的)。

我还相信,这一景观对于新到太空的人来说是有用的,他们可以对这个话题的复杂性和深度进行理解,同时也让那些更有经验的人有一个参考点,并围绕特定的技术创造新的对话。

接下来,我们将努力绘制一种架构来获取人工智能的知识,并遵循紧急动态,这是一种预先存在的知识的大门,它将允许您四处寻找额外的信息,并最终在人工智能上创建新的知识。我把它叫做AI知识地图(AIKM)。

在坐标轴上,你会发现两个宏观的基团。人工智能范例和人工智能问题领域。人工智能范例(x轴)是人工智能研究人员用来解决特定的人工智能问题的方法(包括最新的方法)。另一方面,人工智能问题域(y轴)在历史上是人工智能可以解决的问题类型。从某种意义上说,它也表明了人工智能技术的潜在能力。

因此,我已经确定了以下的人工智能范例:

基于逻辑的工具:用于知识表示和解决问题的工具

基于知识的工具:基于本体的工具和大量的概念、信息和规则数据库

概率方法:允许代理在不完全信息场景中执行的工具

机器学习:允许计算机从数据中学习的工具

体现智能:工程工具箱,它假定一个身体(或者至少是部分功能,如运动、知觉、交互和可视化)是更高智能的要求。

搜索和优化:允许智能搜索的工具,有许多可能的解决方案。

这六种范式也分为三种不同的宏观方法,即符号、次符号和统计(用不同的颜色表示)。简单地说,这种象征性的方法表明,人类的智力可以被简化为符号操作,而次符号化的方法是没有特定的知识表示在事前提供,而统计方法是基于数学工具来解决特定的子问题。

垂直轴代替了人工智能所使用的问题,这里的分类是相当标准的:

推理:解决问题的能力

知识:代表和理解世界的能力

计划:设定和实现目标的能力

沟通:理解语言和交流的能力

感知:将原始的感觉输入(如图像、声音等)转化为可用信息的能力。

盒子的模式将这些技术分成两组。狭窄的应用程序和一般应用程序。所使用的词语是故意的,但可能会有轻微的误导。在我解释的时候,请耐心听我说。对于任何在人工智能领域起步的人来说,知道弱/窄AI(ANI)、强/通用AI(AGI)和人工超级智能(ASI)之间的区别是最重要的。为了清晰起见,ASI只是一个最新的推测,AI是研究人员的最终目标和圣杯,而狭义的人工智能是我们今天真正拥有的。一组技术,它们无法处理超出其范围的任何东西(这是与AGI的主要区别)。

图中使用的两种类型的线(连续的和点状的)显式地指出,当你阅读其他介绍性的人工智能材料时,可以帮助你增加一些自信。然而,与此同时,这里的差异概述了只能解决特定任务的技术(通常比人类更好——狭窄的应用程序),以及其他能够在今天或将来解决多个任务并与世界交互的技术(优于许多人——一般应用程序)。

最后,让我们看看在图中有什么。在地图中,不同种类的人工智能技术被表示出来。注意,我故意不指定特定的算法,而是将它们聚集到宏观组中。我也没有向你提供一个价值评估,评估什么是有效的,什么是不可行的,而只是列出研究人员和数据科学家可以利用的东西。

那么你如何解读和解读地图呢?让我给你们举两个例子。如果你看自然语言处理,这就嵌入了一种算法,它结合了基于知识的方法、机器学习和概率方法来解决感知领域的问题。但与此同时,如果你看一下基于逻辑的范式和推理问题之间的空白空间,你可能会想为什么那里没有技术。地图所传达的并不是一个方法不能完全存在,它可以填满一个空间,而是当人们接近推理问题时,他们更喜欢使用机器学习。

以下是一份技术清单:

机器人过程自动化(RPA):通过观察用户执行某项任务来提取规则和动作列表的技术

专家系统:一个计算机程序,它有硬编码的规则来模拟人类的决策过程。模糊系统是基于规则的系统的一个特定的例子,它将变量映射到0到1之间的连续值,这与传统的数字逻辑相反,它导致了0/1的结果

计算机视觉(CV):获取和理解数字图像的方法(通常分为活动识别、图像识别和机器视觉)

自然语言处理(NLP):处理自然语言数据的子字段(三个主要块属于这个字段,即语言理解、语言生成和机器翻译)

神经网络(NNs或ANNs):一类算法是根据人类/动物大脑的神经元结构松散地建模的,它可以改善其表现,而不需要明确地指导如何去做。NNs的两个专业和著名的子类是深度学习(一个有多个层次的神经网络)和生成的敌对网络(GANs——两个相互训练的网络)

自治系统:位于机器人和智能系统之间的交叉领域(例如,智能感知,灵巧的物体操作,基于飞机的机器人控制,等等)。

分布式人工智能(DAI):一种解决问题的技术,将它们分配给相互作用的自主“代理”。多代理系统(MAS)、基于代理的建模(ABM)和群智能是这个子集的三个有用的规范,其中集体行为来自于分散的自组织代理的交互。

情感计算:一个处理情绪识别、解释和模拟的子领域

进化算法(EA):它是一个更广泛的计算机科学领域的一个子集,叫做进化计算,它使用由生物激发的机制(例如,突变,繁殖,等等)来寻找最优解。遗传算法是EAs中最常用的子群,它是根据自然选择过程选择“最适者”候选方案的搜索启发式。

归纳逻辑程序设计(ILP):子字段使用正式逻辑来表示事实数据库并从这些数据中形成假设

决策网络:是最著名的贝叶斯网络/推理的概括,它代表一组变量及其通过映射的概率关系(也称为定向无环图)

概率编程:一个框架,它不强迫您硬编码特定的变量,而是使用概率模型。贝叶斯程序合成(bp)在某种程度上是概率编程的一种形式,贝叶斯程序编写新的贝叶斯程序(而不是人类,就像在更广泛的概率编程方法中一样)

环境智能(AmI):一个框架,它要求物理设备进入数字环境,以感知、感知和响应外部刺激(通常由人类行为触发)。

为了解决一个特定的问题,您可能会采用一种或多种方法,而这又意味着一种或多种技术,因为其中许多技术并不是相互排斥的,并且是互补的。

教计算机如何在不需要显式编程的情况下学习是一项艰巨的任务,它涉及到处理多种细微差别的几种技术,尽管这张地图远非完美,但它至少是第一次尝试理解混乱的风景。

我知道这里出现了一个强大的帕累托原则。80%(如果不是更多)当前的努力和结果是由地图中所描绘的20%的技术所驱动的(即深度学习、NLP和计算机视觉),但我也确信拥有一个完整的频谱可能会帮助研究人员、创业公司和投资者。

我打开第一个版本的反馈,我计划把两个额外的步骤:一个是创建一个层的人工智能正面临挑战(例如,内存问题和灾难性的遗忘,转移学习,学习更少的数据与零和一次性学习,等等)和技术可用于解决特定的问题。其次,是应用透镜来观察不同的技术,而不是他们正在解决的问题,而是他们正在创造的问题(例如,伦理问题、数据密集型问题、黑箱和解释能力问题等等)。(新闻来源:腾讯网)