【新视野】阻碍人工智能进步的8个问题

今天的人工智能 (AI) 是有限的。它还有很长的路要走。


(相关资料图)

一些AI研究人员发现,计算机通过反复试验学习的机器学习算法已经成为一种“神秘力量”。

不同类型的人工智能

人工智能 (AI) 的最新进展正在改善我们生活的许多方面。

人工智能分为三种类型:

狭义人工智能 (ANI),具有狭窄的能力范围。

通用人工智能 (AGI),与人类能力相当。

人工超级智能 (ASI),比人类更有智能。

今天的人工智能有什么问题?

今天的人工智能主要由统计学习模型和算法驱动,称为数据分析、机器学习、人工神经网络或深度学习。它作为 IT 基础设施(ML平台、算法、数据、计算)和开发堆栈(从库到语言、IDE、工作流和可视化)的组合来实现。

总之,其涉及:

一些应用数学、概率论和统计学

一些统计学习算法,逻辑回归,线性回归,决策树和随机森林

一些机器学习算法,有监督、无监督和强化

一些人工神经网络、深度学习算法和模型,通过多层过滤输入数据以预测和分类信息

一些优化(压缩和量化)训练的神经网络模型

一些统计模式和推论,例如高通神经处理SDK,

一些编程语言,如 Python 和 R.

一些ML平台、框架和运行时,例如PyTorch、ONNX、Apache MXNet、TensorFlow、Caffe2、CNTK、SciKit-Learn 和 Keras,

一些集成开发环境(IDE),如PyCharm、Microsoft VS Code、Jupyter、MATLAB等,

一些物理服务器、虚拟机、容器、专用硬件(如 GPU)、基于云的计算资源(包括虚拟机、容器和无服务器计算)。

当今使用的大多数 AI 应用都可以归类为狭义 AI,称为弱 AI。

它们都缺少通用人工智能和机器学习,这由三个关键的交互引擎定义:

世界模型 [表示、学习和推理] 机,或现实模拟机(世界超图网络)。

世界知识引擎(全球知识图谱)

世界数据引擎(全球数据图网络)

通用AI和ML和DL应用/机器/系统的区别在于将世界理解为多个似是而非的世界状态表示,其现实机器和全球知识引擎以及世界数据引擎。

它是General/Real AI Stack 最重要的组成部分,与其真实世界的数据引擎交互,并提供智能功能/能力:

处理关于世界的信息

估计/计算/学习世界模型的状态

概括其数据元素、点、集合

指定其数据结构和类型

迁移其学习

将其内容语境化

形成/发现因果数据模式,如因果规律、规则和规律

推断所有可能的相互作用、原因、影响、循环、系统和网络中的因果关系

以不同的范围和规模以及不同的概括和规范水平预测/回顾世界的状态

有效地和高效地与世界互动,适应它,导航它并根据它的智能预测和处方操纵它的环境

事实上,它主要是依靠大数据计算、算法创新以及统计学习理论和联结主义哲学的统计归纳推理机。

对于大多数人来说,它只是构建一个简单的机器学习 (ML) 模型,经历数据收集、管理、探索、特征工程、模型训练、评估,最后部署。

EDA:探索性数据分析

AI Ops — 管理 AI 的端到端生命周期

今天的人工智能的能力来自“机器学习”,需要针对每个不同的现实世界场景配置和调整算法。这使得它非常需要人工操作,并且需要花费大量时间来监督其开发。这种手动过程也容易出错、效率低下且难以管理。更不用说缺乏能够配置和调整不同类型算法的专业知识。

配置、调整和模型选择越来越自动化,谷歌、微软、亚马逊、IBM 等所有大型科技公司都推出了类似的AutoML平台,使机器学习模型构建过程自动化。

AutoML涉及自动化构建基于机器学习算法的预测模型所需的任务。这些任务包括数据清理和预处理、特征工程、特征选择、模型选择和超参数调整,手动执行这些任务可能很乏味。

SAS4485-2020.pdf

所呈现的端到端 ML 管道由 3 个关键阶段组成,同时缺少所有数据的来源,即世界本身:

自动化机器学习——概述

Big-Tech AI 的关键秘密是作为暗深度神经网络的 Skin-Deep Machine Learning,它的模型需要通过大量标记数据和包含尽可能多的层的神经网络架构进行训练。

每个任务都需要其特殊的网络架构:

用于回归和分类的人工神经网络 (ANN)用于计算机视觉的卷积神经网络 (CNN)用于时间序列分析的递归神经网络 (RNN)用于特征提取的自组织映射用于推荐系统的深度玻尔兹曼机推荐系统的自动编码器

ANN作为一种信息处理范式被引入,似乎是受到生物神经系统/大脑处理信息的方式的启发。而这样的人工神经网络被表示为“通用函数逼近器”,它可以学习/计算各种激活函数。

神经网络在测试阶段通过特定的反向传播和纠错机制进行计算/学习。

试想一下,通过最小化错误,这些多层系统有望有一天自己学习和概念化想法。

人工神经网络 (ANN) 简介

总而言之,几行R或Python代码就足以实现机器智能,并且有大量在线资源和教程可以训练准神经网络,例如各种深度伪造网络,操纵图像-视频-音频-文本,对世界的了解为零,如生成对抗网络、BigGAN、CycleGAN、StyleGAN、GauGAN、Artbreeder、DeOldify等。

他们创造和修改面孔、风景、通用图像等,对它的全部内容了解为零。

使用循环一致的对抗网络进行不成对的图像到图像的转换,使2019年成为新人工智能时代的 14 种深度学习和机器学习用途。

有无数的数字工具和框架以它们自己的方式运行:

开放语言——Python是最受欢迎的,R和 Scala也在其中。

开放框架——Scikit-learn、XGBoost、TensorFlow等。

方法和技术——从回归到最先进的GAN和RL的经典ML技术

提高生产力的能力——可视化建模、AutoAI 以帮助进行特征工程、算法选择和超参数优化

开发工具——DataRobot、H2O、Watson Studio、Azure ML Studio、Sagemaker、Anaconda 等。

令人遗憾的是,数据科学家的工作环境:scikit-learn、R、SparkML、Jupyter、R、Python、XGboost、Hadoop、Spark、TensorFlow、Keras、PyTorch、Docker、Plumbr 等等,不胜枚举。

现代 AI 堆栈和 AI 即服务消费模型

构建 AI 堆栈

冒充人工智能的,其实是虚假冒牌的人工智能。在最好的情况下,它是一种自动学习技术,ML/DL/NN 模式识别器,本质上是数学和统计性质的,无法凭直觉行事或对其环境建模,具有零智能、零学习和 零理解。

阻碍人工智能进步的问题

尽管有许多优点,人工智能并不完美。以下是阻碍人工智能进步的 8 个问题以及根本错误所在:

1. 缺乏数据

人工智能需要大量数据集进行训练,这些数据集应该具有包容性/公正性,并且质量良好。有时他们必须等待生成新数据。

2. 耗时

人工智能需要足够的时间让算法学习和发展到足以以相当高的准确性和相关性实现其目的。它还需要大量资源才能发挥作用。这可能意味着对您的计算机能力有额外的要求。

3.结果解释不力

另一个主要挑战是准确解释算法生成的结果的能力,还必须根据自己的目的仔细选择算法。

4. 高度易错

人工智能是自治的,但极易出错。假设使用足够小的数据集训练算法,使其不具有包容性。最终会得到来自有偏见的训练集的有偏见的预测。在机器学习的情况下,这样的失误会引发一系列错误,这些错误可能会在很长一段时间内未被发现。当他们确实被注意到时,需要相当长的时间来识别问题的根源,甚至更长时间来纠正它。

5. 伦理问题

相信数据和算法胜过我们自己的判断的想法有其优点和缺点。显然,我们从这些算法中受益,否则,我们一开始就不会使用它们。这些算法使我们能够通过使用可用数据做出明智的判断来自动化流程。然而,有时这意味着用算法取代某人的工作,这会带来伦理后果。此外,如果出现问题,我们应该责怪谁?

6. 缺乏技术资源

人工智能还是比较新的技术。从启动代码到流程的维护和监控,都需要机器学习专家来维护流程。人工智能和机器学习行业对市场来说仍然比较新鲜。以人力形式寻找足够的资源也很困难。因此,缺乏可用于开发和管理机器学习科学物质的有才华的代表。数据研究人员通常需要混合空间洞察力,以及从头到尾的数学、技术和科学知识。

7.基础设施不足

人工智能需要大量的数据处理能力。继承框架无法处理压力下的责任和约束。应该检查基础架构是否可以处理人工智能中的问题.、如果不能,应该使用良好的硬件和适应性强的存储来完全升级。

8.缓慢的结果和偏见

人工智能非常耗时。由于数据和要求过载,提供结果的时间比预期的要长。关注数据库中的特定特征以概括结果在机器学习模型中很常见,这会导致偏差。

结论

人工智能已经接管了我们生活的许多方面。虽然不完美,但人工智能是一个不断发展的领域,需求量很大。在没有人为干预的情况下,它使用已经存在和处理过的数据提供实时结果。它通常通过开发数据驱动模型来帮助分析和评估大量数据。虽然人工智能有很多问题,这是一个不断发展的领域。从医学诊断、疫苗研发到先进的交易算法,人工智能已成为科学进步的关键。

关键词: