监督学习对于自动化的未来至关重要

机器人将继续变得更加聪明，但它们依然需要向人类专家学习。

自动化的主要目标是解放人们的精力，提高工作效率。这意味着可以使用机器人系统来代替人执行枯燥或重复的任务。这使得人们可以通过专注于需要更多思考、创造力和解决问题的任务来完成更多任务——这些任务最终会产生更多价值。

当机器人系统能够以一定程度的自主性完成任务时，例如，从随机放置的零件箱中挑选零件而不是需要整齐的零件堆，人们就会获得更多的解放。然而，机器人仍然不能把所有事情做好。例如，让机器人看到环境并与其交互的最佳视觉算法仍然不是 100% 准确。

这些用于重现任务的算法，无论是检测物体还是学习握住金属部件，都是通过一遍又一遍地重复相同的动作来学习。他们采取的行动越多，他们就会做得越好。但是，这只在任务从未改变、部件不变或部件以相同位置和方向呈现时才有效。当任务的任何一个方面发生变化时，算法可能无法应对环境的变化。

为了提高这种性能并处理这些新情况，许多算法采用了一种称为监督学习的策略。由于许多机器人部署在过去执行机器人任务的人员仍在附近的环境中，因此监督学习背后的想法是，如果机器人遇到由于环境中的某些条件而不知道如何执行的情况它以前从未见过——它从未见过的零件、两个零件粘在一起、机器卡住等等——人可以提供机器人所需的缺失信息。该信息可能以新标签的形式出现（是的，这仍然是一瓶肥皂，即使它是颠倒的）或新的演示（您需要在此处获取这个新部件）。用户演示并提供附加信息，然后机器人重新开始工作。

人向机器人提供的这种类型的纠正帮助在人们相互传递技能的过程中也很常见。在许多不同的行业中，这种类型的指导已经存在了数千年，并且仍然是新工人接受教育的常见方式（与课堂环境相对，或除了课堂环境之外）。甚至有些公司正在使用人工智能来更好地捕捉这种指导。

想象一下，一名以前将所有时间都花在一台机器上工作的工人，现在管理着一组机器人，偶尔通过提供自己的专业知识的额外信息来调整每个机器人的性能。他们的权力更大，因为他们的生产力更高，他们可以从自己执行不需要的任务中解放出来，并且他们仍然利用他们丰富的知识通过指导不断改进机器人系统。

设计一个可以由工人通过监督学习有效训练的机器人系统的一个关键要素是确保工人用来提供额外信息的界面易于使用。如果执行监督学习的人是机器操作员（这很常见）而不是机器人工程师（这非常罕见），则尤其如此。

如果我们想利用人们熟悉（并且擅长）指导的事实并将其应用于改进自动化系统，那么用于向机器人提供信息的界面需要类似于他们训练其他人的方式。例如，工人常常会通过演示动作来教授一项技能。

您需要像这样握住工具，然后按此处。随着“协作机器人”的出现，人们现在可以通过移动机器人的手臂来直接演示动作。此外，我们开始看到视觉系统可以观察人的动作，例如用喷漆器绘画，并使用该演示来定义机器人的动作。这很有效，因为它与人们互相演示动作的方式非常相似。以这种方式教授机器人是很自然的，即使是那些没有丰富机器人技术经验的人也能训练机器人。这是更快速地采用自动化的关键。

从学习的角度来看，工作人员可能需要（至少一次）展示任务是如何完成的，以便机器人可以从中学习。工作人员定义一组完成任务的步骤，并以某种逻辑流程表示这些步骤。工人通常使用流程图来教导或与其他工人交流流程如何逐步进行。现在有无 **软件提供相同的流程图界面来对机器人进行编程。这意味着工作人员无需学习编码，而是可以根据他们已经熟悉的内容来学习对话界面，而花费的精力要少得多。

无**软件显着降低了学习曲线，也让机器人的学习变得更加容易。机器人技术的教育障碍非常高，其中很大一部分源于学习用机器人的本地编程语言进行编程所需的时间。

相反，当快速学习编程时，那些宝贵的技能提升时间可以用于更多地了解机器人完成任务的最佳方式。

机器人如何最好地夹持零件？机器人如何应对变化？机器人在什么情况下最有可能失败？工作人员越深入机器人的“大脑”，就越能帮助引导机器人取得成功。

机器人学习能力的一个关键部分是何时可以在新情况下使用这些知识。

现在，当我们谈论机器人的学习能力时，我们实际上是在谈论软件或算法的学习能力。这意味着，要使这种类型的学习真正有用，一旦学习了一项技能，无论什么机器人（或硬件）正在执行任务，它都应该有效。这是一个简单的想法，但在实践中很少这样运作。

例如，假设一种算法学会了使用带有真空夹具的小型工业机器人从垃圾箱中拾取钢瓶。它知道零件的外观，以及真空吸盘的放置位置，以便牢固地固定零件。现在，用户想要使用带有两指夹具的更大机器人。

该算法仍然知道如何操纵气缸，但它需要有关这个更大的手臂的新信息，以及如何放置两指夹具以获得最佳抓握效果。这种学习技能基础知识的过程（与特定硬件无关）称为抽象，人们一直在这样做。给熟练的木匠五把不同的锤子，他们仍然能够击中钉子，因为他们知道这项任务超出了工具的限制。

现在想象一下一个负责多个此类机器人的机器操作员。他们必须提供这些附加信息，以允许机器人在这些新情况下抓取零件。然而，该操作员必须处理许多此类机器和情况，可能需要处理来自不同品牌的机器人。

该用户必须拥有一致的界面来提供这些额外信息，这意味着机器人必须运行相同的覆盖软件。这种通用软件层也有利于算法，因为该算法现在是机器人的标准化接口，并且是机器人的表示形式，与其尺寸和配置无关。毕竟，机器人仍然可以移动和抓取，只是它更大并且有一只不同的手。

最近的技术进步使得诸如所描述的学习算法可以在任何品牌的机器人上工作，因为它们运行在通用的底层软件平台上。想想 pc 上的 windows——一种算法可以在许多不同的计算机上运行，并且所有底层软件都可以正常工作。在这种情况下，这个通用平台使每个机器人在算法眼中看起来都是一样的，从而使机器人之间的技能转换变得更加容易。

能够自己解决问题的机器人仍然有很多东西需要向我们学习，而监督学习是传授这些知识的一种方式。然而，为了真正实现监督学习，系统需要可供提供额外知识的人使用。用户界面需要类似于人们互相教学的方式，并且易于使用，以便向机器人展示诀窍就像向另一个人展示一样自然。

此外，机器人硬件的通用软件平台可以使监督学习更快地抽象到新的情况，因为机器人和工具对于算法来说是相同的，即使它们可能具有不同的尺寸和配置。

将所有这些放在一起，通过正确的监督学习架构（对话式、直观的机器人编程界面、跨机器人模型和品牌的通用界面以及针对监督学习输入和教学进行优化的软件），机器人不仅变得更加高效，而且能够处理原本非常难以编程的任务，并且使用机器人的机器操作员得到充分利用，从而实现了以前不可能达到的生产力水平。

监督学习对于自动化的未来至关重要

半监督学习在大规模数据集上的效率优势

逆境中的学习，如何将失败转化为动力

数据驱动的随机优化在机器学习和强化学习中的应用

监督学习对于自动化的未来至关重要

半监督学习在大规模数据集上的效率优势

逆境中的学习，如何将失败转化为动力

数据驱动的随机优化在机器学习和强化学习中的应用

相關推薦