您现在的位置是:主页 > 深度智能 >
深度机器学习的未来
2021-01-05 14:45:22深度智能 44236人已围观
我之所以分享这些预测,并不是因为我希望它们将来能被证明是完全正确的,而是因为它们在当前很有趣并且可以付诸实践。
从高层次看,我看到希望的主要方向是:
- 比通用计算机程序更接近的模型,是建立在比我们当前的可区分层更丰富的基元之上的,这就是我们将如何推理和抽象的方法,这是当前模型的根本缺陷。
- 使上述一切成为可能的新型学习形式-允许模型摆脱可区分的变换。
- 不需要人工参与的模型-不断调整旋钮不是您的工作。
- 更好地,系统地重用以前学习的功能和体系结构;基于可重用和模块化程序子例程的元学习系统。
此外,请注意,这些注意事项并非到目前为止一直是深度学习的基础的那种监督学习,而是适用于任何形式的机器学习,包括无监督,自我监督和强化学习。标记的来源或训练循环的样子从根本上来说并不重要;机器学习的这些不同分支只是同一构造的不同方面。

实现这一目标的途径可能是什么?考虑一种著名的网络:RNN。重要的是,与前馈网络相比,RNN的限制略少。这是因为RNN不仅仅是几何变换:它们是在for循环内重复应用的几何变换。暂时的for循环本身是由人类开发人员硬编码的:它是网络的内置假设。自然,RNN的表示能力仍然受到极大限制,主要是因为它们执行的每个步骤仍然只是可微的几何变换,并且它们从一步到一步传递信息的方式是通过连续几何空间中的点(状态向量)进行的。现在,想象一下以类似的方式通过编程原语(例如for循环)来“增强”神经网络,但不仅仅是for具有硬编码几何内存的单个硬编码循环,而是模型所包含的大量编程原语可以随意操作以扩展其处理功能,例如if分支,while语句,变量创建,用于长期内存的磁盘存储,排序运算符,高级数据结构(如列表,图形和哈希表)等等。这样的网络可以代表的程序空间将比当前深度学习模型所能代表的程序要广阔得多,并且其中一些程序可以实现更高的泛化能力。
一言以蔽之,我们将摆脱拥有“硬编码算法智能”(手工软件)和“学习几何智能”(深度学习)的格局。相反,我们将混合使用提供推理和抽象功能的正式算法模块和提供非正式直觉和模式识别功能的几何模块。整个系统将在几乎没有人参与的情况下学习。
我认为AI的一个相关子领域可能会大有作为,它是程序综合领域,尤其是神经程序综合领域。程序合成包括通过使用搜索算法(可能是遗传搜索,如遗传编程)自动生成简单的程序,以探索大量可能的程序。当找到符合所需规范的程序时,搜索将停止,该程序通常以一组输入输出对的形式提供。正如您所看到的,它是否使人联想到机器学习:给定输入和输出对提供的“训练数据”,我们找到了一个将输入与输出匹配并可以归纳为新输入的“程序”。所不同的是,与其在硬编码程序(神经网络)中学习参数值,不如说是, 通过离散搜索过程。
我绝对希望深度机器学习这个子领域在接下来的几年中看到新的兴趣浪潮。特别是,我希望在深度学习和程序合成之间出现一个交叉子域,在该子域中,我们不会以通用语言生成程序,而会在其中生成神经网络(几何数据处理)。流)增加了一组丰富的算法的图元,如for循环等等。与直接生成源代码相比,这应该更容易处理和有用,并且它将大大扩展机器学习可以解决的问题的范围-在给定适当的训练数据的情况下,我们可以自动生成的程序空间。象征性AI和几何AI的融合。当代的RNN可以看作是这种混合算法-几何模型的史前祖先。
相关文章
随机图文
区块链未死!2019区块链+农业或将浴火重生
内容加密法律领域法律文件分析
I. 引言 在当今信息爆炸的时代,大数据和人工智能技术的发展已经深刻地改变了我们的生活和工作方式。其中,大语言模型作为一种重要的自然语言处理技术,已经在多个领域得到了广泛的应用。本文将介绍大语言模型的基本原理和技术,并探讨其在法律领域法律文件分析中的应用。 II. 大语言模型的基本原理 大语言模型是一种基于神经网络的自然语言处理技术,其主要目的是通过学习大量的语料库,来预测下一个单词或者一段研报频道: 金麒麟分析师 天风快递策略:挖三四线潜能
唱吧上市搁浅,原因为何? 其一,全民K歌抢了唱吧“风头”。众所周知,全民K歌背靠腾讯,可谓是含着“金钥匙”出生。全民K歌不仅拥有微信与QQ两大流量入口,还与QQ音乐共享丰富的音乐版权,在流量与音乐版权方面都有着天然的优势,是唱吧最强劲的对手。据了解,全民K歌自2014年上线起,其活跃人数一直高增猛涨,在2016年成功超越唱吧,并逐渐拉开差距。据易观数据,2018年第三季度,唱吧活还剩8条命?小猫洗衣机里被“洗”20分钟幸存(图)
内容加密