扛鼎之作!Twitter 图机器学习大牛发表160页论文:以几何学视角统一深度学习-安定传媒
轻识Logo
人工智能与算法学习

共 4904字,需浏览 10分钟

 ·

2021-05-04 23:08


来源 | AI科技评论
编译 | Mr Bear、青暮

导语近日,帝国理工学院教授、Twitter 首席科学家 Michael Bronstein 发表了一篇长达160页的论文(或者说书籍),试图从对称性和不变性的视角从几何上统一CNNs、GNNs、LSTMs、Transformers等典型架构,构建深度学习的“爱尔兰根纲领”!本文是Michael Bronstein对论文的精华介绍。

「几何深度学习」试图从对称性和不变性的视角从几何上统一多种机器学习问题。这些原理不仅为卷积神经网络的性能突破和最近大热的图神经网络奠定了基础,也提供了一种原理性的方法来构建针对具体问题的新型归纳偏置。 

相关论文:https://arxiv.org/pdf/2104.13478.pdf

1872 年 10 月,位于德国巴伐利亚城的埃尔兰根大学任命了一位年轻的教授。按照惯例,这位教授需要提出一项初始研究项目,而他提出的项目名称似乎有些乏味——「近期几何学研究的比较综述」。这位教授就是年仅 23 岁的 Felix Klein,他的这项初始工作就是数学史上鼎鼎大名的「爱尔兰根纲领」。

图注:Felix 和他的爱尔兰根纲领

 19 世纪,几何学蓬勃发展,该领域的学者硕果累累。在欧氏几何提出近两千年后,彭色列首次构建了射影几何,高斯、波尔约、罗巴切夫斯基提出了双曲几何,黎曼提出了椭圆几何,这说明我们可以建立一个由各种几何学组成的完整体系。然而,这些方向迅速分化为各个独立的研究领域。于是,那个时期的许多数学家纷纷思考,不同的几何学分支相互之间有何关系,究竟应该如何「定义」几何?

Klein 突破性地提出将几何定义为对不变性的研究,即研究在某类变换下保持不变的结构(对称性)。Klein 通过群论形式化定义了这种变换,并且使用群及其子群的层次对由它们产生的不同几何进行分类。因此,刚性运动群产生了传统的欧氏几何,而仿射或射影变换分别产生了仿射几何和射影几何。值得一提的是,爱尔兰根纲领仅仅局限于齐次空间,最初并不适用于黎曼几何。

图 2:Klein 的爱尔兰根纲领将几何学定义为研究在某类变换下保持不变的性质。我们通过保持面积、距离、角度、平行结构不变的刚性变换(建模为等距群)定义 2 维欧氏几何。仿射变换将保持平行结构,但并不能保证距离或面积不变。射影变换的不变性最弱,只保持交点和交比不变,对应于以上三种变换中最大的群。因此,Klein 认为射影几何是最为通用的。

爱尔兰根纲领对几何学和数学的影响是极为深远的,其影响也延伸到了其它领域(尤其是物理学),对对称性的思考使我们可以从第一性原理出发导出守恒定律(例如,举世闻名的「诺特定理」)。数十年后,人们通过规范不变性的概念(于 1954 年由杨振宁和米尔斯提出的广义形式)证明这一基本原理成功地统一了除引力之外的所有自然基本力。这就是所谓的标准模型,它描述了我们目前所知道的所有物理知识。

正如诺贝尔奖获得者、物理学家 Philip Anderson 所言:

“it is only slightly overstating the case to say that physics is the study of symmetry.’’

稍显夸张地说,物理学就是对对称性的研究。

我们认为,当下的深度(表征)学习研究领域的情况与 19 世纪的几何学研究是相似的:一方面,深度学习在过去十年间为数据科学领域带来了一场革命,它使许多之前被认为无法实现的任务成为了可能——无论是计算机视觉、语音识别、自然语言翻译或围棋游戏中都是如此。另一方面,我们现在拥有了各种适用于不同数据的神经网络架构,但是却很少发展出统一的原理。因此,我们很难理解不同方法之间的关系,这不可避免地使我们对相同的概念进行重复开发。

图注:现代的深度学习——有各种各样的架构,但是缺乏统一的原理。

与 Klein 的爱尔兰根纲领相类似,Michael Bronstein 等人在论文「Geometric deep learning: going beyond Euclidean data」(https://arxiv.org/abs/1611.08097)中引入了「几何深度学习」的概念,作为近期从几何学的角度将机器学习统一起来的尝试的总称。这样做有两个目的:首先,它提出了一个通用的数学框架,从而推导出当下最成功的神经网络架构;其次,它给出了一种有建设性的过程,以一种有条理的方法构建未来的框架。

在最简单的情况下,有监督机器学习本质上是一个函数估计问题:在训练集(例如,带有标签的狗和猫的图片)上给定某些未知函数的输出,试图从某些假设函数类别中找到一个函数 f,该函数可以很好地拟合训练数据,使模型可以预测出先前未见过的输入对应的输出。在过去的十年间,以 ImageNet 为代表的大型、高质量数据集和不增长的计算资源(GPU)使我们可以设计各种可以被用于此类大型数据集的函数。
神经网路似乎可以很好地表征函数,即使是感知机这种自建单的架构也可以在仅仅使用两层网络的情况下生成各类函数,它可以使我们以理想的准确率近似任意连续函数——该性质被称为「通用近似」(又称万能近似定理)。

图注:多层感知机是一种只包含一个隐层的通用近似器。他们可以表征阶跃函数的组合,从而以任意的精度近似任意的连续函数。

在低维空间中,该问题是近似理论中的一类已经被广泛研究的经典问题,从数学上对估计误差由精确的控制。但是在高维空间中,情况就完全不同了:显然,即使为了近似一类简单的函数(例如,李普希兹连续函数),样本数会随着维度呈指数增长,该现象被称为「维数诅咒」。由于现代机器学习方法需要处理具有数千甚至数百万个维度的数据,维数诅咒往往是存在的,使我们无法通过朴素的方式进行学习。

图注:维数诅咒示意图。对于一个由处于 d 维单位超立方体的象限中的高斯核组成的连续函数(蓝色),如果我们希望以 ε 的误差近似一个李普希兹连续的函数,则需要 𝒪(1/εᵈ) 的样本(红色点)。

在计算机视觉问题(例如,图像分类)中,这种现象尤为突出。即使是很小的图像也往往具有非常高的维度,但是直观地看,当我们将一张图像解析为一个输入给感知机的向量时,许多图像的结构被破坏并丢弃了。即使我们将图像仅仅平移一个像素,向量化的输入也会有很大的区别。为了使平移后的输入能够被分到同一类中,我们需要向神经网络输入大量的训练样本。
幸运的是,在许多高维机器学习问题中,我们可以使用来自于输入信号的几何学上的额外结构信息。我们将这种结构称为「对称先验」,这种通用的强大原理有助于我们应对维数诅咒问题。在图像分类的例子中,输入图像 x 不仅仅是一个 d 维向量,也是一个在某个域 Ω 上定义的信号,在本例中这个域是一个二维网格。我们通过一个对称群 𝔊(本例中为一个二维变换组成的群)捕获域的结构信息,该群在域中的点上进行操作。在信号 𝒳(Ω) 的空间中,底层域上的群操作(群的元素,𝔤∈𝔊)通过群表征 ρ(𝔤) 体现。在本例中,上述操作为简单的平移操作,即一个在 d 维向量上运算的 d×d 矩阵。
图注:几何先验示意图——我们在域(网格 Ω)上定义输入信号(图像 x∈𝒳(Ω)),其中的对称群(变换群 𝔊)通过群表征ρ(𝔤) 在信号空间中进行平移操作。对函数(例如,图像分类器)如何与群进行交互的假设限制了假设类别。
输入信号底层的域的几何结构为我们试图学习的函数 f 的类别施加了架构信息。对于任意的 𝔤∈𝔊 和 x,我们可以找出不会被群的操作所影响的不变性函数,即  f(ρ(𝔤)x)=f(x)。另一方面,有时函数具有相同的输入输出结构,并且输出以与输入相同的方式进行变换,这种函数被称为同变性函数,它满足  f(ρ(𝔤)x)=ρ(𝔤)f(x)。
在计算机视觉领域中,图像分类是一种典型的人们希望得到不变性函数的任务(例如,无论猫位于图像的什么位置,我们都希望将该图分类为猫);而图像分割任务的输出是一个像素级别的标签掩模,这是一种同变性函数(分割掩模需要遵循输入图像的变化)。
「尺度分离」是另一种强大的几何先验。在某些情况下,我们可以通过「同化」附近的点来构建域的多尺度层次结构(如图7 所示的 Ω and Ω’),并且生成一个由粗粒度算子 P 关联的信号空间的层次。在粗尺度上,我们可以应用粗尺度的函数。如果一个函数 f 可以被近似为粗粒度算子 P 和粗尺度函数的组合  f≈f’∘P,则  f 是局部稳定的。尽管 f 可能取决于长距离依赖,如果 f 是局部稳定的,它们可以被分解为局部交互,然后向着粗尺度传播。
图注:尺度分离的示意图,其中我们可以将细尺度函数 f 近似为粗尺度函数 f' 和粗粒度算子 P 的组合 f≈f′∘P
这两个原理为我们提供了一个非常通用的几何深度学习设计范式,可以在大多数用于表示学习的流行深度神经架构中得以体现:一个典型的设计由一系列同变层(例如,CNN 中的卷积层)组成,然后可以通过不变的全局池化层将所有内容聚合到一个输出中。在某些情况下,也可以通过采用局部池化形式的粗化过程(coarsening procedure)来创建域的层次结构

图注:展示了一种非常通用的设计,可以应用于不同类型的几何结构(例如,网格,具有全局变换群的齐次空间,图(集合也是其中一种特例)和流形,这些结构具有全局等距不变性和局部规范对称性。基于上述原理,我们实现了目前深度学习领域中的一些最流行的架构:由平移对称导出的卷积网络(CNN),由置换不变性导出的图神经网络、DeepSets 和 Transformer,由时间扭曲不变性导出的门控 RNN(例如 LSTM 网络),以及由规范对称性导出的计算机图形和视觉中使用的 Intrinsic Mesh CNN。

这是一种非常通用的设计,可以应用于不同类型的几何结构,例如网格,具有全局变换群的齐次空间,图形(以及特定情况下的集合)和流形,这些结构具有全局等距不变性和局部规范的对称性。这些原理的实现带来了目前深度学习中的一些最流行的架构:由平移对称导出的卷积网络(CNN),由置换不变性导出的图神经网络、DeepSets和Transformers,由时间扭曲不变性导出的门控RNN(例如LSTM网络),以及由规范对称性导出的计算机图形和视觉中使用的Intrinsic Mesh CNN。
图注:几何深度学习的“ 5G”图景:网格,群(具有全局对称性的均匀空间),图(以及作为特定情况的集合)和流形,其中几何先验通过全局等距不变性(可以使用测地线表示) 和局部规范对称性显现。

最后还要重点强调的是,对称性在历史上是众多科学领域中的一个关键概念。在机器学习研究社区中,对称性的重要性早已得到普遍认可,特别是在模式识别和计算机视觉的应用中,关于等变特征检测(Equivariant Feature Detection)的研究最早可以追溯到shun'ichi Amari 和Reiner Lenz 等人的工作。在神经网络的研究历史中,Marvin Minsky 和 Seymour Papert 提出的感知器群不变性定理(The Group Invariance Theorem)对(单层)感知器学习不变性的能力提出了基本限制。这是研究多层架构的主要动机之一,并最终催生了深度学习。

相关链接:

https://towardsdatascience.com/geometric-foundations-of-deep-learning-94cdd45b451d

https://arxiv.org/pdf/2104.13478.pdf


浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

图片
表情
点赞
评论
收藏
分享

手机扫一扫分享

相关内容推荐

苏州有哪些科技期刊期刊名称带电子刊体育核心期刊题目怎么写文学研究期刊投稿邮箱文科论文投那些国际期刊山东化工期刊检索网站建筑实践期刊在哪买体育老师期刊官网轧机振动预测相关期刊投稿本科生发表论文期刊环境类专业杂志期刊投稿高校学术期刊功能分类龙源期刊假刊名单天津职业学院核心期刊北大核心期刊高校认吗建筑杂志期刊版面费肾病领域期刊有哪些专业期刊编辑剽窃作者论文内容中国市场的期刊排名福建省级期刊目录核心期刊审稿周期包括什么走期刊官网可靠吗可以发表教学论文的期刊几大医学类期刊排名报纸和期刊哪个容易发仪器科学有哪些顶级期刊太谷公司期刊印刷制作工程与工业技术期刊龙源期刊属于sci嘛控制工程期刊投稿难度深圳汽车维修期刊官网陕西诚信期刊要求高吗安徽省专科院校期刊数理天地是电子期刊吗青年文学家期刊邮箱春为主题的期刊内容现代防御技术期刊投稿经验德国研究学术期刊同济桥梁建筑与隧道工程期刊外国教育研究期刊简介武汉有名的期刊有哪些故事会期刊开创时间电子类期刊发表高职保定学院期刊官网电话农业期刊杂志官网广东期刊要求多少钱桃花岭小学期刊投稿英文的期刊类型有哪些湖北音乐文学期刊细胞工程北大核心期刊北宋神宗时期刊行了期刊论文定稿费期刊退休期望有所创新关于复合材料的期刊类似财经的期刊还有哪些四川诚信期刊要求投中文还是英文期刊容易计算机专业热门期刊国外文献核心期刊排名计算机科学 期刊 ccf现代经济期刊出版地址计算机科学 期刊 投稿生殖方面的核心期刊排名不能用的期刊名字期刊名怎么看的中小学美育方面期刊神经网络有哪些期刊论文期刊投稿邮件怎么写氯碱工业期刊定制官网影视类论文期刊哪个好投稿期刊选开源还是订阅军工文化杂志属于什么期刊只有ei算不算核心期刊现代食品刊期刊创刊年份美国最早的期刊叫什么核心期刊是大几的宁夏期刊论文格式保定学院期刊官网查询早期刊物采访谢霆锋张柏芝春秋文物期刊是什么级别化学基础研究英文期刊大学生期刊论文远望智库是什么期刊交通类核心中文期刊材料光学有哪些期刊啊陕西教育高校期刊价钱表英文期刊有哪些化学类型甘肃特有的期刊目录文科国际核心期刊有哪些合肥市期刊招聘信息唐钢科技期刊级别中国国家政治期刊投稿旅游方向的英文期刊广西城建期刊投稿邮箱农家科技是电子期刊吗推荐几何教学的论文期刊食品类的综述期刊阅读科学期刊的目的郑州大学期刊分级只有ei算不算核心期刊地形测绘期刊排名榜网络与数据安全技术期刊科技信息不良期刊投稿关于学术期刊的繁荣哪些期刊偏向计量分析期刊创刊号2020年体育画报期刊怎么买便宜外文期刊送审流程图艺术理论与创作研究期刊国家级别的教育期刊如何用学习通查期刊期刊板块命名古风图片生物基因研究与开发期刊是课程发展的核心期刊管理杂志核心期刊目录民国时期刊物整理定州中山文学期刊考研应该看的外刊期刊预水解液纯化的期刊植物学报属于几类期刊论文怎么分辨国家期刊级别外国期刊主编周末上班吗陕西高考高职招生杂志期刊兰州大学ABCD类期刊民航期刊排名系统陕西科技期刊张薇化学建材是什么期刊河北画报期刊是什么类别CNS各期刊文章特点论著是期刊还是著作啊考古界权威的杂志期刊外文期刊论文代号格式宁夏诚信期刊信息推荐系统考研英语看期刊还是教材论文中介期刊网址正高级期刊有什么要求环境与健康期刊格式要求天津化工期刊等级划分江西教育2019期刊号什么是期刊图书诚信经营农业方面的期刊投稿要求如何进入科技核心期刊文献期刊期数怎么学写那个英文纺织期刊收综述ec是哪个期刊的简称读写算201204期刊考试与作文期刊封面格式纸质期刊引用格式怎么写知网能否订阅杂志期刊中国编辑期刊投稿经验分享博士论文发表期刊级别中国养兔是省级期刊提高期刊的影响力工业制造技术期刊有哪些教育博士发表中文核心期刊广东学校教育研究期刊智慧电力期刊外审要求好看的故事期刊杂志期刊文献前沿的信息类型建筑建材装饰期刊如何中国期刊引证数据库党校期刊投稿要求多少字医学期刊法语论文泰安核心期刊查重吗有哪些美国哲学期刊江苏省高校精品期刊芒种期刊学生可以投哦解释北大核心期刊的意义怎样看是不是核心期刊桥梁建设期刊查询审稿进度期刊杂志架尺寸英文期刊有哪些化学类型大数据传播核心期刊中国比较好的期刊大学系列期刊目录江苏文博期刊投稿邮箱科技人才期刊网关于生态文明的核心期刊广东耕地保护期刊国际期刊杂志封面尺寸征集期刊名称怎么写渠敬东办新期刊文科国际核心期刊有哪些英语广场算不算核心期刊决策参考信息是什么期刊冶金材料普通期刊有哪些电力研究期刊公开课工程装备与智能控制期刊2008年财会北核期刊重庆建筑期刊什么级别的江西省内出职称期刊灌溉排水学报的期刊排名写作教学期刊论文期刊报纸采购注意事项哲学方面最好的期刊是期刊论文贴代码截图初中物理老师投稿期刊推荐电气工程中文卓越期刊语文报发表是期刊机电类核心期刊2019

合作伙伴

安定传媒

www.3phw.com
niu.seo5951.com
www.gzlyapi.com
www.mtcddc.cn
www.snlanyards.com
www.jsfengchao.com
dw.urkeji.com
www.mtcddc.cn
www.haowangjiao.cc
seo.chaoshanxing.com
seo.07yue.com
www.urkeji.com
www.desai360.com
www.urkeji.com
zz.urkeji.com
seo.chaoshanxing.com
kuai.urkeji.com
seo.xtcwl.com
www.imcrd.com
www.kmpower.cn