当前位置:首页 > 每日看点

为什么神经网络可以解偏微分方程,是什么原理?

卡卷网1年前 (2024-11-20)每日看点306

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过这个算法,因为期权领域的Black-Scholes Model也是一个偏微分方程。在想这周写个什么内容时,突然想到这篇文章,当然我不是物理学专业,其实只需要知道怎么用即可,闲话不多说,下面介绍这篇文章吧。

文章地址:Fourier Neural Operator for Parametric Partial Differential Equations

源码地址:github.com/neuraloperat

作者博客:zongyi-li.github.io/blo

youtube讲解:youtube.com/watch?

一作是来自加州理工的Zongyi Li博士,获得过英伟达 2023-2024 研究生奖学金,其导师是Anima Anandkumar,本文的通讯作者,同时也是英伟达的机器学习总监。

为什么神经网络可以解偏微分方程,是什么原理?  第1张

为什么神经网络可以解偏微分方程,是什么原理?  第2张

图1 zero-shot超分辨率评测:Navier-Stokes 方程,粘度 ν = 1e−4; 上面是groud-truth,下面是预测值; 在 64 × 64 × 20 数据集上训练; 在 256 × 256 × 80 上评估

直接上效果,zero-shot超分辨率预测,准确率非常高,说明其FNO无惧分辨率变化-resolution-invariant,它实现了 Burgers 方程的错误率降低 30%,达西流Darcy Flow 降低 60%,Navier Stokes 降低 30%。同时FNO 深度神经网络拥有极快的运行速度。例如,在一个需要进行 30000 次仿真(包括 Navier-Stokes 方程)的求解过程中,对于每个仿真,FNO 花费了不到一秒的时间;而 DeepONet 耗时 2.5 秒;传统的求解器则大概需要花费 18 个小时。

传统的求解器vs 数据驱动的解决方案

有限元法 (FEM) 和有限差分法 (FDM) 等传统求解器通过将空间离散化来求解方程。 因此,需要在分辨率上进行了权衡:粗网格速度快但精度较低; 精细网格准确但速度慢。但复杂的 PDE 系统通常需要非常精细的离散化,因此对于传统求解器来说非常具有挑战性和耗时。 另一方面,数据驱动的方法可以直接从数据中学习方程族的映射mapping。 因此,基于数据驱动学习的方法可以比传统求解器快几个数量级。

算子学习:

神经网络其实就是从有限的输入输出对中学习一种拓展到无限空间的非线性的映射关系,设 为什么神经网络可以解偏微分方程,是什么原理?  第3张 是一个有界的开集, 为什么神经网络可以解偏微分方程,是什么原理?  第3张为什么神经网络可以解偏微分方程,是什么原理?  第3张是函数的可分 Banach 空间,分别在 为什么神经网络可以解偏微分方程,是什么原理?  第3张为什么神经网络可以解偏微分方程,是什么原理?  第3张 中取值。 此外,设 G† : A → U 是一个(通常)非线性映射。假设我们有观测值 为什么神经网络可以解偏微分方程,是什么原理?  第3张 , 旨在通过构建参数映射,通过选择 θ† ∈ Θ 对于某些有限维参数空间 Θ 来构建 G† 的近似值 使得 G(·, θ†) = Gθ† ≈ G†。

为什么神经网络可以解偏微分方程,是什么原理?  第3张或等效地 为什么神经网络可以解偏微分方程,是什么原理?  第3张为什么神经网络可以解偏微分方程,是什么原理?  第3张

这是无限维学习的自然框架,因为可以定义成本函数 C : U × U → R 并寻求问题的最小值

为什么神经网络可以解偏微分方程,是什么原理?  第3张

对于上面的图可知,算子学习可以看作是图像到图像的问题。 傅里叶层可以看作是卷积层的替代品。

主要解决解决cnn无法实现的resolution-invariant

傅里叶算子

为什么神经网络可以解偏微分方程,是什么原理?  第13张

图2 傅里叶算子FNO的架构

让v 是输入向量,u是输出向量。 一个标准的深度神经网络可以写成以下形式:

为什么神经网络可以解偏微分方程,是什么原理?  第14张

K是线性层或卷积层,σ 是 ReLU 等激活函数。

映射 为什么神经网络可以解偏微分方程,是什么原理?  第3张 可以参数化为

为什么神经网络可以解偏微分方程,是什么原理?  第16张

其中 κ 是核函数,W 是偏置项,对于傅立叶神经算子,K 作为卷积并通过傅里叶变换实现。

如图2所示从输入 a 开始。

(1)傅里叶算子结构:

为通过神经网络 P 提升到更高维度的通道空间。 然后应用四层傅里叶积分算子和激活函数。 通过神经网络Q投影回目标维度,输出u。

(2)傅立叶层:

从输入 v 开始。在顶部:应用傅立叶变换 F,对较低的傅立叶模式进行线性变换 R 并滤除较高的模式,然后应用逆傅立叶变换 为什么神经网络可以解偏微分方程,是什么原理?  第3张 。 在底部:应用局部线性变换 W 。最后一起过一个激活函数。

FFT变换 为什么神经网络可以解偏微分方程,是什么原理?  第3张 和逆变换 为什么神经网络可以解偏微分方程,是什么原理?  第3张 可以定义为:

为什么神经网络可以解偏微分方程,是什么原理?  第20张

为什么神经网络可以解偏微分方程,是什么原理?  第21张

CNN滤波和傅里叶滤波的区别

卷积神经网络中的过滤器通常是局部的。 它们很适合捕捉局部图案,例如边缘和形状。 傅立叶滤波器是全局正弦函数。 它们更适合表示连续函数。

高频模式和非周期边界

傅立叶层本身会失去较高频率的模式,并且仅适用于周期性边界条件。 然而,傅里叶神经算子作为一个整体没有这些限制。 傅里叶变换-逆变换结构有助于恢复更高的傅立叶模式。另外偏置项 W 有助于恢复非周期边界。

分辨率不变性

傅里叶层是离散化不变的,因为它们可以从以任意方式离散化的函数中学习和评估。 由于参数是直接在傅里叶空间中学习的,因此在物理空间中求解函数简单地相当于在 为什么神经网络可以解偏微分方程,是什么原理?  第3张 的基础上进行投影,而 为什么神经网络可以解偏微分方程,是什么原理?  第3张为什么神经网络可以解偏微分方程,是什么原理?  第3张 上随处可见,这使FNO能够实现zero-shot超分辨率预估。

简单看一下GitHub中的傅里叶层的代码吧,整体实现不是很难看懂

为什么神经网络可以解偏微分方程,是什么原理?  第25张

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2024/11/1043.html

分享给朋友:

相关文章

只有我一个人后悔升级鸿蒙next吗?

只有我一个人后悔升级鸿蒙next吗?

我有一台mate 60 pro,第一时间升级了“纯血鸿蒙”。 虽然功能并不完善,甚至有些简陋,但是我非常~非常不后悔升级鸿蒙next系统。 因为.... 这就是一款“大型养成系游戏“,给我平淡的生活提供了源源不断的情绪价值。 我每天特别…

如何看待台积电,三星相继停供大陆7nm及更先进芯片?

在这个事出来之前,我就看到过一个说法,两家Foundry可以在中东建厂,让中东的Fab去干“脏活”。本质上是国内企业搞几个中东的代理人,装作是中东的初创Fabless企业去下单,人家Foundry大概率睁一只眼闭一只眼,只管数钱。然而,紧接…

PHP承载百万/天 访问量需要用到什么技术?

当年做一个百万PV的商城,也不过是两台2c4g的阿里云虚机罢了(其实一台就够,另外一台主要的逼着大家一定开发的时候一定要有负载均衡和横向扩容的意识)。当时框架还是Thinkphp3.2,框架提高运行效率的开关全打开,标准的lnmp模式,单机…

抖音上有一些账号搬运别人的视频,几乎一模一样,也没判搬运,他们是怎么做到的??

对于任何短视频平台来说,如何用最低的成本快速实现伪原创搬运都是需要解决的问题。 所有的短视频平台,包括抖音、快手、tiktok、视频号、小红书、B站,甚至是FB、推特、INS、YouTube,它们的查重技术都是类似的,只要你在网络环境设置得…

如何评价小米14pro顶配可以选配卫星通话,小米15全系都无法选配?

如何评价小米14pro顶配可以选配卫星通话,小米15全系都无法选配?

雷总不是说了吗,我可以不用,但你不能没有。市面上OPPO Find X8 Pro和vivo X200 Pro的卫星通信版分别加价300,而荣耀Magic7和Magic7 Pro有卫星通信版且不加价,荣耀更显诚意。 我觉得有是更好的,虽然使用…

是不是从Java培训班出来的人都被淘汰了?

真实个人经历。我就是从培训班出来的,但没有学完就跑出来了。当我明白什么人不管什么基础都能进培训班进行培训,学到什么程度都能保证他们包就业,我就知道不正常。我自己是大三下的时候去的,考研考到一半感觉无望,想抓紧时间学习技术,利用应届生身份准备…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。