当前位置：首页 >> 每日看点 >> 为什么神经网络可以解偏微分方程，是什么原理？

为什么神经网络可以解偏微分方程，是什么原理？

卡卷网 2024-11-20 21:06:05 每日看点 136

题主一直比较关心神经网络在其他科学领域的应用，比如数学、物理学还有生物学，比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向，其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过这个算法，因为期权领域的Black-Scholes Model也是一个偏微分方程。在想这周写个什么内容时，突然想到这篇文章，当然我不是物理学专业，其实只需要知道怎么用即可，闲话不多说，下面介绍这篇文章吧。

文章地址：Fourier Neural Operator for Parametric Partial Differential Equations

源码地址：https://github.com/neuraloperator/neuraloperator

作者博客：https://zongyi-li.github.io/blog/2020/fourier-pde/

youtube讲解：https://www.youtube.com/watch?v=IaS72aHrJKE

一作是来自加州理工的Zongyi Li博士，获得过英伟达 2023-2024 研究生奖学金，其导师是Anima Anandkumar，本文的通讯作者，同时也是英伟达的机器学习总监。

为什么神经网络可以解偏微分方程，是什么原理？第1张

为什么神经网络可以解偏微分方程，是什么原理？第2张

图1 zero-shot超分辨率评测：Navier-Stokes 方程，粘度 ν = 1e−4；上面是groud-truth，下面是预测值；在 64 × 64 × 20 数据集上训练；在 256 × 256 × 80 上评估

直接上效果，zero-shot超分辨率预测，准确率非常高，说明其FNO无惧分辨率变化-resolution-invariant，它实现了 Burgers 方程的错误率降低 30%，达西流Darcy Flow 降低 60%，Navier Stokes 降低 30%。同时FNO 深度神经网络拥有极快的运行速度。例如，在一个需要进行 30000 次仿真（包括 Navier-Stokes 方程）的求解过程中，对于每个仿真，FNO 花费了不到一秒的时间；而 DeepONet 耗时 2.5 秒；传统的求解器则大概需要花费 18 个小时。

传统的求解器vs 数据驱动的解决方案

有限元法 (FEM) 和有限差分法 (FDM) 等传统求解器通过将空间离散化来求解方程。因此，需要在分辨率上进行了权衡：粗网格速度快但精度较低；精细网格准确但速度慢。但复杂的 PDE 系统通常需要非常精细的离散化，因此对于传统求解器来说非常具有挑战性和耗时。另一方面，数据驱动的方法可以直接从数据中学习方程族的映射mapping。因此，基于数据驱动学习的方法可以比传统求解器快几个数量级。

算子学习：

神经网络其实就是从有限的输入输出对中学习一种拓展到无限空间的非线性的映射关系，设为什么神经网络可以解偏微分方程，是什么原理？第3张是一个有界的开集，和是函数的可分 Banach 空间，分别在和中取值。此外，设 G† : A → U 是一个（通常）非线性映射。假设我们有观测值，旨在通过构建参数映射，通过选择 θ† ∈ Θ 对于某些有限维参数空间 Θ 来构建 G† 的近似值使得 G(·, θ†) = Gθ† ≈ G†。