最优化方法Python计算：函数向量和函数矩阵

文章列表

函数 $f(\\boldsymbol{x}),\\boldsymbol{x}\\in\\text{ℝ}^n$ 的梯度
$\\nabla f(\\boldsymbol{x})=\\begin{pmatrix}\\frac{\\partial f}{\\partial x_1}\\\\\\frac{\\partial f}{\\partial x_2}\\\\\\vdots\\\\\\frac{\\partial f}{\\partial x_n}\\end{pmatrix}$
和Hesse阵
$\\nabla^2f(\\boldsymbol{x})=\\begin{pmatrix}\\frac{\\partial^2f}{\\partial x_1\\partial x_1}&\\frac{\\partial^2f}{\\partial x_1\\partial x_2}&\\cdots&\\frac{\\partial^2f}{\\partial x_1\\partial x_n}\\\\\\frac{\\partial^2f}{\\partial x_2\\partial x_1}&\\frac{\\partial^2f}{\\partial x_2\\partial x_2}&\\cdots&\\frac{\\partial^2f}{\\partial x_2\\partial x_n}\\\\\\vdots&\\vdots&\\ddots&\\vdots\\\\\\frac{\\partial^2f}{\\partial x_n\\partial x_1}&\\frac{\\partial^2f}{\\partial x_n\\partial x_2}&\\cdots&\\frac{\\partial^2f}{\\partial x_n\\partial x_n}\\end{pmatrix}$
中的元素都是 $\\boldsymbol{x}$ 的函数。以函数为元素的向量称为函数向量。相仿地，元素为函数的矩阵称为函数矩阵。以函数的意义，梯度和Hesse阵仍然是 $\\boldsymbol{x}$ 的函数，不过前者为 $\\text{ℝ}^n\\rightarrow\\text{ℝ}^n$ 的函数，而后者为 $\\text{ℝ}^n\\rightarrow\\text{ℝ}^{n\\times n}$ 的函数。
例如，Rosenbrock函数 $f(x_1,x_2)=100(x_2-x_1^2)^2+(1-x_1)^2$ 的梯度
$\\nabla f(x_1,x_2)=\\begin{pmatrix}-400x_1(x_2-x_1^2)-2(1-x_1)\\\\200(x_2-x_1^2)\\end{pmatrix}$
在 $\\boldsymbol{x}=\\begin{pmatrix}0\\\\0\\end{pmatrix}$ 处的值为 $\\nabla f(0,0)=\\begin{pmatrix}-2\\\\0\\end{pmatrix}$ ，在 $\\boldsymbol{x}=\\begin{pmatrix}1\\\\1\\end{pmatrix}$ 处的值为 $\\nabla f(1,1)=\\begin{pmatrix}0\\\\0\\end{pmatrix}$ 。Rosenbrock函数的Hesse阵
$\\nabla^2f(x_1,x_2)=\\begin{pmatrix}-400(x_2-x_1^2)+800x_1^2+2&-400x_1\\\\-400x_1&200\\end{pmatrix}$
其在 $\\boldsymbol{x}=\\begin{pmatrix}0\\\\0\\end{pmatrix}$ 处的值为 $\\nabla^2f(0,0)=\\begin{pmatrix}2&0\\\\0&200\\end{pmatrix}$ ，而在 $\\boldsymbol{x}=\\begin{pmatrix}1\\\\1\\end{pmatrix}$ 处的值为 $\\nabla^2f(1,1)=\\begin{pmatrix}802&-400\\\\-400&200\\end{pmatrix}$ 。
Python用于科学计算的工具包sicpy的optimization模块提供了计算Rosenbrock函数值、梯度值及Hesse阵值的函数rosen、rosen_der和rosen_hess。
例1 调用rosen_der和rosen_hess验算上述计算结果。
解：下列代码完成本例计算。

import numpy as np                                  #导入numpy
from scipy.optimize import rosen_der,rosen_hess     #导入rosen_der,rosen_hess
x=np.array([0,0])                                   #设置向量x
print(rosen_der(x))                                 #计算梯度
print(rosen_hess(x))                                #计算Hesse阵
x=np.array([1,1])                                   #重设向量x
print(rosen_der(x))                                 #重算梯度
print(rosen_hess(x))                                #重算Hesse阵

程序的第1~2行分别导入numpy包和scipy包中optimization模块的rosen_der函数和rosen_hess函数。第3行创建numpy提供的array类数组对象x，并将其初始化为[0,0]，第4、5行调用rosen_der和rosen_hess函数，分别计算Rosenbrock函数在[0,0]处的梯度和Hesse阵并输出。第6行将x重置为[1,1]，第7、8行将打印算得的梯度和Hesse阵。运行程序，输出

[-2  0]
[[  2   0]
[  0 200]]
[0 0]
[[ 802 -400]
[-400  200]]

其中第1行输出的是 $\\nabla f(0,0)=\\begin{pmatrix}-2\\\\0\\end{pmatrix}$ ，第2~3函数输出的是 $\\nabla^2f(0,0)=\\begin{pmatrix}2&0\\\\0&200\\end{pmatrix}$ 。第4行输出 $\\nabla f(1,1)=\\begin{pmatrix}0\\\\0\\end{pmatrix}$ ，第5~6行输出 $\\nabla^2f(1,1)=\\begin{pmatrix}802&-400\\\\-400&200\\end{pmatrix}$ 。
Rosenbrock函数是Python作为基准问题唯一提供梯度和Hesse阵计算函数的对象。一般情况下，我们需要自行为函数 $f(\\boldsymbol{x}),\\boldsymbol{x}\\in\\text{ℝ}^n$ 设置计算梯度和Hesse阵的函数。
Python中有一个lambda运算符，可以用来定义简单函数，其语法格式为
lambda x: expression
其中，x表示函数的自变量，分号后的expression表示计算函数返回值的表达式，一般含有自变量x。
例2 用lambda运算符，设计Rosenbrock函数的梯度函数和Hesse阵函数。
解：下列代码完成本例计算。

import numpy as np                                                      #导入numpy
f1=lambda x:np.array([-400*x[0]*(x[1]-x[0]2)-2*(1-x[0]),              #设置梯度函数200*(x[1]-x[0]2)])
f2=lambda x:np.array([[-400*(x[1]-x[0]2)+800*x[0]2+2,-400*x[0]],    #设置Hesse阵函数[-400*x[0],200]])
x=np.array([0,0])                                                       #设置向量x
print(f1(x))                                                            #计算梯度
print(f2(x))                                                            #计算Hesse阵
x=np.array([1,1])                                                       #重置向量x
print(f1(x))                                                            #重算梯度
print(f2(x))                                                            #重算Hesse阵

程序的第2~3行用lambda运算符定义Rosenbrock函数的梯度函数
$\\nabla f(x_1,x_2)=\\\\\\begin{pmatrix}-400x_1(x_2-x_1^2)-2(1-x_1)\\\\200(x_2-x_1^2)\\end{pmatrix}$
为f1。注意，Python数组的下标是从0开始编码的。第4~5行定义Hesse阵函数
$\\nabla^2f(x_1,x_2)=\\begin{pmatrix}-400(x_2-x_1^2)+800x_1^2+2&-400x_1\\\\-400x_1&200\\end{pmatrix}$
为f2。注意， Python使用二维数组（等长数组的数组）表示矩阵。第6～8行和9～11行分别计算 $\\boldsymbol{x}=\\begin{pmatrix}0\\\\0\\end{pmatrix}$ 及 $\\boldsymbol{x}=\\begin{pmatrix}1\\\\1\\end{pmatrix}$ 处Rosenbrock函数的梯度和Hesse阵并输出。程序运行结果为

[-2  0]
[[  2   0]
[  0 200]]
[0 0]
[[ 802 -400]
[-400  200]]

与例1的输出一致。

最优化方法Python计算：函数向量和函数矩阵

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

最优化方法Python计算：函数向量和函数矩阵

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签