Advertisement

矩阵微分常用公式.pdf

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:PDF


简介:
本PDF文档提供了全面而系统的矩阵微分常用公式集合,涵盖各种基础到高级的应用场景,是学习和研究线性代数及机器学习中必备的参考材料。 本段落将详细介绍“常用矩阵微分公式”的关键知识点,涵盖函数相对于实值向量的梯度以及实值函数相对于实值矩阵的梯度等方面。 ### 一、函数相对于实值向量的梯度 #### 1.1 实值函数相对向量的梯度矩阵 假设有一个实值函数 \( f(\mathbf{x}) \),其中 \(\mathbf{x}\) 是一个 \( n \times 1 \) 的列向量,则该函数相对于 \(\mathbf{x}\) 的梯度定义为一个 \( n \times 1 \) 的列向量: \[ \nabla_{\mathbf{x}} f(\mathbf{x}) = \begin{bmatrix} \frac{\partial f(\mathbf{x})}{\partial x_1} \\ \frac{\partial f(\mathbf{x})}{\partial x_2} \\ \vdots \\ \frac{\partial f(\mathbf{x})}{\partial x_n} \end{bmatrix} \] 这里,\( \nabla \) 表示梯度算子,它定义为: \[ \nabla = \begin{bmatrix} \frac{\partial}{\partial x_1} \\ \frac{\partial}{\partial x_2} \\ \vdots \\ \frac{\partial}{\partial x_n} \end{bmatrix} \] #### 1.2 运算法则 对于实值函数相对于向量的梯度,存在以下几种运算法则: 1. **线性法则**:如果 \( f(\mathbf{x}) \) 和 \( g(\mathbf{x}) \) 分别是向量 \(\mathbf{x}\) 的实值函数,\( c_1 \) 和 \( c_2 \) 为实常数,则: \[ \nabla_{\mathbf{x}} (c_1 f(\mathbf{x}) + c_2 g(\mathbf{x})) = c_1 \nabla_{\mathbf{x}} f(\mathbf{x}) + c_2 \nabla_{\mathbf{x}} g(\mathbf{x}) \] 2. **乘积法则**:若 \( f(\mathbf{x}) \) 和 \( g(\mathbf{x}) \) 分别是向量 \(\mathbf{x}\) 的实值函数,则: \[ \nabla_{\mathbf{x}} (f(\mathbf{x}) g(\mathbf{x})) = f(\mathbf{x}) \nabla_{\mathbf{x}} g(\mathbf{x}) + g(\mathbf{x}) \nabla_{\mathbf{x}} f(\mathbf{x}) \] 3. **商法则**:若 \( g(\mathbf{x}) \neq 0 \),则: \[ \nabla_{\mathbf{x}} \left( \frac{f(\mathbf{x})}{g(\mathbf{x})} \right) = \frac{g(\mathbf{x}) \nabla_{\mathbf{x}} f(\mathbf{x}) - f(\mathbf{x}) \nabla_{\mathbf{x}} g(\mathbf{x})}{g^2(\mathbf{x})} \] 4. **链式法则**:若 \( y = \mathbf{y}(x) \) 是 \(\mathbf{x}\) 的向量值函数,则: \[ \nabla_{\mathbf{x}} f(y(\mathbf{x})) = (\nabla_y f(y))^T \cdot \nabla_{\mathbf{x}} y(\mathbf{x}) \] #### 1.3 基本公式 给定向量 \(\mathbf{x}\) 和 \(\mathbf{y}\),以及矩阵 \( A \) 和 \( B \)(与 \(\mathbf{x}\) 无关),其中 \( I \) 表示单位矩阵。以下是一些基本的梯度公式: 1. 若 \( c \) 是常数,则 \( \nabla_{\mathbf{x}} c = 0 \). 2. \( \nabla_{\mathbf{x}} (\mathbf{x}^T) = I \). 3. \( \nabla_{\mathbf{x}} (\mathbf{x}^T \mathbf{x}) = 2\mathbf{x} \). 4. 若矩阵 \( A \) 是对称的,则: \( \nabla_{\mathbf{x}} (\mathbf{x}^T A \mathbf{x}) = (A + A^T)\mathbf{x} \) 5. 如果向量 \( \mathbf{

全部评论 (0)

还没有任何评论哟~
客服
客服
  • .pdf
    优质
    本PDF文档提供了全面而系统的矩阵微分常用公式集合,涵盖各种基础到高级的应用场景,是学习和研究线性代数及机器学习中必备的参考材料。 本段落将详细介绍“常用矩阵微分公式”的关键知识点,涵盖函数相对于实值向量的梯度以及实值函数相对于实值矩阵的梯度等方面。 ### 一、函数相对于实值向量的梯度 #### 1.1 实值函数相对向量的梯度矩阵 假设有一个实值函数 \( f(\mathbf{x}) \),其中 \(\mathbf{x}\) 是一个 \( n \times 1 \) 的列向量,则该函数相对于 \(\mathbf{x}\) 的梯度定义为一个 \( n \times 1 \) 的列向量: \[ \nabla_{\mathbf{x}} f(\mathbf{x}) = \begin{bmatrix} \frac{\partial f(\mathbf{x})}{\partial x_1} \\ \frac{\partial f(\mathbf{x})}{\partial x_2} \\ \vdots \\ \frac{\partial f(\mathbf{x})}{\partial x_n} \end{bmatrix} \] 这里,\( \nabla \) 表示梯度算子,它定义为: \[ \nabla = \begin{bmatrix} \frac{\partial}{\partial x_1} \\ \frac{\partial}{\partial x_2} \\ \vdots \\ \frac{\partial}{\partial x_n} \end{bmatrix} \] #### 1.2 运算法则 对于实值函数相对于向量的梯度,存在以下几种运算法则: 1. **线性法则**:如果 \( f(\mathbf{x}) \) 和 \( g(\mathbf{x}) \) 分别是向量 \(\mathbf{x}\) 的实值函数,\( c_1 \) 和 \( c_2 \) 为实常数,则: \[ \nabla_{\mathbf{x}} (c_1 f(\mathbf{x}) + c_2 g(\mathbf{x})) = c_1 \nabla_{\mathbf{x}} f(\mathbf{x}) + c_2 \nabla_{\mathbf{x}} g(\mathbf{x}) \] 2. **乘积法则**:若 \( f(\mathbf{x}) \) 和 \( g(\mathbf{x}) \) 分别是向量 \(\mathbf{x}\) 的实值函数,则: \[ \nabla_{\mathbf{x}} (f(\mathbf{x}) g(\mathbf{x})) = f(\mathbf{x}) \nabla_{\mathbf{x}} g(\mathbf{x}) + g(\mathbf{x}) \nabla_{\mathbf{x}} f(\mathbf{x}) \] 3. **商法则**:若 \( g(\mathbf{x}) \neq 0 \),则: \[ \nabla_{\mathbf{x}} \left( \frac{f(\mathbf{x})}{g(\mathbf{x})} \right) = \frac{g(\mathbf{x}) \nabla_{\mathbf{x}} f(\mathbf{x}) - f(\mathbf{x}) \nabla_{\mathbf{x}} g(\mathbf{x})}{g^2(\mathbf{x})} \] 4. **链式法则**:若 \( y = \mathbf{y}(x) \) 是 \(\mathbf{x}\) 的向量值函数,则: \[ \nabla_{\mathbf{x}} f(y(\mathbf{x})) = (\nabla_y f(y))^T \cdot \nabla_{\mathbf{x}} y(\mathbf{x}) \] #### 1.3 基本公式 给定向量 \(\mathbf{x}\) 和 \(\mathbf{y}\),以及矩阵 \( A \) 和 \( B \)(与 \(\mathbf{x}\) 无关),其中 \( I \) 表示单位矩阵。以下是一些基本的梯度公式: 1. 若 \( c \) 是常数,则 \( \nabla_{\mathbf{x}} c = 0 \). 2. \( \nabla_{\mathbf{x}} (\mathbf{x}^T) = I \). 3. \( \nabla_{\mathbf{x}} (\mathbf{x}^T \mathbf{x}) = 2\mathbf{x} \). 4. 若矩阵 \( A \) 是对称的,则: \( \nabla_{\mathbf{x}} (\mathbf{x}^T A \mathbf{x}) = (A + A^T)\mathbf{x} \) 5. 如果向量 \( \mathbf{
  • 汇总表
    优质
    《矩阵公式汇总表》是一份全面总结了线性代数中各种矩阵运算和性质的表格,涵盖行列式、特征值等核心概念,适合学生及研究人员参考使用。 矩阵公式大全包含了研究生阶段常用的许多矩阵公式,便于查阅。
  • (高等数学)
    优质
    《常用微积分公式》是一本针对学习和复习高等数学中微积分部分的重要参考书,汇集了求导、积分等核心公式的精华,适用于学生及专业人士。 总结了高等数学微积分常用公式,适合快速查阅。包括以下内容: 一、基本导数公式 二、导数的四则运算法则及常用法则 三、高阶导数的运算法则 四、基本初等函数的n阶导数公式 五、微分公式与微分运算法则 六、微分运算法则 七、基本积分公式及常用积分方法 八、补充积分公式 九、常用凑微分公式 十、分部积分法公式 十一、第二换元积分法中的三角换元公式 十二、重要公式 十三、下列常用等价无穷小关系 十四、三角函数公式 1. 两角和公式 2. 二倍角公式 3. 半角公式 4. 和差化积公式 5. 积化和差公式 6. 万能公式 7. 平方关系 8. 倒数关系 9. 商数关系 十五、几种常见的微分方程
  • 计算大全
    优质
    《矩阵计算公式大全》汇集了线性代数中各类矩阵运算的核心公式和技巧,适用于学生、教师及科研人员参考学习。 这里有3个英文版的PDF文件,包含了矩阵相关的常用和不常用公式,非常适合理工科研使用。
  • Z、Y、A、S和T的定义、推导与转换
    优质
    本文探讨了Z矩阵、Y矩阵、A矩阵、S矩阵及T矩阵的核心概念,并详细阐述了它们之间的推导过程和转换公式,为深入理解这些数学工具提供了理论支持。 ### 微波网络中的参数矩阵定义、推导及其转换 #### 一、Z 矩阵(阻抗矩阵) 在微波工程领域中,二端口网络是非常重要的组成部分。为了方便分析与计算,引入了不同的参数矩阵来描述这些网络的行为。首先介绍的是**Z 矩阵**。 **定义:** Z 矩阵用于描述端口电压和电流之间的关系。对于一个二端口网络,假设其两个端口的电压分别为 \(U_1\) 和 \(U_2\),对应的电流分别为 \(I_1\) 和 \(I_2\) ,则可以定义 Z 矩阵如下: \[ \begin{align*} U_1 &= Z_{11} I_1 + Z_{12} I_2 \\ U_2 &= Z_{21} I_1 + Z_{22} I_2 \end{align*} \] 或者用矩阵形式表示为: \[ \begin{bmatrix} U_1 \\ U_2 \end{bmatrix} = \begin{bmatrix} Z_{11} & Z_{12} \\ Z_{21} & Z_{22} \end{bmatrix} \begin{bmatrix} I_1 \\ I_2 \end{bmatrix} \] **特殊性质:** - **对于互易网络**: \(Z_{12}=Z_{21}\) - **对于对称网络**: \(Z_{11} = Z_{22}\) - **对于无耗网络**: 每个元素都可以表示为纯虚数,即 \(Z_{ij} = jX_{ij}\),其中 \(X_{ij}\) 为实数。 **归一化阻抗矩阵:** 为了进一步简化计算,通常会定义归一化的电压和电流以及相应的归一化阻抗矩阵。设归一化电压和电流分别为 \(u\) 和 \(i\) ,则它们与未归一化的电压和电流之间的关系为: \[ \begin{align*} u &= \frac{U}{Z_0} \\ i &= \frac{I}{Z_0} \end{align*} \] 其中,\(Z_0\) 为参考阻抗。由此可以得到归一化的 Z 矩阵为: \[ \begin{bmatrix} u_1 \\ u_2 \end{bmatrix} = \begin{bmatrix} z_{11} & z_{12} \\ z_{21} & z_{22} \end{bmatrix} \begin{bmatrix} i_1 \\ i_2 \end{bmatrix} \] 这里的 \(z_{ij}\) 是归一化后的阻抗矩阵元素。 #### 二、Y 矩阵(导纳矩阵) **定义:** Y 矩阵是用来描述端口电流和电压之间关系的。对于一个二端口网络,Y 矩阵可以定义为: \[ \begin{align*} I_1 &= Y_{11} U_1 + Y_{12} U_2 \\ I_2 &= Y_{21} U_1 + Y_{22} U_2 \end{align*} \] 或者用矩阵形式表示为: \[ \begin{bmatrix} I_1 \\ I_2 \end{bmatrix} = \begin{bmatrix} Y_{11} & Y_{12} \\ Y_{21} & Y_{22} \end{bmatrix} \begin{bmatrix} U_1 \\ U_2 \end{bmatrix} \] **特殊性质:** - **对于互易网络**: \(Y_{12}=Y_{21}\) - **对于对称网络**: \(Y_{11} = Y_{22}\) - **对于无耗网络**: 每个元素都是纯虚数,即 \(Y_{ij} = jB_{ij}\),其中 \(B_{ij}\) 为实数。 **归一化导纳矩阵:** 同样地,可以定义归一化的电压和电流,并据此定义归一化的导纳矩阵。设归一化电压和电流分别为 \(u\) 和 \(i\) ,则有: \[ \begin{align*} u &= \frac{U}{Z_0} \\ i &= \frac{I}{Z_0} \end{align*} \] 归一化的 Y 矩阵为: \[ \begin{bmatrix} i_1 \\ i_2 \end{bmatrix} = \begin{bmatrix} y_{11} & y
  • 的归纳总结
    优质
    本文章全面梳理并归纳了各类基础及高级矩阵公式,旨在帮助学习者系统地理解和掌握线性代数中的核心概念与计算技巧。 矩阵是数学中的一个重要概念,在机器学习与人工智能领域有着广泛的应用。本段落总结了一些常用的矩阵公式,这些内容对于研究相关领域的科研人员、工程师以及学生在阅读论文或进行实际工作时非常有帮助。 首先来看矩阵求逆的更新规则。在机器学习中,经常需要更新参数或者对矩阵执行操作,这时就需要用到矩阵的求逆方法。Neumann级数(也称作无穷级数)提供了一种特定条件下计算逆矩阵的方法:(I+A)^-1=I-A+A^2-A^3+... ,这个公式成立的前提是A的所有特征值绝对值小于1。这种性质在迭代优化过程中非常有用。 接下来介绍的是Sherman-Morrison公式,即所谓的矩阵求逆引理。当矩阵A经过修正后,其求逆可以通过原矩阵的逆加上适当的调整来完成。具体表达式为(A+BCD)^-1=A^-1-A^-1B(C^-1+DA^-1B)^-1DA^-1 。若D等于B的转置,则得到一个特殊形式:(A+BCB^T)^-1=A^-1-A^-1B(C+B^TA^-1B)^-1B^TA^-1 ,这被称为Woodbury恒等式。在机器学习中,Woodbury恒等式常用于大规模矩阵求逆的近似计算。 关于行列式的性质,如果AB是可逆的,则行列式满足det(AB)=det(A)det(B),这是行列式乘积规则的应用体现。另外,在单位阵基础上加上一个矩阵后,其行列式的变化可以用公式表示为:det(Ir+AB)=det(Is+BA) ,这一特性在统计学和数据分析中尤为重要。 Moore-Penrose伪逆是处理非方阵或奇异矩阵的一种更广泛的概念,它在解决线性最小二乘问题及奇异系统时非常有用。例如,当A是非奇异的,则其伪逆A+等于它的逆A^-1;而对于对称且幂等(即满足A^2=A)的矩阵A来说,其伪逆就是自身。此外,在许多情况下,矩阵及其伪逆具有相同的秩。 在随机矩阵分析中,“期望”是一个重要的概念。随机矩阵X的期望E{X}定义为非随机的矩阵形式,其中每个元素是对应于X中的那些元素的平均值。例如对于向量来说,E{X} 就是该向量各个分量的均值。 关于矩阵期望的一些性质包括:给定任意矩阵A和向量b,则有E{Ax+b}=AE{x}+b;随机变量X^2 的期望描述了其方差;多维情形下 E{X^TAX} 描述了协方差结构,这在多元分析中很有用。对于乘积形式的期望值,即E{(AX)(AX)^T}, 可以简化为A乘以E{X^TX} 的形式。 此外,Kronecker积运算也有特殊性质:(A⊗B)+=A+⊗B+, 这在处理高维数据和多维度信号分析时特别有用。它允许不同维度上的扩展操作,并将数据嵌入到更高层次的空间中进行进一步的解析研究。 综上所述,这些矩阵公式与性质构成了现代计算方法理论推导及实践应用的基础框架。掌握并运用好这些技巧对于深入理解和有效使用机器学习和人工智能领域中的各种技术至关重要。
  • LaTeX符号.pdf
    优质
    《LaTeX公式常用符号》是一份全面介绍LaTeX排版系统中数学公式的资源文档。包含各种数学符号、命令和示例,帮助用户高效地编写学术论文和技术文档中的复杂公式。 Latex公式常见符号大全包括203个符号:66个运算符号、43个函数符号、70个括号/箭头以及24个希腊字母。
  • 汇总.pdf
    优质
    本PDF文档汇集了微积分领域常用的公式与定理,包括导数、积分、级数等核心内容,适合学习和复习使用。 微积分公式大全.pdf
  • 求导简要回顾
    优质
    本文对矩阵求导的基本概念和常用公式进行了简洁的总结与回顾,旨在帮助读者快速掌握并应用于实际问题中。 矩阵求导公式的总结感觉还不错。这是从网上找到的资源。
  • 论千题详解——析.pdf
    优质
    《矩阵论千题详解》是一本针对矩阵分析领域的深度解析书籍,涵盖一千多道精选题目及其详细解答,适用于深入研究和学习线性代数与矩阵理论。 矩阵论千题详解电子版(最新版)