Méthode de Rayleigh-Ritz

La méthode de Rayleigh-Ritz est une méthode numérique de calcul approché des valeurs propres et vecteurs propres d'un système linéaire. Elle trouve son origine dans le contexte de la résolution de problèmes aux limites (équations aux dérivées partielles). Elle est nommée d'après les physiciens Lord Rayleigh et Walther Ritz.

L'apposition des deux noms Rayleigh et Ritz pour cette méthode fait débat [1],[2]. La procédure numérique a d'abord été publiée par Walther Ritz en 1908-1909. Selon cette référence[1], Lord Rayleigh a écrit un article félicitant Ritz pour son travail en 1911, mais déclarant qu'il avait lui-même utilisé la méthode de Ritz à de nombreuses occasions dans ses propres publications. Selon la référence [2] citant Richard Courant, Lord Rayleigh et Walther Ritz ont indépendamment l'un de l'autre conçu l'idée de remplacer la recherche d'une solution d'une équation aux dérivées partielles avec conditions aux limites fixées par un problème équivalent de type calcul variationnel consistant à chercher une solution approchée décrite par un nombre fini de paramètres.

Cette méthode est utilisée dans différents domaines des mathématiques et de la physique et est connue parfois sous un nom différent, mais toujours dans des situations nécessitant un calcul approché de valeurs propres et de vecteurs propres. En mécanique quantique, où un système de particules est décrit à l'aide d'un hamiltonien, on l'appelle méthode de Ritz et elle consiste à utiliser une base de fonctions d'onde (e.g. ondes planes, ondes gaussiennes) pour approcher la fonction d'onde propre de l'état fondamental de plus faible énergie. En mathématiques, dans le contexte de la méthode des éléments finis, la même algorithme est communément appelé la méthode de Ritz-Galerkin. On retrouve également cette méthode en mécanique des structures pour déterminer et étudier les modes propres de vibration et les fréquences de résonance.

Illustration de la méthode de Rayleigh-Ritz en algèbre linéaire

En algèbre linéaire numérique, la méthode de Rayleigh-Ritz est couramment utilisée pour déterminer des valeurs approchées de la solution d'un problème aux valeurs propres :

A x = λ x {\displaystyle A{\textbf {x}}=\lambda {\textbf {x}}}

où la matrice A C N × N {\displaystyle A\in \mathbb {C} ^{N\times N}} est de taille N {\displaystyle N} . La méthode de Rayleigh-Ritz est une méthode de projection orthogonale. On considère une matrice V C N × m {\displaystyle V\in \mathbb {C} ^{N\times m}} constituée de m vecteurs colonnes orthonormés et dont l'espace vectoriel engendré (appelé K {\displaystyle K} ). On suppose que l'espace K {\displaystyle K} contient les vecteurs propres que l'on cherche à calculer. On recherche alors des paires ( x ~ , λ ~ ) {\displaystyle ({\tilde {x}},{\tilde {\lambda }})} avec x ~ K {\displaystyle {\tilde {x}}\in K} telles que

A x ~ λ ~ x ~ K {\displaystyle A{\tilde {x}}-{\tilde {\lambda }}{\tilde {x}}\perp K} ,

ce qui signifie que la projection orthogonale de A x ~ λ ~ x ~ {\displaystyle A{\tilde {x}}-{\tilde {\lambda }}{\tilde {x}}} sur l'espace K {\displaystyle K} est nulle. De manière équivalente, on cherche les paires ( x ~ , λ ~ ) {\displaystyle ({\tilde {x}},{\tilde {\lambda }})} telles que

A x ~ λ ~ x ~ , v , v K {\displaystyle \langle A{\tilde {x}}-{\tilde {\lambda }}{\tilde {x}},v\rangle ,\forall v\in K}

, {\displaystyle \langle \cdot ,\cdot \rangle } désigne le produit scalaire hermitien de deux vecteurs de C N {\displaystyle \mathbb {C} ^{N}} . Si la norme résiduelle du vecteur A x ~ λ ~ x ~ {\displaystyle A{\tilde {x}}-{\tilde {\lambda }}{\tilde {x}}} est très faible, alors on a trouvé un vecteur et une valeur propre approchés du problème de départ.

La procédure algorithmique de Rayleigh-Ritz consiste à :

  1. Calculer la matrice V A V {\displaystyle V^{*}AV} de taille m {\displaystyle m} , où V {\displaystyle V^{*}} désigne la transposée conjuguée complexe de V {\displaystyle V}
  2. Résoudre le problème aux valeurs propres V A V y i = μ i y i {\displaystyle V^{*}AV\mathbf {y} _{i}=\mu _{i}\mathbf {y} _{i}} (plus facile, car de plus petite taille, les vecteurs y i {\displaystyle \mathbf {y} _{i}} sont de taille m {\displaystyle m} )
  3. Calculer les vecteurs de Ritz x ~ i = V y i {\displaystyle {\tilde {\textbf {x}}}_{i}=V{\textbf {y}}_{i}} et la valeur propre de Ritz λ ~ i = μ i {\displaystyle {\tilde {\lambda }}_{i}=\mu _{i}}
  4. La paire ( λ ~ i , x ~ i ) {\displaystyle ({\tilde {\lambda }}_{i},{\tilde {\textbf {x}}}_{i})} , appelée paire de Ritz constitue une solutions approchées du problème aux valeurs propres et vecteurs propres de la matrice d'origine A {\displaystyle A}

Si le sous-espace vectoriel K {\displaystyle K} engendré par les colonnes de la matrice V C N × m {\displaystyle V\in \mathbb {C} ^{N\times m}} contient k m {\displaystyle k\leq m} vecteurs proches des vecteurs propres de la matrice A {\displaystyle A} , la méthode de Rayleigh-Ritz ci-dessus trouve k {\displaystyle k} vecteurs de Ritz qui se rapprochent bien de ces vecteurs propres. La quantité facilement calculable A x ~ i λ ~ i x ~ i {\displaystyle \|A{\tilde {\textbf {x}}}_{i}-{\tilde {\lambda }}_{i}{\tilde {\textbf {x}}}_{i}\|} détermine la précision d'une telle approximation pour chaque paire de Ritz.

Dans le cas le plus simple m = 1 {\displaystyle m=1} , le matrice V {\displaystyle V} est en fait un vecteur colonne unitaire v {\displaystyle v} , et la matrice V A V {\displaystyle V^{*}AV} est un scalaire égal au quotient de Rayleigh ρ ( v ) = v A v / v v {\displaystyle \rho (v)=v^{*}Av/v^{*}v} . L'unique solution du problème aux valeurs propres est y i = 1 {\displaystyle y_{i}=1} et μ i = ρ ( v ) {\displaystyle \mu _{i}=\rho (v)} , et le seul vecteur de Ritz est v {\displaystyle v} lui-même. Ainsi, la méthode Rayleigh-Ritz se transforme en calcul du quotient de Rayleigh si m = 1 {\displaystyle m=1} .

Il existe autre connexion intéressante avec le quotient de Rayleigh. En effet, pour chaque paire de Ritz ( λ ~ i , x ~ i ) {\displaystyle ({\tilde {\lambda }}_{i},{\tilde {\textbf {x}}}_{i})} , la valeur propre λ ~ i {\displaystyle {\tilde {\lambda }}_{i}} approchée est obtenue comme le quotient de Rayleigh d'un vecteur v i {\displaystyle \mathbf {v} _{i}} , c'est-à-dire λ ~ i = μ i = ρ ( v i ) {\displaystyle {\tilde {\lambda }}_{i}=\mu _{i}=\rho (v_{i})} . Comme exemple, si A {\displaystyle A} est une matrice hermitienne, son quotient de Rayleigh (et donc toutes ses valeurs de Ritz) est réel et prend des valeurs dans l'intervalle fermé de la plus petite valeur propre de A {\displaystyle A} à la plus grande.

Remarquons que la méthode ne dit pas comment choisir la matrice V {\displaystyle V} .

Exemple

La matrice

A = [ 2 0 0 0 2 1 0 1 2 ] {\displaystyle A={\begin{bmatrix}2&0&0\\0&2&1\\0&1&2\end{bmatrix}}}

a des valeurs propres 1 , 2 , 3 {\displaystyle 1,2,3} et les vecteurs propres correspondants

x λ = 1 = [ 0 1 1 ] , x λ = 2 = [ 1 0 0 ] , x λ = 3 = [ 0 1 1 ] . {\displaystyle \mathbf {x} _{\lambda =1}={\begin{bmatrix}0\\1\\-1\end{bmatrix}},\quad \mathbf {x} _{\lambda =2}={\begin{bmatrix}1\\0\\0\end{bmatrix}},\quad \mathbf {x} _{\lambda =3}={\begin{bmatrix}0\\1\\1\end{bmatrix}}.}

Prenons

V = [ 0 0 1 0 0 1 ] , {\displaystyle V={\begin{bmatrix}0&0\\1&0\\0&1\end{bmatrix}},}

alors

V A V = [ 2 1 1 2 ] {\displaystyle V^{*}AV={\begin{bmatrix}2&1\\1&2\end{bmatrix}}}

avec des valeurs propres 1 , 3 {\displaystyle 1,3} et les vecteurs propres correspondants

y μ = 1 = [ 1 1 ] , y μ = 3 = [ 1 1 ] , {\displaystyle \mathbf {y} _{\mu =1}={\begin{bmatrix}1\\-1\end{bmatrix}},\quad \mathbf {y} _{\mu =3}={\begin{bmatrix}1\\1\end{bmatrix}},}

dont les valeurs propres de Ritz sont 1 {\displaystyle 1} et 3 {\displaystyle 3} et les vecteurs de Ritz sont

x ~ λ ~ = 1 = [ 0 1 1 ] , x ~ λ ~ = 3 = [ 0 1 1 ] . {\displaystyle \mathbf {\tilde {x}} _{{\tilde {\lambda }}=1}={\begin{bmatrix}0\\1\\-1\end{bmatrix}},\quad \mathbf {\tilde {x}} _{{\tilde {\lambda }}=3}={\begin{bmatrix}0\\1\\1\end{bmatrix}}.}

Nous observons que chacun des vecteurs de Ritz ainsi calculés est exactement un vecteur propre de A {\displaystyle A} les valeurs de Ritz associées sont des valeurs propres exactes de la matrice A {\displaystyle A} . Cela est dû au fait que l'espace vectoriel engendré pas les colonnes de la matrice V {\displaystyle V} se trouve être exactement le même que le sous-espace couvert par les deux vecteurs propres x λ = 1 {\displaystyle \mathbf {x} _{\lambda =1}} et x λ = 3 {\displaystyle \mathbf {x} _{\lambda =3}} dans cet exemple.

La méthode de Rayleigh-Ritz en calcul variationnel

Considérons le problème de la recherche d'une fonction y ( x ) {\displaystyle y(x)} qui rende extrémale une fonctionnelle, comme par exemple une intégrale I [ y ( x ) ] = a b F ( x , y , y ) d x {\displaystyle I[y(x)]=\int _{a}^{b}F(x,y,y')dx} . C'est une situation courante en physique, par exemple en mécanique lorsque l'on cherche un état d'équilibre comme un état qui minimise une énergie potentielle. On suppose que l'on peut approcher cette fonction y ( x ) {\displaystyle y(x)} par une combinaison linéaire de fonctions linéairement indépendantes,

y ( x ) φ 0 ( x ) + c 1 φ 1 ( x ) + c 2 φ 2 ( x ) + + c N φ N ( x ) {\displaystyle y(x)\approx \varphi _{0}(x)+c_{1}\varphi _{1}(x)+c_{2}\varphi _{2}(x)+\cdots +c_{N}\varphi _{N}(x)}

c 1 , c 2 , , c N {\displaystyle c_{1},c_{2},\cdots ,c_{N}} sont des constantes à déterminer par une méthode variationnelle - telle que celle décrite ci-dessous.

Les fonctions φ i ( x ) {\displaystyle \varphi _{i}(x)} sont choisies arbitrairement, à l'exception des considérations suivantes :

a) Si le problème a des conditions aux limites de type valeur fixe aux bords du domaine d'étude, alors φ 0 ( x ) {\displaystyle \varphi _{0}(x)} est choisie pour satisfaire les conditions aux limites du problème, et tous les autres φ i ( x ) {\displaystyle \varphi _{i}(x)} prennent la valeur zéro aux bords du domaine (conditions homogènes).

b) Si la forme de la solution est connue, alors φ i ( x ) {\displaystyle \varphi _{i}(x)} peut être choisie de telle sorte que y ( x ) {\displaystyle y(x)} aura cette forme.

On remplace ainsi le problème qui consiste à trouver une fonction y ( x ) {\displaystyle y(x)} qui minimise une fonctionnelle I [ y ( x ) ] {\displaystyle I[y(x)]} , par la recherche des N {\displaystyle N} coefficients qui minimisent une fonction de N {\displaystyle N} variables I ( c 1 , c 2 , , c N ) {\displaystyle I(c_{1},c_{2},\cdots ,c_{N})} . On cherche les coefficients c i {\displaystyle c_{i}} tels que le gradient de I ( c 1 , c 2 , , c N ) {\displaystyle I(c_{1},c_{2},\cdots ,c_{N})} soit nul, c'est-à-dire

I c i = 0 , i {\displaystyle {\partial I \over \partial c_{i}}=0,\forall i}

On utilise généralement une procédure itérative pour calculer les coefficients.

Dans de nombreux cas, on utilise un ensemble dit complet de fonctions φ i ( x ) {\displaystyle \varphi _{i}(x)} , par exemple une base de polynômes ou les fonctions sinus et cosinus. Un ensemble de fonctions φ i ( x ) {\displaystyle \varphi _{i}(x)} est dit complet sur l'intervalle [ a , b ] {\displaystyle [a,b]} si pour chaque fonction f ( x ) {\displaystyle f(x)} , il existe un ensemble de valeurs de coefficients c 1 , c 2 , , c N {\displaystyle c_{1},c_{2},\cdots ,c_{N}} qui représente exactement la fonction f ( x ) {\displaystyle f(x)} .

Le lien avec la section précédente (méthode de Rayleigh-Ritz en algèbre linéaire) est que lorsque l'on considère que la fonction y ( x ) {\displaystyle y(x)} est approchée par une combinaison linaire de φ i ( x ) {\displaystyle \varphi _{i}(x)} , on se place dans un espace de fonction possible plus (infiniment) petit (de dimension finie N {\displaystyle N} ), et donc là encore il s'agit de chercher une solution dans un espace projeté.

Applications en génie mécanique

La méthode Rayleigh-Ritz est souvent utilisée en génie mécanique pour trouver les fréquences de résonance approchées d'un système à plusieurs degrés de liberté, tel qu'un système de masse-ressort ou pour l'étude de la stabilité d'un volant d'inertie. La méthode peut également être utilisée pour rechercher les charges critique de flambage et le comportement post-flambage d'un poteau soumis à un effort de compression.

Considérons le cas où l'on veut trouver la fréquence de résonance d'oscillation d'un système. Tout d'abord, on écrit le mode de vibration sous la forme,

y ( x , t ) = Y ( x ) cos ω t {\displaystyle y(x,t)=Y(x)\cos \omega t}

avec une amplitude Y ( x ) {\displaystyle Y(x)} inconnue. Ensuite, on forme l'énergie totale du système, composée d'un terme d'énergie cinétique et d'un terme d'énergie potentielle. Le terme d'énergie cinétique fait intervenir le carré de la dérivée temporelle de y ( x , t ) {\displaystyle y(x,t)} , proportionnel à ω 2 {\displaystyle \omega ^{2}} . Ainsi, on exprime l'énergie totale du système sous la forme suivante :

E = T + V A [ Y ( x ) ] ω 2 sin 2 ω t + B [ Y ( x ) ] cos 2 ω t {\displaystyle E=T+V\equiv A[Y(x)]\omega ^{2}\sin ^{2}\omega t+B[Y(x)]\cos ^{2}\omega t}

Par conservation de l'énergie, l'énergie cinétique moyenne doit être égale à l'énergie potentielle moyenne. Ainsi,

ω 2 = B [ Y ( x ) ] A [ Y ( x ) ] = R [ Y ( x ) ] {\displaystyle \omega ^{2}={\frac {B[Y(x)]}{A[Y(x)]}}=R[Y(x)]}

qui est également connu sous le nom de quotient de Rayleigh. Ainsi, si nous connaissions la forme du mode de vibration Y ( x ) {\displaystyle Y(x)} , on pourrait calculer A [ Y ( x ) ] {\displaystyle A[Y(x)]} et B [ Y ( x ) ] {\displaystyle B[Y(x)]} , et ensuite obtenir la fréquence propre. Cependant, nous ne connaissons pas encore Y ( x ) {\displaystyle Y(x)} . Pour le trouver, on peut approcher Y ( x ) {\displaystyle Y(x)} par une combinaison linéaire de quelques fonctions Y i ( x ) {\displaystyle Y_{i}(x)}

Y ( x ) = i = 1 N c i Y i ( x ) {\displaystyle Y(x)=\sum _{i=1}^{N}c_{i}Y_{i}(x)}

c 1 , c 2 , , c N {\displaystyle c_{1},c_{2},\cdots ,c_{N}} sont des constantes à déterminer. On cherche les modes propres du système comme les valeurs de c 1 , c 2 , , c N {\displaystyle c_{1},c_{2},\cdots ,c_{N}} qui rendent le quotient de Rayleigh minimal.

En général, on peut exprimer A [ Y ( x ) ] {\displaystyle A[Y(x)]} et B [ Y ( x ) ] {\displaystyle B[Y(x)]} comme des polynômes du second degré des coefficients c i {\displaystyle c_{i}}  :

B [ Y ( x ) ] = i j c i c j K i j = c T K c {\displaystyle B[Y(x)]=\sum _{i}\sum _{j}c_{i}c_{j}K_{ij}={\bf {c^{T}Kc}}}

A [ Y ( x ) ] = i j c i c j M i j = c T M c {\displaystyle A[Y(x)]=\sum _{i}\sum _{j}c_{i}c_{j}M_{ij}={\bf {c^{T}Mc}}}

K {\displaystyle K} et M {\displaystyle M} sont respectivement la matrice de rigidité et la matrice de masse d'un système discret.

La minimisation de ω 2 {\displaystyle \omega ^{2}} devient:

ω 2 c i = c i c T K c c T M c = 0 {\displaystyle {\partial \omega ^{2} \over \partial c_{i}}={\partial \over \partial c_{i}}{\frac {\bf {c^{T}Kc}}{\bf {c^{T}Mc}}}=0}

Ce qui revient à,

c T M c c T K c c c T K c c T M c c = 0 {\displaystyle {\bf {{c^{T}Mc}{\partial {\bf {c^{T}Kc}} \over \partial c}-{\bf {{c^{T}Kc}{\partial {\bf {c^{T}Mc}} \over \partial c}=0}}}}}

K c c T K c c T M c M c = 0 {\displaystyle {\bf {{Kc}-{\frac {\bf {c^{T}Kc}}{\bf {c^{T}Mc}}}{\bf {{Mc}=0}}}}}

K c ω 2 M c = 0 {\displaystyle {\bf {{Kc}-\omega ^{2}{\bf {{Mc}=0}}}}}

Pour obtenir une solution non triviale des coefficients c i {\displaystyle c_{i}} , il faut et suffit que le déterminant de ce système linéaire soit nul,

det ( K ω 2 M ) = 0 {\displaystyle \det({\bf {{K}-\omega ^{2}{\bf {M}}}})=0}

On obtient ainsi les N premières fréquences propres et modes propres du système, N étant le nombre de fonctions d'approximation.

Voir également

Notes et références

  1. a et b Leissa, « The historical bases of the Rayleigh and Ritz methods », Journal of Sound and Vibration, vol. 287, nos 4-5,‎ , p. 961–978 (DOI 10.1016/j.jsv.2004.12.021, Bibcode 2005JSV...287..961L, lire en ligne)
  2. a et b Ilanko, « Comments on the historical bases of the Rayleigh and Ritz methods », Journal of Sound and Vibration, vol. 319, nos 1-2,‎ , p. 731-733 (DOI 10.1016/j.jsv.2008.06.001)

Liens externes

  • Cours sur le calcul des variations, a une section sur la méthode Rayleigh-Ritz (en anglais).
  • Calcul des valeurs propres, par Bernard Philippe et Youssef Saad
  • icône décorative Portail des mathématiques