Saltar al contenido principal
LibreTexts Español

9.6: Teoría de Dirac

  • Page ID
    130753
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    El verdadero avance hacia la teoría relativista cuántica de los electrones (y otros espín-\(1 / 2\) fermiones) fue logrado en 1928 por P. A. M. Dirac. Para esa época, la estructura de su teoría era altamente no trivial. Es decir, aunque se preserva formalmente, en la representación de coordenadas, la misma ecuación de Schrödingerpicture de la dinámica cuántica que en la mecánica cuántica no relativista,\({ }^{51}\)\[i \hbar \frac{\partial \Psi}{\partial t}=\hat{H} \Psi,\] postula que la función de onda\(\Psi\) que describe no es una función compleja escalar de tiempo y coordenadas, sino una columna-vector de cuatro componentes (a veces llamado bispinor) de tales funciones,\(\Psi^{\dagger}\) siendo su biespinor hermio-conjugado un vector fila-vector de 4 componentes de sus conjugados complejos:\[\Psi=\left(\begin{array}{c} \Psi_{1}(\mathbf{r}, t) \\ \Psi_{2}(\mathbf{r}, t) \\ \Psi_{3}(\mathbf{r}, t) \\ \Psi_{4}(\mathbf{r}, t) \end{array}\right), \quad \Psi^{\dagger}=\left(\Psi_{1}^{*}(\mathbf{r}, t), \quad \Psi_{2}^{*}(\mathbf{r}, t), \quad \Psi_{3}^{*}(\mathbf{r}, t), \quad \Psi_{4}^{*}(\mathbf{r}, t)\right)\] y que el hamiltoniano que participa en la Ec. (95) es un \(4 \times 4\)matriz definida en el espacio Hilbert de bispinores\(\Psi\). Para una partícula libre, el hamiltoniano postulado se ve increíblemente simple: 52

    \[\hat{H}=c \hat{\boldsymbol{\alpha}} \cdot \hat{\mathbf{p}}+\hat{\beta} m c^{2} .\]donde\(\hat{\mathbf{p}}=-i \hbar \nabla\) es el mismo\(3 \mathrm{D}\) vector operador de impulso que en el caso no relativista, mientras que los operadores\(\hat{\boldsymbol{\alpha}}\) y\(\hat{\beta}\) pueden ser representados en la siguiente\(2 \times 2\) forma taquigráfica:\[\hat{\boldsymbol{\alpha}} \equiv\left(\begin{array}{cc} \hat{0} & \hat{\boldsymbol{\sigma}} \\ \hat{\boldsymbol{\sigma}} & \hat{0} \end{array}\right), \quad \hat{\beta} \equiv\left(\begin{array}{cc} \hat{I} & \hat{0} \\ \hat{0} & -\hat{I} \end{array}\right)\] El operador \(\hat{\boldsymbol{\alpha}}\), compuesto por los operadores vectoriales Pauli\(\hat{\boldsymbol{\sigma}}\), es también un vector en el\(3 \mathrm{D}\) espacio habitual, siendo cada uno de sus 3 componentes cartesianos una\(4 \times 4\) matriz. La forma particular de las\(2 \times 2\) matrices correspondientes a los operadores\(\hat{\boldsymbol{\sigma}}\) y\(\hat{I}\) en la ecuación (98a) depende de la base seleccionada para la representación del estado de giro; por ejemplo, en la\(z\) base estándar, en la que el cartesiano componentes de\(\hat{\boldsymbol{\sigma}}\) están representados por las matrices Pauli (4.105), la forma\(4 \times 4\) matricial de la Eq. (98a) es\[\alpha_{x}=\left(\begin{array}{cccc} 0 & 0 & 0 & 1 \\ 0 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{array}\right), \quad \alpha_{y}=\left(\begin{array}{cccc} 0 & 0 & 0 & -i \\ 0 & 0 & i & 0 \\ 0 & -i & 0 & 0 \\ i & 0 & 0 & 0 \end{array}\right), \quad \alpha_{z}=\left(\begin{array}{cccc} 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & -1 \\ 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \end{array}\right), \quad \beta=\left(\begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{array}\right) .(9.98 \mathrm{~b})\] Es sencillo usar ecuaciones (98) para verificar que las matrices\(\alpha_{x}, \alpha_{y}, \alpha_{z}\) y\(\beta\) satisfacer las siguientes relaciones: \[\begin{gathered} \alpha_{x}^{2}=\alpha_{y}^{2}=\alpha_{z}^{2}=\beta^{2}=\mathrm{I}, \\ \alpha_{x} \alpha_{y}+\alpha_{y} \alpha_{x}=\alpha_{y} \alpha_{z}+\alpha_{z} \alpha_{y}=\alpha_{z} \alpha_{x}+\alpha_{x} \alpha_{z}=\alpha_{x} \beta+\beta \alpha_{x}=\alpha_{y} \beta+\beta \alpha_{y}=\alpha_{z} \beta+\beta \alpha_{z}=0, \end{gathered}\]es decir, antiviaje.

    Usando estas relaciones de conmutación, y actuando esencialmente como en la Sec. 1.4, es sencillo demostrar que cualquier solución a la ecuación de Dirac obedece a la ley de conservación de probabilidad, es decir, la ecuación de continuidad (1.52), con la densidad de probabilidad:\[w=\Psi^{\dagger} \Psi\] y la corriente de probabilidad,\[\mathbf{j}=\Psi^{\dagger} c \hat{\boldsymbol{\alpha}} \Psi\] mirando casi como en la mecánica de onda no relativista - cf. Eq. (1.22) y (1.47). Obsérvese, sin embargo, la conjugación hermitiana utilizada en estas fórmulas en lugar de la conjugación compleja, para formar los escalares\(w\)\(j_{x}, j_{y}\), y a\(j_{z}\) partir de los vectores de estado de 4 componentes (96).

    Esta estrecha similitud se extiende a las soluciones fundamentales de onda plana de las ecuaciones de Dirac es el espacio libre. En efecto, al enchufar tal solución, en la forma\[\Psi=\mathrm{u} e^{i(\mathbf{k} \cdot \mathbf{r}-\omega t)} \equiv\left(\begin{array}{l} u_{1} \\ u_{2} \\ u_{3} \\ u_{4} \end{array}\right) e^{i(\mathbf{k} \cdot \mathbf{r}-\omega t)}\] en las ecuaciones (95) y (97), vemos que efectivamente están satisfechas, siempre que se satisfaga un sistema de cuatro ecuaciones algebraicas lineales acopladas para cuatro amplitudes\(u_{1,2,3,4}\) de\(c\) número complejo. La condición de su consistencia produce la misma relación de dispersión (87), es decir, el mismo diagrama de dos ramas mostrado en la Fig. 6, como se desprende de la ecuación de Klein-Gordon. La diferencia es que tapando cada valor de\(\omega\), dado por la Ec. (87), de nuevo en el sistema de las ecuaciones lineales para cuatro amplitudes\(u\), obtenemos dos soluciones para su vector\(\mathbf{u} \equiv\left(u_{1}, u_{2}, u_{3}, u_{4}\right)\) para cada una de las dos ramas de energía - ver Fig. 6 nuevamente. En la\(z\) base estándar de los operadores de giro, pueden representarse de la siguiente manera:

    \ [\\ text {for} E=E_ {+} >0:\ quad\ mathrm {u} _ {+\ uparrow} =c_ {+\ uparrow}\ left (\ begin {array} {c}
    1\\ 0\
    \ frac {c p_ {z}} {E_ {+} +m c^ {2}}\
    \ frac {c _ {+}} {E_ {+} +m c^ {2}}
    \ end {array}\ derecha),\ quad\ mathrm {u} _ {+\ flecha abajo} =c_ {+\ flecha abajo}\ izquierda (\ begin {array} {c}
    0\\ 1\\
    \ frac {c p_ {-}} {E_ {+} +m c^ {2}}\
    \ frac {-c p_ {z}} {E_ {+} +m c^ {2}}
    \ end {array}\ derecha),\]

    \ [\\ text {for} E=E_ {-} <0:\ quad u_ {-\ uparrow} =c_ {-\ uparrow}\ left (\ begin {array} {c}
    \ frac {c p_ {z}} {E_ {-} -m c^ {2}}\
    \ frac {c p_ {+}} {E_ {-} -m c^ {2}}\\
    1\\
    0
    \ end {array}\ derecha),\ quad u_ {-\ flecha abajo} =c_ {-\ flecha abajo}\ izquierda (\ begin {array} {c }
    \ frac {c p_ {-}} {E_ {-} -m c^ {2}}\\
    \ frac {-c p_ {z}} {E_ {-} -m c^ {2}}\\
    0\\
    1
    \ end {array}\ derecha),\]

    donde\(p_{\pm} \equiv p_{x} \pm i p_{y}\), y\(c_{\pm}\) son coeficientes de normalización.

    La interpretación más simple de estas soluciones es que la Ec. (103), con los vectores\(\mathbf{u}_{+}\) dados por la Ec. (104a), representa una partícula spin-1/2 (digamos, un electrón), mientras que con los vectores\(\mathbf{u}_{-}\) dados por la Eq. (104b), representa una antipartícula (un positrón), y las dos soluciones para cada partícula, indexada con flechas opuestas, corresponde a dos direcciones posibles del spin-1/2\(\sigma_{z}=\pm 1\), es decir\(S_{z}=\pm \hbar / 2\). Esta interpretación es realmente sólida en el límite no relativista, cuando dos últimos componentes del vector (104a), y dos primeros componentes del vector (104b) son insignificantemente pequeños:\[\mathrm{u}_{+\uparrow} \rightarrow\left(\begin{array}{c} 1 \\ 0 \\ 0 \\ 0 \end{array}\right), \quad \mathrm{u}_{+\downarrow} \rightarrow\left(\begin{array}{c} 0 \\ 1 \\ 0 \\ 0 \end{array}\right), \quad \mathrm{u}_{-\uparrow} \rightarrow\left(\begin{array}{l} 0 \\ 0 \\ 1 \\ 0 \end{array}\right), \quad \mathrm{u}_{-\downarrow} \rightarrow\left(\begin{array}{l} 0 \\ 0 \\ 0 \\ 1 \end{array}\right), \quad \text { for } \frac{p_{x, y, z}}{m c} \rightarrow 0\] Sin embargo, a energías arbitrarias, el cuadro físico es más complejo. Para mostrar esto, utilicemos la ecuación de Dirac para calcular la ley Heisenberg-picture de evolución temporal del operador de algún componente cartesiano del momento angular orbital\(\mathbf{L} \equiv \mathbf{r} \times \mathbf{p}\), por ejemplo de\(L_{x}=y p_{z}-z p_{y}\), teniendo en cuenta que los operadores Dirac (98a) viajan con los de\(\mathbf{r}\) y\(\mathbf{p}\), y también las relaciones de conmutación de Heisenberg (2.14):\[i \hbar \frac{\partial \hat{L}_{x}}{\partial t}=\left[\hat{L}_{x}, \hat{H}\right]=c \hat{\boldsymbol{\alpha}} \cdot\left[\left(\hat{y} \hat{p}_{z}-\hat{z} \hat{p}_{y}\right), \hat{\mathbf{p}}\right]=-i \hbar c\left(\hat{\alpha}_{z} \hat{p}_{y}-\hat{\alpha}_{y} \hat{p}_{z}\right)\] con relaciones similares para otros dos componentes cartesianos. Dado que el lado derecho de estas ecuaciones es diferente de cero, el impulso orbital generalmente no se conserva, ¡incluso para una partícula libre! Consideremos, sin embargo, el siguiente vector operador,\[\hat{\mathbf{S}} \equiv \frac{\hbar}{2}\left(\begin{array}{ll} \hat{\boldsymbol{\sigma}} & \hat{0} \\ \hat{0} & \hat{\boldsymbol{\sigma}} \end{array}\right) .\] Según las ecuaciones (4.105), sus componentes cartesianos, en la\(z\) -base, están representados por\(4 \times 4\) matrices\[\mathrm{S}_{x}=\frac{\hbar}{2}\left(\begin{array}{cccc} 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 1 & 0 \end{array}\right), \quad \mathrm{S}_{y}=\frac{\hbar}{2}\left(\begin{array}{cccc} 0 & -i & 0 & 0 \\ i & 0 & 0 & 0 \\ 0 & 0 & 0 & -i \\ 0 & 0 & i & 0 \end{array}\right), \quad \mathrm{S}_{z}=\frac{\hbar}{2}\left(\begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & -1 \end{array}\right) \text {. }\] Calculemos la ley Heisenberg-picture de evolución temporal de estos componentes, por ejemplo\[i \hbar \frac{\partial \hat{S}_{x}}{\partial t}=\left[\hat{S}_{x}, \hat{H}\right]=c\left[\hat{S}_{x},\left(\hat{\alpha}_{x} \hat{p}_{x}+\hat{\alpha}_{y} \hat{p}_{y}+\hat{\alpha}_{z} \hat{p}_{z}\right)\right]\] Un cálculo directo de los conmutadores de las matrices (98) y (107) rinde para\[\left[\hat{S}_{x}, \hat{\alpha}_{x}\right]=0,\left[\hat{S}_{x}, \hat{\alpha}_{y}\right]=i \hbar \hat{\alpha}_{z},\left[\hat{S}_{x}, \hat{\alpha}_{z}\right]=-i \hbar \hat{\alpha}_{y}\] que finalmente obtengamos\[i \hbar \frac{\partial \hat{S}_{x}}{\partial t}=i \hbar c\left(\hat{\alpha}_{z} \hat{p}_{y}-\hat{\alpha}_{y} \hat{p}_{z}\right),\] con expresiones similares para los otros dos componentes del operador. Comparando este resultado con la Ec. (106), vemos que cualquier componente cartesiano del operador definido de manera similar a la Ec. (5.170),\[\hat{\mathbf{J}} \equiv \hat{\mathbf{L}}+\hat{\mathbf{S}}\] es una integral del movimiento,\({ }^{53}\) por lo que este operador puede interpretarse como el que representa el momento angular total de la partícula. Por lo tanto, el operador (107) puede interpretarse como el operador de espín de una\(1 / 2\) partícula de espín (por ejemplo, electrón). Como se desprende de la última de la Ec. (107b), en el límite no relativista las columnas (105) representan los propios mercados del\(z\) -componente de ese operador, con estados propios\(S_{z}=\pm \hbar / 2\), con el signo correspondiente a en el índice de flecha. Entonces, la teoría Dirac proporciona una justificación para el giro\(1 / 2\) -o, algo más humildemente, reemplaza el postulado hamiltoniano Pauli (4.163) por el de un hamiltoniano más simple (y por lo tanto más plausible), invariante de Lorentz (97).

    Obsérvese, sin embargo, que esta interpretación simple, que separa completamente una partícula de su antipartícula, no es válida para las soluciones exactas (103) - (104), de manera que generalmente los autoestados del Hamiltoniano Dirac son ciertas superposiciones lineales (coherentes) de los componentes que describen la partícula y su antipartícula - cada una con ambas direcciones de giro. Este hecho lleva a varios efectos interesantes, entre ellos la llamada paradoja de Klien ante el reflejo de un electrón relativista de una barrera potencial. \({ }^{54}\)


    \({ }^{51}\)Después de la forma “natural-relativista” de la ecuación de Klein-Gordon (84), este aparente retorno a la ecuación no relativista de Schrödinger puede parecer muy contradictorio. Sin embargo, se vuelve un poco menos sorprendente teniendo en cuenta el hecho (cuya prueba se deja para el ejercicio del lector) que la Ec. (84) también puede ser refundido en la forma (95) para un vector-columna de dos componentes\(\Psi\) (a veces llamado spinor), con un hamiltoniano que puede estar representado por un \(2 \times 2\)\(-\)y por lo tanto expresado a través de las matrices Pauli (4.105) y la matriz de identidad I.

    \({ }^{52}\)Además, si la derivada del tiempo que participa en la ecuación (95), y las tres derivadas de coordenadas que participan (vía el operador de impulso) en la ecuación (97), se fusionan en un operador de 4 vectores\(\partial / \partial x_{k} \equiv\{\nabla, \partial / \partial(c t)\}\), la ecuación de Dirac (95) puede reescribirse de una manera aún más simple, manifiestamente Forma 4-vector invariante de Lorentz (con la suma implícita sobre el índice repetido\(k=1, \ldots, 4\) - véase, por ejemplo, EM Sec. 9.4):\[\left(\hat{\gamma}_{k} \frac{\partial}{\partial x_{k}}+\mu\right) \Psi=0, \quad \text { where } \hat{\gamma} \equiv\left\{\hat{\gamma}_{1}, \hat{\gamma}_{2}, \hat{\gamma}_{3}\right\}=\left(\begin{array}{cc} 0 & -i \hat{\boldsymbol{\sigma}} \\ i \hat{\boldsymbol{\sigma}} & 0 \end{array}\right), \quad \hat{\gamma}_{4}=\hat{\beta}\] donde\(\mu \equiv m c / \hbar\) - al igual que en la Ec. (84). Obsérvese también que, muy contraintuitivamente, el Hamiltoniano Dirac (97) es lineal en el momento, mientras que el hamiltoniano no relativista de una partícula, así como la ecuación relativista de Schrödinger, son cuadráticos en p. En mi humilde opinión, la teoría Dirac (incluyendo el concepto de antipartículas que ha inspirado ) puede competir por el título de la idea teórica más revolucionaria en física de todos los tiempos, a pesar de contendientes tan fuertes como las leyes de Newton, las ecuaciones de Maxwell, la distribución estadística de Gibbs, la teoría de Bohr del átomo de hidrógeno y la relatividad general de Einstein.

    \({ }^{53}\)Es sencillo demostrar que este resultado sigue siendo válido para una partícula en cualquier campo central\(U(r)\).

    \({ }^{54}\)Ver, e.g., A. Calogeracos y N. Dombey, Contempo. Phys. 40, 313 (1999).


    This page titled 9.6: Teoría de Dirac is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Konstantin K. Likharev via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.