Saltar al contenido principal
LibreTexts Español

7.4: Método de Matriz de Densidad Variacional

  • Page ID
    126445
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Template:MathJaxArovas

    El principio variacional

    Supongamos que se nos da un hamiltoniano\(\HH\). A partir de esto construimos la energía libre,\(F\):

    \[\begin{split} F&=E-TS\\ &={Tr}\,(\vrh\,\HH) + \kT\,{Tr}\,(\vrh\,\ln\vrh)\ . \end{split}\]

    Aquí,\(\vrh\) está la matriz de densidad 13. Una matriz de densidad física debe ser (i) normalizada (\({Tr}\,\vrh = 1\)), (ii) hermitiana y (iii) definida no negativa (todos los valores propios de\(\vrh\) deben ser no negativos).

    Nuestro objetivo es extremizar la energía libre sujeta a las diversas limitaciones sobre\(\vrh\). Supongamos que\(\vrh\) es diagonal en la base de los autoestados de\(\HH\),

    \[\vrh=\sum_\gamma P_\gamma\,\ket{\gamma}\bra{\gamma}\ ,\]

    donde\(P_\gamma\) está la probabilidad de que el sistema esté en estado\(\ket{\gamma}\). Entonces

    \[F=\sum_\gamma E_\gamma\,P_\gamma +\kT\sum_\gamma P_\gamma\ln P_\gamma\ .\]

    Así, la energía libre es una función del conjunto\(\{P_\gamma\}\). Ahora extremizamos\(F\) sujetos a la restricción de normalización. Esto significa que formamos la función extendida

    \[F^*\big(\{P_\gamma\},\lambda\big)=F\big(\{P_\gamma\}\big) + \lambda\Big(\sum_\gamma P_\gamma - 1\Big)\ ,\]

    y luego extremizar libremente tanto sobre las probabilidades\(\{P_\gamma\}\) como sobre el multiplicador de Lagrange\(\lambda\). Esto produce la distribución de Boltzmann,

    \[P^{eq}_\gamma={1\over Z}\,\exp(-E_\gamma/\kT)\ ,\]

    donde\(Z=\sum_\gamma e^{-E_\gamma/\kT}={Tr}\,e^{-\HH/\kT}\) está la función de partición canónica, que se relaciona a\(\lambda\) través de

    \[\lambda=\kT\,(\ln Z -1)\ .\]

    Tenga en cuenta que los pesos de Boltzmann son, apropiadamente, todos positivos.

    Si el espectro de\(\HH\) está delimitado desde abajo, nuestro extremo debería de hecho producir un mínimo para la energía libre\(F\). Además, dado que hemos minimizado libremente sobre todas las probabilidades, sujeto a la restricción de normalización única, \(\{P_\gamma\}\)cualquier distribución que no sea el equilibrio uno debe producir un mayor valor de\(F\).

    Por desgracia, la distribución de Boltzmann, aunque exacta, suele ser intratable de evaluar. Para los sistemas unidimensionales, existen métodos generales como el enfoque de matriz de transferencia que permiten una evaluación exacta de la energía libre. Sin embargo, más allá de una dimensión, la situación es en general desesperada. Existe una familia de modelos solucionables (“integrables”) en dos dimensiones, pero sus soluciones requieren técnicas especializadas y son extremadamente difíciles. La idea detrás de la aproximación de la matriz de densidad variacional es construir una matriz de densidad de prueba tratable\(\vrh\) que depende de un conjunto de parámetros variacionales\(\{x\nda\}\), y minimizar con respecto a este conjunto (finito).

    Matriz de densidad variacional para el modelo Ising

    Consideremos una vez más el modelo de Ising Hamiltoniano,

    \[\HH=-\sum_{i<j} J_{ij}\,\sigma_i\,\sigma_j -H\sum_i \sigma_i\ .\]

    Los estados del sistema\(\ket{\gamma}\) pueden ser etiquetados por los valores de las variables de giro:\(\ket{\gamma}\longleftrightarrow\ket{\,\sigma_1,\sigma_2,\ldots}\). Suponemos que la matriz de densidad es diagonal en esta base,

    \[\vrh\ns_N\big(\gamma \big| \gamma'\big) \equiv\vrh(\gamma)\,\delta_{\gamma,\gamma'}\ ,\]

    donde

    \[\delta_{\gamma,\gamma'}=\prod_i\delta_{\sigma\ns_i,\sigma'_i}\ .\]

    En efecto, este es el caso de la matriz de densidad exacta, es decir, el peso de Boltzmann,

    \[\vrh\nd_N(\sigma_1,\sigma_2,\ldots)={1\over Z}\,e^{-\beta\HH(\sigma\ns_1,\ldots,\sigma\ns_N)}\ .\]

    Ahora escribimos una matriz de densidad de prueba que es un producto sobre las contribuciones de sitios individuales independientes:

    \[\vrh\nd_N(\sigma_1,\sigma_2,\ldots)=\prod_i\vrh(\sigma_i)\ ,\]

    donde

    \[\vrh(\sigma)=\Big({1+m\over 2}\Big)\,\delta_{\sigma,1} + \Big({1-m\over 2}\Big)\,\delta_{\sigma,-1}\ .\]

    Tenga en cuenta que hemos cambiado ligeramente nuestra notación. Estamos denotando por\(\vrh(\sigma)\) el elemento diagonal correspondiente de la matriz

    \[\vrh=\begin{pmatrix} {1+m\over 2} & 0 \\ 0 & {1-m\over 2} \end{pmatrix}\ ,\]

    y la matriz de densidad completa es un producto tensor sobre las matrices de sitio único:

    \[\vrh\nd_N=\vrh\otimes\vrh\otimes\cdots\otimes\vrh\ .\]

    Tenga en cuenta que\(\vrh\) y por lo tanto\(\vrh\ns_N\) se normalizan apropiadamente. El parámetro variacional aquí es\(m\), que, si\(\rho\) va a ser definido no negativo, debe satisfacer\(-1\le m\le 1\). La cantidad\(m\) tiene la interpretación física del giro promedio en cualquier sitio dado, ya que

    \[\langle \sigma_i\rangle = \sum_\sigma \vrh(\sigma)\,\sigma = m.\]

    Ahora podemos evaluar la energía promedio:

    \[\begin{split} E&=\Tra (\vrh\nd_N\HH) = -\sum_{i<j} J_{ij}\, m^2 - H\sum_i m\\ &=-\half N \jhz\,m^2 -N H m\ , \end{split}\]

    donde una vez más\(\jhz\) está la transformada discreta de Fourier de\(J(\BR)\) en el vector de onda\(\Bq=0\). La entropía viene dada por

    \[\begin{split} S&=-\kB \Tra (\vrh\ns_N\ln\vrh\ns_N) = -N\kB\Tra (\vrh\ln\vrh)\vph\\ &=-N\kB\bigg\{ \Big({1+m\over 2}\Big) \ln \Big({1+m\over 2}\Big) + \Big({1- m\over 2}\Big) \ln \Big({1-m\over 2}\Big) \bigg\}\ . \end{split}\]

    Ahora definimos la energía libre adimensional por sitio:\(f\equiv F/N\jhz\). Tenemos

    \[f(m,h,\theta)=-\half\, m^2 - hm + \theta\> \bigg\{\Big({1+m\over 2}\Big) \ln \Big({1+m\over 2}\Big) +\Big({1- m\over 2}\Big) \ln \Big({1-m\over 2}\Big) \bigg\}\ ,\]

    donde\(\theta\equiv \kT/\jhz\) está la temperatura adimensional, y\(h\equiv H/\jhz\) el campo magnético adimensional, como antes. Extremizamos\(f(m)\) fijando

    \[{\pz f\over\pz m}=0=-m-h+{\theta\over 2}\ln\Big({1+m\over 1-m}\Big)\ .\]

    Resolviendo para\(m\), obtenemos

    \[m=\tanh\bigg({m+h\over \theta}\bigg)\ ,\]

    que es precisamente lo que encontramos en la Ecuación [isingmft].

    [ferg] Energía libre de campo variacional\(\RDelta f = f(m,h,\theta) + \theta\,\ln 2\) versus magnetización\(m\) a seis temperaturas igualmente espaciadas interpolando entre valores 'alto' (\(\theta=1.25\), rojo) y 'bajo' (\(\theta=0.75\), azul). Panel superior:\(h=0\). Panel inferior:\(h=0.06\).

    Tenga en cuenta que el valor óptimo de\(m\) hecho satisface el requisito\(|m|\le 1\) de probabilidad no negativa. Esta ecuación no lineal puede resolverse gráficamente. Para\(h=0\), la solución no magnetizada\(m=0\) siempre aplica. Sin embargo, para\(\theta<1\) hay dos soluciones adicionales en\(m=\pm m\nd_\ssr{A}(\theta)\), con\(m\nd_\ssr{A}(\theta) =\sqrt{3(1-\theta)} + \CO\big( (1-\theta)^{3/2}\big)\) para\(t\) cerca de (pero menos de) una. Estas soluciones, que están relacionadas por la\(\MZ_2\) simetría del\(h=0\) modelo, son de hecho las soluciones de baja energía. Esto se muestra claramente en la figura [ferg], donde la energía libre variacional\(f(m,t)\) se grafica como una función de\(m\) para un rango de temperaturas interpolando entre valores 'alto' y 'bajo'. A la temperatura crítica\(\theta_\Rc=1\), el estado de energía más bajo cambia de no magnetizado (alta temperatura) a magnetizado (baja temperatura).

    Porque\(h> 0\), ya no hay una\(\MZ_2\) simetría (\(\sigma_i\to -\sigma_i\)\(\forall\> i\)). La solución de alta temperatura ahora tiene\(m>0\) (o\(m<0\) si\(h<0\)), y esto varía suavemente a medida que\(t\) se baja, acercándose al límite completamente polarizado\(m=1\) como\(\theta\to 0\). A temperaturas muy altas, el argumento de la\(\tanh\) función es pequeño, y podemos aproximarnos\(\tanh(x)\simeq x\), en cuyo caso

    \[m(h,\theta)={h\over \theta-\theta_\Rc}\ .\]

    A esto se le llama la ley Curie-Weiss. Se puede inferir\(\theta_\Rc\) de la susceptibilidad a altas temperaturas\(\xhi(\theta)=(\pz m/\pz h)\nd_{h=0}\) trazando\(\xhi^{-1}\) versus\(\theta\) y extrapolando para obtener la\(\theta\) -intercepción. En nuestro caso,\(\xhi(\theta)=(\theta-\theta_\Rc)^{-1}\). Para baja\(\theta\) y débil\(h\), hay dos mínimos inequivalentes en la energía libre.

    Cuando\(m\) es pequeño, es apropiado expandirse\(f(m,h,\theta)\), obteniendo

    \[f(m,h,\theta)=-\theta\,\ln 2 - hm +\half\, (\theta-1) \,m^2 + \frac{\theta}{12}\,m^4 + \frac{\theta}{30}\,m^6 + \frac{\theta}{56}\,m^8 + \ldots\ .\]

    Esto se conoce como la expansión Landau de la energía libre en términos del parámetro de orden\(m\). Un parámetro de orden es una variable termodinámica\(\phi\) que distingue fases ordenadas y desordenadas. Típicamente\(\phi=0\) en la fase desordenada (alta temperatura), y\(\phi\ne 0\) en la fase ordenada (baja temperatura). Cuando el orden se establece continuamente, cuando\(\phi\) es continuo a través\(\theta_\Rc\), se dice que la transición de fase es de segundo orden. Cuando\(\phi\) cambia abruptamente, la transición es de primer orden. También es bastante común observar transiciones de fase entre dos estados ordenados. Por ejemplo, un cristal, que es un estado ordenado, puede cambiar su estructura reticular, digamos de una fase tetragonal de alta temperatura a una fase ortorrómbica de baja temperatura. Cuando la\(T\) fase alta posee las mismas simetrías que la\(T\) fase baja, como en el ejemplo tetragonal a ortorrómbico, la transición puede ser de segundo orden. Cuando las dos simetrías están completamente desrelacionadas, por ejemplo en una transición hexagonal-tetragonal, o en una transición entre un ferroimán y un antiferroimán, la transición es en general de primer orden.

    A lo largo de esta discusión, hemos asumido que las interacciones\(J_{ij}\) son predominantemente ferromagnéticas,\(J_{ij}>0\), por lo que todos los giros prefieren alinearse. Cuando\(J_{ij}<0\), se dice que la interacción es antiferromagnética y prefiere la antialineación de los espines (\(\sigma_i\,\sigma_j=-1\)). Claramente, no todos los pares de giros pueden ser antialineados: hay dos posibles estados de giro y un número termodinámicamente extenso de giros. Pero en la celosía cuadrada, por ejemplo, si las únicas interacciones\(J_{ij}\) son entre vecinos más cercanos y las interacciones son antiferromagnéticas, entonces la configuración de energía más\(T=0\) baja (estado fundamental) será aquella en la que los giros en sublátices opuestos estén antialineados. La celosía cuadrada es bipartita — se descompone en dos sublátices interpenetrantes A y B (que son a su vez celosías cuadradas, giradas 45\(^\circ\) con respecto al original, y con una constante de celosía mayor por un factor de\(\sqrt{2}\)), de tal manera que cualquier sitio en A tiene vecinos más cercanos en B, y viceversa. La celosía de nido de abeja es otro ejemplo de una celosía bipartita. Así es la simple celosía cúbica. La celosía triangular, sin embargo, no es bipartita (es tripartita). En consecuencia, con interacciones antiferromagnéticas vecinas más cercanas, el modelo de Ising de celosía triangular está altamente frustrado. La moraleja de la historia es esta: las interacciones antiferromagnéticas pueden dar lugar a un ordenamiento magnético complicado, y, cuando se frustra por la geometría de la celosía, pueden tener una entropía específica finita incluso en\(T=0\).

    Teoría media del campo del modelo Potts

    El hamiltoniano para el modelo Potts es

    \[\HH=-\sum_{i<j} J_{ij}\,\delta_{\sigma_i,\sigma_j} - H\sum_i \delta_{\sigma_i,1}\ .\]

    Aquí,\(\sigma_i\in\{1,\ldots,q\}\), con entero\(q\). Se trata del llamado 'modelo\(q\) estatal Potts'. La cantidad\(H\) es análoga a un campo magnético externo, y preferentemente alinea (para\(H>0\)) los giros locales en la\(\sigma=1\) dirección. Vamos a asumir\(H\ge 0\).

    El conjunto\(q\) -component se toma convenientemente para ser los enteros de\(1\) a\(q\), pero podría ser cualquier cosa, como

    \[\sigma_i\in\{\hbox{tomato, penny, ostrich, Grateful Dead ticket from 1987}, \ \,\ldots\}\ .\]

    La energía de interacción es\(-J_{ij}\) si los sitios\(i\) y\(j\) contienen el mismo objeto (\(q\)posibilidades), y\(0\) si\(i\) y\(j\) contienen diferentes objetos (\(q^2-q\)posibilidades).

    El modelo Potts de dos estados es equivalente al modelo Ising. Dejar que los valores permitidos de\(\sigma\) ser\(\pm 1\). Luego la cantidad

    \[\delta_{\sigma,\sigma'}=\half + \half\,\sigma\sigma'\\]

    es igual a\(1\) si\(\sigma=\sigma'\), y es cero en caso contrario. El modelo Potts de tres estados no se puede escribir como un simple modelo de Ising de tres estados, uno con una interacción bilineal\(\sigma\,\sigma'\) donde\(\sigma\in\{-1,0,+1\}\). Sin embargo, es sencillo verificar la identidad

    \[\delta_{\sigma,\sigma'}=1+\half\,\sigma\sigma'+\frac{3}{2}\,\sigma^2\sigma'^2 -(\sigma^2+\sigma'^2)\ .\]

    Así, el modelo\(q=3\) -estado Potts es equivalente a un modelo de Ising\(S=1\) (de tres estados) que incluye\(\sigma^2\sigma'^2)\) interacciones tanto\((\sigma\sigma')\) bilineales como bicátricas, así como un término de campo local que se empareja al cuadrado del espín,\(\sigma^2\). En general se pueden encontrar tales correspondencias para modelos\(q\) Potts superiores, pero, como debería esperarse, las interacciones se vuelven cada vez más complejas, con términos bicúbico, bicártico, bi-quintico. Tal formulación, sin embargo, oscurece la bella\(S\ns_q\) simetría inherente al modelo, donde\(S\ns_q\) está el grupo de permutación sobre\(q\) símbolos, que tiene\(q!\) elementos.

    Volviendo a la teoría del campo medio, escribimos la matriz de densidad variacional de sitio único\(\vrh\) como una matriz diagonal con entradas

    \[\vrh(\sigma)=x\,\delta_{\sigma,1} + \bigg({1-x\over q-1}\bigg)\, \big( 1-\delta_{\sigma,1}\big)\ ,\]

    con\(\vrh\nd_N(\sigma\ns_1,\ldots,\sigma\ns_N)=\vrh(\sigma\ns_1)\cdots\vrh(\sigma\ns_N)\). Tenga en cuenta que\(\Tra(\vrh)=1\). El parámetro variacional es\(x\). Cuando\(x=q^{-1}\), todos los estados son igualmente probables. Pero para\(x>q^{-1}\),\(\sigma=1\) se prefiere el estado, y los otros\((q-1)\) estados tienen probabilidades idénticas pero menores. Es una cuestión sencilla calcular la energía y la entropía:

    \[\begin{split} E=\Tra(\vrh\nd_N\HH) &= -\half N \jhz \bigg\{x^2 + {(1-x)^2\over q-1}\bigg\}-NH x\\ S=-\kB\Tra(\vrh\nd_N\ln\vrh\nd_N)&=-N\kB\bigg\{x\ln x + (1-x)\ln \bigg({1-x\over q-1}\bigg)\bigg\}\ . \end{split}\]

    La energía libre adimensional por sitio es entonces

    \[f(x,\theta,h)=-\half \bigg\{x^2 + {(1-x)^2\over q-1}\bigg\} + \theta\> \bigg\{x\ln x + (1-x)\ln \bigg({1-x\over q-1}\bigg)\bigg\}-hx\ ,\]

    donde\(h=H/\jhz\). Ahora extremizamos con respecto\(x\) a obtener la ecuación media del campo,

    \[{\pz f\over\pz x}=0=-x+{1-x\over q-1} + \theta\,\ln x -\theta\,\ln\bigg({1-x\over q-1}\bigg) -h\ .\]

    Obsérvese que para\(h=0\),\(x=q^{-1}\) es una solución, correspondiente a un estado desordenado en el que todos los estados son igualmente probables. A altas temperaturas, para pequeños\(h\), esperamos\(x-q^{-1}\propto h\). De hecho, usando Mathematica se puede establecer

    \[x\equiv q^{-1}+s\ ,\]

    y ampliar la ecuación de campo medio en potencias de\(s\). Se obtiene

    \[h={q\,(q\theta-1)\over q-1}\,s + {q^3\,(q-2)\,\theta\over 2\,(q-1)^2}\,s^2 + \CO(s^3)\ .\]

    Para los campos débiles\(|h|\ll 1\),, y tenemos

    \[s(\theta)={(q-1)\,h\over q\,(q\theta-1)} + \CO(h^2)\ ,\]

    que de nuevo es de la forma Curie-Weiss. La diferencia\(s=x-q^{-1}\) es el parámetro de orden para la transición.

    Por último, se puede ampliar la energía libre en poderes de\(s\), obteniendo la expansión Landau,

    \[\begin{split} f(s,\theta,h)&=-{2h+1\over 2q}-\theta\ln q - hs + {q\,(q\theta-1)\over 2\,(q-1)}\,s^2 -{(q-2)\,q^3\,\theta\over 6\,(q-1)^2}\,s^3\\ &\qquad\qquad+{q^3\theta\over 12}\Big[1+(q-1)^{-3}\Big] s^4 -{q^4\theta\over 20}\Big[1-(q-1)^{-4}\Big] s^5\\ &\qquad\qquad\qquad\qquad + {q^5\theta\over30}\Big[1+(q-1)^{-5}\Big] s^6+\ldots\quad. \end{split}\]

    Tenga en cuenta que\(q=2\), para, los coeficientes de\(s^3\)\(s^5\), y poderes impares de orden superior de\(s\) desaparecer en la expansión Landau. Esto es consistente con lo que encontramos para el modelo de Ising, y está relacionado con la\(\MZ_2\) simetría de ese modelo. Porque\(q>3\), hay un término cúbico en la media de energía libre de campo, y así esperamos genéricamente una transición de primer orden, como veremos a continuación cuando discutamos la teoría de Landau.

    Teoría media del campo del\(XY\) modelo

    Consideremos el llamado\(XY\) modelo, en el que cada sitio contiene un giro plano continuo, representado por una variable angular\(\phi_i\in [-\pi,\pi]\):

    \[\HH=-{1\over 2}\sum_{i\ne j} J_{ij}\cos\!\big(\phi_i-\phi_j\big)-H\sum_i\cos\phi_i\ . \label{XYmodel}\]

    Escribimos los (elementos diagonales de la) matriz de densidad completa una vez más como un producto:

    \[\vrh\ns_N(\phi_1,\phi_2,\ldots)=\prod_i\vrh(\phi_i)\ .\]

    Nuestro objetivo será extremizar la energía libre con respecto a la función\(\vrh(\phi)\). Para ello, calculamos

    \[E=\Tra (\vrh\ns_N\,\HH) = - \half N\jhz\> \Big|\! \Tra\!\big(\vrh\,e^{i\phi}\big) \Big|^2 - NH\Tra\!\big(\vrh\,\cos\phi\big)\ .\]

    La entropía es

    \[S=-N\kB\Tra (\vrh\,\ln\vrh)\ .\]

    Tenga en cuenta que para cualquier función\(A(\phi)\), tenemos 14

    \[\Tra\big(\vrh \, A)\equiv\int\limits_{-\pi}^\pi\!{d\phi\over 2\pi}\>\vrh(\phi)\,A(\phi)\ .\]

    Ahora extremizamos lo funcional\(F\big[\vrh(\phi)\big]=E-TS\) con respecto a\(\vrh(\phi)\), bajo la condición de que\(\Tra\vrh=1\). Por lo tanto, utilizamos el método de Lagrange de multiplicadores indeterminados, escribiendo

    \[F^*=F-N\kT\,\lambda\>\Big(\Tra\!\vrh -1\Big)\ .\]

    Tenga en cuenta que\(F^*\) es una función del multiplicador de Lagrange\(\lambda\) y una función de la matriz de densidad\(\vrh(\phi)\). El prefactor\(N\kT\) que\(\lambda\) se multiplica no tiene ninguna consecuencia matemática —siempre podríamos redefinir el multiplicador para ser\(\lambda'\equiv N\kT\lambda\). Está presente sólo para mantener la homogeneidad y dimensionalidad adecuada de\(F^*\) consigo\(\lambda\) mismo adimensional y de orden\(N^0\). Ahora tenemos

    \[\begin{split} {\delta F^*\over\delta\vrh(\phi)}&={\delta\over\delta\vrh(\phi)} \Bigg\{\!- \half N\jhz\> \Big|\! \Tra\!\! \big(\vrh\,e^{i\phi}\big) \Big|^2 - NH\Tra\!\!\big(\vrh\,\cos\phi\big)\\ &\hskip 1.25in+ N\kT\,\Tra\!\big(\vrh\,\ln\vrh\big)-N\kT\>\lambda\, \Big(\Tra\!\vrh -1\Big)\Bigg\} \ . \end{split}\]

    Para ello, observamos que

    \[{\delta\over\delta\vrh(\phi)} \Tra(\vrh\,A)={\delta\over\delta\vrh(\phi)} \int\limits_{-\pi}^\pi\!{d\phi\over 2\pi}\>\vrh(\phi)\,A(\phi)={1\over 2\pi}\>A(\phi)\ .\]

    Así, tenemos

    \[\begin{split} {\delta {\tilde F}\over\delta\vrh(\phi)}&=-\half N\jhz\cdot{1\over 2\pi}\Bigg[ \mathop{\textsf{Tr}}_{\phi'}\!\big(\vrh \>e^{i\phi'}\big) \>e^{-i\phi} +\mathop{\textsf{Tr}}_{\phi'}\!\big(\vrh \>e^{-i\phi'}\big)\>e^{i\phi} \Bigg]-NH\cdot{\cos\phi\over 2\pi}\\ &\hskip 1.5in + N\kT\cdot {1\over 2\pi}\,\Big[\ln\vrh(\phi)+1\Big] -N\kT\cdot{\lambda\over 2\pi}\ . \end{split}\]

    Ahora definamos

    \[\mathop{\textsf{Tr}}_{\phi}\!\big(\vrh\,e^{i\phi}\big)=\int\limits_{-\pi}^\pi\!{d\phi\over 2\pi}\> \vrh(\phi)\>e^{i\phi}\equiv m\,e^{i\phi\ns_0}\ .\]

    Entonces tenemos

    \[\ln\vrh(\phi)={\jhz\over\kT}\>m\,\cos(\phi-\phi\ns_0) + {H\over\kT}\,\cos\phi+ \lambda-1 .\]

    Claramente la energía libre se reducirá si es\(\phi\ns_0=0\) así que el campo medio es máximo y se alinea con el campo externo, que prefiere\(\phi=0\). Así, concluimos

    \[\vrh(\phi)=\CC\>\exp\!\bigg({H\ns_{eff}\over\kT}\>\cos\phi\bigg)\ ,\]

    donde

    \[H\ns_{eff}=\jhz\, m + H\]

    y\(\CC=e^{\lambda-1}\). El valor de\(\lambda\) se determina entonces invocando la restricción,

    \[\Tra\!\vrh=1=\CC\!\!\int\limits_{-\pi}^\pi\!{d\phi\over 2\pi}\>\exp\!\bigg({H\ns_{eff}\over\kT}\>\cos\phi\bigg) =\CC\,I\ns_0(H\ns_{eff}/\kT)\ ,\]

    donde\(I_0(z)\) está la función Bessel. Somos libres de definir\(\ve\equiv H\ns_{eff}/\kT\) y tratar\(\ve\) como nuestro único parámetro variacional. Luego tenemos la matriz normalizada de densidad de sitio único

    \[\vrh(\phi)={\exp(\ve\cos\phi)\over\int\limits_{-\pi}^\pi \!\!{d\phi'\over 2\pi}\,\exp(\ve\cos\phi')} = {\exp(\ve\cos\phi)\over I_0(\ve)}\ .\]

    A continuación calculamos los siguientes promedios:

    \[\begin{aligned} \blangle\, e^{\pm i\phi}\,\brangle & = \int\limits_{-\pi}^\pi\!{d\phi\over 2\pi}\,\vrh(\phi)\,e^{\pm i\phi} = {I_1(\ve)\over I_0(\ve)}\\ \big\langle\!\cos(\phi-\phi')\big\rangle&= \Rep\,\big\langle e^{i\phi}\,e^{-i\phi'}\big\rangle =\bigg({I_1(\ve)\over I_0(\ve)}\bigg)^{\!2}\ ,\end{aligned}\]

    así como

    \[\Tra(\vrh\,\ln\vrh)=\int\limits_{-\pi}^\pi\!{d\phi\over 2\pi}\,{e^{\ve\cos\phi}\over I_0(\ve)}\, \Big\{\ve\cos\phi - \ln I_0(\ve)\Big\} = \ve\,{I_1(\ve)\over I_0(\ve)} - \ln I_0(\ve)\ .\]

    Por lo tanto, la energía libre adimensional por sitio es

    \[f(\ve,h,\theta)=-{1\over 2}\bigg({I_1(\ve)\over I_0(\ve)}\bigg)^{\!2} +(\theta\ve-h)\,{I_1(\ve)\over I_0(\ve)} - \theta\,\ln I_0(\ve)\ ,\]

    con\(\theta=\kT/\jhz\)\(h=H/\jhz\) y\(f=F/N\jhz\) como antes. Obsérvese que la ecuación de campo medio es\(m=\theta\ve-h=\blangle\, e^{i\phi}\,\brangle\),

    \[\theta\ve - h = {I_1(\ve)\over I_0(\ve)}\quad. \label{XYvdm}\]

    Para pequeños\(\ve\), podemos ampliar las funciones de Bessel, usando

    \[I_\nu(z)=(\half z)^\nu\sum_{k=0}^\infty {(\frac{1}{4} z^2)^k\over k!\,\RGamma(k+\nu+1)}\ ,\]

    para obtener

    \[f(\ve,h,\theta)=\frac{1}{4}\,\big(\theta-\half\big)\,\ve^2 + \frac{1}{64}\,\big(2-3\theta\big)\,\ve^4 -\half\,h\ve + \frac{1}{16}\,h\ve^3 + \ldots\ .\]

    Esto predice una transición de fase de segundo orden en\(\theta_\Rc=\half\). 15 Tenga en cuenta también la forma Curie-Weiss de la susceptibilidad a alta\(\theta\):

    \[{\pz f\over\pz \ve}=0 \quad \Longrightarrow\quad \ve={h\over \theta-\theta_\Rc} + \ldots\ .\]

    \(XY\)modelo a través del método de abandono de fluctuaciones

    Consideremos nuevamente el hamiltoniano de la ecuación [XYmodel]. Definir\(z\ns_i\equiv \exp(i\phi\ns_i)\) y escribir

    \[z\ns_i=w + \delta z\ns_i\quad,\]

    dónde\(w\equiv\langle z\ns_i\rangle\) y\(\delta z\ns_i\equiv z\ns_i-w\). Por supuesto que también tenemos las complejas relaciones conjugadas\(z^*_i=w^*+\delta z^*_i\) y\(w^*=\langle z^*_i\rangle\). Escribiendo\(\cos(\phi\ns_i-\phi\ns_j)=\Rep(z^*_i z\ns_j)\), al descuidar los términos proporcionales a\(\delta z^*_i\,\delta z\ns_j\) en\(\HH\) llegamos al campo medio hamiltoniano,

    \[\HH^\ssr{MF}=\half N \HJ(0)\,|w|^2 - \half\HJ(0)\,|w|\sum_i\big(w^* z\ns_i + w z^*_i\big) - \half H\sum_i \big(z^*_i+z\ns_i\big)\]

    Es claro que la energía libre se minimizará si el campo medio\(w\) rompe la\(\SO(2)\) simetría en la misma dirección que el campo externo\(H\), lo que significa\(w\in\MR\) y

    \[\HH^\ssr{MF}=\half N \HJ(0)\,|w|^2 - \big(H+\HJ(0)\,|w|\big)\sum_i\cos\phi\ns_i\quad.\]

    La energía libre adimensional por sitio es entonces

    \[f=\half |w|^2 -\theta\ln I\ns_0\bigg({h+|w|\over\theta}\bigg)\quad.\]

    Diferenciando con respecto a\(|w|\), se obtiene

    \[|w|\equiv m = {I\ns_1\!\left({h+m\over\theta}\right)\over I\ns_0\!\left({h+m\over\theta}\right)}\quad,\]

    que es la misma ecuación que la Ecuación [XyVDM]. Las dos teorías de campo medias arrojan los mismos resultados en cada detalle (ver § 10).


    This page titled 7.4: Método de Matriz de Densidad Variacional is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Daniel Arovas.