Saltar al contenido principal
LibreTexts Español

3.10: La Integral con respecto a una Medida

  • Page ID
    151574
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \renewcommand{\P}{\mathbb{P}} \)\( \newcommand{\E}{\mathbb{E}} \)\( \newcommand{\R}{\mathbb{R}} \)\( \newcommand{\Q}{\mathbb{Q}} \)\( \newcommand{\N}{\mathbb{N}} \)\( \newcommand{\bs}{\boldsymbol} \)\( \newcommand{\range}{\text{range}} \)

    Las funciones de densidad de probabilidad tienen interpretaciones muy diferentes para distribuciones discretas en lugar de distribuciones continuas. Para una distribución discreta, la probabilidad de un evento se calcula sumando la función de densidad sobre los resultados en el evento, mientras que para una distribución continua, la probabilidad se calcula integrando la función de densidad sobre los resultados. Para distribuciones mixtas, tenemos funciones de densidad parcial discreta y continua y la probabilidad de un evento se calcula sumando e integrando. Los diversos tipos de funciones de densidad pueden unificarse bajo una teoría general de la integración, que es el tema de esta sección. Esta teoría tiene una enorme importancia en la probabilidad, mucho más allá de las funciones de densidad. El valor esperado, que consideramos en el siguiente capítulo, puede interpretarse como una integral con respecto a una medida de probabilidad. Más allá de la probabilidad, la teoría general de la integración es de fundamental importancia en muchas áreas de las matemáticas.

    Teoría Básica

    Definiciones

    Nuestro punto de partida es un espacio de medida\( (S, \mathscr{S}, \mu) \). Es decir,\( S \) es un conjunto,\( \mathscr{S} \) es un\( \sigma \) -álgebra de subconjuntos de\( S \), y\( \mu \) es una medida positiva sobre\( \mathscr{S} \). Como es habitual, los casos especiales más importantes son

    • Espacio euclidiano:\( S = \R^n \) para algunos\( n \in \N_+ \)\( \mathscr{S} = \mathscr R_n \), el\( \sigma \) -álgebra de los subconjuntos medibles de Lebesgue y\( \R^n \)\( \mu = \lambda_n \), medida estándar\( n \) -dimensional de Lebesgue.
    • Espacio discreto:\( S \) es un conjunto contable,\( \mathscr{S} \) es la colección de todos los subconjuntos de\( S \), y\( \mu = \# \), medida de conteo.
    • Espacio de probabilidad:\( S \) es el conjunto de resultados de un experimento aleatorio,\( \mathscr{S} \) es el\( \sigma \) álgebra de eventos y\( \mu = \P \), una medida de probabilidad.

    La siguiente definición refleja el hecho de que en la teoría de medidas, los conjuntos de medida 0 a menudo se consideran poco importantes.

    Considera una declaración con\(x \in S \) como variable libre. Técnicamente tal declaración es un predicado de\( S \). Supongamos que\( A \in \mathscr{S} \).

    1. El enunciado se sostiene\( A \) si es cierto para todos\( x \in A \).
    2. La declaración se sostiene en casi todas partes sobre\( A \) (con respecto a\( \mu \)) si existe\( B \in \mathscr{S} \) con\( B \subseteq A \) tal que la declaración se mantenga\( B \) y\( \mu(A \setminus B) = 0 \).

    Una afirmación típica que tenemos en mente es una ecuación o una desigualdad con\( x \in S \) como variable libre. Nuestro objetivo es definir la integral de ciertas funciones medibles\( f: S \to \R \), con respecto a la medida\( \mu \). La integral puede existir como un número en\( \R \) (en cuyo caso decimos que\( f \) es integrable), o puede existir como\( \infty \) o\( -\infty \), o puede no existir en absoluto. Cuando existe, la integral se denota de diversas maneras por\[ \int_S f \, d\mu, \; \int_S f(x) \, d\mu(x), \; \int_S f(x) \mu(dx) \] Vamos a utilizar los dos primeros.

    Dado que el conjunto de números reales extendidos\( \R^* = \R \cup \{-\infty, \infty\} \) juega un papel importante en la teoría, necesitamos recordar la aritmética de\( \infty \) y\( -\infty \). Aquí están las convenciones que son apropiadas para la integración:

    Aritmética en\( \R^* \)

    1. Si\( a \in (0, \infty] \) entonces\( a \cdot \infty = \infty \) y\( a \cdot (-\infty) = -\infty \)
    2. Si\( a \in [-\infty, 0) \) entonces\( a \cdot \infty = -\infty \) y\( a \cdot (-\infty) = \infty \)
    3. \(0 \cdot \infty = 0 \)y\( 0 \cdot (-\infty) = 0 \)
    4. Si\( a \in \R \) entonces\( a + \infty = \infty \) y\( a + (-\infty) = -\infty \)
    5. \( \infty + \infty = \infty \)
    6. \( -\infty + (-\infty) = -\infty \)

    Sin embargo, no\( \infty - \infty \) está definido (porque no tiene sentido consistente) y debemos tener cuidado de no producir nunca esta forma indeterminada. Se podría recordar del cálculo que también\( 0 \cdot \infty \) es una forma indeterminada. Sin embargo, para la teoría de la integración, la convención que\( 0 \cdot \infty = 0 \) es conveniente y consistente. En términos de orden por supuesto,\(-\infty \lt a \lt \infty\) para\( a \in \R \).

    También necesitamos extender la topología y medir a\( \R^* \). En cuanto a la primera,\( (a, \infty] \) es un barrio abierto de\( \infty \) y\( [-\infty, a) \) es un barrio abierto de\( -\infty \) para todos\( a \in \R \). Esto asegura que si\( x_n \in \R \) para\( n \in \N_+ \) entonces\( x_n \to \infty \) o\( x_n \to -\infty \) como\( n \to \infty \) tiene su significado habitual de cálculo. Técnicamente esta topología da como resultado la compactificación de dos puntos de\( \R \). Ahora podemos dar\( \R^* \) la\( \sigma \) -álgebra de Borel\( \mathscr R^* \), es decir, la\( \sigma \) -álgebra generada por la topología. Básicamente, esto simplemente significa que si\( A \in \mathscr R \) entonces\( A \cup \{\infty\} \),\( A \cup \{-\infty\} \), y\( A \cup \{-\infty, \infty\} \) están todos adentro\( \mathscr R^* \).

    Propiedades Deseadas

    Como motivación para la definición, cada versión de integración debe satisfacer algunas propiedades básicas. En primer lugar, la integral de la función indicadora de un conjunto medible debe ser simplemente el tamaño del conjunto, medido por\( \mu \). Esto da nuestra primera definición:

    Si\( A \in \mathscr{S} \) entonces\( \int_S \bs{1}_A \, d\mu = \mu(A) \).

    Esta definición insinúa la relación íntima entre la medida y la integración. Construiremos la integral a partir de la medida\( \mu \) en esta sección, pero esta primera propiedad demuestra que si empezamos con la integral, podríamos recuperar la medida. Esta propiedad también muestra por qué necesitamos\( \infty \) como posible valor de la integral, y aunado a algunas de las propiedades a continuación, por qué también\( -\infty \) se necesita. Aquí hay un simple corolario de nuestra primera definición.

    \( \int_S 0 \, d\mu = 0 \)

    Prueba

    Tenga en cuenta que\( \int_S 0 \, d\mu = \int_S \bs{1}_\emptyset \, d\mu = \mu(\emptyset) = 0 \).

    Damos tres propiedades más esenciales que queremos. Primero están las propiedades de linealidad en dos partes: la parte (a) es la propiedad aditiva y la parte (b) es la propiedad de escalado.

    Si\( f, \; g: S \to \R \) son funciones medibles cuyas integrales existen, y\( c \in \R \), entonces

    1. \( \int_S (f + g) \, d\mu = \int_S f \, d\mu + \int_S g \, d\mu \)siempre y cuando el lado derecho no sea de la forma\( \infty - \infty \)
    2. \( \int_S c f \, d\mu = c \int_S f \, d\mu \).
    La propiedad aditiva casi implica la propiedad de escalado

    Los pasos a continuación no constituyen una prueba porque se ignoran cuestiones de la existencia de las integrales y porque no se justifica el intercambio límite en el último paso. Aún así, el argumento muestra la estrecha relación entre la propiedad aditiva y la propiedad de escalado.

    1. Si\( n \in \N_+ \), entonces por (a) e inducción,\( \int_S n f \, d\mu = n \int_S f \, d\mu \).
    2. A partir del paso (1), si\( n \in \N_+ \) entonces\( \int f \, d\mu = \int_S n \frac{1}{n} f \, d\mu = n \int_S \frac{1}{n} f \, d\mu \) es así\( \int_S \frac{1}{n} f \, d\mu = \frac{1}{n} \int_S f \, d\mu \).
    3. Si\( m, \; n \in \N_+ \) entonces a partir de los pasos (1) y (2)\( \int_S \frac{m}{n} f \, d\mu = m \int_S \frac{1}{n} f \, d\mu = \frac{m}{n} \int_S f \, d\mu \).
    4. \( 0 = \int_S 0 \, d\mu = \int_S (f - f) \, d\mu = \int_S f \, d\mu + \int_S - f \, d\mu \)así\( \int_S -f \, d\mu = -\int_S f \, d\mu \).
    5. Por pasos (3) y (4),\( \int_S c f \, d\mu = c \int_S f \, d\mu \) para cada\( c \in \Q \) (el conjunto de números reales racionales).
    6. Si\( c \in \R \) existe\( c_n \in \Q \) para\( n \in \N_+ \) con\( c_n \to c \) como\( n \to \infty \). Por paso (5),\( \int_S c_n f \, d\mu = c_n \int_S f \, d\mu \).
    7. Tomar límites en el paso (6) sugiere\( \int_S c f \, d\mu = c \int_S f \, d\mu \).

    Para ser más explícitos, queremos que la propiedad de aditividad (a) se mantenga si al menos una de las integrales de la derecha es finita, o si ambas son\( \infty \) o si ambas lo son\( -\infty \). Lo que se descarta son los dos casos donde una integral es\( \infty \) y la otra es\( -\infty \), y esto es lo que se entiende por la forma indeterminada\( \infty - \infty \). Nuestras siguientes propiedades esenciales son las propiedades de orden, nuevamente en dos partes: la parte (a) es la propiedad positiva y la parte (b) es la propiedad creciente.

    Supongamos que\( f, \, g: S \to \R \) son medibles.

    1. Si\( f \ge 0 \) en\( S \) entonces\( \int_S f \, d\mu \ge 0 \).
    2. Si las integrales de\( f \) y\( g \) existen y\( f \le g \) en\( S \) entonces\( \int_S f \, d\mu \le \int_S g \, d\mu \)
    La propiedad positiva y la propiedad aditiva implican la propiedad creciente

    Implícito en la parte (a) es que la integral de una función no negativa, medible siempre existe en\( [0, \infty] \). Supongamos que las integrales de\( f \) y\( g \) existen y\( f \le g \) siguen\( S \). Entonces\( g - f \ge 0 \) encendido\( S \) y\( g = f + (g - f) \). Si\( \int_S f \, d\mu = -\infty \), entonces trivialmente. \( \int_S f \, d\mu \le \int_S g \, d\mu \). De lo contrario, por la propiedad de aditividad,\[ \int_S g \, d\mu = \int_S f \, d\mu + \int_S (g - f) \, d\mu\] Pero\( \int_S (g - f) \, d\mu \ge 0 \) (así en particular el lado derecho no lo es\( -\infty + \infty \)), y por lo tanto\( \int_S g \, d\mu \ge \int_S f \, d\mu \)

    Nuestra última propiedad esencial es quizás la menos intuitiva, pero es un tipo de propiedad de continuidad de integración, y está estrechamente relacionada con la propiedad de continuidad de medida positiva. El nombre oficial es el teorema de convergencia monótona.

    Supongamos que\( f_n: S \to [0, \infty) \) es medible para\( n \in \N_+ \) y que\( f_n \) va aumentando en\( n \). Entonces\[ \int_S \lim_{n \to \infty} f_n \, d\mu = \lim_{n \to \infty} \int_S f_n d \mu \]

    Tenga en cuenta que ya\( f_n \) está aumentando en\( n \),\( \lim_{n \to \infty} f_n(x) \) existe en\( \R \cup \{\infty\} \) para cada uno\( x \in \R \) (y el límite define una función medible). Esta propiedad muestra que a veces es conveniente permitir que funciones no negativas tomen el valor\( \infty \). Tenga en cuenta también que por el aumento de la propiedad,\( \int_S f_n \, d\mu \) está aumentando en\( n \) y por lo tanto también tiene un límite en\( \R \cup \{\infty\} \).

    Para ver la conexión con la medida, supongamos que\( (A_1, A_2, \ldots) \) es una secuencia creciente de conjuntos en\( \mathscr{S} \), y dejar\( A = \bigcup_{i=1}^\infty A_i \). Tenga en cuenta que\( \bs{1}_{A_n} \) está aumentando en\( n \in \N_+ \) y\( \bs{1}_{A_n} \to \bs{1}_{A} \) como\( n \to \infty \). Por ello, a la unión\( A \) se le llama a veces el límite de\( A_n \) as\( n \to \infty \). El teorema de continuidad de la medida positiva establece que\( \mu(A_n) \to \mu(A) \) como\( n \to \infty \). Equivalentemente,\(\int_S \bs{1}_{A_n} \, d\mu \to \int_S \bs{1}_A \, d\mu\) como\( n \to \infty \), así el teorema de continuidad de la medida positiva es un caso especial del teorema de convergencia monótona.

    Armado con las propiedades que queremos, la definición de la integral es bastante sencilla, y procede por etapas. Damos la definición sucesivamente para

    1. Funciones simples no negativas
    2. Funciones medibles no negativas
    3. Funciones medibles de valor real

    Por supuesto, cada definición debe coincidir con la anterior sobre las funciones que se encuentran en ambas colecciones.

    Funciones simples

    Una función simple\( S \) es simplemente una función medible, de valor real con rango finito. Las funciones simples generalmente se expresan como combinaciones lineales de funciones indicadoras.

    Representaciones de funciones simples

    1. Supongamos que\( I \) es un conjunto de índices finitos,\( a_i \in \R \) para cada uno\( i \in I \), y\( \{A_i: i \in I\} \) es una colección de conjuntos en\( \mathscr{S} \) esa partición\( S \). Entonces\( f = \sum_{i \in I} a_i \bs{1}_{A_i} \) es una función sencilla. Expresar una función simple en esta forma es una representación de\( f \).
    2. Una función simple\( f \) tiene una representación única como\( f = \sum_{j \in J} b_j \bs{1}_{B_j} \) donde\( J \) es un conjunto de índices finitos,\( \{b_j: j \in J\} \) es un conjunto de números reales distintos y\( \{B_j: j \in J\} \) es una colección de conjuntos no vacíos en\( \mathscr{S} \) esa partición\( S \). Esta representación se conoce como la representación canónica.
    Prueba
    1. Tenga en cuenta que\( f \) es medible ya que\( A_i \in \mathscr{S} \) para cada uno\( i \in I \). También\( f \) tiene rango finito ya que\( I \) es finito. Específicamente, el rango de\( f \) consiste en lo distinto\( a_i \) para\( i \in I \) con\( A_i \ne \emptyset \).
    2. Supongamos que eso\( f \) es simple. Let\( \{b_j: j \in J\} \) denotar los valores (distintos) en el rango de\( f \) y let\( B_j = f^{-1}\{b_j\} \) for\( j \in J \). Entonces\( J \) es finito,\( \{B_j: j \in J\} \) es una colección de conjuntos no vacíos en\( \mathscr{S} \) esa partición\( S \), y\( f = \sum_{j \in J} b_j \bs{1}_{B_j} \). Por el contrario, supongamos que\( f \) tiene una representación de esta forma. Entonces\(\{b_j: j \in J\}\) es el rango de\( f \) y\( B_j = f^{-1}\{b_j\} \) así la representación es única.

    Quizás te preguntes por qué no solo usamos siempre la representación canónica para funciones simples. El problema es que aunque partimos de representaciones canónicas, cuando combinamos funciones simples de diversas maneras, las representaciones resultantes pueden no ser canónicas. La colección de funciones simples se cierra bajo las operaciones aritméticas básicas, y en particular, forma un espacio vectorial.

    Supongamos que\( f \) y\( g \) son funciones simples con representaciones\( f = \sum_{i \in I} a_i \bs{1}_{A_i} \) y\( g = \sum_{j \in J} b_j \bs{1}_{B_j} \), y eso\( c \in \R \). Entonces

    1. \( f + g \)es simple, con representación\(f + g = \sum_{(i, j) \in I \times J} (a_i + b_j) \bs{1}_{A_i \cap B_j} \).
    2. \( f g \)es simple, con representación\(f g = \sum_{(i, j) \in I \times J} (a_i b_j) \bs{1}_{A_i \cap B_j} \).
    3. \( c f \)es simple, con representación\( c f = \sum_{i \in I} c a_i \bs{1}_{A_i} \).
    Prueba

    Ya que\( f \) y\( g \) son medibles, también lo son\( f + g \)\( f g \),, y\( c f \). Además, desde\( f \) y\( g \) tienen rango finito, también lo hacen\( f + g \),\( f g \), y\( c f \). Para las representaciones en las partes (a) y (b), tenga en cuenta que\( I \times J \) es finito,\( \left\{A_i \cap B_j: (i, j) \in I \times J\right\} \) es una colección de conjuntos en\( \mathscr{S} \) esa partición\( S \), y on\( A_i \cap B_j \),\( f + g = a_i + b_j \) y\( f g = a_i b_j \).

    Como aludimos antes, señalar que aunque las representaciones de\( f \) y\( g \) sean canónicas, las representaciones para\( f + g \) y\( f g \) pueden no serlo. El siguiente resultado trata la composición, y será importante para el cambio de teorema de variables en la siguiente sección.

    Supongamos que\( (T, \mathscr{T}) \) es otro espacio medible, y que\( f: S \to T \) es medible. Si\( g \) es una función simple\( T \) con representación\( g = \sum_{i \in I} b_i \bs{1}_{B_i} \), entonces\( g \circ f \) es una función simple sobre\( S \) con representación\(g \circ f = \sum_{i \in I} b_i \bs{1}_{f^{-1}(B_i)}\).

    Prueba

    Recordemos eso\( g \circ f : S \to \R \) y\( \range(g \circ f) \subseteq \range(g) \) así\( g \circ f \) tiene rango finito. \( f \)es medible, y las imágenes inversas conservan todas las operaciones establecidas, por lo que\( \left\{f^{-1}(B_i): i \in I\right\} \) es una partición medible de\( S \). Por último, si\( x \in f^{-1}(B_i) \) entonces\( f(x) \in B_i \) es así\( g\left[f(x)\right] = b_i \).

    Dada la definición de la integral de una función indicadora en (3) y que queremos que se mantenga la propiedad de linealidad (5), no hay duda de cómo debemos definir la integral de una función simple no negativa.

    Supongamos que\( f \) es una función simple no negativa, con la representación\( f = \sum_{i \in I} a_i \bs{1}_{A_i} \) donde\( a_i \ge 0 \) para\( i \in I \). Definimos\[ \int_S f \, d\mu = \sum_{i \in I} a_i \mu(A_i) \]

    La definición es consistente

    La consistencia se refiere al hecho de que una función simple puede tener más de una representación como combinación lineal de funciones indicadoras, y por lo tanto debemos demostrar que todas esas representaciones conducen al mismo valor para la integral. Dejar\(\{b_j: j \in J\}\) denotar el conjunto de elementos distintos entre los números\( a_i \) donde\(i \in I\) y\(A_i \neq \emptyset \). Para\( j \in J \), vamos\( I_j = \{i \in I: a_i = b_j\} \) y vamos\( B_j = \bigcup_{i \in I_j} A_i \). Así,\( f = \sum_{j \in J} b_j \bs{1}_{B_j} \), y esta es la representación canónica. Obsérvese que\[ \sum_{i \in I} a_i \mu(A_i) = \sum_{j \in J} \sum_{i \in I_j} a_i \mu(A_i) = \sum_{j \in J} b_j \sum_{i \in I_j} \mu(A_i) = \sum_{j \in J} b_j \mu(B_j) \] La primera suma es la integral definida en términos de la representación general\( f = \sum_{i \in I} a_i \bs{1}_{A_i} \) mientras que la última suma es la integral definida en términos de la representación canónica única\( f = \sum_{j \in J} b_j \bs{1}_{B_j} \). Así, cualquier representación de una función simple\( f \) conduce al mismo valor para la integral.

    Tenga en cuenta que si\( f \) es una función simple no negativa, entonces\( \int_S f \, d\mu \) existe en\( [0, \infty] \), por lo que las propiedades de orden se mantienen. A continuación mostramos que las propiedades de linealidad se satisfacen para funciones simples no negativas.

    Supongamos que\( f \) y\( g \) son funciones simples no negativas, y eso\( c \in [0, \infty) \). Entonces

    1. \( \int_S (f + g) \, d\mu = \int_S f \, d\mu + \int_S g \, d\mu \)
    2. \( \int_S c f \, d\mu = c \int_S f \, d\mu \)
    Prueba

    Supongamos que\( f \) y\( g \) son funciones simples no negativas con las representaciones\( f = \sum_{i \in I} a_i \bs{1}_{A_i} \) y\(g = \sum_{j \in J} b_j \bs{1}_{B_j} \). Así\( a_i \ge 0 \) para\( i \in I \),\( b_j \ge 0 \) para\( j \in J \), y\(\int_S f \, d\mu = \sum_{i \in I} a_i \mu(A_i) \) y\( \int_S g \, d\mu = \sum_{j \in J} b_j \mu(B_j) \).

    1. Como se señaló anteriormente,\( f + g \) tiene la representación\[ f + g = \sum_{(i, j) \in I \times J} (a_i + b_j) \bs{1}_{A_i \cap B_j} \] Nota que\( \{A_i \cap B_j: j \in J\} \) es una partición de\( A_i \) para cada uno\( i \in I \), y de manera similar\( \{A_i \cap B_j: i \in I\} \) es una partición de\( B_j \) para cada uno\( j \in J \). De ahí\ begin {align}\ int_s (f + g)\, d\ mu & =\ sum_ {(i, j)\ in I\ times J} (a_i + b_j)\ mu (a_i\ cap b_j)\\ & =\ sum_ {i\ in I}\ sum_ {j\ in J} a_i\ mu (a_i\ cap b_j) +\ suma_ {j\ en J}\ suma_ {i\ en I} b_j\ mu (a_i\ cap b_j)\\ & =\ sum_ {i\ en I} a_i\ mu (a_i\ cap B) +\ sum_ {j\ en J} b_j\ mu (b_j\ cap A)\\ & amp; =\ sum_ {i\ in I} a_i\ mu (a_i) +\ sum_ {j\ in J} b_j\ mu (b_j) =\ int_s f\, d\ mu +\ int_s g\, d\ mu\ end {align} Tenga en cuenta que todos los términos son no negativos (aunque algunos pueden serlo\( \infty \)), por lo que no hay problemas para reordenar el orden del términos.
    2. Esta parte es más fácil. Por\( c \in [0, \infty) \), recordemos que\( c f \) tiene la representación\( c f = \sum_{i \in I} c a_i \bs{1}_{A_i} \) tan\[ \int_S c f \, d\mu = \sum_{i \in I} c a_i \mu(A_i) = c \sum_{i \in I} a_i \mu(A_i) = c \int_S f \, d\mu \]

    La propiedad creciente se mantiene para funciones simples no negativas.

    Supongamos que\( f \) y\( g \) son funciones simples no negativas y\( f \le g \) sucesivamente\( S \). Entonces\( \int_S f \, d\mu \le \int_S g \, d\mu \)

    Prueba

    El comprobante de la propiedad aditiva arriba funciona. Tenga en cuenta que\( g - f \) es una función simple no negativa, y\( g = f + (g - f) \). Por la propiedad de aditividad,\( \int_S g \, d\mu = \int_S f \, d\mu + \int_S (g - f) \, d\mu \ge \int_S f \, d\mu \).

    A continuación damos una versión del teorema de continuidad en (7) para funciones simples. No es del todo general, pero será necesario para la siguiente subsección donde sí probemos la versión general.

    Supongamos que\( f \) es una función simple no negativa y que\( (A_1, A_2, \ldots) \) es una secuencia creciente de conjuntos en\( \mathscr{S} \) con\( A = \bigcup_{n=1}^\infty A_n \). entonces\[ \int_S \bs{1}_{A_n} f \, d\mu \to \int_S \bs{1}_A f \, d\mu \text{ as } n \to \infty\]

    Prueba

    Supongamos que\( f \) tiene la representación\( f = \sum_{i \in I} b_i \bs{1}_{B_i}\). Entonces\( \bs{1}_{A_n} f = \sum_{i \in I} b_i \bs{1}_{A_n} \bs{1}_{B_i} = \sum_{i \in I} b_i \bs{1}_{A_n \cap B_i} \) y de manera similar,\( \bs{1}_A f = \sum_{i \in I} b_i \bs{1}_{A \cap B_i} \). Pero para cada uno\( i \in I \),\( B_i \cap A_n \) está aumentando en\( n \in \N_+ \) y\( \bigcup_{n=1}^\infty (B_i \cap A_n) = B_i \cap A \). Por el teorema de continuidad para las medidas positivas,\( \mu(B_i \cap A_n) \to \mu(B_i \cap A) \) como\( n \to \infty \) para cada una\( i \in I \). Dado que\( I \) es finito,\[ \int_{A_n} f \, d\mu = \sum_{i \in I} b_i \mu(A_n \cap B_i) \to \sum_{i \in I} b_i \mu(A \cap B_i) = \int_A f \, d\mu \text{ as } n \to \infty \]

    Tenga en cuenta que\( \bs{1}_{A_n} f \) va aumentando en\( n \in \N_+ \) y\( \bs{1}_{A_n} f \to \bs{1}_A f \) como\( n \to \infty \), por lo que este realmente es un caso especial del teorema de la convergencia monótona.

    Funciones no negativas

    A continuación consideraremos funciones medibles no negativas en\( S \). Primero observamos que una función de este tipo es el límite de funciones simples no negativas.

    Supongamos que eso\( f: S \to [0, \infty) \) es medible. Entonces existe una secuencia creciente\( \left(f_1, f_2, \ldots\right) \) de funciones simples no negativas con\( f_n \to f \) on\( S \) as\( n \to \infty \).

    Prueba

    Para\( n \in \N_+ \) y\( k \in \left\{1, 2, \ldots, n 2^n\right\} \) Let\( I_{n,k} = \left[(k -1) \big/ 2^n, k \big/ 2^n\right) \) y\( I_n = [n, \infty) \). Tenga en cuenta que

    1. \( \left\{I_{n,k}: k = 1, \ldots, n 2^n\right\} \cup \left\{I_n\right\} \)es una partición de\( [0, \infty) \) para cada uno\( n \in \N_+ \).
    2. \( I_{n, k} = I_{n + 1, 2 k - 1} \cup I_{n + 1, 2 k} \)para\( k \in \{1, 2, \ldots, n 2^n\} \).
    3. \(I_n = \left(\bigcup_{k = n 2^{n + 1} + 1}^{(n+1)2^{n+1}} I_{n+1,k} \right) \cup I_{n+1} \)para\( n \in \N_+ \).

    Tenga en cuenta que la partición\( n \) th divide el intervalo\( [0, n) \) en\( n 2^n \) subintervalos de longitud\( 1 \big/ 2^n \). Así, (b) sigue porque la partición\( (n + 1) \) st divide cada uno de los primeros\( 2^n \) intervalos de la partición\( n \) th por la mitad, y (c) sigue porque la partición\( (n + 1) \) st divide el intervalo\( [n, n + 1) \) en subintervalos de longitud\( 1 \big/ 2^{n + 1} \). Ahora vamos\( A_{n,k} = f^{-1}\left(I_{n,k}\right) \) y\( A_n = f^{-1}\left(I_n\right) \) para\( n \in \N_+ \) y\( k \in \left\{1, 2, \ldots, n 2^n\right\} \). Dado que las imágenes inversas conservan todas las operaciones establecidas, (a), (b) y (c) se mantienen\( A \) reemplazando en\( I \) todas partes, y\( S \) reemplazando\( [0, \infty) \) en (a). Por otra parte, ya que\( f \) es mensurable,\( A_n \in \mathscr{S} \) y\( A_{n, k} \in \mathscr{S} \) para cada uno\( n \) y\( k \). Ahora, definir\[ f_n = \sum_{k = 1}^{ n 2^n} \frac{k - 1}{2^n} \bs{1}_{A_{n, k}} + n \bs{1}_{A_n} \] Entonces\( f_n \) es una función simple y\( 0 \le f_n \le f \) para cada uno\( n \in \N_+ \). Para mostrar convergencia, arregle\( x \in S \). Si\( n \gt f(x) \) entonces\( \left|f(x) - f_n(x)\right| \le 2^{-n} \) y por lo tanto\( f_n(x) \to f(x) \) como\( n \to \infty \). Todo lo que queda es demostrar que\( f_n \) está aumentando en\( n \). Dejar\( x \in S \) y\( n \in \N_+ \). Si\( x \in A_{n,k} \) para algunos\( k \in \left\{1, 2, \ldots, n 2^n\right\} \), entonces\( f_n(x) = (k - 1) \big/ 2^n \). Pero cualquiera\(f_{n + 1}(x) = (2 k - 2) \big/ 2^{n + 1} \) o\( f_{n + 1}(x) = (2 k - 1) \big/ 2^{n + 1} \). Si\( x \in A_n \) entonces\( f_n(x) = n \). Pero ya sea\( f_{n+1}(x) = (k - 1) \big/ 2^{n + 1} \) para algunos\( k \in \left\{n 2^{n+1} + 1, \ldots, (n + 1) 2^{n+1}\right\} \) o\( f_{n+1}(x) = n + 1 \). En todos los casos,\( f_{n + 1}(x) \ge f_n(x) \).

    El último resultado señala el camino hacia la definición de la integral de una función medible\( f: S \to [0, \infty) \) en términos de las integrales de funciones simples. Si\( g \) es una función simple no negativa con\( g \le f \), entonces por la propiedad orden, necesitamos\( \int_S g \, d\mu \le \int_S f \, d\mu \). Por otro lado, existe una secuencia de función simple no negativa convergiendo a\( f \). Así, la propiedad de continuidad sugiere la siguiente definición:

    Si\( f: S \to [0, \infty) \) es medible, defina\[ \int_S f \, d\mu = \sup\left\{ \int_S g \, d\mu: g \text{ is simple and } 0 \le g \le f \right\} \]

    Tenga en cuenta que\( \int_S f \, d\mu \) existe en\( [0, \infty] \) lo que la propiedad positiva se mantiene. Obsérvese también que si\( f \) es simple, la nueva definición concuerda con la anterior. Como siempre, necesitamos establecer las propiedades esenciales. En primer lugar, el aumento de la propiedad tiene.

    Si\( f, \, g: S \to [0, \infty) \) son medibles y\( f \le g \) en\( S \) entonces\( \int_S f \, d\mu \le \int_S g \, d\mu \).

    Prueba

    Tenga en cuenta que\( \{h: h \text{ is simple and } 0 \le h \le f\} \subseteq \{ h: h \text { is simple and } 0 \le h \le g\} \). por tanto\[ \int_S f \, d\mu = \sup\left\{\int_S h \, d\mu: h \text{ is simple and } 0 \le h \le f \right\} \le \sup\left\{\int_S h \, d\mu: h \text{ is simple and } 0 \le h \le g\right\} = \int_S g \, d\mu \]

    Ahora podemos probar la propiedad de continuidad conocida como teorema de convergencia monótona en plena generalidad.

    Supongamos que\( f_n: S \to [0, \infty) \) es medible para\( n \in \N_+ \) y que\( f_n \) va aumentando en\( n \). Entonces\[ \int_S \lim_{n \to \infty} f_n \, d\mu = \lim_{n \to \infty} \int_S f_n d \mu \]

    Prueba

    Vamos\( f = \lim_{n \to \infty} f_n \). Por la propiedad orden, tenga en cuenta que\( \int_S f_n \, d\mu \) va aumentando en\( n \in \N_+\) y por lo tanto tiene un límite en\( \R^* \), que vamos a denotar por\( c \). Tenga en cuenta que\( f_n \le f \) en\( S \) para\( n \in \N_+ \), así por la orden propiedad de nuevo,\(\int_S f_n \, d\mu \le \int_S f \, d\mu\) para\( n \in \N_+ \). Dejar\( n \to \infty \) da\( c \le \int_S f \, d\mu \). Para demostrar que\( c \ge \int_S f \, d\mu \) necesitamos mostrar eso\( c \ge \int_S g \, d\mu \) para cada función simple\( g \) con\( 0 \le g \le f \). Arreglar\( a \in (0, 1) \) y dejar\( A_n = \{ x \in S: f_n(x) \ge a g(x)\} \). Ya que\( f_n \) está aumentando en\( n \),\( A_n \subseteq A_{n+1} \). Por otra parte, ya que\( f_n \to f \) como\( n \to \infty \) una\( S \) y\( g \le f \) otra\( S \) vez,\( \bigcup_{n=1}^\infty A_n = S \). Pero por definición,\( \alpha g \le f_n \) encendido\( A_n \) así\[ \alpha \int_S \bs{1}_{A_n} g \, d\mu = \int_S \alpha \bs{1}_{A_n} g \, d\mu \le \int_S \bs{1}_{A_n} f_n \, d\mu \le \int_S f_n \, d\mu \] Dejando\( n \to \infty \) entrar las partes extremas de la desigualdad mostrada y usando la versión del teorema de convergencia monótona para funciones simples, tenemos\( a \int_S g \, d\mu \le c \) para cada uno\( a \in (0, 1) \). Por último, dejar\( a \uparrow 1 \) da\( \int_S g \, d\mu \le c \)

    Si\( f: S \to [0, \infty) \) es medible, entonces por el teorema anterior, existe una secuencia creciente\( \left(f_1, f_2, \ldots\right) \) de funciones simples con\( f_n \to f \) as\( n \to \infty \). Por el teorema de convergencia monótona en (18),\( \int_S f_n \, d\mu \to \int_S f \, d\mu \) como\( n \to \infty \). Estos dos hechos pueden ser utilizados para establecer otras propiedades de la integral de una función no negativa a partir de nuestro conocimiento que las propiedades tienen para funciones simples. Este tipo de argumento se conoce como bootstrapping. Usamos bootstrapping para mostrar que las propiedades de linealidad contienen:

    Si\( f, \, g: S \to [0, \infty) \) son medibles y\( c \in [0, \infty) \), entonces

    1. \( \int_S (f + g) \, d\mu = \int_S f \, d\mu + \int_S g \, d\mu \)
    2. \( \int_S c f \, d\mu = c \int_S f \, d\mu \)
    Prueba
    1. Dejar\( \left(f_1, f_2, \ldots\right) \) y\( \left(g_1, g_2, \ldots\right) \) estar aumentando secuencias de funciones simples no negativas con\( f_n \to f \) y\( g_n \to g \) como\( n \to \infty \). Entonces también\( (f_1 + g_1, f_2 + g_2, \ldots) \) es una secuencia creciente de funciones simples, y\( f_n + g_n \to f + g \) como\( n \to \infty \). Por el teorema de convergencia monótona\( \int_S f_n \, d\mu \to \int_S f \, d\mu \),\( \int_S g_n \, d\mu \to \int_S g \, d\mu \),, y\( \int_S (f_n + g_n) \, d\mu \to \int_S (f + g) \, d\mu \) como\( n \to \infty \). Pero\( \int_S (f_n + g_n) \, d\mu = \int_S f_n \, d\mu + \int_S g_n \, d\mu \) para cada uno\( n \in \N_+ \) así que tomar límites da\( \int_S (f + g) \, d\mu = \int_S f \, d\mu + \int_S g \, d\mu \).
    2. Del mismo modo,\( (c f_1, c f_2, \ldots) \) es una secuencia creciente de funciones simples no negativas con\( c f_n \to c f \) as\( n \to \infty \). Nuevamente, por el MCT,\( \int_S f_n \, d\mu \to \int_S f \, d\mu \) y\( \int_S c f_n \, d\mu \to \int_S c f \, d\mu \) como\( n \to \infty \). Pero\( \int_S c f_n \, d\mu = c \int_S f_n \, d\mu \) así tomar límites da\( \int_S c f \, d\mu = c \int_S f \, d\mu \).

    Funciones generales

    Nuestro paso final es definir la integral de una función medible\( f: S \to \R \). Primero, recordemos las partes positiva y negativa de\( x \in \R \):\[ x^+ = \max\{x, 0\}, \; x^- = \max\{-x, 0\} \] Tenga en cuenta que\( x^+ \ge 0 \)\( x^- \ge 0 \),,\( x = x^+ - x^- \), y\( \left|x\right| = x^+ + x^- \). Dado que queremos que la integral tenga las propiedades de linealidad en (5), no hay duda de cómo debemos definir la integral de\( f \) en términos de las integrales de\( f^+ \) y\( f^- \), que al ser no negativas, son definidas por la subsección anterior.

    Si\( f: S \to \R \) es medible, definimos\[ \int_S f \, d\mu = \int_S f^+ \, d\mu - \int_S f^- \, d\mu \] asumiendo que al menos una de las integrales de la derecha es finita. Si ambos son finitos, entonces\( f \) se dice que son integrables.

    Asumiendo que ya sea la integral de la parte positiva o la integral de la parte negativa es finita asegura que no obtengamos la temida forma indeterminada\( \infty - \infty \).

    Supongamos que eso\( f: S \to \R \) es medible. Entonces\( f \) es integrable si y solo si\( \int_S \left|f \right| \, d\mu \lt \infty \).

    Prueba

    Supongamos que\( f \) es integrable. Recordemos eso\( \left| f \right| = f^+ + f^- \). Por la propiedad aditiva para funciones no negativas,\( \int_S \left| f \right| \, d\mu = \int_S f^+ \, d\mu + \int_S f^- \, d\mu \lt \infty \). Por el contrario, supongamos que\( \int_S \left| f \right| \, d\mu \lt \infty \). Entonces\( f^+ \le \left| f \right| \) y\( f^- \le \left| f \right|\) así por el aumento de la propiedad para funciones no negativas,\( \int_S f^+ \, d\mu \le \int_S \left| f \right| \, d\mu \lt \infty \) y\( \int_S f^- \, d\mu \le \int_S \left| f \right| \, d\mu \lt \infty \).

    Tenga en cuenta que si no\( f \) es negativo, entonces nuestra nueva definición concuerda con nuestra anterior, ya que\( f^+ = f \) y\( f^- = 0 \). Para funciones simples, la integral tiene la misma forma básica que para las funciones simples no negativas:

    Supongamos que\( f \) es una función sencilla con la representación\( f = \sum_{i \in I} a_i \bs{1}_{A_i} \). Entonces\[ \int_S f \, d\mu = \sum_{i \in I} a_i \mu(A_i) \] asumiendo que la suma no tiene ambos\( \infty \) y\( -\infty \) términos.

    Prueba

    Tenga en cuenta que\( f^+ \) y también\( f^- \) son simples, con las representaciones\( f^+ = \sum_{i \in I} a_i^+ \bs{1}_{A_i} \) y\( f^- = \sum_{i \in I} a_i^- \bs{1}_{A_i} \). de ahí\[ \int_S f \, d\mu = \sum_{i \in I} a_i^+ \mu(A_i) - \sum_{i \in I} a_i^- \mu(A_i) \] siempre y cuando una de las sumas sea finita. Dado que este es el caso, podemos recombinar las sumas para obtener\[ \int_S f \, d\mu = \sum_{i \in I} a_i \mu(A_i) \]

    Una vez más, necesitamos establecer las propiedades esenciales. Nuestro primer resultado es un paso intermedio hacia la linealidad.

    Si\( f, \, g: S \to [0, \infty) \) son medibles entonces\( \int_S (f - g) \, d\mu = \int_S f \, d\mu - \int_S g \, d\mu \) siempre y cuando al menos una de las integrales de la derecha sea finita.

    Prueba

    Tomamos casos. Supongamos primero eso\( \int_S f \, d\mu \lt \infty \) y\( \int_S g \, d\mu \lt \infty \). Tenga en cuenta que\( (f - g)^+ \le f \) y\( (f - g)^- \le g \). Por el aumento de la propiedad para funciones no negativas,\( \int_S (f - g)^+ \, d\mu \le \int_S f \, d\mu \lt \infty \) y\( \int_S (f - g)^- \, d\mu \le \int_S g \, d\mu \lt \infty \). Así\( f - g \) es integrable. A continuación tenemos\( f - g = (f - g)^+ - (f - g)^- \) y por lo tanto\( f + (f - g)^- = g + (f - g)^+ \). Las cuatro funciones en la última ecuación son no negativas, y por lo tanto por propiedad de aditividad para funciones no negativas, tenemos\[ \int_S f \, d\mu + \int_S (f - g)^- \, d\mu = \int_S g \, d\mu + \int_S (f - g)^+ \, d\mu \] Todas estas integrales son finitas, y por lo tanto\[\int_S (f - g) \, d\mu = \int_S (f - g)^+ \, d\mu - \int_S (f - g)^- \, d\mu = \int_S f \, d\mu - \int_S g \, d\mu\]

    Siguiente supongamos que\( \int_S f \, d\mu = \infty \) y\( \int_S g \, d\mu \lt \infty \). Entonces\( f - g \le (f - g)^+ \) y por lo tanto\( f \le (f - g)^+ + g \). Usando la aditividad y aumentando las propiedades para funciones no negativas, tenemos\( \infty = \int_S f \, d\mu \le \int_S (f - g)^+ \, d\mu + \int_S g \, d\mu\). Ya\( \int_S g \, d\mu \lt \infty \) que debemos tener\( \int_S (f - g)^+ \, d\mu = \infty \). Por otro lado,\( (f - g)^- \le g \) así\( \int_S (f - g)^- \, d\mu \le \int_S g \, d\mu \lt \infty \). De ahí\( \int_S (f - g) \, d\mu = \infty = \int_S f \, d\mu - \int_S g \, d\mu \)

    Por último, supongamos que\( \int_S f \, d\mu \lt \infty \) y\( \int_S g \, d\mu = \infty \). Por el argumento del último párrafo, tenemos\( \int_S (g - f)^+ \, d\mu = \infty \) y\( \int_S (g - f)^- \, d\mu \lt \infty \). Equivalentemente,\( \int_S (f - g)^+ \, d\mu \lt \infty \) y\( \int_S (f - g)^- \, d\mu = \infty \). De ahí\( \int_S (f - g) \, d\mu = -\infty = \int_S f \, d\mu - \int_S g \, d\mu \).

    Finalmente tenemos las propiedades de linealidad en plena generalidad.

    Si\( f, \, g: S \to \R \) son funciones medibles cuyas integrales existen, y\( c \in \R \), entonces

    1. \( \int_S (f + g) \, d\mu = \int_S f \, d\mu + \int_S g \, d\mu \)siempre y cuando el lado derecho no sea de la forma\( \infty - \infty \).
    2. \( \int_S c f \, d \mu = c \int_S f \, d\mu \)
    Prueba
    1. Tenga en cuenta que\( f + g = (f^+ - f^-) + (g^+ - g^-) = (f^+ + g^+) - (f^- + g^-) \) y las dos funciones entre paréntesis en la última expresión no son negativas. Por el lema anterior y la propiedad de aditividad para funciones no negativas, tenemos\ begin {align}\ int_s (f + g)\, d\ mu & =\ int_s (f^+ + g^+)\, d\ mu -\ int_s (f^- + g^-)\, d\ mu\ & =\ left (\ int_s f^+\, d\ mu +\ int_s g^+\, d\ mu\ derecha) -\ izquierda (\ int_s f^-\, d\ mu +\ int_s g^-\, d\ mu\ derecha)\ end { align} asumiendo que ambas integrales en el primer paréntesis son finitas o ambas integrales en el segundo paréntesis son finitas. En cualquier caso, podemos agrupar los términos (sin preocuparnos por lo temido\( \infty - \infty \)) para obtener\[ \int_S (f + g) \, d\mu = \left(\int_S f^+ \, d\mu - \int_S f^- \, d\mu \right) + \left(\int_S g^+ \, d\mu - \int_S g^- \, d\mu \right) = \int_S f \, d\mu + \int_S g \, d\mu \]
    2. Tenga en cuenta que si\( c \ge 0 \) entonces\( (c f)^+ = c f^+ \) y\( (c f)^- = c f^- \). De ahí el uso de la propiedad de escalado para funciones no negativas,\[ \int_S c f \, d\mu = \int_S (c f)^+ \, d\mu - \int_S (c f)^- \, d\mu = \int_S c f^+ \, d\mu - \int _S c f^- \, d\mu = c \int_S f^+ \, d\mu - c \int_S f^- \, d\mu = c \int_S f \, d\mu \] Por otro lado, si\( c \lt 0 \),\( (c f)^+ = - c f^- \) y\( (c f)^- = - c f^+ \). Nuevamente usando la propiedad de escalado para funciones no negativas,\[ \int_S c f \, d\mu = \int_S (c f)^+ \, d\mu - \int_S (c f)^- \, d\mu = \int_S - c f^- \, d\mu - \int _S -c f^+ \, d\mu = - c \int_S f^- \, d\mu + c \int_S f^+ \, d\mu = c \int_S f \, d\mu \]

    En particular, tenga en cuenta que si\( f \) y\( g \) son integrables, entonces también lo son\( f + g \) y\( c f \) para\( c \in \R \). Así, el conjunto de funciones integrables en\( (S, \mathscr{S}, \mu) \) forma un espacio vectorial, que se denota\( \mathscr{L}(S, \mathscr{S}, \mu) \). El\( \mathscr{L} \) es en honor a Henri Lebesgue, quien primero desarrolló la teoría. Este espacio vectorial, y otros relacionados, serán estudiados con más detalle en la sección de espacios funcionales.

    También tenemos la creciente propiedad en plena generalidad.

    Si\( f, \, g: S \to \R \) son funciones medibles cuyas integrales existen, y si están\( f \le g \) encendidas\( S \) entonces\( \int_S f \, d\mu \le \int_S g \, d\mu \)

    Prueba

    Podemos usar la prueba basada en la propiedad aditiva de (6). Primero\( g = f + (g - f) \) y\( g - f \ge 0 \) en adelante\( S \). Si\( \int_S f \, d\mu = -\infty \) entonces trivialmente,\( \int_S f \, d\mu \le \int_S g \, d\mu \). De lo contrario\( \int_S (g - f) \, d\mu \ge 0 \) y por tanto\( \int_S g \, d\mu = \int_S f \, d\mu + \int_S (g - f) \, d\mu \ge \int_S f \, d\mu \).

    La integral sobre un conjunto

    Ahora que hemos definido la integral de una función medible\( f \) sobre todo\( S \), hay una extensión natural a la integral de\( f \) más de un subconjunto medible

    Si\( f: S \to \R \) es medible y\( A \in \mathscr{S} \), definimos\[ \int_A f \, d\mu = \int_S \bs{1}_A f \, d\mu \] asumiendo que existe la integral a la derecha.

    Si\( f: S \to \R \) es una función medible cuya integral existe y\( A \in \mathscr{S} \), entonces la integral de\( f \) sobre\( A \) existe.

    Prueba

    Tenga en cuenta que\( \left(\bs{1}_A f\right)^+ = \bs{1}_A f^+ \) y\( \left(\bs{1}_A f\right)^- = \bs{1}_A f^- \). También\( \bs{1}_A f^+ \le f^+ \) y\( \bs{1}_A f^- \le f^- \). Si\( \int_S f \, d\mu \) existe, entonces cualquiera\( \int_S f^+ \, d\mu \lt \infty \) o\( \int_S f^- \, d\mu \lt \infty \). Por el aumento de la propiedad, se deduce que cualquiera\( \int_S \bs{1}_A f^+ \, d\mu \lt \infty \) o\( \int_S \bs{1}_A f^- \, d\mu \lt \infty \), así\( \int_A f \, d\mu \) existe.

    Por otro lado, es claramente posible\( \int_A f \, d\mu \) que exista para algunos\( A \in \mathscr{S} \), pero no\( \int_S f \, d\mu \).

    También podríamos pensar simplemente\( \int_A f \, d\mu \) como la integral de una función medible\( f: A \to \R \) sobre el espacio de medida\( (A, \mathscr{S}_A, \mu_A) \), dónde\( \mathscr{S}_A = \{ B \in \mathscr{S}: B \subseteq A\} = \{C \cap A: C \in \mathscr{S}\} \) está el\( \sigma \) álgebra de subconjuntos medibles de\( A \), y dónde\( \mu_A \) está la restricción de\( \mu \) a\( \mathscr{S}_A \). De ello se deduce que todas las propiedades esenciales se mantienen para integrales sobre\( A \): las propiedades de linealidad, las propiedades de orden y el teorema de convergencia monótona. La siguiente propiedad es una consecuencia simple de la propiedad aditiva general, y se conoce como propiedad aditiva para dominios disjuntos.

    Supongamos que\( f: S \to \R \) es una función medible cuya integral existe, y que\( A, \, B \in \mathscr{S} \) son desarticuladas. entonces\[ \int_{A \cup B} f \, d\mu = \int_A f \, d\mu + \int_B f \, d\mu \]

    Prueba

    Recordemos eso\( \bs{1}_{A \cup B} = \bs{1}_A + \bs{1}_B \). De ahí que por la propiedad aditiva y el resultado anterior,\[ \int_{A \cup B} f \, d\mu = \int_S \bs{1}_{A \cup B} f \, d\mu = \int_S \left(\bs{1}_A f + \bs{1}_B f\right) \, d\mu = \int_S \bs{1}_A f \, d\mu + \int_S \bs{1}_B f \, d\mu = \int_A f \, d\mu + \int_B f \, d\mu \]

    Por inducción, la propiedad aditiva se mantiene para una colección finita de dominios disjuntos. La extensión a una colección contablemente infinita de dominios disjuntos se considerará en la siguiente sección sobre propiedades de la integral.

    Casos Especiales

    Espacios Discretos

    Recordemos nuevamente que el espacio de medida\((S, \mathscr S, \#)\) es discreto si\(S\) es contable,\(\mathscr S\) es la colección de todos los subconjuntos de\(S\), y\( \# \) está contando la medida con\( \mathscr{S} \). Así todas las funciones\( f: S \to \R \) son medibles, y como veremos, las integrales con respecto a\( \# \) son simplemente sumas.

    Si\( f: S \to \R \) entonces\[ \int_S f \, d\# = \sum_{x \in S} f(x) \] siempre y cuando sea la suma de los términos positivos o la suma de los términos negativos en finito.

    Prueba

    La prueba es un argumento de bootstrapping.

    1. Supongamos primero que\(S\) es finito. En este caso, cada función\( f: S \to \R \) es simple y tiene la representación\( f = \sum_{x \in S} f(x) \bs{1}_x \) donde\( \bs{1}_x \) es una abreviatura de\( \bs{1}_{\{x\}} \). Así, el resultado se desprende de la definición de la integral.
    2. Siguiente supongamos que\(S\) es contable infinito y\(f: S \to [0, \infty)\). Let\( (A_1, A_2, \ldots) \) Ser una secuencia creciente de subconjuntos finitos de\( S \) con\( \bigcup_{i=1}^\infty A_i = S \). Definir\( f_n = \sum_{x \in A_n} f(x) \bs{1}_x \). Entonces\( (f_1, f_2, \ldots) \) es una secuencia creciente de funciones simples con\( f_n \to f \) as\( n \to \infty \). Así\[ \int_S f \, d\# = \lim_{n \to \infty} \int_S f_n \, d\# = \lim_{n \to \infty} \sum_{x \in A_n} f(x) \] Pero por definición, el último límite a la derecha es justo\( \sum_{x \in S} f(x) \).
    3. Por último considerar el caso general donde\(S\) es contable y\(f: S \to \R\). En este caso el resultado se desprende de la definición de la integral\( \int_S f \, d\# = \int_S f^+ \, d\# - \int_S f^- \, d\# \) siempre y cuando una de las integrales de la derecha sea finita. Por (b),\( \int_S f^+ \, d\# \) es la suma de los términos positivos y\( -\int_S f^- \, d\# \) es la suma de los términos negativos.

    Si la suma de los términos positivos y la suma de los términos negativos son finitas, entonces\( f \) es integrable con respecto a\( \# \), pero el término habitual del cálculo es que la serie\( \sum_{x \in S} f(x) \) es absolutamente convergente. El resultado se verá más familiar en el caso especial\( S = \N_+ \). Las funciones en\( S \) son simplemente secuencias, por lo que podemos usar la notación más familiar\( a_i \) en lugar de\( a(i) \) para una función\( a: S \to \R \). La parte (b) de la prueba (con\( A_n = \{1, 2, \ldots, n\} \)) es solo la definición de una serie infinita de términos no negativos como el límite de las sumas parciales: La\[ \sum_{i=1}^\infty a_i = \lim_{n \to \infty} \sum_{i=1}^n a_i \] parte (c) de la prueba es solo la definición de una serie infinita general\[ \sum_{i=1}^\infty a_i = \sum_{i=1}^\infty a_i^+ - \sum_{i=1}^\infty a_i^- \] siempre y cuando una de las series de la derecha sea finita. Nuevamente, cuando ambos son finitos, la serie es absolutamente convergente. En el cálculo también consideramos series condicionalmente convergentes. Esto significa que\( \sum_{i=1}^\infty a_i^+ = \infty \),\( \sum_{i=1}^\infty a_i^- = \infty \), pero\( \lim_{n \to \infty} \sum_{i=1}^n a_i \) existe en\( \R \). Tales series no tienen cabida en la teoría general de la integración. También, tal vez recuerde que tales series son patológicas en el sentido de que, dado cualquier número en\( \R^* \), existe un reordenamiento de los términos para que la serie reordenada converja al número dado.

    Las Integrales de Lebesgue y Riemann en\( \R \)

    Consideremos el espacio euclídeo unidimensional\( (\R, \mathscr{R}, \lambda) \) donde\( \mathscr{R} \) está el\( \sigma \) álgebra habitual de conjuntos medibles de Lebesgue y\( \lambda \) es la medida Lebesgue. La teoría desarrollada anteriormente se aplica, por supuesto, para la integral\( \int_A f \, d\mu \) de una función medible\( f: \R \to \R \) sobre un conjunto\( A \in \mathscr{R} \). No es de extrañar que en este caso especial, la teoría de la integración sea referida como integración Lebesgue en honor a nuestro buen amigo Henri Lebesgue, quien primero desarrolló la teoría.

    Por otro lado, ya tenemos una teoría de la integración sobre\( \R \), a saber, la integral de cálculo Riemann, llamada así por nuestro otro buen amigo Georg Riemann. Para una función\( f \) y dominio adecuados se denota\( A \) esta integral\( \int_A f(x) \, dx \), como todos recordamos del cálculo. ¿Cómo se relacionan las dos integrales? Como veremos, la integral de Lebesgue generaliza la integral Riemann.

    Para entender la conexión necesitamos revisar la definición de la integral de Riemann. Considere primero el caso estándar donde el dominio de integración es un intervalo cerrado y delimitado. Aquí están las definiciones preliminares que necesitaremos.

    Supongamos que\( f: [a, b] \to \R \), dónde\( a, \, b \in \R \) y\( a \lt b \).

    1. Una partición\( \mathscr{A} = \{A_i : i \in I\}\) de\( [a, b] \) es una colección finita de subintervalos disjuntos cuya unión es\( [a, b] \).
    2. La norma de una partición\( \mathscr{A} \) es\( \|A\| = \max\{\lambda(A_i): i \in I\} \), la longitud del subintervalo más grande de\( \mathscr{A} \).
    3. Un conjunto de puntos\( B = \{x_i: i \in I\}\) donde\( x_i \in A_i \) para cada uno\( i \in I \) se dice que está asociado con la partición\( \mathscr{A} \).
    4. La suma de Riemann\( f \) correspondiente a una partición\( \mathscr{A} \) y y un conjunto\( B \) asociado con\( \mathscr{A} \) es\[ R\left(f, \mathscr{A}, B\right) = \sum_{i \in I} f(x_i) \lambda(A_i) \]

    Tenga en cuenta que la suma de Riemann es simplemente la integral de la función simple\( g = \sum_{i \in I} f(x_i) \bs{1}_{A_i} \). Además, dado que\( A_i \) es un intervalo para cada uno\( i \in I \),\( g \) es una función de paso, ya que es constante en una colección finita de intervalos disjuntos. Además, nuevamente ya que\( A_i \) es un intervalo para cada uno\( i \in I \),\( \lambda(A_i) \) es simplemente la longitud del subintervalo\( A_i \), por lo que por supuesto la teoría de medidas per se no es necesaria para la integración de Riemann. Ahora para la definición del cálculo:

    \( f \)es Riemann integrable en\( [a, b] \) si existe\( r \in \R \) con la propiedad que por cada\( \epsilon \gt 0 \) existe\( \delta \gt 0 \) tal que si\( \mathscr{A} \) es una partición de\( [a, b] \) con\( \|A\| \lt \delta \) entonces\( \left| r - R\left(f, \mathscr{A}, B\right) \right| \lt \epsilon \) para cada conjunto de puntos\( B \) asociados con \( \mathscr{A} \). Entonces por supuesto definimos la integral por\[ \int_a^b f(x) \, dx = r\]

    Aquí está nuestro teorema principal de esta subsección.

    Si Riemann\( f: [a, b] \to \R \) es integrable\( [a, b] \) entonces Lebesgue\( f \) es integrable en\( [a, b] \) y\[ \int_{[a, b]} f \, d\lambda = \int_a^b f(x) \, dx \]

    Por otro lado, hay muchas funciones que son Lebesgue integrables pero no Riemann integrables. De hecho existen funciones indicadoras de este tipo, la más simple de las funciones desde el punto de vista de la integración de Lebesgue.

    Considerar la función\( \bs{1}_\Q \) donde como de costumbre,\( \Q \) es el conjunto de número racional en\( \R \). Entonces

    1. \( \int_\R \bs{1}_\Q \, d\lambda = 0 \).
    2. \( \bs{1}_Q \)no es Riemann integrable en ningún intervalo\( [a, b] \) con\( a \lt b \).
    Prueba

    La parte (a) se desprende de la definición de la integral de Lebesgue:\[ \int_\R \bs{1}_\Q \, d\lambda = \lambda(\Q) = 0 \] Para la parte (b), tenga en cuenta que hay números racionales e irracionales en cada intervalo\( \R \) de longitud positiva (los números racionales y los números irracionales son densos en\( \R \)). Así, dada cualquier partición\( \mathscr{A} = \{A_i: i \in I\} \) de\( [a, b] \), por pequeña que sea la norma, hay sumas de Riemann que son 0 (toman\(x_i \in A_i\) irracionales para cada uno\( i \in I \)), y las sumas de Riemann que son\( b - a \) (toman\( x_i \in A_i \) racionales para cada una\( i \in I \))

    El siguiente teorema fundamental completa el panorama.

    \( f: [a, b] \to \R \)es Riemann integrable en\( [a, b] \) si y solo si\( f \) está limitado\( [a, b] \) y\( f \) es continuo en casi todas partes en\( [a, b] \).

    Ahora que la integral de Riemann está definida para un intervalo delimitado cerrado, se puede extender a otros dominios.

    Ampliaciones de la integral de Riemann.

    1. Si\( f \) se define on\( [a, b) \) y Riemann integrable on\( [a, t] \) for\( a \lt t \lt b \), definimos\( \int_a^b f(x) \, dx = \lim_{t \uparrow b} \int_a^t f(x) \, dx \) si el límite existe en\( \R^* \).
    2. Si\( f \) se define on\( (a, b] \) y Riemann integrable on\( [t, b] \) for\( a \lt t \lt b \), definimos\( \int_a^b f(x) \, dx = \lim_{t \downarrow a} \int_t^b f(x) \, dx \) si el límite existe en\( \R^* \).
    3. Si\( f \) se define on\( (a, b) \), seleccionamos\( c \in (a, b) \) y definimos\( \int_a^b f(x) \, dx = \int_a^c f(x) \, dx + \int_c^b f(x), \, dx \) si las integrales de la derecha existen en\( \R^* \) por (a) y (b), y no son de la forma\( \infty - \infty \).
    4. Si\( f \) se define una\( [a, \infty) \) y Riemann integrable en\( [a, t] \) para\( a \lt t \lt \infty \) definimos\( \int_a^\infty f(x) \, dx = \lim_{t \to \infty} \int_a^t f(x) \, dx \).
    5. si\( f \) se define on\( (-\infty, b] \) y Riemann integrable on\( [t, b] \) para\( -\infty \lt t \lt b \) definimos\( \int_{-\infty}^b f(x) \, dx = \lim_{t \to -\infty} \int_t^b f(x) \, dx \) si el límite existe en\( \R^* \)
    6. si\( f \) se define en\( \R \) seleccionamos\( c \in \R \) y definimos\( \int_{-\infty}^\infty f(x) \, dx = \int_{-\infty}^c f(x) \, dx + \int_c^\infty f(x) \, dx \) si ambas integrales a la derecha existen por (d) y (e), y no son de la forma\( \infty - \infty \).
    7. La integral se define para un dominio que es la unión de una colección finita de intervalos disjuntos por el requisito de que la integral sea aditiva sobre dominios disjuntos

    Como otro indicio de su superioridad, señalar que ninguna de estas circunvoluciones es necesaria para la integral de Lebesgue. De una vez por todas, hemos definido\( \int_A f(x) \, dx \) para una función general mensurable\( f: \R \to \R \) y un dominio general\( A \in \mathscr{R} \)

    La Integral Lebesgue-Stieltjes

    Consideremos de nuevo el espacio medible\( (\R, \mathscr{R}) \) donde\( \mathscr{R} \) se encuentra el habitual\( \sigma \) -álgebra de los subconjuntos medibles de Lebesgue de\( \R \). Supongamos que\( F: \R \to \R \) es una función de distribución general, de manera que por definición,\( F \) es creciente y continua desde la derecha. Recordemos que la medida de Lebesgue-Stieltjes\( \mu \) asociada a\( F \) es la medida única sobre la\( \mathscr{R} \) que satisface\[ \mu(a, b] = F(b) - F(a); \quad a, \, b \in \R, \; a \lt b \] Recall que\( F \) satisface algunas, pero no necesariamente todas las propiedades de una función de distribución de probabilidad. Las propiedades no necesariamente satisfechas son las propiedades normalizantes

    • \( F(x) \to 0 \)como\( x \to -\infty \)
    • \( F(x) \to 1 \)como\( x \to \infty \)

    Si\( F \) satisface estas dos propiedades adicionales, entonces\( \mu \) es una medida de probabilidad y\( F \) su función de distribución de probabilidad.

    La integral con respecto a la medida\( \mu \) es, apropiadamente, referida como la integral Lebesgue-Stieltjes con respecto a\( F \), y al igual que la medida, lleva el nombre del ubicuo Henri Lebesgue y por Thomas Stieltjes. Además de nuestra notación habitual\( \int_S f \, d\mu \), también se denota la integral Lebesgue-Stieltjes\( \int_S f \, dF\) y\(\int_S f(x) \, dF(x) \).

    Espacios de Probabilidad

    Supongamos que\( (S, \mathscr{S}, \P) \) es un espacio de probabilidad, de modo que ese\( S \) es el conjunto de resultados de un experimento aleatorio,\( \mathscr{S} \) es la\( \sigma \) -álgebra de eventos, y\( \P \) la medida de probabilidad en el espacio muestral\((S, \mathscr S)\). Una función medible de valor real\( X \) en\( S \) es, por supuesto, una variable aleatoria de valor real. La integral con respecto a\( \P \), si existe, es el valor esperado de\( X \) y se denota\[ \E(X) = \int_S X \, d\P \] Este concepto es de fundamental importancia en la teoría de la probabilidad y se estudia en detalle en un capítulo separado sobre Valor Esperado, principalmente desde un punto de vista elemental que no implica integración abstracta. Sin embargo, una sección avanzada trata el valor esperado como una integral sobre la medida de probabilidad subyacente, como se indicó anteriormente.

    Supongamos a continuación que\( (T, \mathscr T, \#) \) es un espacio discreto y que\( X \) es una variable aleatoria para el experimento, tomando valores adentro\( T \). En este caso\( X \) tiene una distribución discreta y la función\( f \) de densidad de probabilidad de\( X \) está dada por\( f(x) = \P(X = x) \) for\( x \in T \). De manera más general,\[ \P(X \in A) = \sum_{x \in A} f(x) = \int_A f \, d\#, \quad A \subseteq T \] por otro lado, supongamos que\( X \) se trata de una variable aleatoria con valores en\( \R^n \), donde como de costumbre,\( (\R^n, \mathscr R_n, \lambda_n) \) es\( n \) -dimensional espacio euclídeo. Si\( X \) tiene una distribución continua, entonces\( f: T \to [0, \infty) \) es una función de densidad de probabilidad de\( X \) si\[ \P(X \in A) = \int_A f \, d\lambda_n, \quad A \in \mathscr R^n \] Técnicamente,\( f \) es la función de densidad de\( X \) con respecto a la medida de conteo\( \# \) en el caso discreto, y\( f \) es la función de densidad de \( X \)con respecto a la medida Lebesgue\( \lambda_n \) en el caso continuo. En ambos casos, la probabilidad de un evento\( A \) se calcula integrando la función de densidad, con respecto a la medida apropiada, sobre\( A \). Todavía hay diferencias, sin embargo. En el caso discreto, se garantiza la existencia de la función de densidad con respecto a la medida de conteo, y de hecho tenemos una fórmula explícita para ello. En el caso continuo, no se garantiza la existencia de una función de densidad respecto a la medida de Lebesgue, y de hecho podría no haber una. De manera más general, supongamos que tenemos un espacio de medida\( (T, \mathscr{T}, \mu) \) y una variable aleatoria\( X \) con valores en\( T \). Una función medible\( f: T \to [0, \infty) \) es una función de densidad de probabilidad de\( X \) (o más precisamente, la distribución de\( X \)) con respecto a\( \mu \) si\[ \P(X \in A) = \int_A f \, d\mu, \quad A \in \mathscr{T} \] Esta cuestión fundamental de la existencia de una función de densidad se aclarará en la sección sobre continuidad absoluta y funciones de densidad.

    Supongamos nuevamente que\( X \) es una variable aleatoria de valor real con función de distribución\( F \). Entonces, por definición, la distribución de\( X \) es la medida de Lebesgue-Stieltjes asociada a\( F \):\[ \P(a \lt X \le b) = F(b) - F(a), \quad a, \, b \in \R, \; a \lt b \] independientemente de si la distribución es discreta, continua o mixta. Trivialmente,\( \P(X \in A) = \int_S \bs{1}_A \, dF \) para\( A \in \mathscr R \) y el valor esperado de\( X \) definido anteriormente también se puede escribir como\( \E(X) = \int_\R x \, dF(x) \). Nuevamente, todo esto se explicará con mucho más detalle en el próximo capítulo sobre Valor Esperado.

    Ejercicios Computacionales

    Dejemos\( g(x) = \frac{1}{1 + x^2} \) para\( x \in \R \).

    1. Encuentra\( \int_{-\infty}^\infty g(x) \, dx \).
    2. Demostrar que\( \int_{-\infty}^\infty x g(x) \, dx \) no existe.
    Contestar
    1. \(\int_{-\infty}^\infty g(x) \, dx = \pi \)
    2. \( \int_0^\infty x g(x) \, dx = \infty \),\( \int_{-\infty}^0 x g(x) \, dx = -\infty \)

    Tal vez recuerde que la función\( g \) en el último ejercicio es importante en el estudio de la distribución de Cauchy, llamada así por Augustin Cauchy. También puedes recordar que la gráfica de\( g \) es conocida como la bruja de Agnesi, llamada así por Maria Agnesi.

    Let\( g(x) = \frac{1}{x^b} \) para\( x \in [1, \infty) \) donde\( b \gt 0 \) es un parámetro. Encuentra\( \int_1^\infty g(x) \, dx \)

    Contestar

    \(\int_1^\infty g(x) \, dx = \begin{cases} \infty, & 0 \lt b \le 1 \\ \frac{1}{b - 1}, & b \gt 1 \end{cases} \)

    Tal vez recuerde que la función\( g \) en el último ejercicio es importante en el estudio de la distribución de Pareto, llamada así por Vilfredo Pareto.

    Supongamos que\( f(x) = 0 \) si\( x \in \Q \) y\( f(x) = \sin(x) \) si\( x \in \R - \Q \).

    1. Encuentra\( \int_{[0, \pi]} f(x) \, d\lambda(x) \)
    2. ¿\( \int_0^\pi f(x) \, dx\)Existe?
    Contestar
    1. 2
    2. No

    This page titled 3.10: La Integral con respecto a una Medida is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.