Saltar al contenido principal
LibreTexts Español

Fuente

  • Page ID
    118536
    • Bob Dumas and John E. McCarthy
    • University of Washington and Washington University in St. Louis
    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    CAPÍTULO 0

    Introducción

    Por qué este libro es

    Hoy en día más estudiantes que nunca toman cálculo en la preparatoria. Esto tiene un costo, sin embargo: cada vez menos toman un curso riguroso en geometría euclidiana. Además, el curso de cálculo que toman casi todos los estudiantes, ya sea en la preparatoria o en la universidad, evita pruebas, y muchas veces ni siquiera da una definición formal de límite. En efecto, algunos estudiantes ingresan a la universidad nunca habiendo leído o escrito una prueba por inducción, ni se encontraron con una prueba matemática de ningún tipo.

    Como consecuencia, los profesores de los cursos de matemáticas de grado superior en álgebra lineal, álgebra abstracta, análisis y topología tienen que trabajar extremadamente duro inculcando el concepto de prueba mientras simultáneamente tratan de cubrir el plan de estudios. Este problema se ha abordado en muchas universidades introduciendo un curso puente, con un título como “Fundamentos para las Matemáticas Superiores”, tomado por estudiantes que han completado la secuencia regular de cálculo. Algunos de estos estudiantes planean convertirse en carreras de matemáticas. Otros solo quieren aprender algunas matemáticas más; pero si a lo que están expuestos es interesante y satisfactorio, muchos optarán por especializarse o doblarse en matemáticas.

    Este libro está escrito para estudiantes que han tomado cálculo y quieren aprender qué es la “matemática real”. Esperamos que encuentre el material atractivo e interesante, y que se le anime a aprender matemáticas más avanzadas.

    Qué es este libro

    El propósito de este libro es introducirte en la cultura, el lenguaje y el pensamiento de los matemáticos. Decimos “matemáticos”, no “matemáticas”, para enfatizar que las matemáticas son, en el fondo, un esfuerzo humano. Si hay vida inteligente en Erewhemos, entonces los erewhemosianos seguramente estarán de acuerdo en eso\(2+2=4\). Si han pensado detenidamente en la pregunta, no creerán que la raíz cuadrada de dos pueda estar exactamente dada por la proporción de dos números enteros, o que haya finitamente muchos números primos. Sin embargo, sólo podemos especular sobre si encontrarían estas últimas preguntas remotamente interesantes o qué podrían considerar satisfactorias respuestas a preguntas de este tipo.

    Los matemáticos, después de milenios de luchas y argumentos, han llegado a un acuerdo generalizado (si no del todo universal) sobre lo que constituye un argumento matemático aceptable. A esto lo llaman “prueba”, y constituye un argumento cuidadosamente razonado basado en premisas pactadas. La metodología de las matemáticas ha sido espectacularmente exitosa, y ha generado muchos otros campos. En el siglo XX, la programación informática y la estadística aplicada se desarrollaron a partir de ramificaciones de las matemáticas a disciplinas propias. En el siglo XIX, también lo hicieron la astronomía y la física. La creciente disponibilidad de datos hace que el tratamiento de los datos de una manera matemática sofisticada sea uno de los grandes retos científicos del siglo XXI.

    En este libro, trataremos de enseñarte qué es una prueba: qué nivel de argumento se considera convincente, qué se considera exagerado y qué nivel de detalle se considera demasiado. Intentaremos enseñarte cómo piensan los matemáticos, qué estructuras utilizan para organizar sus pensamientos. Una estructura es como un esqueleto - si quitas los detalles inesenciales puedes concentrarte en el problema real. Un gran ejemplo de ello es la idea del número, la estructura matemática humana más temprana. Si aprendes a contar manzanas, y que dos manzanas más dos manzanas hacen cuatro manzanas, y si piensas que se trata de manzanas en lugar de contar, entonces todavía no sabes qué hacen dos ovejas más dos ovejas. Pero una vez que te das cuenta de que hay una estructura subyacente de número, y que dos más dos son cuatro en abstracto, entonces agregar lana o piernas a los objetos no cambia la aritmética.

    Lo que este libro no es

    Existe un enfoque para impartir un curso de transición que muchos instructores favorecen. Es tener un curso de resolución de problemas, en el que los alumnos aprendan a escribir pruebas en un contexto donde su intuición pueda ayudar, como en combinatoria o teoría de números. Esto ayuda a que el curso sea interesante, y puede evitar que los estudiantes se pierdan por completo.

    No hemos adoptado este enfoque. Nuestra razón es que además de enseñar la habilidad de escribir una prueba lógica, también queremos enseñar la habilidad de analizar cuidadosamente las definiciones. Gran parte del trabajo del instructor en un curso de álgebra o análisis de división superior consiste en obligar a los estudiantes a leer atentamente las definiciones de objetos nuevos y desconocidos, decidir qué objetos matemáticos satisfacen la definición y cuáles no, y entender qué sigue “inmediatamente” de la definiciones. En efecto, la principal razón por la que la definición épsilon-delta de límite ha desaparecido de la mayoría de los cursos introductorios de cálculo es la dificultad de explicar cómo los cuantificadores\(\forall \varepsilon \exists \delta\), precisamente en este orden, dan la noción exacta de límite por la que nos estamos esforzando. Así, si bien los estudiantes deben trabajar más duro en este curso para aprender más matemáticas abstractas, estarán mejor preparados para cursos avanzados.

    Tampoco se trata de un texto en la lógica aplicada. Los primeros capítulos del libro introducen al estudiante a las estructuras matemáticas básicas a través de definiciones formales. Aunque brindamos un tratamiento bastante formal de la lógica de primer orden y la inducción matemática, nuestro objetivo es pasar a estructuras y argumentos matemáticos clásicos más avanzados tan pronto como el estudiante tenga una comprensión adecuada de la lógica subyacente a las pruebas matemáticas.

    Asesoría al Alumno

    ¡Bienvenido a las matemáticas superiores! Si tu exposición a las matemáticas universitarias se limita al cálculo, este libro probablemente parecerá muy diferente de tus textos anteriores. Muchos estudiantes aprenden cálculo escaneando rápidamente el texto y procediendo directamente a los problemas. Al luchar con un problema, buscan problemas similares en el texto, e intentan emular la solución que encuentran. Por último, revisan la solución, que generalmente se encuentra al dorso del texto, para “validar” la metodología.

    Este libro, como muchos textos que abordan temas más avanzados, no está escrito pensando en problemas computacionales. Nuestro objetivo es introducirte en los diversos elementos de las matemáticas de pregrado superior: la cultura, el lenguaje, los métodos, los temas, los estándares y los resultados. Los problemas en estos cursos son probar verdaderas afirmaciones matemáticas, o refutar afirmaciones falsas. En el contexto del cálculo, el matemático debe probar los resultados que utilizó libremente. Para la mayoría de la gente, esta actividad parece muy diferente a la computación. Por ejemplo, probablemente te resulte necesario pensar en un problema durante algún tiempo antes de comenzar a escribir. A diferencia del cálculo, en el que la dirección general de los métodos suele ser obvia, tratar de probar afirmaciones matemáticas puede parecer sin dirección o accidental. Sin embargo, es más estratégico que aleatorio. Este es uno de los grandes retos de las matemáticas en los niveles superiores, es creativo, no de memoria. Con la práctica y el pensamiento disciplinado, aprenderás a ver tu manera de probar afirmaciones matemáticas.

    Comenzaremos nuestro tratamiento de las matemáticas superiores con un gran número de definiciones. Esto es habitual en un curso de matemáticas, y es necesario porque las matemáticas requieren una expresión precisa. Trataremos de motivar estas definiciones para que su utilidad sea obvia lo antes posible. Después de presentar y discutir algunas definiciones, presentaremos argumentos para algunas afirmaciones elementales relativas a estas definiciones. Esto nos dará algo de práctica en la lectura, escritura y discusión de las matemáticas. En los primeros capítulos del libro incluimos numerosas discusiones y comentarios para ayudarle a comprender la dirección básica de los argumentos. En los capítulos posteriores del libro, leerás argumentos más difíciles para algunos resultados clásicos profundos. Te recomendamos que leas estos argumentos deliberadamente para asegurar tu comprensión profunda del argumento y nutrir tu sentido del nivel de detalle y rigor que se espera en una prueba matemática de pregrado.

    Al final de cada capítulo hay ejercicios diseñados para dirigir tu atención a la lectura y obligarte a pensar en los detalles de las pruebas. Algunos de estos ejercicios son sencillos, pero muchos de ellos son muy duros. No esperamos que cada alumno sea capaz de resolver todos los problemas. No obstante, pasar una hora (o más) pensando en un problema difícil es tiempo bien empleado aunque no resuelvas el problema: fortalece tus músculos matemáticos, y te permite apreciar, y entender más profundamente, la solución si finalmente se te muestra. En última instancia, podrás resolver algunos de los problemas difíciles tú mismo después de pensarlos profundamente. ¡Entonces serás un verdadero matemático!

    Las matemáticas son, desde un punto de vista, un ejercicio lógico. Definimos objetos que no existen físicamente, y utilizamos la lógica para sacar las conclusiones más profundas que podamos sobre estos objetos. Si este fuera el final de la historia, las matemáticas no serían más que un juego, y serían de poco interés perdurable. Ocurre, sin embargo, que interpretar objetos físicos, procesos, comportamientos y otros sujetos de interés intelectual, como objetos matemáticos, y aplicar las conclusiones y técnicas del estudio de estos objetos matemáticos, nos permite extraer conclusiones confiables y poderosas sobre prácticas problemas. Este método de usar las matemáticas para entender el mundo se llama modelización matemática. El mundo en el que vives, la forma en que entiendes este mundo, y cómo se diferencia del mundo y la comprensión de tus ancestros lejanos, es en gran medida el resultado de la investigación matemática. En este libro, tratamos de explicar cómo sacar conclusiones matemáticas con certeza. Cuando estudiaste cálculo, utilizaste numerosos teoremas profundos para sacar conclusiones que de otra manera podrían haber tomado meses en lugar de minutos. Ahora vamos a desarrollar una comprensión de cómo se derivan los resultados de esta profundidad y poder.

    Asesoría al Instructor

    Aprender terminología - qué significan “contrapositivo” y “conversar” - llega fácilmente a la mayoría de los estudiantes. Tu reto en el curso es enseñarles a leer las definiciones de cerca, y luego cómo manipularlas. Esto es mucho más difícil cuando no hay una imagen concreta que los estudiantes puedan tener en cuenta. Los vectores en\(\mathbb{R}^{n}\), por ejemplo, son más intimidantes que en\(\mathbb{R}^{3}\), no por ningún gran aumento inherente en la complejidad, sino porque son más difíciles de pensar geométricamente, por lo que los estudiantes deben confiar solo en el álgebra. Esta confianza lleva tiempo para construir.

    El capítulo 1 consiste principalmente en establecer la notación y discutir conceptos necesarios que algunos pueden haber visto ya (como inyecciones y suryecciones). Desafortunadamente esta puede ser la primera exposición a algunas de estas ideas para muchos estudiantes, por lo que el tratamiento es bastante largo. La velocidad a la que se cubra el material de forma natural dependerá de la fuerza y los antecedentes de los alumnos. Tómate un tiempo explicando por qué una secuencia puede pensarse como una función con dominio\(\mathbb{N}\); las variaciones de esta idea volverán a repetirse.

    El capítulo 2 introduce las relaciones. Éstas son difíciles de entender, debido a la naturaleza abstracta de la definición. Las equivalencias y ordenamientos lineales se repiten a lo largo del libro, y la comodidad de los estudiantes con estos aumentará.

    Ni el Capítulo 1 ni el Capítulo 2 habitan en las pruebas. De hecho, las pruebas matemáticas y la lógica elemental de primer orden no se introducen hasta el Capítulo 3. Nuestro objetivo es hacer que el estudiante piense en las estructuras y definiciones matemáticas sin el peso psíquico adicional de las pruebas de lectura y escritura. Usamos ejemplos para ilustrar las definiciones. Los primeros Capítulos proporcionan fundamentos conceptuales básicos para capítulos posteriores, y encontramos que la mayoría de los estudiantes tienen las manos ocupadas solo tratando de leer y entender las definiciones y ejemplos. En los ejercicios pedimos a los alumnos que “muestren” la verdad de algunas afirmaciones matemáticas. Nuestra intención es hacer que el estudiante piense en la tarea de probar afirmaciones matemáticas. No se espera que escriban argumentos exitosos antes del Capítulo 3. Animamos a los estudiantes a intentar los problemas aunque probablemente no estén seguros sobre los requisitos para una prueba matemática. Si cree firmemente que las pruebas matemáticas deben discutirse antes de lanzarse a definiciones matemáticas, puede cubrir primero el Capítulo 3.

    El capítulo 3 es bastante formal, y debe ir rápido. El capítulo 4 introduce a los estudiantes a la primera técnica de prueba importante: la inducción. Con la práctica, se puede esperar que dominen esta técnica. También introducimos como tema continuo el estudio de polinomios, y demostramos por ejemplo que un polinomio no tiene más raíces que su grado.

    Los capítulos 5,6 y 7 son completamente independientes entre sí. El capítulo 5 trata los límites y la continuidad, hasta demostrar que el límite uniforme de una secuencia de funciones continuas es continuo. El capítulo 6 es sobre conjuntos infinitos, demostrando los teoremas de Cantor y el teorema de Schröder-Bernstein. Al final del capítulo, los alumnos habrán llegado a apreciar que generalmente es mucho más fácil construir dos inyecciones que ¡una biyección!

    El capítulo 7 contiene una pequeña teoría de números, hasta la prueba del pequeño teorema de Fermat. Luego muestra cuánto de la estructura se transfiere al álgebra de polinomios reales.

    El capítulo 8 construye los números reales, usando cortes Dedekind, y demuestra que tienen la menor propiedad de límite superior. Esto se utiliza entonces para probar los teoremas básicos del análisis real: el teorema del Valor Intermedio y el Teorema del Valor Extremo. Las secciones\(8.1\) a través\(8.4\) requieren únicamente Capítulos\(1-4\) y Sección 6.1. Las secciones\(8.5-8.8\) requieren Secciones\(5.1\) y 5.2. Sección\(8.9\) requiere Capítulo 6.

    En el Capítulo 9, introducimos los números complejos. Secciones\(9.1\)\(9.3\) prueban la fórmula Tartaglia-Cardano para encontrar las raíces de un cúbico, y señalan cómo es necesario usar números complejos incluso para encontrar raíces reales de cubiceros reales. Estas secciones requieren únicamente los Capítulos 1 - 4. En Sección\(9.4\) probamos el Teorema Fundamental del Álgebra. Esto requiere el Capítulo 5 y el teorema de Bolzano-Weierstrass de la Sección 8.6.

    ¿Qué es un curso razonable basado en este libro? Los capítulos 1 a 4 son esenciales para cualquier curso. En un curso de un cuarto, también se podría abarcar el Capítulo 6 y bien el Capítulo 5 o el 7. En un curso de un semestre, uno podría abarcar Capítulos\(1-6\) y uno de los tres capítulos restantes. El Capítulo 9 puede cubrirse sin el Capítulo 8 si uno está dispuesto a afirmar la propiedad del Límite Mínimo Superior como axioma de los números reales, y entonces la Sección\(8.6\) puede cubrirse antes de la Sección\(9.4\) sin ningún otro material del Capítulo 8.

    Te sugerimos que estés de acuerdo con tus compañeros en un plan de estudios común para este curso, para que los temas que cubras a fondo (por ejemplo, cardinalidad) no tengan que repetirse en cursos sucesivos.

    Este curso de transición se está convirtiendo en uno de los cursos más importantes del plan de estudios de matemáticas, y el primer curso importante para la especialidad de matemáticas. Para el estudiante talentoso e intelectualmente discriminante de primer o segundo año los cursos iniciales estándar en el plan de estudios de matemáticas -cálculo, ecuaciones diferenciales, álgebra matricial- proporcionan poco incentivo para estudiar matemáticas. En efecto, hay pocas matemáticas en estos cursos, y menos aún con la evolución de los planes de estudios de pregrado inferior hacia el servicio de las ciencias y la ingeniería. Esto es particularmente inquietante ya que se refiere al talentoso estudiante que aún no se ha decidido por una especialización y puede que nunca haya considerado las matemáticas. Creemos que se debe alentar a los mejores estudiantes a tomar este curso lo antes posible, incluso concurrente con el cálculo del segundo semestre o tercer trimestre del primer año. No es solo para ayudar a futuros estudiantes de matemáticas, sino que también puede servir un valioso papel en reclutarlos, al permitir que los estudiantes inteligentes vean que las matemáticas son desafiantes y, más al grano, interesantes y profundas. La matemática es su mejor apologista. Exponga a los estudiantes temprano al pensamiento y resultados matemáticos auténticos y déjelos tomar una decisión informada. Puede ser una sorpresa para algunos, pero los buenos estudiantes aún buscan lo que los matemáticos buscaban como estudiantes: la satisfacción de dominar una disciplina difícil, interesante y útil.

    Agradecimientos

    Hemos recibido mucha ayuda en la redacción de este libro. Además del apoyo de nuestras familias, hemos recibido valiosos consejos y comentarios de nuestros estudiantes y colegas, y de los revisores del manuscrito. En particular nos gustaría agradecer a Matthew Valeriote por muchas discusiones útiles, y a Alexander Méndez por dibujar todas las figuras del libro. CAPÍTULO 1

    Preliminares

    Para comunicar las matemáticas necesitarás entender y acatar las convenciones de los matemáticos. En este capítulo revisamos algunas de estas convenciones.

    1. “Y” “O”

    Las declaraciones son oraciones declarativas; es decir, una declaración es una oración que es verdadera o falsa. Los matemáticos hacen declaraciones matemáticas - oraciones sobre matemáticas que son verdaderas o falsas. Por ejemplo, la declaración:

    “Todos los números primos, excepto el número 2, son impares”.

    es una verdadera declaración. El enunciado:\[" 3<2 . "\] es falso.

    Utilizamos conectivos de lenguaje natural para combinar declaraciones matemáticas. Los conectivos “y” y “o” tienen un uso particular en la prosa matemática. Dejar\(P\) y\(Q\) ser declaraciones matemáticas. El enunciado\[P \text { and } Q\] es la afirmación de que ambos\(P\) y\(Q\) son ciertos.

    Los matemáticos utilizan lo que se llama el “inclusivo o”. En el uso cotidiano la afirmación\(Q\) "\(P\)o" a veces puede significar que exactamente una (pero no ambas) de las afirmaciones\(P\) y\(Q\) es verdadera. En matemáticas, la afirmación\[P \text { or } Q\] es verdadera cuando una o ambas declaraciones son verdaderas, es decir, cuando se mantiene alguna de las siguientes:

    \(P\)es verdadero y\(Q\) es falso.

    \(P\)es falso y\(Q\) es cierto.

    \(P\)es verdad y\(Q\) es verdad.

    Sets

    Intuitivamente, un conjunto matemático es una colección de objetos matemáticos. Desafortunadamente esta sencilla caracterización de conjuntos, manejados descuidadamente, da lugar a contradicciones. Algunas colecciones resultarán no tener las propiedades que exigimos de conjuntos matemáticos. Un ejemplo de cómo esto puede ocurrir se presenta en la Sección 1.7. Aquí no vamos a desarrollar la teoría formal de conjuntos desde cero. En cambio, asumiremos que ciertos conjuntos de bloques de construcción son conocidos, y describir formas de construir nuevos conjuntos a partir de estos bloques de construcción.

    Nuestros bloques de construcción iniciales serán los conjuntos de números naturales, enteros, números racionales y números reales. En el Capítulo 8, mostraremos cómo construir todos estos a partir de los números naturales. Sin embargo, no se puede ir mucho más allá de esto: para hacer matemáticas, hay que comenzar con axiomas que aseveran que existe el conjunto de números naturales.

    Definición. Elemento,\(\in\) Si\(X\) es un conjunto y\(x\) es un objeto en\(X\), decimos que\(x\) es un elemento, o miembro, de\(X\). Esto está escrito\[x \in X .\] Escribimos\(x \notin X\) si no\(x\) es miembro de\(X\).

    Existen numerosas formas de definir conjuntos. Si un conjunto tiene pocos elementos, puede definirse listando. Por ejemplo,\[X=\{2,3,5,7\}\] es el conjunto de los primeros cuatro números primos. A falta de cualquier otra indicación, se supone que un conjunto definido por una lista tiene como elementos solo los objetos de la lista. Para conjuntos con demasiados elementos para enumerar, debemos proporcionar al lector un medio para determinar la pertenencia al conjunto. El autor puede informar al lector que no se han enumerado todos los elementos del conjunto, sino que se ha proporcionado suficiente información para que el lector identifique un patrón para determinar la pertenencia al conjunto. Por ejemplo, let\[X=\{2,4,6,8, \ldots, 96,98\} .\] Entonces\(X\) es el conjunto de enteros pares positivos menores a 100. Sin embargo, el uso de puntos suspensivos para definir un conjunto puede no funcionar siempre: asume que el lector identificará el patrón que desea caracterizar. Aunque esto suele funcionar, conlleva el riesgo de que el lector no pueda identificar correctamente el patrón pretendido por el autor.

    Algunos conjuntos son tan importantes que tienen nombres estándar y anotaciones que necesitarás conocer.

    Notación. Números naturales,\(\mathbb{N}\) Los números naturales son los elementos del conjunto\[\{0,1,2,3, \ldots\} .\] Este conjunto se denota por\(\mathbb{N}\).

    Cuidado: Muchos autores llaman\(\{1,2,3, \ldots\}\) al conjunto de números naturales. Esto es una cuestión de definición, y no hay convención universal; los logísticos tienden a favorecer nuestra convención, y los algebraistas el otro. En este libro, utilizaremos\(\mathbb{N}^{+}\) para denotar\(\{1,2,3, \ldots\}\).

    NOTACIÓN. \(\mathbb{N}^{+} \mathbb{N}^{+}\)es el conjunto de enteros positivos,\[\{1,2,3, \ldots\} \text {. }\] NOTACIÓN. Enteros,\(\mathbb{Z} \mathbb{Z}\) es el conjunto de enteros,\[\{\ldots,-3,-2,-1,0,1,2,3, \ldots\} \text {. }\] NOTACIÓN. Números racionales,\(\mathbb{Q} \mathbb{Q}\) es el conjunto de números racionales,\[\left\{\frac{p}{q} \text { where } p, q \in \mathbb{Z} \text { and } q \neq 0\right\} \text {. }\] NOTACIÓN. Números reales,\(\mathbb{R} \mathbb{R}\) es el conjunto de números reales. Una buena comprensión de los números reales requiere un poco de desarrollo matemático. De hecho, fue sólo en el siglo XIX cuando realmente llegamos a una comprensión moderna de\(\mathbb{R}\). Tendremos mucho que decir sobre los números reales del Capítulo 8.

    DEFINICIÓN. Un número\(x\) es positivo si\(x>0\). Un número no\(x\) es negativo si\(x \geq 0\).

    NOTACIÓN. \(X^{+}\)Si\(X\) es un conjunto de números reales, usamos\(X^{+}\) para los números positivos en el conjunto\(X\).

    La notación que hemos presentado para estos conjuntos es ampliamente utilizada. Presentamos una convención final para los nombres de conjuntos que no es tan ampliamente reconocida, pero que es útil para la teoría de conjuntos.

    NOTACIÓN. \(\ulcorner n\urcorner\)es el conjunto de todos los números naturales menores que\(n\):\[\ulcorner n\urcorner=\{0,1,2, \ldots, n-1\} .\] Un propósito de esta notación es asociar canónicamente cualquier número natural\(n\) con un conjunto que tenga exactamente\(n\) elementos.

    El lector debe tener en cuenta que no hemos definido los conjuntos anteriores. Estamos asumiendo que estás familiarizado con ellos, y algunas de sus propiedades, en virtud de tu experiencia previa en matemáticas. Eventualmente definiremos los conjuntos sistemáticamente en el Capítulo\(8 .\)

    Un método más preciso para definir un conjunto es utilizar condiciones inequívocas que caractericen la pertenencia al conjunto.

    Notación. \(\{x \in X \mid P(x)\}\)Dejar\(X\) ser un conjunto (previamente definido), y dejar\(P(x)\) ser una condición o propiedad. Entonces el conjunto\[Y=\{x \in X \mid P(x)\}\] es el conjunto de elementos en los\(X\) que cumplen condición\(P\). El conjunto\(X\) se llama el dominio de la variable.

    En palabras, (1.1) se lee: "\(Y\)equivale al conjunto de todos (poco)\(x\) en (capital)\(X\) tal que\(P\) es cierto de\(x\)”. El símbolo "\(\mid\)" en (1.1) a menudo se escribe en su lugar con dos puntos, a saber\(\{x \in X: P(x)\}\). En matemáticas,\(P(x)\) es una fórmula a menudo matemática. Por ejemplo, supongamos que\(P(x)\) es la fórmula "\(x^{2}=4\)”. Por\(P(2)\) nos referimos a la fórmula con 2 sustituido por\(x\), es decir\[" 2^{2}=4 "\] Si la sustitución da como resultado una afirmación verdadera, decimos que se\(P(x)\) mantiene en 2, o\(P(2)\) es verdad. Si la afirmación que resulta de la sustitución es falsa, por ejemplo\(P(1)\), decimos que\(P(x)\) no se sostiene en 1, o que\(P(1)\) es falsa.

    EJEMPLO 1.2. Considera el conjunto\[X=\{0,1,4,9, \ldots\} .\] Una definición precisa del mismo conjunto es la siguiente:\[X=\left\{x \in \mathbb{N} \mid \text { for some } y \in \mathbb{N}, x=y^{2}\right\} .\] EJEMPLO 1.3. Dejar\(Y\) ser el conjunto de enteros pares positivos menores a 100. Entonces se\(Y\) puede escribir:\[\left\{x \in \mathbb{N} \mid x<100 \text { and there is } n \in \mathbb{N}^{+} \text {such that } x=2 \cdot n\right\}\] EJEMPLO 1.4. Un intervalo\(I\) es un subconjunto no vacío de\(\mathbb{R}\) con la propiedad que siempre\(a, b \in I\) y\(a<c<b\), entonces\(c\) está en\(I\). Un intervalo delimitado debe tener una de las cuatro formas\ [\ begin {aligned} (a, b) &=\ {x\ in\ mathbb {R}\ mid a<x<b\}\\ {[a, b)} &=\ {x\ in\ mathbb {R}\ mid a\ leq x<b\}\\ (a, b] &=\ {x\ en math\ in\ mathbb {R}\ mediados a<x\ leq b\}\\ {[a, b]} &=\ {x\ in\ mathbb {R}\ mediados de a\ leq x \ leq b\} \ end {alineado}\] donde en los tres primeros casos\(a\) y\(b\) son números reales con\(a<b\) y en el cuarto caso solo requerimos\(a \leq b\). Los intervalos no acotados tienen cinco formas:\ [\ begin {aligned} (-\ infty, b) &=\ {x\ in\ mathbb {R}\ mid x<b\}\ (-\ infty, b] &=\ {x\ in\ mathbb {R}\ mid x\ leq b\}\\ (b,\ infty) &=\ {x\ in\ mathbb {R}\ mediados x>b\}\\ {[b,\ infty)} &=\ {x\ in\ mathbb {R}\ mediados x\ geq b\}\\ \ mathbb {R} & \ end {aligned}\] donde\(b\) hay algún número real. Un intervalo se llama cerrado si contiene todos sus extremos (ambos\(a\) y\(b\) en el primer grupo de ejemplos, solo\(b\) en los primeros cuatro ejemplos del segundo grupo), y abierto si no contiene ninguno de ellos. Observe que esto hace que\(\mathbb{R}\) el único intervalo que sea a la vez cerrado y abierto.

    En aras de la brevedad, un autor no puede identificar explícitamente el dominio de la variable. Tenga cuidado con esto, ya que el autor está confiando en el lector para hacer las suposiciones necesarias. Por ejemplo, considere el conjunto\[X=\left\{x \mid\left(x^{2}-2\right)(x-1)\left(x^{2}+1\right)=0\right\} .\] Si se supone que el dominio de la variable es\(\mathbb{N}\), entonces\[X=\{1\} .\] Si se supone que el dominio de la variable es\(\mathbb{R}\), entonces\[X=\{1, \sqrt{2},-\sqrt{2}\} .\] Si se asume que el dominio de la variable es el números complejos, entonces,\[X=\{1, \sqrt{2},-\sqrt{2}, i,-i\}\] dónde\(i\) está el número complejo\(\sqrt{-1}\). Recuerde, la carga de la comunicación clara recae en el autor, no en el lector.

    Otra alternativa es incluir el dominio de la variable en la condición que define la pertenencia al conjunto. Entonces, si\(X\) es el dominio pretendido del conjunto y\(P(x)\) es la condición para la pertenencia al conjunto,\[\{x \in X \mid P(x)\}=\{x \mid x \in X \text { and } P(x)\} .\] siempre y cuando la definición sea clara, el autor tiene cierta flexibilidad con respecto a la notación.

    1.2.1. Establecer Identidad. ¿Cuándo son iguales dos conjuntos? Podría inclinarse a decir que dos conjuntos son iguales siempre que sean la misma colección de objetos. Por supuesto que esto es cierto, pero la igualdad como relación entre objetos no es muy interesante. Sin embargo, probablemente hayas pasado mucho tiempo investigando ecuaciones (que son solo declaraciones de igualdad), y dudamos de que la igualdad pareciera trivial. Esto se debe a que en general la igualdad debe entenderse como una relación entre descripciones o nombres de objetos, más que entre los propios objetos. El enunciado\[a=b\] es una afirmación de que el objeto representado por\(a\) es el mismo objeto que el representado por\(b\). Por ejemplo, la sentencia\[5-3=2\] es la afirmación de que el número representado por la expresión aritmética\(5-3\) es el mismo número que el representado por el numeral 2.

    En el caso de los conjuntos, esta noción de igualdad se llama extensionalidad.

    DEFINICIÓN. Extensionalidad Let\(X\) and\(Y\) be sets. Entonces\(X=Y\) siempre que cada elemento de también\(X\) sea un elemento de\(Y\) y cada elemento de también\(Y\) sea un elemento de\(X\).

    Hay flexibilidad en cómo se caracteriza un conjunto siempre y cuando tengamos claro qué objetos constituyen el conjunto. Por ejemplo, consideremos la ecuación establecida\[\{\text { Mark Twain, Samuel Clemens }\}=\{\text { Mark Twain }\} .\] Si por “Mark Twain” y “Samuel Clemens”, nos referimos al autor estadounidense fallecido, estos conjuntos son iguales, por extensión, y la afirmación es verdadera. El conjunto en el lado izquierdo de la ecuación tiene un solo elemento ya que ambos nombres se refieren a la misma persona. Si, sin embargo, consideramos a “Mark Twain” y “Samuel Clemens” como nombres, la afirmación es falsa, ya que “Samuel Clemens” es miembro del conjunto en el lado izquierdo de la ecuación, pero no del lado derecho. Se puede ver que las definiciones de conjuntos pueden depender del dominio implícito de la variable aunque los conjuntos se definan listando.

    Ejemplo 1.5. Considere los siguientes seis conjuntos:\ [\ begin {aligned} &X_ {1} =\ {1,2\}\\ &X_ {2} =\ {2,1\}\\ &X_ {3} =\ {1,2,1\}\\ &X_ {4} =\ {n\ in\ mathbb {N}\ mediados 0<n<3\}\\ &X_ {5} = izquierda\\ {n\ in\ mathbb {N}\ mid\ text {existen} x, y, z\ in\ mathbb {N} ^ {+}\ texto {tal que} x^ {n} +y^ {n} =z^ {n}\ derecha\}\\ &X_ {6} =\ {0,1,2\}. \ end {aligned}\] Los cinco primeros conjuntos son todos iguales, y el sexto es diferente. No obstante, si bien es obvio que\(X_{1}=X_{2}=X_{3}=X_{4}\), el hecho que\(X_{5}=X_{1}\) es el célebre teorema de Andrew Wiles (su prueba del último teorema de Fermat).

    1.2.2. Conjuntos Relativos. Para decir algo interesante sobre los conjuntos, necesitamos formas de relacionarlos, y vamos a querer formas de crear nuevos conjuntos a partir de conjuntos existentes.

    Definición. Subconjunto,\(\subseteq\) Let\(X\) y\(Y\) ser conjuntos. \(X\)es un subconjunto de\(Y\) si cada elemento de\(X\) es también un elemento de\(Y\). Esto se escribe\[X \subseteq Y .\] Superconjunto,\(\supseteq\) Si\(X \subseteq Y\), entonces\(Y\) se llama un superconjunto de\(X\), escrito Con el\[Y \supseteq X .\] fin de mostrar dos conjuntos son iguales (o que dos descripciones de conjuntos se refieren a la misma set), se debe demostrar que tienen precisamente los mismos elementos. A menudo es más fácil si el argumento se rompe en dos argumentos más simples en los que se muestra contención mutua de los conjuntos. En otras palabras, decir\(X=Y\) es lo mismo que decir\[X \subseteq Y \text { and } Y \subseteq X,\] y verificar las dos afirmaciones separadas en (1.6) suele ser más fácil (o al menos más claro) que mostrar\(X=Y\) eso de una vez.

    Agreguemos algunas nociones más elementales a nuestra discusión de conjuntos.

    DEFINICIÓN. Subconjunto adecuado,\(\subsetneq, \supsetneq\) Let\(X\) y\(Y\) ser conjuntos. \(X\)es un subconjunto propio de\(Y\) si\[X \subseteq Y \text { and } X \neq Y \text {. }\] Escribimos esto como\[X \subsetneq Y\] o\[Y \supsetneq X .\] DEFINICIÓN. Conjunto vacío,\(\emptyset\) El conjunto vacío es el conjunto sin elementos. Se denota por\(\emptyset\).

    Entonces para cualquier conjunto,\(X\),\[\emptyset \subseteq X \text {. }\] (Piensa en por qué esto es cierto). \(\emptyset\)El hecho de que esté vacío no quiere decir que no tenga importancia. En efecto, muchas preguntas matemáticas se reducen a preguntar si un conjunto en particular está vacío o no. Además, como verá en el Capítulo 8, podemos construir toda la línea real a partir del conjunto vacío usando operaciones de conjunto.

    EJERCICIO. (Ver Ejercicios 1.1). Demostrar que\[\{n \in \mathbb{N} \mid n \text { is odd and } n=k(k+1) \text { for some } k \in \mathbb{N}\}\] está vacío.

    Discutamos algunas formas de definir nuevos conjuntos a partir de conjuntos existentes. DEFINICIÓN. Unión,\(\cup\) Let\(X\) and\(Y\) be sets. La unión de\(X\) y\(Y\), escrito\(X \cup Y\), es el conjunto\[X \cup Y=\{x \mid x \in X \text { or } x \in Y\} .\] (Recordemos nuestra discusión en la Sección 1.1 sobre el significado matemático de la palabra “o”.)

    DEFINICIÓN. Intersección,\(\cap\) Let\(X\) and\(Y\) be sets. La intersección de\(X\) y\(Y\), escrito\(X \cap Y\), es el conjunto\[X \cap Y=\{x \mid x \in X \text { and } x \in Y\} .\] DEFINICIÓN. Establecer diferencia,\(\backslash\) Let\(X\) and\(Y\) be sets. La diferencia establecida de\(X\) y\(Y\), escrita\(X \backslash Y\), es la\[X \backslash Y=\{x \in X \mid x \notin Y\} .\] definición de conjunto. Disjoint Let\(X\) and\(Y\) be sets. \(X\)y\(Y\) son disjuntos si\[X \cap Y=\emptyset .\] A menudo uno trata con conjuntos que son subconjuntos de algún conjunto fijo dado\(U\). Por ejemplo, cuando se trata de conjuntos de números naturales, el conjunto\(U\) sería\(\mathbb{N}\).

    DEFINICIÓN. Complemento Let\(X \subseteq U\). El complemento de\(X\) in\(U\) es el conjunto\(U \backslash X\). Cuando\(U\) se entiende desde el contexto,\(X\) se escribe el complemento de\(X^{c}\).

    ¿Qué pasa con las operaciones de conjuntos que involucran más de dos conjuntos? A diferencia de la aritmética, en la que existe un orden de operaciones por defecto (potencias, productos, sumas), no existe una convención universal para el orden en que se realizan las operaciones de conjunto. Si las intersecciones y uniones aparecen en la misma expresión, entonces el orden en que se realizan las operaciones puede importar. Por ejemplo, supongamos\(X\) y\(Y\) son conjuntos disjuntos, no vacíos, y consideramos la expresión\[X \cap X \cup Y \text {. }\] Si queremos decir que la intersección se ejecute antes de la unión, entonces\[(X \cap X) \cup Y=X \cup Y .\] If, sin embargo pretendemos que la unión se compute antes de la intersección, entonces\[X \cap(X \cup Y)=X .\] Since no\(Y\) está vacía y disjunta de\(X\),\[(X \cap X) \cup Y \neq X \cap(X \cup Y) .\] En consecuencia, el orden en que se ejecutan las operaciones de conjunto necesita prescribirse explícitamente con paréntesis.

    EJEMPLO 1.7. Dejar\(X=\mathbb{N}\) y\(Y=\mathbb{Z} \backslash \mathbb{N}\). Entonces\[(X \cap X) \cup Y=\mathbb{N} \cup Y=\mathbb{Z} .\] Sin embargo\[X \cap(X \cup Y)=\mathbb{N} \cap \mathbb{Z}=\mathbb{N} .\] DEFINICIÓN Producto cartesiano, Producto directo,\(X \times Y\) Let\(X\) and\(Y\) be sets. El producto cartesiano de\(X\) y\(Y\), escrito\(X \times Y\), es el conjunto de pares ordenados\[\{(x, y) \mid x \in X \text { and } y \in Y\} .\] El producto cartesiano también se llama el producto directo.

    EJEMPLO 1.8. Vamos\[X=\{1,2,3\}\] y\[Y=\{1,2\} .\] Entonces\[X \times Y=\{(1,1),(1,2),(2,1),(2,2),(3,1),(3,2)\} .\] Tenga en cuenta que el orden importa - es decir\[(1,2) \neq(2,1) .\] Así\(X \times Y\) es un conjunto con seis elementos. Dado que los productos directos son en sí mismos conjuntos, podemos definir fácilmente el producto directo de más de dos factores. Por ejemplo, dejar\(X, Y\) y\(Z\) ser conjuntos, luego\[(X \times Y) \times Z=\{((x, y), z) \mid x \in X, y \in Y, z \in Z\} .\] Formalmente,\[(X \times Y) \times Z \neq X \times(Y \times Z),\] porque\(((x, y), z)\) y no\((x,(y, z))\) son lo mismo. Sin embargo en casi todas las aplicaciones, esta distinción no es importante, y los matemáticos generalmente consideran el producto directo de más de dos conjuntos sin tener en cuenta este detalle. Por lo tanto, generalmente verá el producto cartesiano de tres conjuntos escritos sin paréntesis,\[X \times Y \times Z \text {. }\] en este caso podrá interpretar el producto directo como cualquiera de los lados de la declaración 1.8.

    Con un poco de pensamiento, se puede concluir que hemos descrito esencialmente el producto cartesiano de una colección finita arbitraria de conjuntos. Los elementos del producto cartesiano\(X \times Y\) son pares ordenados. Nuestra caracterización del producto cartesiano de tres conjuntos,\(X, Y\) y\(Z\), indica que sus elementos podrían considerarse como pares ordenados de elementos de\(X \times Y\) y\(Z\), respectivamente. Desde un punto de vista práctico, es más sencillo pensar en elementos\(X \times Y \times Z\) de triples ordenados. Esto lo generalizamos de la siguiente manera.

    DEFINICIÓN. Producto cartesiano, producto directo,\(\prod_{i=1}^{n} X_{i}\) Let\(n \in\)\(\mathbb{N}^{+}\), y\(X_{1}, X_{2}, \ldots, X_{n}\) ser conjuntos. El producto cartesiano de\(X_{1}, \ldots, X_{n}\), escrito\(X_{1} \times X_{2} \times \ldots \times X_{n}\), es el conjunto\[\left\{\left(x_{1}, x_{2}, \ldots, x_{n}\right) \mid x_{i} \in X_{i}, 1 \leq i \leq n\right\} .\] Esto también puede escribirse\[\prod_{i=1}^{n} X_{i} .\] Cuando tomamos el producto cartesiano de un conjunto\(X\) consigo mismo\(n\) tiempos, lo escribimos como \(X^{n}\):\[X^{n}:=\overbrace{X \times X \times \cdots \times X}^{n \text { times }} .\]

    Funciones

    Al igual que los conjuntos, las funciones son omnipresentes en las matemáticas.

    Definición. Función,\(f: X \rightarrow Y\) Let\(X\) and\(Y\) be sets. Una función\(f\) de\(X\) a\(Y\), denotada por\(f: X \rightarrow Y\), es una asignación de exactamente un elemento de\(Y\) a cada elemento de\(X\).

    Para cada elemento\(x \in X\), la función\(f\) asocia o selecciona un elemento único\(y \in Y\). La condición de singularidad no permite\(x\) ser asignada a distintos elementos de\(Y\). Permite que diferentes elementos de\(X\) sean asignados al mismo elemento de\(Y\) sin embargo. Es importante para tu comprensión de las funciones que consideres este punto cuidadosamente. Los siguientes ejemplos pueden ayudar a ilustrar esto.

    EJEMPLO 1.9. Let\(f: \mathbb{Z} \rightarrow \mathbb{R}\) be given by\[f(x)=x^{2} .\] Then\(f\) es una función en la que el elemento de\(\mathbb{R}\) asignado al elemento\(x\) de\(\mathbb{Z}\) es especificado por la expresión\(x^{2}\). Por ejemplo,\(f\) asigna 9 al entero 3. Esto lo expresamos por escrito\[f(3)=9 \text {. }\] Observe que no todos los números reales están asignados a un número de\(\mathbb{Z}\). Además, observe que 4 se asigna tanto a 2 como a\(-2\). Comprobar que\(f\) sí satisface la definición de una función.

    EJEMPLO 1.10. Dejar\(g: \mathbb{R} \rightarrow \mathbb{R}\) ser definido por\(g(x)=\tan (x)\). Entonces no\(g\) es una función, porque no se define cuando\(x=\pi / 2\) (o siempre\(x-\pi / 2\) es un múltiplo entero de\(\pi\)). Esto se puede arreglar definiendo\[X=\mathbb{R} \backslash\{\pi / 2+k \pi \mid k \in \mathbb{Z}\} .\] Entonces\(\tan : X \rightarrow \mathbb{R}\) es una función de\(X\) a\(\mathbb{R}\). EJEMPLO 1.11. Considera dos reglas\(f, g: \mathbb{R} \rightarrow \mathbb{R}\),, definidas por\ [\ begin {array} {ll} f (x) =y &\ text {if} 3 x=2-y\\ g (x) =y &\ text {if} x=y^ {4}. \ end {array}\] Entonces\(f\) es una función, y se puede dar explícitamente como\(f(x)=2-3 x\). Pero\(g\) no define una función, porque\(e . g\). cuando\(x=16\), entonces\(g(x)\) podría ser o bien 2 o\(-2\).

    DEFINICIÓN. Imagen Let\(f: X \rightarrow Y\). Si\(a \in X\), entonces el elemento de\(Y\) que se\(f\) asigna a\(a\) se denota por\(f(a)\), y se llama la imagen de\(a\) debajo\(f\).

    La notación\(f: X \rightarrow Y\) es una declaración que\(f\) es una función de\(X\) a\(Y\). Esta afirmación tiene como consecuencia que para cada\(a \in X\),\(f(a)\) es un elemento específico de\(Y\). Damos una caracterización alternativa de funciones basada en productos cartesianos.

    DEFINICIÓN. Gráfica de una función Let\(f: X \rightarrow Y\). La gráfica de\(f, \operatorname{graph}(f)\), es\[\{(x, y) \mid x \in X \text { and } f(x)=y\} .\] EJEMPLO 1.12. Dejar\(X \subseteq \mathbb{R}\) y\(f: X \rightarrow \mathbb{R}\) ser definido por\(f(x)=\)\(-x\). Entonces la gráfica de\(f\) es\[\{(x,-x) \mid x \in X\} .\] EJEMPLO 1.13. La función vacía\(f\) es la función con gráfico vacío (esa es la gráfica de\(f\) es el conjunto vacío). Esto significa\(f: \emptyset \rightarrow Y\) para algún conjunto\(Y\).

    Si\(f: X \rightarrow Y\), entonces,\[\operatorname{graph}(f) \subseteq X \times Y \text {. }\] Vamos\(Z \subseteq X \times Y\). Entonces\(Z\) es la gráfica de una función de\(X\) a\(Y\) si

    (i) para cualquiera\(x \in X\), hay algunos\(y\) en\(Y\) tal que\((x, y) \in Z\)

    (ii) si\((x, y)\) está adentro\(Z\) y\((x, z)\) está adentro\(Z\), entonces\(y=z\). Supongamos\(X\) y\(Y\) son subconjuntos de\(\mathbb{R}\). Entonces Condición (i) es la condición de que cada línea vertical a través de un punto de\(X\) corta la gráfica al menos una vez. La condición (ii) es la condición de que cada línea vertical a través de un punto de\(X\) corta la gráfica como máximo una vez.

    DEFINICIÓN. Dominio, Codominio Let\(f: X \rightarrow Y\). El conjunto\(X\) se llama el dominio de\(f\), y está escrito\(\operatorname{Dom}(f)\). El conjunto\(Y\) se llama el codominio de\(f\).

    El dominio de una función es un componente necesario de la definición de una función. El codominio es un poco más sutil. Si piensas en las funciones como conjuntos de pares ordenados, es decir, si identificaste la función con su gráfica, entonces cada función tendría muchos codominios posibles (tomar cualquier superconjunto del codominio original). Los teóricos de conjuntos piensan en las funciones de esta manera, y si las funciones se consideran como conjuntos, la extensionalidad requiere que las funciones con la misma gráfica sean idénticas. No obstante, esta convención haría torpe una discusión de las suryecciones (véase más adelante), por lo que no la adoptaremos.

    Cuando escribes\[f: X \rightarrow Y\] estás nombrando explícitamente el codominio previsto, y esto hace que el codominio sea una parte crucial de la definición de la función. Estás indicando al lector que tu definición incluye algo más que la gráfica de la función. La definición de una función incluye tres partes: el dominio, el codominio y la gráfica.

    EJEMPLO 1.14. Dejar\(f: \mathbb{N} \rightarrow \mathbb{N}\) ser definido por\[f(n)=n^{2} .\] Let\(g: \mathbb{N} \rightarrow \mathbb{R}\) be defined by\[g(x)=x^{2} .\] Then\(\operatorname{graph}(f)=\operatorname{graph}(g)\). Si\(h: \mathbb{R} \rightarrow \mathbb{R}\) se define para\[h(x)=x^{2}\] entonces\(\operatorname{graph}(f) \subsetneq \operatorname{graph}(h)\), así\(f \neq h\) y\(g \neq h\). Si bien\(\operatorname{graph}(f)=\)\(\operatorname{graph}(g)\), consideramos\(f\) y\(g\) ser diferentes funciones porque tienen diferentes codominios.

    DEFINICIÓN. Rango Let\(f: X \rightarrow Y\). El rango de\(f, \operatorname{Ran}(f)\), es\[\{y \in Y \mid \text { for some } x \in X, f(x)=y\} \text {. }\] So si\(f: X \rightarrow Y\), entonces\(\operatorname{Ran}(f) \subseteq Y\), y es precisamente el conjunto de imágenes bajo\(f\) de elementos en\(X\). Eso es\[\operatorname{Ran}(f)=\{f(x) \mid x \in X\} .\] Ningún subconjunto adecuado de\(\operatorname{Ran}(f)\) puede servir como codominio para una función que tiene la misma gráfica que\(f\).

    EJEMPLO 1.15. Con la misma notación que en el Ejemplo 1.14, tenemos\(\operatorname{Ran}(f)=\operatorname{Ran}(g)=\left\{n \in \mathbb{N} \mid n=k^{2}\right.\) para algunos\(\left.k \in \mathbb{N}\right\}\). El rango de\(h\) es\([0, \infty)\).

    DEFINICIÓN. Función de valor real, función real Let\(f: X \rightarrow Y\). Si\(\operatorname{Ran}(f) \subseteq \mathbb{R}\), decimos que\(f\) es de valor real. Si\(X \subseteq \mathbb{R}\) y\(f\) es una función de valor real, entonces llamamos\(f\) una función real.

    A veces se dice que una función es una regla que asigna, a cada elemento de un conjunto dado, algún elemento de otro conjunto. Si por una regla se entiende una instrucción de algún tipo, verá en el Capítulo 6 que hay “más” funciones que no pueden caracterizarse por reglas que funciones que las que pueden haber. En la práctica, sin embargo, la mayoría de las funciones que utilizamos están definidas por reglas.

    Si una función viene dada por una regla, es común escribirla en la forma\ [\ begin {aligned} f: X &\ fila derecha Y\\ x &\ mapsto f (x). \ end {aligned}\] El símbolo\(\mapsto\) se lee “se asigna a”. Por ejemplo, la función\(g\) del ejemplo anterior podría definirse por\ [\ begin {aligned} g:\ mathbb {N} &\ rightarrow\ mathbb {R}\\ n &\ mapsto n^ {2}. \ end {alineado}\] Ejemplo 1.16. La función\ [\ begin {aligned} f:\ mathbb {R} &\ rightarrow\ mathbb {R}\\ x &\ mapsto\ begin {cases} 0 & x<0\\ x+1 & x\ geq 0\ end {cases} \ end {aligned}\] está definida por una regla, aunque para aplicar la regla a un dado primero\(x\) debes verificar dónde en el dominio\(x\) se encuentra.

    Cuando una función real es definida por una regla y el dominio no se establece explícitamente, se toma como el conjunto más grande para el que se define la regla. Esta es la convención habitual en el cálculo: las funciones reales se definen por expresiones matemáticas y se entiende que el dominio implícito de una función es el subconjunto más grande\(\mathbb{R}\) para el que la expresión tiene sentido. Se supone que el codominio de una función real es a\(\mathbb{R}\) menos que se indique explícitamente lo contrario.

    EJEMPLO 1.17. Que\(f(x)=\sqrt{x}\) sea una función real. Se supone que el dominio de la función es\[\{x \in \mathbb{R} \mid x \geq 0\} .\] DEFINICIÓN. Operación Dejar\(X\) ser un conjunto, y\(n \in \mathbb{N}^{+}\). Una operación\(X\) encendida es una función de\(X^{n}\) a\(X\).

    Las operaciones pueden considerarse como medios para combinar elementos de un conjunto para producir nuevos elementos del conjunto. Las operaciones más comunes son las operaciones binarias (cuando\(n=2\)).

    Ejemplo\(1.18 .+\) y\(\cdot\) son operaciones binarias en\(\mathbb{N}\).

    • y no\(\div\) son operaciones en\(\mathbb{N}\).

    EJEMPLO 1.19. Let\(X=\mathbb{R}^{3}\), pensado como el conjunto de 3 -vectores. La función\(x \mapsto-x\) es una operación unaria\(X\) encendida, la función\((x, y) \mapsto x+y\) es una operación binaria y la función\((x, y, z) \mapsto x \times y \times z\) es una operación ternaria. Si\(f: X \rightarrow Y, g: X \rightarrow Y\), y\(\star\) es una operación binaria\(Y\) encendida, entonces hay una manera natural de definir una nueva función al\(X\) usar\(\star\). Definir\(f \star g\) por\ [\ comenzar {alineado} f\ estrella g: X &\ fila derecha Y\\ (f\ estrella g) (x) &=f (x)\ estrella g (x). \ end {alineado}\] Ejemplo 1.20. Supongamos que\(f\) es la función real\(f(x)=x^{3}\), y\(g\) es la función real\(g(x)=3 x^{2}-1\). Entonces\(f+g\) es la función real\(x \mapsto x^{3}+3 x^{2}-1\), y\(f \cdot g\) es la función real\(x \mapsto x^{3}\left(3 x^{2}-1\right)\).

    Otra forma de construir nuevas funciones es por composición.

    DEFINICIÓN. Composición,\(\circ\) Let\(f: X \rightarrow Y\) y\(g: Y \rightarrow Z\). Entonces la composición de\(g\) con\(f\) es la función,\ [\ begin {aligned} g\ circ f: X &\ rightarrow Z\\ x &\ mapsto g (f (x)). \ end {alineado}\] Ejemplo 1.21. Dejar\(f\) ser la función real\[f(x)=x^{2} .\] Dejar\(g\) ser la función real\[g(x)=\sqrt{x} .\] Entonces\[(g \circ f)(x)=|x| .\] ¿qué es\(f \circ g\)? (Tenga cuidado con el dominio).

    EJEMPLO 1.22. Vamos\ [\ comenzar {alineado} f:\ mathbb {R} &\ rightarrow\ mathbb {R}\\ x &\ mapsto 2 x+1 \ end {alineado}\] y dejar\ [\ comenzar {alineado} g:\ mathbb {R} ^ {2} &\ rightarrow\ mathbb {R}\\ (x, y) &\ mapsto x^ {2} +3 y^ {2}. \ end {alineado}\] Entonces\ [\ begin {alineado} f\ circ g:\ mathbb {R} ^ {2} &\ fila derecha\ mathbb {R}\\ (x, y) &\ mapsto 2 x^ {2} +6 y^ {2} +1. \ end {aligned}\] La función no\(g \circ f\) está definida (¿por qué?).

    Inyecciones, Suryecciones, Biyecciones

    Las más básicas entre las características que puede tener una función son las propiedades de inyectividad, surjectividad y bijectividad.

    DEFINICIÓN. Inyección, Let Uno a Uno\(f: X \rightarrow Y\). La función\(f\) se llama inyección si, siempre que\(x\) y\(y\) son elementos distintos de\(X\), tenemos\(f(x) \neq f(y)\). Las inyecciones también se llaman funciones uno-a-uno.

    Otra forma de afirmar la definición (el contrapositivo) es que si\(f(x)=f(y)\) entonces\(x=y\).

    EJEMPLO 1.23. La función real\(f(x)=x^{3}\) es una inyección. Para ver esto, dejemos\(x\) y\(y\) sean números reales, y supongamos que\[f(x)=x^{3}=y^{3}=f(y) .\]\[x=\left(x^{3}\right)^{1 / 3}=\left(y^{3}\right)^{1 / 3}=y .\] Entonces Así, por\(x, y \in X\),\[f(x)=f(y) \text { only if } x=y .\] Ejemplo 1.24. La función real no\(f(x)=x^{2}\) es una inyección, ya que\[f(2)=4=f(-2) .\] Observe que un solo ejemplo es suficiente para demostrar que\(f\) no es una inyección.

    EJEMPLO 1.25. Supongamos\(f: X \rightarrow Y\) y\(g: Y \rightarrow Z\). Demostrar que si\(f\) y\(g\) son inyectables, así es\(g \circ f\).

    Prueba. Supongamos que\(g \circ f(x)=g \circ f(y)\). Ya que\(g\) es inyectivo, esto quiere decir que\(f(x)=f(y)\). Ya que\(f\) es inyectable, esto a su vez significa eso\(x=y\). Por lo tanto,\(g \circ f\) es inyectivo, según se desee. (Ver Ejercicio\(1.20\) a continuación).

    Definición. Surjección, Onto Let\(f: X \rightarrow Y\). Decimos que\(f\) es una sobrejección de\(X\) a\(Y\) si\(\operatorname{Ran}(f)=Y\). También describimos esto diciendo que\(f\) está sobre\(Y\).

    EJEMPLO 1.26. La función\(f: \mathbb{R} \rightarrow \mathbb{R}\) definida por no\(f(x)=x^{2}\) es una sobreyección. Por ejemplo,\(-1\) está en el codominio de\(f\), pero\(-1 \notin \operatorname{Ran}(f)\). Por lo tanto,\(\operatorname{Ran}(f) \subsetneq \mathbb{R}\).

    EJEMPLO 1.27. Dejar\(Y=\{x \in \mathbb{R} \mid x \geq 0\}\), y\(f: \mathbb{R} \rightarrow Y\) ser dado por\(f(x)=x^{2}\). Entonces\(f\) es una sobrejección. Para probarlo, tenemos que demostrarlo\(Y=\operatorname{Ran}(f)\). Eso lo sabemos\(\operatorname{Ran}(f) \subseteq Y\), así que debemos mostrar\(Y \subseteq \operatorname{Ran}(f)\). Vamos\(y \in Y\), así\(y\) es un número real no negativo. Entonces\(\sqrt{y} \in \mathbb{R}\), y\(f(\sqrt{y})=y\). Entonces\(y \in \operatorname{Ran}(f)\). Ya que\(y\) fue un elemento arbitrario de\(Y, Y \subseteq \operatorname{Ran}(f)\). De ahí\(Y=\operatorname{Ran}(f)\) y\(f\) es una sobrejección.

    El hecho de que una función sea una sobreyección depende de la elección del codominio. Una función está siempre en su rango. Quizás te preguntes por qué uno no definiría simplemente el codominio como el rango de la función (garantizando que la función es una suryección). Una razón es que podemos estar más interesados en relacionar dos conjuntos usando funciones que en cualquier función particular entre los conjuntos. Estudiamos una importante aplicación de funciones para relacionar conjuntos en el Capítulo 6, donde utilizamos funciones para comparar el tamaño de los conjuntos. Esto es de particular interés a la hora de comparar conjuntos infinitos, y ha llevado a profundizar en los fundamentos de las matemáticas.

    Si juntamos las ideas de una inyección y una suryección, llegamos a la idea clave de una biyección.

    Definición. Bijección,\(\mapsto\) Vamos\(f: X \rightarrow Y\). Si\(f\) es una inyección y una sobreyección, entonces\(f\) es una biyección. Esto está escrito como\(f: X \mapsto Y\).

    ¿Por qué son tan importantes las bijecciones? Desde un punto de vista teórico, las funciones pueden ser utilizadas para relacionar el dominio y el codominio de la función. Si está familiarizado con un conjunto, es posible que pueda desarrollar conocimientos en un conjunto diferente al encontrar una función entre los conjuntos que conserve algunas de las características clave de los conjuntos. Por ejemplo, una inyección puede “interpretar” un conjunto en un conjunto diferente. Si la inyección conserva la información crítica del dominio, podemos comportarnos como si el dominio de la función fuera prácticamente un subconjunto del codominio mediante el uso de la función para “renombrar” los elementos del dominio. Si la función es una biyección, y conserva las características estructurales clave del dominio, podemos tratar el dominio y el codominio como prácticamente el mismo conjunto. Cuáles son las características estructurales clave depende del área de matemáticas que estés estudiando. Por ejemplo, si estás estudiando estructuras algebraicas, probablemente estés más interesado en preservar las operaciones de la estructura. Si estás estudiando geometría, te interesan las funciones que preserven la forma. La preservación de las características estructurales clave del dominio o codominio a menudo nos permite traducir el conocimiento de un conjunto en conocimiento equivalente de otro conjunto.

    DEFINICIÓN. Permutación Let\(X\) Ser un conjunto. Una permutación de\(X\) es una biyección\(f: X \mapsto X\).

    EJEMPLO 1.28. Dejar\(f: \mathbb{Z} \rightarrow \mathbb{Z}\) ser definido por\[f(x)=x+1 .\] Entonces\(f\) es una permutación de\(\mathbb{Z}\).

    Ejemplo 1.29. Vamos\(X=\{0,1,-1\}\). Entonces\(f: X \rightarrow X\) dada por\(f(x)=-x\) es una permutación de\(X\).

    Imágenes e inversos

    Las funciones se pueden utilizar para definir subconjuntos de conjuntos dados.

    DEFINICIÓN. Imagen,\(f[]\) Let\(f: X \rightarrow Y\) y\(W \subseteq X\). La imagen de\(W\) debajo\(f\), escrita\(f[W]\), es el conjunto\[\{f(x) \mid x \in W\} .\] Así que si\(f: X \rightarrow Y\), entonces\[\operatorname{Ran}(f)=f[X] .\] EJEMPLO 1.30. Supongamos que\(f\) es la función real\(f(x)=x^{2}+3\). Vamos\(W=\{-2,2,3\}\), y\(Z=(-1,2)\). Entonces\(f[W]=\{7,12\}\), y\(f[Z]=[3,7)\).

    En aplicaciones de las matemáticas, las funciones suelen describir relaciones numéricas entre observaciones medibles. Entonces si\(f: X \rightarrow Y\) y\(a \in X\), entonces\(f(a)\) es la medida predicha o real asociada con\(a\). En este contexto, a menudo uno está interesado en determinar qué elementos de\(X\) están asociados a un valor,\(b\), en el codominio de\(f\).

    Definición 1.31. Imagen inversa, Pre-imagen,\(f^{-1}(\)) Let\(f: X \rightarrow Y\) y\(b \in Y\). Entonces la imagen inversa de\(b\) under\(f, f^{-1}(b)\), es el conjunto\[\{x \in X \mid f(x)=b\} .\] Este conjunto también se llama la pre-imagen de\(b\) under\(f\).

    Tenga en cuenta que si\(b \notin \operatorname{Ran}(f)\), entonces\(f^{-1}(b)=\emptyset\). Si\(f\) es una inyección, entonces para cualquiera\(b \in \operatorname{Ran}(f), f^{-1}(b)\) tiene un solo elemento.

    Definición. Imagen inversa, Pre-imagen,\(f^{-1}[]\) Let\(f: X \rightarrow Y\) y\(Z \subseteq Y\). La imagen inversa de\(Z\) under\(f\), o la pre-imagen de\(Z\) under\(f\), es el conjunto\[f^{-1}[Z]=\{x \in X \quad \mid f(x) \in Z\}\] que usamos\(f^{-1}[]\) para significar la imagen inversa de un subconjunto del codominio, y\(f^{-1}\) () para la imagen inversa de un elemento del codominio - ambos son subconjuntos del dominio de\(f\). Si\(Z \cap \operatorname{Ran}(f)=\emptyset\), entonces\[f^{-1}[Z]=\emptyset .\] EJEMPLO 1.32. \(f\)Sea como en Figura\(1.33\) Entonces\(f[\{b, c\}]=\{1,3\}\), y\(f^{-1}[\{1,3\}]=\{a, b, c, d\}\).

    imagen

    FIGURA 1.33. Imagen de\(f\)

    EJEMPLO 1.34. \(g\)Déjese ser la verdadera función\(g(x)=x^{2}+3\). Si\(b \in \mathbb{R}\) y\(b>3\), entonces\[g^{-1}(b)=\{\sqrt{b-3},-\sqrt{b-3}\} .\] Si\(b=3\), entonces\(g^{-1}(3)=\{0\}\). Si\(b<3\), entonces\(g^{-1}(b)\) está vacío.

    EJEMPLO 1.35. \(h\)Déjese ser la verdadera función\(h(x)=e^{x}\). Si\(b \in \mathbb{R}\) y\(b>0\), entonces\[h^{-1}(b)=\left\{\log _{e}(b)\right\} .\] Por ejemplo,\[h^{-1}(1)=\{0\} .\] Porque\(h\) es estrictamente creciente, la imagen inversa de cualquier elemento del codominio\((\mathbb{R})\) es o bien un conjunto con un solo elemento o el conjunto vacío.

    Let\(I=(a, b)\), donde\(a, b \in \mathbb{R}\) y\(0<a<b\) (\(I\)es decir, el intervalo abierto con puntos finales\(a\) y\(b\)). Luego\[h^{-1}[I]=\left(\log _{e}(a), \log _{e}(b)\right) .\] hemos discutido la construcción de nuevas funciones a partir de funciones existentes utilizando operaciones algebraicas y composición de funciones. Otra herramienta para construir nuevas funciones a partir de funciones conocidas es la función inversa.

    Definición 1.36. Función inversa Let\(f: X \mapsto Y\) Ser una biyección. Entonces la función inversa de\(f, f^{-1}: Y \rightarrow X\), es la función con gráfica\[\{(b, a) \in Y \times X \mid(a, b) \in \operatorname{graph}(f)\} .\] La función\(f^{-1}\) se define por “revertir las flechas”. Para que esto tenga sentido,\(f: X \rightarrow Y\) debe ser biyectiva. En efecto, si no\(f\) fueran suryectivas, entonces habría un elemento\(y\) de\(Y\) que no está en el rango de\(f\), por lo que no se puede mapear de nuevo a nada en\(X\). Si no\(f\) fueran inyectables, habría elementos\(z\) de\(Y\) que fueran la imagen de elementos distintos\(x_{1}\) y\(x_{2}\) en\(X\). No se podría definir\(f^{-1}(z)\) sin especificar cómo elegir una preimagen en particular. Ambos problemas se pueden solucionar. Si\(f\) es inyectable pero no suryectiva, se puede definir\(g: X \mapsto \operatorname{Ran}(f)\) por\[g(x)=f(x)\] para todos\(x \in X\). Entonces\(g^{-1}: \operatorname{Ran}(f) \mapsto X\). Si no\(f\) es inyectable, el problema es más complicado; pero si podemos encontrar algún subconjunto\(X\) sobre el cual\(f\) es inyectable, podríamos restringir nuestra atención a ese conjunto.

    EJEMPLO 1.37. \(f\)Déjese ser la verdadera función\(f(x)=x^{2}\). La función no\(f\) es una biyección, por lo que no tiene una función inversa. Sin embargo la función\ [\ begin {aligned} g: [0,\ infty) &\ rightarrow [0,\ infty)\\ x &\ mapsto x^ {2} \ end {alineado}\] es una biyección. En este caso,\[g^{-1}(y)=\sqrt{y} .\]imagen

    FIGURA 1.38. Imagen de\(g\)

    EJEMPLO 1.39. Que\(f\) sea la verdadera función,\(f(x)=e^{x}\). Sabes por cálculo que\(f\) es una inyección, y eso\(\operatorname{Ran}(f)=\mathbb{R}^{+}\). De ahí\(f\) que no sea una sobreyección, ya que el codominio implícito de una función real lo es\(\mathbb{R}\). La función\ [\ begin {aligned} g:\ mathbb {R} &\ rightarrow\ mathbb {R} ^ {+}\\ x &\ mapsto e^ {x} \ end {aligned}\] es una biyección y\[g^{-1}(x)=\log _{e}(x)\] Advertencia: Para\(f: X \mapsto Y\) una biyección hemos asignado dos significados diferentes a\(f^{-1}(b)\). En la Definición 1.31, significa el conjunto de puntos en los\(X\) que se mapean\(b\). En la Definición 1.36, significa la función inversa\(f^{-1}\),, de la biyección\(f\) aplicada al punto\(b \in Y\). Sin embargo, si\(f\) es una biyección, para que la segunda definición tenga sentido, entonces estas definiciones están estrechamente relacionadas. Supongamos\(a \in \operatorname{Dom}(f)\) y\(f(a)=b\). De acuerdo con la Definición 1.31,\(f^{-1}(b)=\{a\}\) y por Definición\(1.36\)\(f^{-1}(b)=a\). En la práctica el contexto dejará claro qué definición se pretende. DEFINICIÓN. Función de identidad, id\(\left.\right|_{X}\) Let\(X\) be a set. La función de identidad on\(X\), id\(\left.\right|_{X}: X \mapsto X\), es la función definida por\[\left.\operatorname{id}\right|_{X}(x)=x .\] If\(f: X \rightarrow Y\) es una biyección, entonces\(f^{-1}\) es la función única tal que\[f^{-1} \circ f=\left.\operatorname{id}\right|_{X}\] y\[f \circ f^{-1}=\left.\mathrm{id}\right|_{Y} .\] Porque \(f(x)=x^{2}\)no es una inyección, no tiene inversa, incluso después de restringir el codominio para que sea el rango. Por lo tanto, para “invertir”\(f\), consideramos una función diferente\(g(x)\), que era igual a\(f\) sobre un subconjunto del dominio de\(f\), y era una inyección. En el Ejemplo 1.37, logramos esto definiendo la función\(g(x)=x^{2}\) con dominio\(\{x \in \mathbb{R} \mid x \geq 0\}\). Muchas de las funciones que necesitamos invertir por razones prácticas y teóricas pasan por no ser inyecciones, y por lo tanto no tienen funciones inversas. Una forma de abordar este obstáculo es considerar la función en un dominio más pequeño.

    Dada una función, es posible\(f: X \rightarrow Y\) que deseemos definir una “inversa” de\(f\) en algún subconjunto\(W \subseteq X\) para el cual la restricción de\(f\) a\(W\) es una inyección.

    DEFINICIÓN. Dominio restringido,\(\left.f\right|_{W}\) Let\(f: X \rightarrow Y\) y\(W \subseteq X\). La restricción de\(f\) a\(W\), escrita\(\left.f\right|_{W}\), es la función\ [\ begin {aligned} \ left.f\ right|_ {W}: W &\ rightarrow Y\\ x &\ mapsto f (x). \ end {aligned}\] Así que si\(f: X \rightarrow Y\) y\(W \subseteq X\), entonces\[\operatorname{graph}\left(\left.f\right|_{W}\right)=[W \times Y] \cap[\operatorname{graph}(f)] .\] EJEMPLO 1.40. Vamos\(f(x)=(x-2)^{4}\). Vamos\(W=[2, \infty)\). Entonces\[\left.f\right|_{W}: W \rightarrow[0, \infty)\] es una biyección. EJEMPLO 1.41. Que\(f\) sea la verdadera función,\(f(x)=\tan (x)\). Entonces\[\operatorname{Dom}(f)=\{x \in \mathbb{R} \mid x \neq \pi / 2+k \pi, k \in \mathbb{Z}\},\] y\[\operatorname{Ran}(f)=\mathbb{R} .\] La función\(f\) es periódica con periodo\(\pi\), y por lo tanto no es una inyección. No obstante, es importante responder a la pregunta,

    “En qué ángulo (s),\(x\), hace\(\tan (x)\) igual a un valor particular,\(a \in \mathbb{R}\) “”.

    Esto es matemáticamente equivalente a preguntar,\[\text { "What is } \arctan (a) \text { ?". }\] En cálculo esta necesidad se satisfizo restringiendo el dominio a un intervalo mayor,\(I\) tal que\[\left.f\right|_{I}: I \mapsto \mathbb{R}\] Para cualquiera\(k \in \mathbb{Z}\),\[\left(\frac{(2 k+1) \pi}{2}, \frac{(2 k+3) \pi}{2}\right)\] es tal intervalo. Para definir una función específica, se selecciona el más simple de estos intervalos, y definimos\[\operatorname{Tan}:=\left.\tan \right|_{(-\pi / 2, \pi / 2)} .\] Observar que\[\text { Tan : }(-\pi / 2, \pi / 2) \mapsto \mathbb{R} .\] Así la función es invertible, es decir, Tan tiene una función inversa,\[\operatorname{Arctan}=\operatorname{Tan}^{-1} \text {. }\]

    Secuencias

    En el cálculo pensamos en una secuencia como una lista (posiblemente infinita) de objetos. Ampliaremos un poco esa idea, y la expresaremos en el lenguaje de las funciones.

    DEFINICIÓN. Secuencia finita,\(\left\langle a_{n} \mid n<N\right\rangle\) Una secuencia finita es una función\(f\) con dominio\(\ulcorner N\urcorner\), donde\(N \in \mathbb{N}\). A menudo identificamos la secuencia con el conjunto finito ordenado\(\left\langle a_{n} \mid n<N\right\rangle\), donde\(a_{n}=f(n)\), para\(0 \leq n<N\).

    Esta interpretación de una secuencia como un tipo de función se extiende fácilmente a secuencias infinitas.

    DEFINICIÓN. Secuencia infinita,\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) Una secuencia infinita es una función\(f\) con dominio\(\mathbb{N}\). A menudo identificamos la secuencia con el conjunto infinito ordenado\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\), donde\(a_{n}=f(n)\), para\(n \in \mathbb{N}\).

    OBSERVACIÓN. Intervalo en\(\mathbb{Z}\) Realmente, la secuencia de palabras se usa normalmente para significar cualquier función cuyo dominio sea un intervalo in\(\mathbb{Z}\), donde un intervalo in\(\mathbb{Z}\) es la intersección de algún intervalo real con\(\mathbb{Z}\). Por conveniencia en este libro, solemos suponer que el primer elemento de cualquier secuencia está indexado por 0 o 1.

    EJEMPLO 1.42. La secuencia\(\langle 0,1,4,9, \ldots\rangle\) viene dada por la función\(f(n)=n^{2} .\)

    La secuencia\(\langle 1,-1,2,-2,3,-3, \ldots\rangle\) viene dada por la función\[f(n)= \begin{cases}\frac{n}{2}+1, & n \text { even } \\ -\frac{n+1}{2}, & n \text { odd. }\end{cases}\] Secuencias puede tomar valores en cualquier conjunto (el codominio de la función\(f\) que define la secuencia). Hablamos de una secuencia real si los valores son números reales, una secuencia entera si todos son enteros, etc. resultará más tarde que las secuencias con valores en el conjunto de dos elementos\(\{0,1\}\) ocurren con bastante frecuencia, así que tenemos un nombre especial para ellos: los llamamos secuencias binarias.

    DEFINICIÓN. Secuencia binaria Una secuencia binaria finita es una función\(f:\ulcorner N\urcorner \rightarrow\ulcorner 2\urcorner\),, para algunos\(N \in \mathbb{N}\). Una secuencia binaria infinita es una función,\(f: \mathbb{N} \rightarrow\ulcorner 2\urcorner\).

    A menudo usamos la expresión\(\left\langle a_{n}\right\rangle\) para la secuencia\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\).

    Las funciones también se utilizan para “indexar” conjuntos con el fin de construir conjuntos más complicados con operaciones de conjunto generalizadas. Se discutió la unión (o intersección) de más de dos conjuntos. Podría preguntarse si es posible formar uniones o intersecciones de una gran colección (infinita) de conjuntos. Hay dos preocupaciones que deben abordarse al responder a esta pregunta. Debemos estar seguros de que la definición de la unión de infinitamente muchos conjuntos es precisa; es decir, caracteriza de manera única a un objeto en el universo matemático. También necesitamos notación para manejar esta idea - ¿cómo especificamos los conjuntos sobre los que estamos tomando el sindicato?

    DEFINICIÓN. Unión infinita, Index set,\(\bigcup_{n=1}^{\infty} X_{n} \quad\) For\(n \in \mathbb{N}^{+}\), let\(X_{n}\) be a set. Entonces\[\bigcup_{n=1}^{\infty} X_{n}=\left\{x \mid \text { for some } n \in \mathbb{N}^{+}, x \in X_{n}\right\} \text {. }\] El conjunto\(\mathbb{N}^{+}\) se llama el conjunto de índices para la unión.

    Esto puede escribirse de algunas maneras diferentes.

    Notación. \(\bigcup_{n \in \mathbb{N}^{+}} X_{n}\)Las siguientes tres expresiones son todas iguales:

    imagen

    Podemos usar conjuntos de índices distintos a\(\mathbb{N}^{+}\).

    DEFINICIÓN. Familia de conjuntos, Unión indexada,\(\bigcup_{\alpha \in A} X_{\alpha} \quad\) Let\(A\) be a set, y para\(\alpha \in A\), let\(X_{\alpha}\) be a set. El conjunto\[\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\}\] se llama familia de conjuntos indexados por\(A\). Entonces\(\bigcup_{\alpha \in A} X_{\alpha}\) Se lee\[\bigcup_{\alpha \in A} X_{\alpha}=\left\{x \mid x \in X_{\alpha} \text { for some } \alpha \in A\right\} \text {. }\] la notación “la unión sobre alfa en A de los conjuntos X sub alfa”. Entonces las intersecciones\[x \in \bigcup_{\alpha \in A} X_{\alpha} \text { if } x \in X_{\alpha} \text { for some } \alpha \in A \text {. }\] generales sobre una familia de conjuntos se definen análogamente:\[\bigcap_{\alpha \in A} X_{\alpha}=\left\{x \mid x \in X_{\alpha} \text { for all } \alpha \in A\right\} .\] EJEMPLO 1.43. Dejar\(X_{n}=\{n+1, n+2, \ldots, 2 n\}\) para cada uno\(n \in \mathbb{N}^{+}\). Entonces\ [\ begin {alineado} &\ bigcup_ {n=1} ^ {\ infty} X_ {n} =\ {k\ in\ mathbb {N}\ mid k\ geq 2\}\\ &\ bigcap_ {n=1} ^ {\ infty} X_ {n} =\ emptyset. \ end {alineado}\] Ejemplo 1.44. Por cada número real positivo\(t\), vamos\(Y_{t}=[11 / t, t]\). Entonces\ [\ begin {aligned} \ bigcup_ {t\ in (\ sqrt {11},\ infty)} Y_ {t} &=\ mathbb {R} ^ {+}\\ \ bigcap_ {t\ in [\ sqrt {11},\ infty)} Y_ {t} &=\ {\ sqrt {11}\}. \ end {alineado}\] Ejemplo 1.45. Dejar\(f: X \rightarrow Y, A \subseteq X\) y\(B \subseteq Y\). Entonces\[\bigcup_{a \in A}\{f(a)\}=f[A] .\] y\[\bigcup_{b \in B} f^{-1}(b)=f^{-1}[B] .\]

    Paradoja de Russell

    A medida que se exploraron las ideas para la teoría de conjuntos, hubo intentos de definir conjuntos de la manera más amplia posible. Se esperaba que cualquier colección de objetos matemáticos que pudiera definirse por una fórmula calificaría como un conjunto. Esta creencia fue conocida como el Principio de Comprensión General (GCP). Desafortunadamente, el GCP dio lugar a conclusiones que eran inaceptables para las matemáticas. Considera la colección definida por la siguiente fórmula simple:\[V=\{x \mid x \text { is a set and } x=x\} .\] Si\(V\) se considera como un conjunto, entonces ya que\(V=V\),\[V \in V \text {. }\] Si esto no es una inconsistencia, es al menos inquietante. Desafortunadamente, se pone peor. Considera la colección\[X=\{x \mid x \notin x\} .\] Entonces\[X \in X \text { if and only if } X \notin X \text {. }\] Este último ejemplo se llama paradoja de Russell, y demostró que el GCP es falso. Claramente tendría que haber algún control sobre qué definiciones dan lugar a conjuntos. La teoría de conjuntos axiomática fue desarrollada para proporcionar reglas para definir rigurosamente conjuntos. Damos una breve discusión en el Apéndice B.

    Ejercicios

    EJERCICIO 1.1. Demostrar que

    \(\{n \in \mathbb{N} \mid n\)es impar y\(n=k(k+1)\) para algunos\(k \in \mathbb{N}\}\)

    está vacío.

    EJERCICIO 1.2. Dejar\(X\) y\(Y\) ser subconjuntos de algún conjunto\(U\). Demostrar las leyes de Morgan:\ [\ begin {aligned} & (X\ copa Y) ^ {c} =X^ {c}\ cap Y^ {c}\\ & (X\ cap Y) ^ {c} =X^ {c}\ copa Y^ {c} \ end {alineado}\] EJERCICIO 1.3. Dejar\(X, Y\) y\(Z\) ser conjuntos. Demostrar\ [\ begin {alineado} &X\ cap (Y\ copa Z) =( X\ cap Y)\ copa (X\ cap Z)\\ &X\ copa (Y\ cap Z) =( X\ copa Y)\ cap (X\ copa Z). \ end {alineado}\] EJERCICIO 1.4. Vamos\(X=\ulcorner 2\urcorner, Y=\ulcorner 3\urcorner\), y\(Z=\ulcorner 1\urcorner\). Cuáles son los siguientes conjuntos:

    (i)\(X \times Y\).

    ii)\(X \times Y \times Z\).

    iii)\(X \times Y \times Z \times \emptyset\).

    iv)\(X \times X\).

    (v)\(X^{n}\).

    EJERCICIO 1.5. Supongamos que\(X\) es un conjunto con\(m\) elementos, y\(Y\) es un conjunto con\(n\) elementos. ¿Cuántos elementos\(X \times Y\) tiene? ¿La respuesta es la misma si uno o ambos conjuntos están vacíos?

    EJERCICIO 1.6. ¿Cuántos elementos\(\emptyset \times \mathbb{N}\) tiene?

    EJERCICIO 1.7. Describir todos los intervalos posibles en\(\mathbb{Z}\).

    EJERCICIO 1.8. Dejar\(X\) y\(Y\) ser conjuntos finitos no vacíos, con\(m\) y\(n\) elementos, respectivamente. ¿Cuántas funciones hay de\(X\) a\(Y\)? ¿Cuántas inyecciones? ¿Cuántas sobrejecciones? ¿Cuántas bijecciones?

    EJERCICIO 1.9. ¿Qué sucede en el Ejercicio\(1.8\) si\(m\) o\(n\) es cero?

    EJERCICIO 1.10. Para cada uno de los siguientes conjuntos, cuáles de las operaciones suma, resta, multiplicación, división y exponenciación son operaciones en el conjunto:

    (i)\(\mathbb{N}\)

    ii)\(\mathbb{Z}\)

    iii)\(\mathbb{Q}\)

    iv)\(\mathbb{R}\)

    v)\(\mathbb{R}^{+}\).

    EJERCICIO 1.11. Dejar\(f\) y\(g\) ser funciones reales,\(f(x)=3 x+8\),\(g(x)=x^{2}-5 x\). ¿Qué son\(f \circ g\) y\(g \circ f\)? ¿Es\((f \circ g) \circ f=f \circ(g \circ f)\)?

    EJERCICIO 1.12. Anote todas las permutaciones de\(\{a, b, c\}\).

    EJERCICIO 1.13. ¿Cuál es la generalización natural del Ejercicio\(1.2\) a un número arbitrario de conjuntos? Verifica tus leyes generalizadas. EJERCICIO 1.14. ¿Cuál es la generalización natural del Ejercicio\(1.3\) a un número arbitrario de conjuntos? Verifica tus leyes generalizadas.

    EJERCICIO 1.15. \(X\)Sea el conjunto de todos los triángulos en el plano,\(Y\) el conjunto de todos los triángulos en ángulo recto, y\(Z\) el conjunto de todos los triángulos no isósceles. Para cualquier triángulo\(T\), deja\(f(T)\) ser el lado más largo de\(T\), y\(g(T)\) ser el máximo de las longitudes de los lados de\(T\). ¿En cuál de los conjuntos\(X, Y, Z\) es\(f\) una función? ¿Sobre cuál es\(g\) una función?

    ¿Cuál es el complemento de\(Z\) in\(X\)? ¿Qué es\(Y \cap Z^{c}\)?

    EJERCICIO 1.16. Por cada real positivo\(t\), vamos\(X_{t}=(-t, t)\) y\(Y_{t}=\)\([-t, t]\). Describir

    (i)\(\bigcup_{t>0} X_{t}\) y\(\bigcup_{t>0} Y_{t}\).

    ii)\(\bigcup_{0<t<10} X_{t}\) y\(\bigcup_{0<t<10} Y_{t}\).

    iii)\(\bigcup_{0<t \leq 10}^{0<t<10} X_{t}\) y\(\bigcup_{0<t \leq 10}^{0<t<10} Y_{t}\).

    iv)\(\bigcap_{t>10}^{0<t \leq 10} X_{t}\) y\(\bigcap_{t>10}^{0<t \leq 10} Y_{t}\).

    \((\mathrm{v}) \bigcap_{t>10}^{t \geq 10} X_{t}\)y\(\bigcap_{t>10}^{t \geq 10} Y_{t}\)

    vi)\(\bigcap_{t>0}^{t>10} X_{t}\) y\(\bigcap_{t>0}^{t>10} Y_{t}\).

    EJERCICIO 1.17. Dejar\(f\) ser la función real coseno, y dejar que\(g\) sea la función real\(g(x)=\frac{x^{2}+1}{x^{2}-1}\).

    (i) ¿Qué son\(f \circ g, g \circ f, f \circ f, g \circ g\) y\(g \circ g \circ f\)?

    (ii) ¿Cuáles son los dominios y rangos de las funciones reales\(f, g, f \circ g\) y\(g \circ f\)?

    EJERCICIO 1.18. Dejar\(X\) ser el conjunto de vértices de un cuadrado en el plano. ¿Cuántas permutaciones\(X\) hay? ¿Cuántos de estos provienen de rotaciones? ¿Cuántos vienen de reflexiones en líneas? ¿Cuántos provienen de la composición de una rotación y una reflexión?

    EJERCICIO 1.19. Cuáles de las siguientes funciones reales son inyectoras y cuáles son suryectivas:

    i)\(f_{1}(x)=x^{3}-x+2\).

    ii)\(f_{2}(x)=x^{3}+x+2\). iii)\(f_{3}(x)=\frac{x^{2}+1}{x^{2}-1}\).

    iv)\(f_{4}(x)= \begin{cases}-x^{2} & x \leq 0 \\ 2 x+3 & x>0\end{cases}\)

    EJERCICIO 1.20. Supongamos\(f: X \rightarrow Y\) y\(g: Y \rightarrow Z\). Demostrar que si\(g \circ f\) es inyectable, entonces\(f\) es inyectable.

    Dé un ejemplo para mostrar que no es\(g\) necesario que sea inyectivo.

    EJERCICIO 1.21. Supongamos\(f: X \rightarrow Y\) y\(g: Y \rightarrow Z\).

    (i) Demostrar que si\(f\) y\(g\) son suryectivas, así es\(g \circ f\).

    (ii) Demostrar que si\(g \circ f\) es suryectiva, entonces una de las dos funciones\(f, g\) debe ser suryectiva (¿cuál?). Dé un ejemplo para mostrar que la otra función no necesita ser suryectiva.

    EJERCICIO 1.22. Para cuál\(n \in \mathbb{N}\) es la función\(f(x)=x^{n}\) una inyección.

    EJERCICIO 1.23. Dejar\(f: \mathbb{R} \rightarrow \mathbb{R}\) ser un polinomio de grado\(n \in \mathbb{N}\). ¿Para qué valores de\(n\) debe\(f\) ser una sobreyección, y para qué valores no es una suryección?

    EJERCICIO 1.24. Anote una bijección de\((X \times Y)\) vez\(Z\) en\(X \times(Y\) cuando\(Z)\). Demostrar que es uno a uno y sobre.

    EJERCICIO 1.25. Dejar\(X\) ser un conjunto con\(n\) elementos. ¿Cuántas permutaciones\(X\) hay?

    EJERCICIO 1.26. Dejar\(f: \mathbb{R} \rightarrow \mathbb{R}\) ser una función construida usando solo números naturales y suma, multiplicación y exponenciación (por ejemplo\(f\) podría definirse como\(\left.x \mapsto(x+3)^{x^{2}}\right)\). ¿Qué puedes decir sobre\(f[\mathbb{N}] ?\) ¿Qué puedes decir si incluimos la resta o división?

    EJERCICIO 1.27. Vamos\(f(x)=x^{3}-x .\) Encuentra conjuntos\(X\) y\(Y\) tal que\(f: X \rightarrow Y\) es una bijección. ¿Hay una elección máxima de\(X ?\) Si la hay, es única? ¿Hay una elección máxima de\(y\)? Si la hay, ¿es única?

    EJERCICIO 1.28. Vamos\(f(x)=\tan (x)\). Utilice la notación de conjunto para definir el dominio y el rango de\(f\). ¿Qué es\(f^{-1}(1)\)? Qué es\(f^{-1}\left[\mathbb{R}^{+}\right] ?\) EJERCICIO 1.29. Para cada una de las siguientes funciones reales, encuentra un intervalo\(X\) que contenga más de un punto y tal que la función sea una biyección de\(X\) a\(f[X]\). Encuentra una fórmula para la función inversa.

    i)\(f_{1}(x)=x^{2}+5 x+6\).

    ii)\(f_{2}(x)=x^{3}-x+2\).

    iii)\(f_{3}(x)=\frac{x^{2}+1}{x^{2}-1}\).

    iv)\(f_{4}(x)= \begin{cases}-x^{2} & x \leq 0 \\ 2 x+3 & x>0\end{cases}\)

    EJERCICIO 1.30. Encuentre fórmulas para las siguientes secuencias:

    i)\(\langle 1,2,9,28,65,126, \ldots\rangle\).

    ii)\(\langle 1,-1,1,-1,1,-1, \ldots\rangle\).

    iii)\(\langle 2,1,10,27,66,125,218, \ldots\rangle\).

    iv)\(\langle 1,1,2,3,5,8,13,21, \ldots\rangle\).

    EJERCICIO 1.31. Que la función real\(f\) sea estrictamente creciente. Demostrar que para cualquiera\(b \in \mathbb{R}, f^{-1}(b)\) está vacío o consiste en un solo elemento, y eso por lo tanto\(f\) es una inyección. Si también\(f\) es una biyección, ¿es la función inversa de\(f\) también aumentar estrictamente?

    EJERCICIO 1.32. \(f\)Sea una función real que sea una biyección. Mostrar que la gráfica de\(f^{-1}\) es el reflejo de la gráfica de\(f\) en la línea\(y=x\).

    EJERCICIO 1.33. Dejar\(X_{n}=\{n+1, n+2, \ldots, 2 n\}\) para cada uno\(n \in \mathbb{N}^{+}\) como en el Ejemplo 1.43. ¿Qué son

    i)\(\cup_{n=1}^{5} X_{n}\).

    ii)\(\cap_{n=4}^{6} X_{n}\).

    iii)\(\cap_{k=1}^{5}\left[\cup_{n=1}^{k} X_{n}\right]\).

    iv)\(\cap_{k=5}^{\infty}\left[\cup_{n=3}^{k} X_{n}\right]\).

    EJERCICIO 1.34. Verificar las aseveraciones del Ejemplo 1.44.

    EJERCICIO 1.35. Dejemos\(f: X \rightarrow Y\), y asumamos eso\(U_{\alpha} \subseteq X\) para cada\(\alpha \in A\), y\(V_{\beta} \subseteq Y\) para cada uno\(\beta \in B\). Demostrar:\ [\ begin {alineado} &\ text {(i)} f\ left (\ bigcup_ {\ alpha\ in A} U_ {\ alpha}\ right) =\ bigcup_ {\ alpha\ in A} f\ left (U_ {\ alpha}\ right)\\ &\ text {(ii)} f\ left (\ bigcap_ {\ alpha\ in A} U_ {\ alfa}\ derecha)\ subseteq\ bigcap_ {\ alpha\ in A} f\ izquierda (U_ {\ alpha}\ derecha)\\ &\ text {( iii)} f^ {-1}\ izquierda (\ bigcup_ {\ beta\ en B} V_ {\ beta}\ derecha) =\ bigcup_ {\ beta\ en B} f^ {-1}\ izquierda (V_ {\ beta}\ derecha)\\\\ texto {(iv)} f^ {-1}\ izquierda (\ bigcap_ {\ beta\ en B} V_ {beta\}\ derecha) =\ bigcap_ {\ beta\ in B} f^ {-1}\ izquierda (V_ {\ beta}\ derecha)\ text {.}\ end {alineado} \] Tenga en cuenta que (ii) tiene contención en su lugar de igualdad. Dar un ejemplo de contención adecuada en la parte (ii). Encontrar una condición\(f\) que garantice la igualdad en el (ii).

    Consejos para comenzar con algunos ejercicios

    Ejercicio 1.2. Esto se podría hacer con un diagrama de Venn. No obstante, una vez que haya más de tres conjuntos (ver Ejercicio 1.13), este enfoque será difícil. Una prueba algebraica se generalizará más fácilmente, así que trata de encontrar una aquí. Argumentan por las dos inclusiones\ [\ begin {alineadas} (X\ copa Y) ^ {c} &\ subseteq X^ {c}\ cap Y^ {c}\ X^ {c}\ cap Y^ {c} &\ subseteq (X\ copa Y) ^ {c} \ end {alineado}\] por separado. En el primero, por ejemplo, asumir eso\(x \in(X \cup Y)^{c}\) y demostrar que debe ser en ambos\(X^{c}\) y\(Y^{c}\).

    Ejercicio 1.13. Parte del problema aquí es la notación - ¿y si tienes más conjuntos que letras? Comience con un número finito de conjuntos contenidos en\(U\), y llámalos\(X_{1}, \ldots, X_{n}\). ¿Cuál crees que es el complemento de su unión? Demuéstralo como lo hiciste cuando\(n=2\) en el Ejercicio 1.2. (¿Ve la ventaja de tener una prueba en Ejercicio\(1.2\) que no utilizó diagramas de Venn? Una de las razones por las que a los matemáticos les gusta tener múltiples pruebas del mismo teorema es que es probable que cada prueba se generalice de una manera diferente). ¿Puedes hacer que funcione el mismo argumento si tus conjuntos están indexados por algún conjunto de índices infinito?

    Ahora haz lo mismo con el complemento de la intersección.

    Ejercicio 1.14. Nuevamente hay un problema notacional, pero mientras\(Y\) y\(Z\) juega el mismo papel en el Ejercicio 1.3,\(X\) juega un papel diferente. Así que reescribe las ecuaciones como\ [\ begin {aligned} &X\ cap\ left (Y_ {1}\ cup Y_ {2}\ right) =\ left (X\ cap Y_ {1}\ right)\ cup\ left (X\ cap Y_ {2}\ right)\\ &X\ cup\ left (Y_ {1}\ cap Y_ {2}\ right) =\ left (X\ copa Y_ {1}\ derecha)\ tapa\ izquierda (X\ copa Y_ {2}\ derecha), \ end {alineado}\] y mira si puedes generalizar estos.

    Ejercicio 1.35. (i) Nuevamente, esto reduce a probar dos contenciones. Si\(y\) está en el lado izquierdo, entonces debe haber algunos\(x_{0}\) en algunos\(U_{\alpha_{0}}\) tales que\(f(x)=y\). Pero luego\(y\) está adentro\(f\left(U_{\alpha_{0}}\right)\), así\(y\) está en el lado derecho.

    Por el contrario, si\(y\) está en el lado derecho, entonces debe estar en\(f\left(U_{\alpha_{0}}\right)\) para algunos\(\alpha_{0} \in A\). Pero luego\(y\) está adentro\(f\left(\cup_{\alpha \in A} U_{\alpha}\right)\), y también lo está en el lado izquierdo.
    (1)

    \(5-2 \sqrt{-2}\)

    \(\sqrt{5}-\sqrt{-2}\)

    \(4=\sqrt{2}+\frac{}{}\)

    \(4+\frac{2}{4}\)

    \(\sqrt{4-2}+\frac{12}{}\)

    4

    \(\operatorname{sins}^{-2}+\frac{2}{}\)

    imagen

    1

    (\(2.7\)

    \(\sqrt{2-25}+\)

    (2)

    (\(2.7\)

    (2

    \(4=\sqrt{2}+\)

    \(\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}\)

    (\(2.7\)

    4

    (2020

    (2

    • 2

    2

    (

    r.

    a\(2+2\)

    \(\sqrt{2-2 \cdot 2 \cdot\)

    (

    (

    \((\sqrt{2}+2\)

    (

    4

    (200

    (\(2-2\)

    (

    \(\mathrm{~ r e s ~ a ~}\)

    (\(2-2=\)

    (2)

    4

    \((2+2)\)

    4

    4

    imagen

    imagen

    (1)

    • CAPÍTULO 2

    Relaciones

    Definiciones

    DEFINICIÓN. Relación Let\(X\) and\(Y\) be sets. Una relación de\(X\) a\(Y\) es un subconjunto de\(X \times Y\).

    Alternativamente, cualquier conjunto de pares ordenados es una relación. Si\(Y=X\), decimos que\(R\) es una relación sobre\(X\).

    Notación. \(x\)\(X\)Ry Let and\(Y\) be sets y\(R\) ser una relación sobre\(X \times Y\). Si\(x \in X\) y\(y \in Y\), entonces podemos expresar que\(x\) lleva\(R\) relación con\(y\) (es decir\((x, y) \in R\)) por escrito\(x R y\).

    Entonces para\(X\) y\(Y\) establece,\(x \in X, y \in Y\), y\(R\) una relación sobre\(X \times Y\),\(x R y\) si y solo si\((x, y) \in R\).

    EJEMPLO 2.1. Deje\(\leq\) ser el pedido habitual en\(\mathbb{Q}\). Entonces\(\leq\) es una relación sobre\(\mathbb{Q}\). Escribimos\[1 / 2 \leq 2\] para expresar que\(1 / 2\) lleva la relación\(\leq\) con 2.

    EJEMPLO 2.2. Definir una relación\(R\) de\(\mathbb{Z}\) a\(\mathbb{R}\) por\(x R y\) si\(x>y+3\). Entonces podríamos escribir\(7 R \sqrt{2}\) o\((7, \sqrt{2}) \in R\) decir que\((7, \sqrt{2})\) está en la relación.

    EJEMPLO 2.3. Vamos\(X=\{2,7,17,27,35,72\}\). Definir una relación\(R\) por\(x R y\) si\(x \neq y\) y\(x\) y\(y\) tener un dígito en común. Entonces

    \(R=\{(2,27),(2,72),(7,17),(7,27),(7,72),(17,7),(17,27),(17,72),\),\((27,2),(27,7),(27,17),(27,72),(72,2),(72,7),(72,17),(72,27)\}\). EJEMPLO 2.4. Dejar\(P\) ser el conjunto de todos los polígonos en el plano. Definir una relación\(E\) diciendo\((x, y) \in E\) si\(x\) y\(y\) tener el mismo número de lados.

    ¿Cómo usan las relaciones los matemáticos? Una relación en un conjunto se puede utilizar para imponer la estructura. En el Ejemplo 2.1, la relación de orden habitual\(\leq\) sobre nos\(\mathbb{Q}\) permite pensar que los números racionales se encuentran en una línea numérica, lo que proporciona una visión adicional de los números racionales. En el Ejemplo 2.4, podemos usar la relación para romper polígonos en los conjuntos de triángulos, cuadriláteros, pentágonos, etc.

    Una función\(f: X \rightarrow Y\) puede pensarse como un tipo muy especial de relación de\(X\) a\(Y\). En efecto, la gráfica de la función es un conjunto de pares ordenados en\(X \times Y\), pero tiene la propiedad adicional de que cada\(x\) in\(X\) ocurre exactamente una vez como primer elemento de un par en la relación. Como discutimos en la Sección 1.3, las funciones son una forma útil de relacionar conjuntos.

    \(X\)Sea un conjunto, y\(R\) una relación sobre\(X\). Aquí hay algunas propiedades importantes que la relación puede tener o no.

    DEFINICIÓN. \(R\)Reflejo es reflexivo si para cada\(x \in X\),\[x R x .\] Simétrico\(R\) es simétrico si para alguno\(x, y \in X\),\[x R y \text { implies } y R x \text {. }\] Antisimétrico\(R\) es antisimétrico si para alguno\(x, y \in X\), \[[(x, y) \in R \text { and }(y, x) \in R] \text { implies } x=y \text {. }\]Transitivo\(R\) es transitivo si para alguno\(x, y, z \in X\),\[[x R y \text { and } y R z] \text { implies }[x R z] \text {. }\] ¿Cuál de estas cuatro propiedades se aplica a las relaciones dadas en los Ejemplos 2.1-2.4 (Ejercicio 2.1)?

    Pedidos

    Una relación en un conjunto puede pensarse como parte de la estructura impuesta al conjunto. Entre las relaciones más importantes en un conjunto están las relaciones de orden.

    DEFINICIÓN. Ordenamiento parcial Dejar\(X\) ser un conjunto y\(R\) una relación sobre\(X\). Decimos que\(R\) es un ordenamiento parcial si:
    (1)\(R\) es reflexivo
    (2)\(R\) es antisimétrico
    (3)\(R\) es transitivo.

    EJEMPLO 2.5. \(X\)Déjese ser una familia de conjuntos. La relación\(\subseteq\) es un ordenamiento parcial sobre\(X\). Cada conjunto es un subconjunto de sí mismo, por lo que la relación es reflexiva. Si\(Y \subseteq Z\) y\(Z \subseteq Y\), entonces\(Y=Z\), entonces la relación es antisimétrica. Por último, si\(Y \subseteq Z\) y\(Z \subseteq W\) entonces\(Y \subseteq W\), entonces la relación es transitiva.

    EJEMPLO 2.6. \(R\)Sea la relación sobre\(\mathbb{N}^{+}\) definida por\(x R y\) si y sólo si hay\(z \in \mathbb{N}^{+}\) tal que\[x z=y .\] Entonces\(R\) es un ordenamiento parcial de\(\mathbb{N}^{+}\). (Demostrar esto: Ejercicio 2.2).

    DEFINICIÓN. Ordenación lineal Let\(X\) Ser un conjunto y\(R\) ser un orden parcial de\(X\). Decimos que\(R\) es un ordenamiento lineal, también llamado ordenamiento total, siempre que, para cualquiera\(x, y \in X\), ya sea\(x R y\) o\(y R x\).

    Tenga en cuenta que dado que un orden lineal es antisimétrico, para cualquier distinto\(x\) y\(y\), exactamente uno de\(x R y\) y\(y R x\) mantiene.

    Ejemplo 2.7. El orden\(\leq\) en\(\mathbb{N}\) (o\(\mathbb{R}\)) es un orden lineal. Así es la relación\(\geq\). La relación no\(<\) es (¿por qué?).

    EJEMPLO 2.8. Vamos\(X=\mathbb{R}^{n}\). Podemos definir una relación reflexiva de la\(X\) siguiente manera. Dejar\(x=\left(a_{1}, \ldots, a_{n}\right)\) y\(y=\left(b_{1}, \ldots, b_{n}\right)\) ser miembros distintos de\(X\). Que\(k \in \mathbb{N}^{+}\) sea el menor número tal que\(a_{k} \neq b_{k}\). Entonces definimos\[x R y \text { if and only if } a_{k}<b_{k} .\] Entonces\(R\) es un ordenamiento lineal de\(X\). Se llama el orden del diccionario.

    La noción de un ordenamiento lineal es probablemente natural para ti, y la has usado intuitivamente desde que empezaste a estudiar aritmética. La relación\(\leq\) ayuda a visualizar el conjunto como una línea en la que la ubicación relativa de dos elementos del conjunto está determinada por el orden lineal. Si está considerando un conjunto con operaciones, esto a su vez puede ayudar a visualizar cómo se comportan las operaciones. Por ejemplo, piense en usar una recta numérica para visualizar suma, resta y multiplicación de enteros.

    Los ordenamientos parciales son generalizaciones de ordenamientos lineales, y\(\leq\) es el ejemplo más obvio de un ordenamiento lineal. Debido a esto, el símbolo normal para un ordenamiento parcial es\(\preceq\) (también recuerda al símbolo\(\subseteq\), que es el ejemplo que la mayoría de los matemáticos tienen en cuenta al pensar en un ordenamiento parcial).

    EJEMPLO 2.9. Deja\(X\) ser el conjunto de todas las colecciones de manzanas y naranjas. Si\(x, y\) están en\(X\), entonces diga\(x \preceq y\) si el número de manzanas en\(x\) es menor o igual que el número de manzanas en\(y\), y el número de naranjas en\(x\) es menor o igual que el número de naranjas en\(y\). Se trata de un ordenamiento parcial. Puede que no puedas comparar manzanas con naranjas, pero puedes decir que ¡2 manzanas y 5 naranjas es inferior a 4 manzanas y 6 naranjas!

    Una forma de visualizar un orden parcial\(\preceq\) en un conjunto finito\(X\) es imaginar flechas que conectan elementos distintos de\(X, x\) y\(y\), si\(x \preceq y\) y no hay un tercer punto distinto que\(z\) satisfaga \(x \preceq z \preceq y\). Entonces dos elementos\(a\) y\(b\) en\(X\) satisfarán\(a \preceq b\) si y sólo si se puede llegar de\(a\) a\(b\) siguiendo un camino de flechas.

    EJEMPLO 2.10. Considera la gráfica en el conjunto\(X=\{a, b, c, d, e, f\}\) dan en la Figura 2.11.

    imagen

    FIGURA 2.11. Imagen de un pedido parcial

    Ilustra el orden parcial que podría describirse como la relación reflexiva, transitiva más pequeña\(\preceq\) sobre la\(X\) que satisface\(a \preceq b, a \preceq c, b \preceq\)\(d, b \preceq e, c \preceq e, e \preceq f .\)

    Relaciones de equivalencia

    DEFINICIÓN. Relación de equivalencia Let\(X\) be a set and\(R\) a relation on\(X\). Decimos que\(R\) es una relación de equivalencia si

    (1)\(R\) es reflexivo

    (2)\(R\) es simétrico

    (3)\(R\) es transitivo.

    EJEMPLO 2.12. Definir una relación\(R\) sobre\(\mathbb{R}\) por\(x R y\) si y solo si\(x^{2}=\)\(y^{2}\). Entonces\(R\) es una relación de equivalencia.

    EJEMPLO 2.13. \(R\)Sea una relación definida de la\(\mathbb{Z} \times \mathbb{Z}\) siguiente manera. Si\(a, b, c, d \in \mathbb{Z}\),\[(a, b) R(c, d) \text { if and only if } a+d=b+c \text {. }\] Entonces\(R\) es una relación de equivalencia. En efecto, vamos a revisar las tres propiedades.

    Reflexivo: Por (2.14), tenemos\((a, b) R(a, b)\) si\(a+b=a+b\), que claramente sostiene. Simétrico: Supongamos\((a, b) R(c, d)\), entonces\(a+d=b+c\). Para ver si\((c, d) R(a, b)\), debemos comprobar si\(c+b=d+a\); pero esto se sostiene por la conmutatividad de la adición.

    Transitivo: Supongamos\((a, b) R(c, d)\) y\((c, d) R(e, f)\). Debemos comprobar que\((a, b) R(e, f)\), en otras palabras que\[a+f=b+e .\] tenemos\(a+d=b+c\) y\(c+f=d+e\), y sumando estas dos ecuaciones obtenemos\[a+d+c+f=b+c+d+e .\] Cancelando\(c+d\) de cada lado de (2.16), obtenemos (2.15) como se desee.

    EJEMPLO 2.17. Dejar\(R\) ser una relación sobre\(X=\mathbb{Z} \times \mathbb{N}^{+}\) definida por\[(a, b) R(c, d) \text { if and only if } a d=b c \text {. }\] Entonces\(R\) es una relación de equivalencia sobre\(X\). (Demostrar esto; Ejercicio 2.4).

    EJEMPLO 2.18. Vamos\(f: X \rightarrow Y\). Definir una relación\(R_{f}\) on\(X\) por\[x R_{f} y \text { if and only if } f(x)=f(y) .\] Entonces\(R_{f}\) es una relación de equivalencia. Comprobamos las condiciones para una relación de equivalencia:

    \(R_{f}\)es claramente reflexivo, ya que, para cualquier\(x \in X\),\[f(x)=f(x) .\]\(R_{f}\) es simétrico ya que, para cualquiera\(x \in X\) y\(y \in X\),\[f(x)=f(y) \text { if and only if } f(y)=f(x) .\] Mostrar\(R_{f}\) es transitivo, vamos \(x, y, z \in X\). Si\(f(x)=f(y)\) y\(f(y)=\)\(f(z)\) entonces\(f(x)=f(z)\).

    Las relaciones de equivalencia tienen tres de las propiedades clave de la identidad. Permiten relacionar objetos en un conjunto que deseamos considerar como “los mismos” en un contexto dado. Esto nos permite enfocarnos en qué diferencias entre objetos matemáticos son relevantes para la discusión en cuestión, y cuáles no. Por ello, es un símbolo común para una relación de equivalencia\(\sim\).

    DEFINICIÓN. Clase de equivalencia,\([x]_{R}\) Let\(R\) Ser una relación de equivalencia en un conjunto\(X\). Si\(x \in X\) entonces la clase de equivalencia de\(x\) módulo\(R\), denotada por\([x]_{R}\), es\[[x]_{R}=\{y \in X \mid x R y\} .\] Si\(y \in[x]_{R}\) llamamos a\(y\) un elemento representativo de\([x]_{R}\). Se escribe el conjunto de todas las clases\(\left\{[x]_{R} \mid x \in X\right\}\) de equivalencia\(X / R\). Se le llama el cociente espacio de\(X\) por\(R\).

    Podemos utilizar\([x]\) para la clase de equivalencia de\(x\), siempre que la relación de equivalencia sea clara.

    Notación. Equivalencia mod\(R, \equiv_{R}, \sim\) Let\(R\) Ser una relación de equivalencia en un conjunto\(X\). Podemos expresarlo\(x R y\) por escrito\[x \equiv y \bmod R\]\[x \equiv_{R} y\] o por la\[x \sim y .\] Proposición 2.19. Supongamos que\(\sim\) es una relación de equivalencia sobre\(X\). Vamos\(x, y \in X\). Si\(x \sim y\), entonces\[[x]=[y] .\] Si no\(x\) es equivalente a\(y(x \nsim y)\), entonces\[[x] \cap[y]=\emptyset .\] Prueba. (i) Asumir\(x \sim y\). Demostremos eso\([x] \subseteq[y]\). Vamos\(z \in[x]\). Esto significa que\(x \sim z\). Ya que\(\sim\) es simétrico\(x \sim y\), y, tenemos\(y \sim x\). Como\(y \sim x\) y\(x \sim z\), por transitividad de\(\sim\) lo conseguimos\(y \sim z\). Por lo tanto\(z \in[y]\). Ya que\(z\) es un elemento arbitrario de\([x]\), lo hemos demostrado\([x] \subseteq[y]\). Como\(y \sim x\), el mismo argumento con\(x\) e\(y\) intercambiado da\([y] \subseteq[x]\), y por lo tanto\([x]=[y]\).

    (ii) Ahora asuma eso\(x\) y no\(y\) son equivalentes. Debemos demostrar que no existe\(z\) tal que\(z \in[x]\) y\(z \in[y]\). Vamos a argumentar por contradicción. Supongamos que hubiera tal\(z\). Entonces tendríamos\[x \sim z \quad \text { and } \quad y \sim z .\] Por simetría, tenemos también eso\(z \sim y\), y por transitividad, entonces tenemos eso\(x \sim y\). Esto contradice la suposición que no\(x\) equivale a\(y\). Entonces si\(x\) y no\(y\) son equivalentes, no\(z\) pueden existir que sea simultáneamente en ambos\([x]\) y\([y]\). Por lo tanto\([x]\) y\([y]\) son conjuntos disjuntos, según se requiera.

    Entonces, ¿qué hemos mostrado? No hemos demostrado que ninguna relación en particular sea una relación de equivalencia. Más bien hemos demostrado que cualquier relación de equivalencia en un conjunto divide el conjunto en clases de equivalencia disjuntas.

    Como veremos a lo largo de este libro, y verás a lo largo de tus estudios matemáticos, esta es una herramienta sorprendentemente poderosa.

    Definición. Pares disjuntos Let\(\left\{X_{\alpha} \mid \alpha \in A\right\}\) be a family of sets. La familia es disjunta por parejas si es por alguna\(\alpha, \beta \in A, \alpha \neq \beta\),\[X_{\alpha} \cap X_{\beta}=\emptyset .\] DEFINICIÓN. Partition Let\(Y\) Ser un conjunto y\(\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\}\) ser una familia de conjuntos no vacíos. La colección\(\mathcal{F}\) es una partición de\(Y\) si\(\mathcal{F}\) es disjunta por pares y\[Y=\bigcup_{\alpha \in A} X_{\alpha} .\] Dada una relación de equivalencia\(\sim\) en un conjunto\(X\), las clases de equivalencia con respecto a \(\sim\)dar una partición de\(X\). Por el contrario, las particiones dan lugar a relaciones de equivalencia.

    TEOREMA 2.21. (i)\(X\) Sea un conjunto, y\(\sim\) una relación de equivalencia sobre\(X\). Entonces\(X / \sim\) es una partición de\(X\). (ii) Por el contrario, dejar\(\left\{X_{\alpha} \mid \alpha \in A\right\}\) ser una partición de\(X\). Dejar\(\sim\) ser la relación en\(X\) definida por\(x \sim y\) siempre\(x\) y\(y\) son miembros del mismo conjunto en la partición. Entonces\(\sim\) es una relación de equivalencia.

    PRUEBA. La parte (i) del teorema es Proposición\(2.19\) replanteada, y dimos la prueba anterior. Para probar lo contrario, debemos demostrar que la relación\(\sim\) definida como en la parte (ii) del teorema es una equivalencia.

    Reflexivity: Vamos\(x \in X\). Entonces\(x\) está en algunos\(X_{\alpha_{0}}\), ya que la unión de todos estos conjuntos es todo de\(X\). Por lo tanto\(x \sim x\).

    Simetría: Supongamos\(x \sim y\). Entonces hay algunos\(X_{\alpha_{0}}\) tales que\(x \in X_{\alpha_{0}}\) y\(y \in X_{\alpha_{0}}\). Esto implica que\(y \sim x\).

    Transitividad: Supongamos\(x \sim y\) y\(y \sim z\). Después hay conjuntos\(X_{\alpha_{0}}\) y\(X_{\alpha_{1}}\) tal que ambos\(x\) y\(y\) están en\(X_{\alpha_{0}}\), y ambos\(y\) y\(z\) están en\(X_{\alpha_{1}}\). Pero como los conjuntos\(X_{\alpha}\) forman una partición, y\(y\) está en ambos\(X_{\alpha_{0}}\) y\(X_{\alpha_{1}}\), debemos tener eso\(X_{\alpha_{0}}=X_{\alpha_{1}}\). Esto implica que\(x\) y\(z\) están en el mismo miembro de la partición, y así\(x \sim z\).

    Construyendo Bijecciones

    Consideremos una aplicación abstracta particularmente interesante e importante de las clases de equivalencia. Vamos\(f: X \rightarrow Y\). No\(f\) es necesario que la función sea una inyección o una sobreyección. Sin embargo, ya hemos discutido la conveniencia de encontrar una “inversa” para\(f\), aun cuando no cumpla con las condiciones necesarias para la existencia de una inversa. En la Sección\(1.3\) consideramos la función\(\left.f\right|_{D}\), dónde\(D \subseteq X\) y\(\left.f\right|_{D}\) es una inyección. Otro enfoque es utilizar la función\(f\) para crear una nueva función en un dominio distinto que conserve gran parte de la información de\(f\).

    Utilizamos\(f\) para inducir una relación de equivalencia sobre\(X\). Definir una relación\(\sim\) sobre\(X\) por\[x \sim y \text { if and only if } f(x)=f(y) .\] Mostramos en Ejemplo\(2.18\) que\(\sim\) es una relación de equivalencia; es la relación de equivalencia en\(X\) inducida por\(f\). La relación de equivalencia\(\sim\) induce una partición de\(X\), es decir,\(X / \sim(\) que es el conjunto\(\{[x] \mid x \in X\}\) de todas las clases de equivalencia). Notación. \(X / f\)Dejar\(f: X \rightarrow Y\) y\(\sim\) ser la relación de equivalencia sobre\(X\) inducido por\(f\). Escribimos\(X / f\) para el conjunto de clases de equivalencia inducidas por\(\sim\) on\(X\).

    Una clase de equivalencia in\(X / f\) es la imagen inversa de un elemento en\(\operatorname{Ran}(f)\). Es decir, si\(x \in X\) y\(f(x)=y\),\[[x]=f^{-1}(y) .\] Entonces\[X / f=\left\{f^{-1}(y) \mid y \in \operatorname{Ran}(f)\right\} .\] Los elementos de\(X / f\) se llaman los conjuntos de niveles de\(f\). La inspiración para esto viene de pensar en un mapa topográfico. Las curvas en un mapa topográfico correspondientes a altitudes fijas se denominan curvas de nivel. Considera la función desde un punto en un mapa hasta la altitud de la ubicación física representada por el punto en el mapa. Las curvas de nivel en el mapa son subconjuntos de los conjuntos de niveles de esta función.

    Notación. \(\Pi_{f}\)Vamos\(f: X \rightarrow Y\). La función\(\Pi_{f}: X \rightarrow X / f\) se define por\(\Pi_{f}(x)=[x]_{f}\), donde\([x]_{f}\) está la clase de equivalencia de\(x\) con respecto a la relación de equivalencia inducida por\(f\).

    Deja\(Z \subseteq Y\) ser el rango de\(f\). Definimos una nueva función,\(\widehat{f}: X / f \rightarrow Z\) por\[\widehat{f}([x])=f(x) .\] La función\(\widehat{f}\) está estrechamente relacionada con\(f\); de hecho, para cada\(x \in X\),\[f(x)=\widehat{f} \circ \Pi_{f}(x) .\] Esto a veces se ilustra con un diagrama, como en la Figura \(2.22\).

    La función\(\hat{f}\) es una biyección. En este sentido, cada función puede asociarse canónicamente con una biyección. Consideramos la función que vimos en la Sección 1.3.

    imagen

    FIGURA 2.22. Hacer una función en una biyección

    EJEMPLO 2.23. Vamos\(f(x)=\tan (x)\). Como comentamos anteriormente, podemos “invertir” esta función considerando la función Tan:\((-\pi / 2, \pi / 2) \rightarrow\)\(\mathbb{R}\) por\[\operatorname{Tan}=\left.\tan \right|_{(-\pi / 2, \pi / 2)}\] La función Tan es una biyección, y tiene una inversa,\[\operatorname{Arctan}: \mathbb{R} \rightarrow(-\pi / 2, \pi / 2)\] Para cualquiera\(k \in \mathbb{Z}\) hay una restricción correspondiente de tan,\[\tan \mid\left(\frac{(2 k+1) \pi}{2}, \frac{(2 k+3) \pi}{2}\right)\] que es una biyección, y por lo tanto tiene una función inversa.

    Otra biyección se puede construir sobre las clases de equivalencia inducidas por\(f(x)=\tan (x)\). Un conjunto de niveles de\(f\) es\([x]_{f}=\{x+k \pi \mid k \in \mathbb{Z}\}\). \(X\)Sea el dominio del bronceado. Entonces\[X / f=\left\{[x]_{f} \mid x \in X\right\}\] podemos interpretar una clase de equivalencia\([x]_{f}\) con respecto a los ángulos en posición estándar en el plano cartesiano. La clase de equivalencia de\(x\) es el conjunto de ángulos en posición estándar que tienen lado terminal colineal con el lado terminal del ángulo\(x\) - ver Figura 2.24.

    imagen

    FIGURA 2.24. Ángulos colineales

    Siguiendo la construcción descrita anteriormente, la función\(\Pi_{f}: X \rightarrow\)\(X / f\) es la función\[\Pi_{f}(x)=[x]_{f}=\{x+k \pi \mid k \in \mathbb{Z}\} .\] La función\(\widehat{f}: X / f \rightarrow \mathbb{R}\) dada por\[\widehat{f}\left([x]_{f}\right)=f(x)\] es una biyección. Además,\[\tan =\widehat{f} \circ \Pi_{f} .\] si\(x \in X\), entonces\(\Pi_{f}(x)\) es el conjunto de todos los ángulos que tienen lado terminal colineal con el lado terminal de ángulo\(x\) en posición estándar. Así nos\(\Pi_{f}\) dice que solo\(\tan\) se puede distinguir la pendiente del lado terminal del ángulo - no el cuadrante del ángulo o cuántas revoluciones subtendió el ángulo.

    Aritmética Modular

    Definimos una relación de equivalencia que nos ayudará a obtener conocimientos en la teoría de números. DEFINICIÓN. Divide,\(a \mid b\) Let\(a\) y\(b\) ser enteros. Entonces\(a\) divide\(b\), escrito\(a \mid b\), si hay\(c \in \mathbb{Z}\) tal que\[a \cdot c=b .\] DEFINICIÓN. Congruencia,\(x \equiv y \bmod n, \equiv_{n}\) Vamos\(x, y, n \in \mathbb{Z}\) y\(n>1\). Entonces\[x \equiv y \bmod n\] (o\(x \equiv_{n} y\)) si\[n \mid(x-y) .\] La relación\(\equiv_{n}\) on\(\mathbb{Z}\) se llama congruencia\(\bmod n\).

    TEOROMA\(2.25\). Congruencia mod\(n\) es una relación de equivalencia en\(\mathbb{Z}\).

    Ejercicio 2.5: Demostrar Teorema 2.25.

    DEFINICIÓN. Clase de congruencia Las clases de equivalencia de la relación\(\equiv_{n}\) se denominan clases de congruencia, clases de residuo o clases de resto\(\bmod n\). El conjunto de clases de congruencia\(\bmod n\) puede ser escrito\(\mathbb{Z}_{n}\) o\(\mathbb{Z} / n \mathbb{Z}\).

    Por supuesto\(\mathbb{Z}_{n}\) que es una partición de\(\mathbb{Z}\). Cuando\(n=2\), las clases de residuo se llaman los números pares e impares. Muchos de los hechos que conoces sobre números pares e impares se generalizan si piensas en ellos como clases de residuos. ¿Para qué sirven las clases de residuos\(n=3\)?

    Lo dejamos como un ejercicio (Ejercicio 2.6) para probar que dos enteros están en la misma clase de resto\(\bmod n\) siempre que tengan el mismo resto cuando se dividan por\(n\).

    Notación. [a] Fijar un número natural\(n \geq 2\). Deja entrar a un\(\mathbb{Z}\). Representamos la clase de equivalencia de a con respecto a la relación\(\equiv_{n}\) por\([a]\).

    Proposición 2.26. Si\(a \equiv r \bmod n\) y\(b \equiv s \bmod n\), entonces\[\text { (i) } \quad a+b \equiv r+s \bmod n\] y\[\text { (ii) } a b \equiv r s \quad \bmod n .\] Prueba. (i) Supongamos que\(a \equiv r \bmod n\) y\(b \equiv s \bmod n\). Entonces\(n \mid(a-r)\) y\(n \mid(b-s)\). \[n \mid(a+b-(r+s))\]Por lo tanto\[a+b \equiv r+s \quad \bmod n\] demostrando (i).

    Para probar (ii), tenga en cuenta que existen\(i, j \in \mathbb{Z}\) tales que\[a=n i+r\] y\[b=n j+s\] Entonces\[a b=n^{2} j i+r n j+s n i+r s=n(n j i+r j+s i)+r s\] Por lo tanto\[n \mid(a b-r s)\] y\[a b \equiv r s \quad \bmod n\] De ahí las operaciones algebraicas que\(\mathbb{Z}_{n}\) “hereda” de \(\mathbb{Z}\)están bien definidos. Es decir, podemos definir\(+\) y seguir\(\cdot\)\(\mathbb{Z}_{n}\) por\[[a]+[b]=[a+b]\] y\[[a] \cdot[b]=[a \cdot b]\] En matemáticas, cuando preguntas si algo está “bien definido”, te refieres a que en algún lugar de la definición se hizo una elección, y quieres saber si una elección diferente habría resultado en el mismo resultado final. Por ejemplo, vamos\(X_{1}=\{-2,2\}\) y vamos\(X_{2}=\{-1,2\}\). Definir\(y_{1}\) por: “Elige\(x\)\(X_{1}\) y deja\(y_{1}=x^{2}\). Definir\(y_{2}\) por: “Elige\(x\)\(X_{2}\) y deja\(y_{2}=x^{2}\). Entonces\(y_{1}\) está bien definido, y es el número 4; pero no\(y_{2}\) está bien definido, ya que diferentes elecciones de\(x\) dan lugar a diferentes números.

    En (2.27) y (2.28), los lados de la derecha dependen a priori de una elección particular de elementos de las clases de equivalencia\([a]\) y\([b]\). Pero Proposición\(2.26\) asegura que la suma y el producto así definidos sean independientes de la elección de los representantes de las clases de equivalencia.

    EJEMPLO 2.29. \(Z_{2}\)Además y multiplicación se definen de la siguiente manera:

    (1)\([0]+[0]=[0]\)

    (2)\([0]+[1]=[1]+[0]=[1]\)

    (3)\([1]+[1]=[0]\)

    (4)\([0] \cdot[0]=[0] \cdot[1]=[1] \cdot[0]=[0]\)

    (5)\([1] \cdot[1]=[1]\).

    Observe que si lee\([0]\) como “par” y [1] como “impar”, estas son reglas que aprendió hace mucho tiempo.

    Al trabajar con aritmética modular podemos elegir los representantes de las clases de resto que mejor se adapten a nuestras necesidades. Por ejemplo,\[79 \cdot 23 \equiv 2 \cdot 2 \equiv 4 \bmod 7 .\] en otras palabras\[[79 \cdot 23]=[79] \cdot[23]=[2] \cdot[2]=[4] .\] EJEMPLO 2.30. Puede recordar de su exposición temprana a las tablas de multiplicación que la multiplicación por nueve resultó en un producto cuyos dígitos sumaron a nueve. Esto generaliza muy bien con la aritmética modular. Específicamente, si\(a_{n} \in\ulcorner 10\urcorner\) para\(0 \leq n \leq N\) entonces\[\sum_{n=0}^{N} a_{n} 10^{n} \equiv \sum_{n=0}^{N} a_{n} \bmod 9 .\] El resto de cualquier entero dividido por 9 es igual al resto de la suma de los dígitos de ese entero cuando se divide por 9. Prueba. La observación clave es que\[10 \equiv 1 \bmod 9 .\] Por lo tanto\ [\ begin {array} {lll} 10^ {2}\ equiv 1\ cdot 1\ equiv 1 &\ bmod 9\\ 10^ {3}\ equiv 1\ cdot 1\ cdot 1\ equiv 1 &\ bmod 9, \ end {array}\] y así sucesivamente para cualquier potencia de 10:\[10^{n} \equiv 1 \bmod 9 \text { for all } n \in \mathbb{N} \text {. }\] (Esta inducción a todos poderes de 10 es sencillo, pero para probarlo formalmente necesitaremos la noción de inducción matemática del Capítulo 4). Por lo tanto en el lado izquierdo de (2.31), trabajando mod 9, podemos sustituir todas las potencias de 10 por 1, y esto nos da el lado derecho.

    EJEMPLO 2.32. La observación de que el residuo de un número mod 9 es el mismo que el de la suma de los dígitos se puede utilizar en una técnica llamada “casting out nueves” para verificar la aritmética.

    Por ejemplo, considere la siguiente suma (incorrecta). El número en la penúltima columna es la suma de los dígitos, y el número en la última columna es la suma repetida de los dígitos hasta alcanzar un número entre 0 y 9.

    1588 22 4
    \(+1805\) 14 5
    3493 19 1

    Si la suma se hubiera realizado correctamente, el resto mod 9 de la suma equivaldría a la suma de los restos; así sabemos que se cometió un error.

    \(2.33\)EJEMPLO. ¿Cuál es el último dígito de\(7^{7}\)?

    Queremos saber\(7^{7} \bmod 10\). Tenga en cuenta que, módulo\(10,7^{0} \equiv 1,7^{1} \equiv\)\(7,7^{2} \equiv 9,7^{3} \equiv 3,7^{4} \equiv 1\). Entonces\(7^{7}=7^{4} 7^{3} \equiv 1 \cdot 3 \equiv 3\), y así 3 es el último dígito de\(7^{7}\). EJEMPLO 2.34. ¿Cuál es el último dígito de\(7^{7^{7}}\)?

    Por el Ejemplo 2.33, vemos que los residuos de\(7^{n} \bmod 10\) repetición ellos mismos cada vez\(n\) aumenta en 4. Por lo tanto si\(m \equiv n \bmod 4\), entonces\(7^{m} \equiv 7^{n} \bmod 10\).

    ¿Qué es\(7^{7} \bmod 4\)? Bueno\(7^{1} \equiv 3 \bmod 4,7^{2} \equiv 1 \bmod 4\), entonces\(7^{7} \equiv\)\(\left(7^{2}\right)^{3} \cdot 7 \equiv 3 \bmod 4\). Por lo tanto\[7^{7^{7}} \equiv 7^{3} \equiv 3 \quad \bmod 10 .\]

    Ejercicios

    EJERCICIO 2.1. ¿Cuál de las propiedades de reflexividad, simetría, antisimetría y transitividad se aplica a las relaciones dadas en los Ejemplos 2.1-2.4?

    EJERCICIO 2.2. Demostrar que la relación en Ejemplo\(2.6\) es un ordenamiento parcial.

    EJERCICIO 2.3. Enumere cada par en la relación dada en el Ejemplo 2.10.

    EJERCICIO 2.4. Demostrar que la relación en Ejemplo\(2.17\) es una equivalencia.

    EJERCICIO 2.5. Demostrar que la congruencia\(\bmod n\) es una relación de equivalencia sobre\(\mathbb{Z}\).

    EJERCICIO 2.6. Demostrar que dos enteros están en la misma clase de congruencia\(\bmod n\) si y solo si tienen el mismo resto cuando se dividen por\(n\).

    EJERCICIO 2.7. Supongamos que\(R\) es una relación sobre\(X\). ¿Qué significa si\(R\) es tanto un orden parcial como una equivalencia?

    EJERCICIO 2.8. Considerar las relaciones sobre las personas “es hermano de”, “es hermano de”, “es padre de”, “está casado con”, “es descendiente de”. ¿Cuál de las propiedades de reflexividad, simetría, antisimetría y transitividad tiene cada una de estas relaciones? EJERCICIO 2.9. Vamos\(X=\{k \in \mathbb{N}: k \geq 2\}\). Considere las siguientes relaciones sobre\(X\):

    (i)\(j R_{1} k\) si y sólo si\(\operatorname{gcd}(j, k)>1(\operatorname{gcd}\) representa el mayor divisor común).

    ii)\(j R_{2} k\) si y sólo si\(j\) y\(k\) son coprimos (es decir\(\operatorname{gcd}(j, k)=1\)).

    iii)\(j R_{3} k\) si y sólo si\(j \mid k\).

    (iv)\(j R_{4} k\) si y sólo si\[\{p: p \text { is prime and } p \mid j\}=\{q: q \text { is prime and } q \mid k\} .\] Para cada relación, decir cuál de las propiedades de Reflexivity, Simetría, Antisimetría, Transitividad tiene.

    EJERCICIO 2.10. Para\(j, k\) en\(\mathbb{N}^{+}\), definir dos relaciones\(R_{1}\) y\(R_{2}\) por\(j R_{1} k\) si\(j\) y\(k\) tener un dígito en común (pero no necesariamente en el mismo lugar) y\(j R_{2} k\) si \(j\)y\(k\) tener un dígito común en el mismo lugar (así, por ejemplo,\(108 R_{1} 82\), pero\((108,82) \notin R_{2}\)).

    (i) Si\(j=\sum_{m=0}^{M} a_{m} 10^{m}\) y\(k=\sum_{n=0}^{N} b_{n} 10^{n}\), con\(a_{M} \neq 0\) y\(b_{N} \neq 0\), ¿cómo se puede definir matemáticamente\(R_{1}\) y\(R_{2}\) en términos de los coeficientes\(a_{m}\) y\(b_{n}\)?

    (ii) ¿Cuál de las cuatro propiedades de reflexividad, simetría, antisimetría y transitividad tienen\(R_{1}\) y\(R_{2}\) tienen?

    EJERCICIO 2.11. Vamos\(X=\{a, b\}\). Enumere todas las relaciones posibles sobre\(X\), y diga cuáles son reflexivas, cuáles son simétricas, cuáles son antisimétricas y cuáles son transitivas.

    EJERCICIO 2.12. ¿Cuántas relaciones hay en un set con 3 elementos? ¿Cuántos de estos son reflexivos? ¿Cuántos son simétricos? ¿Cuántos son antisimétricos?

    EJERCICIO 2.13. Repita Ejercicio\(2.12\) para un conjunto con\(N\) elementos.

    EJERCICIO 2.14. La suma de dos enteros pares es par, la suma de un entero par y otro impar es impar, y la suma de dos enteros impares es par. ¿Cuál es la generalización de esta afirmación a las clases de residuos\(\bmod 3\)? EJERCICIO 2.15. ¿Cuál es el último dígito de\(3^{5^{7}}\)? De\(7^{5^{3}}\)? De\(11^{10^{6}}\)? De\(8^{5^{4}}\)?

    EJERCICIO 2.16. ¿Qué es\(2^{1000000} \bmod 17\)? ¿Qué es\(17^{77} \bmod 14\)?

    EJERCICIO 2.17. Mostrar que el residuo de un número\(\bmod 3\) es el mismo que la suma de sus dígitos.

    EJERCICIO 2.18. Demostrar que la afirmación de Ejercicio no\(2.17\) es cierta\(\bmod n\) para ningún valor de\(n\) excepto 3 y 9.

    EJERCICIO 2.19. Demostrar que hay un número infinito de números naturales que no se pueden escribir como la suma de tres cuadrados. (Pista: Mira los posibles residuos mod 8).

    EJERCICIO 2.20. Dejar\(f: X \rightarrow Y\) y\(g: Y \rightarrow Z\). ¿Qué se puede decir de la relación entre\(X / f\) y\(X /(g \circ f)\)?

    EJERCICIO 2.21. \(R\)Sea la relación sobre\(X=\mathbb{Z} \times \mathbb{N}^{+}\) definida en el Ejemplo 2.17. Definir una operación\(\star\) de la\(X / R\) siguiente manera: para\(x=(a, b)\) y\(y=(c, d)\),\[[x] \star[y]=[(a d+b c, c d)] .\] ¿Está\(\star\) bien definida?

    EJERCICIO 2.22. Dejar\(X\) ser el conjunto de funciones de subconjuntos finitos de\(\mathbb{N}\) a\(\ulcorner 2\urcorner\) (es decir\(f \in X\), si hay un conjunto finito\(D \subseteq \mathbb{N}\) tal que\(f: D \rightarrow\ulcorner 2\urcorner\)). Defina una relación\(R\) de la\(X\) siguiente manera: si\(f, g \in X, f R g\) iff\(\operatorname{Dom}(g) \subseteq \operatorname{Dom}(f)\) y\(g=\left.f\right|_{\operatorname{Dom}(g)}\). ¿Es\(R\) un pedido parcial? ¿Es\(R\) una relación de equivalencia?

    EJERCICIO\(2.23\). Dejar\(X\) ser el conjunto de todas las secuencias binarias infinitas. Definir una relación\(R\) de la\(X\) siguiente manera: Para cualquier\(f, g \in X, f R g\) iff\(f^{-1}(1) \subseteq\)\(g^{-1}(1)\). ¿Es\(R\) un pedido parcial? ¿Es\(R\) una relación de equivalencia?

    EJERCICIO 2.24. Vamos\(X=\{\ulcorner n\urcorner \mid n \in \mathbb{N}\}\). Dejar\(R\) ser una relación sobre\(X\) definida por\(x, y \in R\) iff\(x \subseteq y\). Demostrar que\(R\) es un ordenamiento lineal. EJERCICIO 2.25. Vamos\(X=\{f: \mathbb{R} \rightarrow \mathbb{R} \mid f\) es una sobrejección\(\}\). Definir una relación\(R\) sobre\(X\) por\(f R g\) iff\(f(0)=g(0)\). Demostrar que\(R\) es una relación de equivalencia. Dejar\(F: X \rightarrow \mathbb{R}\) ser definido por\(F(f)=f(0)\). Mostrar que los conjuntos de niveles de\(F\) son las clases de equivalencia de\(X / R\). Eso es demostrar que\[X / R=X / F .\] EJERCICIO 2.26. Vamos\(f: X \rightarrow Y\). Mostrar que\(X / f\) se compone de singletons (conjuntos con exactamente un elemento) iff\(f\) es una inyección. CAPÍTULO 3

    Pruebas

    Matemáticas y Pruebas

    La actividad principal de los matemáticos de investigación es probar afirmaciones matemáticas. Dependiendo de la profundidad de la reivindicación, la relación de la reivindicación con otras reivindicaciones matemáticas, y varios otros factores, una afirmación matemática que ha sido probada generalmente se denomina teorema, proposición, corolario o lema. Una afirmación matemática que no ha sido probada, pero que se espera que sea cierta, comúnmente se llama conjetura. Una afirmación que es aceptada como punto de partida para argumentos sin ser probada se llama axioma.

    Algunos resultados matemáticos son tan fundamentales, profundos, difíciles, sorprendentes o de otra manera notables que se les nombra. Parte de su iniciación como miembro de la comunidad de matemáticos es familiarizarse con algunas de estas declaraciones nombradas -y probaremos algunas de ellas en este libro-.

    Es probable que la mayor parte de las matemáticas que has estudiado haya sido la aplicación de teoremas para derivar soluciones de problemas relativamente concretos. Aquí comenzamos a aprender a probar teoremas. La mayoría de los estudiantes encuentran muy desafiante la transición de las matemáticas computacionales a las pruebas matemáticas.

    ¿Qué es una prueba matemática?

    La naturaleza de una prueba matemática depende del contexto. Existe una noción formal de prueba matemática:

    Una secuencia finita de declaraciones matemáticas formales tal que cada declaración

    • es un axioma o suposición, o

    • sigue por reglas formales de deducción lógica de declaraciones anteriores en la secuencia.

    La mayoría de los matemáticos no piensan en las pruebas matemáticas como pruebas matemáticas formales, y prácticamente ningún matemático escribe pruebas matemáticas formales. Esto se debe a que una prueba formal es algo irremediablemente engorroso, y generalmente está fuera del alcance de la capacidad humana, incluso para los enunciados matemáticos más elementales. Más bien, los matemáticos escriben pruebas que son secuencias de declaraciones en una combinación de lenguaje natural y símbolos matemáticos formales (intercalados con diagramas, preguntas, referencias y otros dispositivos que están destinados a ayudar al lector a comprender la prueba) que se puede considerar como representando un argumento puramente formal. Una buena definición práctica de una prueba matemática es:

    Un argumento a favor de una afirmación matemática que convencerá a la preponderancia de matemáticos conocedores de la verdad de la afirmación matemática.

    Esta definición es algo imprecisa, y los matemáticos pueden estar en desacuerdo sobre si un argumento es una prueba, particularmente para argumentos extremadamente difíciles o profundos. No obstante, para prácticamente todos los argumentos matemáticos, después de algún tiempo para una cuidadosa consideración, la comunidad matemática llega a un consenso unánime sobre si es una prueba.

    La noción de prueba matemática para el estudiante es similar a la idea general de una prueba matemática. Las diferencias se deben al tipo de declaración que el estudiante está demostrando, y las razones para solicitar que el estudiante acredite la declaración. Las declaraciones que estarás demostrando son conocidas por los matemáticos profesionales o pueden ser probadas con relativamente poco esfuerzo por tus instructores. Claramente las declaraciones que estarás demostrando requieren condiciones diferentes para una prueba satisfactoria a las señaladas anteriormente para el matemático profesional. Definamos un argumento exitoso por parte del alumno de la siguiente manera: Un argumento para una afirmación matemática que

    • el instructor puede entender

    • el instructor no puede refutar

    • utiliza únicamente supuestos que el instructor considere admisibles.

    Obsérvese que refutar un argumento no es lo mismo que refutar la pretensión original. La frase “El cuadrado de cada número real no es negativo porque todos los números reales no son negativos”. es una prueba falsa de una afirmación verdadera. La frase “El cuadrado de cada número real no es negativo porque todos los triángulos tienen tres lados”. falla la primera prueba: si bien ambas afirmaciones son verdaderas, su instructor no verá cómo la primera se desprende de la segunda.

    En este libro, las soluciones a los problemas serán una exposición en lenguaje natural potenciada por expresiones matemáticas. Se espera que el alumno aprenda las convenciones de gramática y argumentación matemática, y las use. Como la mayoría de las convenciones, éstas suelen estar determinadas por la tradición o el precedente. Puede ser bastante difícil, inicialmente, determinar si tu exposición matemática cumple con los estándares de tu instructor. La práctica, con la retroalimentación de un lector con experiencia en lectura matemática, es la mejor manera de desarrollar buenas habilidades de escritura de prueba. Recuerde, los lectores de matemáticas están bastante impacientes por tratar de descifrar lo que quiere decir el autor; las matemáticas son lo suficientemente desafiantes cuando el autor escribe precisamente lo que pretende. La mayor parte de la carga de la comunicación recae en el autor de una prueba matemática, no en el lector. Una prueba puede ser lógicamente correcta, pero tan difícil de seguir que es inaceptable para tu instructor.

    ¿Por qué pruebas?

    ¿Por qué las pruebas son el medio primario de las matemáticas? Los matemáticos dependen de las pruebas para la certeza y la explicación. Una vez que una prueba es aceptada por la comunidad matemática, es prácticamente inaudito que el resultado sea posteriormente refutado. Esto no siempre fue así: en el\(19^{\text {th }}\) siglo hubo serias disputas sobre si los resultados realmente se habían probado o no (ver Sección\(5.3\) para un ejemplo, y el libro [4] para un tratamiento muy extenso del desarrollo del rigor en el razonamiento matemático). Esto llevó a nuestra noción moderna de un argumento matemático “riguroso”. Si bien se podría argumentar que es posible que en el\(21^{\text {st }}\) siglo un nuevo estándar de rigor rechace lo que actualmente consideramos como pruebas, nuestras ideas actuales se han mantenido estables durante más de un siglo, y la mayoría de los matemáticos (incluidos los autores de este libro) no esperan que haya un cambio filosófico.

    Para resultados muy complicados, escribir una prueba detallada ayuda al autor a convencerse a sí mismo de la verdad de la afirmación. Después de que un matemático se haya topado con la idea clave detrás de un argumento, queda mucho trabajo para desarrollar los detalles del argumento. Muchas ideas prometedoras fracasan ya que el autor intenta escribir un argumento detallado basado en la idea. Finalmente, las pruebas a menudo proporcionan una visión más profunda del resultado y los objetos matemáticos que son objeto de la prueba. En efecto, incluso pruebas muy inteligentes que no proporcionan conocimientos matemáticos se mantienen en menor consideración, por algunos, que los argumentos que dilucidan el tema.

    Las pruebas matemáticas están fuertemente relacionadas con las pruebas formales en un sentido puramente lógico. Se supone que la existencia de una prueba matemática informal es evidencia abrumadora de la existencia de una prueba matemática formal. Si no está claro que la prueba informal pueda concebiblemente interpretarse en un argumento formal, es dudoso que el argumento informal sea aceptado por la comunidad matemática. En consecuencia, los argumentos matemáticos tienen una estructura lógica subyacente transparente.

    Por esta razón comenzaremos nuestra discusión sobre las pruebas matemáticas con una breve discusión de la lógica proposicional. A pesar de su abstracción, el tema es sencillo, y la mayoría de las afirmaciones de esta sección pueden confirmarse con un pensamiento cuidadoso y paciente.

    Lógica Proposicional

    La lógica proposicional estudia cómo la verdad o falsedad de los enunciados compuestos está determinada por la verdad o falsedad de los enunciados constitutivos. Nos da una manera de derivar de manera confiable conclusiones verdaderas a partir de verdaderas suposiciones.

    DEFINICIÓN. Valor de verdad Si\(P\) es una declaración que es verdadera, entonces\(P\) tiene valor de verdad 1. Si\(P\) es una declaración que es falsa,\(P\) tiene valor de verdad 0. Escribimos\(T(P)\) para el valor de verdad de\(P\).

    Los valores de la verdad pueden pensarse como una función\(T: S \rightarrow\ulcorner 2\urcorner\), donde\(S\) está el conjunto de todas las afirmaciones. Al investigar los principios abstractos de la lógica proposicional, consideramos posibles asignaciones de valores de verdad a variables que representan declaraciones. Nos interesan las afirmaciones que son independientes de cualquier asignación particular de valores de verdad a las variables proposicionales. Usamos los enteros 0 y 1 para representar valores de verdad porque nos permite usar operaciones aritméticas en lógica proposicional. Otros autores prefieren\(F\) y\(T\).

    DEFINICIÓN. Conectivos proposicionales Los símbolos\(\wedge, \vee, \neg\) y\(\Rightarrow\) son conectivos proposicionales. Se definen de la siguiente manera para declaraciones\(P\) y\(Q\).

    Conectivo Nombre Definición
    \(\neg\) negación \(T(\neg P)=1-T(P)\)
    \(\hat{\vee}\) conjunción \(T(P \wedge Q)=T(P) \cdot T(Q)\)
    \(\Rightarrow\) disyunción \(T(P \vee Q)=T(P)+T(Q)-T(P) \cdot T(Q)\)
    \(\Rightarrow\) implicación \(T(P \Rightarrow Q)=1-T(P)+T(P) \cdot T(Q)\)

    En la expresión "\(P \Rightarrow Q\)“, el enunciado\(P\) se denomina antecedente o hipótesis y\(Q\) se denomina la consecuencia o conclusión.

    Los conectivos proposicionales son equivalentes formales de los conectivos del lenguaje natural.

    Conectivo Equivalente a Lenguaje Natural
    \(\neg\) no
    \(\wedge\) y
    \(\vee\) o
    \(\Rightarrow\) implica

    Comprueba que las fórmulas que definen los conectivos proposicionales dan el significado que esperas. Por ejemplo, comprobar que la definición del valor de verdad para\(P \wedge Q\) significa que\(P \wedge Q\) es cierto si y sólo si ambos\(P\) y\(Q\) son verdaderos.

    Los conectivos proposicionales se aproximan a las conectivas del lenguaje natural. Los conectivos proposicionales son formales y precisos, mientras que los conectivos del lenguaje natural son imprecisos y algo más expresivos; en consecuencia, la aproximación es imperfecta. Vimos un ejemplo de esto al contrastar el uso de los matemáticos del “o” conectivo con su uso en el lenguaje cotidiano. Para mayor precisión en matemáticas interpretamos los conectivos formalmente, incluso cuando se utilizan expresiones de lenguaje natural.

    Podemos construir declaraciones compuestas muy complicadas mediante el uso de conectivos lógicos. Naturalmente, existen reglas para construir declaraciones correctas con conectivos.

    DEFINICIÓN. Declaración atómica Una declaración atómica es una declaración sin conectivos proposicionales explícitos.

    Una declaración atómica suele estar representada por una letra mayúscula.

    DEFINICIÓN. Declaración bien formada Definimos una declaración proposicional bien formada recursivamente de la siguiente manera.

    Las declaraciones atómicas están bien formadas.

    Si\(P\) y\(Q\) son declaraciones bien formadas, entonces las siguientes son declaraciones bien formadas:

    • \((\neg P)\)

    • \((P \wedge Q)\)

    • \((P \vee Q)\)

    • \((P \Rightarrow Q)\). En la práctica se dejan caer los paréntesis a menos que exista la posibilidad de ambigüedad. Adicionalmente, “[” y “]” pueden sustituirse por paréntesis en aras de la legibilidad. Para cualquier asignación de valores de verdad a las declaraciones atómicas en una declaración bien formada, la declaración compuesta tendrá un valor de verdad bien definido.

    DEFINICIÓN. Declaración compuesta Una declaración compuesta es una declaración bien formada compuesta de declaraciones atómicas y conectivos proposicionales.

    3.2.1. Equivalencia proposicional. Un propósito de la lógica proposicional es dar herramientas para evaluar la verdad de una declaración compuesta sin necesariamente tener que entender el significado específico de las declaraciones atómicas. Es decir, algunas afirmaciones son demostrablemente verdaderas o falsas en virtud de su forma. En este entendimiento es central la idea de equivalencia proposicional.

    DEFINICIÓN. Equivalencia proposicional Let\(P\) y\(Q\) ser declaraciones bien formadas construidas a partir de declaraciones atómicas. Decimos eso\(P\) y\(Q\) son proposicionalmente equivalentes siempre que\(T(P)=T(Q)\) para cualquier asignación de valores de verdad a las declaraciones atómicas constitutivas.

    Si\(P\) y\(Q\) son proposicionalmente equivalentes, podemos escribir el\[P \equiv Q .\] EJEMPLO 3.1. \[[P \Rightarrow Q] \equiv[(\neg Q) \Rightarrow(\neg P)]\]Este es un ejemplo muy importante de una equivalencia proposicional. Demostraremos esto considerando todas las posibles asignaciones de valores de verdad a\(P\) y\(Q\). Vamos a poner esto en lo que popularmente se llama una tabla de la verdad. Consideramos todas las asignaciones posibles de valores de verdad a\(P\) y\(Q\), y comparamos los valores de verdad de las afirmaciones compuestas bajo consideración:

    \(\begin{array}{cccc}\frac{T(P)}{0} & \frac{T(Q)}{0} & \frac{T(P \Rightarrow Q)}{1} & \frac{T((\neg Q) \Rightarrow(\neg(P)))}{1} \\ 0 & 1 & 1 & 1 \\ 1 & 0 & 0 & 0 \\ 1 & 1 & 1 & 1\end{array}\)

    Cada fila de la tabla de verdad representa una asignación particular de valores de verdad a las declaraciones atómicas\(P\) y\(Q\). Las cuatro asignaciones posibles se agotan por las filas de la tabla de la verdad. Los valores de verdad de las declaraciones compuestas coinciden en cada fila de la tabla de verdad por lo que las declaraciones son equivalentes.

    EJEMPLO 3.2. \ [\ begin {aligned} & {[\ neg (P\ wedge Q)]\ equiv [(\ neg P)\ vee (\ neg Q)]}\\ & {[\ neg (P\ vee Q)]\ equiv [(\ neg P)\ wedge (\ neg Q)]} \ end {alineado}\] Se conocen declaraciones (3.3) y (3.4) como las leyes de Morgan. (¿Cómo se relacionan con el Ejercicio 1.2?)

    Con dos posibles excepciones, una vez que estudies cuidadosamente lo que significan estas conectivas, debes entenderlas intuitivamente. Una excepción es que el lógico y matemático “o”,\(\vee\), es inclusivo. Esto lo discutimos al inicio del Capítulo 2. La otra excepción es el conectivo lógico "\(\Rightarrow\)”.

    3.2.2. Implicación. A los estudiantes a menudo les resulta confuso que la implicación\(P \Rightarrow Q\) pueda ser cierta cuando la consecuencia,\(Q\), es falsa. Esto es comprensible cuando consideramos que las implicaciones se suelen emplear en argumento en el silogismo siguiente:\ [\ begin {reunió} P\ P\ Rightarrow Q\ end {reunió} \] por lo tanto, (es decir, si\(P\) es cierto, y\(P \Rightarrow Q\), entonces\(Q\) es cierto). Este silogismo es la regla más importante de deducción lógica (llamada Modus Ponens). La implicación lógica se utiliza tan a menudo para demostrar la verdad de la consecuencia que es fácil entender por qué uno podría pensar erróneamente que la consecuencia debe seguir de la implicación, en lugar de seguir del antecedente. Considera la siguiente declaración:

    Si eres el rey de Francia, entonces yo soy el tío de un mono.

    ¿Es cierta esta afirmación? Presumiblemente no eres el rey de Francia, y no creo que sea tío de mono. Entonces tanto el antecedente como la consecuencia son falsos. Sin embargo la afirmación es cierta. De hecho, esta afirmación es lógicamente equivalente a la afirmación:

    Si no soy tío de mono, entonces tú no eres el rey de Francia.

    La definición de implicación lógica dice que una implicación en la que el antecedente es falso no da información sobre la consecuencia. De ahí que cualquier implicación lógica con el antecedente “Tú eres el rey de Francia” será cierta.

    Existe una preocupación adicional con implicación lógica. En el lenguaje natural (e intuitivamente en matemáticas), la afirmación\[P \Rightarrow Q\] sugiere una relación entre las afirmaciones\(P\) y\(Q\) -es decir, que la verdad de\(P\) alguna manera obliga a la verdad de\(Q\). Como conectivo proposicional, esta relación entre\(P\) y no\(Q\) es necesaria para la implicación lógica. La verdad de\(P \Rightarrow Q\) es una función de los valores de verdad de\(P\) y\(Q\), no de sus significados. En la escritura matemática, se entiende que no sólo es lógicamente cierta la implicación, sino que\(P\) y\(Q\) están relacionados y que la verdad de\(P\) hecho obliga a la verdad de\(Q\). Por ejemplo, considere la afirmación\[\mathbb{N} \subset \mathbb{Q} \Rightarrow 3>2 .\] Esta afirmación es cierta por la definición formal de\(\Rightarrow\). De hecho, como declaración proposicional, podríamos sustituir el antecedente por cualquier otra afirmación, verdadera o falsa, y la declaración condicional sería verdadera. No obstante, tal afirmación es matemáticamente inaceptable, ya que el antecedente y la consecuencia no tienen nada que ver entre sí. No nos preocupan los valores de verdad accidentales de las declaraciones atómicas, sino las conexiones matemáticas entre estas afirmaciones, que cumplen, sin embargo, van más allá de la definición formal de las conectivas lógicas.

    3.2.3. Converse y Contrapositivo. La mayoría de las afirmaciones matemáticas tienen la forma de una implicación. Por lo tanto, es necesario estar familiarizado con la nomenclatura convencional que rodea la implicación lógica. Supongamos que nos interesa una implicación lógica particular,\[P \Rightarrow Q \text {. }\] Hay otras dos implicaciones lógicas con las que naturalmente se asocian\(P \Rightarrow Q\). Uno es el contrapositivo,\[\neg Q \Rightarrow \neg P .\] Una implicación y sus contrapositivos son proposicionalmente equivalentes.

    EJEMPLO 3.5. La declaración,

    “Si esto es un insecto entonces tiene seis patas”.

    es proposicionalmente equivalente a la declaración

    “Si esto no tiene seis patas, no es un insecto”.

    EJEMPLO 3.6. El contrapositivo de

    “Una ballena es un pez”

    es

    “Si no es un pez entonces no es una ballena”.

    Este último ejemplo ilustra que una declaración no necesita ser cierta para tener un contrapositivo (que es, por supuesto, todavía proposicionalmente equivalente a la declaración condicional original). También ilustra que las declaraciones condicionales en lenguaje natural no necesitan incluir la palabra “si” o “entonces”, ni ser escritas en una forma particular, para ser una declaración condicional. Lo contrario de una declaración condicional,\[P \Rightarrow Q\] es la declaración condicional,\[Q \Rightarrow P .\] Una declaración condicional y su inversa no son proposicionalmente equivalentes. Puedes comprobarlo fácilmente\(P \Rightarrow Q\) y\(Q \Rightarrow P\) tener diferentes valores de verdad si\(T(P)=1\) y\(T(Q)=0\).

    EJEMPLO 3.7. ¿Qué es lo contrario a la declaración?

    ¿"Todos los peces viven en el agua”?

    Dado que esto está escrito en lenguaje natural, no hay una respuesta única.

    Un obvio lo contrario es

    “Si algo vive en el agua, entonces es un pez”.

    Si armamos una implicación y su inversa, obtenemos el conectivo bicondicional.

    DEFINICIÓN. Bicondicional,\(\Longleftrightarrow\) Dejar\(P\) y\(Q\) ser declaraciones. El bicondicional, escrito\(\Longleftrightarrow\), se define de la siguiente manera.

    Conectivo Nombre Definición
    \(\Longleftrightarrow\) bicondicional \(T(P \Longleftrightarrow Q)=T(P \Rightarrow Q) \cdot T(Q \Rightarrow P)\)

    El conectivo bicondicional es la interpretación formal de “si y solo si”. Esta frase es tan utilizada en matemáticas que tiene su propia abreviatura: iff.

    Otras palabras del lenguaje natural que pueden traducirse en conectivos proposicionales son “necesarias” y “suficientes”. El comunicado

    \(P\)Para que pueda sostenerse, es necesario que\(Q\) sostenga” equivale a\(P \Rightarrow Q\). El comunicado

    \(P\)Para que pueda sostenerse, basta con que\(Q\) sostenga”

    es equivalente a\(Q \Rightarrow P\). Combinando estos dos, conseguimos que la afirmación “\(P\)Para poder sostener, es necesario y suficiente que\(Q\) sostiene” es equivalente a\(P \Longleftrightarrow Q\).

    Fórmulas

    Hablando vagamente, una fórmula es una expresión matemática con variables. Correspondiente a cada variable\(x_{i}\),, apareciendo en una fórmula es un universo\(U_{i}\),, del cual esa variable puede ser sustituida.

    DEFINICIÓN. Fórmula abierta Una fórmula matemática abierta en variables\(x_{1}, \ldots, x_{n}\) es una expresión matemática en la que la sustitución del\(x_{i}(1 \leq i \leq n)\) por elementos específicos de\(U_{i}\) produce una declaración matemática.

    EJEMPLO 3.8. Considera la fórmula,\[x^{2}+y^{2}=z^{2}\] en variables\(x, y\) y\(z\), todas con universo\(\mathbb{N}\). Cualquier sustitución de las variables con números naturales da como resultado una declaración. Por ejemplo,\[3^{2}+4^{2}=5^{2}\] o Por\[1^{2}+1^{2}=2^{2} .\] supuesto, las declaraciones pueden ser verdaderas o falsas, por lo que algunas sustituciones producen declaraciones verdaderas, mientras que otras darán declaraciones falsas.

    Al discutir una fórmula general en\(n\) variables, podemos usar la notación\(P\left(x_{1}, \ldots, x_{n}\right)\). Para\(1 \leq i \leq n\), deja\(U_{i}\) ser el universo de la variable\(x_{i}\), y\(a_{i} \in U_{i}\). El enunciado que resulta de la sustitución de\(a_{i}\) for\(x_{i}, 1 \leq i \leq n\), está escrito\(P\left(a_{1}, \ldots, a_{n}\right)\).

    Si\(P\left(x_{1}, \ldots, x_{n}\right)\) es una fórmula en variables\(x_{1}, \ldots, x_{n}\), y para\(1 \leq i \leq\)\(n, U_{i}\) es el universo de\(x_{i}\), entonces podemos pensar en\(\left(x_{1}, \ldots, x_{n}\right)\) como una sola variable con universo\(U=\prod_{1 \leq i \leq n} U_{i}\).

    Las fórmulas pueden cumplir muchos propósitos en matemáticas:

    (1) Caracterizar las relaciones entre cantidades

    (2) Definir cálculos (3) Definir conjuntos

    (4) Definir funciones.

    EJEMPLO 3.9. Considera una fórmula abierta\(P(x, y)\),, en dos variables,\[x^{2}+y^{2}=1,\] con universo\(\mathbb{R}^{2}\). Es decir, el universo de\(x\) es\(\mathbb{R}\) y el universo de\(y\) es\(\mathbb{R}\). Una forma de pensar\(P(x, y)\) es como un medio para\(\mathbb{R}^{2}\) dividir en dos conjuntos:

    (1) el subconjunto del Plano Cartesiano para el que la ecuación es verdadera, es decir, el círculo unitario;

    (2) el subconjunto del Plano Cartesiano para el que la ecuación es falsa, el complemento del círculo unitario en\(\mathbb{R}^{2}\).

    DEFINICIÓN. Conjunto característico,\(\chi_{P}\) Let\(P(x)\) be a formula, y\(U\) el universo de la variable\(x\). Se escribe el subconjunto\(U\) para el que se\(P\) mantiene la fórmula\(\chi_{P}\). El conjunto\(\chi_{P}\) se llama el conjunto característico de\(P(x)\).

    Entonces,\[\chi_{\neg P}=U \backslash \chi_{P} .\] 3.3.1. Fórmulas y Conectivos Proposicionales. La lógica proposicional se extiende fácilmente a las fórmulas. Dejar\(P(x)\) y\(Q(x)\) ser fórmulas en la variable\(x\), con universo\(U\). Let\[R(x)=P(x) \wedge Q(x) .\] Entonces el conjunto característico de\(R(x)\) viene dado por\[\chi_{R}=\{a \in U \mid T(P(a) \wedge Q(a))=1\}\] De ahí\[\chi_{R}=\chi_{P} \cap \chi_{Q} .\] El conectivo proposicional\(\wedge\) está fuertemente asociado con la operación de conjunto\(\cap\). Del mismo modo\(\vee\) pueden estar asociados\(\cup, \neg\) con complemento (in\(U\)), y\(\Rightarrow\) con\(\subseteq\).

    Cuantificadores

    Dejar\(P(x)\) ser una fórmula en una variable. Si sustituimos una constante\(a \in U\),,\(x\) pues llegamos a un comunicado\(P(a)\). No obstante, supongamos que nos interesa\(P(x)\) con respecto a algún conjunto\(X \subseteq U\), más que a un elemento particular de\(U\). En particular, preguntamos si\(P(a)\) es una verdadera declaración para todos\(a \in X\). Recordemos que uno de los roles de una fórmula es definir conjuntos. Para cualquier fórmula\(P(x)\), universo\(U\) y\(X \subseteq U, P(x)\) particiones\(X\) en dos conjuntos - aquellos elementos de\(X\) para los cuales\(P\) es cierto, y aquellos para los que\(P\) es falso. En este sentido, preguntar si se\(P\) sostiene para todos\(x \in X\), o si se sostiene para algunos\(x \in X\) (lo que es complementario a preguntar si se\(\neg P\) mantiene para todos\(x \in X)\) es preguntar si\(P\) define una nuevo o interesante subconjunto de\(X\).

    Así como se introdujeron los conectivos proposicionales para formalizar el comportamiento lingüístico de ciertos conectivos de lenguaje natural ampliamente empleados (y, o, implica, no), también formalizaremos la “cuantificación” sobre conjuntos.

    Definición. Cuantificador universal,\((\forall x \in X) P(x)\) Let\(P(x)\) be una fórmula en una variable, con universo\(U\). Vamos\(X \subseteq U\). \(Q\)Sea la declaración\[(\forall x \in X) P(x)\] Entonces\(Q\) es verdad si por cada\(a \in X, P(a)\) es verdad. De lo contrario\(Q\) es falso.

    La notación\[(\forall x \in X) P(x)\] es una taquigrafía para\[(\forall x)([x \in X] \Rightarrow[P(x)])\] La declaración "\((\forall x \in X) P(x) "\)se lee “para todos\(x\) en\(X, P(x) "\). Tenemos\[(\forall x \in X) P(x) \Longleftrightarrow X \subseteq \chi_{P}\] DEFINITION. Cuantificador existencial,\((\exists x \in X) P(x)\) Let\(P(x)\) Ser una fórmula en una variable con universo\(U .\) Let\(X \subseteq U, X \neq \emptyset\). \(Q\)Sea el enunciado\[(\exists x \in X) P(x) .\] Entonces\(Q\) es cierto si hay alguno\(a \in X\), para lo cual\(P(a)\) es cierto. De lo contrario\(Q\) es falso.

    La expresión\[(\exists x \in X) P(x)\] es una taquigrafía para\[(\exists x)[(x \in X) \wedge P(x)] \text {. }\] La declaración\((\exists x \in X) P(x)\) "" se lee “existe\(x\) en\(X\), tal que\(P(x)\)”. El cuantificador "\(\nabla\)" es el equivalente formal de la expresión del lenguaje natural “para todos” o “cada”. El cuantificador "\(\exists\)" es el equivalente formal de “para algunos” o “existe... tal que...”.

    Siempre que el universo de una variable sea claro, o no relevante para la discusión, es común suprimir el universo en la expresión del enunciado. Por ejemplo, si\(P(x)\) es una fórmula con universo\(U\), podemos escribir\[(\forall x) P(x)\] en lugar de\[(\forall x \in U) P(x) .\] 3.4.1. Cuantificadores Múltiples. Dejar\(P\left(x_{1}, \ldots, x_{n}\right)\) ser una fórmula en\(n \geq 2\) variables. Entonces la fórmula\[\left(\forall x_{1}\right) P\left(x_{1}, \ldots, x_{n}\right)\] es una fórmula en las\(n-1\) variables\(x_{2}, \ldots, x_{n}\). De igual manera, la fórmula\[\left(\exists x_{1}\right) P\left(x_{1}, \ldots, x_{n}\right)\] es una fórmula en\(n-1\) variables.

    EJEMPLO 3.10. Considera la fórmula en cinco variables\[P\left(x, x_{0}, L, \varepsilon, \delta\right):=\left(0<\left|x-x_{0}\right|<\delta\right) \Rightarrow(|\sin (x)-L|<\varepsilon)\] con todas las variables teniendo universo\(\mathbb{R}\). Entonces\(\left(\forall x_{0}\right) P\left(x, x_{0}, L, \varepsilon, \delta\right)\) es una fórmula en cuatro variables,\(\left(\forall x_{0}\right)(\exists L) P\left(x, x_{0}, L, \varepsilon, \delta\right)\) es una fórmula en tres variables, y\[\left(\forall x_{0}\right)(\exists L)(\forall \varepsilon) P\left(x, x_{0}, L, \varepsilon, \delta\right)\] es una fórmula en dos variables.

    Definición. Variable abierta, Variable enlazada En la fórmula\(P(x)\),\(x\) es una variable abierta. En las fórmulas\[(\forall x) P(x), \quad(\exists x) P(x), \quad(\forall x) Q(x, y), \quad(\exists x) Q(x, y)\]\(x\) hay una variable enlazada o cuantificada, y en las dos últimas,\(y\) es una variable abierta.

    3.4.2. Orden del cuantificador. En la discusión a continuación, necesitamos discutir los cuantificadores genéricamente, es decir, sin tener en cuenta si el cuantificador en discusión es universal o existencial. Por lo que vamos a introducir alguna notación conveniente sólo para esta sección.

    Notación. \((\mathcal{Q} x) P(x)\)Utilizamos la notación\[\text { (Q } \mathcal{Q} x) P(x)\] para representar genéricamente\[(\forall x) P(x)\] y\[(\exists x) P(x) \text {. }\] Let\(\mathcal{Q}_{1}, \ldots, \mathcal{Q}_{n}\) be cuantificadores lógicos y\(P\left(x_{1}, \ldots, x_{n}\right)\) ser una fórmula con variables abiertas\(x_{1}, \ldots, x_{n}\). Entonces\[\left(\mathcal{Q}_{1} x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] es una declaración.

    EJEMPLO 3.11. Considerar una declaración\(S\) en la forma\[S=(\forall x \in X)(\exists y \in Y) P(x, y) .\]\(S\) es verdadera si para cada uno\(a \in X\),\[(\exists y \in Y) P(a, y)\] es verdad. Esto se satisface siempre que para cada uno\(a \in X\), haya un elemento de\(Y\) (llamémoslo\(b_{a}\) para recordarnos que este elemento particular de\(Y\) está asociado con la elección anterior, a) tal que\[P\left(a, b_{a}\right)\] es cierto. Así\(b_{a}\) se selecciona teniendo\(a\) en mente. Las declaraciones en esta forma son especialmente importantes en matemáticas porque la definición del límite en el cálculo es una declaración en la forma de este ejemplo.

    Volvamos al enunciado\[\left(\mathcal{Q}_{1} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] El orden de los cuantificadores es significativo. Si\(1 \leq i<j \leq n, x_{i}\) se comporta como un parámetro desde el punto de vista de\(x_{j}\) (es decir,\(x_{i}\) se fija desde el punto de vista de\(x_{j}\)). Dicho de otra manera,\(x_{j}\) se elige con respecto a las sustituciones de\(x_{1}, \ldots, x_{j-1}\), pero sin consideración para\(x_{j+1}, \ldots, x_{n}\).

    Siempre se lee desde la izquierda. El enunciado\[\left(\forall x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] es el mismo que\[\left(\forall x_{1}\right)\left[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\right] \text {, }\] o, en otras palabras, para cada elección de\(x_{1}\), la afirmación\[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] es cierta. De igual manera, la afirmación\[\left(\exists x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] es la misma que\[\left(\exists x_{1}\right)\left[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\right] \text {, }\] o en otras palabras que hay alguna elección de\(x_{1}\) para la cual la afirmación\[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\] sobre las\(n-1\) variables\(x_{2}, \ldots, x_{n}\) es verdadera.

    EJEMPLO 3.12. El orden de los cuantificadores es importante, como se puede ver en lo siguiente: no\[(\forall x \in X)(\exists y \in Y) P(x, y)\] es equivalente a\[(\exists y \in Y)(\forall x \in X) P(x, y) .\] Por ejemplo, la afirmación\[(\forall x \in \mathbb{R})(\exists y \in \mathbb{R})\left(y=x^{2}\right)\] es verdadera. Pero\[(\exists y \in \mathbb{R})(\forall x \in \mathbb{R})\left(y=x^{2}\right)\] es falso. El enunciado\[[(\exists y \in Y)(\forall x \in X) P(x, y)] \Rightarrow[(\forall x \in X)(\exists y \in Y) P(x, y)]\] es cierto. Lo contrario claramente falla.

    3.4.3. Negación de Cuantificadores. En un sentido importante,\(\wedge\) y\(\vee\) son complementarios. Por las identidades de Morgan (3.3) y (3.4), la negación de una simple conjunción es una disyunción de negaciones. De igual manera, la negación de una disyunción simple es una conjunción de negaciones. Los cuantificadores universales y existenciales también son complementarios. Observamos que\[[\neg(\forall x) P(x)] \equiv[(\exists x) \neg P(x)]\] para cualquier fórmula,\(P(x)\). Similarmente Por\[[\neg(\exists x) P(x)] \equiv[(\forall x) \neg P(x)] .\] supuesto,\(P(x)\) en sí misma puede ser una fórmula que tenga numerosos cuantificadores y variables enlazadas. Supongamos que\[P(x)=(\exists y) Q(x, y) .\] Entonces las siguientes declaraciones son equivalentes (para cualquier elección\(P\) y\(Q\) satisfacción de la identidad (3.13)):\ [\ begin {reunió} \ neg (\ forall x) P (x)\\ (\ existe x)\ neg P (x)\ \ neg (\ forall x) (\ existe y ) Q (x, y)\\ (\ existe x)\ neg (\ existe y) Q (x, y)\\ (\ existe x) (\ para todos y)\ neg Q (x, y). \ end {reunió}\] Este ejemplo sugiere que es permisible permutar una negación y un cuantificador cambiando el tipo de cuantificador, y de hecho esto es así.

    Dejar\(\mathcal{Q}_{i}\) ser un cuantificador, para\(1 \leq i \leq n\). Para cada uno\(\mathcal{Q}_{i}\), deja\(\mathcal{Q}_{i}^{*}\) ser el cuantificador complementario. Es decir, si\(\mathcal{Q}_{i}=\forall\), entonces vamos\(\mathcal{Q}_{i}^{*}=\exists\); si\(\mathcal{Q}_{i}=\exists\), entonces vamos\(\mathcal{Q}_{i}^{*}=\forall\). Entonces,\[\neg\left(\mathcal{Q}_{1} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P(\bar{x}) \equiv\left(\mathcal{Q}_{1}^{*} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n}^{*} x_{n}\right) \neg P(\bar{x}) .\]

    Estrategias de prueba

    Hay dos formas lógicas elementales que ocurren tan comúnmente en las afirmaciones matemáticas que justifican alguna discusión general.

    3.5.1. Declaraciones Universales. Una forma lógica que es probable que encuentre muy a menudo es\[(\forall x)[H(x) \Rightarrow P(x)] \text {, }\] dónde\(H(x)\) y\(P(x)\) son fórmulas en una variable. Las declaraciones en esta forma se denominan declaraciones universales. Las fórmulas\(H\) y\(P\) se utilizan para caracterizar las propiedades de los objetos matemáticos, de manera que las reivindicaciones en esta forma puedan considerarse como declarando:

    Si un objeto matemático tiene propiedad\(H\), entonces\(P\) también tiene propiedad.

    Esto es particularmente útil si sabemos mucho sobre objetos matemáticos que tienen propiedad\(P\). Debido a que la afirmación que estamos tratando de probar es universal, los ejemplos no bastan para probar tales afirmaciones; el ejemplo que cita podría tener accidentalmente propiedades\(H\) y\(P\). Más bien, las afirmaciones universales deben probarse abstractamente, argumentando que satisfacer una definición o conjunto de propiedades implica la satisfacción de otras propiedades. Esto generalmente requiere evaluar cuidadosamente las definiciones. En la práctica, a menudo lo hacemos asumiendo que tenemos un elemento arbitrario que satisface una definición o supuestos explícitos, y lógicamente derivamos conclusiones adicionales sobre este objeto. Por arbitrario queremos decir que no se nos permite hacer ninguna afirmación sobre el elemento excepto aquellas que se deriven inmediatamente de definiciones, suposiciones explícitas, o que se deriven lógicamente de definiciones y suposiciones explícitas. Dado que el objeto era arbitrario (a excepción de las suposiciones explícitas que hagas al inicio del argumento), las conclusiones que derives sobre el objeto serán verdaderas universalmente para todos los objetos que satisfagan los supuestos.

    EJEMPLO 3.15. Supongamos que\(F(x)\) es la fórmula:\[\text { " } x \in \mathbb{N} \text { and } x \text { is a multiple of } 4 . "\] Let\(E(x)\) be the formula:\[\text { " } x \text { is even." }\] Entonces No\[(\forall x)[F(x) \Rightarrow E(x)] .\] basta con observar que 4,8 y 12 son todos parejos. Para argumentar directamente a favor de la afirmación, se argumentaría abstractamente que cualquier objeto que satisfaga\(F(x)\) necesariamente satisface\(E(x)\).

    Hay un par de enfoques que uno suele considerar al probar declaraciones condicionales. Elegir un enfoque es elegir una estrategia para la prueba. Normalmente, se puede hacer funcionar más de una estrategia, pero a menudo una puede ser más simple que las otras.

    Las reclamaciones de la forma (3.14) generalmente se abordan de una de las siguientes maneras:

    (1) Prueba Directa. Dejar\(x\) ser un objeto para el que se\(H\) sostiene. Al decodificar la propiedad\(H\), es posible que también pueda mostrar directamente esa\(P\) propiedad.\(x\) Al\(x\) ser un objeto arbitrario satisfactorio\(P\), se probará la reivindicación universal.

    EJEMPLO 3.17. Demostrar (3.16) directamente.

    Let\(x \in \mathbb{N}\) (tratamos\(x\) como un elemento fijo pero arbitrario de los números naturales). Si\(x=4 n\), entonces\[x=2 \cdot(2 n),\] y por lo tanto es parejo.

    EJEMPLO 3.18. Demostrar que cualquier 3 puntos en el plano son colineales o se encuentran en un círculo.

    Comprobante. Etiquetar los puntos\(A, B, C\). Dejar\(L\) ser la bisectriz perpendicular de\(A B\). Cada punto en\(L\) es equidistante de\(A\) y\(B\).

    Dejar\(M\) ser la bisectriz perpendicular de\(B C\). Cada punto en\(M\) es equidistante de\(B\) y\(C\).

    Si\(A, B\) y no\(C\) son colineales, las líneas\(L\) y no\(M\) son paralelas, por lo que se cruzan en algún momento\(D\). El punto\(D\) es equidistante de\(A, B\) y\(C\), por lo que estos puntos se encuentran en un círculo centrado en\(D\).

    EJEMPLO 3.19. El teorema de Pitágoras se puede afirmar en la forma (3.14). (¿Qué son\(H\) y\(P\) en este caso?) La prueba de Euclides del teorema de Pitágoras es una prueba directa (Elementos I.47 de Euclides).

    (2) Prueba Contrapositiva.

    A veces es más fácil demostrar que el fracaso de\(P\) implica el fracaso de\(H\). Supongamos que tiene un objeto para el cual\(P\) falla (es decir, asumir\(\neg P\) retenciones del objeto). Derivar que\(H\) debe fallar para el objeto también. En este caso habrás demostrado que\[(\forall x)[\neg P(x) \Rightarrow \neg H(x)] .\] Esto equivale a la reclamación\[(\forall x)[H(x) \Rightarrow P(x)] .\] EJEMPLO 3.20. Demostrar (3.16) demostrando el contrapositivo.

    Vamos\(x \in \mathbb{N}\), y supongamos\(\neg E(x)\), así\(x\) es extraño. Como\(x\) es impar, entonces\(x\) dividido por 4 tiene resto 1 o 3. Entonces,\[x \neq 4 n \text {. }\] Así no\(x\) es un múltiplo de 4.

    EJEMPLO 3.21. Demostrar que si\(x\) es un entero y\(x^{2}\) es par, entonces\(x\) es par.

    El contrapositivo es la afirmación de que si\(x\) es un entero impar, entonces\(x^{2}\) es impar. Esto lo demostraremos.

    Supongamos que\(x\) es impar, así que\(x=2 n+1\) para algún entero\(n\). Entonces\(x^{2}=\)\(4 n^{2}+4 n+1\), así\(x^{2} \equiv 1 \bmod 2\), y por lo tanto\(x^{2}\) es extraño.

    (3) Contradicción.

    Esta es una prueba en la que demostramos que\(H \wedge \neg P\) es necesariamente falsa. Es decir, asumir que se\(H\) sostiene para un objeto arbitrario y\(P\) falla para ese objeto, y demostrar que esto da lugar a una contradicción. Dado que las contradicciones son lógicamente imposibles, es lógicamente necesario aquello\[\neg(H \wedge \neg P)\] que es proposicionalmente equivalente a\[\neg H \vee P\] o, alternativamente,\[H \Rightarrow P \text {. }\] ya que habremos demostrado que para cualquier sustitución de\(x\), el enunciado \(H \Rightarrow P\)sostiene, habremos mostrado el reclamo universal.

    EJEMPLO 3.22. Demostrar (3.16) por contradicción.

    Supongamos que\(x\) es un múltiplo de 4 y eso\(x\) es impar. Dejar\(r\) ser el residuo del\(x\) módulo 2. Ya que\(x\) es un múltiplo de\(4=2 \cdot 2\), tenemos eso\(r \equiv 0 \bmod 2\). Ya que\(r\) es extraño, tenemos eso\(r \equiv 1 \bmod 2\). Esto implica\(0 \equiv 1 \bmod 2\), una contradicción. Por lo tanto, la suposición de\(x\) que había un que era a la vez un múltiplo de 4 e impar es falsa, y así ((3.16) debe ser verdadera. EJEMPLO 3.23. Demostrar que\(\sqrt{2}\) es irracional.

    Comprobante. Reafirmamos esto como implicación: Si un número es racional, es cuadrado no puede igualar 2. Comenzamos por considerar la estructura lógica del reclamo. Aquí la hipótesis\(H(x)\) es que\(x\) es un número racional, y la conclusión\(P(x)\) es que\(x^{2} \neq 2\). \[(\forall x) H(x) \Rightarrow P(x) .\]Deseamos probar Daremos una prueba por contradicción. Es decir, asumimos que la afirmación es falsa y derivamos una contradicción. Entonces asumimos\[\neg((\forall x) H(x) \Rightarrow P(x)) .\] Esto es lógicamente equivalente a\[(\exists x) H(x) \wedge \neg(P(x)) .\] Volvamos a la prosa matemática ahora que hemos luchado a través de la lógica. Supongamos que\(x\) es un número racional, y asumir también eso\(x^{2}=2\); deseamos derivar una contradicción lógica. Escribir\(x=m / n\), donde\(m\) y\(n\) son enteros distintos de cero que no tienen factores comunes. Entonces\[x^{2}=m^{2} / n^{2}=2,\] así\(m^{2}=2 n^{2}\). Por lo tanto\(m^{2}\) es parejo, así que por el Ejemplo 3.21,\(m\) es parejo. Por lo tanto\(m=2 k\) para algún entero\(k\), y así\[m^{2}=4 k^{2}=2 n^{2} .\] Por lo tanto\(n^{2}=2 k^{2}\) es par, así\(n\) es par. Pero entonces ambos\(m\) y\(n\) son parejos, y así tienen 2 como factor común, lo que contradice la suposición de que\(m / n\) era la forma reducida del número racional\(x\).

    Las pruebas contrapositivas y las pruebas por contradicción son muy similares. En efecto, cualquier prueba contrapositiva, eso\(\neg P \Rightarrow \neg H\), automáticamente cede eso\((H \wedge \neg P)\) es imposible. La distinción es más lingüística que lógica. La razón de tener nombres para diferentes estrategias de prueba es brindar orientación al lector para que la prueba sea más fácil de seguir. En el Capítulo 4 veremos otro método poderoso para probar declaraciones universales sobrepasadas\(\mathbb{N}\), a saber, el Principio de Inducción.

    3.5.2. Pruebas de Existencia. Una segunda forma común para una afirmación matemática es una declaración existencial, es decir, una declaración en la forma\[(\exists x) P(x) \text {. }\] Hay tres enfoques comunes para probar afirmaciones existenciales.

    (1) Construcción.

    Obviamente, la forma más directa de mostrar que algo existe con ciertas propiedades es introducir o construir un objeto con propiedad\(P\). Para las reclamaciones en esta forma, el ejemplo es la prueba, aunque habrá que demostrar que el objeto satisface\(P\), si no es obvio.

    EJEMPLO 3.25. Demostrar que existe una función real cuya primera derivada es en todas partes positiva, y cuya segunda derivada es en todas partes negativa.

    Prueba. La forma más fácil de hacerlo es anotar una función con estas propiedades. Una de esas funciones es\(f(x)=1-e^{-x}\). El derivado es\(e^{-x}\), que en todas partes es positivo, y el segundo derivado lo es\(-e^{-x}\), que en todas partes es negativo.

    (2) Conteo.

    A veces se puede establecer la existencia de un objeto mediante un argumento de conteo.

    EJEMPLO 3.26. Supongamos que hay 30 alumnos en una clase. Demostrar que al menos dos de ellos comparten la misma última inicial.

    PRUEBA. Por cada letra\(A, B, \ldots\) agrupa a todos los alumnos con esa letra como su última inicial. Como solo hay 26 grupos y\(30>26\) estudiantes, al menos un grupo debe tener más que sobre estudiante en él.

    El argumento que acabamos de dar se llama el “principio del casillero”, basado en la analogía de poner letras en casilleros. Si hay más letras que casilleros, entonces algún casillero debe tener más de una letra. Observe que a diferencia de una prueba constructiva, una prueba de conteo no le dice qué grupo tiene más de un elemento en ella.

    Para conocer la espectacular generalización de Cantor del principio del casillero a conjuntos infinitos, ver Capítulo 6.

    (3) Contradicción.

    Puede ser difícil probar declaraciones existenciales por construcción. Una alternativa es asumir que la afirmación existencial es falsa (que no hay objeto que satisfaga\(P(x)\)). Si es imposible que ningún objeto tenga propiedad\(P\), entonces algún objeto debe. Nuevamente, este enfoque puede no darnos mucha idea de los objetos que tienen propiedad\(P\). Ver por ejemplo Ejercicio 3.27.

    EJEMPLO 3.27. Supongamos que todos los puntos en el plano son de color rojo o azul. Demostrar que debe haber dos puntos del mismo color exactamente a una unidad de distancia.

    Comprobante. Supongamos que no los hay. Dibuja un triángulo equilátero del lado 1. Etiquetar sus vértices\(A, B\) y\(C\). Entonces\(A\) y\(B\) deben ser diferentes colores,\(B\) y\(C\) deben ser diferentes colores,\(C\) y\(A\) deben ser diferentes colores. Esto es imposible con solo dos colores para elegir.

    Observe que no hemos dicho si hay un par rojo-rojo que esté separado por unidad de distancia, o un par azul-azul que esté a distancia unitaria, solo que uno de esos pares debe existir.

    Ejercicios

    EJERCICIO 3.1. Demostrar las leyes de Morgan, (3.3) y (3.4). (Pista: Hay cuatro posibles asignaciones de valores de verdad 0 y 1 a las dos afirmaciones\(P\) y\(Q\). Para cada una de esas tareas, evalúe los valores de verdad de los lados izquierdo y derecho de (3.3) y demuestre que siempre son los mismos).

    EJERCICIO 3.2. Demostrar que las declaraciones compuestas\(P\) y\(Q\) son proposicionalmente equivalentes iff\(P \Longleftrightarrow Q\).

    EJERCICIO 3.3. Dar un ejemplo de una declaración condicional verdadera en la que la consecuencia es falsa. EJERCICIO 3.4. Si\(P, Q\) y\(R\) son declaraciones, probar que son ciertas las siguientes:
    a)\(P \wedge \neg P \Rightarrow Q\)
    b)\([(P \Rightarrow Q) \wedge(Q \Rightarrow R)] \Rightarrow(P \Rightarrow R)\)
    c)\([P \Rightarrow(Q \wedge \neg Q)] \Rightarrow \neg P\)
    d)\([P \wedge(P \Rightarrow Q)] \Rightarrow Q\)
    e) \(P \Rightarrow(Q \vee \neg Q)\).

    EJERCICIO 3.5. Dejar\(P\) y\(Q\) ser declaraciones. Demostrar que hay declaraciones usando solamente\(P, Q, \neg\) y\(\wedge\) que son proposicionalmente equivalentes a
    a)\(P \wedge Q\)
    b)\(P \vee Q\)
    c)\(P \Rightarrow Q\).

    Demostrar que hay declaraciones usando solamente\(P, Q, \neg\) y\(\vee\) que son equivalentes a lo anterior.

    EJERCICIO 3.6. Demostrar las leyes distributivas para la lógica proposicional: Si\(P, Q\) y\(R\) son declaraciones, entonces
    a)\(P \vee(Q \wedge R) \equiv(P \vee Q) \wedge(P \vee R)\)
    b)\(P \wedge(Q \vee R) \equiv(P \wedge Q) \vee(P \wedge R)\).

    EJERCICIO 3.7. Demostrar la ley distributiva para conjuntos: Si\(X, Y\) y\(Z\) son conjuntos, entonces
    a)\(X \cup(Y \cap Z)=(X \cup Y) \cap(X \cup Z)\)
    b)\(X \cap(Y \cup Z)=(X \cap Y) \cup(X \cap Z)\).

    EJERCICIO 3.8. Dejar conjuntos\(X, Y\) y\(Z\) ser conjuntos característicos de fórmulas\(P(x), Q(x)\) y\(R(x)\) respectivamente. Para cada región posible del diagrama de Venn\(X, Y\) y\(Z\) dar una fórmula compuesta (con fórmulas atómicas\(P, Q\) y\(R\)) que tiene esa región como su conjunto característico.

    EJERCICIO 3.9. Escribe una fórmula en una variable que defina los enteros pares.

    EJERCICIO 3.10. Escribe una fórmula que defina cuadrados perfectos. EJERCICIO 3.11. Escribe una fórmula en dos variables que defina los puntos en los\(\mathbb{R}^{2}\) que tengan distancia 1 del punto\((\pi, e)\).

    EJERCICIO 3.12. ¿Se puede escribir una fórmula en una variable usando solo suma, multiplicación, exponenciación, enteros e igualdad, para definir el conjunto de todas las raíces de un polinomio dado con coeficientes enteros? ¿Qué tal el conjunto de raíces de todos los polinomios con coeficientes enteros?

    EJERCICIO 3.13. ¿Cuáles de las siguientes afirmaciones son ciertas?
    a)\((\forall x \in \mathbb{R}) x+1>x\)
    b)\((\forall x \in \mathbb{Z}) x^{2}>x\)
    c)\((\exists x \in \mathbb{Z})(\forall y \in \mathbb{Z}) x \leq y\)
    d)\((\forall y \in \mathbb{Z})(\exists x \in \mathbb{Z}) x \leq y\)
    e)\((\forall \varepsilon>0)(\exists \delta>0)(\forall x \in \mathbb{R})[0<|x-1|<\delta] \Rightarrow\left[\left|x^{2}-1\right|<\varepsilon\right]\).

    EJERCICIO 3.14. ¿Cuál es la negación de cada enunciado en el Ejercicio 3.13? ¿Cuál de las negaciones es verdad?

    EJERCICIO 3.15. Dejar\(a, L \in \mathbb{R}\) y\(f\) ser una función real. Demostrar que las declaraciones\[(\forall \varepsilon>0)(\exists \delta>0)(\forall x \in \operatorname{Dom}(f))[0<|x-a|<\delta] \Rightarrow[|f(x)-L|<\varepsilon]\] y no\[(\exists \delta>0)(\forall \varepsilon>0)(\forall x \in \operatorname{Dom}(f))[0<|x-a|<\delta] \Rightarrow[|f(x)-L|<\varepsilon]\] son equivalentes. ¿Qué afirmación es consecuencia de la otra?

    EJERCICIO 3.16. Dejar\(P(x, y)\) ser una fórmula en dos variables. Demostrar que en general no\((\forall x)(\exists y) P(x, y)\) necesita ser equivalente a\((\exists y)(\forall x) P(x, y)\). Demostrar que\((\forall x)(\forall y) P(x, y)\) es equivalente a\((\forall y)(\forall x) P(x, y)\). ¿Y qué pasa\((\exists x)(\exists y) P(x, y)\) con y\((\exists y)(\exists x) P(x, y)\)?

    EJERCICIO 3.17. Considera las siguientes afirmaciones. Anote lo contrapositivo y lo contrario a cada uno.

    (i) Todos los hombres son mortales.

    (ii) Me refiero a lo que digo. (iii) Toda función continua en el intervalo\([0,1]\) alcanza su máximo

    (iv) La suma de los ángulos de un triángulo es\(180^{\circ}\).

    EJERCICIO 3.18. Demostrar que un número es divisible por 4 si y sólo si sus dos últimos dígitos lo son.

    EJERCICIO 3.19. Demostrar que un número es divisible por 8 si sus últimos tres dígitos son.

    EJERCICIO 3.20. Demostrar que un número es divisible\(2^{n}\) por si sus últimos\(n\) dígitos son.

    EJERCICIO 3.21. Supongamos que\(m\) es un número con la propiedad de que cualquier número natural es\(m\) divisible por si sus últimos tres dígitos son. ¿De qué dice esto\(m\)? Demuestra tu aseveración.

    EJERCICIO 3.22. Demostrar que un entero es divisible por 11 si la suma de los dígitos colocados extrañamente menos la suma de los dígitos colocados uniformemente es divisible por 11. (Entonces\(11 \mid 823493\) iff 11 divide\((2+4+3)-(8+3+9)\).)

    EJERCICIO 3.23. Mostrar que cada intervalo contiene números racionales e irracionales.

    EJERCICIO 3.24. Demostrar que\(\sqrt{3}\) es irracional.

    EJERCICIO 3.25. Demostrar que\(\sqrt{10}\) es irracional.

    EJERCICIO 3.26. Demostrar que la raíz cuadrada de cualquier número natural es o bien un número entero o irracional.

    EJERCICIO 3.27. Demostrar que existen números irracionales\(x\) y\(y\) entonces eso\(x^{y}\) es racional. (Pista: considerar\(\sqrt{2}^{\sqrt{2}}\) y\(\left(\sqrt{2}^{\sqrt{2}}\right)^{\sqrt{2}}\).)

    EJERCICIO 3.28. Demostrar o refutar la siguiente aseveración: Cualesquiera 4 puntos en el plano, ninguno de los cuales tres son colineales, se encuentran en un círculo.

    EJERCICIO 3.29. Demostrar que hay un número infinito de primos. EJERCICIO 3.30. Para\(k=0,1,2\), deja\(P_{k}\) ser el conjunto de números primos que son congruentes con\(k \bmod 3\). Por el Ejercicio 3.29,\(P_{0} \cup P_{1} \cup P_{2}\) es infinito. ¿Se puede decir cuáles de los conjuntos\(P_{0}, P_{1}\) y\(P_{2}\) son infinitos?

    (Comentario: Para dos de los tres conjuntos, este problema no es demasiado difícil. Para el tercero, es sumamente difícil, y es un caso especial de un célebre teorema de Dirichlet. Ver\(e . g\). [8] para un tratamiento del teorema de Dirichlet.)

    EJERCICIO 3.31. Deja que los puntos en\(\mathbb{R}^{2}\) sean de color rojo, verde y azul. Demostrar que o bien hay dos puntos del mismo color a una distancia 1 de distancia, o bien hay un triángulo equilátero de longitud lateral\(\sqrt{3}\) todos cuyos vértices son del mismo color.

    EJERCICIO 3.32. Demostrar que\[e=\sum_{n=0}^{\infty} \frac{1}{n !}\] es irracional. (Pista: Argumenta por contradicción. Asumir\(e=\frac{p}{q}\) y multiplicar ambos lados por\(q !\) Reorganizar la ecuación para obtener un entero igual a una suma infinita de números racionales que converge a un número en\((0,1)\).)
    (1)

    \(5-2 \sqrt{-2}\)

    \(\sqrt{5}-\sqrt{-2}\)

    \(4=\sqrt{2}+\frac{}{}\)

    \(4+\frac{2}{4}\)

    \(\sqrt{4-2}+\frac{12}{}\)

    4

    \(\operatorname{sins}^{-2}+\frac{2}{}\)

    imagen

    1

    (\(2.7\)

    \(\sqrt{2-25}+\)

    (2)

    (\(2.7\)

    (2

    \(4=\sqrt{2}+\)

    \(\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}\)

    (\(2.7\)

    4

    (2020

    (2

    • 2

    2

    (

    r.

    a\(2+2\)

    \(\sqrt{2-2 \cdot 2 \cdot\)

    (

    (

    \((\sqrt{2}+2\)

    (

    4

    (200

    (\(2-2\)

    (

    \(\mathrm{~ r e s ~ a ~}\)

    (\(2-2=\)

    (2)

    4

    \((2+2)\)

    4

    4

    imagen

    imagen

    (1)

    • CAPÍTULO 4

    Principio de Inducción

    Ordenamientos de bienestar

    En este capítulo discutimos el principio de inducción matemática. Tenga en cuenta que la palabra inducción tiene un significado diferente en matemáticas que en el resto de la ciencia. El principio de inducción matemática depende de la estructura de orden de los números naturales, y nos da una técnica poderosa para probar afirmaciones matemáticas universales.

    DEFINICIÓN. Bien ordenado Let\(X\) ser un conjunto, y\(\preceq\) un orden lineal en\(X\). Decimos que\(X\) está bien ordenado con respecto a\(\preceq\) (o\(\preceq\) es un wellordering de\(X\)) si cada subconjunto no vacío de\(X\) tiene un elemento mínimo con respecto a\(\preceq\). Es decir, para cualquier subconjunto no vacío\(Y\) de\(X\)\[(\exists a \in Y)(\forall y \in Y) a \preceq y .\] En general, los ordenamientos lineales no necesitan ser ordenamientos bien. El ordenamiento correcto es una propiedad universal: un conjunto\(X\) con un orden\(\preceq\) está bien ordenado si cada subconjunto no vacío de\(X\) tiene un elemento mínimo con respecto a\(\preceq\). Si hay algún subconjunto no vacío que no tenga un elemento mínimo, entonces\(\preceq\) no se ordena bien\(X\).

    EJEMPLO 4.1. \(\mathbb{Z}\)no está bien ordenado por\(\leq\). Los enteros no tienen un elemento mínimo, lo que basta para demostrar que no\(\mathbb{Z}\) está bien ordenado por\(\leq\).

    EJEMPLO 4.2. Vamos\(X=\{x \in \mathbb{R} \mid x \geq 2\}\). Let\(\leq\) be the usual order on\(\mathbb{R} . X\) is linealmente ordenado por\(\leq\), pero no\(X\) es bien ordenado por\(\leq\). En este ejemplo,\(X\) tiene un elemento mínimo, pero cualquier intervalo abierto contenido en no\(X\) podrá tener un elemento mínimo. Las propiedades clave del orden\(\mathbb{N}\) son que está bien ordenado y cada elemento de\(\mathbb{N}\), excepto 0, es el sucesor de un número natural:

    PRINCIPIO DE BIENESTAR PARA LOS NUMEROS NATURALES: El conjunto\(\mathbb{N}\) está bien ordenado\(\leq\)

    PROPIEDAD SUCESORA PARA LOS NÚMEROS NATURALES: Si\(n \in \mathbb{N}\) y\(n \neq 0\), entonces hay\(m \in \mathbb{N}\) tal que\(n=m+1\).

    Si uno acepta una comprensión intuitiva de los números naturales, estos principios son más o menos obvios. En efecto, dejemos\(Y\) ser cualquier subconjunto no vacío de\(\mathbb{N}\). Como no está vacío, hay algunos\(m\) adentro\(Y\). Ahora, considere cada uno de los números\(0,1,2, \ldots, m\) finitamente muchos a su vez. Si\(0 \in Y\), entonces 0 es el elemento menor. Si 0 no está en\(Y\), proceda a 1. Si esto está en\(Y\), debe ser el elemento menor; de lo contrario proceder a 2. Continúa de esta manera, y encontrarás algún número menor o igual que\(m\) ese es el menor elemento de\(Y\).

    Este argumento, aunque convincente, sí se basa en el hecho de que tenemos una idea de lo que\(\mathbb{N}\) “es”. Si queremos definir\(\mathbb{N}\) en términos de operaciones de conjunto, como hacemos en el Capítulo 8, esencialmente tenemos que incluir como axioma el principio bien ordenado para los números naturales.

    Principio de Inducción

    Comenzamos por probar un teorema que es equivalente al principio de inducción.

    TEOREMA 4.3. Si
    (1)\(X \subseteq \mathbb{N}\)
    (2)\(0 \in X\)
    (3)\((\forall n \in \mathbb{N}) n \in X \Rightarrow(n+1) \in X\),

    luego\[X=\mathbb{N}\] Discusión. Discutiremos por contradicción. Eso lo asumimos\(X \neq \mathbb{N}\). Que\(Y\) sea el complemento de\(X\) in\(\mathbb{N}\). Dado que no\(Y\) está vacío, tendrá un elemento mínimo. La tercera hipótesis del teorema no permitirá un elemento mínimo en\(Y\), que no sea 0, y esto es imposible por la segunda hipótesis. Por lo tanto,\(Y\) es necesariamente vacío.

    Comprobante. Vamos\(X\) a satisfacer las hipótesis del teorema. \[Y=\mathbb{N} \backslash X .\]Dejemos Supongamos que no\(Y\) está vacío. Ya que\(Y \subseteq \mathbb{N}, Y\) está bien ordenado por\(\leq\). Dejar\(a \in Y\) ser el menor elemento de\(Y\). Observamos que no\(a\) es 0, ya que\(0 \in X\). Por lo tanto\(a \geq 1\) y es un sucesor, así\(a-1\) es en\(\mathbb{N}\) y no en\(Y\). De ahí\(a-1\) está en\(X\). Pero luego por hipótesis (3) del teorema,\(a-1+1 \in X\). Esto es una contradicción, por lo tanto\(Y\) está vacío y\(X=\mathbb{N}\).

    OBSERVACIÓN. Ocasionalmente incluiremos discusiones informales etiquetadas en nuestras pruebas para guiarte en tu lectura. Esta no es una práctica habitual. No debe incluir tales discusiones en sus pruebas a menos que su instructor lo solicite.

    El teorema\(4.3\) se aplica más fácilmente en la siguiente forma.

    COROLARIO 4.4. Principio de inducción Dejar\(P(x)\) ser una fórmula en una variable. Si

    (1)\(P(0)\)

    (2)\((\forall x \in \mathbb{N}) P(x) \Rightarrow P(x+1)\),

    después\[(\forall x \in \mathbb{N}) P(x) .\] Prueba. Que\[\chi_{P}=\{x \in \mathbb{N} \mid P(x)\} .\] Deseemos demostrar eso\(\chi_{P}=\mathbb{N}\). Por suposición (1),\(P(0)\), entonces\(0 \in \chi_{P}\). Asumir eso\(n \in \chi_{P}\). Entonces\(P(n)\). Por suposición (2)\[P(n) \Rightarrow P(n+1) .\] Por lo tanto\(P(n+1)\) y\(n+1 \in \chi_{P}\). Ya que\(n\) es arbitrario,\[(\forall n \in \mathbb{N}) n \in \chi_{P} \Rightarrow n+1 \in \chi_{P} .\] Por Teorema 4.3,\(\chi_{P}=\mathbb{N}\) y\[(\forall x \in \mathbb{N}) P(x)\] Supongamos que se desea demostrar que una fórmula\(P(x)\) sostiene para todos los números naturales. Al argumentar por inducción, el autor debe demostrar que las hipótesis para el teorema están satisfechas. Por lo general, el autor primero lo demuestra\(P(0)\). A esto se le llama el caso base de la prueba por inducción. Muy a menudo es una conclusión fácil, incluso trivial. No obstante, es necesario probar un caso base para poder argumentar por inducción (¿se puede demostrar esto?). Habiendo probado el caso base, el autor probará entonces la segunda hipótesis, a saber, que la afirmación de ser cierta para un número natural arbitrario implica que es cierto en el sucesor de ese número natural. Este es el paso de inducción. El paso de inducción requiere probar una declaración condicional, que a menudo se prueba directamente. Es importante entender que el autor no está alegando que\(P\) sostiene en un número natural arbitrario, de lo contrario el argumento sería circular e inválido. Más bien, el autor demostrará que si el resultado fuera cierto en un número natural arbitrario, entonces sería cierto para el número natural posterior. El supuesto que se\(P\) sostiene en un número natural fijo y arbitrario se denomina hipótesis de inducción. Si el autor prueba con éxito el caso base y el paso de inducción, entonces\(4.4\) se satisfacen los supuestos de Corolario, y\(P\) mantiene en todos los números naturales.

    Proposición 4.5. Vamos\(N \in \mathbb{N}\). Después\[\sum_{n=0}^{N} n=\frac{N(N+1)}{2} .\] Discusión. Este es un buen primer ejemplo de una prueba por inducción. El argumento es una aplicación directa de la técnica y el resultado es de interés histórico y práctico. Argumentamos por inducción en el índice superior de la suma. Es decir, la fórmula que estamos demostrando para todos los números naturales es\[P(x): \sum_{n=0}^{x} n=\frac{x(x+1)}{2} .\] Es importante identificar la cantidad sobre la que se está aplicando el principio de inducción, pero algunos autores que están escribiendo un argumento para lectores que están familiarizados con la inducción pueden no declarar explícitamente la fórmula.

    Demostramos un caso base\(N=0\),, que corresponde a la suma con el término único 0. Luego argumentamos el paso de inducción. Este es nuestro primer argumento utilizando el principio de inducción. Preste mucha atención a la estructura de esta prueba. Debes esforzarte por seguir las convenciones de pruebas por inducción que establecemos en este libro.

    Comprobante. Caso base:\(N=0\).

    Discusión. Tenga en cuenta que el caso base es la declaración\(P(0)\).

    Ya que\[\sum_{n=0}^{0} n=0=\frac{(0)(1)}{2},\]\(P(0)\) sostiene.

    Paso de inducción:

    Discusión. Demostramos la afirmación universal\[(\forall x \in \mathbb{N}) P(x) \Rightarrow P(x+1) .\] demostrando que para un número natural arbitrario\(N\)\[P(N) \Rightarrow P(N+1) .\] Así reducimos probar una declaración universal a probar una declaración condicional abstracta. Demostramos directamente la declaración condicional resultante. Es decir, asumimos\(P(N)\) y derivamos\(P(N+1)\). Le recordamos al lector que no estamos reclamando que el resultado se mantenga en\(N\) - es decir, no reclamamos\(P(N)\). Más bien, estamos demostrando la afirmación condicional asumiendo el antecedente, la hipótesis de inducción y derivando la consecuencia. Si no usas la hipótesis de inducción, no estás discutiendo por inducción. Desde luego, en el cuerpo del argumento esto es transparente, sin referencia a los principios lógicos subyacentes.

    Vamos\(N \in \mathbb{N}\) y supongamos que\[\sum_{n=0}^{N} n=\frac{N(N+1)}{2} .\] Entonces\ [\ begin {alineado} \ sum_ {n=0} ^ {N+1} n &=\ left (\ sum_ {n=0} ^ {N} n\ derecha) +N+1\\ &= {} _ {I H}\ frac {N (N+1)} {2} +N+1 \ end {alineado}\] por la hipótesis de inducción.

    Discusión. Es un buen hábito, y una consideración para tu lector, identificar cuándo estás invocando la hipótesis de inducción. Utilizaremos el subíndice\({ }_{I H}\) para indicar dónde invocamos la hipótesis de inducción.

    Entonces\ [\ comenzar {alineado} \ sum_ {n=0} ^ {N+1} n &=\ frac {N (N+1)} {2} +N+1\\ &=\ frac {N (N+1)} {2} +\ frac {2 N+2} {2}\\ &=\ frac {N^ {2} +3 N+2} {2}\\ &= frac ac {(N+1) ((N+1) +1)} {2}. \ end {aligned}\] Por lo tanto,\[(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) .\] Por el principio de inducción, la proposición sigue.

    Proposición 4.6. Vamos\(N \in \mathbb{N}\). Después\[\sum_{n=0}^{N} n^{2}=\frac{N(N+1)(2 N+1)}{6} .\] Prueba. La aseveración\(P(N)\) es que la ecuación (4.7) sostiene. El caso base,\(N=0\), es obvio: Paso\[\sum_{n=0}^{0} n^{2}=\frac{0(0+1)(2 \cdot 0+1)}{6} .\] de inducción:

    Supongamos que\(N \in \mathbb{N}\) y\[\sum_{n=0}^{N} n^{2}=\frac{N(N+1)(2 N+1)}{6}\] demostramos que\[\sum_{n=0}^{N+1} n^{2}=\frac{(N+1)(N+2)(2 N+3)}{6}\] Efectivamente\ [ \ begin {alineado}\ sum_ {n=0} ^ {N+1} n^ {2} &=\ left (\ sum_ {n=0} ^ {N} n^ {2}\ derecha) + (N+1) ^ {2}\\ &=I H\\ &=\ frac {N (N+1) (2 N+1)} {6} + (N+1) ^ {2}. \\ &=\ frac {N (N+1) (2 N+1)} {6} + (N+1) ^ {2}\\ &=\ frac {2 N^ {3} +9 N^ {2} +13 N+6} {6}\\ &\ frac {(N+1) (N+2) (2 (N+1) +1)} {6}. \ end {aligned}\] La proposición se desprende del principio de inducción.

    Discusión. La prueba de la Proposición\(4.6\) es muy similar a la prueba de la Proposición 4.5. Es posible que desee confirmar las identidades algebraicas en la última parte de la prueba, ya que no son obvias. Se incluye solo el detalle suficiente para guiarlo a través de la prueba de la implicación. El autor de una prueba por inducción asumirá que te sientes cómodo con la técnica, y con ello puede proporcionar menos detalles de los que te gusta.

    OBSERVACIÓN. Hay más en las Proposiciones\(4.5\) y\(4.6\) que solo las pruebas. También están las fórmulas. En efecto, un uso de la inducción es que si adivina una fórmula, puede usar la inducción para demostrar que su fórmula es correcta. Ver Ejercicios\(4.12\) y 4.16.

    ¿Por qué es necesario un caso base? Considera el siguiente argumento a favor de la falsa pretensión\(\sum_{n=0}^{N} n<\frac{N(N+1)}{2}\). Vamos\(N \in \mathbb{N}\) y supongamos\(P(N)\), donde\(P(N)\) esta la sentencia\[\sum_{n=0}^{N} n<\frac{N(N+1)}{2} .\] Entonces\ [\ begin {alineada} \ suma_ {n=0} ^ {N+1} n &=\ left (\ sum_ {n=0} ^ {N} n\ derecha) +N+1\\ <_ {I H} &\ frac {N (N+1)} {2} +N+1\\ &=\ frac {N^ {2} +3} {2}\ \ &=\ frac {(N+1) ((N+1) +1)} {2}. \ end {aligned}\] De ahí, por\[(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) .\] supuesto que la desigualdad\(P(N)\) se demuestra fácilmente como falsa. ¿Qué salió mal? Sin un caso base, probar no\[(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1)\] es suficiente para probar\((\forall N \in \mathbb{N}) P(N)\). Si\(P(0)\) fuera verdad, entonces\(P(1)\) sería verdad, y si\(P(1)\) fuera verdad, entonces lo\(P(2)\) sería, y así sucesivamente. En efecto, si somos capaces de probar\(P(N)\) para alguno\(N \in \mathbb{N}\), entonces sabemos\(P(M)\) por cualquier número natural\(M>N\). Pero la secuencia de declaraciones\(\langle P(0), P(1), P(2), \ldots\rangle\) nunca se inicia. \(P(N)\)falla para todos\(N\).

    Otra forma de pensar en la inducción es en términos de garantías. Supongamos que decide comprar un auto. Primero vas a Honest Bob's Bob garantiza que cualquier auto que venda irá por lo menos a una milla. Se compra un auto, lo sacas del lote, y después de 3 millas se descompone y no se puede arreglar. Regresas con enojo, pero Bob no te devolverá tu dinero porque el auto estuvo a la altura de la garantía.

    Entonces cruzas la carretera hacia Honest John's John garantiza que si te vende un auto, una vez que arranca nunca se detendrá. Esto suena bastante bien, así que compras un auto, pones las llaves en el encendido, y... nada. El auto no arranca. John tampoco te devolverá tu dinero, porque el auto no dejó de hacer lo que reclamó.

    Sentirse desesperado, terminas en Honest Stewart's Los autos de Stewart vienen con dos garantías:

    (1) El auto arrancará y recorrerá al menos una milla.

    (2) No importa qué tan lejos haya ido el auto, siempre se puede conducir una milla extra.

    Piensas esto de nuevo, y finalmente decides que el auto irá para siempre. Lo mejor de todo es que el arrendamiento es de solo\(\$ 1\) un mes por los dos primeros meses. Firmas el contrato de arrendamiento y conduces a casa bastante satisfecho contigo mismo. \({ }^{1}\)

    Hay muchas generalizaciones útiles del principio de inducción. El primero que discutimos se llama inducción fuerte. Se llama así porque la hipótesis de inducción es más fuerte que la hipótesis de inducción en la inducción estándar, y por lo tanto el paso de inducción a veces es más fácil de probar en un argumento por inducción fuerte.

    COROLARIO 4.8. Inducción fuerte Deja\(P(x)\) que sea una fórmula tal que

    \({ }^{1}\)Tienes razón en que el Principio de Inducción garantiza que tu auto conducirá para siempre. No obstante, como señala tu madre cuando le muestras el contrato de arrendamiento, después de los dos primeros meses tu pago cada mes es la suma de tus pagos en los dos meses anteriores. ¿Cuánto vas a pagar después de 5 años? (1)\(P(0)\)

    (2) Para cada uno\(n \in \mathbb{N}\),\[[(\forall x<n) P(x)] \Rightarrow[P(n)]\] entonces\[(\forall x \in \mathbb{N}) P(x)\] Intuitivamente esto no es muy diferente de la inducción básica. Empiezas en un caso base, y una vez iniciado puedes continuar por el resto de los números naturales. La distinción está justo en el número de suposiciones que usas al momento de probar algo por fuerte inducción. En la práctica, da la ventaja de que en el paso de inducción se puede reducir caso\(N\) a cualquier caso anterior, en lugar del caso inmediatamente anterior,\(N-1\). En particular, esto simplifica los argumentos sobre la divisibilidad y los enteros.

    Discusión. Reducimos el principio de inducción fuerte al principio de inducción. Esto lo logramos introduciendo una fórmula\(Q(x)\), que dice: “P (y) es cierto para todos\(y<x "\). La inducción fuerte\(P(x)\) es equivalente a la inducción básica en\(Q(x) .\)

    PRUEBA. Supongamos que\(P(x)\) satisface las hipótesis del corolario. Que\(Q(x)\) sea la fórmula\[(\forall y \leq x) P(y)\] donde\(y\) está el universo de\(\mathbb{N}\). Entonces\(Q(0) \equiv P(0)\), así es cierto. Vamos\(N \in \mathbb{N}\),\(N \geq 1\), y asumir\(Q(N)\). Entonces\[(\forall y \leq N) P(y)\] y por lo tanto\(P(N+1)\). De ahí\[(\forall n \leq N+1) P(y)\] y así\(Q(N+1)\). Por lo tanto\[(\forall x \in \mathbb{N}) Q(x) \Rightarrow Q(x+1)\] Por el principio de inducción,\[(\forall x \in \mathbb{N}) Q(x) .\] Sin embargo, para cualquier\(N \in \mathbb{N}, Q(N) \Rightarrow P(N)\), por lo que la inducción\[(\forall x \in \mathbb{N}) P(x) .\] Fuerte es particularmente útil a la hora de probar afirmaciones sobre división. Hay ejemplos de la técnica a lo largo del Capítulo 7. Los resultados en el Capítulo 7 no requieren el Capítulo 5 y el Capítulo 6, por lo que fácilmente puede saltarse adelante. Véase por ejemplo la Sección 7.1, donde se prueba el Teorema Fundamental de Aritemética mediante inducción fuerte. La inducción no tiene que comenzar en 0, ni siquiera en un número natural.

    Corolario 4.9. Dejar\(k \in \mathbb{Z}\), y\(P(x)\) ser una fórmula en una variable tal que

    (1)\(P(k)\)

    (2)\((\forall x \geq k) P(x) \Rightarrow P(x+1)\).

    Después\[(\forall x \in \mathbb{Z}) x \geq k \Rightarrow P(x)\] Discusión. Esto se puede probar definiendo una nueva fórmula que se puede probar con inducción estándar. ¿Se puede definir la fórmula?

    Polinomios

    Ahora utilizamos la maquinaria desarrollada en Sección\(4.2\) para emprender un modesto programa matemático. Como indicamos en el primer capítulo de este libro, la mayoría de ustedes, hasta ahora, han utilizado resultados matemáticos para resolver problemas en cómputos. Aquí nos interesa probar un resultado con el que te puede estar familiarizado.

    Este resultado se refiere a polinomios con coeficientes reales (es decir, coeficientes que son números reales). Has pasado buena parte de tu vida matemática investigando polinomios, e indudablemente puedes hacer muchas afirmaciones interesantes y veraces sobre ellos. Pero, ¿qué tan seguro está de que estas afirmaciones son ciertas? Es posible que su creencia en estas afirmaciones sea, en general, mera confianza en las afirmaciones y creencias de expertos en la materia. En la práctica, se puede hacer peor que consentir las aseveraciones de los especialistas, y las limitaciones prácticas generalmente nos obligan a aceptar muchas afirmaciones sobre la fe. Por supuesto, esta práctica conlleva riesgos. Durante cientos de años, las aseveraciones de Aristóteles fueron ampliamente aceptadas, muchas veces a pesar de la evidencia empírica de lo contrario. Naturalmente, seguimos aceptando muchas afirmaciones sobre la fe. En el caso de la ciencia moderna, generalmente no tenemos acceso de primera mano a la evidencia primaria en la que se basan las teorías científicas modernas. Las matemáticas son diferentes de cualquier otro campo del esfuerzo intelectual porque tienes la oportunidad de verificar prácticamente cada reclamo matemático que encuentres. Ahora estás en el punto de tu carrera matemática en el que puedes confirmar directamente los resultados matemáticos.

    El teorema que deseamos probar es que el número de raíces reales de un polinomio real es a lo sumo el grado del polinomio. Es posible que esté familiarizado con esta afirmación, pero no esté seguro de por qué se sostiene. Este resultado es interesante, en parte, porque garantiza que la gráfica de un polinomio cruzará cualquier línea horizontal solo finitamente muchas veces. Dicho de otra manera, los conjuntos de niveles de polinomios no pueden tener más elementos que el grado del polinomio.

    Notación. \(\mathbb{R}[x] \mathbb{R}[x]\)es el conjunto de polinomios con coeficientes reales en la variable\(x\).

    TEOREMA 4.10. Dejar\(N \in \mathbb{N}\) y\(p \in \mathbb{R}[x]\) tener grado\(N \geq 1\). Entonces\(p\) tiene a lo sumo raíces\(N\) reales.

    Discusión. Este resultado es lo suficientemente difícil como para que tengamos que probar tres resultados preliminares. Estos lemas\({ }^{2}\) se prueban dentro del argumento a favor del teorema. A lo largo del argumento estaremos investigando un polinomio general,\(p\), de grado\(N\).

    \({ }^{2}\)Un lema es un resultado auxiliar que se utiliza en la prueba de un teorema, algo así como una subrutina. En alemán, un teorema se llama “Satz” y un lema se llama “Hilfsatz”, un “teorema auxiliar”. Comprobante. Primero probamos que la propiedad distributiva generaliza a un número arbitrario de summands.

    LEMA 4.11. Dejar\(N \in \mathbb{N}^{+}\) y, para\(0 \leq n \leq N, a_{n} \in \mathbb{R}\). Si\(c \in \mathbb{R}\), entonces\[\sum_{n=0}^{N} c a_{n}=c\left(\sum_{n=0}^{N} a_{n}\right) .\] Discusión. Este resultado generaliza la propiedad distributiva a más de dos summands. Estamos asumiendo la propiedad distributiva de los números reales: para\(a, b, c \in \mathbb{R}\),\[c \cdot(a+b)=c a+c b\] Probamos el lema por inducción. Es sorprendente que una afirmación que parece tan obvia utilice la poderosa maquinaria de inducción. Pero recuerden que estamos demostrando esto por todas las sumas finitas de arbitrariamente muchos summands. Por supuesto, puede sentir que el lema es del todo obvio. Si es así, deberías intentar producir tu propia prueba, o leer esta para practicar en inducción matemática en un contexto donde el contenido matemático sea fácil.

    Argumentaremos por inducción sobre el número de términos en la suma. El caso base es para sumas con dos summands - esto es solo la propiedad distributiva. En el paso de inducción probamos el resultado condicional que si el lema tiene para todas las sumas con\(N\) términos, entonces se mantiene para todas las sumas con\(N+1\) términos. En cada paso del argumento (pasos base e inducción) estamos argumentando por infinitamente muchas afirmaciones concretas argumentando a favor de una sola afirmación abstracta.

    Comprobante. Argumentamos por inducción sobre\(N\).

    Estuche base:\(N=1\) Let\(c, a_{0}, a_{1} \in \mathbb{R}\). Por la propiedad distributiva,\ [\ begin {aligned} \ sum_ {n=0} ^ {1} c a_ {n} &=c a_ {0} +c a_ {1}\\ &=c\ left (a_ {0} +a_ {1}\ right)\\ &=c\ left (\ sum_ {n=0} ^ {1} a_ {n}\ derecha). \ end {aligned}\] Paso de inducción:

    Dejar\(c \in \mathbb{R}\) y\(a_{n} \in \mathbb{R}\), para\(0 \leq n \leq N+1\). \[\sum_{n=0}^{N} c a_{n}=c\left(\sum_{n=0}^{N} a_{n}\right) .\]Suponemos que tenemos\ [\ begin {alineado} \ sum_ {n=0} ^ {N+1} c a_ {n} &=\ left (\ sum_ {n=0} ^ {N} c a_ {n}\ derecha) +c a_ {N+1}\\ &= {} _ {I H}\ quad c\ left (\ sum_ {n=0} ^ {N} a_ {n} a_ {n}\ derecha) +c a_ {N+1} \ end {alineado}\] Por la ley distributiva (para dos summands)\ [\ begin { alineado} c\ izquierda (\ suma_ {n=0} ^ {N} a_ {n}\ derecha) +c a_ {N+1} &=c\ izquierda (\ suma_ {n=0} ^ {N} a_ {n} +a_ {N+1}\ derecha)\\ &=c\ izquierda (\ suma_ {n=0} ^ {N+1} a_ {n}\ derecha). \ end {aligned}\] Por lo tanto,\[\sum_{n=0}^{N+1} c a_{n}=c\left(\sum_{n=0}^{N+1} a_{n}\right) .\] por el principio de inducción el resultado se mantiene para todos\(N \in \mathbb{N}\). LEMA 4.12. Si\(x, y \in \mathbb{R}\) y\(n \in \mathbb{N}^{+}\), entonces\ [\ comenzar {alineado} x^ {n} -y^ {n} & =( x-y)\ izquierda (x^ {n-1} +x^ {n-2} y+\ cdots+x y^ {n-2} +y^ {n-1}\ derecha)\\ & =( x-y)\ izquierda (\ sum_ {\ subestack {i, j\ en\ matemáticas bb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ derecha). \ end {alineado}\] Discusión. La notación en la última línea del lema significa que la suma se toma sobre todos los números naturales\(i\) y\(j\) que tienen la propiedad que\(i+j=n-1\).

    PRUEBA. Por Lema 4.11,\ [\ begin {alineado} (x-y)\ left (\ sum_ {\ subestack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ derecha) &=x\ izquierda (\ sum_ {\ subestack {i, j\ in\ mathbb {N}\ i+j=n= -1}} x^ {i} y^ {j}\ derecha) -y\ izquierda (\ sum_ {\ suback {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ derecha)\\ &=\ sum_ {\ substack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i+1} y^ {j} -\ sum_ {\ substack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j+1}\\ &=x^ {n} -y^ {n}. \ end {aligned}\] El siguiente lema asocia raíces de polinomios y factores lineales.

    LEMA 4.13. Dejar\(p\) ser un polinomio de grado\(N\). Un número real,\(c\), es una raíz de\(p\) iff\[p(x)=(x-c) q(x),\] donde\(q(x)\) es un polinomio de grado\(N-1\).

    Discusión. Este lema es una declaración bicondicional. Es decir, el lema es proposicionalmente equivalente a la conjunción de dos declaraciones condicionales. Demostramos las declaraciones condicionales de forma independiente. Una de las declaraciones condicionales es obvia (¿puedes determinar cuál?). La declaración condicional más difícil utilizará Lemma 4.12. Al probar un bicondicional,\(P \Longleftrightarrow Q\), al probar las declaraciones condicionales\(P \Rightarrow Q\) y\(Q \Rightarrow P\), a menudo usamos\((\Rightarrow)\) y\((\Leftarrow)\) para identificar la declaración condicional bajo consideración. Comprobante. Dejar\(p\) ser un polinomio de grado\(N\). Luego hay\(a_{0}, a_{1}, \ldots, a_{N} \in\)\(\mathbb{R}, a_{N} \neq 0\), tal que,\[p(x)=\sum_{n=0}^{N} a_{n} x^{n} .\] (\(\Leftarrow\)) Supongamos que hay\(c \in \mathbb{R}\) y un polinomio\(q\) de grado\(N-1\) tal que\[p(x)=(x-c) q(x) .\] Entonces \[p(c)=(c-c) q(c)=0 .\]Entonces\(c\) es una raíz de\(p\).

    \((\Rightarrow)\)Dejar\(c \in \mathbb{R}\) ser una raíz de\(p\). Entonces\ [\ begin {alineado} p (x) &=p (x) -p (c)\\ &=a_ {0} -a_ {0} +\ suma_ {n=1} ^ {N} a_ {n}\ izquierda (x^ {n} -c^ {n}\ derecha)\\ &=\ suma_ {n=1} ^ {N} a_ {n}\ izquierda (x^ {n} -c^ {n}\ derecha). \ end {alineado}\] Por Lema 4.12, para\(n \geq 1\),\[x^{n}-c^{n}=(x-c) q_{n}(x)\] donde\[q_{n}(x)=x^{n-1}+c x^{n-2}+\cdots+c^{n-2} x+c^{n-1}=\sum_{\substack{i, j \in \mathbb{N} \\ i+j=n-1}} x^{i} c^{j} .\] Por Lema 4.11,\[p(x)=\sum_{n=1}^{N} a_{n}\left(x^{n}-c^{n}\right)=(x-c) \sum_{n=1}^{N} a_{n} q_{n}(x) .\] Let\[q(x)=\sum_{n=1}^{N} a_{n} q_{n}(x) .\] Para todos\(n\) entre 1 y\(N, q_{n}(x)\) tiene grado\((n-1)\). Entonces el grado de\(q(x)\) es menor que\(N\). Sin embargo el coeficiente de\(x^{N-1}\) in\(q(x)\) es\(a_{N}\), y\(a_{N} \neq 0\) por suposición. Entonces el grado de\(q(x)\) es\(N-1\), y\[p(x)=(x-c) q(x) .\] completamos la prueba del teorema. Dejar\(p\) ser un polinomio de grado\(N\). Argumentamos por inducción sobre el grado de\(p\).

    Caso base:\(N=1\).

    Si\(p\) es un polinomio de grado 1, entonces es de la forma\[p(x)=a_{1} x+a_{0},\] y la única raíz es\(-a_{0} / a_{1}\).

    Paso de inducción:

    Supongamos que el teorema se sostiene para\(N \in \mathbb{N}^{+}\). Dejar\(p\) tener grado\(N+1\). Si no\(p\) tiene raíces, el teorema se sostiene para\(p\). Entonces supongamos que\(p\) tiene una raíz real,\(c \in \mathbb{R}\). Por Lemma\(4.13\),\[p(x)=(x-c) q(x),\] donde\(q\) es de grado\(N\). Por la hipótesis de inducción,\(q\) tiene a lo sumo raíces\(N\) reales. Si\(x\) es una raíz de\(p\), entonces por (4.14) o bien\(x\) es una raíz de\(q\) o\(x=c\). Por lo tanto\(p\) tiene como máximo\(N+1\) raíces, demostrando el paso de inducción.

    Como función, un polinomio en una variable particular es lo mismo que un polinomio con los mismos coeficientes en una variable diferente. Dejar\(p \in \mathbb{R}[x]\) ser\[p(x)=\sum_{n=0}^{N} a_{n} x^{n},\] y\(q \in \mathbb{R}[y]\) ser\[q(y)=\sum_{n=0}^{N} a_{n} y^{n} .\] Entonces como funciones reales\(p\) y\(q\) son la misma función. Es decir,\[\operatorname{graph}(p)=\operatorname{graph}(q) .\] como objetos algebraicos, sin embargo, ocasionalmente se podría desear distinguir entre polinomios en distintas variables.

    Terminamos esta sección demostrando que los polinomios son iguales como funciones si y sólo si tienen los mismos coeficientes.

    COROLARIO 4.15. Vamos\(p, q \in \mathbb{R}[x]\). Los coeficientes de\(p\) y\(q\) son iguales iff\[(\forall x \in \mathbb{R}) \quad p(x)=q(x) .\] Prueba. \((\Rightarrow)\)Si los coeficientes de\(p\) y\(q\) son todos iguales, entonces, dejando\(a_{n}\) denotar el\(n^{\text {th }}\) coeficiente, tenemos\[(\forall x \in \mathbb{R}) p(x)=\sum_{n=0}^{N} a_{n} x^{n}=q(x) .\] (\(\Leftarrow\)) Supongamos\((\forall x \in \mathbb{R}) p(x)=q(x)\). Entonces\(p-q\) es un polinomio con infinitamente muchas raíces. Si\(p\) y en\(q\) desacuerdo sobre algún coeficiente, entonces\(p-q\) es un polinomio distinto de cero, tiene un grado, y por Teorema 4.10, finitamente muchas raíces. Por lo tanto,\(p\) y\(q\) deben acordar todos los coeficientes.

    Desigualdad aritmética-geométrica

    Se han presentado modestas generalizaciones de inducción matemática básica (Corolario\(4.8\) y Corolario 4.9). La formalidad de nuestro enfoque podría sugerir que la inducción es una técnica rígida que debe aplicarse de manera inflexible de manera prescriptiva específica. A un matemático la inducción se rige por dos ideas:

    (1) La inducción utiliza el ordenamiento bien de los números naturales, o más generalmente cualquier conjunto bien ordenado, para probar declaraciones universales cuantificadas sobre el conjunto.

    (2) Cada elemento del conjunto sobre el que cuantifique debe ser contabilizado por la inducción.

    Las caracterizaciones formales de inducción en Sección\(4.2\) son suficientes pero no necesarias para lograr los objetivos de una prueba por inducción. El teorema de esta sección te dará un sentido sobre cómo se puede extender la técnica de inducción. DEFINICIÓN. Media aritmética Let\(a_{1}, \ldots, a_{N}\) Ser números reales. La media aritmética de\(a_{1}, \ldots, a_{N}\) es\[\frac{1}{N}\left(\sum_{n=1}^{N} a_{n}\right) .\] Definición. Media geométrica Let\(a_{1}, \ldots, a_{N}\) be números reales positivos. La media geométrica de\(a_{1}, \ldots, a_{N}\) es\[\sqrt[N]{a_{1} \cdots a_{N}} .\] TEOREMA 4.16. Desigualdad media aritmética-geométrica Let\(a_{1}, \ldots, a_{N} \in\)\(\mathbb{R}^{+}\). Después\[\sqrt[N]{a_{1} \cdots a_{n}} \leq \frac{1}{N}\left(\sum_{n=1}^{N} a_{n}\right) .\] Discusión. Esto lo demostramos con un argumento interesante debido originalmente a Cauchy; nuestro tratamiento es del libro [1]. Argumentamos por inducción sobre el tamaño de la muestra sobre la cual estamos calculando las medias. Después de argumentar el caso base mostramos que si la desigualdad se mantiene para las medias aritméticas y geométricas de\(N\) los números, necesariamente se sostiene para las medias de\(2 N\) los números. Esto implica que el teorema se sostiene para las medias de\(2^{N}\) números para cualquier\(N \in \mathbb{N}\) (por un argumento de inducción estándar).

    Luego mostramos que el resultado que se mantiene para\(N\) los números implica que se mantiene para\(N-1\) los números. Esto implica que si el resultado se mantiene en un número natural\(N\), la desigualdad se mantiene para todos los medios de menos de\(N\) números. Dado cualquiera\(k \in \mathbb{N}, 2^{k}>k\) y dado que el teorema se sostiene para medias de\(2^{k}\) números, se sostiene para medios de\(k\) términos.

    Comprobante. Argumentamos por inducción sobre el número de términos en cada lado de la desigualdad.

    Caso base:\((N=2)\)

    Vamos\(a_{1}, a_{2} \in \mathbb{R}^{+}\). Entonces\[\left(a_{1}-a_{2}\right)^{2}=a_{1}^{2}-2 a_{1} a_{2}+a_{2}^{2} \geq 0 .\] Por lo tanto\[2 a_{1} a_{2} \leq a_{1}^{2}+a_{2}^{2},\] y\ [\ comienzan {alineados} 4 a_ {1} a_ {2} &\ leq a_ {1} ^ {2} +2 a_ {1} a_ {2} +a_ {2} ^ {2}\\ &=\ izquierda (a_ {1} +a_ {2}\ derecha) ^ {2}. \ end {alineado}\] Así\[2 \sqrt{a_{1} a_{2}} \leq a_{1}+a_{2} .\] pues la desigualdad se mantiene por dos términos.

    Paso de inducción:

    \(P(N)\)Sea la afirmación que (4.17) sostiene para todos\(a_{1}, \ldots, a_{N}>0\). Eso lo demostramos\(P(N) \Rightarrow P(2 N)\). Vamos\[G_{N}=\prod_{n=1}^{N} a_{n}\] y\[A_{N}=\left(\frac{\sum_{n=1}^{N} a_{n}}{N}\right) .\] Así\ [\ comenzar {alineado} G_ {2 N} &=\ prod_ {n=1} ^ {2 N} a_ {n}\\ &=\ izquierda (\ prod_ {n=1} ^ {N} a_ {n}\ derecha)\ izquierda (\ prod_ {n=n+1} ^ {2 N} a_ {n}\ derecha)\\ &\ leq_ {I H}\ izquierda (\ suma_ {n=1} ^ {N}\ frac {a_ {n}} {N}\ derecha) ^ {N}\ izquierda (\ suma_ {n=n+1} ^ {2 N}\ frac {a_ {n}} {N}\ derecha) ^ {N} \ end {alineado}\] Dejar\[B=\sum_{n=N+1}^{2 N} \frac{a_{n}}{N} .\] Por el caso base\ [\ comenzar {alineado} A_ {N} B &\ leq\ izquierda (\ frac {A_ {N} +B} {2}\ derecha) ^ {2}\ &=\ izquierda (A_ {2 N}\ derecha) ^ {2} \ fin {alineado}\] Así que\ [\ comenzar {alineado} \ izquierda (A_ {N}\ derecha) ^ {N} B^ {N} & ; =\ left (A_ {N} B\ right) ^ {N}\\ &\ leq\ left (\ left (A_ {2 N}\ right) ^ {2}\ right) ^ {N}\\ &=\ left (A_ {2 N}\ right) ^ {2 N} \ end {alineado}\] Así\[G_{2 N} \leq\left(A_{2 N}\right)^{2 N} .\] pues, para cualquier\(N \in \mathbb{N}^{+}\),\[P(N) \Rightarrow P(2 N) .\] Discusión. \(Q(N)\)Déjese ser la declaración\(P\left(2^{N}\right)\). Entonces el argumento hasta el momento es una prueba estándar por inducción de\(\left(\forall N \in \mathbb{N}^{+}\right) Q(N)\). Por supuesto que queremos mostrar\((\forall N \in \mathbb{N}) P(N)\). Esto lo hacemos demostrando\[\left(\forall N \in \mathbb{N}^{+}\right) P(N+1) \Rightarrow P(N) .\] Let\(N>2\). Demostramos que\[P(N+1) \Rightarrow P(N) .\] Asumir\(P(N+1)\). Después\[\left(G_{N}\right)\left(A_{N}\right) \leq\left(\frac{\left(\sum_{n=1}^{N} a_{n}\right)+A_{N}}{N+1}\right)^{N+1} .\] Discusión. Recordemos que\(G_{N}\) es producto de\(a_{1}, \ldots, a_{N}\). Estamos tratando la suma\(A_{N}\) como el\(N+1^{\text {st }}\) factor,\(a_{N+1}\), y aplicando la desigualdad\(P(N+1)\).

    Como\ [\ comenzar {alineado} \ izquierda (\ frac {\ izquierda (\ suma_ {n=1} ^ {N} a_ {n}\ derecha) +A_ {N}} {N+1}\ derecha) ^ {N+1} &=\ izquierda (\ frac {N A_ {N} +A_ {N}} {N+1}\ derecha) ^ {N+1}\\ derecha) ^ {N+1}\ \\ left (A_ {N}\ right) ^ {N+1} \ end {alineado}\] La desigualdad\(4.18\) da\[G_{N} A_{N} \leq A_{N}^{N+1}\] y así\[G_{N} \leq\left(A_{N}\right)^{N}\] que es la declaración\(P(N)\). Entonces, de\[\left(\forall N \in \mathbb{N}^{+}\right) P(N+1) \Rightarrow P(N) .\] ahí para todos\(N \geq 2, P(N)\).

    La media aritmética y la media geométrica son diferentes formas de entender los promedios. Se relacionan por la desigualdad aritmética de la media geométrica (llamada desigualdad AGM). ¿Podemos aplicar la desigualdad? Consideremos una fácil aplicación geométrica del estuche\(N=2\). Considera el rectángulo con lados de largo\(a\) y\(b\). El perímetro del rectángulo es\[P=2 a+2 b\] y el área es\[A=a b .\]imagen

    En cálculo se demostró que el rectángulo de perímetro fijo con mayor área es el cuadrado. Esto también se puede probar directamente a partir de la desigualdad AGM:\ [\ begin {aligned} P &=2 a+2 b\\ &=\ frac {4 a+4 b} {2}\\ &\ geq\ sqrt {16 a b}\\ &=4\ sqrt {a b}. \ end {aligned}\] Así\[\frac{P^{2}}{16} \geq a b=A .\] Recordemos que\(P\) es fijo, y por lo tanto así es\(\frac{P^{2}}{16}\), y hemos demostrado que este es un límite superior para el área del rectángulo.

    ¿Se logra este límite superior? El área\(A\) del rectángulo varía según las dimensiones del rectángulo y si\(a=b\)\[\frac{P^{2}}{16}=\frac{(4 a)^{2}}{16}=A .\] Así se logra el área máxima del rectángulo cuando\(a=b\). Este resultado puede generalizarse a dimensiones superiores, sin necesidad de cálculo multivariable.

    Demostrar teoremas no es solo una cuestión de técnica, aunque esto debe dominarse. También requiere creatividad y perspicacia. Una hermosa colección de pruebas está contenida en el libro [1] de Martin Aigner y Günter Ziegler.

    Ejercicios

    EJERCICIO 4.1. Demostrar por inducción que 3 divide\(7^{n}-4\) por cada\(n \in \mathbb{N}^{+}\).

    EJERCICIO 4.2. Probar por inducción que\[(\forall n \in \mathbb{N}) 2^{n}>n .\] EJERCICIO 4.3. Demostrar que cualquier subconjunto de un conjunto bien ordenado es soldado. EJERCICIO 4.4. \((1+x)^{n} \geq 1+n x\)Demuéstralo para todos\(n \in \mathbb{N}^{+}\) y cada uno\(x \in(-1, \infty)\).

    EJERCICIO 4.5. Demuestre por inducción que cada conjunto finito de números reales tiene un elemento más grande.

    EJERCICIO 4.6. Dejar\(X\) y\(Y\) ser conjuntos con\(n\) elementos cada uno. ¿Cuántas bijecciones de\(X\) a\(Y\) hay? ¿Qué te dice esto sobre el número de permutaciones de\(\ulcorner n\urcorner\)? Demuestre su reclamo.

    EJERCICIO 4.7. Los coeficientes binomiales se\(\left(\begin{array}{l}n \\ k\end{array}\right)\) pueden definir a partir del triángulo de Pascal por:

    i)\(\forall n \in \mathbb{N},\left(\begin{array}{l}n \\ 0\end{array}\right)=\left(\begin{array}{l}n \\ n\end{array}\right)=1\).

    ii)\(\forall 2 \leq n \in \mathbb{N}, \forall 1 \leq k \leq n-1,\left(\begin{array}{l}n \\ k\end{array}\right)=\left(\begin{array}{c}n-1 \\ k\end{array}\right)+\left(\begin{array}{c}n-1 \\ k-1\end{array}\right)\).

    Demostrar por inducción que\ [\ left (\ begin {array} {l} n\\ k \ end {array}\ right) =\ frac {n!} {(n-k)! k!} .\] EJERCICIO 4.8. Demostrar el teorema binomial: con\(\left(\begin{array}{l}n \\ k\end{array}\right)\) definido por el Ejercicio 4.7\(n \in \mathbb{N}\), para cualquiera, la siguiente identidad mantiene\ [(x+y) ^ {n} =\ sum_ {k=0} ^ {n}\ left (\ begin {array} {l} n\\ k \ end {array}\ right) x^ {n-k} y^ {k}.\] EJERCICIO 4.9. Demostrar\(\sum_{k=0}^{n}\left(\begin{array}{l}n \\ k\end{array}\right)=2^{n}\).

    EJERCICIO 4.10. Demostrar\(n \in \mathbb{N}^{+}\), para todos,\ [\ left (\ begin {array} {c} 2 n\\ n \ end {array}\ right)\ geq\ frac {2^ {2 n-1}} {\ sqrt {n}}\] EJERCICIO 4.11. El Principio de Descenso dice que no hay una secuencia infinita estrictamente decreciente de números naturales. Demostrar el Principio de Descenso.

    EJERCICIO 4.12. Los números de Fibonacci se definen recursivamente por\(F_{1}=1, F_{2}=1\), y para\(n \geq 3, F_{n}=F_{n-1}+F_{n-2}\). Demostrar que los números de Fibonacci vienen dados por la ecuación\[F_{n}=\frac{(1+\sqrt{5})^{n}-(1-\sqrt{5})^{n}}{2^{n} \sqrt{5}} .\] Este es un ejemplo de una fórmula que es difícil de adivinar, pero fácil de verificar. Para una explicación de cómo surge la fórmula, ver Ejercicio 5.29.

    EJERCICIO 4.13. Que\(X\) sea un conjunto bien ordenado por una relación\(\preceq\). Decimos que una secuencia de elementos en\(X,\left\langle x_{n} \mid n \in \mathbb{N}\right\rangle\), es estrictamente decreciente (con respecto a\(\preceq\)) si para todos\(m, n \in \mathbb{N}\)\[[m<n] \Rightarrow\left[x_{n} \preceq x_{m} \wedge x_{n} \neq x_{m}\right] .\] Probar que no hay una secuencia estrictamente decreciente de elementos en\(X\).

    EJERCICIO 4.14. Demostrar que el último dígito de\(7^{7} \underbrace{7}\) es 3 para cualquier torre de sietes de altura superior a 1.

    EJERCICIO 4.15. Dar otro ejemplo que ilustre la necesidad de un caso base en una prueba válida por inducción.

    EJERCICIO 4.16. Supongamos que hay un polinomio de grado 4 en\(N\) que da\(\sum_{n=0}^{N} n^{3}\). Encuentra el polinomio y luego prueba que la fórmula es correcta por inducción.

    Usa el método de Arquímedes para demostrar que

    EJERCICIO 4.17. Dejar\(\mathbb{N}[x]\) ser el conjunto de polinomios con coeficientes numéricos naturales. Definir una relación\(\preceq\)\(\mathbb{N}[x]\) por:

    Vamos\(p(x)=\sum_{n=0}^{N} a_{n} x^{n}\), y\(q(x)=\sum_{n=0}^{M} b_{n} x^{n}\). Decir que\(p \preceq q\) iff, si\(k\) es el coeficiente de grado más alto en el que\(p\) y\(q\) difieren, entonces\(a_{k} \leq b_{k}\). ¿Es\(\preceq\) un ordenamiento lineal? ¿Es un buen orden de\(\mathbb{N}[x]\)?

    EJERCICIO 4.18. Supongamos que existe un polinomio\(p\) de grado 5 tal que\[\sum_{n=0}^{N} n^{4}=p(N) .\] Encuentra\(p\) y prueba que la fórmula que propones es correcta.

    EJERCICIO 4.19. Determinar el conjunto de números naturales positivos de\(n\) tal manera que la suma de cada número natural\(n\) consecutivo sea divisible por\(n\). EJERCICIO 4.20. Que\(f\) sea una función real tal que, para\(x, y \in \mathbb{R}\),\[f(x+y)=f(x)+f(y) .\] Demostrar que

    a)\(f(0)=0\)

    b)\(f(n)=n f(1)\).

    EJERCICIO 4.21. Demostrar Corolario 4.9.

    EJERCICIO 4.22. Considera cajas con dimensiones\(a, b\) y\(c\) en las que se fija la suma de las dimensiones (i.e.\(a+b+c\)). Demostrar que la caja con mayor volumen posible tiene dimensiones que satisfacen\(a=b=c\).

    EJERCICIO 4.23. Demostrar por inducción que cualquier declaración proposicional bien formada tiene un valor de verdad bien definido.

    EJERCICIO 4.24. Demostrar por inducción en el número de conectivos proposicionales que cada declaración proposicional compuesta es equivalente a una declaración usando solo\(\neg\) y\(\vee\).

    EJERCICIO 4.25. Demostrar por inducción en el número de conectivos proposicionales que cada declaración proposicional compuesta es equivalente a una declaración usando solo\(\neg\) y\(\wedge\).

    EJERCICIO 4.26. Dejar\(Q_{i}\) ser un cuantificador, para\(1 \leq i \leq n\). Para cada uno\(Q_{i}\), deja\(Q_{i}^{*}\) ser el cuantificador complementario. Es decir, si\(Q_{i}=\forall\), entonces\(Q_{i}^{*}=\exists\); si\(Q_{i}=\exists\), entonces vamos\(Q_{i}^{*}=\forall\). Demostrar por inducción en el número de cuantificadores que,\(\neg\left(Q_{1} x_{1}\right)(\ldots)\left(Q_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) \equiv\left(Q_{1}^{*} x_{1}\right)(\ldots)\left(Q_{n}^{*} x_{n}\right) \neg P\left(x_{1}, \ldots, x_{n}\right) .\)

    EJERCICIO 4.27. Definir el número de\(n^{\text {th }}\) Fermat para que sea\[F_{n}:=2^{2^{n}}+1, \quad n \in \mathbb{N} .\] (i) Mostrar que los números de Fermat satisfacen\[\prod_{k=0}^{n} F_{k}=F_{n+1}-2 .\] (ii) Concluir que dos números Fermat distintos son coprimos. EJERCICIO 4.28. Dejar\(\left\langle a_{n}: n \in \mathbb{N}\right\rangle\) ser una secuencia de números positivos. Supongamos que\(a_{0} \leq 1\), y eso para todos\(N \in \mathbb{N}\),\[a_{N+1} \leq \sum_{n=0}^{N} a_{n} .\] Probar\[(\forall N \in \mathbb{N}) a_{n} \leq 2^{N}\] EJERCICIO 4.29. Dejar\(\left\langle a_{n}: n \in \mathbb{N}\right\rangle\) ser una secuencia de números positivos satisfactorios (4.21), y\(a_{0} \leq C\). ¿Cuál es el análogo correcto de (4.22)? Demuestra tu aseveración.

    EJERCICIO 4.30. Let\(\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\}\) Ser una familia indexada de conjuntos disgregados por pares. Supongamos que cada uno\(X_{\alpha}\) está bien ordenado por\(\preceq_{\alpha}\) y que\(A\) está bien ordenado por\(\preceq\). Definir una relación\(R\) sobre la unión de todos los conjuntos en\(\mathcal{F}\) por: para todos\(a, b \in \bigcup_{\alpha \in A} X_{\alpha}, a R b\) iff (a)\(a \in X_{\alpha_{1}}, b \in X_{\alpha_{2}}\) y\(\alpha_{1} \preceq \alpha_{2}\),

    o

    b)\((\exists \alpha \in A) a, b \in X_{\alpha}\) y\(a \preceq_{\alpha} b\).

    Demostrar que\(R\) es un orden bien de\(\bigcup_{\alpha \in A} X_{\alpha}\).

    EJERCICIO 4.31. Dejar\(X\) ser un conjunto finito y\(f: X \rightarrow X\). Demostrar que\(f\) es una inyección iff\(f\) es una sobreyección.
    (1)

    \(5-2 \sqrt{-2}\)

    \(\sqrt{5}-\sqrt{-2}\)

    \(4=\sqrt{2}+\frac{}{}\)

    \(4+\frac{2}{4}\)

    \(\sqrt{4-2}+\frac{12}{}\)

    4

    \(\operatorname{sins}^{-2}+\frac{2}{}\)

    imagen

    1

    (\(2.7\)

    \(\sqrt{2-25}+\)

    (2)

    (\(2.7\)

    (2

    \(4=\sqrt{2}+\)

    \(\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}\)

    (\(2.7\)

    4

    (2020

    (2

    • 2

    2

    (

    r.

    a\(2+2\)

    \(\sqrt{2-2 \cdot 2 \cdot\)

    (

    (

    \((\sqrt{2}+2\)

    (

    4

    (200

    (\(2-2\)

    (

    \(\mathrm{~ r e s ~ a ~}\)

    (\(2-2=\)

    (2)

    4

    \((2+2)\)

    4

    4

    imagen

    imagen

    (1)

    • CAPÍTULO 5

    Límites

    La idea de un límite es la piedra angular del cálculo. Es algo sutil, razón por la cual, aunque estaba implícita en la obra de Arquímedes\(^{1}\), y esencial para una adecuada comprensión de las paradojas de Zenón, tardó dos mil años en comprenderse plenamente. El cálculo fue desarrollado en el\(17^{\text {th }}\) siglo por Newton y Leibniz con un enfoque algo arrogante de los límites; no fue sino hasta el\(19^{\text {th }}\) siglo que se le dio una definición rigurosa de límite, por Cauchy.

    En Sección\(5.1\) definimos límites, y probamos algunas propiedades elementales. En la Sección\(5.2\) discutimos las funciones continuas, y en la Sección\(5.3\) analizamos los límites de las secuencias de funciones.

    Límites

    Dada una función real\(f: X \rightarrow \mathbb{R}\), la idea intuitiva del enunciado\[\lim _{x \rightarrow a} f(x)=L\] es que, a medida que\(x\) se acerca cada vez más\(a\), los valores de\(f(x)\) acercarse cada vez más\(L\). Hacer esta noción precisa no es fácil: intenta escribir una definición matemática ahora, antes de seguir leyendo.

    La idea detrás de la definición es dar una secuencia de garantías. Imagínate como abogado, tratando de defender el reclamo (5.1). Por concreción, arreglemos\(g(x)=\frac{\sin (x)}{x}\), e intentemos defender la afirmación de que\[\lim _{x \rightarrow 0} g(x)=1\]\({ }^{1}\) Arquímedes (287-212 a.C.) calculó el área bajo una parábola (lo que ahora llamaríamos\(\int_{0}^{1} x^{2} d x\)) calculando el área de los rectángulos de ancho \(1 / N\)bajo la parábola y dejando\(N\) tender al infinito. Esto es idéntico al enfoque moderno de encontrar una integral tomando un límite de sumas de Riemann.

    imagen

    FIGURA 5.3. Parcela de\(\sin (x) / x\)

    El juez escéptico pregunta “¿Se puede garantizar que\(g(x)\) está dentro de .1 de 1?”

    “Sí, señoría, siempre que eso\(|x|<.7\).

    “Mmm, bueno, ¿puedes garantizar que\(g(x)\) está dentro\(.01\) de 1?”

    “Sí, señoría, siempre que\(|x|<.2 . "\)

    Y así va. Si, por cada tolerancia posible que plantea el juez, puede encontrar una precisión (es decir, una desviación permisible\(x\) de\(a\)) que garantice que la diferencia entre el valor de la función y el límite está dentro de la tolerancia permisible, entonces puede defender con éxito el Reclamación.

    EJERCICIO. Ahora trata de dar una definición matemática de un límite, sin leer más.

    Comenzaremos con el caso de que la función se defina en un intervalo abierto.

    DEFINICIÓN. Limit,\(\lim _{x \rightarrow a} f(x)\) Let\(I\) be an open interval and\(a\) some point in\(I\). Dejar\(f\) ser una función de valor real definida en\(I \backslash\{a\}\). (No importa si\(f\) se define en\(a\) o no). Entonces decimos\[\lim _{x \rightarrow a} f(x)=L\] (en palabras, “el límite como\(x\) tiende a\(a\) de\(f(x)\) es\(L\) “) si, por cada\(\varepsilon>0\), existe\(\delta>0\), de manera que\[0<|x-a|<\delta \quad \Longrightarrow \quad|f(x)-L|<\varepsilon\]imagen

    FIGURA 5.5. Una opción\(\delta\) para un determinado\(\varepsilon\)

    La condición\(0<|x-a|<\delta\) significa que excluimos\(x=a\) de la consideración. Los límites son sobre el comportamiento de una función cerca del punto, no en el punto. Para una función como\(g(x)=\sin (x) / x\), el valor en 0 es indefinido; sin embargo\(\lim _{x \rightarrow 0} g(x)\) existe, y es el mismo que\(\lim _{x \rightarrow 0}\) de la función\ [h (x) =\ left\ {\ begin {array} {cc} \ sin (x)/x & x\ neq 0\\ 5 & x=0. \ end {array}\ right.\] COMENTARIOS. El uso de\(\varepsilon\) para el error permisible y\(\delta\) para la precisión correspondiente requerida se santifica por el uso prolongado. Los matemáticos necesitan todos los símbolos convenientes que puedan encontrar. El alfabeto griego se ha utilizado durante mucho tiempo como un suplemento del alfabeto romano en las matemáticas occidentales, y hay que estar familiarizado con él (ver Apéndice A para el alfabeto griego). El punto principal a tener en cuenta en la definición es el orden de los cuantificadores:\(\forall \varepsilon, \exists \delta\). Qué significaría decir\[(\exists \delta>0)(\forall \varepsilon>0) \quad[0<|x-a|<\delta \quad \Longrightarrow \quad|f(x)-L|<\varepsilon] ?\] Hablar cómodamente de límites, ayuda tener algunas palabras que describan las desigualdades (5.4). Digamos que el\(\varepsilon\) -vecindario de\(L\) es el conjunto de puntos dentro\(\varepsilon\) de\(L\), es decir, el intervalo\((L-\varepsilon, L+\varepsilon)\). El\(\delta\) barrio perforado de\(a\) es el conjunto de puntos dentro\(\delta\) de\(a\), excluyéndose a\(a\) sí mismo, es decir\((a-\delta, a) \cup(a, a+\delta)\). Cuando hablamos de\(\varepsilon\) -barrios y barrios perforados\(\delta\) -, siempre asumimos eso\(\varepsilon\) y\(\delta\) somos positivos, para que los barrios no estén vacíos.

    Entonces la definición de límite se puede redactar como “cada\(\varepsilon\) -barrio de\(L\) tiene una imagen inversa debajo\(f\) que contiene algún\(\delta\) barrio perforado de\(a\)”.

    OBSERVACIÓN. Podemos volver a visitar nuestra analogía de sala de justicia, y decir que para demostrar que\(f\) tiene límite\(L\) en\(a\), necesitamos una estrategia que produzca un viable\(\delta\) para cualquier\(\varepsilon\). Entonces una prueba es esencialmente una función\(F\) que toma cualquier positivo\(\varepsilon\) y escupe un positivo\(\delta=F(\varepsilon)\) para el cual (5.4) funciona.

    EJEMPLO 5.6. Vamos\(f(x)=5 x+2\). Demostrar\(\lim _{x \rightarrow 3} f(x)=17\).

    Vamos\(\varepsilon>0\). Queremos encontrar un para\(\delta>0\) que el\(\delta\) barrio perforado de 3 se mapee en el\(\varepsilon\) -barrio de 17.

    imagen

    FIGURA 5.7. Relación entre\(\delta\) y\(\varepsilon\) Tomando\(\delta=\varepsilon / 5\) funcionará, al igual que cualquier elección más pequeña de\(\delta\). En efecto, si\(0<|x-3|<\delta\), entonces\(|f(x)-17|<5 \delta=\varepsilon\).

    EJEMPLO 5.8. Esta vez, vamos\(g(x)=55 x+2\). Para probar\(\lim _{x \rightarrow 3} g(x)=\) 167, debemos tomar\(\delta \leq \varepsilon / 55\).

    Si dos funciones\(f\) y\(g\) ambas tienen límites en el punto\(a\), entonces también lo hacen todas las combinaciones algebraicas\(f+g, f-g, f \cdot g\) y\(c f\) para\(c\) una constante. El cociente\(f / g\) también tiene un límite en\(a\), siempre y cuando\(\lim _{x \rightarrow a} g(x) \neq 0\). Además, estos límites son lo que cabría esperar.

    TEOREMA 5.9. Supongamos\(f\) y\(g\) son funciones en un intervalo abierto\(I\), y en el punto\(a\) en\(I\) ambos\(\lim _{x \rightarrow a} f(x)\) y\(\lim _{x \rightarrow a} g(x)\) existir. \(c\)Sea cualquier número real. Entonces\ [\ comenzar {alineado} \ texto {(i)}\ lim _ {x\ fila derecha a} [f (x) +g (x)] &=\ lim _ {x\ fila derecha a} f (x) +\ lim _ {x\ fila derecha a} g (x)\ \ texto {(ii)}\ lim _ {x\ fila derecha a} [f (x) -g (x)] &=\ lim _ {x\ fila derecha a} f (x) -\ lim _ {x\ fila derecha a} g (x)\\ \ texto {(iii)}\ quad\ lim _ {x\ derecha a} c f (x) &=c\ izquierda [\ lim _ {x\ fila derecha a} f (x)\ derecha]\\ (i v)\ quad\ lim _ {x\ fila derecha a} [f (x) g (x)] &=\ izquierda [\ lim _ {x\ fila derecha a} f (x)\ derecha]\ cdot\ izquierda [\ lim _ {x\ fila derecha]\ cdot\ izquierda [\ lim _ _ {x\ fila derecha a} g (x) \ derecha]\\\ texto {(v)}\ quad\ lim _ {x\ fila derecha a}\ frac {f (x)} {g (x)} &=\ frac {\ lim _ {x\ fila derecha a} f (x)} {\ lim _ {x\ fila derecha a} g (x)},\ quad\ texto {proporcionado}\ lim _ {x\ fila derecha a} g (x)\ neq 0. \ end {alineado}\] Discusión. ¿Cómo vamos a probar un teorema así? Bueno, para empezar, no se deje intimidar por su longitud. Empecemos por la parte (i). Solo tenemos la definición de límite para trabajar, por lo que solo tenemos una opción estratégica: demostrar directamente que la definición está satisfecha.

    COMPROBACIÓN DE (i). Dejar\(L_{1}\) y\(L_{2}\) ser los límites de\(f\) y\(g\) respectivamente en\(a\). Dejar\(\varepsilon\) ser un número positivo arbitrario. Debemos encontrar un\(\delta>0\) modo que\[0<|x-a|<\delta \quad \Longrightarrow \quad\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right|<\varepsilon .\] La idea clave, común a muchos argumentos de límite, es utilizar la observación de que Se\[\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| \leq\left|f(x)-L_{1}\right|+\left|g(x)-L_{2}\right| .\] trata de una aplicación de la llamada desigualdad triangular, que se le pide después que demuestre (Lema 5.14). Es la aseveración que para cualquier número real\(c\) y\(d\), tenemos\[|c+d| \leq|c|+|d| .\] (¿Qué valores de\(c\) y\(d\) rendimiento (5.10)?) Entonces, si podemos hacer ambos\(\left|f(x)-L_{1}\right|\) y\(\left|g(x)-L_{2}\right|\) pequeños, entonces Desigualdad (5.10) obliga\[\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right|\] a ser pequeños también, que es lo que queremos.

    Desde\(f\) y\(g\) tenemos límites\(L_{1}\) y\(L_{2}\) at\(a\), sabemos que existen números positivos\(\delta_{1}\) y\(\delta_{2}\) tales que\ [\ begin {array} {lll} 0<|x-a|<\ delta_ {1} &\ Longrightarrow &\ izquierda|f (x) -L_ {1}\ derecha|<\ varepsilon\\ 0<|x-a|<\ delta_ {2} &\ Longrightarrow &\ izquierda|g (x) -L_ {2}\ derecha|<\ varepsilon \ end {array}\] Si\(|x-a|\) es menor que ambos\(\delta_{1}\) y\(\delta_{2}\), luego ambos las desigualdades están satisfechas, y obtenemos\[\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| \leq\left|f(x)-L_{1}\right|+\left|g(x)-L_{2}\right| \leq \varepsilon+\varepsilon .\] Esto no es lo suficientemente bueno; queremos que el lado izquierdo de (5.11) esté limitado por\(\varepsilon\), no\(2 \varepsilon\). Estamos salvados, sin embargo, por el requisito de que para cualquier número positivo\(\eta\), podamos garantizar eso\(f\) y\(g\) estamos en un\(\eta\) -barrio de\(L_{1}\) y\(L_{2}\), respectivamente. En particular,\(\eta\) dejémoslo\(\varepsilon / 2\). Desde\(f\) y\(g\) tienen límites en\(a\), hay números positivos\(\delta_{3}\) y\(\delta_{4}\) así que\ [\ begin {array} {lll} 0<|x-a|<\ delta_ {3} &\ Longrightarrow &\ izquierda|f (x) -L_ {1}\ derecha|<\ frac {\ varepsilon} {2}\\ 0<|x-a|<\ delta_ {4} &\ Longrightarrow &\ izquierda|g (x) -L_ {2}\ derecha|<\ frac {\ varepsilon} {2}. \ end {array}\] Así que establecemos\(\delta\) igual al menor de\(\delta_{3}\) y\(\delta_{4}\), y obtenemos\ [\ begin {aligned} &0<|x-a|<\ delta\ Longrightarrow\\ &\ quad\ izquierda|f (x) +g (x) -\ left (L_ {1} +L_ {2}\ derecha)\ derecha|\ leq\ izquierda|f (x) -L_ {1}\ derecha|+\ izquierda|g (x) -L_ {2}\ derecha|<\ varepsilon, \ end {alineado}\] según sea necesario. EJERCICIO. Explique con palabras cómo funcionaba la prueba anterior. En mano corta, se podría decir que si\(F_{1}\) y\(F_{2}\) son estrategias para probar\(\lim _{x \rightarrow a} f(x)=L_{1}\) y\(\lim _{x \rightarrow a} g(x)=L_{2}\) respectivamente, entonces\[F=\min \left\{F_{1}\left(\frac{\varepsilon}{2}\right), F_{2}\left(\frac{\varepsilon}{2}\right)\right\}\] es una estrategia para probar\(\lim _{x \rightarrow a} f(x)+g(x)=L_{1}+L_{2}\).

    Discusión. ¿Qué sigue? Podríamos probar (ii) de manera similar, pero a los matemáticos les gustan los atajos. Observe que si probamos (iii) y dejamos\(c=-1\), entonces podemos aplicar (i)\(f+(-g)\) y obtener (ii) de esa manera. Además, (iii) es solo un caso especial de (iv), si sabemos que la función constante\(g(x)=c\) tiene el límite\(c\) en cada punto. Entonces probemos (iv) siguiente.

    Prueba de (iv). Nuevamente, dejemos\(\varepsilon\) ser un número positivo arbitrario. Debemos encontrar una\(\delta>0\) para que no\[0<|x-a|<\delta \quad \Longrightarrow \quad\left|f(x) g(x)-\left(L_{1} L_{2}\right)\right|<\varepsilon .\] quede muy claro qué tan cerca\(f\) y\(g\) tiene que estar de\(L_{1}\) y\(L_{2}\) para conseguir que su producto esté lo suficientemente cerca de\(L_{1} L_{2}\), así que vamos a jugarlo seguro al no elegir todavía. Por cada\(\varepsilon_{1}, \varepsilon_{2}>0\), sabemos que existe\(\delta_{1}, \delta_{2}>0\) tal que\ [\ begin {array} {lll} 0<|x-a|<\ delta_ {1} &\ Longrightarrow &\ izquierda|f (x) -L_ {1}\ derecha|<\ varepsilon_ {1}\\ 0<|x-a|<\ delta_ {2} &\ Longrighttarrow &\ izquierda |g (x) -L_ {2}\ derecha|<\ varepsilon_ {2} \ end {array}\] Ahora usamos el segundo truco común para probar la existencia de límites: sumar y restar la misma cantidad para que uno pueda factorizar. \ [\ comenzar {alineado} \ izquierda|f (x) g (x) -L_ {1} L_ {2}\ derecha| &=\ izquierda|f (x) g (x) -L_ {1} g (x) +L_ {1} g (x) -L_ {1} L_ {2}\ derecha|\\ &\ izquierda\ izquierda | f (x) g (x) -L_ {1} g (x)\ derecha|+\ izquierda|L_ {1} g (x) -L_ {1} L_ {2}\ derecha|\\ &\ izquierda\ izquierda|f (x) -L_ {1}\ derecha||g (x) |+\ izquierda|g (x) -L_ {2}\ derecha|\ izquierda|l_ {1}\ derecha|\ cdot\ quad (5.1 \ end {alineado}\] Ahora bien, si ambos summands en la última línea se pueden hacer menos que\(\varepsilon / 2\), ganamos. El segundo término es fácil: elegimos\[\varepsilon_{2}=\frac{\varepsilon}{2\left|L_{1}\right|+1} .\] Luego hay un\(\delta_{2}\) modo que\ [\ begin {alineado} 0<|x-a|<\ delta_ {2} &\ Longrightarrow\ quad\ izquierda|g (x) -L_ {2}\ derecha| &<\ varepsilon_ {2}\ &\ Longrightarrow\ quad\ izquierda|g (x) -L_ {2}\ derecha|\ izquierda|L_ {1}\ derecha| &<\ frac {\ varepsilon\ izquierda|l_ {1}\ right|} {2\ izquierda|l_ {1}\ right|+1} <\ frac {\ varepsilon} {2} \ end {alineado}\] (Si\(L_{1} \neq 0\), podríamos haber elegido\(\varepsilon_{2}=\frac{\varepsilon}{2\left|L_{1}\right|}\); agregamos 1 al denominador solo para no tener que considerar los dos casos por separado.)

    ¿Y el primer summand en (5.12), el término\(\left|f(x)-L_{1}\right||g(x)|\)? Primero vamos a ponernos un poco atados sobre lo grande que\(|g|\) puede ser. Sabemos que si\(0<|x-a|<\delta_{2}\), entonces\(\left|g(x)-L_{2}\right|<\varepsilon /\left(2\left|L_{1}\right|+1\right)\), entonces\[|g(x)|<\left|L_{2}\right|+\frac{\varepsilon}{2\left|L_{1}\right|+1}=: M .\] Si lo dejamos\(\varepsilon_{1}=\varepsilon /(2 M)\), sabemos que existe\(\delta_{1}>0\) para que\[0<|x-a|<\delta_{1} \quad \Longrightarrow \quad\left|f(x)-L_{1}\right||g(x)|<\varepsilon_{1}|g(x)| .\] Finalmente, dejamos\(\delta=\min \left(\delta_{1}, \delta_{2}\right)\). Pues\(0<|x-a|<\delta\), ambas summands en (5.12) son menores que\(\varepsilon / 2\): la segunda suma porque\(\delta \leq \delta_{2}\), y la primera porque cuando\(0<|x-a|<\delta\), la Desigualdad\(5.13\) se fortalece a\[\left|f(x)-L_{1}\right||g(x)|<\varepsilon_{1}|g(x)|<\varepsilon_{1} M=\varepsilon / 2 .\] Por lo tanto, para \(0<|x-a|<\delta\), tenemos\(\left|f(x) g(x)-L_{1} L_{2}\right|<\varepsilon\), como se desee.

    PRUEBA DE (iii). Este es un caso especial de (iv), una vez que sabemos que las funciones constantes tienen límites. Digamos esto como un lema. Dado Lema 5.15, se prueba el inciso iii), y por lo tanto también lo es (ii).

    COMPROBACIÓN DE (v). Ejercicio.

    LEMA 5.14. Desigualdad triangular Let\(c, d\) be números reales. Entonces\(|c+d| \leq|c|+|d| .\)

    PRUEBA. Ejercicio.

    LEMA 5.15. Dejar\(g(x) \equiv c\) ser la función constante c. Entonces,\[(\forall a \in \mathbb{R}) \lim _{x \rightarrow a} g(x)=c .\] PRUEBA. Ejercicio.

    EJEMPLO 5.16. La función Heaviside\(H(t)\) está definida por\[H(t)= \begin{cases}0 & t<0 \\ 1 & t \geq 0\end{cases}\] Show que\(H\) no tiene límite en 0.

    Discusión. Para probar que no existe un límite, debemos probar lo contrario de\(\forall \varepsilon \exists \delta\), es decir, eso\(\exists \varepsilon \nexists \delta\). Como la brecha entre la función on\([0, \infty)\) y\((-\infty, 0)\) es 1, está claro que cualquier banda de ancho\(<1\) no puede ser lo suficientemente ancha como para contener valores de\(H(t)\) for\(t\) en ambos lados de 0. Entonces elegiremos algunos\(\varepsilon<.5\), y discutiremos por contradicción.

    Supongamos que el límite existe y es igual\(L\). Vamos\(\varepsilon=\frac{1}{4}\). Por hipótesis, existe\(\delta>0\) tal que\[0<|t|<\delta \Longrightarrow|H(t)-L|<\frac{1}{4} .\] Pero para\(t\) negativo, esto significa\(|L|<\frac{1}{4}\); y para\(t\) positivo, esto significa\(|L-1|<\frac{1}{4}\). Así obtenemos una contradicción.

    Si la función se define en el intervalo cerrado\([c, d]\), es posible que aún queramos preguntar si tiene un valor limitante en\(c\); si es así, sin embargo, solo queremos considerar puntos cercanos\(c\) que estén en el dominio de la definición. De manera más general, nos llevan a la siguiente definición de límite restringido.

    DEFINICIÓN. Límite restringido,\(\lim _{X \ni x \rightarrow a} f(x)\) Supongamos que\(f\) es una función real y\(X \subseteq \operatorname{Dom}(f)\). Vamos\(a \in \mathbb{R}\). Decimos que\(\lim _{X \ni x \rightarrow a} f(x)=L\) si\((\forall \varepsilon>0)(\exists \delta>0)(\forall x \in X) \quad[0<|x-a|<\delta] \Longrightarrow|f(x)-L|<\varepsilon .\)

    Leemos "\(\lim _{X \ni x \rightarrow a} f(x)=L\)" como “el límite como\(x\) tiende al\(a\) interior\(X\) de\(f(x)\) es\(L . "\) Un caso especial importante de límites restringidos son los siguientes:

    DEFINICIÓN. Límite derecho,\(\lim _{x \rightarrow a^{+}} f(x)\) Let\(a, b, L \in \mathbb{R}, a<b\) y\(f\) ser una función real definida en\((a, b)\). Decimos que\[\lim _{x \rightarrow a^{+}} f(x)=L\] si\[(\forall \varepsilon>0)(\exists \delta>0)[x \in(a, a+\delta)] \Rightarrow[|f(x)-L|<\varepsilon]\] El número\(L\) es el límite de la derecha de\(f(x)\) at\(a\). El límite de la izquierda se define de manera similar. Si\(a, c, L \in \mathbb{R}, c<a\) y\(f\) es una función real definida en\((c, a)\), decimos que\(\lim _{x \rightarrow a^{-}} f(x)=L\) si los límites de la\[(\forall \varepsilon>0)(\exists \delta>0)[x \in(a-\delta, a)] \Rightarrow[|f(x)-L|<\varepsilon]\] mano derecha y los límites de la izquierda se denominan límites unilaterales. Los límites unilaterales son ejemplos de límites restringidos.

    EJEMPLO 5.17. \(H(t)\)Sea la función Heaviside. Entonces\ [\ comenzar {alineado} &\ lim _ {t\ fila derecha 0^ {+}} H (t) =1\\ &\ lim _ {t\ fila derecha 0^ {-}} H (t) =0 \ final {alineado}\]

    Continuidad

    La mayoría de las funciones que has encontrado tienen la propiedad de que en (casi) cada punto la función tiene un límite que concuerda con su valor allí. Esta es una característica muy útil de una función, y se llama continuidad.

    DEFINICIÓN. Continuo Let\(f\) ser una función real con dominio\(X \subseteq \mathbb{R} .\) Let\(a \in X\). Entonces decimos que\(f\) es continuo en\(a\) si\(\lim _{X \ni x \rightarrow a} f(x)=\)\(f(a)\). Decimos que\(f\) es continuo\(X\) si es continuo en cada punto de\(X\)

    Intuitivamente, la idea de una función continua en un intervalo es que no tiene saltos. Esto lo haremos preciso en el Capítulo 8 cuando probemos el Teorema del Valor Intermedio 8.10, que afirma que si una función continua en un intervalo toma dos valores distintos\(c\) y\(d\), también debe asumir cada valor entre\(c\) y \(d\).

    EJEMPLO 5.18. Demostrar que la función\(f(x)=x^{2}\) es continua en\(\mathbb{R}\). Discusión. ¿Cómo haríamos esto desde los primeros principios? Tenemos que demostrar que para cada\(a \in \mathbb{R}\), para cada\(\varepsilon>0\), siempre podemos encontrar un\(\delta>0\) tal que para cualquiera\(x \in \mathbb{R}\)\[|x-a|<\delta \quad \Longrightarrow \quad\left|x^{2}-a^{2}\right|<\varepsilon .\] (¿Por qué no necesitamos agregar la hipótesis\(0<|x-a|\)?) La forma más fácil de hacerlo es anotar una fórmula que, dada\(a\) y\(\varepsilon\), produce una\(\delta\) satisfactoria (5.19).

    Como\(x^{2}-a^{2}=(x-a)(x+a)\), si\(|x-a|\) es menor que algún número\(\delta\) (aún sin especificar), entonces\(\left|x^{2}-a^{2}\right|\) es menor que\(\delta|x+a|\). Entonces queremos No\[\delta|x+a| \leq \varepsilon\] podemos elegir\(\delta=\varepsilon /|x+a|\), porque\(\delta\) no podemos depender de\(x\). Pero si\(|x-a|<\delta\), entonces\ [\ begin {aligned} |x+a| &\ leq|x|+|a|\\ &<|a|+\ delta+|a|a|=2|a|+\ delta, \ end {alineado}\] SO\[\left|x^{2}-a^{2}\right|<\delta(2|a|+\delta) \stackrel{?}{\leq} \varepsilon .\] Debemos elegir\(\delta\) para que la última desigualdad se mantenga. Por la fórmula cuadrática,\[\delta(2|a|+\delta) \leq \varepsilon \quad \Longleftrightarrow \delta \leq \sqrt{|a|^{2}+\varepsilon}-|a| .\] Así que elige\(\delta=\sqrt{|a|^{2}+\varepsilon}-|a|\) y (5.19) sostiene.

    OBSERVACIÓN. Una prueba formalmente correcta podría haberse reducido a:

    PRUEBA. Dejar\(a \in \mathbb{R}\) y\(\varepsilon>0\). Entonces dejando\(\delta=\sqrt{|a|^{2}+\varepsilon}-|a|\) que tengamos\(|x-a|<\delta \Longrightarrow\left|x^{2}-a^{2}\right|<\varepsilon\). Q.E.D.

    Sin embargo, si bien un lector diligente podría verificar que esta prueba es correcta,\(\delta\) sacarse de un sombrero como este no le da al lector la idea de que nuestra prueba mucho más larga sí. Recuerde, una prueba tiene más de una función: no sólo debe convencer al lector de que el resultado reclamado es cierto, sino que también debe ayudar al lector a entender por qué el resultado es cierto. Una buena prueba debe ser descriptible en unas pocas frases en inglés, para que un oyente experto pueda entonces ir a escribir una prueba más detallada con bastante facilidad.

    OBSERVACIÓN. No es necesario elegir el mayor valor de para\(\delta\) que la desigualdad\(\stackrel{?}{\leq}\) en (5.21) se mantenga - cualquier positivo\(\delta\) que satisfaga la desigualdad funcionará. Esto permite simplificar el álgebra. Por ejemplo,\(\delta_{1}\) seamos tales que\[|x-a|<\delta_{1} \Rightarrow|x+a|<2|a|+1 .\] (Tal\(\delta_{1}\) existe a partir de la continuidad de la función más simple\(x \mapsto x\)). Entonces vamos\[\delta=\min \left(\delta_{1}, \frac{\varepsilon}{2|a|+1}\right)\] y (5.20) sostiene.

    Se podría imaginar repetir pruebas como las anteriores para demostrar eso\(x^{3}\)\(x^{4}\),, y así sucesivamente son continuas, pero queremos dar grandes pasos. ¿Podemos mostrar que todos los polinomios son continuos?

    Primero observe que debido a que los límites se comportan bien con respecto a las operaciones algebraicas (Teorema 5.9), y la continuidad se define en términos de límites, entonces las combinaciones algebraicas de funciones continuas son continuas.

    Proposición 5.22. Supongamos\(f: X \rightarrow \mathbb{R}\) y\(g: X \rightarrow \mathbb{R}\) son funciones reales que son continuas en\(a \in X\). Dejar\(c\) y\(d\) ser escalares\({ }^{2}\). Entonces\(c f+d g\) y ambos\(f g\) son continuos a una, y así es\(f / g\) si\(g(a) \neq 0\).

    PRUEBA. Ejercicio.

    Las funciones constantes son continuas (Lema 5.15), y la función\(f(x)=x\) es continua (Ejercicio 5.16). Así se puede demostrar por inducción sobre el grado de polinomio, utilizando la Proposición 5.22, que todos los polinomios son continuos (Ejercicio 5.27). Una vez que hayas demostrado que todos los polinomios son continuos, puedes probar que las funciones racionales son continuas donde el denominador no se desvanece.

    Este resultado se utiliza con tanta frecuencia que lo declararemos formalmente.

    \({ }^{2}\)Un escalar es solo una palabra elegante para un número. PROPOSICIÓN 5.23. Cada polinomio es continuo en\(\mathbb{R}\). Toda función racional es continua donde el denominador es distinto de cero.

    Qué pasa con la función exponencial\[e^{x}:=\sum_{n=0}^{\infty} \frac{x^{n}}{n !} ?\] Cada suma parcial es un polinomio, y por lo tanto continuo; así que si supiéramos que el límite de una secuencia de funciones continuas era continuo, estaríamos hechos. Esto resulta, sin embargo, ser un problema sutil, que abordamos en la siguiente Sección.

    Secuencias de funciones

    Una secuencia infinita de números\(\left\langle a_{n}\right\rangle\) tiende a un límite\(L\) si\(a_{n}\) se acerca\(L\) como\(n\) tiende al infinito. Trate de escribir una definición formal de esto antes de seguir leyendo.

    Discusión. Pista. Ya hemos visto cómo codificar el enunciado “enfoques\(L\)”. La dificultad es codificar “como\(n\) tiende al infinito”. ¿Cómo podrías hacer esto?

    DEFINICIÓN. \(\lim _{n \rightarrow \infty} a_{n}\), convergen, divergen La secuencia\(\left\langle a_{n}\right\rangle\) tiende al límite\(L\) como\(n\) tiende al infinito, escrito\[\lim _{n \rightarrow \infty} a_{n}=L,\] si por cada\(\varepsilon>0\) existe\(N \in \mathbb{N}\) tal que \[(\forall n \in \mathbb{N}) n>N \quad \Longrightarrow \quad\left|a_{n}-L\right|<\varepsilon .\]Decimos que la secuencia\(\left\langle a_{n}\right\rangle\) converge a\(L\). Si una secuencia no converge, decimos que diverge.

    EJEMPLO 5.24. Demostrar que la secuencia\[\left\langle\sin ^{2}(n) / n \mid n \in \mathbb{N}\right\rangle\] converge. Discusión. Generalmente es más fácil probar que una secuencia converge si tenemos una idea de su límite. Para probar la convergencia de secuencias sin candidato para el límite generalmente implica usar la propiedad de límite inferior superior de\(\mathbb{R}\) (que está cubierta en el Capítulo 8). Ciertamente parece que los términos en la secuencia se están acercando a 0, así que tratamos de mostrar esto rigurosamente.

    Observamos que\[(\forall n \in \mathbb{N})\left|\sin ^{2}(n)\right| \leq 1\] De ahí\[(\forall n \in \mathbb{N})\left|\sin ^{2}(n) / n\right| \leq|1 / n| .\] Dejar\(\varepsilon>0\) y\(N \in \mathbb{N}\) ser tal que\(1 / N \leq \varepsilon\). Entonces para cualquier\(n \geq N\),\[\left|\sin ^{2}(n) / n-0\right| \leq 1 / n \leq \varepsilon\] Por lo tanto\[\lim _{n \rightarrow \infty} \frac{\sin ^{2}(n)}{n}=0 .\] EJEMPLO 5.25. Para cualquiera\(n \in \mathbb{N}\), vamos\(a_{n}=(-1)^{n}\). Demostrar que la secuencia\(\left\langle a_{n}\right\rangle\) diverge.

    Discusión. Dado que la secuencia alterna entre\(-1\) y 1, es intuitivamente claro que la secuencia no tiende a ningún número en particular. Deseamos demostrar que una declaración en la forma\[(\exists L \in \mathbb{R})(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall n>N)(\ldots)\] es falsa. Por lo que debemos demostrar que la negación de la afirmación es cierta. Eso es\[(\forall L \in \mathbb{R})(\exists \varepsilon>0)(\forall N \in \mathbb{N})(\exists n>N) \neg(\ldots) .\] Para cualquiera\(L \in \mathbb{R}\), si\(\varepsilon<1\) escogemos no podremos capturar tanto como\(-1\) 1 en los\(\varepsilon\) -barrios de L. Esto demostrará que la secuencia diverge.

    Dejar\(L \in \mathbb{R}\) y\(\varepsilon<1\). Demostramos que para cualquiera\(N \in \mathbb{N}\), hay\(n>N\) tal que\[\left|(-1)^{n}-L\right| \geq \varepsilon\] Vamos\(N \in \mathbb{N}^{+}\). Argumentamos por casos.

    Supongamos\(L<0\). Entonces,\[\left|(-1)^{2 N}-L\right| \geq 1>\varepsilon\] supongamos\(L \geq 0\). Entonces\[\left|(-1)^{(2 N+1)}-L\right| \geq 1>\varepsilon .\] Por lo tanto la secuencia\(\left\langle a_{n}\right\rangle\) diverge.

    EJEMPLO 5.26. Para todos\(n \in \mathbb{N}\), vamos\(a_{n}=\sum_{k=0}^{n}\left(\frac{k}{n}\right)^{2} \frac{1}{n}\). ¿Cuál es el límite de la secuencia\(\left\langle a_{n}\right\rangle\)?

    Discusión. Los términos de la secuencia pueden resultarle familiares ya que Riemann suma asociada con el área bajo la parábola\(f(x)=x^{2}\) entre\(x=0\) y\(x=1\). Utilizaremos un resultado combinatorio que probamos por inducción en el último capítulo.

    Por Proposición 4.6,\ [\ comenzar {alineado} \ lim _ {n\ fila derecha\ infty}\ suma_ {k=0} ^ {n}\ izquierda (\ frac {k} {n}\ derecha) ^ {2}\ frac {1} {n} &=\ lim _ {n\ fila derecha\ infty}\ izquierda (\ frac {1} {n^ {}}\ derecha)\ suma_ {k=0} ^ {n} k^ {2}\\ &=\ lim _ {n\ fila derecha\ infty}\ izquierda (\ frac {1} {n^ {3}}\ derecha)\ frac {(n) (n+1) (2 n+1)} {6 }\\ &=1/3. \ end {aligned}\] La verificación de la última igualdad se deja al lector como ejercicio.

    En la siguiente sección nos interesan particularmente las sumas infinitas.

    Definición. Suma infinita, suma parcial,\(\sum_{k=0}^{\infty} a_{k}\) Let\(\left\langle a_{k} \mid k \in \mathbb{N}\right\rangle\) Ser una secuencia de números. La suma\(n^{\text {th }}\) parcial de la secuencia es\[s_{n}=\sum_{k=0}^{n} a_{k} .\] La suma infinita de la secuencia es\[\sum_{k=0}^{\infty} a_{k}:=\lim _{n \rightarrow \infty} s_{n} .\] La suma infinita es el límite de la secuencia de sumas parciales,\(\left\langle s_{n}\right\rangle\). EJEMPLO 5.27. Demostrar que\[\sum_{k=0}^{\infty} \frac{1}{2^{k}}=2 .\] Let\(s_{n}\) sea la suma\(n^{\text {th }}\) parcial. Tenemos que demostrar que\[\lim _{n \rightarrow \infty} s_{n}=2 .\] Let\(\varepsilon>0\) y\(N \in \mathbb{N}\) ser tal que\(\frac{1}{2^{N}}<\varepsilon\). Mostramos que si\(n \geq N\), entonces\[\left|s_{n}-2\right|<\varepsilon\] Dado que la serie\(\sum_{k=0}^{\infty} \frac{1}{2^{k}}\) es geométrica, sabemos que\[s_{n}=\frac{1-2^{-(n+1)}}{1-1 / 2}=2-2^{-n} .\] Así que si\(n \geq N\), entonces\[\left|s_{n}-2\right|=2^{-n}<\varepsilon .\] En análisis, a menudo se trata de una secuencia de funciones \(f_{n}\). Por ejemplo,\(f_{n}\) podría ser el polinomio Taylor de\(n^{\text {th }}\) orden -order de alguna función\(f\), y uno quiere saber si esta secuencia\(f_{n}\) converge a\(f\); o la secuencia\(f_{n}\) puede representar funciones cuyas gráficas tienen una curva de límite fija en\(\mathbb{R}^{3}\) y tienen áreas decrecientes, y se quiere saber si la secuencia converge a la gráfica de una función con área mínima para ese límite. Este tipo de problema es tan importante que los matemáticos estudian diferentes formas en las que una secuencia de funciones podría converger. La forma más obvia es puntual:

    DEFINICIÓN. Convergencia puntual Una secuencia de funciones\(f_{n}\) en un conjunto\(X\) converge puntualmente a la función\(f\) si, para todos\(x\) en\(X\), la secuencia de números\(\left\langle f_{n}(x)\right\rangle\) converge a \(f(x)\).

    Para que la definición tenga sentido, requerimos que\[X \subseteq \bigcap_{n \in \mathbb{N}} \operatorname{Dom}\left(f_{n}\right) .\] si\(a \in X\), la convergencia puntual de una secuencia de funciones,\(\left\langle f_{n}\right\rangle\), en el punto\(a\) depende de la convergencia de la secuencia de números,\(\left\langle f_{n}(a)\right\rangle\). Si no entiendes la convergencia de una secuencia de números no puedes entender la convergencia de una secuencia de funciones.

    EJEMPLO 5.28. Considera las funciones\(f_{n}(x)=x^{n}\). En el intervalo abierto\((-1,1)\), estas funciones convergen puntualmente a 0. En el punto 1, las funciones convergen a 1; en el punto\(-1\), las funciones no convergen, porque los valores oscilan entre\(+1\) y\(-1\). Fuera del conjunto\((-1,1]\) la secuencia de funciones diverge.

    El ejemplo anterior ilustra el principal problema con la convergencia puntual: la secuencia de funciones continuas\(x^{n}\) en el conjunto\([0,1]\) converge, pero la función a la que converge no es continua. Incluso Cauchy cometió este error: afirmó como teorema en su libro Cours d'analyse de 1821 que si una secuencia de funciones continuas converge puntualmente, entonces su límite es continuo\({ }^{3}\). Para sortear este problema, introducimos la noción de convergencia uniforme.

    DEFINICIÓN. Convergencia uniforme\(X \subseteq \mathbb{R}\) Se dice que la secuencia de funciones reales\(f_{n}\) definidas en un conjunto converge uniformemente a la función\(f\) en\(X\) si, por cada\(\varepsilon>0\), existe\(N \in \mathbb{N}\) tal que, para cada \(x\)en\(X\), siempre que\(n>N\) entonces\(\left|f_{n}(x)-f(x)\right|<\varepsilon\). En notación lógica:\[(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall x \in X)(\forall n>N) \quad\left|f_{n}(x)-f(x)\right|<\varepsilon\] Obsérvese la gran diferencia entre convergencia puntual y uniforme: en convergencia puntual\(N\) puede depender\(x\); en convergencia uniforme no puede. La importancia de la convergencia uniforme deriva del siguiente teorema.

    TEOREMA 5.29. Dejar\(f_{n}\) ser una secuencia de funciones continuas sobre\(X\) que converge uniformemente a\(f\) on\(X\). Entonces\(f\) es continuo encendido\(X\).

    Discusión. Debemos mostrar\(|f(x)-f(a)|\) es pequeño cuando\(x\) está cerca de un. sabemos que\(\left|f_{n}(x)-f(x)\right|\) es pequeño para todos\(x\); así que refinamos el

    \({ }^{3}\)Véase el libro [4] de Imre Lakatos para una interesante discusión histórica sobre el error de Cauchy y el descubrimiento de la convergencia uniforme, de Seidel y Stokes independientemente en 1847. engañar a partir de la p. 133, y sumar y restar lo mismo dos veces, escribiendo\(f(x)-f(a)=\left[f(x)-f_{n}(x)\right]+\left[f_{n}(x)-f_{n}(a)\right]+\left[f_{n}(a)-f(a)\right] .\) Entonces tratamos de hacen que cada uno de los tres pares agrupados sea pequeño, por lo que su suma es pequeña. Esto a veces se llama\(\varepsilon / 3\) argumento, porque si hacemos cada término más pequeño que\(\varepsilon / 3\), entonces su suma es menor que\(\varepsilon\).

    Comprobante. Arreglar algún punto\(a \in X\), y dejar\(\varepsilon>0\). Debemos encontrar\[|x-a|<\delta \quad \Longrightarrow \quad|f(x)-f(a)|<\varepsilon .\] para\(\delta>0\) que Para ello, nos\(f(x)-f(a)\) dividimos en tres partes:\[f(x)-f(a)=\left[f(x)-f_{n}(x)\right]+\left[f_{n}(x)-f_{n}(a)\right]+\left[f_{n}(a)-f(a)\right] .\] Elegir para que\(N\) eso\(n \geq N\) implique\(\left|f_{n}(x)-f(x)\right|<\varepsilon / 3\) para todos\(x\). Elige\(\delta>0\) para que\(\left|f_{N}(x)-f_{N}(a)\right|<\varepsilon / 3\) cuando sea\(|x-a|<\delta\). Entonces por el triángulo desigualdad, para\(|x-a|<\delta\), tenemos\ [\ begin {alineado} |f (x) -f (a) | &\ leq\ left|f (x) -f_ {N} (x)\ derecha|+\ izquierda|f_ {N} (x) -f_ {N} (a)\ derecha|+\ izquierda|f_ {N} (a) -f (a)\ derecha|\\ &\ leq\ frac {\ varepsilon} {3} +\ frac {\ varepsilon} {3} +\ frac {\ varepsilon} {3} =\ varepsilon. \ end {alineado}\] PREGUNTA. ¿Dónde se utilizó la hipótesis de que la convergencia era uniforme?

    Podemos utilizar el teorema\(5.29\), por ejemplo, para demostrar que la función exponencial es continua. Consideramos la función exponencial como su serie Taylor\[e^{x}=\sum_{k=0}^{\infty} \frac{x^{k}}{k !} .\] Recordemos que la expresión\(\sum_{k=0}^{\infty} \frac{x^{k}}{k !}\) es una taquigrafía\[\lim _{n \rightarrow \infty} \sum_{k=0}^{n} \frac{x^{k}}{k !} .\] para Para cualquier número real\(a, \sum_{k=0}^{\infty} \frac{a^{k}}{k !}\) es una suma infinita que converge si su correspondiente secuencia de sumas parciales converge. Por la prueba de ratio, la serie exponencial converge para todos los reales\(a\). (Para una prueba formal de la prueba de ratio, ver Teorema 8.9).

    Proposición 5.31. La función exponencial es continua\(\mathbb{R}\).

    Comprobante. \[p_{n}(x):=\sum_{k=0}^{n} \frac{x^{k}}{k !}\]Déjese ser el polinomio de Taylor de\(n^{\text {th }}\) orden. Sabemos que cada uno\(p_{n}\) es continuo, por Proposición\(5.23\). Si supiéramos que\(p_{n}(x)\) convergían uniformemente a\(e^{x}\), estaríamos hechos por el Teorema\(5.29\).

    No es cierto que\(p_{n}\) converge uniformemente sobre\(\mathbb{R}\) (¿por qué?). Sin embargo, la secuencia converge uniformemente en cada intervalo\([-R, R]\), y esto es lo suficientemente bueno para concluir que\(e^{x}\) es continuo en\(\mathbb{R}\) (¿por qué?).

    Para ver esta última afirmación, arreglar\(R>0\) y\(\varepsilon>0\). Debemos encontrar para\(N\) que, para todos\(n>N\) y para todos\(x \in[-R, R]\), tengamos\(\left|e^{x}-p_{n}(x)\right|<\varepsilon\). Observe que\[\left|e^{x}-p_{n}(x)\right|=\left|\frac{x^{n+1}}{(n+1) !}+\frac{x^{n+2}}{(n+2) !}+\ldots\right| .\] Para cada uno\(n\), el lado derecho se maximiza\([-R, R]\) por su valor en\(R\) (¿por qué?) ; y a medida que\(n\) aumenta, este resto disminuye monótonamente (porque se pierden cada vez más términos positivos). Como sabemos la serie exponencial para\(e^{R}\) converge, elige una\(N\) así que\(e^{R}-p_{N}(R)\) sea menor que\(\varepsilon\). Entonces para todos\(x\) en\([-R, R]\) y todos\(n \geq N\), tenemos\(\left|e^{x}-p_{n}(x)\right|<\varepsilon\), como se desee.

    Las funciones seno y coseno también se pueden definir en términos de su serie Taylor:\ [\ begin {aligned} &\ sin (x)\ quad: =\ sum_ {n=0} ^ {\ infty} (-1) ^ {n}\ frac {x^ {2 n+1}} {(2 n+1)!} \\ &\ cos (x)\ quad: =\ suma_ {n=0} ^ {\ infty} (-1) ^ {n}\ frac {x^ {2 n}} {(2 n)!} . \ end {aligned}\] Se puede demostrar que son continuos por argumentos similares. OBSERVACIÓN. Observe que en nuestras definiciones de límites y continuidad, estamos utilizando el valor absoluto solo para medir distancias. En otras palabras, estamos diciendo que\(f\) es continuo en\(a\) si, para todos\(\varepsilon>0\), podemos encontrar\(\delta>0\), de tal manera que siempre que la distancia de\(x\) a\(a\) sea menor que\(\delta\), entonces la distancia de\(f(x)\) a\(f(a)\) es menor que\(\varepsilon\). Esta definición tiene perfectamente sentido cuando se tiene una forma de medir distancias en el dominio y el codominio. Por ejemplo, si la función se mapea\(\mathbb{R}^{m}\) a\(\mathbb{R}^{n}\), se pueden medir distancias de la manera euclidiana habitual. En una generalidad aún mayor, los matemáticos utilizan algo llamado métricas para medir distancias, y una vez que se tienen métricas, se puede discutir la continuidad de las funciones de manera similar a nuestra discusión para funciones reales.

    Las matemáticas de este capítulo -una mirada cercana al comportamiento de las funciones reales- se llama Análisis. Esta comprende una de las tres principales disciplinas de la matemática pura; las otras dos son Geometría y Álgebra. Una buena introducción al análisis es el libro [?] de Walter Rudin.

    Ejercicios

    EJERCICIO 5.1. Demostrar que las definiciones de límite en las páginas 129 y 130 son las mismas.

    EJERCICIO 5.2. Demostrar Lema 5.14, y la aseveración relacionada de que\(|c|-|d| \leq|c+d|\).

    EJERCICIO 5.3. Para\(n \in \mathbb{N}^{+}, a_{i} \in \mathbb{R}(1 \leq i \leq n)\), demostrar que\[\left|\sum_{i=1}^{n} a_{i}\right| \leq \sum_{i=1}^{n}\left|a_{i}\right| .\] EJERCICIO 5.4. Demostrar Lema\(5.15\).

    EJERCICIO 5.5. Demostrar parte (v) del Teorema 5.9.

    EJERCICIO 5.6. Dé un ejemplo de dos funciones\(f\) y\(g\) que no tengan límites en un punto\(a\) pero tal que\(f+g\) sí. Para el mismo par de funciones,\(f-g\) también puede tener un límite en\(a\)? EJERCICIO 5.7. Supongamos que\(f\) es una función real y\(\lim _{x \rightarrow a} f(x)=\)\(L\). Demostrar que si\(X \subseteq \operatorname{Dom}(f)\), entonces\[\lim _{X \ni x \rightarrow a} f(x)=L .\] EJERCICIO 5.8. Usa el método de Arquímedes (el método de las sumas de Riemann) para demostrarlo\[\int_{0}^{1} x^{2} d x=\frac{1}{3}\] (Necesitarás conocer una fórmula para\(\sum_{k=0}^{n} k^{2}\) - ver Proposición 4.6).

    EJERCICIO 5.9. Utilice el método de Arquímedes para probarlo\[\int_{0}^{1} x^{3} d x=\frac{1}{4} .\] (Ver Ejercicio 4.16).

    EJERCICIO 5.10. Demostrar que la función Heaviside tiene límites tanto a la izquierda como a la derecha en\(0 .\)

    EJERCICIO 5.11. Demostrar que una función tiene un límite en un punto si y sólo si tiene límites tanto izquierdo como derecho en ese punto y sus valores coinciden.

    EJERCICIO 5.12. Demostrar que el Teorema\(5.9\) aplica a límites restringidos.

    EJERCICIO 5.13. El punto\(a\) es un punto límite del conjunto\(X\) si, por cada\(\delta>0\), existe un punto\(x\) adentro\(X \backslash\{a\}\) con\(|x-a|<\delta\). Dejar\(f\) ser una función de valor real en\(X \subseteq \mathbb{R}\). Demostrar que si\(a\) es un punto límite de\(X\), entonces si\(f\) tiene un límite restringido en\(a\) él es único. Demostrar que si no\(a\) es un punto límite de\(X\), entonces cada número real es un límite restringido de\(f\) at\(a\).

    EJERCICIO 5.14. \(\lim _{x \rightarrow 0} \sin (x) / x=1\)Demuéstralo.

    EJERCICIO 5.15. Demostrar Proposición 5.22.

    EJERCICIO 5.16. Demostrar que la función\(f(x)=x\) es continua en todas partes\(\mathbb{R}\). EJERCICIO 5.17. En el Ejercicio 4.12 se da una fórmula para los números de Fibonacci. Evaluar\(\lim _{n \rightarrow \infty} F_{n+1} / F_{n}\).

    EJERCICIO 5.18. ¿Qué tan grande debe\(n\) ser para asegurar que\(F_{n+1} / F_{n}\) está dentro\(10^{-1}\) del límite en el Ejercicio 5.17? \(10^{-2}\)¿Dentro? \(10^{-k}\)¿Dentro?

    EJERCICIO 5.19. Define la función\(\psi: \mathbb{R} \rightarrow \mathbb{R}\) por\[\psi(x):= \begin{cases}0 & x \notin \mathbb{Q} \\ 1 & x \in \mathbb{Q} .\end{cases}\] Demostrar que\(\psi\) es discontinuo en todas partes.

    EJERCICIO\(5.20\). Definir la función\(\phi: \mathbb{R} \rightarrow \mathbb{R}\) por\[\phi(x):= \begin{cases}0 & x \notin \mathbb{Q} \\ \frac{1}{n} & x \in \mathbb{Q} \backslash\{0\}, x=\frac{m}{n}, \operatorname{gcd}(m, n)=1, n>0 \\ 1 & x=0 .\end{cases}\] Probar que\(\phi\) es continua en cada número irracional y discontinuo en cada número racional.

    EJERCICIO 5.21. Demostrar que una función de valor real\(f\) en un intervalo abierto\(I\) es continua en cualquier punto donde exista su derivada, es decir, donde\[\lim _{x \rightarrow a} \frac{f(x)-f(a)}{x-a}\] exista. ¿Cuál es lo contrario de esta afirmación? Demostrar que lo contrario no es cierto.

    EJERCICIO 5.22. Demostrar que si la función\(f\) tiene el límite\(L\) de la derecha en\(a\), entonces la secuencia\(f\left(a+\frac{1}{n}\right)\) tiene límite\(L\) como\(n \rightarrow \infty\). Demostrar que lo contrario es falso en general.

    EJERCICIO 5.23. Dejar\(f\) y\(g\) ser funciones reales. Vamos\(a \in \mathbb{R}\) y supongamos que\[\lim _{x \rightarrow a} g(x)=L_{1}\] y\[\lim _{x \rightarrow L_{1}} f(x)=L_{2} .\] Demostrar que\[\lim _{x \rightarrow a} f \circ g=L_{2} .\] Si\(g\) es continuo en\(a\) y\(f\) es continuo en\(g(a)\), es\(f \circ g\) continuo en\(a\)?

    EJERCICIO 5.24. Que\(f\) sea una función real,\(a \in \mathbb{R}\) y\(\lim _{x \rightarrow a} f(x)=\)\(L\). Si\(\left\langle a_{n}\right\rangle\) converge a\(a\), demostrar que\(\left\langle f\left(a_{n}\right)\right\rangle\) converge a\(L\).

    EJERCICIO 5.25. Ejemplo Completo 5.26. Es decir, probar que\[\lim _{n \rightarrow \infty}\left(\frac{1}{n^{3}}\right) \frac{(n)(n+1)(2 n+1)}{6}=1 / 3 .\] EJERCICIO 5.26. Evaluar ¿\[\lim _{n \rightarrow \infty} \sum_{k=0}^{n}\left(\frac{k}{n}\right) \frac{1}{n} .\]Se puede dar una interpretación geométrica de este límite?

    EJERCICIO 5.27. Utilice la inducción para demostrar que cada polinomio es continuo en cada número real.

    EJERCICIO 5.28. Vamos\(-1<x<1\). Demostrar que la serie geométrica con relación\(x, \sum_{k=0}^{\infty} x^{k}\), converge a\(\frac{1}{1-x}\).

    EJERCICIO 5.29. Que los números de Fibonacci\(F_{n}\) se definan como en el Ejercicio 4.12. Considera la serie Power\(F(x)=\sum_{n=1}^{\infty} F_{n} x^{n}\). Demostrar que la serie power satisface\[F(x)=x^{2} F(x)+x F(x)+x .\] Solve (5.32) para\(F(x)\), descomponerla por fracciones parciales y usar Ejercicio\(5.28\) para derivar Fórmula\(4.20\). Esta técnica para encontrar una fórmula para\(F_{n}\) estudiar la función\(F\) suele ser fructífera. La función\(F\) se llama la función generadora para la secuencia.

    EJERCICIO 5.30. Supongamos que se define una secuencia con la misma relación de recurrencia que los números de Fibonacci\(F_{n+2}=F_{n+1}+F_{n}\), pero con diferentes valores iniciales para\(F_{1}\) y\(F_{2}\). Encontrar la función generadora para la nueva secuencia, y de ahí calcular una fórmula para el término general. ¿\(\lim _{n \rightarrow \infty} F_{n+1} / F_{n}\)Siempre es lo mismo?

    EJERCICIO 5.31. Demostrar que el seno y el coseno son funciones continuas en todos\(\mathbb{R}\).

    CAPÍTULO 6

    Cardinalidad

    En este capítulo utilizamos funciones para explorar la idea del tamaño de un conjunto. Los resultados que obtenemos son profundos y muy interesantes, especialmente cuando consideramos la simplicidad de las herramientas que estamos utilizando. Por supuesto, tendremos que usar estas herramientas de alguna manera hábilmente.

    La teoría de conjuntos viene en diferentes sabores. El más difícil es la teoría de conjuntos axiomática. Muchos resultados interesantes se han derivado en la teoría de conjuntos axiomática formal, pero el tema es avanzado y no es adecuado para una introducción a las matemáticas superiores. En cambio, estudiaremos lo que se llama teoría de conjuntos ingenua. El uso de la palabra “ingenuo” no es peyorativo, sino que pretende diferenciar este enfoque de la teoría de conjuntos axiomática. La mayoría de los matemáticos han estudiado la teoría de conjuntos ingenua, pero relativamente pocos han trabajado extensamente con axiomas de conjuntos.

    Cardinalidad

    Deseamos comparar el tamaño de los conjuntos. La herramienta fundamental para nuestra investigación es la biyección. En el caso de los conjuntos finitos, que se pueden enumerar exhaustivamente, esto es fácil. Dados dos conjuntos finitos cualesquiera,\(X\) y\(Y\), podríamos enumerar los elementos y contarlos. Siempre que nuestras listas no tengan redundancias, el conjunto más grande es el que tiene el conteo más alto. El acto de enumerar los elementos en un conjunto, donde esto es posible, también es definir una biyección desde un número natural (interpretado como un conjunto) hasta el conjunto que se está contando. La idea de usar funciones para comparar el tamaño de los conjuntos puede generalizarse a conjuntos arbitrarios.

    A la hora de comparar el tamaño de los sets infinitos hay intuiciones en competencia. Por un lado tenemos la intuición de que si un conjunto es un subconjunto propio de otro conjunto, debería ser más pequeño. Por otro lado si dos conjuntos son infinitos, ¿cómo puede uno ser más grande que el otro? El uso de biyecciones, inyecciones y suryecciones para definir el tamaño relativo de los conjuntos nos permite ver nuestro camino a través de esta paradoja.

    Definición. Equinumero, cardinalidad Dejar\(X\) y\(Y\) ser conjuntos. Eso decimos\(X\) y\(Y\) tenemos la misma cardinalidad si hay una biyección\(f: X \mapsto Y\). Podemos expresar que dos conjuntos tienen la misma cardinalidad por\[|X|=|Y| .\] Si\(|X|=|Y|\), entonces decimos eso\(X\) y\(Y\) son equinúmeros.

    RECLAMACIÓN. La equinumerosidad es una relación de equivalencia.

    (Demostrar esto: Ejercicio 6.2).

    Si bien antes de ahora usamos las ideas finitas e infinitas, las definiremos en términos de bijecciones.

    DEFINICIÓN. Finito, infinito Let\(X\) be a set. \(X\)es finito si existe alguna\(n \in \mathbb{N}\) y una biyección\(f:\ulcorner n\urcorner \mapsto X\). En el caso de que\(X=\emptyset\), decimos que\(X\) es biyectiva con\(\ulcorner 0\urcorner\) vía la función vacía. Si no\(X\) es finito, decimos que\(X\) es infinito.

    Entonces un conjunto es finito si es biyective con un conjunto\(\ulcorner n\urcorner\) para algunos\(n \in \mathbb{N}\). Probablemente no sea de sorprender que un conjunto no pueda ser biyective con diferentes números naturales.

    PROPOSICIÓN 6.1. Vamos\(m, n \in \mathbb{N}\). Después\[(|\ulcorner m\urcorner|=|\ulcorner n\urcorner|) \Longleftrightarrow(m=n) .\] Discusión. Demostramos la dirección no trivial de este bicondicional por inducción en uno de los enteros en el enunciado.

    PRUEBA. \(\Leftarrow\)

    Vamos\(m=n\). Entonces es obvio que\[|\ulcorner m\urcorner|=|\ulcorner n\urcorner| .\]\(\Rightarrow\)

    Argumentamos por inducción sobre\(m\).

    Caso base:

    Si\(m=0\) y\(\left|\left\ulcorner^{n}\right\urcorner\right|=\mid\left\ulcorner_{m}||\right.\) entonces claramente\(n=0\).

    Paso de inducción:

    Dejemos\(m \in \mathbb{N}\) y supongamos que\[(\forall n \in \mathbb{N})\left[\left|\left\ulcorner^{\prime}\right\urcorner\right|=|\ulcorner\urcorner|\right] \Rightarrow[m=n]\] Demostramos que\[(\forall n \in \mathbb{N})[|\ulcorner m+1\urcorner|=|\ulcorner n\urcorner|] \Rightarrow[m+1=n]\] Supongamos que\[\left|\left\ulcorner^{m}+1\right\urcorner\right|=\left|\left\ulcorner^{\urcorner} n\right\rangle\right|\] Dejemos\[f:\ulcorner m+1\urcorner \longmapsto\ulcorner n\urcorner\] Discusión Una forma natural de proceder con este argumento es restringir el dominio de\(f\) a\(\ulcorner m\urcorner\) y usar la hipótesis de inducción. Desafortunadamente si\(f(m) \neq n-1\) entonces no\(\left.\left.f\right|_{\ulcorner m}\right\urcorner\) es una bijección de\(\ulcorner m\urcorner\) a\(\ulcorner n-1\urcorner\), y la hipótesis de inducción no se aplicará directamente. Para abordar este tema, definiremos una permutación\(g:\ulcorner m+1\urcorner \rightarrow\ulcorner m+1\urcorner\) que reordene los elementos de\(\ulcorner m+1\urcorner\) tal manera que\(f \circ g\) será una biyección satisfactoria\[(f \circ g)(m)=n-1\] Definimos de la\(g:\ulcorner m+1\urcorner \rightarrow\ulcorner m+1\urcorner\) siguiente manera:\ [g (x) =\ left\ {\ begin {array} {clc} f^ {-1} (n-1) &\ text {if} & x=m\\ m &\ text {si}\ quad x=f^ {-1} (n-1)\\ x &\ text {de lo contrario.} \ end {array}\ derecho.\] Vamos\(h=f \circ g\). Entonces\(h\) es una bijección y\[h(m)=(f \circ g)(m)=n-1\]imagen

    FIGURA 6.2. Imagen de la permutación\(g\)

    Por lo tanto\[\left.h\right|_{\left\ulcorner_{m}\right\urcorner}:\ulcorner m\urcorner \mapsto\ulcorner n-1\urcorner .\] Por la hipótesis de inducción\[m=n-1 .\]\[m+1=n .\] Por lo tanto Por el principio de inducción,\[(\forall m \in \mathbb{N})(\forall n \in \mathbb{N})(|\ulcorner m\urcorner|=|\ulcorner n\urcorner|) \Rightarrow(m=n) .\] COROLARIO 6.3. Si\(X\) es un conjunto finito, hay exactamente uno\(n \in \mathbb{N}\) tal que\(\ulcorner n\urcorner\) es biyective con\(X\).

    Discusión. Este es un argumento de singularidad estándar. Suponemos que un conjunto es biyectiva con números naturales\(\ulcorner n\urcorner\) y\(\ulcorner m\urcorner\), y usamos que la composición de las biyecciones es una biyección para demostrarlo\(m=n\). Esto no es una prueba por contradicción. Más bien estamos demostrando que dos nombres cualesquiera para los números naturales que son biyectivos con\(X\) deben nombrar al mismo número natural. Comprobante. \(X\)es finito, entonces hay\(n \in \mathbb{N}\) tal que\[|X|=|\ulcorner n\urcorner| .\] Let\(m \in \mathbb{N}\) y\[|X|=|\ulcorner m\urcorner| .\] Let\(f: X \mapsto\ulcorner n\urcorner\) y\(g: X \mapsto\ulcorner m\urcorner\). Entonces\(g^{-1}:\ulcorner m\urcorner \mapsto X\). La composición de las biyecciones es una bijección,\[f \circ g^{-1}:\ulcorner m\urcorner \mapsto\ulcorner n\urcorner .\] por lo que Por la Proposición 6.1,\[m=n .\] DEFINICIÓN. Cardinalidad finita Si\(X\) es un conjunto finito, decimos que tiene cardinalidad finita. Dejar\(n \in \mathbb{N}\) ser el número natural único tal que\(\ulcorner n\urcorner\) sea biyective con\(X\). Entonces decimos que\(X\) tiene cardinalidad\(n\), o\[|X|=n \text {. }\] Corolario\(6.3\) garantiza que la cardinalidad de un conjunto finito está bien definida.

    Conjuntos Infinitos

    Los sets infinitos son misteriosos. Muchas paradojas clásicas abordan confusiones históricas sobre la idea del infinito. Al mismo tiempo, a matemáticos de los antiguos griegos les ha resultado imposible desarrollar el pensamiento matemático sin el uso del infinito. ¿Por qué es así? Desde un punto de vista metafísico, la idea del infinito probablemente no sea necesaria. Desde un punto de vista físico, no hay evidencia de infinito. Es decir, el universo, tal como lo entendemos, es finito. Incluso desde un punto de vista teológico, el infinito es en cierta medida el complemento de lo finito -y, en consecuencia, da origen a sus propias paradojas.

    El infinito ha molestado a algunos matemáticos y filósofos, y algunos han tratado de prescindir de él. No hay muchos adeptos a esta escuela. La idea del infinito es tan útil que el estudiante de matemáticas tendrá que desarrollar cierta comodidad con la idea -y sus consecuencias lógicas. En cualquier caso, el infinito existe claramente en el universo matemático, exista o no en el mundo natural, y usar el infinito ha sido crucial para desarrollar una comprensión matemática del mundo natural. En esta sección iniciamos una investigación de conjuntos infinitos.

    Utilizaremos inyecciones y suryecciones para construir alguna maquinaria analítica para comparar conjuntos.

    NOTACIÓN. \(\preceq\)Dejar\(X\) y\(Y\) ser conjuntos. Escribimos\(X \preceq Y\) si hay una inyección\[f: X \rightarrow Y \text {. }\] Esta notación sugiere que, bajo las condiciones de la definición, pensamos\(X\) que es “no mayor que” que\(Y\). Esto tiene sentido, ya que somos capaces de asociarnos a cualquier elemento de\(X\) un elemento distinto de\(Y\). Si\(f\) en la definición hay una sobreyección, entonces también\(f\) es una biyección y\(|X|=|Y|\). De lo contrario,\(f\) es una función que se asocia con cada elemento del rango de\(f\) (que es un subconjunto apropiado de\(Y\)) un elemento único de\(X\), y\(Y\) todavía tiene algunos elementos no contabilizados por \(f\). Entonces\(Y\) podría ser “más grande” que\(X\), pero ciertamente no será “más pequeño”. Es posible que desee considerar esta definición en el caso especial de conjuntos finitos\(X\) y\(Y\). Observarás que\[X \preceq Y \Longleftrightarrow|X| \leq|Y| .\] En el Ejercicio 6.3 se te pide que demuestres que\(\preceq\) es transitivo y reflexivo.

    OBSERVACIÓN. ¿Hay dos conjuntos comparables con respecto a\(\preceq\)? Sorprendentemente, requiere de una suposición más avanzada, llamada Axioma de Elección (ver Apéndice B), para garantizar la comparabilidad de todos los pares de conjuntos. Prácticamente todos los matemáticos aceptan el Axioma de Elección. Asumiremos el Axioma de Elección en este texto.

    Si\(X \preceq Y\) y\(Y \preceq X\), esperaríamos que\(X\) y\(Y\) sean del mismo tamaño. Esto es cierto, aunque la prueba es un poco complicada. El resultado es muy útil, ya que muchas veces es mucho más fácil anotar dos inyecciones que una biyección. TEOREMA 6.4. Teorema de Schröder-Bernstein Let\(X\) and\(Y\) be sets. Si\(X \preceq Y\) y\(Y \preceq X\), entonces\(|X|=|Y|\).

    Discusión. La idea detrás de esta prueba es la siguiente. Lo demostramos\(|X|=|Y|\) construyendo una biyección\(F: X \nrightarrow Y\). Nos dan inyecciones\(f: X \rightarrow Y\) y\(g: Y \rightarrow X\). Construimos\(F\) usando las inyecciones\(f\) y\(g\) como guías. Es decir, queremos definir de\(F\) manera que para cada uno\(x \in X\), ya sea\(F(x)=f(x)\) o\(F(x)=g^{-1}(x)\). Es obvio que esto no se puede lograr ciegamente. Por ejemplo, si\(x \in X \backslash g[Y]\), nuestra mano es forzada, y\(F(x)=f(x)\). De igual manera\(y \in Y \backslash f[X]\), si, nuestra única oportunidad de lograr nuestro objetivo es para\(F(g(y))=y\). Si tomamos la decisión equivocada para\(F(x)\), perderemos el uso de\(f\) y\(g\) como guías. Podríamos considerar\(F\) indecisos sobre\(x\) desde entonces\(f\) y\(g^{-1}\) no estamos de acuerdo. La solución es usar\(f\) y movernos de un lado\(g\) a otro entre\(X\) y\(Y\) hasta que encontremos que nuestra mano está forzada.

    Comprobante. Dejar\[f: X \rightarrow Y\] y\[g: Y \rightarrow X\] ser inyecciones. Podemos suponer eso\(X\) y\(Y\) somos disjuntos.

    Discusión. Si\(X\) y no\(Y\) son disjuntos, podemos reemplazar\(X\) con\(X \times\{0\}\) y\(Y\) con\(Y \times\{1\}\). La existencia de una biyección implica\[g: X \times\{0\} \mapsto Y \times\{1\}\] claramente la existencia de una biyección de\(X\) a\(Y\).

    Si\(x \in X\) decimos\(y \in Y\) es el predecesor de\(x\) si\(g(y)=x\). Análogamente, si\(y \in Y\) decimos que\(x \in X\) es el antecesor de\(y\) if\(f(x)=y\). Es posible que un elemento no tenga predecesor. Por ejemplo, si\(x \in X \backslash g[Y]\), entonces no\(x\) tiene predecesor. Sin embargo, si un elemento sí tiene un predecesor, ese predecesor es único (ya que\(f\) y\(g\) son ambas inyecciones). Dado un elemento\(w\), deja\(m(w)\) ser 0 si\(w\) no tiene predecesor. De lo contrario, deje\(m(w)\) ser el número máximo\(N \geq 1\) tal que haya una secuencia finita\(\left\langle z_{n} \mid 0 \leq n \leq N\right\rangle\) para algunos\(N \geq 1\) satisfactorios

    (1)\(w=z_{N}\)

    (2) Porque\(n<N, z_{n}\) es el predecesor de\(z_{n+1}\), si existe el máximo. Si el máximo no existe (es decir, si se pueden hacer cadenas arbitrariamente largas de predecesores), vamos\(m(w)=\infty\).

    Ahora define\ [\ begin {alineado} X_ {e} &=\ {x\ in X\ mid m (x)\ text {es par}\}\\ X_ {o} &=\ {x\ in X\ mid m (x)\ text {es impar}\}\\ X_ {i} &=\ {x\ in X\ mid m (x) =\ infty\}\ Y_ {e} &=\ {y\ in Y\ mid m (y)\ text {es par}\}\\ Y_ {o} &=\ {y\ in Y\ mid m (y)\ text {es impar }\}\\ Y_ {i} &=\ {y\ in Y\ mid m (y) =\ infty\} \ end {alineado}\] La colección\[\left\{X_{e}, X_{o}, X_{i}\right\}\] es obviamente una partición de\(X\). Del mismo modo,\[\left\{Y_{o}, Y_{e}, Y_{i}\right\}\] es una partición de\(Y\).

    Ahora estamos en condiciones de definir una bijección entre\(X\) y\(Y\). Dejar\ [F (x) =\ left\ {\ begin {array} {ccc} f (x) &\ text {if} & x\ in X_ {i}\\ f (x) &\ text {if} & x\ in X_ {e}\\ g^ {-1} (x) &\ text {if} & x\ in X_ {o}. \ end {array}\ right.\] Discusión. Nos queda algo de trabajo en esta prueba. Tenemos que verificar que\(F\) es una bijección de\(X\) a\(Y\). La idea detrás de la definición de\(F\) puede no ser obvia, así que investiguemos la motivación para la definición. Supongamos\(g\) que\(f\) y no sean sobreyecciones (si alguna de las funciones es una suryección no habría nada que probar, ya que también sería una biyección). Dejar\(x \in X \backslash g[Y]\) y\(y \in Y \backslash f[X]\). Ya que\(x \notin g[Y]\), la única opción posible para\(F(x)\) es\(f(x)\). De igual manera\(y \notin f[X]\),, y el único valor posible de\(F^{-1}(y)\) es\(g(y)\). Pero esto no resuelve todos nuestros problemas. El conjunto\(X \backslash g[Y]\) está conformado por aquellos integrantes de los\(X\) que no tienen antecesores, y\(Y \backslash f[X]\) está integrado por los integrantes de\(Y\) sin antecesores. Si vamos a definir\(F\) juntando\(f\) y\(g\), encontramos que nuestras manos se vieron forzadas con estos conjuntos. Ahora supongamos que eso\(x \in X\) tiene exactamente un antecedente. Entonces no\(g^{-1}(x)\) tiene predecesor. Como observamos anteriormente, necesitamos satisfacer\[F^{-1}\left(g^{-1}(x)\right)=g\left(g^{-1}(x)\right)=x\] y por lo tanto debemos satisfacer\[F(x)=g^{-1}(x) .\] De igual manera, si\(y \in Y\) tiene exactamente un antecedente, debemos satisfacer\[F^{-1}(y)=f^{-1}(y) .\] Si un elemento\(w\) de\(X \cup Y\) tiene finitamente muchos antecedentes,\(\left.F\right|_{A(w)}\) estarán determinados por la restricción impuesta por el antecedente sin antecedente.

    Afirmamos que\[F: X \mapsto Y .\] Se ve fácilmente que\(F\) está bien definido. Ya que\(X_{o} \subseteq g[Y]\) y\(g\) es una inyección,\(\left.F\right|_{X_{o}}=\left.g^{-1}\right|_{X_{o}}\) está bien definida. Eso\(F\) está bien definido\(X_{e}\) y\(X_{i}\) es obvio. Además\ [\ begin {reunió} F\ left [X_ {e}\ right] =f\ left [X_ {e}\ right] =Y_ {o}\\ F\ left [X_ {o}\ right] =g^ {-1}\ left [X_ {o}\ right] =Y_ {e} \ end {reunió}\] y\[F\left[X_{i}\right]=f\left[X_{i}\right]=Y_{i} .\] Discusión. A pesar de que no tuvimos otra opción en la definición de\(F\) on\(X_{e}\) y\(X_{o}\), podríamos haber definido\(F\) así que\(\left.F\right|_{X_{i}}=\left.g^{-1}\right|_{X_{i}}\).

    Por lo tanto,

    \(F[X]=F\left[X_{e} \cup X_{o} \cup X_{i}\right]=f\left[X_{e}\right] \cup g^{-1}\left[X_{o}\right] \cup f\left[X_{i}\right]=Y_{o} \cup Y_{e} \cup Y_{i}=Y .\)Así\(F\) es una sobrejección. Demostramos que\(F\) es una inyección. Vamos\(x, z \in X\), y supongamos\(F(x)=F(z)\). Si\(x \in X_{e}\), entonces\(F(x) \in Y_{o}\) y\(z \in X_{e}\). De ahí\[F(x)=f(x)=f(z)=F(z) .\] que Since\(f\) sea una inyección, así es\(\left.f\right|_{X_{e}}\). Por lo tanto\(x=z\).

    Si\(x \in X_{o}\), entonces\(F(x) \in Y_{e}\) y\(z \in X_{o}\). Entonces\[F(x)=g^{-1}(x)=g^{-1}(z)=F(z) .\] La función\(g\) es una inyección, por lo tanto\(\left.g^{-1}\right|_{X_{o}}\) es una inyección y así\(x=z\).

    Por último, si\(x \in X_{i}\), entonces\(F(x) \in X_{i}\) y\(z \in X_{i}\). Así\[F(x)=f(x)=f(z)=F(z) .\] que ya\(f\) es una inyección,\(x=z\).

    Por lo tanto\(F\) es una inyección. De ahí,\[F: X \mapsto Y\] y\[|X|=|Y| .\] TEOREMA 6.5. \(\mathbb{N}\)es un conjunto infinito.

    Discusión. Mostramos que cualquier función con dominio\(\ulcorner n\urcorner\), pues\(n \in\)\(\mathbb{N}\), no logra ser una suryección. Por lo tanto, no\(\mathbb{N}\) es finito.

    Comprobante. Asumir\(n \in \mathbb{N}\), y\[f:\ulcorner n\urcorner \longrightarrow \mathbb{N} .\] Let\[a=1+\sum_{i=0}^{n-1} f(i) \in \mathbb{N} .\] Claramente\(a \notin f[\ulcorner n\urcorner]\), así no\(f\) es una sobrejección. En consecuencia, no hay ninguna\(n \in \mathbb{N}\) que pueda ser mapeada de manera surjectiva\(\mathbb{N}\). Por lo tanto, no\(\mathbb{N}\) es finito. No sólo es\(\mathbb{N}\) un conjunto infinito, es en cierto sentido el conjunto infinito “más pequeño”.

    TEOREMA 6.6. Si\(X\) es infinito, entonces\(\mathbb{N} \preceq X\).

    Discusión. Definiremos una inyección\(f: \mathbb{N} \rightarrow X\) inductivamente, construyéndola paso a paso.

    Prueba. Como\(X\) es infinito, no está vacío, por lo que debe contener algún elemento\(x_{0}\). Definir\(f(0)=x_{0}\).

    Ahora, supongamos que todos\(x_{0}=f(0), x_{1}=f(1), \ldots, x_{n}=f(n)\) han sido elegidos, así que eso\[\left.f\right|_{\{0,1, \ldots, n\}}=\left.f\right|_{n+1\urcorner}: k \mapsto x_{k}\] es inyectivo. Como\(X\) es infinita, la función\(\left.f\right|_{\left.{ }_{n+1}\right\urcorner}\) que hemos definido no puede ser suryectiva. Entonces existe algunos\(x_{n+1}\) en\(X \backslash\left\{x_{0}, \ldots, x_{n}\right\}\). Definir\(f(n+1)=x_{n+1}\). Continuando de esta manera, alcanzamos una inyección\(f\) definida en todos\(\mathbb{N}\).

    OBSERVACIÓN. El lector astuto pudo haber notado que en la prueba anterior, terminamos haciendo un número infinito de elecciones de elementos de\(X\).

    DEFINICIÓN. Cardinalidad,\(\aleph_{0}\) Utilizamos la expresión\(\aleph_{0}\) (léase “aleph nought” 1) para el tamaño de\(\mathbb{N}\). Es decir\[\aleph_{0}:=|\mathbb{N}| \text {. }\] El tamaño de un conjunto se llama la cardinalidad del conjunto. Cualquier conjunto que sea biyective con\(\mathbb{N}\) tiene cardinalidad\(\aleph_{0}\). Un conjunto finito tiene cardinalidad igual al número natural único con el que es biyectiva.

    DEFINICIÓN. Contable Un conjunto que es finito o tiene cardinalidad\(\aleph_{0}\) se denomina conjunto contable.

    No estamos desarrollando formalmente la idea de cardinalidad. Esto requeriría trabajar con los ordinales, lo que nos distraería de intereses matemáticos más inmediatos. Sin embargo, usaremos el lenguaje

    \({ }^{1} \aleph\)es la primera letra del alfabeto hebreo. y convenciones de cardenales donde es intuitiva y no interfiere con nuestro programa.

    Conjuntos incontables

    En esta sección demostramos uno de los resultados más notables de las matemáticas modernas. Hay conjuntos que no son contables. Cuando este resultado fue comunicado por primera vez en 1878 por Georg Cantor, asombró al mundo matemático. De este resultado se deduce que, en el sentido más significativo, existen diferentes tamaños de infinito. Supongamos que no\(X\) es un conjunto contable. Por teorema 6.6,\(\mathbb{N} \preceq X\). Por el Teorema de Schröder-Bernstein\(X \preceq \mathbb{N}\), si\(|\mathbb{N}|=|X|\), entonces, y\(X\) sería contable. Entonces si no\(X\) es contable,\(X \npreceq \mathbb{N}\), y\(\mathbb{N} \prec X\). Es decir,\[\aleph_{0}<|X| \text {. }\] DEFINICIÓN. Incontable Un conjunto que no es contable se llama incontable.

    Por supuesto, todavía tenemos que demostrar que hay conjuntos incontables.

    NOTACIÓN. \(\prec\)Dejar\(X\) y\(Y\) ser conjuntos. Entonces\(X \prec Y\) siempre que\[X \preceq Y\] y\[|X| \neq|Y| .\] escribimos\(|X| \leq|Y|\) si\(X \preceq Y\), y\(|X|<|Y|\) si\(X \prec Y\).

    Definición. Power set,\(P(X)\) Let\(X\) be a set. Entonces\[P(X)=\{Y \mid Y \subseteq X\} .\]\(P(X)\) se llama el conjunto de poder de\(X\). Es el conjunto de todos los subconjuntos de\(X\).

    El siguiente teorema, debido a G. Cantor, es uno de los resultados más notables de las matemáticas. No sólo prueba la existencia de un conjunto incontable, implica que el conjunto de poder genera necesariamente conjuntos de cardinalidad mayor y con ello proporciona un medio para construir infinitamente muchas cardinalidades infinitas diferentes. TEOREMA 6.7. \(X\)Déjese ser un conjunto. Después\[|X|<|P(X)| .\] Discusión. Para probar este resultado necesitamos demostrar que una bijección entre un conjunto y su conjunto de potencia es imposible. ¿Cómo se muestra la imposibilidad de tal función? Podemos suponer que tal bijección existe y derivar una contradicción. Alternativamente, podemos demostrar que cualquier función, desde un conjunto hasta su conjunto de potencia, necesariamente falla en ser una suryección, que es casi lo mismo, y más elegante. Necesitamos demostrar que cualquier función de un conjunto a su conjunto de potencia “echa de menos” algunos elementos del conjunto de potencia. Utilizaremos una técnica conocida como argumento diagonal para construir un elemento del conjunto de potencia que no esté en el rango de la función. El dominio,\(X\), actúa como un índice para realizar un seguimiento de los elementos del rango de la función (este es otro uso para las funciones). Construimos un elemento que\(Y \in P(X)\) no está en el rango de la función agregando\(x \in X\) a\(Y\) iff no\(x\) está en el elemento de\(P(X)\) indexado por\(x\) (es decir, no\(x\) está en el imagen de\(x\) debajo de la función). Es fácil demostrar que este subconjunto\(Y\) de no\(X\) está en el rango de la función y, por lo tanto, la función no logra ser una sobreyección sobre\(P(X)\).

    Comprobante. Observamos que la función\(g: X \rightarrow P(X)\) definida por\[g(x)=\{x\}\] es una inyección. En el caso el\(X=\emptyset, g\) es la función vacía es decir, la función cuya gráfica es la\(\emptyset\). (Debe verificar que la función vacía es una inyección.) Por lo tanto,\[|X| \leq|P(X)| \text {. }\]\[f: X \rightarrow P(X)\] vamos a definir\[Y:=\{x \in X \mid x \notin f(x)\} .\] Discusión. Recordemos que para cada uno\(x \in X, f(x)\) es un subconjunto de\(X\). Por lo tanto, tiene sentido considerar si\(x\) es un elemento de\(f(x)\). ¡El sabor autorreferencial de este argumento lo hace desafiante en la primera lectura!

    Claramente,\[Y \subseteq X\] ¿es\(Y \in f[X]\)? Supongamos que lo fuera, así que\(Y=f\left(x_{0}\right)\) para algunos\(x_{0}\) en\(X\). Pero entonces,\(x_{0}\) estaría en\(Y\) iff no\(x_{0}\) estaban en\(f\left(x_{0}\right)=Y\). Esto es imposible, contradiciendo la suposición en la que\(Y\) se encuentra\(f[X]\).

    Podrías intentar reparar\(f\) modificándolo para incluir en su rango el conjunto diagonal que construimos. Al aplicar nuevamente el argumento diagonal, se identificará un nuevo elemento que falta en el rango de la función modificada. De hecho, la mayoría de los elementos del codominio faltan en el rango de la función, aunque esto no es inmediatamente obvio a partir de la prueba.

    Todavía podría estar confundido por el motivo por el que a esto se le llama argumento diagonal. Esto será obvio cuando apliquemos la técnica a secuencias binarias infinitas.

    Si\(X\) es finito el teorema es obvio. En efecto, si hay\(n \in \mathbb{N}\) tal que\(|X|=n\), entonces\(|P(X)|=2^{n}\). El teorema\(6.7\) implica que cualquier conjunto, incluido un conjunto infinito, es estrictamente más pequeño que su conjunto de potencia. De hecho, al iterar las aplicaciones de la función power set to\(\mathbb{N}\), se ve fácilmente que hay infinitamente muchos conjuntos infinitos de cardinalidad distinta en la secuencia de conjuntos\[\langle\mathbb{N}, P(\mathbb{N}), P(P(\mathbb{N})), \ldots\rangle\] (¿Cuál es la cardinalidad de la unión sobre esta secuencia? ¿Cuál es la cardinalidad del conjunto de poder de esa unión?)

    Demostraremos que dos conjuntos más son incontables. Ambos son conjuntos de interés matemático. Primero mostraremos que las secuencias binarias infinitas son incontables. Las secuencias binarias infinitas son funciones de\(\mathbb{N}\) a\(\ulcorner 2\urcorner\). Como veremos, existe una relación muy estrecha entre secuencias binarias infinitas y el conjunto de potencias de\(\mathbb{N}\). De manera más general, la colección de todas las funciones de un conjunto a otro puede ser de interés matemático. Introducimos una notación para tales colecciones.

    NOTACIÓN. \(Y^{X}\)Dejar\(X\) y\(Y\) ser conjuntos. Se escribe el conjunto de todas las funciones con dominio\(X\) y codominio\(Y\)\(Y^{X}\).

    No confundas esto con exponenciación. Sin embargo si\(X\) y\(Y\) son finitos,\[\left|Y^{X}\right|=|Y|^{|X|} .\] El conjunto de todas las funciones de algún conjunto\(X\) en\(\ulcorner 2\urcorner\) está en correspondencia biyectiva con\(P(X)\):

    Proposición 6.8. Dejar\(X\) ser un conjunto, y definir\(F:\ulcorner 2\urcorner X \rightarrow P(X)\) por: para\(\chi \in\ulcorner 2\urcorner X\),\[F(\chi)=\chi^{-1}(1) .\] Eso es\(F(\chi)=\{x \in X \mid \chi(x)=1\}\). Entonces\(F:\ulcorner 2\urcorner^{X} \rightarrow P(X)\) es una biyección.

    PRUEBA. La prueba se deja como ejercicio.

    La existencia de esta biyección nos permite probar fácilmente el siguiente teorema.

    TEOREMA 6.9. El conjunto de secuencias binarias infinitas es biyective con\(P(\mathbb{N})\) y por lo tanto es incontable.

    PRUEBA. Por Proposición\(6.8\)\[\left|\ulcorner 2\urcorner^{\mathbb{N}}\right|=|P(\mathbb{N})| .\] Por Teorema 6.7,\[|\mathbb{N}| \prec|P(\mathbb{N})| .\] Por lo tanto\(\ulcorner 2\urcorner^{\mathbb{N}}\) es incontable.

    Notación. \(2^{\mathbb{N}_{0}}\)Utilizamos\(2^{\mathbb{N}_{0}}\) para la cardinalidad de\(\left\ulcorner 22^{\mathbb{N}}\right.\). Vale la pena ilustrar mediante una aplicación a infinitas secuencias binarias por qué la técnica utilizada para probar el Teorema\(6.7\) se denomina argumento diagonal (a veces llamado el segundo argumento diagonal, para distinguirlo del “primer argumento diagonal” en la Sección 6.4). Vamos\(f: \mathbb{N} \rightarrow\ulcorner 2\urcorner \mathbb{N}\). Demostramos que no\(f\) es una sobreyección por aplicación directa del argumento diagonal en la prueba del Teorema 6.7. Enumeramos todos los elementos en el rango de\(f\); cada uno es una secuencia de 0's y 1's.\ [\ begin {aligned} & f (0) =a_ {00}\ quad a_ {01}\ quad a_ {02}\ quad a_ {03}\ quad\ ldots\ quad a_ {0 j}\ ldots\\ & f (1) =a_ {10}\ aquad _ {11}\ cuádruple a_ {12}\ quad a_ {13}\ cuádruple\ lpuntos \ quad a_ {1 j}\ quad\ ldots\\ & f (2) =a_ {20}\ quad a_ {21}\ quad a_ {22}\ quad a_ {23}\ quad\ ldots\ cuádruple a_ {2 j}\ cuádruple\ lpuntos\\ & f (3) =a_ {30}\ quad a_ {31}\ quad a_ {32}\ a_ {33}\ quad\ ldots\ quad a_ {3 j}\ quad\ ldots \ end {alineado}\] Ahora creamos una secuencia alterando la diagonal elementos de esta matriz infinita. \(s\)Sea la secuencia de elementos diagonales\[\left\langle 1-a_{00}, 1-a_{11}, \ldots, 1-a_{i i}, \ldots\right\rangle .\]imagen\ [\ begin {alineada} & f (1) =a_ {10}\ izquierda\ langle\ izquierda\ langle 1-a_ {11}\ derecha\ rangle\ quad a_ {12}\ quad a_ {13}\ quad\ ldots\ quad a_ {1 i}\ quad\ ldots\ derecha. \\ & f (2) =a_ {20}\ quad a_ {21}\ izquierda\ langle\ begin {array} {lllllll}\ izquierda\ langle 1-a_ {22}\ derecha\ rangle & a_ {23} &\ ldots & a_ {2 i} &\ ldots\ end {array}\ derecha. \\ & f (3) =a_ {30}\ quad a_ {31}\ quad a_ {32}\ izquierda\ langle\ izquierda\ langle 1-a_ {33}\ derecha\ rangle\ cuádruple\ ldots\ quad a_ {3 i}\ quad\ ldots\ derecha. \\ & f (i) =a_ {i 0}\ quad a_ {i 1}\ quad a_ {i 2}\ quad a_ {i 3}\ quad\ ldots,\ izquierda\ langle 1-a_ {i i}\ derecha\ rangle^ {s_ {i}}\ ldots \ end {alineado}\] FIGURA 6.10. El segundo argumento diagonal

    La secuencia\(s\) es un elemento de\(\ulcorner 2\urcorner^{\mathbb{N}}\), y difiere de cada elemento en el rango de\(f\): de hecho,\(s\) difiere de\(f(i)\) en al menos la\(i^{\text {th }}\) ranura. De ahí,\[s \notin f[\mathbb{N}],\] y así no\(f\) es una sobrejección. Lo dejamos como un ejercicio para mostrar que\(s\) es el conjunto diagonal\(Y\) construido en la prueba del Teorema 6.7, donde\(X=\mathbb{N}\). Más precisamente,\(s\) es la imagen de\(Y\) bajo la bijección natural de\(P(\mathbb{N})\) a\(\ulcorner 2\urcorner^{\mathbb{N}}\) de la Proposición 6.8.

    Consideramos otro conjunto de interés matemático, el conjunto de todas las secuencias decimales infinitas. Este conjunto tiene una estrecha relación con el intervalo cerrado\([0,1]\). Comprender esta relación requiere una comprensión más profunda y formal de los números reales de lo que la mayoría de los estudiantes han estado expuestos en el cálculo, y posponemos la discusión detallada de esta relación hasta la Sección 8.9. Con algunas modificaciones, el siguiente teorema demostrará que\([0,1]\) es incontable, y por lo tanto\(\mathbb{R}\) es incontable (ver Sección 8.9).

    TEOREMA 6.11. El conjunto de expansiones decimales infinitas es incontable. De hecho,\[\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .\] DISCUSIÓN. La función de identidad en las secuencias binarias infinitas en las secuencias decimales infinitas es claramente una inyección. Construiremos una inyección de las secuencias decimales infinitas a secuencias binarias infinitas. El teorema seguirá del Teorema de Schröder-Bernstein.

    Prueba. Es obvio que\[\left|\ulcorner 2\urcorner^{\mathbb{N}}\right| \leq\left|\ulcorner 10\urcorner^{\mathbb{N}}\right| .\] (¿Por qué?) Vamos a definir una inyección\[f:\ulcorner 10\urcorner^{\mathbb{N}} \rightarrow\ulcorner 2\urcorner^{\mathbb{N}} .\] Let\(x \in\ulcorner 10\urcorner^{\mathbb{N}}\). Entonces,\[x=\left\langle x_{j} \mid j \in \mathbb{N}\right\rangle\] ¿dónde\(x_{j}\) está el\(j^{t h}\) miembro de la secuencia\(x\) y\[0 \leq x_{j} \leq 9 .\] queremos definir una secuencia binaria\(s(x)\) que “codifica”\(x\). Hay muchas maneras de hacerlo. Una es mirar bloques de 10 bits (abreviatura de “dígitos binarios”), y, en\(j^{\text {th }}\) dicho bloque, tener nueve de los bits 0, y poner un 1 en la\(x_{j}^{\text {th }}\) ranura. Formalmente, dada una secuencia decimal infinita\(x\), definimos una secuencia binaria\[f(x)=\left\langle y_{i} \mid i \in \mathbb{N}\right\rangle\] para que\(y_{i}=1\) si hay\(j \in \mathbb{N}\) tal que\[i=10 j+x_{j} .\] De lo contrario\(y_{i}=0\). Con ello definimos una función\[f:\ulcorner 10\urcorner \rightarrow\ulcorner 2\urcorner .\] Demostramos que\(f\) es una inyección. Dejar\(x\) y\(y\) ser elementos distintos de\(\ulcorner 10\urcorner^{\mathbb{N}}\). Entonces hay algunos\(j \in \mathbb{N}\) tales que\[x_{j} \neq y_{j} .\] Entonces\[10 j+x_{j} \neq 10 j+y_{j} .\] Vamos\(i=10 j+x_{j}\). Entonces\(f(x)\) y\(f(y)\) difieren en el\(i^{\text {th }}\) componente. Es decir,\[(f(x))_{i}=1 \neq 0=(f(y))_{i} .\] Por lo tanto\(f\) es una inyección y\[\left|\ulcorner 10\urcorner^{\mathbb{N}}\right| \preceq\left|\ulcorner 2\urcorner^{\mathbb{N}}\right| .\] Por el Teorema de Schröder-Bernstein, (6.12) y (6.13) rendimiento\[\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .\] Demostramos en Sección\(8.9\) que\[|[0,1]|=\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|,\] esencialmente identificando un real número con su expansión decimal. Si asumimos este resultado, podemos probar fácilmente que los números reales son incontables. COROLARIO 6.14. \(\mathbb{R}\)es incontable.

    Conjuntos Contable

    Los incontables conjuntos que hemos identificado hasta ahora tienen una cierta característica estructural en común. Hemos demostrado que el conjunto de todas las funciones desde un dominio infinito fijo hasta un codominio fijo de al menos dos elementos es incontable. El teorema de Cantor de que el conjunto de poder de un conjunto contable infinito es incontable también se puede interpretar de esta manera. Si\(X\) es un conjunto, entonces se\(P(X)\) puede entender como\(\ulcorner 2\urcorner X\), el conjunto de todas las funciones de\(X\) a\(\ulcorner 2\urcorner\). En el caso de conjuntos finitos,\(X\) y\(Y\), el conjunto de todas las funciones desde\(X\) hasta\(Y, Y^{X}\), tiene cardinalidad\(|Y|^{|X|}\). Es decir, la cardinalidad de\[\{f \subseteq X \times Y \mid f \text { is a function }\}\] es una función exponencial de\(|X|\). Por supuesto, las funciones exponenciales crecen relativamente rápido. Para los conjuntos finitos, la cardinalidad de la unión de conjuntos disjuntos es la suma de las cardinalidades de los conjuntos. La cardinalidad del producto directo de dos conjuntos finitos es producto de las cardinalidades. ¿Qué pasa con la unión o el producto directo de conjuntos infinitos contables? ¿Pueden las operaciones de conjunto de unión y producto directo generar conjuntos incontables a partir de conjuntos contables? Respondemos primero a las preguntas para los sindicatos (adición).

    La siguiente proposición simplificará algunos de los detalles técnicos en los argumentos que siguen.

    PROPOSICIÓN 6.15. Dejar\(X\) y\(Y\) ser conjuntos. Luego hay una sobrejección\(f: X \rightarrow Y\) iff\(|Y| \leq|X| .\)

    Discusión. Utilizaremos los conjuntos de niveles de la sobreyección\(f\) para definir la inyección de\(Y\) a\(X\). Esto utiliza la maquinaria de relaciones de equivalencia desarrollada en el Capítulo 2 con el Axioma de Elección.

    Comprobante. \((\Rightarrow)\)

    Dejar\(X, Y\) y\(f\) ser como en el enunciado de la proposición. \[\widehat{f}: X / f \rightarrow Y\]Sea la biyección canónica asociada a la\(f\) que se definió en la Sección 2.3. Nos preguntamos si hay una inyección\(g: X / f \rightarrow X\) donde\(g([x]) \in[x]\). Recordemos que\(X / f\) es la colección de subconjuntos de niveles de\(X\), con respecto a\(f\), y es una partición de\(X\). ¿Por qué no simplemente elegir un elemento de cada clase de equivalencia y\(g\) definir como la función de\(X / f\) a\(X\) definida por estas elecciones?

    DISCUSIÓN. El Axioma de Elección es la afirmación de que existen tales funciones de “elección”.

    La función\(g\) es claramente una inyección, también lo\[g \circ \widehat{f}^{-1}: Y \rightarrow X\] es una inyección. Por lo tanto si hay una sobrejección\(f: X \rightarrow Y\), entonces\(|Y| \leq|X|\).

    \((\Leftarrow)\)

    La prueba de esta implicación se deja como ejercicio.

    TEOREMA 6.16. Teorema de Cantor\(\left\{X_{n} \mid n \in \mathbb{N}\right\}\) Sea una familia de conjuntos tal que\(X_{n}\) sea contable para todos\(n \in \mathbb{N}\), y\(X=\bigcup_{n \in \mathbb{N}} X_{n}\). Después\[|X| \leq \aleph_{0}\] Discusión. Este Teorema, también debido a G. Cantor, es el resultado clave para demostrar que los conjuntos son contables. Se prueba mediante una técnica también llamada argumento diagonal (a veces llamado el primer argumento diagonal). Usamos el conjunto de índices\(\mathbb{N}\) para construir una matriz infinita, y usamos esa matriz para ilustrar una enumeración de la unión. Esta enumeración es una subyección de\(\mathbb{N}\) a\(X\).

    PRUEBA. Porque\(n \in \mathbb{N}, X_{n}\) es contable y por Proposición\(6.15\) hay una sobrejección\[f_{n}: \mathbb{N} \rightarrow X_{n}\] Usa las funciones\(f_{n}\) para construir una matriz infinita. La\(0^{\text {th }}\) columna contendrá todos los elementos de\(X_{0}\), en el orden\(f_{0}(0), f_{0}(1), f_{0}(2), \ldots\) (No importa si el mismo elemento se enumera varias veces). La siguiente columna tiene los elementos de\(X_{1}\) en el orden\(f_{1}(0), f_{1}(1), f_{1}(2)\), etc. definimos una función\(g: \mathbb{N} \rightarrow X\) atravesando esta matriz a lo largo de las diagonales noreste a suroeste, a saber\(g(0)=f_{0}(0), g(1)=f_{1}(0), g(2)=\)\(f_{0}(1), g(3)=f_{2}(0), g(4)=f_{1}(1), g(5)=f_{0}(2), g(6)=f_{3}(0)\), y así sucesivamente.

    imagen

    FIGURA 6.17. El primer argumento diagonal

    Entonces\(g\) es una sobreyección, porque cada elemento de\(\bigcup X_{n}\) ocurre en la matriz, y por lo tanto está en el rango de\(g\). Por Proposición 6.15,\[|X| \leq \aleph_{0} .\] COROLARIO 6.18. Dejar\(A\) ser un conjunto contable y\(\left\{X_{\alpha} \mid \alpha \in A\right\}\) ser una familia de conjuntos contables indexados por A. Entonces\[\left|\bigcup_{\alpha \in A} X_{\alpha}\right| \leq \aleph_{0} \text {. }\] Prueba. Ya que\(A\) es contable, hay una sobrejección\[f: \mathbb{N} \rightarrow A .\] Por lo tanto\[\bigcup_{\alpha \in A} X_{\alpha}=\bigcup_{n \in \mathbb{N}} X_{f(n)}\] Por el Teorema de Cantor 6.16,\[\left|\bigcup_{\alpha \in A} X_{\alpha}\right| \leq \aleph_{0} .\] COROLARIO 6.19. \(\mathbb{Z}\)es contable.

    Discusión. Sin demasiado esfuerzo, podríamos definir una bijección de\(\mathbb{N}\) a\(\mathbb{Z}\). En cambio probaremos la existencia de la biyección sin definir explícitamente una biyección.

    Comprobante. \(f: \mathbb{N} \rightarrow \mathbb{Z}\)Sea tal que\[f(n)=-n .\] Entonces\(f[\mathbb{N}]\) sea contable. Por el teorema de Cantor\[\mathbb{Z}=\mathbb{N} \cup f[\mathbb{N}]\] es contable.

    Volvemos nuestra atención a los productos directos.

    TEOREMA 6.20. Si\(n \in \mathbb{N}\), y\(X_{1}, X_{2}, \ldots, X_{n}\) son conjuntos contables, entonces\[X_{1} \times X_{2} \times \cdots X_{n}\] es contable.

    Comprobante. Suponemos que todos los factores, no\(X_{1}, \ldots, X_{n}\) están vacíos. Argumentamos por inducción sobre el número de factores.

    Caso base:\(n=2\). \[X_{1} \times X_{2}=\bigcup_{x \in X_{2}} X_{1} \times\{x\}\]Para cada uno\(x \in X_{2}\),\[\left|X_{1}\right|=\left|X_{1} \times\{x\}\right| .\] Por Corolario 6.18,\(X_{1} \times X_{2}\) es contable.

    Paso de inducción: Supongamos que para cualquier colección de conjuntos\(n\) contables\(X_{1}, \ldots X_{n}\), el producto\(X_{1} \times \cdots \times X_{n}\) es contable. Let\(X_{1}, \ldots, X_{n+1}\) Ser conjuntos no vacíos contables. Entonces\[X_{1} \times \cdots \times X_{n+1}=\left(X_{1} \times \cdots \times X_{n}\right) \times X_{n+1}\] Por la hipótesis de inducción,\(X_{1} \times \cdots \times X_{n}\) es contable, y por el caso base el producto directo de dos conjuntos contables es contable. Por lo tanto,\(X_{1} \times \cdots \times X_{n+1}\) es contable.

    COROLARIO 6.21. \(\mathbb{Q}\)es contable.

    Comprobante. Dejar\(f: \mathbb{Z} \times \mathbb{Z} \rightarrow \mathbb{Q}\) ser definido por\ [f (a, b) =\ left\ {\ begin {array} {ccc} a/b &\ text {if} & b\ neq 0\\ 0 &\ text {de lo contrario.} \ end {array}\ right.\] Entonces\(f\) es una sobrejección, y por Proposición\(6.15, \mathbb{Q}\) es contable.

    Hemos evaluado la secuencia anidada de conjuntos,\[\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{R} \text {. }\] Estos son conjuntos matemáticos importantes y, con la excepción de\(\mathbb{R}\), son contables. Investigamos la cardinalidad de un conjunto más entre\(\mathbb{Q}\) y\(\mathbb{R}\).

    DEFINICIÓN. Número real algebraico,\(\mathbb{K}\) Un número real\(\alpha\) es algebraico si hay un polinomio\(p\) (no idénticamente 0) con coeficientes enteros tales que\(p(\alpha)=0\). Vamos a denotar el conjunto de todos los números algebraicos por\(\mathbb{K}\).

    Cualquier número racional\(a / b \in \mathbb{Q}\) es algebraico, ya que\(a / b\) es una raíz del polinomio\[p(x)=b x-a .\] Además, en el Ejemplo 3.23, demostramos que\(\sqrt{2}\) es irracional, y es claramente algebraico, ya que es una raíz de\(x^{2}-2\). Por lo tanto tenemos\[\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{K} \subseteq \mathbb{R} .\] Finalmente lo demostramos\(\mathbb{K} \neq \mathbb{R}\) demostrando que\(\mathbb{K}\) es contable. TEOREMA 6.22. \(\mathbb{K}\)es contable.

    Discusión. Este resultado se demuestra mostrando que los números reales algebraicos pueden ser construidos por un procedimiento contable. Es decir,\(\mathbb{K}\) puede construirse agregando a\(\mathbb{Q}\) contablemente muchos elementos a la vez contabilizadamente muchas veces. El Teorema de Cantor implica que cualquier conjunto así construido será contable.

    PRUEBA. Dejar\(n \in \mathbb{N}\) y definir\(f: \prod_{i=0}^{n} \mathbb{Z} \rightarrow \mathbb{Z}[x]\)\[f\left(a_{0}, \ldots, a_{n}\right)=\sum_{i=0}^{n} a_{i} x^{i} .\] por Por Corolario 6.19,\(\mathbb{Z}\) es contable. Por Teorema 6.20,\(\prod_{i=0}^{n} \mathbb{Z}\) es contable. El rango de\(f\) es el conjunto de polinomios con coeficientes enteros con grado\(\leq n\) (o el polinomio idénticamente igual a 0). Por Proposición\(6.15\), el rango de una función con un dominio contable también es contable. Por lo tanto, el conjunto de polinomios de grado\(\leq n\) es contable.

    Dejar\(P_{n}\) ser el conjunto de polinomios con coeficientes enteros de grado\(\leq n\). Entonces\[\mathbb{Z}[x]=\bigcup_{i=0}^{\infty} P_{n} .\] Por Teorema 6.16,\(\mathbb{Z}[x]\) es contable. Por Teorema 4.10, si\(p(x)\) es un polinomio con coeficientes reales de grado\(n\), tiene a lo sumo raíces\(n\) reales. Let\[Z_{p}=\{\alpha \mid p(\alpha)=0\} .\] So\(Z_{p}\) es finito para cada polinomio\(p\). Aplicar nuevamente el Teorema de Cantor (Teorema 6.16),\[\mathbb{K}=\bigcup_{p \in \mathbb{Z}[x]} Z_{p}\] es contable.

    COROLARIO 6.23. \(\mathbb{K} \neq \mathbb{R}\)

    Dado que\(\mathbb{K}\) es contable y\(\mathbb{R}\) es incontable,\(\mathbb{K}\) es un subconjunto propio de\(\mathbb{R}\). DEFINICIÓN. Número trascendental Un número real que no es algebraico se llama número trascendental.

    Corolario\(6.23\) afirma que hay números trascendentales. Se trata de una pretensión de existencia en la que no se presenta ningún testigo de la demanda. Más bien es un ejemplo de argumento de conteo (sobre conjuntos infinitos). Hay demasiados números reales para que todos sean algebraicos. A finales del siglo XIX se demostró que\(\pi\) y\(e\) son trascendentales, pero estas pruebas son mucho más complicadas que la prueba de existencia de Cantor anterior, que es, en esencia, una aplicación muy inteligente del principio del casillero.

    COROLARIO 6.24. Hay incontables muchos números trascendentales.

    PRUEBA. \(T\)Sea el conjunto de números trascendentales. Como\[|\mathbb{R}|=|T \cup \mathbb{K}|>\aleph_{0},\] y\(\mathbb{K}\) es contable,\(T\) debe ser incontable.

    Por lo que hemos demostrado que\[\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{K} \subsetneq \mathbb{R} .\] Sin embargo,\[|\mathbb{N}|=|\mathbb{Z}|=|\mathbb{Q}|=|\mathbb{K}|<|\mathbb{R}|\]

    Funciones y Computabilidad

    En Sección\(1.3\) hicimos el comentario improvisado de que la mayoría de las funciones no están definidas por reglas (por lo que nos referimos a instrucciones para computar la función). Consideramos que una regla es una instrucción (en algún idioma) de longitud finita. Las funciones que están definidas inequívocamente por una regla de longitud finita se denominan funciones computables o recursivas. Naturalmente existe una definición matemática complicada de funciones recursivas, pero vamos a prescindir de las formalidades y decir que una función es recursiva, o computable, si existe una instrucción (de longitud finita) para encontrar la imagen de cualquier elemento en el dominio. ¿Cuántas funciones computables hay?

    Restringiremos nuestra investigación a funciones desde\(\mathbb{N}\) hasta\(\mathbb{N}\). Consideramos las funciones como gráficas de funciones. Es decir, cada subconjunto de\(P(\mathbb{N} \times \mathbb{N})\) que satisface la definición de una función es una función en\(\mathbb{N}^{\mathbb{N}}\). ¿Todas esas funciones son computables? Es obvio que\[2^{\aleph_{0}} \leq\left|\mathbb{N}^{\mathbb{N}}\right| \text {. }\] (¿Por qué?) De hecho se puede demostrar que los sets son biyectivos. Entonces hay incontables muchas funciones en\(\mathbb{N}^{\mathbb{N}}\). ¿Cuántas instrucciones para las funciones de cómputos hay? Una instrucción es una cadena finita, o secuencia, de símbolos. Por ejemplo, una instrucción para la función que cuadra números naturales es\[f(x)=x^{2} .\] Esta es una secuencia finita de siete símbolos. La instrucción da suficiente información para calcular la imagen de cualquier número natural. Hay muchas otras reglas para computar esta función. Por ejemplo, la regla\[f(x)=x \cdot x\] obviamente define la misma función, pero la instrucción es diferente, contiene un símbolo más. Considere el conjunto de todas las instrucciones posibles para computar funciones de números naturales. ¿Cómo se formulan las instrucciones? Se produce una secuencia finita de símbolos que forma una guía explícita para computar la imagen de cualquier número natural.

    Dejar\(X\) ser el conjunto de todos los símbolos que aparecen en las instrucciones para computar funciones de números naturales. El conjunto\(X\) incluirá letras, dígitos, símbolos para operaciones, símbolos para relaciones y potencialmente cualquier otro símbolo que puedas ver en un libro sobre matemáticas. ¿Qué tan grande es\(X\)? Si requieres que cada símbolo aparezca en algún diccionario real, claramente sería finito. Probablemente desee permitir que aparezca cualquier número natural en la instrucción. Sin embargo, aunque hay infinitamente muchos números naturales, solo necesitamos diez símbolos para nombrarlos a todos. Parece que razonablemente podemos exigir que\(X\) sea finito, pero como resulta, podemos permitir que sea contablemente infinito sin cambiar nuestra conclusión.\(X\)

    Si hay algún lenguaje con muchos símbolos contables en los que se pueda escribir el conjunto de todas las instrucciones para funciones de computación, entonces podemos suponer que\(X\) es contable. Si\(F\) es una instrucción o regla (y por lo tanto una secuencia finita de símbolos de\(X\)), entonces hay\(N \in \mathbb{N}\) tal que\[F \in X^{N} \text {. }\] Así se ve fácilmente que el conjunto de todas las instrucciones posibles para los elementos de\(\mathbb{N}^{\mathbb{N}}, I\), satisface \[I \preceq \bigcup_{N \in \mathbb{N}} X^{N} .\]Porque\(N \in \mathbb{N}, X^{N}\) es el producto directo de\(N\) factores de\(X\), y por Teorema\(6.20\),\[\left|X^{N}\right| \leq \aleph_{0} .\] El conjunto\(\bigcup_{N \in \mathbb{N}} X^{N}\) es la unión contable de conjuntos contables, y por Teorema \(6.16\)es contable. Por lo tanto, son incontables muchas funciones de los números naturales que no están definidas por reglas.

    Para un tratamiento más exhaustivo de la teoría de conjuntos, consulte el libro [5] de Yiannis Moschovakis.

    Ejercicios

    EJERCICIO 6.1. Dejar\(f: X \mapsto Y\) y\(g: Y \mapsto Z\). Demostrar que\[g \circ f: X \rightarrow Z\] es una biyección.

    EJERCICIO 6.2. Demostrar que la equinumerosidad es una relación de equivalencia.

    EJERCICIO 6.3. Demostrar que la relación en los sets\(\preceq\) es reflexiva y transitiva. EJERCICIO 6.4. En la prueba del Teorema de Schröder-Bernstein, defina una función\ [G (x) =\ left\ {\ begin {array} {clc} g^ {-1} (x) &\ text {if} & x\ in X_ {i}\\ f (x) &\ text {if} & x\ in X_ {e}\\ g^ {-1} (x) &\ text {if} & X_ {o} \ end {array}\ right.\] Demostrar que \(G: X \mapsto Y\).

    EJERCICIO 6.5. Vamos\(n \in \mathbb{N}\). Demuestra que\[|P(\ulcorner n\urcorner)|=2^{n} .\] EJERCICIO 6.6. Vamos\(X=\{0,1,2\}\). Anota alguna función\(f\):\(X \rightarrow P(X)\). Para este particular\(f\), ¿cuál es el conjunto\(Y\) del Teorema 6.7?

    EJERCICIO 6.7. Dejar\(X\) ser un conjunto y definir una secuencia de conjuntos\(\left\langle X_{n} \mid n \in \mathbb{N}\right\rangle\) por\[X_{0}=X\] y\[X_{n+1}=P\left(X_{n}\right) .\] Let\(Y=\bigcup_{n=0}^{\infty} X_{n}\). Prueba\[(\forall n \in \mathbb{N})\left|X_{n}\right|<|Y| .\] EJERCICIO 6.8. Dejar\(X\) y\(Y\) ser conjuntos finitos. Probar que\[\left|X^{Y}\right|=|X|^{|Y|} \text {. }\] EJERCICIO 6.9. Demostrar Proposición 6.8.

    EJERCICIO 6.10. Let\(f: \mathbb{N} \rightarrow\ulcorner 2\urcorner^{\mathbb{N}}\) y para\(i, j \in N^{+}\)\[a_{i j}=(f(i))_{j} .\] (Es decir,\(a_{i j}\) es el\(j^{t h}\) término de la\(i^{t h}\) secuencia.) Déjese\(s\) ser la secuencia “diagonal” Eso lo\[s=\left\langle 1-a_{n n} \mid n \in N^{+}\right\rangle .\] sabemos\(s \notin f[\mathbb{N}]\). Si\(F:\ulcorner 2\urcorner^{\mathbb{N}} \mapsto P(\mathbb{N})\) es la biyección en la Proposición 6.8, entonces\(F \circ f: \mathbb{N} \rightarrow P(\mathbb{N})\). Demostrar que ese\(F(s)\) es el conjunto “diagonal” de Teorema\(6.7\) (donde\(X=\mathbb{N}\), y\(F \circ f\) es la enumeración de subconjuntos de\(\mathbb{N})\), y por lo tanto eso\(F(s) \notin(F \circ f)[\mathbb{N}]\). EJERCICIO 6.11. Demostrar que si\(X \subseteq Y\) y\(X\) es incontable, entonces\(Y\) es incontable.

    EJERCICIO 6.12. Dejar\(X\) ser un conjunto incontable,\(Y\) ser un conjunto contable y\(f: X \rightarrow Y\). Demostrar que algún elemento de\(Y\) tiene una preimagen incontable.

    EJERCICIO 6.13. Completar el comprobante de la Proposición 6.15.

    EJERCICIO 6.14. Definir una bijección explícita de\(\mathbb{N}\) a\(\mathbb{Z}\).

    EJERCICIO 6.15. \(|\mathbb{K} \backslash \mathbb{Q}|=\aleph_{0}\)Demuéstralo.

    EJERCICIO 6.16. Demostrar que\[e=\sum_{n=0}^{\infty} \frac{1}{n !}\] es irracional. (Pista: Argumenta por contradicción. ¡Asumir\(e=\frac{p}{q}\) y multiplicar ambos lados por\(q\)!. Reorganice la ecuación para obtener un entero igual a una suma infinita de números racionales que converja a un número en el intervalo abierto)\((0,1)\).

    Comentario: Esto también fue el Ejercicio 3.32. ¿Ahora es más fácil?

    EJERCICIO 6.17. Supongamos que\(a, b, c, d \in \mathbb{R}, a<b\) y\(c<d\). Demostrar

    a) El intervalo abierto\((a, b)\) es biyectiva con el intervalo abierto\((c, d)\).

    b) El intervalo cerrado\([a, b]\) es biyectiva con el intervalo cerrado\([c, d]\).

    c) El intervalo abierto\((0,1)\) es biyectiva con el intervalo cerrado\([0,1]\).

    d) El intervalo abierto\((a, b)\) es biyectiva con el intervalo cerrado\([c, d]\).

    e)\(|[0,1]|=|\mathbb{R}|\).

    EJERCICIO 6.18. Construir bijecciones explícitas para cada uno de los pares de conjuntos en el Ejercicio 6.17.

    EJERCICIO 6.19. \(f(x)\)Sea un polinomio distinto de cero con coeficientes enteros, y supongamos que\(\alpha \in \mathbb{R}\) es trascendental. Demostrar que\(f(\alpha)\) es trascendental. EJERCICIO 6.20. \(F: \mathbb{K} \rightarrow \mathbb{R}\)Sea definido por: Si\(x \in \mathbb{K}, F(x)\) es el grado más bajo de un polinomio con coeficientes enteros para el cual\(x\) es una raíz. ¿Está\(F\) bien definido?

    EJERCICIO\(6.21\). Dejar\(a \in \mathbb{R}\) ser una raíz de un polinomio con coeficientes racionales. Demostrar que\(a\) es una raíz de un polinomio con coeficientes enteros, y por lo tanto es un número algebraico.

    EJERCICIO 6.22. Para cada uno de los siguientes conjuntos, indique y pruebe si es biyectiva con\(\mathbb{N}, P(\mathbb{N})\) o es mayor que\(P(\mathbb{N})\) (con respecto a la relación\(\prec\)):

    a) El conjunto de subconjuntos finitos de\(\mathbb{N}\)

    b) El conjunto de todas las permutaciones de conjuntos finitos de números naturales

    c) El conjunto de secuencias finitas de números naturales

    d) El conjunto de secuencias finitas de números enteros

    e) El conjunto de secuencias finitas de números algebraicos

    f) El conjunto de secuencias finitas de números reales

    g) El conjunto de secuencias infinitas de números naturales

    h) El conjunto de secuencias infinitas de números reales

    i) Subconjuntos contables de\(\mathbb{R}\).

    h)\(\mathbb{N}^{\mathbb{R}}\)

    k)\(\mathbb{R}^{\mathbb{R}}\).

    Puedes usar el hecho de que\(|\mathbb{R}|=2^{\aleph_{0}}\).

    EJERCICIO 6.23. \(\left|\mathbb{R}^{\mathbb{R}}\right| \geq|P(\mathbb{R})|\)Demuéstralo.

    CAPÍTULO 7

    Divisibilidad

    En este capítulo investigamos la divisibilidad. Puede parecer peculiar que investiguemos un tema que has estudiado desde la primaria, pero no te dejes engañar por la aparente sencillez del tema. El estudio de la divisibilidad de los números enteros forma parte de la teoría de números. La geometría y la teoría de números son las áreas más antiguas del estudio matemático, y siguen siendo campos activos de la investigación matemática.

    Teorema fundamental de la aritmética

    DEFINICIÓN. Divide, factor Let\(a, b \in \mathbb{Z}\). Decimos que\(a\) divide\(b\), o\(a\) es un factor de\(b\), si\[(\exists c \in \mathbb{Z}) a \cdot c=b .\] Escribimos esto como\(a \mid b\). Si\(a\) no divide\(b\) escribimos\(a \nmid b\).

    La divisibilidad es la idea central de la teoría de números. Es precisamente porque un entero no necesita ser un factor de otro entero, o un par de enteros puede no tener factores comunes no triviales, que la divisibilidad proporciona una visión de la estructura de los enteros. Dicho de otra manera, considere la definición de divisibilidad aplicada a los números racionales; encontrará que no proporciona ninguna idea en absoluto ya que un número racional distinto de cero es un factor de cualquier otro número racional. Además, muchas de las propiedades de los enteros con respecto a la divisibilidad generalizan muchas de las propiedades de los enteros con respecto a la divisibilidad generalizan de esta en la Sección 7.5.

    DEFINICIÓN. Número primo Let\(p \in \mathbb{N}\). Decimos que\(p\) es un número primo si\(p>1\) y los únicos factores positivos de\(p\) son\(p\) y 1. DEFINICIÓN. Relativamente prime Let\(a, b \in \mathbb{Z}\). Eso decimos\(a\) y\(b\) son relativamente primos si no tienen un factor común mayor a 1.

    DEFINICIÓN. Combinación entera Let\(a, b, c \in \mathbb{Z}\). Entonces\(c\) es una combinación entera de\(a\) y\(b\) si\[(\exists m, n \in \mathbb{Z}) c=m a+n b .\] PROPOSICIÓN 7.1. Vamos\(a, b \in \mathbb{Z}\). Si\(a\) y\(b\) son relativamente primos, entonces\(a-b\) y\(b\) son relativamente primos.

    Discusión. Demostraremos lo contrapositivo demostrando que cualquier factor común de\(a-b\) y también\(b\) es un factor de\(a\).

    Prueba. Dejar\(c>1\) ser un factor común de\(b\) y\(a-b\). Entonces\[(\exists m \in \mathbb{Z}) b=c m\] y\[(\exists n \in \mathbb{Z}) a-b=c n .\] Entonces\[c(m+n)=a\] y así\(c \mid a\). Por lo tanto si\(a\) y\(b\) son relativamente primos, entonces\(a-b\) y\(b\) son relativamente primos.

    PROPOSICIÓN 7.2. Dejar\(a\) y\(b\) ser enteros. Si\(a\) y\(b\) son relativamente primos, entonces\[(\exists m, n \in \mathbb{Z}) m a+n b=1 .\] Discusión. Argumentaremos a favor del caso en el que\(a\) y\(b\) son números naturales. Dada la propuesta para todos los pares de números naturales relativamente primos, podemos extenderla fácilmente a pares arbitrarios de números enteros relativamente primos cambiando el signo de\(m\) o\(n\) en la combinación de enteros. Esta suposición nos permite argumentar por inducción sobre la suma de los enteros. El argumento base para este argumento por inducción será\(a+b=3\). Si\(a=0=b\), entonces\(a\) y no\(b\) son relativamente primos. Si\(a+b=1\), entonces\(a\) y\(b\) son relativamente primos y la elección de\(m\) y\(n\) es obvia. Si\(a=b=1\) entonces\(a\) y\(b\) son relativamente primos y nuevamente la elección de\(m\) y\(n\) es obvia.

    Comprobante. Eso podemos suponer\(a>b>0\). Argumentamos por inducción sobre\(a+b\).

    Caso base:\(a+b=3\).

    Entonces\(a=2\) y\(b=1\). Entonces paso\[a-b=1 .\] de inducción:

    Supongamos que el resultado se mantiene para todos los pares de números naturales relativamente primos con suma menor que\(a+b\).

    Por la Proposición 7.1,\(b\) y\(a-b\) son relativamente primos. Por la hipótesis de inducción, hay\(i, j \in \mathbb{Z}\) tales que\[i(a-b)+j b=1 .\] Discusión. Si\(a-b=b\), no estamos en el caso donde tenemos dos números positivos distintos. ¿Cómo manejamos esta posibilidad?

    Dejar\(m=i\) y\(n=j-i\). Entonces\[m a+n b=1 .\] Por el principio de inducción el resultado se mantiene para todos los pares relativamente primos de números naturales.

    DEFINICIÓN. Mayor divisor común,\(\operatorname{gcd}(a, b)\) Let\(a, b \in \mathbb{Z}\). El mayor divisor común de\(a\) y\(b\), escrito\(\operatorname{gcd}(a, b)\), es el entero más grande que divide ambos\(a\) y\(b\).

    Entonces\(a\) y\(b\) son relativamente primos iff\(\operatorname{gcd}(a, b)=1\).

    Proposición 7.3. Vamos\(a, b, c \in \mathbb{Z}\), y asumamos eso\(\operatorname{gcd}(a, b)=1\). Si\(a \mid c b\), entonces\(a \mid c\).

    PRUEBA. Por Proposición\(7.2\) hay\(m, n \in \mathbb{Z}\) tales que\[m a+n b=1 .\] Por lo tanto\[c m a+c n b=c .\] Claramente\(a \mid c n b(\) desde\(a \mid c b)\) y\(a \mid c m a\). Entonces\[a \mid(c m a+c n b)\] y por lo tanto\(a \mid c\).

    PROPOSICIÓN 7.4. Deje\(a, b, c \in \mathbb{Z} .\) Si\(\operatorname{gcd}(a, b)=1, a \mid c\) y\(b \mid c\), luego\[a b \mid c\] PRUEBA. Que\(m, n \in \mathbb{Z}\) sean tales que\(a m=c\) y\(b n=c\). Entonces\[a \mid b n\] Por Proposición\(7.3, a \mid n\). De ahí que haya\(k \in \mathbb{Z}\) tal que\[a k=n\] Therefore\[a k b=c\] y\[a b \mid c\] LEMMA 7.5. Supongamos que
    (1)\(p \in \mathbb{N}\) es primo
    (2)\(N \geq 1\) y\(a_{1}, \ldots, a_{N} \in \mathbb{Z}\)
    (3)\(p \mid\left(\prod_{n=1}^{N} a_{n}\right)\).

    Entonces hay algunos\(n \leq N\) tales que\(p \mid a_{n}\).

    Comprobante. Dejar\(p\) ser un número primo. Argumentamos por inducción sobre\(N\).

    Caso base:\(N=1\)

    El caso base es obvio.

    Paso de inducción:

    Vamos\(N>1\) y supongamos que el resultado se mantiene para todos los productos de menos que\(N\) factores.

    Vamos\[a=\prod_{n=1}^{N-1} a_{n}\] y supongamos que\[p \mid\left(\prod_{n=1}^{N} a_{n}\right) .\] Entonces\[p \mid a \cdot a_{N} .\] Si\(p \mid a\), entonces por la hipótesis de inducción,\[(\exists n<N) p \mid a_{n} .\] Supongamos que no\(p\) es un factor de\(a\); ya que\(p\) es primo, \(\operatorname{gcd}(p, a)=1\). Por la Proposición 7.3,\(p \mid a_{N}\).

    TEOREMA 7.6. Teorema Fundamental de la Aritmética Let\(N\) Ser un número natural mayor a 1. Entonces\(N\) puede expresarse de manera única como el producto de números primos (hasta el orden de los factores).

    DISCUSIÓN. Permitimos un “producto” con un solo factor. Así que cualquier número primo es su propio factoring primo único.

    PRUEBA. Argumentamos por inducción sobre los números naturales mayores que\(1 .\)

    Caso base:\((N=2)\)

    Por la discusión que precede a la prueba, 2 es su propio factoring principal.

    Paso de inducción:

    Supongamos que el resultado se mantiene para todos los números naturales mayores que 1 y menores que\(N\). Si\(N\) es primo, el resultado sigue. Si no\(N\) es primo, entonces hay\(a, b \in \mathbb{N}, a<N\) y\(b<N\), tal que\[a \cdot b=N \text {. }\] Por la hipótesis de inducción,\(a\) y\(b\) tienen factorizaciones primos únicas. El producto de los factorings será un factoraje principal de\(N\). ¿El factoring es único a la orden? Supongamos que\[N=\prod_{i=1}^{m} p_{i}=\prod_{j=1}^{n} q_{j}\] donde\(p_{i}\) es primo para\(1 \leq i \leq m\), y\(q_{j}\) es primo para\(1 \leq j \leq n\). Entonces\[p_{1} \mid \prod_{j=1}^{n} q_{j} .\] Por Lema 7.5,\[(\exists j \leq n) p_{1} \mid q_{j} .\] Podemos reordenar los factores\(q_{1}, \ldots, q_{n}\) para que\(p_{1} \mid q_{1}\). Ambos\(p_{1}\) y\(q_{1}\) son primos, por lo\[p_{1}=q_{1} .\] tanto\[\prod_{i=2}^{m} p_{i}=\prod_{j=2}^{n} q_{j}<N .\] Por lo tanto Por la hipótesis de inducción,\(p_{2}, \ldots, p_{m}\) es un factor primo único de\(\prod_{i=2}^{m} p_{i}\), así\(m=n\) y\(q_{2}, \ldots, q_{n}\) es un reordenamiento de\(p_{2}, \ldots, p_{m}\). Por lo tanto,\(q_{1} \cdots q_{n}\) es un reordenamiento de\(p_{1} \cdots p_{m}\) y el factoring principal de\(N\) es único.

    OBSERVACIÓN. ¿Por qué el número 1 no se define como primo? Después de todo, ¡no tiene otros factores que él mismo o 1! La razón es porque es muy útil tener singularidad en el Teorema Fundamental de la Aritmética. Si 1 se considerara prime, podría incluirse arbitrariamente a menudo en la factorización de\(N\).

    El algoritmo de división

    El Algoritmo de División, Teorema 7.11, es el resultado que garantiza que la división larga de los números naturales terminará en un cociente único y restará con el resto estrictamente más pequeño que el divisor. La división larga es difícil y tediosa para los jóvenes estudiantes. Por lo general, es el cálculo más desafiante que se espera que dominen los estudiantes de primaria. Es posible que hayas vuelto a visitar el algoritmo cuando aprendiste a dividir polinomios. Aquí el Algoritmo de División dice que el cociente y el resto son únicos y el resto es idéntico 0 o tiene grado estrictamente menor que el divisor. Frecuentemente comparamos la aritmética de enteros y la aritmética de polinomios, y es el Algoritmo de División el que hace útil esta comparación.

    Extendamos el vínculo entre las combinaciones de enteros y los mayores divisores comunes. Según Lemma 7.2, un par de enteros son relativamente primos si hay una combinación entera del par que es igual a 1. Este resultado generaliza a los mayores divisores comunes distintos de\(1 .\)

    TEOREMA 7.7. Vamos\(a, b \in \mathbb{Z}\). El conjunto de combinaciones enteras de a y\(b\) es igual al conjunto de múltiplos enteros de\(\operatorname{gcd}(a, b)\).

    Prueba. Let\(c=\operatorname{gcd}(a, b)\) y\[M=\{k c \mid k \in \mathbb{Z}\} .\] Desde\(c\) es un divisor de\(a\) y\(b\), hay\(i, j \in \mathbb{Z}\) tal que\[a=i c\] y\[b=j c .\] Let\[I=\{m a+n b \mid m, n \in \mathbb{Z}\} .\] Mostramos primero que \(I \subseteq M\).

    Si\(m, n \in \mathbb{Z}\), entonces\[m a+n b=m i c+n j c=(m i+n j) c .\] De ahí cada combinación entera de\(a\) y\(b\) es un múltiplo de\(c\) y\[I \subseteq M .\] Ahora lo mostramos\(M \subseteq I\). Dejar\(k c \in M\) y\[r=\operatorname{gcd}(i, j) .\] Entonces hay\(m, n \in \mathbb{Z}\) tales que\[r m c=i c=a\] y\[r n c=j c=b .\] Así\(r c \mid a\) y\(r c \mid b\). De ahí\[\operatorname{gcd}(a, b) \geq r c \geq c .\] Sin embargo\(\operatorname{gcd}(a, b)=c\), y así\(r=1\). Por lo tanto\(i\) y\(j\) son relativamente primos.

    Por la Proposición 7.2, hay una combinación entera de\(i\) y\(j\) que es igual a 1. Que\(u, v \in \mathbb{Z}\) sean tales que\[u i+v j=1 .\] Entonces\[c(u i+v j)=c\] y\[k c=k c(u i+v j)=k(u a+v b)\] por ecuaciones\(7.14\) y\(7.15\). De ahí\[k c \in I,\] y como\(k\) fue arbitrario,\[M \subseteq I .\] COROLARIO 7.8. Vamos\(a, b \in \mathbb{Z}\). Entonces\(\operatorname{gcd}(a, b)\) es la combinación entera positiva más pequeña de\(a\) y\(b\).

    El teorema nos\(7.7\) dice que las combinaciones enteras de\(a\) y\(b\) son precisamente los múltiplos enteros de\(\operatorname{gcd}(a, b)\) (que resulta ser la combinación entera positiva más pequeña de\(a\) y\(b)\). Pensamos en\(\operatorname{gcd}(a, b)\) como “generar” a través de la multiplicación el conjunto de combinaciones enteras de\(a\) y\(b\). PROPOSICIÓN 7.9. Vamos\(a, b, k \in \mathbb{Z}\). Después\[\operatorname{gcd}(a, b)=\operatorname{gcd}(a-k b, b) .\] Prueba. Si\(c \in \mathbb{Z}, c \mid a\) y\(c \mid b\), entonces\(c \mid a-k b\). Por lo tanto\[\operatorname{gcd}(a, b) \leq \operatorname{gcd}(a-k b, b) .\] Del mismo modo\(c \mid b\), si\(c \mid a-k b\) y\(c \mid a\), entonces, así obtenemos la desigualdad inversa de (7.10), por lo que los dos lados son iguales.

    TEOREMA 7.11. Algoritmo de división Let\(a, b \in \mathbb{Z}, b \neq 0\) Entonces hay únicos de\(q, r \in \mathbb{Z}\) tal manera que\[a=q b+r\] donde\(0 \leq r<|b|\).

    Discusión. En el Algoritmo de División\(a\) se llama dividendo,\(q\) divisor, cociente y\(r\) resto.\(b\)

    Comprobante. Dejar\(a, b \in \mathbb{Z}\) y\(b \neq 0\). Definir\(I \subseteq \mathbb{N}\) por\[I=\{a-k b \mid k \in \mathbb{Z}\} \cap \mathbb{N} .\]\(I\) tiene un elemento más pequeño\(a-q b\),, para algunos\(q \in \mathbb{Z}\).

    Reclamación:\(0 \leq a-q b<|b|\).

    Prueba de Reclamación. Argumentamos por casos.

    Caso 1:\(b>0\)

    Si\(a-q b \geq b\) entonces\[a-(q+1) b \geq 0 .\] De ahí\[a-(q+1) b \in I .\] Sin embargo\(a-q b\) es mínimo en\(I\), entonces esto es imposible. Por lo tanto\[a-q b<|b| \text {. }\] Caso 2:\(b<0\)

    Si\(a-q b \geq|b|\), entonces\[a-q b>a-(q-1) b \geq 0 .\] Como en el primer caso\[a-(q-1) b \in I\] Esto es imposible ya que por suposición\(a-q b\) es mínima en\(I\). Por\[a-q b<|b|\] lo tanto, si\[r:=a-q b\] tenemos\(a=q b+r\) y\(0 \leq r<|b|\). Queda por demostrar que el cociente y el resto son únicos. Supongamos\[a=m b+r=n b+s\] dónde\(0 \leq r, s<|b|\). Si\(r=s\) entonces\(m b=n b\) y\(m=n\). Entonces asumimos eso\(r \neq s\). Sin pérdida de generalidad asumimos eso\(r<s\). Entonces,\[0 \leq s-r=(m-n) b<|b|\] Entonces\(m-n=0\) y\(r=s\), una contradicción.

    Por supuesto,\(q\) y\(r\) podría encontrarse por división larga -es decir, se pueden restar múltiplos de\(b\) hasta que el resto sea menor que\(|b|\).

    Algoritmo euclidiano

    ¿Cómo encontramos\(\operatorname{gcd}(a, b)\), para\(a, b \in \mathbb{N}\)? Uno podría invocar el Teorema Fundamental de la Aritmética y comparar las descomposiciones principales de\(a\) y\(b\). Supongamos\[a=\prod_{n=1}^{N} p_{n}^{r_{n}}\] y\[b=\prod_{n=1}^{N} p_{n}^{s_{n}}\] donde\(r_{n}, s_{n} \in \mathbb{N}\) para\(1 \leq n \leq N\). Si es\(t_{n}=\min \left(r_{n}, s_{n}\right)\) por\(1 \leq n \leq N\), entonces\[\operatorname{gcd}(a, b)=\prod_{n=1}^{N} p_{n}^{t_{n}}\] Sin embargo encontrar la descomposición prima de un entero puede ser bastante difícil. Definiremos una operación sobre pares de enteros que después de un número razonable de aplicaciones producirá el mayor divisor común de los enteros.

    Si\(a, b \in \mathbb{N}, a>b>0\), defina\(E: \mathbb{N}^{2} \rightarrow \mathbb{N}^{2}\) por\[E(a, b)=(b, r)\] dónde\(r\) está el resto único (al dividirlo\(a\) por\(b\)) cuya existencia se comprobó en el Algoritmo de División. Es decir, si\[a=q b+r\] con\(0 \leq r<b\), entonces defina\[E(a, b):=(b, r) .\] Si\(b=0\), entonces\[E(a, 0)=(a, 0) .\] vamos Let\((a, b) \in \mathbb{N}^{2}, a>b>0\). Definimos una secuencia de elementos en\(\mathbb{N}^{2}\),\(\left\langle E_{i}(a, b) \mid i \in \mathbb{N}\right\rangle\), por recursión:\[E_{0}(a, b)=(a, b)\] y si Mientras\(n>0\)\[E_{n}(a, b)=E\left(E_{n-1}(a, b)\right) .\]\(E_{n}(a, b)\) tenga componentes distintos de cero, la secuencia de segundos componentes es estrictamente decreciente, por lo que es claro que la secuencia debe eventualmente fijarse en un par ordenado (ver Ejercicio 4.11). Por el Algoritmo de División, esto ocurrirá cuando el segundo componente sea igual a 0. Dejar\(k\) ser el entero más pequeño tal que\[E_{k}(a, b)=E_{k+1}(a, b) .\] Entonces decimos que se\(\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\) estabiliza al paso\(k\). Para\(n \geq k\),\[E_{n}(a, b)=E_{n+1}(a, b)=E_{k}(a, b) .\] Si\(\left\langle E_{n}(a, b)\right\rangle\) se estabiliza al paso\(k\), es obvio que\(k \leq b\). Por lo general, la secuencia se estabiliza mucho más rápido que esto. TEOREMA 7.12. Vamos\(a, b \in \mathbb{N}, a>b>0\). El componente distinto de cero sobre el que se\[\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\] estabiliza la secuencia es\(\operatorname{gcd}(a, b)\).

    Comprobante. \(a\)Déjese fijar, argumentamos por inducción sobre el menor de los enteros,\(b\).

    Caso base:\(b=1\)

    Luego para cualquiera\(a>1\),\[E(a, 1)=(1,0)\] y la secuencia se\(\left\langle E_{n}(a, 1)\right\rangle\) estabiliza en el paso 1 con componente distinto de cero\(1 .\)

    Paso de inducción:

    Vamos\(b>1\). Supongamos que el resultado se mantiene para todos\(c<b\), es decir, para cualquier\((a, c) \in \mathbb{R}^{2}\)\(c<b<a\), donde, es el componente distinto de cero del par ordenado en el que se\(\left\langle E_{n}(a, c)\right\rangle\) estabiliza la secuencia\(\operatorname{gcd}(a, c)\). Mostramos que el componente distinto de cero del par ordenado en el que se\(\left\langle E_{n}(a, b)\right\rangle\) estabiliza la secuencia es\(\operatorname{gcd}(a, b)\). Si\(a>b>0\) entonces\[E(a, b)=(b, a-q b)\] donde\(0 \leq a-q b<b\). Por la hipótesis de inducción, el componente distinto de cero del par ordenado en el que se\(\left\langle E_{n}(b, a-q b)\right|\)\(n \in \mathbb{N}\rangle\) estabiliza la secuencia es\(\operatorname{gcd}(b, a-q b)\). Por Proposición\(7.9\)\[\operatorname{gcd}(a, b)=\operatorname{gcd}(b, a-q b) .\] Entonces el componente distinto de cero del par ordenado en el que se\[\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\] estabiliza la secuencia es\(\operatorname{gcd}(a, b)\). Por el principio de inducción, el resultado se mantiene para todos los pares ordenados\((a, b) \in \mathbb{N}^{2}\) donde\(a>b>0\).

    Un algoritmo es un conjunto de instrucciones computacionales ejecutables. El algoritmo euclidiano es el siguiente conjunto de instrucciones:

    Dado un par de números naturales,\(a>b>0\), computar la secuencia\(\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle\) hasta que la secuencia se estabilice. El componente distinto de cero del par ordenado sobre el que se estabiliza la secuencia es\(\operatorname{gcd}(a, b)\).

    EJEMPLO 7.13. Dejar\(a=29712375\) y\(b=119119\). Encuentra el\(\operatorname{gcd}(a, b)\). Utilizamos el Algoritmo Euclidiana. Así\ [\ comenzar {reunido} E_ {0} (a, b) = (a, b)\\ E_ {1} (a, b) =E (a, b) =( b, 51744)\\ E_ {2} (a, b) =E (b, 51744) =( 51744,4851)\\ E_ {3} (a, b) =E (51744,4851) =( 4851,1078)\\ E_ {4} (a, b) =E (4851,1078) =( 1078,539)\\ E_ {5} (a, b) =E (1078,539) =( 539,0). \ end {reunido}\] Por lo tanto\(\operatorname{gcd}(a, b)=539\). Si empleas el Teorema Fundamental de la Aritmética, con algún trabajo puedes determinar\[119,119=\left(7^{2}\right)(11)(13)(17) .\] eso\[29,712,375=\left(3^{2}\right)\left(5^{3}\right)\left(7^{4}\right)(11)\] y So\(\operatorname{gcd}(a, b)=\left(7^{2}\right)(11)=539\).

    El pequeño teorema de Fermat

    Notación. \(\mathbb{Z}_{n}^{*}\)Vamos\(n \in \mathbb{N}, n \geq 2\). Después\[\mathbb{Z}_{n}^{*}=\mathbb{Z}_{n} \backslash\{[0]\} .\] LEMA 7.14. Que\(a, n \in \mathbb{Z}, n \geq 2\), sea tal que\(\operatorname{gcd}(a, n)=1\). Definir\(\phi_{a}: \mathbb{Z}_{n}^{*} \rightarrow \mathbb{Z}_{n}^{*}\) por\[\phi_{a}([b])=[a b] .\] Entonces\(\phi_{a}\) es una permutación de\(\mathbb{Z}_{n}^{*}\). Comprobante. Mostramos que\([a],[2 a], \ldots,[(n-1) a]\) son elementos distintos de\(\mathbb{Z}_{n}^{*}\). Dejemos\(0<i \leq j<n\) y supongamos eso\(i a \equiv j a \bmod n\). Entonces\[n \mid j a-i a\] y\[n \mid(j-i) a .\] asumimos eso\(\operatorname{gcd}(n, a)=1\), así por Proposición\(7.3, n \mid(j-i)\). Sin embargo\(0 \leq j-i<n\), así\(j-i=0\) y\(i=j\). De ahí, si\(0<i<j<n\), De\[[i a] \neq[j a] .\] ello se deduce que\(\phi_{a}\) es una inyección de\(\mathbb{Z}_{n}^{*}\) a\(\mathbb{Z}_{n}^{*}\). Cualquier inyección de un conjunto finito a sí mismo es una sobreyección, así\(\phi_{a}\) es una permutación de\(\mathbb{Z}_{n}^{*}\).

    DEFINICIÓN. Orden,\(o_{p}(a)\) Let\(p\) Ser un número primo y\(a \in \mathbb{Z}\) no un múltiplo de\(p\). El orden de\(a\) in\(\mathbb{Z}_{p}\) es el menos\(k \in \mathbb{N}^{+}\) tal que\(a^{k} \equiv 1 \bmod p\). Escribimos el orden de\(a\) en\(\mathbb{Z}_{p}\) como\(o_{p}(a)\).

    Si\(a\) es un múltiplo de\(p\), entonces el orden de\(a\) in\(\mathbb{Z}_{p}\) es indefinido, ya que\(a \equiv 0 \bmod p\), y para todos\(k \in \mathbb{N}^{+}\),\[a^{k} \equiv 0 \quad \bmod p .\] La siguiente proposición muestra en particular que si \(a\)no es un múltiplo de\(p\), entonces el orden está bien definido (es decir, que hay algunos\(k\) con\(a^{k} \equiv 1\)\(\bmod p)\).

    PROPOSICIÓN 7.15. Dejar\(a \in \mathbb{Z}\), y\(p\) ser un número primo tal que\(p \nmid a\). Entonces\(o_{p}(a)<p\).

    Comprobante. Dejar\(p\) ser un número primo y\(a \in \mathbb{Z}\) ser tal que no\(a\) sea un múltiplo de\(p\). Por Lema 7.5, como\(p \nmid a\), entonces\(p \nmid a^{n}\), y por lo tanto\(\left[a^{n}\right] \in \mathbb{Z}_{p}^{*}\) para cualquier\(n \in \mathbb{N}\). Ya que\(\left|\mathbb{Z}_{p}^{*}\right|=p-1\), la secuencia finita\[\left\langle\left[a^{n}\right] \mid 1 \leq n \leq p\right\rangle\] debe tener una repetición. \(1 \leq n<k \leq p\)Sea tal que\[a^{n} \equiv a^{k} \quad \bmod p .\] Entonces\[p \mid a^{k}-a^{n} .\] De ahí\[p \mid a^{n}\left(a^{k-n}-1\right) .\] Sin embargo\(p \nmid a^{n}\) y así por la Proposición 7.3,\[p \mid a^{k-n}-1 .\] Así\[a^{k-n} \equiv 1 \quad \bmod p .\] Por tanto\[o_{p}(a) \leq k-n<p .\] la Proposición 7.16. Dejar\(a \in \mathbb{Z}\) y\(p\) ser un número primo tal que no\(a\) sea un múltiplo de\(p\). Entonces las clases restantes\([1],[a],\left[a^{2}\right], \ldots,\left[a^{o_{p}(a)-1}\right]\) en\(\mathbb{Z}_{p}\) son distintas.

    PRUEBA. Ejercicio.

    NOTACIÓN. \(S_{a}(n)\)Arreglar un primo\(p\) para el resto de esta sección. Dejar a ser un entero tal que\(p \nmid a\). Entonces para cualquier número natural positivo\(n\), dejamos\(S_{a}(n)\) denotar el conjunto de clases de equivalencia\(\left\{\left[n \cdot a^{k}\right] \mid k \in \mathbb{N}\right\}\) en\(\mathbb{Z}_{p}\). (Aunque\(S_{a}(n)\) depende de la elección de\(p\), suprimimos esto en la notación y asumimos que\(p\) se entiende).

    LEMA 7.17. Que\(a \in \mathbb{Z}\) sea tal que\(p \nmid a\). Si no\(n \in \mathbb{N}^{+}\) es múltiplo de\(p\), entonces\[\left|S_{a}(n)\right|=o_{p}(a) .\] Prueba. Por Proposición 7.15,\(o_{p}(a)<p\). Vamos\(k=o_{p}(a)\). Por Proposición\(7.16\) las clases restantes\([1],[a],\left[a^{2}\right], \ldots,\left[a^{k-1}\right]\) son distintas. Seamos\(\phi_{n}\) definidos como en Lema 7.14. Entonces\(\phi_{n}\) es una permutación de\(\mathbb{Z}_{p}^{*}\). Por lo tanto, las clases restantes\([n],\left[n a^{2}\right], \ldots,\left[n a^{k-1}\right]\) son distintas. Pero\[n a^{k} \equiv n \quad \bmod p,\] SO\[S_{a}(n)=\left\{[n],\left[n a^{2}\right], \ldots,\left[n a^{k-1}\right]\right\}\] (¿Por qué?) Por lo tanto\[\left|S_{a}(n)\right|=o_{p}(a)\] LEMMA 7.18. Que\(a \in \mathbb{Z}\) sea tal que\(p \nmid a\). Entonces para cualquiera\(m, n \in \mathbb{N}^{+}\) que no sean múltiplos de\(p\), los conjuntos\(S_{a}(m)\) y\(S_{a}(n)\) sean iguales o disjuntos.

    PRUEBA. \(S_{a}(m) \cap S_{a}(n) \neq \emptyset .\)Supongamos Let\(m, n \in \mathbb{N}, \operatorname{gcd}(m, p)=1\)\(\operatorname{gcd}(n, p)=1\) y\[\left[m a^{i}\right] \in S_{a}(n)\] Entonces hay\(j \in \mathbb{N}\) tal que\[\left[m a^{i}\right]=\left[n a^{j}\right]\] Podemos suponer que\(i<j\), ya que hay infinitamente muchos\(j \in \mathbb{N}^{+}\) que satisfacen a la ecuación. Entonces\[[m]=\left[n a^{j-i}\right]\] Entonces\[[m] \in S_{a}(n)\] Por lo tanto si\(S_{a}(m)\) y no\(S_{a}(n)\) son disjuntos, tenemos\[S_{a}(m) \subseteq S_{a}(n)\] Por simetría, también tenemos\[S_{a}(n) \subseteq S_{a}(m)\] y así ya sea\[S_{a}(m)=S_{a}(n)\] o\[S_{a}(m) \cap S_{a}(n)=\emptyset\] TEOREMA 7.19 . El pequeño teorema de Fermat Si\(a \in \mathbb{Z}\) y\(p\) es un número primo tal que\(p \nmid a\), entonces\[a^{p-1} \equiv 1 \quad \bmod p .\] Prueba. Vamos\(k=o_{p}(a)\). Eso lo demostramos\(k \mid(p-1)\). Vamos\(n \in \mathbb{N}\), donde no\(n\) es un múltiplo de\(p\). Por Lemma\(7.17\)\[\left|S_{a}(n)\right|=k .\] Por Lemma 7.18, los conjuntos\(\mathbb{Z}_{p}^{*}\) se\[\left\{S_{a}(n) \mid n \in \mathbb{N}^{+}, p \nmid n\right\}\] particionan en conjuntos de cardinalidad\(k\). Por lo tanto\(k\) divide\(\left|Z_{p}^{*}\right|\). Ya que\(\left|Z_{p}^{*}\right|=p-1\), tenemos De\[k \mid(p-1) .\] ello se deduce que hay\(j \in \mathbb{N}\) tal que\[a^{p-1} \equiv\left(a^{k}\right)^{j} \equiv 1^{j} \equiv 1 \quad \bmod p .\] COROLARIO 7.20. Si\(a \in \mathbb{Z}\) y\(p\) es un número primo tal que\(p \nmid a\), entonces el pequeño teorema de\[a^{p} \equiv a \quad \bmod p .\] Fermat es un resultado importante en el estudio teórico de los números primos, y determinando la primalidad. ¿Cómo podría utilizarse el teorema? Considera el problema de decidir si un número natural en particular\(n\) es primo. Para determinar si\(n\) es primo, puede invocar el Teorema Fundamental de la Aritmética, y comenzar a verificar todos los números primos\(\sqrt{n}\) hasta determinar si alguno son factores no triviales de\(n\). No es necesario verificar primos mayores que\(\sqrt{n}\) ya que la existencia de tal factor conlleva la existencia de un factor menor entonces\(\sqrt{n}\), y por el Teorema Fundamental de la Aritmética, un factor primo menor que\(\sqrt{n}\). Esto puede requerir verificar muchos candidatos, además de requerir que conozca todos los números primos más pequeños que\(\sqrt{n}\), o esté dispuesto a verificar factores que no son primos. Para grandes\(n\) este es un reto formidable. Alternativamente, se puede buscar\(a \in \mathbb{Z}\) tal que\(\left[a^{n}\right] \neq[a]\) para determinar que no\(n\) es primo.\(\mathbb{Z}_{n}\)

    Por ejemplo, ¿es 12,871 prime? Suponemos que tienes acceso a una computadora (hacer estos cálculos a mano puede ser tedioso). Un enfoque es verificar los factores entre los números primos menores que\(\sqrt{12,871}\), es decir, los treinta números primos menores que 114. Alternativamente, para\(a \in \mathbb{Z}\), podemos comprobar si\[a^{12,871} \equiv a \quad \bmod 12,871 .\] Si la respuesta es no, entonces 12,871 no es primo. Intentaremos\(a=2\):\[2^{12,871} \equiv 5732 \bmod 12,871 .\] Por lo tanto 12,871 no es primo. Si tuvieras que verificar los primos secuencialmente, tendrías que verificar 18 primos antes de encontrar que 61 es el primo más pequeño que divide 12,871.

    Si\(a^{12,871} \equiv a \bmod 12,871\) por una elección dada de\(a\), entonces no podemos sacar ninguna conclusión. De hecho hay números no primos,\(n\), de tal manera que para cualquier elección de\(a\),\[a^{n} \equiv a \bmod n .\] Los números que satisfacen la conclusión del Teorema 7.19, pero que no son primos se llaman números de Carmichael. De modo que el pequeño teorema de Fermat se puede utilizar para demostrar que un número no es primo, sino para demostrar que un número es primo.

    Divisibilidad y polinomios

    Aplicamos algunas de las ideas sobre divisibilidad introducidas en secciones anteriores de este capítulo a polinomios con coeficientes reales,\(\mathbb{R}[x]\). Esto requiere que tratemos a polinomios algebraicamente. Comenzamos definiendo formalmente las operaciones sobre\(\mathbb{R}[x]\). Let\(f, g \in \mathbb{R}[x]\),\[f(x)=\sum_{n=0}^{N} a_{n} x^{n}\] y\[g(x)=\sum_{m=0}^{M} b_{m} x^{m} .\] So\(f\) es un polinomio de grado\(N\) como máximo y\(g\) es un polinomio de grado como máximo\(M\). Para simplificar nuestras expresiones, suscribimos a la convención que para los polinomios\(f\) y\(g, a_{n}=0\) para todos\(n>N\), y\(b_{m}=0\) para todos\(m>M\). Es decir, podemos considerar un polinomio como una serie de potencias en la que todos pero finitamente muchos de los coeficientes equivalen a 0.

    OBSERVACIÓN. Si un polinomio es idénticamente igual a una constante distinta de cero, decimos que el polinomio tiene grado cero. Si el polinomio es idéntico cero, no definimos su grado. Esta es una conveniencia notacional: un polinomio de grado 0 es una constante distinta de cero.

    Definimos suma y multiplicación en\(\mathbb{R}[x]\) por\[f(x)+g(x):=\sum_{i=0}^{\max (M, N)}\left(a_{i}+b_{i}\right) x^{i}\] y\[f(x) \cdot g(x):=\sum_{i=0}^{M+N}\left(\sum_{j=0}^{i} a_{j} \cdot b_{i-j}\right) x^{i} .\] Debe confirmar que\(0 \in \mathbb{R}[x]\) es la identidad aditiva en\(\mathbb{R}[x]\), y\(1 \in \mathbb{R}[x]\) es la identidad multiplicativa en\(\mathbb{R}[x]\). También debes verificar que la suma y la multiplicación en\(\mathbb{R}[x]\) son

    (1) asociativo

    (2) conmutativo

    (3) distributivo (es decir, la multiplicación distribuye sobre la suma).

    Demostraremos que una versión del Algoritmo de División es válido para polinomios. En efecto, es la razón por la que la división larga de polinomios es esencialmente similar a la división de enteros.

    TEOREMA 7.21. Algoritmo de división Si\(f, g \in \mathbb{R}[x]\)\(g \neq 0\), y, entonces hay polinomios únicos\(q\) y\(r\) tal que\[f=q \cdot g+r\] y cualquiera\(r=0\) o el grado de\(r\) es menor que el grado de \(g\). Discusión. Argumentamos primero por la existencia de un cociente y resto que satisfaga la afirmación del teorema. Dejamos\(g\) ser un polinomio real arbitrario y argumentamos por inducción sobre el grado de\(f\) - para este divisor particular\(g\). El principio de inducción arrojará el resultado para el divisor\(g\) y cualquier dividendo. Al\(g\) ser un polinomio real arbitrario, se garantiza la existencia de un cociente y resto para cualquier divisor y dividendo. La singularidad se demuestra directamente.

    Comprobante. Vamos\(g \in \mathbb{R}[x]\). Si\(g\) es una constante, entonces\(q(x)=(1 / g(x))(f(x))\) y\(r=0\) satisfacer la afirmación del teorema. Además, cualquier resto debe ser el polinomio cero, ya que es imposible tener un grado menor que el grado de\(g\). Por lo tanto,\(q(x)=(1 / g(x))(f(x))\) es el cociente único que satisface el Algoritmo de División.

    Dejar\(g\) ser un polinomio de grado mayor a 0. Demostramos el resultado para todos los posibles\(f\) (para este particular\(g\)) por inducción en el grado de\(f\). Dejar\(M\) ser el grado de\(g\) y\(N\) ser el grado de\(f\).

    Caso base:\(N<M\)

    Entonces\(q=0\) y\(r=f\) satisfacer la conclusión del teorema.

    Paso de inducción: Supongamos que el resultado se mantiene para todos los polinomios de grado menor que\(N\).\(N \geq M\) Demostramos que se sostiene para\(f \in \mathbb{R}[x]\) de grado\(N\). Asumimos que\[f(x)=\sum_{n=0}^{N} a_{n} x^{n}\] donde\(a_{n} \in \mathbb{R}\) (para\(\left.0 \leq n \leq N\right)\) y\(a_{N} \neq 0\). Vamos\[g(x)=\sum_{m=0}^{M} b_{m} x^{m}\] donde\(b_{m} \in \mathbb{R}\) (para\(0 \leq m \leq M\)) y\(b_{M} \neq 0\). Let\[h(x)=\left(\frac{a_{N}}{b_{M}}\right) x^{(N-M)} .\] Entonces el grado de\(f-h \cdot g\) es menor que\(N\) o\(f-h \cdot g\) es idénticamente 0. Entonces hay\(s \in \mathbb{R}[x]\) tal que\[f=h \cdot g+s\] donde\(s=0\) o el grado de\(s\) es menor que\(N\). Si\(s=0\), entonces vamos\(q=h\) y\(r=0\).

    De lo contrario, por la hipótesis de inducción, hay algún polinomio\(\bar{q}\) tal que\[s=\bar{q} \cdot g+r\] donde\(r=0\) o el grado de\(r\) es menor que\(M\). Así\[f=h g+s=h g+\bar{q} g+r=(h+\bar{q}) g+r .\] si dejamos\(q=h+\bar{q}\) entonces\[f=q g+r .\] Así, por el principio de inducción, para cualquiera\(f \in \mathbb{R}[x]\), hay\(q\) y\(r\) tal que\[f=q \cdot g+r .\] Desde\(g\) era un polinomio arbitrario de grado mayor que 0, el resultado se mantiene para todos\(f\) y\(g\).

    Eso lo demostramos\(q\) y\(r\) somos únicos. Dejar\[f=q g+r=\bar{q} g+\bar{r}\] donde los restos,\(r\) y\(\bar{r}\), tienen grado menor que el grado de\(g\) o son el polinomio 0. Entonces\ [\ comienzan {reunidos} q g+r- (\ bar {q} g+\ bar {r}) =\\ (q-\ bar {q}) g+ (r-\ bar {r}) =0. \ end {reunido}\] Dejar\(Q=q-\bar{q}\) y\(R=r-\bar{r}\). Asumir eso\(Q \neq 0\). Entonces el grado de no\(Q \cdot g\) es menor que el grado de\(g\). Sin embargo los restos\(r\) y\(\bar{r}\) tienen grado menor que el grado de\(g\), o son el polinomio 0. Así el grado de\(R\) es estrictamente menor que el grado de\(g\), o\(R=0\). La suma de dos polinomios de diferente grado no puede ser idéntica a 0. De ahí que eso sea imposible\(Q \neq 0\). Si\(Q=0\) entonces\(R=0\). Por lo tanto\[q=\bar{q}\]\[r=\bar{r}\] y y el cociente y resto son únicos.

    COROLARIO 7.22. Si\(f \in \mathbb{R}[x]\) y\(x_{0} \in \mathbb{R}\), entonces hay\(q \in \mathbb{R}[x]\) tal que\[f(x)=\left(x-x_{0}\right) \cdot q(x)+f\left(x_{0}\right) .\] Prueba. Aplicar el Algoritmo de División con\(g(x)=x-x_{0}\). Entonces el resto\(r\) es de grado 0, o idénticamente cero, así es constante, y evaluando\[f(x)=\left(x-x_{0}\right) q(x)+r(x)\] en\(x=x_{0}\) da\(r(x)=f\left(x_{0}\right)\). Por lo tanto,\[f(x)=\left(x-x_{0}\right) q(x)+f\left(x_{0}\right) .\] utilizamos estos resultados para probar una propiedad algebraica de polinomios.

    DEFINICIÓN. Ideal Si\(I \subseteq \mathbb{R}[x]\) y\(I \neq \emptyset\), entonces llamamos\(I\) un ideal de\(\mathbb{R}[x]\) siempre que se cumplan las siguientes condiciones:

    (1) Si\(f, g \in I\) entonces\(f+g \in I\).

    (2) Si\(f \in I\) y\(g \in \mathbb{R}[x]\) entonces\(f \cdot g \in I\).

    Un ideal de\(\mathbb{R}[x]\) es un conjunto que se cierra bajo adición de elementos en el ideal, y multiplicación por todos los elementos de\(\mathbb{R}[x]\), estén o no en el ideal. Si observa de cerca la definición de combinación de enteros (Sección 7.1), observará que el conjunto de combinaciones de enteros de un par de enteros se cierra bajo adición de elementos en el conjunto y multiplicación por enteros arbitrarios. Por supuesto esta analogía entre los enteros y los polinomios no es accidental. Si generalizas la idea de una combinación entera a polinomios, dirías que las combinaciones polinómicas de un par de polinomios es un ideal de\(\mathbb{R}[x]\). Para los enteros pudimos demostrar que el conjunto de combinaciones de enteros de un par de enteros es precisamente los múltiplos enteros del mayor divisor común de los enteros. ¿Podemos probar un resultado análogo para polinomios? DEFINICIÓN. Principal ideal Un ideal\(I\) en\(\mathbb{R}[x]\) es principal si hay\(f \in \mathbb{R}[x]\) tal que\[I=\{f \cdot g \mid g \in \mathbb{R}[x]\} .\] en la definición de ideal principal,\(f\) se llama generador de\(I\). El teorema se\(7.7\) puede reafirmar para decir que el conjunto de combinaciones de enteros de un par de enteros es el ideal principal (in\(\mathbb{Z}\)) generado por el mayor divisor común del par.

    TEOREMA 7.23. Cada ideal de\(\mathbb{R}[x]\) es principal.

    Comprobante. Deja\(I\) ser un ideal de\(\mathbb{R}[x]\). Dejar\(f\) ser un polinomio de grado más bajo en\(I\). Demostramos que\(f\) genera\(I\). Vamos\(h \in I\). Es suficiente para demostrar que\(h\) es un múltiplo de\(f\). Por Teorema 7.21, hay\(q, r \in \mathbb{R}[x]\),\(r=0\) o el grado de\(r\) menos que el grado de\(f\), tal que\[h=q f+r .\] Desde\(I\) es un ideal y\(f \in I\),\[q f \in I\] y \[h-q f=r \in I .\]Por suposición\(f\) es de grado mínimo en\(I\), entonces\(r=0\). Por lo tanto\[h=q f\] y\(f\) genera\(I\).

    Este programa parece estar moviéndonos hacia un resultado para polinomios que es análogo al Teorema Fundamental de la Aritmética. Un polinomio es irreducible si no puede escribirse como producto de polinomios de menor grado. Demostraremos en Teorema\(9.48\) que cada polinomio en\(\mathbb{R}[x]\) factores singularmente en el producto de polinomios irreducibles (hasta el orden de factores y multiplicación por constantes), y además que todos los polinomios irreducibles son de grado como máximo\(2 .\) El estudio de las propiedades algebraicas de los polinomios es el principio motivador más importante en Álgebra. Los buenos textos sobre Álgebra incluyen [2] de John Fraleigh y [3] de Israel Herstein.

    Ejercicios

    EJERCICIO 7.1. Vamos\(n \in \mathbb{N}\). Demostrar que si no\(n\) es primo entonces\(n\) tiene un factor primo\(p \leq \sqrt{n}\).

    EJERCICIO\(7.2\). ¿Son\(15,462,227\) y\(15,462,229\) relativamente primos?

    EJERCICIO 7.3. Si\(n \in \mathbb{N}\), ¿bajo qué condiciones son\(n\) y\(n+2\) relativamente prime?

    EJERCICIO 7.4. Demostrar que cada número natural puede escribirse como producto de una potencia de 2 y un número impar.

    EJERCICIO 7.5. Encontrar\(\operatorname{gcd}(8243235,453169)\).

    EJERCICIO 7.6. Encontrar\(\operatorname{gcd}(15570555,10872579)\).

    EJERCICIO 7.7. Dejar\(a\) y\(b\) ser enteros y\(m=\operatorname{gcd}(a, b)\). \(\frac{b}{m}\)Demuéstralo\(\frac{a}{m}\) y son números enteros relativamente primos.

    EJERCICIO 7.8. Dejar\(a\) y\(b\) ser enteros positivos con descomposición prima dada por\[a=\prod_{n=1}^{N} p_{n}^{r_{n}}\] y\[b=\prod_{n=1}^{N} p_{n}^{s_{n}}\] donde\(p_{n}, r_{n}, s_{n} \in \mathbb{N}\) y\(p_{n}\) es primo para\(1 \leq n \leq N\). Probar que si es\(t_{n}=\min \left(r_{n}, s_{n}\right)\) por\(1 \leq n \leq N\), entonces\[\operatorname{gcd}(a, b)=\prod_{n=1}^{N} p_{n}^{t_{n}} .\] EJERCICIO 7.9. En el comunicado de Lemma 7.14, supongamos que\(\operatorname{gcd}(a, n) \neq\) 1. Demostrar que la función no\(\phi_{a}\) es una permutación de\(\mathbb{Z}_{n}^{*}\). EJERCICIO 7.10. Demostrar Proposición 7.16.

    EJERCICIO 7.11. ¿4757 es primo?

    EJERCICIO 7.12. Definir un ideal\(\mathbb{Z}\) de forma natural: Un conjunto\(I \subseteq \mathbb{Z}\) es un ideal de\(\mathbb{Z}\) si para alguno\(m, n \in I\) y\(c \in \mathbb{Z}\),

    1. \(m+n \in I\)

    y

    1. \(m c \in I\).

    Si\(a, b \in \mathbb{Z}\), demostrar que el conjunto de combinaciones enteras de\(a\) y\(b\) son un ideal de\(\mathbb{Z}\).

    EJERCICIO 7.13. Demostrar que cada ideal de\(\mathbb{Z}\) es principal. (Pista: encuentra el generador del ideal.)

    EJERCICIO 7.14. Dejar\(p\) ser primo y\(\mathbb{Z}_{p}[x]\) ser el conjunto de polinomios con coeficientes en\(\mathbb{Z}_{p}\). ¿Qué se puede decir de las raíces del polinomio\(x^{p-1}-[1]\) en\(\mathbb{Z}_{p}\)? (Decimos que\([a] \in \mathbb{Z}_{p}\) es una raíz de un polinomio\(f \in \mathbb{Z}_{p}[x]\) si\(\left.f([a])=[0] .\right)\)

    EJERCICIO 7.15. Demostrar que 0 es la identidad aditiva en\(\mathbb{R}[x]\) y 1 es la identidad multiplicativa en\(\mathbb{R}[x]\). Utilizar las definiciones formales de suma y multiplicación en\(\mathbb{R}[x]\).

    EJERCICIO 7.16. Demostrar que el grado del producto de polinomios es igual a la suma de los grados de los polinomios. Utilizar la definición formal de multiplicación en\(\mathbb{R}[x]\).

    EJERCICIO 7.17. Vamos\(p \in \mathbb{R}[x]\). Demostrar que\(p\) tiene una inversa aditiva en\(\mathbb{R}[x]\). Demostrar que\(p\) tiene una inversa multiplicativa iff\(p\) tiene grado 0. Utilizar las definiciones formales de suma y multiplicación en\(\mathbb{R}[x]\).

    EJERCICIO 7.18. Demostrar que la suma y multiplicación en\(\mathbb{R}[x]\) son asociativas y conmutativas, y que la propiedad distributiva posee. Utilizar las definiciones formales de suma y multiplicación en\(\mathbb{R}[x]\).

    EJERCICIO 7.19. Para\(0 \leq n \leq N\), vamos\(a_{n} \in \mathbb{R}\). Si\(f=\sum_{n=0}^{N} a_{n} x^{n}\) y\(g(x)=x-1\), encuentra el cociente único y el resto donde\(f\) está el dividendo y\(g\) es el divisor. EJERCICIO 7.20. Vamos\(f, g, q \in \mathbb{R}[x], g \neq 0\). Supongamos que ese\(f\) es el dividendo,\(g\) el divisor y\(q\) el cociente. Demostrar que la suma del grado de\(g\) y el grado de\(q\) igual al grado de\(f\).

    EJERCICIO 7.21. ¿Existe una versión del Algoritmo Euclidiana para\(\mathbb{R}[x]\)?

    CAPÍTULO 8

    Los números reales

    ¿Cuáles son los números reales y por qué los números racionales no son suficientes para nuestras necesidades matemáticas? En última instancia, los números reales deben satisfacer ciertas propiedades axiomáticas que consideramos deseables para interpretar el mundo natural al tiempo que satisfacen el deseo del matemático de una base formal para el razonamiento matemático.

    Por supuesto que los números reales deben contener los números racionales. También requerimos que los números reales satisfagan propiedades algebraicas bastante obvias que se mantienen para los números racionales, como la conmutatividad de la suma o la propiedad distributiva. Estos axiomas nos permiten utilizar el álgebra para resolver problemas. Adicionalmente debemos satisfacer propiedades geométricas como la desigualdad triangular que permiten la interpretación de números reales positivos como distancias. Necesitamos que nuestro sistema numérico contenga números que surgen de la interpretación algebraica y geométrica de los números. Desafortunadamente los números racionales no bastan para este objetivo limitado. Por ejemplo,\(\sqrt{2}\), que sabes por ejemplo\(3.23\) que es irracional, surge geométricamente como la longitud de la diagonal de la unidad cuadrada, y como la solución a la ecuación algebraica\(x^{2}=2\).

    El desarrollo del límite dio lugar a nuevas preguntas sobre los números reales. En particular, ¿cuándo estamos seguros de que una secuencia de números es convergente en nuestro sistema numérico? Los reclamos de prueba de convergencia suelen utilizar otra propiedad de los números reales, la propiedad de límite superior menor. Muchas de las poderosas conclusiones del cálculo son consecuencias de esta propiedad. Hablando vagamente, la propiedad de límite superior mínimo implica que la línea numérica real no tiene ningún “agujero”. Dicho de otra manera, si todos los elementos de un conjunto no vacío de números reales son menores que todos los elementos de otro conjunto no vacío de números reales, entonces hay un número real mayor o igual a todos los elementos del primer conjunto, y menor o igual a todos los elementos del segundo conjunto. Esta propiedad se denomina orden-integridad, y se define formalmente en la Sección 8.10. Orden-integridad, y sus consecuencias deseables, no se sostienen para los números racionales.

    ¿Cómo demostramos la existencia de un conjunto con orden y operaciones que satisfaga todas estas necesidades simultáneamente? No se puede simplemente suponer que tal estructura existe. Es posible que las propiedades especificadas sean lógicamente inconsistentes. Podríamos intentar construir el conjunto. ¿Cuáles son las reglas para la construcción de un objeto matemático? Esta pregunta impulsó a los matemáticos de finales del siglo XIX y principios del XX a desarrollar las reglas para tal construcción, los axiomas de la teoría de conjuntos.

    Por esta razón construimos los números reales con una construcción set-teórica. Es decir, construiremos los números naturales, enteros, números racionales y números irracionales a su vez, utilizando conjuntos básicos, funciones y relaciones. Al hacerlo construiremos un conjunto con orden y operaciones que contenga los números racionales (o una estructura que se comporte precisamente como esperamos que se comporten los números racionales), satisfaga los axiomas algebraico y de orden, tenga las propiedades que necesitamos para el cálculo y se construye con las herramientas que usted desarrollados en los Capítulos 1 y 2.

    Los números naturales

    Cuando introdujimos los números naturales en el Capítulo 1 fuimos explícitos que no estábamos definiendo el conjunto. En cambio, procedimos bajo el supuesto de que estás familiarizado con los números naturales en virtud de tu experiencia matemática previa. Ahora definimos los números naturales en el universo de conjuntos, construyéndolos a partir del conjunto vacío. DEFINICIÓN. Función sucesora Let\(Y\) be a set. La función sucesora,\(S\), se define por\[S(Y):=Y \cup\{Y\} .\] DEFINICIÓN. Conjunto inductivo Let\(S\) Ser la función sucesora y\(X\) ser cualquier colección de conjuntos que satisfagan las siguientes condiciones:
    (1)\(\emptyset \in X\)
    (2)\([Y \in X] \Rightarrow[S(Y) \in X]\).

    Entonces\(X\) se llama un conjunto inductivo.

    DEFINICIÓN. Números naturales Dejar\(X\) ser cualquier conjunto inductivo. El conjunto de números naturales es la intersección de todos los subconjuntos de\(X\) que son conjuntos inductivos.

    ¿Están bien definidos los números naturales? Es decir, ¿depende la definición de la elección del conjunto\(X\)? Si\(\mathcal{F}\) es una familia de conjuntos, todos los cuales son inductivos, se demuestra fácilmente que la intersección también\(\mathcal{F}\) es inductiva. Si se nos dan conjuntos\(X\) y\(Y\) que son inductivos, ¿darán lugar los conjuntos al mismo conjunto de “números naturales”? Nuevamente se ve fácilmente que la respuesta es sí ya que\(X \cap Y\) es un subconjunto de ambos\(X\) y\(Y\), y es inductivo. Los “números naturales” definidos en términos de\(X\) y\(Y\) serán los “números naturales” definidos en términos de\(X \cap Y\) - constituyen el conjunto inductivo “más pequeño”. Para definir los números naturales en el universo de conjuntos, se debe otorgar que existe un conjunto inductivo. Es un axioma de la teoría de conjuntos que existe tal conjunto, llamado el axioma del infinito (ver Apéndice B para una discusión de los axiomas de la teoría de conjuntos).

    ¿Qué tiene que ver este conjunto con los números naturales tal y como los entendemos y utilizarlos en matemáticas? Considera la función\(i\),, definida por\[i(0)=\emptyset\] y\[i(n+1)=i(n) \cup\{i(n)\} .\] Así\ [\ begin {aligned} i (0) &=\ emptyset\\ i (1) &=\ {\ emptyset\}\\ i (2) &=\ {\ emptyset,\ {\ emptyset\}\\ i (3) &=\ {\ emptyset,\ {\ emptyset\},\ {vaciado,\ {\ juego vacío\} \}\}. \ end {aligned}\] Luego\(i\) da una bijección entre los números naturales, tal como los entendemos intuitivamente, y el conjunto inductivo mínimo que definimos anteriormente.

    Definamos\(\ulcorner n\urcorner\) formalmente como el conjunto que se obtiene aplicando la función sucesora\(S\) a los\(n\) tiempos establecidos vacíos. Entonces\[0=\emptyset\] y para\(n>0\) el conjunto\[\ulcorner n\urcorner=\{\emptyset,\{\emptyset\}, \ldots\}\] tiene exactamente\(n\) elementos, y lo identificaremos con el conjunto\[\{0,1, \ldots, n-1\}\] que antes elegimos como el conjunto canónico con\(n\) elementos.

    El conjunto\[\mathbf{N}:=\{\ulcorner n\urcorner \mid n \in \mathbb{N}\}\] es inductivo, y por lo tanto contiene los números naturales. Finalmente el lector puede confirmar que no\(\mathbf{N}\) tiene un subconjunto adecuado que sea inductivo.

    Para resumir la construcción hasta el momento, el axioma del infinito garantiza que hay un conjunto que es inductivo. Escoge tal conjunto,\(X\). La intersección de todos los subconjuntos de\(X\) que son inductivos es\(\mathbf{N}\), que podemos identificar con los números naturales (concebidos intuitivamente) por la bijección i. Para continuar con la construcción, consideramos\(\mathbb{N}\) y\(\mathbf{N}\) ser el mismo conjunto. Necesitamos\(\mathbb{N}\) tener las operaciones\(+\) y. así como la relación\(\leq\). Definiremos adición\(\mathbb{N}\) con operaciones de conjunto básico y cardinalidad. Si\(m, n \in \mathbb{N}\), entonces definimos suma por\[m+n:=|(\ulcorner m\urcorner \times\{\ulcorner 0\urcorner\}) \cup(\ulcorner n\urcorner \times\{\ulcorner 1\urcorner\})| .\] Recordemos que la cardinalidad de un conjunto finito es el número natural único que es biyectiva con el conjunto - de ahí que la expresión complicada en el lado derecho de la definición es un número natural. Es fácil confirmar que la adición definida de esta manera concuerda con la operación habitual en\(\mathbb{N}\). ¿Por qué nos molestaríamos en definir una operación que has entendido desde hace muchos años? Hemos definido la adición de números naturales como una operación establecida.

    La multiplicación es algo más fácil de definir. Si\(m, n \in \mathbb{N}\), entonces\[m \cdot n:=|\ulcorner m\urcorner \times\ulcorner n\urcorner| .\] (Por supuesto, por\(\ulcorner m\urcorner \times\ulcorner n\urcorner\) nos referimos al producto cartesiano de los conjuntos\(\ulcorner m\urcorner\) y\(\ulcorner n\urcorner\).) Finalmente\(m, n \in \mathbb{N}\)\[[m \leq n] \Longleftrightarrow[\ulcorner m\urcorner \subseteq\ulcorner n\urcorner] .\] si se debe confirmar que las operaciones y la relación de acuerdo con lo habitual\(+, \cdot\) y\(\leq\) en los números naturales.

    Habiendo concluido esta construcción es razonable preguntarse si\(\mathbb{N}\) es verdaderamente el conjunto de números naturales. Ciertamente es justificable que concluya que no se proporciona claridad sobre el número 2 identificándolo con el conjunto\(\{\emptyset,\{\emptyset\}\}\). Lo que ganamos es una reducción de números a conjuntos que nos llevarán a través de la construcción de todos los números reales, incluyendo números que no son fáciles de construir.

    Los números enteros

    Construimos los enteros a partir de los números naturales. El propósito algebraico de los números enteros es incluir inversas aditivas para números naturales. Por supuesto esto naturalmente da lugar a la operación de resta.

    Vamos\(Z=\mathbb{N} \times \mathbb{N}\). Definir una relación de equivalencia,\(\sim\) on\(Z\) by\[\left\langle m_{1}, n_{1}\right\rangle \sim\left\langle m_{2}, n_{2}\right\rangle \quad \Longleftrightarrow \quad m_{1}+n_{2}=m_{2}+n_{1} .\] Entonces los enteros son\[\mathbf{Z}:=Z / \sim .\] Pensamos en el par ordenado\(\langle m, n\rangle \in \mathbf{Z}\) como un representante del entero\(m-n\). Decimos que un entero es positivo si\(m>n\) y negativo si\(m<n\). Debe quedar claro que el conjunto de enteros no negativos (es decir\(\mathbb{N}\)) es\[\{[\langle m, n\rangle] \mid m \geq n\}=\{[\langle m, 0\rangle] \mid m \in \mathbb{N}\} .\] Let\(\mathbb{Z}\) be the (intuitivo) integer y let\(i: \mathbf{Z} \rightarrow \mathbb{Z}\) be defined by\[i([\langle m, n\rangle])=m-n .\] Then\(i\) es una biyección. Como hicimos con los números naturales, construiremos operaciones y ordenaremos sobre\(\mathbf{Z}\) eso de acuerdo con las operaciones habituales y un orden encendido\(\mathbb{Z}\). Por supuesto, podríamos usar\(i\) y las definiciones habituales en\(\mathbb{Z}\) para definir operaciones y relaciones sobre\(\mathbf{Z}\), pero eso extrañaría el espíritu de la construcción, y descuidaría el deseo de establecer definiciones teóricas. Análogamente a la construcción de la sección anterior, definimos\(\mathbb{Z}\) como\(\mathbf{Z}\). Dejemos\(x_{1}, x_{2} \in \mathbb{Z}\) dónde\(x_{1}=\left[\left\langle m_{1}, n_{1}\right\rangle\right]\) y\(x_{2}=\left[\left\langle m_{2}, n_{2}\right\rangle\right]\). La adición se define por\[x_{1}+x_{2}=\left[\left\langle m_{1}+m_{2}, n_{1}+n_{2}\right\rangle\right] .\] La inversa aditiva de\([\langle m, n\rangle]\) es\([\langle n, m\rangle]\) (es decir, la suma de estos números enteros es\([\langle 0,0\rangle]\) - la identidad aditiva en\(\mathbb{Z})\).

    La multiplicación se define por\[x_{1} \cdot x_{2}=\left[\left\langle m_{1} \cdot m_{2}+n_{1} \cdot n_{2}, n_{1} \cdot m_{2}+m_{1} \cdot n_{2}\right\rangle\right] .\] El orden lineal en\(\mathbb{Z}\) se define por la\[x_{1} \leq x_{2} \Longleftrightarrow m_{1}+n_{2} \leq n_{1}+m_{2} .\] suma y la multiplicación se han definido para los números naturales, y las operaciones y el orden lineal en\(\mathbb{Z}\) se definen con respecto a las operaciones y el orden lineal que se definieron previamente para\(\mathbb{N}\). Obsérvese que todas nuestras definiciones fueron dadas en términos de representantes de clases de equivalencia. Para demostrarlo\(+, \cdot\) y\(\leq\) estar bien definidos, debemos demostrar que las definiciones son independientes de la elección del representante - ver Ejercicio 8.6.

    Los números racionales

    Los números racionales son proporciones de números enteros, o casi así. Por supuesto, diferentes numeradores y denominadores pueden dar lugar al mismo número racional; de hecho, una buena parte de la aritmética de la escuela primaria se dedica a determinar cuándo dos expresiones distintas para números racionales son iguales. Construimos los enteros a partir de los números naturales con clases de equivalencia de “diferencias” de números naturales. Construimos los números racionales a partir de los enteros de manera análoga, con clases de equivalencia de “cocientes” de enteros. Álgebraicamente esto da lugar a la división.

    Vamos\(Q=\mathbb{Z} \times \mathbb{N}^{+}\). Definimos una relación de equivalencia\(\sim\) sobre\(Q\). Si\(\langle a, b\rangle,\langle c, d\rangle \in Q\), entonces\[\langle a, b\rangle \sim\langle c, d\rangle \Longleftrightarrow a \cdot d=b \cdot c .\] Definimos los números racionales,\(\mathbf{Q}\), como las clases de equivalencia de\(Q\) con respecto a la relación de equivalencia\(\sim\). Es decir,\[\mathbf{Q}:=Q / \sim \text {. }\] asociamos las clases de equivalencia de\(\mathbf{Q}\) con los números racionales intuitivos a través de la bijección\(i: \mathbb{Q} \rightarrow \mathbf{Q}\) definida por\[i\left(\frac{p}{q}\right)=[\langle p, q\rangle]\] for\(\langle p, q\rangle \in Q\).

    Definimos las operaciones y el ordenamiento lineal\(\mathbb{Q}\) en términos de las operaciones y el ordenamiento lineal en\(\mathbb{Z}\). Definir suma por\[[\langle a, b\rangle]+[\langle c, d\rangle]:=[\langle a d+b c, b d\rangle]\] y multiplicar por\[[\langle a, b\rangle] \cdot[\langle c, d\rangle]:=[\langle a \cdot c, b \cdot d\rangle] .\] Definimos el ordenamiento lineal en\(\mathbb{Q}\) por\[[\langle a, b\rangle] \leq[\langle c, d\rangle] \quad \text { iff } \quad a \cdot d \leq b \cdot c .\] A través de la construcción de los números racionales, hemos utilizado operaciones de conjunto para construir estructuras matemáticas con las que ya estás familiar. En consecuencia usted es capaz de comprobar que la construcción se comporta como se espera. Por ejemplo, se puede probar fácilmente que las operaciones que hemos construido concuerdan con las operaciones habituales de suma y multiplicación sobre los números racionales. Del mismo modo, se puede verificar fácilmente que la relación sobre la que hemos construido\(\mathbb{Q}\) concuerda con el orden lineal habitual de los números racionales. Construir los números reales es más complicado.

    Los números reales

    Completamos nuestra construcción de los números reales (tenemos los números irracionales restantes) con el objetivo de probar el orden completo de los números reales, y derivar algunas consecuencias importantes de la integridad. Muchos de los resultados más potentes e interesantes del cálculo dependen de esta propiedad de los números reales. Si se le ha pedido que acepte algunos de estos teoremas sobre la fe, ahora es el momento de recompensar su confianza.

    Hay un par de formas diferentes de construir los números reales a partir de los números racionales. Un enfoque es definir los números reales como secuencias convergentes de números racionales. El otro enfoque común es caracterizar los números reales como subconjuntos de números racionales que satisfacen ciertas condiciones.

    DEFINICIÓN. Corte Dedekind Un corte Dedekind\(L\) es un subconjunto propio no vacío de\(\mathbb{Q}\) que no tiene elemento máximo y satisface\[(\forall a, b \in \mathbb{Q})[a \in L \wedge b<a] \Rightarrow[b \in L] .\] Let\(L\) be a Dedekind cut. Entonces hay algún número racional\(a \in L\), y por lo tanto todos los números racionales menos entonces\(a\) están en\(L\). Vamos\(R=\mathbb{Q} \backslash L\). Ya que\(L \neq \mathbb{Q}\), hay\(c \in R\) y cada número racional mayor de lo que\(c\) está en\(R\). Está claro que\(\{L, R\}\) es una partición de\(\mathbb{Q}\) y que cada elemento de\(L\) es menor que cada elemento de\(R\). Entonces Dedekind corta “dividir” los números racionales. Asociaremos cada corte de Dedekind con un número real ubicado en la división de la línea numérica real.

    OBSERVACIÓN. Para ayudar a nuestra imagen mental de lo que está pasando, pensamos en\(L\) como todos los números racionales a la izquierda de algún número real fijo\(\alpha\), es decir, como\((-\infty, \alpha) \cap \mathbb{Q}\), y\(R\) como los números racionales a la derecha,\([\alpha, \infty) \cap \mathbb{Q}\). Por supuesto que aún no sabemos a qué nos referimos exactamente con “el número real\(\alpha\) “, pero esta es la idea a tener en cuenta. Tenga en cuenta que\(R\) tendrá un elemento mínimo iff\(\alpha\) es racional.

    Para entender cómo los cortes de Dedekind se relacionan con los números, construimos una inyección desde los números racionales hasta los cortes de Dedekind. Déjese\(\mathcal{D}\) ser el conjunto de cortes de Dedekind. Definimos una inyección\(i: \mathbb{Q} \rightarrow \mathcal{D}\) por\[i(a)=\{b \in \mathbb{Q} \mid b<a\} .\] La función\(i\) es una inyección bien definida que nos informa de cómo\(\mathbb{Q}\) encaja en\(\mathcal{D}\).

    Determinaremos el orden y las operaciones sobre\(\mathcal{D}\) para que coincidan con el orden lineal habitual y las operaciones sobre las\(\mathbb{Q}\) que se hereden en\(i[\mathbb{Q}]\). Es decir, vamos a definir el orden lineal, suma y multiplicación on para\(\mathcal{D}\) que para\(a, b \in \mathbb{Q}\),\ [\ begin {alineado} {[a\ leq b]} &\ Longleftrightarrow [i (a)\ leq i (b)]\\ i (a+b) &=i (a) +i (b)\\ i (a\ cdot b) &=i (a)\ cdot i (b) \ fin {alineado} \] Si podemos hacer esto, podemos pensar en\(\mathcal{D}\) como una extensión de\(\mathbb{Q}\). ¿Cómo lo hacemos?

    Para\(L, K \in \mathcal{D}\), definimos la relación\(\leq\) en\(\mathcal{D}\) por\[[L \leq K] \Longleftrightarrow[L \subseteq K] .\] Usted debe confirmar que\(\leq\) es un orden lineal de\(\mathcal{D}\) y que la relación\(\leq\) en\(i[\mathbb{Q}]\) satisface (1). Si\(L \in \mathcal{D}\) y\(L<i(0)\) decimos que\(L\) es negativo. Si\(L>i(0)\), decimos que\(L\) es positivo. Con un objetivo similar en mente definimos la suma y multiplicación en\(\mathcal{D}\). Es decir, queremos que las operaciones satisfagan ciertas propiedades de suma y multiplicación y queremos que las operaciones definidas en\(i[\mathbb{Q}]\) coincidan con las operaciones en\(\mathbb{Q}\).

    Si\(L, K \in \mathcal{D}\), entonces\[L+K:=\{a+b \mid a \in L \text { and } b \in K\} .\] Verifica que\(L+K\) sea un corte Dedekind, y que (2) se mantenga.

    La multiplicación requiere un poco más de esfuerzo para definir. (¿Por qué no podemos dejar\(L \cdot K=\{a b \mid a \in L, b \in K\}\)?) Si\(L\) o\(K\) es\(i(0)\), entonces\[L \cdot K:=i(0) .\] Si ambos\(L, K \in \mathcal{D}\) son positivos, entonces\[L \cdot K=\{a \cdot b \mid a \in L, b \in K, a>0 \text { and } b>0\} \cup\{c \in \mathbb{Q} \mid c \leq 0\} .\] Verifica que\(L \cdot K\) sea un corte de Dedekind, y que (3) se mantenga para\(a, b>0\).

    ¿Cómo definimos la multiplicación por cortes “negativos” de Dedekind? Empecemos por definir la multiplicación por\(-1\). Dejar\(L \in \mathcal{D}\) y\(R=\)\(\mathbb{Q} \backslash L\). Definimos\(-L\) por\[-L:=\{c \in \mathbb{Q} \mid(\exists r \in R)-c>r\} .\] Ahora podemos definir multiplicación sobre elementos arbitrarios de\(\mathcal{D}\) para satisfacer las propiedades que deseamos. Si\(L, K \in \mathcal{D}\) y ambos son negativos, entonces\[L \cdot K:=(-L \cdot-K) .\] Si exactamente uno de\(L\) y\(K\) es negativo, entonces\[L \cdot K:=-(-L \cdot K) .\] DEFINICIÓN. Números reales,\(\mathbb{R}\) Los números reales son los cortes de Dedekind, con suma, multiplicación y\(\leq\) definidos como arriba. Denotamos los números reales por\(\mathbb{R}\) cuando no necesitamos pensarlos explícitamente como recortes de Dedekind.

    Hemos definido los números reales como conjuntos de números racionales. Ya que los números racionales se definieron utilizando ideas básicas sobre conjuntos, funciones y relaciones, también lo son los números reales. Las propiedades de los números reales que discutimos al inicio de esta sección están satisfechas por los cortes de Dedekind. Por cada número racional\(a\), nos identificamos\(a\) con el corte Dedekind\(i(a)\).

    TEOREMA 8.2. Los números reales definidos anteriormente satisfacen:

    (i) La suma y la multiplicación son tanto conmutativas como asociativas.

    ii)\((\forall L \in \mathcal{D}) L+0=L, L \cdot 1=L\).

    iii)\((\forall L \in \mathcal{D}) L+(-L)=0\).

    iv)\((\forall L \in \mathcal{D} \backslash\{0\})(\exists K \in \mathcal{D}) L \cdot K=1\).

    v)\((\forall L, K, J \in \mathcal{D}) L \cdot(K+J)=L \cdot K+L \cdot J\).

    Comprobante. Ejercicio.

    La propiedad de límite inferior superior

    DEFINICIÓN. Límite superior Let\(X \subset \mathcal{D}\). Decimos que\(X\) está acotado arriba si hay\(M \in \mathcal{D}\) tal que\[(\forall x \in X) x \leq M .\] en este caso decimos que\(M\) es un límite superior para\(X\).

    DEFINICIÓN. Límite inferior superior Dejar\(X \subset \mathcal{D}\) delimitar arriba. Supongamos que\(M\) es un límite superior para\(X\) tal que para cualquier límite superior\(N\) para\(X, M \leq N\). Entonces el número\(M\) se llama el límite inferior superior para\(X\).

    El límite inferior y el mayor límite inferior se definen análogamente.

    TEOREMA 8.3. Propiedad de límite mínimo superior Si\(X\) es un subconjunto no vacío de\(\mathcal{D}\) y está delimitado por encima, entonces\(X\) tiene un límite superior mínimo. Si está acotado por debajo, entonces tiene un mayor límite inferior.

    PRUEBA. \(X \subset \mathcal{D}\)Déjese acotar arriba. Dejar\[M=\bigcup_{L \in X} L \subseteq \mathbb{Q} .\] El conjunto\(M\) está delimitado arriba (¿por qué?) , y por lo tanto\(M \neq \mathbb{Q}\). Cualquier elemento de\(M\) es un elemento de algunos\(L \in X\), y en consecuencia no puede ser un elemento máximo de\(L\). Por lo tanto, no\(M\) tiene elemento más grande. Si\(a \in M\),\(c \in \mathbb{Q}\) y\(c<a\) entonces\(c \in M\). Por lo tanto\(M\) es un corte Dedekind. Para cualquier\(L \in X, L \subseteq M\) y por lo tanto es\[L \leq M .\] decir,\(M\) es un límite superior para\(X\).

    Vamos\(K<M\). Luego está\(a \in M \backslash K\). Así\(a\) es en algunos\(L_{0}\) en\(X\). Por lo tanto no\(L_{0}\) está contenido\(K\) y no\(K\) es un límite superior para\(X\). De ello se deduce que\(M\) es el límite inferior superior para\(X\).

    Dejamos al lector el argumento a favor de la existencia de un mayor límite inferior.

    La propiedad de límite inferior superior es la propiedad esencial de los números reales que permite los principales teoremas del cálculo. Es la razón por la que usamos este gran conjunto, en lugar de, digamos, los números algebraicos. Caracteriza de manera única a los números reales como una extensión de los números racionales - ver Teorema\(8.23\) para una declaración precisa.

    Ahora que hemos probado esta propiedad clave, utilizaremos\(\mathbb{R}\) para denotar el conjunto de números reales, identificando un número real\(\alpha\) con el corte Dedekind\((-\infty, \alpha) \cap \mathbb{Q}\). Ya no necesitaremos preocuparnos por los cortes de Dedekind per se.

    Secuencias reales

    Recordemos que una secuencia es una función con dominio\(\mathbb{N}\) (o\(\mathbb{N}^{+}\)). Una secuencia real es una secuencia de valor real (es decir, el rango de la secuencia es un subconjunto de los números reales).

    DEFINICIÓN. Subsecuencia Let\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) Ser una secuencia y\(f \in \mathbb{N}^{\mathbb{N}}\) ser una secuencia estrictamente creciente de números naturales. Entonces\[\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\] es una subsecuencia de\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\).

    EJEMPLO 8.4. Dejar\(s\) ser la secuencia\[\langle 2 n \mid n \in \mathbb{N}\rangle=\langle 0,2,4,6,8, \ldots\rangle .\] Entonces la secuencia\(t\) dada por\[\langle 6 n \mid n \in \mathbb{N}\rangle=\langle 0,6,12,18, \ldots\rangle\] es una subsecuencia de\(s\). En este ejemplo,\(f(n)=3 n\) es la función que demuestra que\(t\) es una subsecuencia de\(s\). Otra subsecuencia de\(s\) es la secuencia\[\left\langle 2^{5 n+3} \mid n \in \mathbb{N}\right\rangle\] Recordemos que una secuencia\(\left\langle a_{n}\right\rangle\) se llama no decreciente si\(a_{n+1} \geq a_{n}\) para todos\(n\). Se llama no creciente si se invierte la desigualdad. Todo lo que es cierto para una secuencia no decreciente es cierto, con desigualdades invertidas, para secuencias no crecientes (¿por qué?) , así que en lugar de declarar todo dos veces, podemos usar la palabra monotónico para significar una secuencia que no es creciente (en todas partes) o no decreciente.

    LEMA 8.5. Cada secuencia real no decreciente\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) que está delimitada arriba converge a su límite inferior superior. Cada secuencia real no creciente que se limita a continuación converge a su mayor límite inferior.

    Comprobante. Sólo probaremos la primera aseveración. Dejar\(M\) ser el límite inferior superior de\(\left\langle a_{n}\right\rangle\). Vamos\(\varepsilon>0\). Ya que\(M\) es el límite inferior superior, existe\(N \in \mathbb{N}\) tal que,\[0<M-a_{N}<\varepsilon .\] Dado que la secuencia es no decreciente,\[(\forall n \geq N) 0<M-a_{n}<\varepsilon .\] Por lo tanto\(M\) es el límite de la secuencia, según se desee.

    TEOREMA 8.6. Teorema de Bolzano-Weierstrass Let\([b, c]\) Ser un intervalo delimitado cerrado de números reales y\(s=\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) ser una secuencia de números reales tal que\[(\forall n \in \mathbb{N}) a_{n} \in[b, c] .\] Entonces\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) tiene una subsecuencia convergente con límite en\([b, c]\). Discusión. Consideramos una secuencia anidada de intervalos, todos los cuales contienen infinitamente muchos elementos del rango de la secuencia\(s\), con el radio de los intervalos acercándose a 0. Construimos una subsecuencia de\(s\) seleccionando secuencialmente elementos en la intersección del rango de\(s\) y los intervalos sucesivos. Luego mostramos que la subsecuencia que construimos es convergente.

    Prueba. Demostramos el teorema para el intervalo de unidad cerrada\([0,1]\). Es sencillo generalizar este argumento a intervalos delimitados cerrados arbitrarios.

    Si el rango de la secuencia es un conjunto finito, entonces al menos un elemento del rango,\(a_{n}\), debe tener una pre-imagen infinita. La pre-imagen de\(a_{n}\) da una subsecuencia que converge a\(a_{n}\). Por lo tanto asumimos que el rango de la secuencia es infinito. Dejar\(S\) ser el rango de la secuencia\(\left\langle a_{n}\right\rangle\).

    Definimos una secuencia anidada de intervalos cerrados,\(I_{n}=\left\langle\left[b_{n}, c_{n}\right]\right| n \in\)\(\mathbb{N}\rangle\) satisfaciendo

    (1)\(I_{0}=[0,1]\)

    (2) Para todos\(n \in \mathbb{N}, I_{n+1} \subset I_{n}\)

    (3)\(c_{n}-b_{n}=\frac{1}{2^{n}}\)

    (4) Porque todo\(n \in \mathbb{N}, I_{n} \cap S\) es infinito.

    Vamos\(I_{0}=[0,1]\). Supongamos que tenemos\(I_{n}\) satisfaciendo las condiciones anteriores. Al menos uno de los intervalos\(\left[b_{n}, b_{n}+\frac{1}{2^{n+1}}\right]\) y\(\left[b_{n}+\frac{1}{2^{n+1}}, c_{n}\right]\) debe contener infinitamente muchos elementos de\(S\). Que\(I_{n+1}=\left[b_{n}, b_{n}+\frac{1}{2^{n+1}}\right]\) si la intersección de este conjunto con\(S\) es infinita; de lo contrario vamos\(I_{n+1}=\)\(\left[b_{n}+\frac{1}{2^{n+1}}, c_{n}\right]\). Entonces\(I_{n+1}\) satisface las condiciones anteriores.

    La secuencia de puntos finales izquierdos de los intervalos no\(I_{n},\left\langle b_{n} \mid n \in \mathbb{N}\right\rangle\) es decreciente. La secuencia de extremos derechos de los intervalos\(I_{n}\), no\(\left\langle c_{n} \mid n \in \mathbb{N}\right\rangle\) es creciente. Además, para cualquier\(m, n \in \mathbb{N}\),\[b_{m}<c_{n} .\] El conjunto\(\left\{b_{n} \mid n \in \mathbb{N}\right\}\) está delimitado arriba, por lo que por la Propiedad de Límite Mínimo Superior el conjunto tiene un límite superior mínimo,\(\beta\). De igual manera el conjunto\(\left\{c_{n} \mid\right.\)\(n \in \mathbb{N}\}\) tiene un mayor límite inferior\(\gamma\). Por Lema\(8.5\)\ [\ comenzar {alineado} &\ lim _ {n\ fila derecha\ infty} b_ {n} =\ beta\\ &\ lim _ {n\ fila derecha\ infty} c_ {n} =\ gamma. \ end {aligned}\] Por el triángulo de la desigualdad, para cualquier\(n \in \mathbb{N}\),\[|\beta-\gamma| \leq\left|\beta-b_{n}\right|+\left|b_{n}-c_{n}\right|+\left|c_{n}-\gamma\right| .\] Los tres términos en el lado derecho de la desigualdad tienden a 0 como\(n\) se acerca al infinito, así para cualquier\(\varepsilon>0\),\[|\beta-\gamma|<\varepsilon .\] De ahí \(\beta=\gamma\).

    Ahora queremos definir una subsecuencia a la que converja\(\beta\), eligiendo un punto en cada intervalo\(I_{n}\) en turno. Formalmente hacemos esto definiendo\(f \in \mathbb{N}^{\mathbb{N}}\) recursivamente por\[f(0)=0\] y\(f(n+1)\) es lo menos\(k \in \mathbb{N}\) tal que\[[k>f(n)] \wedge\left[a_{k} \in I_{n+1}\right] .\] Esto está bien definido ya que\(S \cap I_{n+1}\) es infinito. Entonces la secuencia\(\left\langle a_{f(n)}\right|\)\(n \in \mathbb{N}\rangle\) converge a\(\beta\). Para ver esto, vamos\(\varepsilon>0\). Para cualquier\(n \in \mathbb{N}\) tal que\(\frac{1}{2^{n}}<\varepsilon\),\[\left|\beta-a_{f(n)}\right|<c_{n}-b_{n}=\frac{1}{2^{n}}<\varepsilon .\] Por lo tanto\(\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\) es una subsecuencia convergente que converge a\(\beta\).

    DEFINICIÓN. Secuencia de Cauchy Let\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) Ser una secuencia. La secuencia\(\left\langle a_{n}\right\rangle\) es una secuencia de Cauchy si\[(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall m, n \in \mathbb{N})[m, n \geq N] \Rightarrow\left[\left|a_{m}-a_{n}\right|<\varepsilon\right] .\] TEOREMA 8.7. Una secuencia real converge si es una secuencia de Cauchy. PRUEBA. \(\Rightarrow\)

    \(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\)Sea una secuencia de números reales que converja a\(a \in \mathbb{R}\).

    Dejar\(\varepsilon>0\) y\(N \in \mathbb{N}\) ser tal que\[(\forall n \geq N)\left|a-a_{n}\right|<\frac{\varepsilon}{2} .\] Entonces para cualquier\(m, n \geq N\),\[\left|a_{n}-a_{m}\right| \leq\left|a_{n}-a\right|+\left|a-a_{m}\right|<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon .\] Por lo tanto\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) es una secuencia de Cauchy.

    \(\Leftarrow\)

    \(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\)Déjese ser una secuencia de Cauchy. Entonces\[(\exists N \in \mathbb{N})(\forall m, n>N)\left|a_{n}-a_{m}\right|<1 .\] Cada término en la secuencia posterior al\(N^{\text {th }}\) término está en la\(\varepsilon\) -vecindad de\(a_{N}\). Entonces\[(\forall n \geq N) a_{n} \in\left[a_{N}-1, a_{N}+1\right] .\] La secuencia\(\left\langle a_{n} \mid n \geq N\right\rangle\) satisface las hipótesis del Teorema de BolzanoWeiersTrass, y así tiene una subsecuencia convergente.

    \(\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\)Sea una subsecuencia convergente de\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) converger a\(a \in \mathbb{R}\). Vamos\(\varepsilon>0\). Ya que\(\left\langle a_{n}\right\rangle\) es Cauchy, hay\(N_{1}\) tal que\[\left(\forall m, n \geq N_{1}\right)\left|a_{m}-a_{n}\right|<\frac{\varepsilon}{2} .\] Además, hay\(N_{2} \in \mathbb{N}\) tal que\[\left(\forall n \geq N_{2}\right)\left|a_{f(n)}-a\right|<\frac{\varepsilon}{2} .\] Let\(N_{3} \geq N_{1}, f\left(N_{2}\right)\). Entonces\(N_{3} \geq N_{2}\) y\[\left(\forall n \geq N_{3}\right)\left|a_{n}-a\right| \leq\left|a_{n}-a_{f(n)}\right|+\left|a_{f(n)}-a\right|<\varepsilon .\] Por lo tanto la secuencia\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) converge a\(a\).

    Las secuencias de Cauchy llegan a la esencia del orden-integridad de los números reales. Una secuencia Cauchy de números racionales no necesita converger a un número racional. Por ejemplo, let\(a\) be any irrational number, and let\(a_{n}\) be the decimal approximation of\(a\) to the\(n^{\text {th }}\) digit. La secuencia\(\left\langle a_{n}\right\rangle\) es una secuencia Cauchy de números racionales que converge en un número irracional. Sin embargo, si una secuencia de Cauchy no logra converger en un conjunto de números, es razonable decir que hay una brecha en el conjunto de números. Los números reales se definen para que se llenen estos vacíos.

    Prueba de Ratio

    Uno de los usos del orden-integridad de los números reales es demostrar que converge una secuencia infinita, sin tener que saber mucho sobre el número al que converge. En el Capítulo 5 aludimos a la prueba de ratio al afirmar que el polinomio Taylor para la función exponencial evaluada en un número real\(a, \sum_{k=0}^{\infty} \frac{a^{k}}{k !}\), converge. ¿Cómo demostramos que converge una suma infinita? Si tenemos una idea de su límite, podríamos demostrar que la secuencia de sumas parciales se acerca a este valor. Es así como demostramos que la suma geométrica con relación menor a 1 converge. Muchas funciones matemáticas importantes se definen por sumas infinitas, y el límite de la suma define el valor de la función. En este caso necesitamos demostrar que la suma converge usando propiedades de los números reales.

    DEFINICIÓN. Convergencia absoluta Let\(\left\langle a_{n}\right\rangle\) Ser una secuencia infinita. Si la suma infinita\[\sum_{k=0}^{\infty}\left|a_{k}\right|\] converge entonces\(\operatorname{sum} \sum_{k=0}^{\infty} a_{k}\) se dice que el infinito converge absolutamente.

    LEMA 8.8. Si una suma infinita converge absolutamente, entonces converge.

    Comprobante. Asumir\(\sum_{k=0}^{\infty} a_{k}\) converge absolutamente. Mostramos que la secuencia de sumas parciales de esta serie,\(\left\langle s_{n} \mid n \in \mathbb{N}\right\rangle\), es una secuencia de Cauchy. Para\(n \in \mathbb{N}\), vamos\[b_{n}=\left|a_{n}\right| .\] Entonces\(\sum_{k=0}^{\infty} b_{k}\) converge. Dejar\(\left\langle t_{n} \mid n \in \mathbb{N}\right\rangle\) ser la secuencia de sumas parciales de\(\sum_{k=0}^{\infty} b_{k}\). Por teorema\(8.7,\left\langle t_{n}\right\rangle\) es una secuencia de Cauchy. Vamos\(\varepsilon>0\). Entonces hay\(N \in \mathbb{N}\) tal que para cualquier\(n \geq m \geq N\),\[\left|t_{n}-t_{m}\right| \leq \varepsilon .\] Por una generalización del triángulo la desigualdad (ver Ejercicio 8.24)\[\left|s_{n}-s_{m}\right|=\left|\sum_{k=m+1}^{n} a_{k}\right| \leq \sum_{k=m+1}^{n} b_{k}=\left|t_{n}-t_{m}\right|<\varepsilon\] De ahí\(\left\langle s_{n}\right\rangle\) es una secuencia Cauchy y converge. Por lo tanto\(\sum_{k=0}^{\infty} a_{k}\) converge.

    TEOREMA 8.9. Prueba de ratio Supongamos que\(\left\langle a_{k}\right\rangle\) es una secuencia infinita de números reales y que hay\(N \in \mathbb{N}\) y un número real positivo\(r<1\) tal que para todos\(n \geq N\),\[\left|\frac{a_{n+1}}{a_{n}}\right| \leq r .\] Entonces\(\sum_{k=0}^{\infty} a_{k}\) converge.

    Comprobante. \(\sum_{k=0}^{\infty} a_{k}\)Sea una suma infinita con términos que satisfagan la hipótesis. Para\(n \in \mathbb{N}\), vamos\(b_{n}=\left|a_{n}\right|\). Por supuesto, hay\(N \in \mathbb{N}\) y un número real positivo\(r<1\) tal que para todos\(n \geq N\),\[\frac{b_{n+1}}{b_{n}} \leq r .\] Podemos asumir sin pérdida de generalidad que\(N=0\), ya que la serie\(\sum_{k=0}^{\infty} b_{k}\) converge iff \(\sum_{k=N}^{\infty} b_{k}\)converge, y si es necesario podemos ignorar finitamente muchos términos de la suma infinita. Afirmamos que para todos\(n \in \mathbb{N}\),\[b_{n} \leq b_{0} r^{n} .\] Si\(n=0\) el reclamo es obvio. Asumir que el reclamo se mantiene en\(n\). Por supuesto,\[\frac{b_{n+1}}{b_{n}} \leq r .\] Por lo tanto\[b_{n+1} \leq r b_{n} \leq r b_{0} r^{n} \leq b_{0} r^{n+1} .\] Por Ejercicio 5.28, la suma geométrica con radio\(-1<r<1\) converge a\(\frac{1}{1-r}\). Por lo tanto\(n \in \mathbb{N}\), para cualquiera,\[s_{n}:=\sum_{k=0}^{n} b_{k} \leq \sum_{k=0}^{n} b_{0} r^{k}=b_{0}\left(\sum_{k=0}^{\infty} r^{k}\right) \leq \frac{b_{0}}{1-r} .\] La secuencia de sumas parciales\(\left\langle s_{n}\right\rangle\),, es una secuencia acotada monotónica y por Lemma\(8.5\), converge. Por lo tanto\(\sum_{k=0}^{\infty} a_{k}\) converge absolutamente. Por Lema\(8.8\) la suma converge.

    Funciones reales

    Si relees tu texto de cálculo, observarás que muchos de los teoremas del cálculo dependen en última instancia del Teorema del Valor Intermedio.

    TEOREMA 8.10. Teorema del Valor Intermedio Let\(f\) Ser una función real continua en un intervalo delimitado cerrado\([a, b]\). Si\(f(a)<L<f(b)\) o\(f(b)<L<f(a)\) luego\[(\exists c \in(a, b)) \quad f(c)=L .\] Prueba. Dejar\(f\) ser una función real continua en un intervalo delimitado cerrado\([a, b]\), y\(f(a)<L<f(b)\). Demostramos el caso especial\(L=0\). Dado el resultado para\(L=0\), el teorema se desprende de la aplicación del caso especial a la función\(f(x)-L\).

    Let\[X=\{x \in[a, b] \mid(\forall y \in[a, x]) f(y) \leq 0\} .\] Entonces\(X \neq \emptyset\) y\(X\) está delimitado arriba por\(b\). Por la Propiedad Límite Mínimo Superior,\(X\) tiene un límite superior mínimo,\(m \leq b\). La función\(f\) es continua, y por lo tanto\(\lim _{x \rightarrow m} f(x)=f(m)\). Si\(f(m)=0\), se prueba el teorema.

    (i) Supongamos que\(f(m)>0\). Vamos\(0<\varepsilon<f(m)\). Para cualquiera\(x \in[a, m)\),\(f(x) \leq 0\) y en\[|f(x)-f(m)| \geq f(m)>\varepsilon\] consecuencia para cualquier\(\delta>0\), hay\(x\) en el pinchado\(\delta\) -barrio de\(m\) tal que\[|f(x)-f(m)| \geq \varepsilon\] Esto contradice la suposición de que\(\lim _{x \rightarrow m} f(x)=f(m)\). Por lo tanto\(f(m) \leq 0 .\)

    ii) Supongamos que\(f(m)<0\). Vamos\(0<\varepsilon<|f(m)|\). Para cualquiera\(\delta>0\), hay\(x \in(m, m+\delta)\) tal que\(f(x)>0\). De lo contrario\[[a, m+\delta) \subseteq X,\] contradiciendo la suposición de que\(m\) es el límite superior mínimo para\(X\). Entonces para cualquiera\(\delta>0\) hay\(x\) en el pinchado\(\delta\) -barrio de\(m\) tal que\[|f(x)-f(m)| \geq|f(m)|>\varepsilon .\] Esto contradice la suposición que\(f\) es continua en\(m\). Por lo tanto\(f(m)=0 .\)

    TEOREMA 8.11. Teorema de Valor Extremo Si\(f\) es una función real continua en un intervalo delimitado cerrado\([a, b]\), entonces\(f\) logra un máximo y un mínimo encendido\([a, b]\).

    Prueba. Mostramos primero que el rango de\(\left.f\right|_{[a, b]}\) está delimitado por encima y por debajo. A modo de contradicción supongamos que el rango de no\(f\) está delimitado por encima. Porque\(n \in \mathbb{N}\), que\(a_{n} \in[a, b]\) sea tal que\(f\left(a_{n}\right)>n\). Por el Teorema de Bolzano-Weierstrass, la secuencia\(\left\langle a_{n}\right\rangle\) tiene una subsecuencia convergente,\(\left\langle a_{g(n)}\right\rangle\), convergente a algún número\(c \in[a, b]\). Por la continuidad de\(f\), si\(c \in(a, b)\) entonces\[f(c)=\lim _{x \rightarrow c} f(x)=\lim _{n \rightarrow \infty} f\left(a_{g(n)}\right) .\] (Ver Ejercicio 8.25.) Si\(c\) es un punto final de\([a, b]\), hacemos la reclamación correspondiente para el límite unilateral apropiado. No obstante, para cualquier\(n \in \mathbb{N}\),\[f\left(a_{g(n)}\right)>g(n)>n .\] por lo tanto,\(\lim _{n \rightarrow \infty} f\left(a_{g(n)}\right)\) no existe. Por lo tanto, el rango de\(f\) está delimitado por encima. Del mismo modo, el rango de\(f\) está delimitado por debajo. Por la Propiedad de Límite Mínimo Superior, el rango de\(f\) tiene un límite superior mínimo\(M\),, y un límite inferior mayor,\(L\).

    Ya que\(M\) es un límite mínimo superior para el rango de\(f\), para cualquier\(\varepsilon>0\), hay\(x \in[a, b]\) tal que\[|f(x)-M|<\varepsilon .\] For\(n \in \mathbb{N}^{+}\), let\(a_{n} \in[a, b]\) be such that\[\left|f\left(a_{n}\right)-M\right|<\frac{1}{n} .\] The sequence \(\left\langle a_{n}\right\rangle\)tiene una subsecuencia convergente según el Teorema de Bolzano-Weierstrass. Dejar\(\left\langle c_{n}\right\rangle\) ser una subsecuencia convergente de\(\left\langle a_{n}\right\rangle\) con límite\(c \in[a, b]\). Dado que\(\left\langle c_{n}\right\rangle\) es una subsecuencia de\(\left\langle a_{n}\right\rangle\), para cualquier\(n \in \mathbb{N}^{+}\),\[\left|f\left(c_{n}\right)-M\right|<\frac{1}{n} .\] De ahí\[\lim _{n \rightarrow \infty} f\left(c_{n}\right)=M .\] Por la continuidad de\(f\),\[\lim _{x \rightarrow c} f(x)=f(c)=\lim _{n \rightarrow \infty} f\left(c_{n}\right)=M .\] si\(c \in(a, b)\) entonces If\(c\) es un punto final de\([a, b]\) tenemos la reivindicación análoga para el límite unilateral apropiado. Por lo tanto\(f\) logra un valor máximo en\([a, b]\). Por un argumento análogo,\(f\) logra un valor mínimo on\([a, b]\).

    Por el Teorema del Valor Extremo, una función continua logra valores extremos en un intervalo delimitado cerrado. Es fácil construir ejemplos para los cuales el teorema falla para intervalos abiertos. El teorema del valor extremo tiene en común con la propiedad de límite inferior superior que garantiza la existencia de un número que satisface una condición deseable sin proporcionar información adicional sobre el número en sí. Muy a menudo basta con saber de manera abstracta que una función alcanza su extremo sin tener que distinguir aún más el objeto. ¿Qué más podemos concluir sobre los valores extremos de una función? TEOREMA 8.12. Dejar\(f\) ser una función real definida en un intervalo\((a, b)\). Si\(c \in(a, b)\) es tal que\(f(c)\) es un valor extremo de\(f\) on\((a, b)\) y\(f\) es diferenciable en\(c\), entonces\(f^{\prime}(c)=0\).

    Prueba. Dejar\(f\) y\(c\) satisfacer las hipótesis del teorema. Supongamos que\(f(c)\) es el valor máximo alcanzado por\(f\) on\((a, b)\). Para cualquier\(x \in(a, c), f(x) \leq f(c)\) y\[\frac{f(c)-f(x)}{c-x} \geq 0 .\] Por lo tanto\[\lim _{x \rightarrow c^{-}} \frac{f(c)-f(x)}{c-x} \geq 0 .\] De manera similar,\[\lim _{x \rightarrow c^{+}} \frac{f(c)-f(x)}{c-x} \leq 0 .\] Sin embargo\(f\) es diferenciable en\(c\), por lo que\[0 \leq \lim _{x \rightarrow c^{-}} \frac{f(c)-f(x)}{c-x}=f^{\prime}(c)=\lim _{x \rightarrow c^{+}} \frac{f(c)-f(x)}{c-x} \leq 0 .\] Un argumento similar prueba la pretensión de\(f(c)\) un valor mínimo de\(f\) on\((a, b)\).

    COROLARIO 8.13. Dejar\(f\) ser una función real continua en un intervalo delimitado cerrado\([a, b]\). Entonces\(f\) logra un máximo y mínimo on\([a, b]\) y si\(c \in[a, b]\) es un número en el que\(f\) logra un valor extremo, entonces uno de los siguientes debe ser cierto de\(c\):

    (i)\(f^{\prime}(c)=0\)

    (ii) no\(f\) es diferenciable en\(c\)

    (iii)\(c\) es un punto final de\([a, b]\).

    TEOREMA 8.14. Teorema del Valor Medio Dejar\(f\) ser una función real continua en un intervalo delimitado cerrado\([a, b]\) y diferenciable en\((a, b)\). Entonces hay\(c \in(a, b)\) tal que\[f^{\prime}(c)=\frac{f(b)-f(a)}{b-a} .\] Prueba. Primero probamos un caso especial del Teorema del Valor Medio, conocido como Teorema de Rolle. Asumir eso\(f(a)=f(b)\). Demostramos que hay\(x \in(a, b)\) tal que\(f^{\prime}(x)=0\).

    Si\(f\) es constante entonces\(f^{\prime}(x)=0\) para todos\(x \in(a, b)\). Supongamos que no\(f\) es constante y que hay\(x \in(a, b)\) tal que\(f(x)>f(a)\). Por el Teorema del Valor Extremo\(f\) logra un valor máximo\(M\) en\([a, b]\). Así,\[M>f(a)=f(b) .\] Seamos\(c \in(a, b)\) tal que\(f(c)=M\). Por Teorema 8.12,\(f^{\prime}(c)=0\). Si hay\(x \in(a, b)\) tal que\(f(x)<f(a)\), la prueba es similar.

    Para probar el Teorema del Valor Medio en general, lo reducimos al Teorema de Rolle. Se resta del segmento\(f(x)\) de línea formado por\((a, f(a))\) y\((b, f(b))\). Dejar\[g(x)=f(x)-f(a)-\frac{f(b)-f(a)}{b-a}(x-a) .\] La función\(g(x)\) satisface las hipótesis del Teorema de Rolle. Entonces hay\(c \in(a, b)\) tal que\(g^{\prime}(c)=0\). Ya que\[g^{\prime}(x)=f^{\prime}(x)-\frac{f(b)-f(a)}{b-a}\] tenemos\[g^{\prime}(c)=f^{\prime}(c)-\frac{f(b)-f(a)}{b-a}=0\] y\[f^{\prime}(c)=\frac{f(b)-f(a)}{b-a} .\] El Teorema del Valor Medio tiene muchas consecuencias prácticas, una de las cuales exponemos aquí.

    COROLARIO 8.15. Dejar\(f\) ser una función diferenciable en\((a, b)\). Si\(f^{\prime}(x)>0\) (resp. \(f^{\prime}(x)<0\)) en\((a, b)\) entonces\(f\) está aumentando (resp. decreciente) en\((a, b)\).

    Cardinalidad de los números reales

    Terminamos el Capítulo 6 con la afirmación no probada de que los números reales son incontables. Ahora que tenemos una definición formal de los números reales, estamos listos para completar nuestra investigación de la cardinalidad de\(\mathbb{R}\). Por Teorema\(6.11\) el conjunto de secuencias decimales infinitas es incontable, con cardinalidad\(2^{\aleph_{0}}\). Pasamos a afirmar que esto tuvo consecuencias para la cardinalidad de\(\mathbb{R}\). Consideramos la cuestión relacionada de la cardinalidad del intervalo unitario cerrado\([0,1]\).

    Proposición 8.16. \(|[0,1]|=|\mathbb{R}|\).

    Comprobante. Definir\(f:[0, \infty) \rightarrow(1 / 2,1]\) por\[f(x)=\frac{1}{x+2}+1 / 2 \text {. }\] Entonces\(f\) es una inyección. \(\mathbb{R}^{-}\)Dejen ser los números reales negativos, y definir\(g: \mathbb{R}^{-} \rightarrow[0,1 / 2)\) por\[g(x)=\frac{-1}{x-2} .\] Entonces\(g\) es una inyección. Que\(h: \mathbb{R} \rightarrow[0,1]\) sea la unión de las funciones\(f\) y\(g\). Entonces\(h\) es claramente una inyección. La función de identidad\([0,1]\) es una inyección en\(\mathbb{R}\). Por el Teorema de Schröder-Bernstein,\[|[0,1]|=|\mathbb{R}| \text {. }\] Investigamos la relación entre las expansiones decimales infinitas (que están relacionadas con secuencias decimales infinitas) y los números reales. Restringiremos nuestra atención a expansiones decimales infinitas de números en el intervalo unitario\([0,1]\).

    DEFINICIÓN. Expansión decimal infinita Para todos\(n \in \mathbb{N}^{+}\), vamos\(a_{n} \in\)\(\ulcorner 10\urcorner\). Entonces\[a_{1} a_{2} \ldots a_{n} \ldots\] es una expansión decimal infinita. Dejar\(s\) ser una expansión decimal infinita\(a_{1} a_{2} \ldots\). Para\(n \in \mathbb{N}\), vamos\[s_{n}:=a_{1} \ldots a_{n}=\sum_{k=1}^{n} a_{k} 10^{-k} .\] Queremos asociar expansiones decimales infinitas con números reales (entendidos como cortes Dedekind). Interpretamos las expansiones decimales infinitas como secuencias Cauchy de números racionales.

    Dejar\(D\) ser el conjunto de expansiones decimales infinitas, y dejar\(f: D \rightarrow \mathbb{R}\) ser definido por\[f\left(. a_{1} \ldots\right)=\lim _{n \rightarrow \infty} s_{n} .\] La secuencia\(\left\langle s_{n}\right\rangle\) es una secuencia de Cauchy por lo que converge a un número real. Let\[L:=\left\{x \in \mathbb{Q} \mid(\exists n \in \mathbb{N}) x<s_{n}\right\} .\] El conjunto\(L\) es un corte Dedekind y\(f(s)=L\). Es decir,\[\lim _{n \rightarrow \infty} s_{n}=L .\]\(L\) es el límite inferior superior del conjunto\(\left\{s_{n} \mid n \in \mathbb{N}\right\}\). Podemos asociar con cada expansión decimal infinita un número real en el intervalo unitario, y así podemos definir una función\(f: D \rightarrow[0,1]\). ¿Es\(f\) una sobrejección? Es decir, ¿cada número real en el intervalo unitario puede realizarse como una expansión decimal infinita? Vamos\(x \in[0,1]\). Definimos una secuencia creciente de números racionales convergiendo a\(x\). Para\(n \in N^{+}\), deja\(s_{n}\) ser la expansión decimal más grande a lugares\(n\) decimales que no es mayor que\(x\). Si\(n<m\), entonces\(s_{n}\) es un truncamiento de\(s_{m}\). Vamos\[s=\lim _{n \rightarrow \infty} s_{n} .\] Entonces\(f(s)=x\). Por lo tanto,\(f\) es una sobreyección sobre\([0,1]\).

    Sería ideal si\(f\) fuera una inyección, pues de ello seguiría que los cortes de Dedekind son solo las infinitas expansiones decimales. Sin embargo esto no es cierto. Supongamos que\[s=. a_{1} \ldots a_{n} a_{n+1} \ldots\] donde\(a_{n} \neq 9\) y para todos\(k>n, a_{k}=9\). Si\[t=. a_{1} \ldots a_{n-1}\left(a_{n}+1\right) 000 \ldots\] entonces\[f(s)=f(t) .\] Si ni\(s\) ni\(t\) son infinitas expansiones decimales que terminan en repetir 9's\(s<t\), y, entonces hay algunas\(n\) tales que\(s<t_{n}\). Entonces el número racional\(\left(s_{n}+t_{n}\right) / 2\) está en el corte de Dedekind\(f(t)\) y no en\(f(s)\), entonces\(f(s) \neq f(t)\). Por lo tanto, hemos demostrado el siguiente teorema.

    TEOREMA 8.17. \(D_{0}\)Sea el conjunto de expansiones decimales infinitas para los números en el intervalo unitario. Dejar\(f: D_{0} \rightarrow[0,1]\) ser definido por\[f\left(. a_{1} a_{2} \ldots\right)=\lim _{n \rightarrow \infty} . a_{1} \ldots a_{n}=\sum_{k=1}^{\infty} a_{k} 10^{-k} .\] Entonces\(f\) es una surjección. Además, dos expansiones decimales distintas se identifican\(f\) por si una de ellas es de la forma\(a_{1} a_{2} \ldots a_{n} 9999 \ldots\) con\(a_{n} \neq 9\) y la otra es. \(a_{1} a_{2} \ldots\left(a_{n}+1\right) 000 \ldots .\)

    COROLARIO 8.18. \(|[0,1]|=2^{\aleph_{0}}\).

    PRUEBA. Por Lema 8.17, Proposición\(6.15\) y Teorema 6.11,\[|[0,1]| \leq\left|D_{0}\right|=\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .\]imagen\[g\left(\left\langle a_{n}\right\rangle\right)=. a_{1} a_{2} \ldots\] y\(h: D_{0} \rightarrow[0,1]\) definirse como en el argumento para el Teorema 8.17. Entonces\(h \circ g:\ulcorner 2\urcorner^{\mathbb{N}} \rightarrow[0,1]\) es una inyección, y así\[2^{\aleph_{0}} \leq|[0,1]| .\] Por el Teorema de Schröder-Bernstein,\[|[0,1]|=2^{\aleph_{0}} .\] COROLARIO 8.19. \(|\mathbb{R}|=2^{\aleph_{0}}\).

    Order-Completitud

    Damos un argumento a favor de la inccountability de\(\mathbb{R}\) depender únicamente de sus propiedades abstractas de orden.

    DEFINICIÓN. Pedido completo Let\((X, \leq)\) Ser un conjunto ordenado linealmente. Se llama order-complete si, siempre\(A\) y\(B\) son subconjuntos no vacíos de\(X\) con la propiedad que\[(\forall a \in A)(\forall b \in B) \quad a \leq b,\] entonces existe\(c\) en\(X\) tal que\[(\forall a \in A)(\forall b \in B) \quad a \leq c \leq b .\] Tenga en cuenta que cualquier order-complete set debe tener la menor propiedad de límite superior - si\(A\) es cualquier conjunto delimitado no vacío, let\(B\) ser el conjunto de todos los límites superiores para\(A\), y luego\(c\) from (8.20) es el límite superior mínimo (único) para \(A\).

    DEFINICIÓN. Denso Let\((X, \leq)\) Ser un conjunto linealmente ordenado, y\(Y \subseteq\)\(X\). Decimos que\(Y\) es denso en\(X\) si\[(\forall a<b \in X)(\exists y \in Y) a<y<b .\] Definición. Extensión Let\(\left(X, \leq_{X}\right)\) y\(\left(Y, \leq_{Y}\right)\) ser conjuntos ordenados linealmente. Decimos que\(\left(Y, \leq_{Y}\right)\) es una extensión de\(\left(X, \leq_{X}\right)\) si\(X \subseteq Y\) y, para todos\(x_{1}, x_{2}\) en\(X\),\[x_{1} \leq_{X} \quad x_{2} \quad \text { iff } \quad x_{1} \leq_{Y} x_{2} .\] TEOREMA 8.21. Dejar\((X, \leq)\) ser una extensión de\((\mathbb{Q}, \leq)\). Si\((X, \leq)\) es orden-completo y\(\mathbb{Q}\) es denso en\(X\), entonces\(X\) es incontable.

    Comprobante. Supongamos que\(X\) es una extensión completa de orden contable\(\mathbb{Q}\) y que\(\mathbb{Q}\) es densa en\(X\).

    Que la secuencia\(\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle\) sea una bijección de\(\mathbb{N}\) a\(X\). Observe que la secuencia impone un orden sobre\(X\). Dejar\(\preceq\) ser definido\(X\) por Es\[(\forall m, n \in \mathbb{N}) a_{m} \preceq a_{n} \Longleftrightarrow m \leq n .\] decir, para cualquiera\(x, y \in X, x \preceq y\) si\(x\) aparece en la secuencia\(\left\langle a_{n}\right\rangle\) anterior\(y\). Entonces\(\preceq\) es un buen orden de\(X\).

    Dado\(Y \subseteq X\) y\(y_{0} \in Y\), decimos que\(y_{0}\) es el elemento\(\preceq\) -minimal de\(Y\) if\[(\forall x \in Y) y_{0} \preceq x .\] Así que cada subconjunto de\(X\) tiene un elemento\(\preceq\) -minimal.

    Vamos a definir dos subsecuencias de\(\left\langle a_{n}\right\rangle\), llamado\(\left\langle a_{f(n)}\right\rangle\) y\(\left\langle a_{g(n)}\right\rangle\), de modo que para cualquier\(n \in \mathbb{N}\)

    (1)\(f(n+1)>g(n)\)

    (2)\(g(n)>f(n)\)

    (3)\(a_{f(n+1)}\) es el elemento\(\preceq\) -minimal del conjunto\[\left\{y \in X \mid a_{f(n)}<y<a_{g(n)}\right\}\] (4)\(a_{g(n+1)}\) es el elemento\(\preceq\) -minimal del conjunto\[\left\{y \in X \mid a_{f(n+1)}<y<a_{g(n)}\right\} .\] Definimos las subsecuencias por recursión usando la secuencia\(\left\langle a_{n}\right\rangle\) para controlar cuidadosamente la construcción. A este argumento se le llama argumento de ida y vuelta. Dadas secuencias finitas de longitud que\(N\) satisfacen las propiedades mencionadas anteriormente, definimos\(a_{f(N+1)}\) sujetas a restricciones impuestas por\(a_{f(N)}\) y\(a_{g(N)}\). Luego definimos\(a_{g(N+1)}\) sujetos a las limitaciones impuestas por\(a_{f(N+1)}\) y\(a_{g(N)}\). Luego definimos\(a_{f(N+2)}, a_{g(N+2)}\), y así sucesivamente.

    Vamos\(f(0)=0\). Entonces\(a_{f(0)}=a_{0}\). Dejar\(g(0)\) ser el entero más pequeño\(n\) tal que\(a_{0}<a_{n}\). Tenga en cuenta que esto equivale a definir\(g(0)\) por lo que\(a_{g(0)}\) es el elemento\(\preceq\) -minimal de\(X\) mayor que\(a_{0}\). Supongamos que hemos definido subsecuencias finitas\(\left\langle a_{f(n)} \mid n \leq N\right\rangle,\left\langle a_{g(n)} \mid n \leq N\right\rangle\) que satisfacen las propiedades de orden enumeradas anteriormente. Definiremos\(a_{f(N+1)}\) y\(a_{g(N+1)}\) satisfaceremos las propiedades de pedido enumeradas anteriormente. El conjunto\(X\) contiene los números racionales y dado que\(\mathbb{Q}\) es denso en\(X\), hay un elemento de\(X\),\(x\), tal que\[a_{f(N+1)}<x<g_{(N+1)} .\] Let\(a_{f(N+1)}\) be the\(\preceq\) -elemento mínimo de\(X\) tal que\[a_{f(N)}<a_{f(N+1)}<a_{g(N)} .\] Since\(\preceq\) es un orden bien definido de\(X, f(N+1)\) está bien definido. Dejamos\(a_{g(N+1)}\) ser el elemento\(\preceq\) -minimal de\(X\) tal que\[a_{f(N+1)}<a_{g(N+1)}<a_{g(N)} .\] Por nuestra discusión anterior,\(g(N+1)\) está bien definido. Observe que para cualquier\(m, n \in \mathbb{N}\),\[a_{f(m)}<a_{g(n)} .\] Por lo tanto la secuencia creciente\(\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle\) está delimitada arriba, y por Lema 8.5, la secuencia converge a su límite inferior superior,\(a\).

    Para cualquiera\(n \in \mathbb{N}\),\[a_{f(n)}<a<a_{g(n) .} .\] So no\(a\) es un término de ninguna subsecuencia. Demostramos que no\(a\) es un término en la secuencia\(\left\langle a_{n}\right\rangle\). Supongamos a modo de contradicción que\(a=a_{n}\) para algunos\(n \in \mathbb{N}\). Ya que\(f(0)=0, n \neq 0\). Let\[Y=(f[\mathbb{N}] \cup g[\mathbb{N}]) \cap\ulcorner n\urcorner .\] Then\(Y \neq \emptyset\) es finito, y tiene un elemento máximo.

    Si el elemento máximo de\(Y\) es\(f(0)\), entonces para cada\(1 \leq k<n\), debemos tener\(a_{k}<a_{0}\). Pero entonces\(g(0)\) sería\(n\), lo que contradice el hecho de que no\(n\) está en el rango de\(g\).

    Si el elemento máximo de\(Y\) es\(f(m+1)\) para algunos\(m\), entonces\(g(m+1)>\)\(n\), y\[f(m+1)<n<g(m+1) .\] Sin embargo\[a_{f(m+1)}<a_{n}<a_{g(m+1)}<a_{g(m) .} .\] Esto es imposible ya que\(a_{g(m+1)}\) es el\(\preceq\) - elemento mínimo de\(X\) en el intervalo abierto\(\left(a_{f(m+1)}, a_{g(m)}\right)\).

    Si el elemento máximo de\(Y\) es\(g(m)\) para algunos\(m\), entonces\(f(m+1)>n\) y\[g(m)<n<f(m+1) .\] Sin embargo\[a_{f(m)}<a_{f(m+1)}<a_{n}<a_{g(m)} .\] Esto es imposible ya que\(a_{f(m+1)}\) es el elemento\(\preceq\) -minimal de \(X\)en el intervalo abierto\(\left(a_{f(m)}, a_{g(m)}\right)\). Entonces no\(a\) es un término en la secuencia\(\left\langle a_{n}\right\rangle\). Por lo tanto no hay bijección de\(\mathbb{N}\) a\(X\), y\(X\) es incontable.

    Por el Ejercicio 8.20,\(\mathbb{Q}\) es denso en\(\mathbb{R}\). Como el conjunto de números reales es orden-completado por el teorema de límite superior mínimo, obtenemos:

    COROLARIO 8.22. El conjunto de números reales es incontable.

    TEOREMA 8.23. Dejar\(\left(X, \leq_{X}\right)\) ser una extensión orden-completa de\(\mathbb{Q}\) en la que\(\mathbb{Q}\) es densa, y tal que no\(X\) tiene elemento máximo o mínimo. Luego hay una bijección conservadora de orden de\(\mathbb{R}\) hacia adelante\(X\) que es la identidad en adelante\(\mathbb{Q}\).

    Comprobante. Definamos un mapa\(f: \mathbb{R} \rightarrow X\). Si\(q \in \mathbb{Q}\), defina\(f(q)=q\). Si\(\alpha \in \mathbb{R} \backslash \mathbb{Q}\), defina\(f(\alpha)\) que sea el límite inferior superior en\(X\) de\(\{q \in \mathbb{Q} \mid q \leq \alpha\}\). La función\(f\) está bien definida, porque\(X\) tiene la Propiedad de Límite Mínimo Superior. Es inyectivo, porque si\(\alpha \neq \beta\), hay números racionales entre\(\alpha\) y\(\beta\).

    Mostrar\(f\) es sobre, supongamos\(x \in X\). \(\alpha \in \mathbb{R}\)Definir para ser el límite inferior superior en\(\mathbb{R}\) de\(\left\{q \in \mathbb{Q} \mid q \leq_{X} x\right\}\). Entonces\(f(\alpha)=x\).

    Finalmente,\(f\) se preserva el orden porque si\(\alpha \leq \beta\), entonces\(f(\beta)\) se define como el límite inferior superior de un superconjunto del conjunto cuyo límite inferior superior es\(f(\alpha)\), y así\(f(\alpha) \leq_{X} f(\beta)\).

    OBSERVACIÓN. ¿Qué pasa si bajamos el requisito que no\(X\) tienen elemento máximo o mínimo?

    Ejercicios

    EJERCICIO 8.1. Dejar\(S\) ser la función sucesora en la Definición 8.1. Demostrar que\[S(\emptyset) \neq \emptyset .\] Probar que para cualquier conjunto\(X\),\[S(X) \neq X .\] EJERCICIO 8.2. Demostrar que ningún subconjunto apropiado de\(\mathbf{N}\) (ver ecuación 8.1) es inductivo.

    EJERCICIO 8.3. Dejar\(\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in Y\right\}\) ser una familia de conjuntos inductivos indexados por\(Y\). Demostrar que\[\bigcap_{\alpha \in Y} X_{\alpha}\] es inductivo.

    EJERCICIO 8.4. Demostrar que la suma y multiplicación en\(\mathbb{N}\) (como se define formalmente en la Sección 8.1) son asociativas, conmutativas y distributivas.

    EJERCICIO 8.5. Demostrar que la relación\(\leq\) definida\(\mathbb{N}\) en Sección\(8.1\) es un ordenamiento lineal de\(\mathbb{N}\).

    EJERCICIO 8.6. Demostrar que la suma y multiplicación en\(\mathbb{Z}\) (como se define formalmente en la Sección 8.2) son asociativas, conmutativas y distributivas.

    EJERCICIO 8.7. Demostrar que la relación\(\leq\) definida\(\mathbb{Z}\) en Sección\(8.2\) es un ordenamiento lineal de\(\mathbb{Z}\).

    EJERCICIO 8.8. Demostrar que\(\leq\) es un buen ordenamiento de\(\mathbb{N}\) pero no de\(\mathbb{Z}\) (utilizando la definición formal de la relación).

    EJERCICIO 8.9. Demostrar que la suma y multiplicación en\(\mathbb{Z}\) y la relación\(\leq\) sobre\(\mathbb{Z}\) extiende las operaciones y la relación sobre\(\mathbb{N}\). Dejar\(I: \mathbb{N} \rightarrow \mathbb{Z}\) ser definido por\[I(n)=[\langle n, 0\rangle] .\] Demostrar que\(I\) es una inyección y eso para todos\(m, n \in \mathbb{N}\),\[I(m+n)=I(m)+I(n),\]\[I(m \cdot n)=I(m) \cdot I(n)\] y\[m \leq n \Rightarrow I(m) \leq I(n)\] Tenga en cuenta que las operaciones en los lados izquierdos de las ecuaciones \(8.24\)y\(8.25\) se definen en\(\mathbb{N}\) y en el lado derecho se definen en\(\mathbb{Z}\). De igual manera, el antecedente de enunciado\(8.26\) se define en\(\mathbb{N}\) y la consecuencia se define en\(\mathbb{Z}\).

    EJERCICIO 8.10. Demostrar que la suma y la multiplicación\(\mathbb{Q}\) (como se define formalmente en la Sección 8.3) son asociativas, conmutativas y distributivas.

    EJERCICIO 8.11. Demostrar que la relación\(\leq\) definida\(\mathbb{Q}\) en Sección\(8.3\) es un ordenamiento lineal de\(\mathbb{Q}\).

    EJERCICIO 8.12. Demostrar que la suma y multiplicación\(\mathbb{Q}\) y la relación\(\leq\) sobre\(\mathbb{Q}\) extiende las operaciones y la relación sobre\(\mathbb{Q}\). Dejar\(I: \mathbb{Z} \rightarrow \mathbb{Q}\) definirse por\[I(a)=[\langle a, 1\rangle] .\] Probar que\(I\) es una inyección y que para todos\(a, b \in \mathbb{Z}\),\ [\ begin {recopilados} I (a+b) =I (a) +I (b)\\ I (a\ cdot b) =I (a)\ cdot I (b) \ end {recopilados}\] y\[a \leq b \Rightarrow I(a) \leq I(b)\] Nota que las operaciones en los lados izquierdos de las ecuaciones\(8.27\) y\(8.28\) se definen en\(\mathbb{Z}\) y en el lado derecho se definen en\(\mathbb{Q}\). De igual manera, el antecedente de enunciado\(8.29\) se define en\(\mathbb{Z}\) y la consecuencia se define en\(\mathbb{Q}\).

    EJERCICIO 8.13. Demostrar que cada elemento distinto de cero de\(\mathbb{Q}\) tiene un inverso multiplicativo en\(\mathbb{Q}\). EJERCICIO 8.14. Probar declaraciones (1), (2) y (3) en la Sección 8.4.

    EJERCICIO 8.15. Demostrar Teorema 8.2.

    EJERCICIO 8.16. Dejar\(X \subseteq \mathbb{R}, Y \subseteq \mathbb{R}\) y dejar que cada elemento de\(X\) ser menos que cada elemento de\(Y\). Demostrar que hay\[(\forall x \in X)(\forall y \in Y) x \leq a \leq y .\] EJERCICIO\(a \in \mathbb{R}\) satisfactorio 8.17. \(X \subseteq \mathbb{R}\)Déjese acotar arriba. Demostrar que el límite inferior superior de\(X\) es único.

    EJERCICIO 8.18. \(X \subseteq \mathbb{R}\)Déjese acotar a continuación. Demostrar que\(X\) tiene un mayor límite inferior.

    EJERCICIO 8.19. Sólo se probó el caso especial del Teorema de Bolzano-Weierstrass (Teorema 8.6) (donde\([b, c]\) está el intervalo unitario cerrado,\([0,1])\). Generalizar la prueba a\(b, c \in \mathbb{R}\) donde arbitraria\(b \leq c\).

    EJERCICIO 8.20. Vamos\(X \subseteq \mathbb{R}\). Decimos que\(X\) es denso en\(\mathbb{R}\) si se da alguno\(a, b \in \mathbb{R}\) con\(a<b\), hay\(x \in X\) tal que\[a \leq x \leq b .\] a) Demostrar que\(\mathbb{Q}\) es denso en\(\mathbb{R}\).

    b) Demostrar que\(\mathbb{R} \backslash \mathbb{Q}\) es denso en\(\mathbb{R}\).

    EJERCICIO 8.21. Dejar\(\left\langle a_{n}\right\rangle\) ser una secuencia de inyección. ¿Cuál es la cardinalidad del conjunto de todas las subsecuencias de\(\left\langle a_{n}\right\rangle\)? ¿Qué se puede decir sobre el conjunto de subsecuencias de una secuencia no inyectable?

    EJERCICIO 8.22. Dejar\(s\) ser una expansión decimal infinita, y para cualquiera\(n \in \mathbb{N}^{+}\), dejar\(s_{n}\) ser el truncamiento de\(s\) a la posición\(n^{t h}\) decimal. Demostrar que la secuencia\(\left\langle s_{n}\right\rangle\) es una secuencia de Cauchy.

    EJERCICIO 8.23. Dejar\(\left\langle a_{n}\right\rangle\) ser una secuencia convergente y\(\left\langle a_{f(n)}\right\rangle\) ser una subsecuencia de\(\left\langle a_{n}\right\rangle\). Demostrar que\[\lim _{n \rightarrow \infty} a_{n}=\lim _{n \rightarrow \infty} a_{f(n)} .\] Exercise 8.24. Demostrar la siguiente generalización de la desigualdad triangular: si la serie\(\sum_{n=0}^{\infty} a_{n}\) converge, entonces\[\left|\sum_{n=0}^{\infty} a_{n}\right| \leq \sum_{n=0}^{\infty}\left|a_{n}\right| .\] EJERCICIO 8.25. Dejar\(f\) ser una función real continua en\(a\), y dejar\(\left\langle a_{n}\right\rangle\) ser una secuencia convergente a\(a\). Demostrar que\[\lim _{n \rightarrow \infty} f\left(a_{n}\right)=f(a) .\] Exercise 8.26. Dar un ejemplo de una función continua en un intervalo abierto que logre sus valores extremos en el intervalo. Dar un ejemplo de una función continua definida en un intervalo abierto que no alcanza sus valores extremos en el intervalo.

    EJERCICIO 8.27. Completar la prueba del Teorema\(8.12\) - es decir, probar el resultado por\(f(c)\) un valor mínimo de\(f\) on\((a, b)\).

    EJERCICIO 8.28. Demostrar Corolario 8.15.

    EJERCICIO 8.29. Demostrar que cualquier función real de inyección continua en un intervalo es monótona en ese intervalo.

    EJERCICIO 8.30. Demostrar que no hay bijección continua de\((0,1)\) a\([0,1]\).

    EJERCICIO 8.31. Demostrar que cada polinomio\(\mathbb{R}[x]\) de grado impar tiene al menos una raíz real.

    EJERCICIO 8.32. Demuestra que si tienes una mesa cuadrada, con patas de igual longitud, y un piso continuo, siempre puedes rotar la mesa para que las 4 patas estén simultáneamente en contacto con el piso. (Pista: Aplicar el teorema del valor Intermedio a una función elegida apropiadamente). Esta es una de las primeras aplicaciones de las matemáticas a las cafeteras.

    EJERCICIO 8.33. La prueba de la Proposición 8.16 requiere que los números reales distintos de cero tengan recíprocos (y de ahí que los cocientes de los números reales estén bien definidos). Demostrar que los números reales distintos de cero tienen recíprocos. EJERCICIO 8.34. Demostrar que hay exactamente 4 extensiones de orden completo de\(\mathbb{Q}\) en las que\(\mathbb{Q}\) es denso. CAPÍTULO 9

    Números Complejos

    Cubicos

    ¿Cómo se encuentran las raíces de un polinomio cúbico? Los babilonios conocían la fórmula cuadrática en el segundo milenio antes de Cristo, pero una fórmula para el cúbico solo se encontró en el\(16^{\text {th }}\) siglo. La historia del descubrimiento es complicada, pero la mayor parte del crédito debería ir a Nicolo Tartaglia. La solución fue publicada en 1545 en el influyente libro Artis magnae sive de regulis algebraicis liber unus de Girolomo Cardano. \(9.2\)La fórmula se conoce hoy como la fórmula Tartaglia-Cardano. Para un relato histórico, véase por ejemplo [6].

    Considerar un polinomio cúbico en\(\mathbb{R}[x]\)\[p(x)=a_{3} x^{3}+a_{2} x^{2}+a_{1} x+a_{0} .\] Si queremos encontrar las raíces, no hay pérdida de generalidad al asumir que\(a_{3}=1\), ya que los ceros de\(p\) son los mismos que los ceros de\(\frac{1}{a_{3}} p\).

    La segunda simplificación es que podemos asumir\(a_{2}=0\). Efectivamente, hacer el cambio de variable\[x=y-\beta,\] para\(\beta\) que algunos sean elegidos posteriormente. Entonces\ [\ begin {alineado} p (x) &=x^ {3} +a_ {2} x^ {2} +a_ {1} x+a_ {0}\\ & =( y-\ beta) ^ {3} +a_ {2} (y-\ beta) ^ {2} +a_ {1} (y-\ beta) +a_ {0}\ & =y^ {3} +\ izquierda [a_ {2} -3\ beta\ derecha] y^ {2} +\ izquierda [a_ {1} -2 a_ {2}\ beta+3\ beta^ {2}\ derecha] y+\ izquierda [a_ {0} -a_ {1}\ beta+a_ {2}\ beta^ {2} -\ beta^ {3}\ derecho]\\ & ; =:\ quad q (y). \ end {alineado}\] Elija\(\beta=a_{2} / 3\). Entonces el coeficiente de\(y^{2}\) in se\(q(y)\) desvanece. Supongamos que puedes encontrar las raíces de\(q\), llámalos\(\alpha_{1}, \alpha_{2}, \alpha_{3}\). Entonces\(p\) son las raíces del polinomio original\(\alpha_{1}-\beta, \alpha_{2}-\beta, \alpha_{3}-\beta\).

    Por lo tanto, basta con encontrar una fórmula para las raíces de un cúbico en el que el término cuadrático se desvanece. A esto se le llama cúbico reducido. Como ahora solo quedan dos coeficientes, bajaremos los subíndices y escribiremos nuestro cúbico reducido como\[q(x)=x^{3}+a x+b .\] La idea clave es hacer otra sustitución, más ingeniosa. Introduzcamos una nueva variable\(w\), relacionada con\(x\) por\[x=w+\frac{c}{w},\] donde\(c\) es una constante que elegiremos más adelante. Entonces\ [\ comenzar {alineado} q (x) &=\ izquierda (w+\ frac {c} {w}\ derecha) ^ {3} +a\ izquierda (w+\ frac {c} {w}\ derecha) +b\\ &=w^ {3} + [3 c+a] w+\ izquierda [3 c^ {2} +a c\ derecha]\ frac {1} {w} +c^ {3}\ frac {1} {w^ {3}} +b. \ end {aligned}\] Elija\[c=-\frac{a}{3},\] para que tanto el coeficiente\(w\) de como\(1 / w\) en (9.4) desaparezcan. \(x\)Entonces encontrar así que\(q(x)=0\) es lo mismo que encontrar\(w\) para que\ [\ begin {aligned} w^ {3} +\ frac {c^ {3}} {w^ {3}} +b &=0\ \ Longleftrightarrow w^ {6} +b w^ {3} +c^ {3} &=0. \ end {aligned}\] La ecuación (9.5) es de grado 6, que parece peor que el cúbico original; pero desaparecen tantos términos que en realidad es una ecuación cuadrática en\(w^{3}\). Por lo tanto se puede resolver por la fórmula cuadrática:\[w^{3}=\frac{-b \pm \sqrt{b^{2}-4 c^{3}}}{2} .\] Sabiendo\(w\), podemos recuperarnos\(x\) por\[x=w+\frac{c}{w}=w-\frac{a}{3 w} .\] Así llegamos a la fórmula Tartaglia-Cardano para las raíces del cúbico reducido (9.2):\[x=\left[\frac{-b \pm \sqrt{b^{2}+\frac{4 a^{3}}{27}}}{2}\right]^{1 / 3}-\frac{a}{3\left[\frac{-b \pm \sqrt{b^{2}+\frac{4 a^{3}}{27}}}{2}\right]^{1 / 3}} .\] ¿Cómo funciona el ¿trabajo de fórmula en la práctica?

    EJEMPLO 9.8. Vamos\(p(x)=x^{3}-3 x+2\). Entonces\(c=1\), y (9.6) dice\(w^{3}=-1\). Por lo tanto\(w=-1\), y así\(x=-2\) es una raíz. Por lo tanto, por Lemma\(4.13,(x+2)\) es un factor de\(p\). Factorización, obtenemos\[x^{3}-3 x+2=(x+2)\left(x^{2}-2 x+1\right) .\] El último término factores como\((x-1)^{2}\), por lo que concluimos que las raíces son\(-2,1,1\).

    En el Ejemplo 9.8, la fórmula funcionó, pero sólo nos dio una de las raíces. Considera el siguiente ejemplo:

    EJEMPLO 9.9. Vamos\[p(x)=x^{3}-3 x+1 .\] Entonces\(c=1\), y\[w^{3}=\frac{-1 \pm \sqrt{-3}}{2} .\] Ahora tenemos un problema peor:\(w^{3}\) implica la raíz cuadrada de un número negativo, y aunque le demos sentido a eso, entonces tenemos que extraer una raíz cubo. ¿Es esto analágico a tratar de resolver la ecuación cuadrática?\[q(x):=x^{2}+x+1=0 ?\] La fórmula cuadrática vuelve a dar el lado derecho de\((9.11)\), y lo explicamos diciendo que de hecho no\(q\) tiene raíces reales. En efecto, la gráfica muestra que\(q\) se parece a la Figura 9.12.

    imagen

    FIGURA 9.12. Parcela de\(q(x)=x^{2}+x+1\)

    Pero esto no puede ser el caso\(p\). En efecto,\ [\ begin {aligned} p (-2) &=-1<0\\ p (0) &=1>0\\ p (1) &=-1<0\\ p (2) &=3>0 \ end {aligned}\] Por lo tanto, por el Teorema del Valor Intermedio\(8.10, p\) debe tener una raíz en cada uno de los intervalos\((-2,0),(0,1)\) y \((1,2)\). Como\(p\) puede tener como máximo 3 raíces por Teorema\(4.10\), por lo tanto, debe tener exactamente tres raíces. Una gráfica de\(p\) se parece a la Figura 9.13.

    Resulta que se pueden encontrar las raíces de\(p\) en Ejemplo\(9.9\) interpretando correctamente la fórmula Tartaglia-Cardano. Volveremos a este ejemplo en la Sección 9.3, después de que desarrollemos las ideas necesarias. La gran idea es introducir la noción de un número complejo.

    Números Complejos

    DEFINICIÓN. Número complejo Un número complejo es una expresión de la forma\(a+i b\), donde\(a\) y\(b\) son números reales.

    imagen

    FIGURA 9.13. Parcela de\(p(x)=x^{3}-3 x+1\)

    Por el momento, se puede pensar\(i\) en el in\(a+i b\) como un símbolo formal, o un lugaretero. Posteriormente, veremos que tiene otra interpretación.

    Notación. \(\mathbb{C}\)Vamos a dejar\(\mathbb{C}\) denotar el conjunto de todos los números complejos:\[\mathbb{C}=\{a+i b: a, b \in \mathbb{R}\} .\] Como conjunto, uno puede identificarse\(\mathbb{C}\) con de la\(\mathbb{R}^{2}\) manera obvia. Esto nos permite definir la suma; lo que no es tan obvio es que también hay una buena definición para la multiplicación.

    DEFINICIÓN. Dejar\(a+i b\) y\(c+i d\) ser números complejos. Entonces su suma y producto son definidos por\ [\ begin {aligned} (a+i b) + (c+i d) & =( a+c) +i (b+d)\\ (a+i b)\ times (c+i d) & =( a c-b d) +i (a d+b c). \ end {aligned}\] La fórmula para la suma (9.14) es justo lo que obtendrías si identificaras el número complejo\(a+i b\) con el vector\((a, b)\) en\(\mathbb{R}^{2}\) y usaras la suma del vector. El producto es más sutil. Si multiplicas el lado izquierdo de (9.15), obtienes\[a c+i(a d+b c)+i^{2} b d .\] Uno llega al lado derecho de (9.15) definiendo\[i^{2}=-1 \text {. }\] Así\(i\) es la raíz cuadrada de\(-1\); es decir, es una cantidad algebraica que introducimos que se define a tener la propiedad que es su plaza\(-1\). Obviamente esto\(i\) impide ser un número real.

    En esencia hemos continuado el programa de definición de sistemas numéricos que iniciamos en el Capítulo 8. La suma y multiplicación de números complejos se han definido por operaciones algebraicas sobre\(\mathbb{R} \times \mathbb{R}\). Dado que las operaciones algebraicas sobre los números reales se definieron teóricamente, hemos definido operaciones algebraicas en operaciones\(\mathbb{C}\) por conjunto. A diferencia de los otros sistemas de números que hemos definido, no definimos un orden lineal de\(\mathbb{C}\). Generalmente no es útil pensar en números complejos en una recta numérica. Sin embargo, es muy útil pensar en los números complejos como puntos en el plano\(\mathbb{R}^{2}\), y describirlos en coordenadas polares.

    Como es habitual, el punto con coordenadas cartesianas\((x, y)\) tiene coordenadas polares\((r, \theta)\), donde están relacionadas por\ [\ begin {array} {cl} r=\ sqrt {x^ {2} +y^ {2}} &\ tan (\ theta) =y/x\\ x=r\ cos\ theta & y=r\ sin\ theta. \ end {array}\] Así que el número complejo también se\(z=x+i y\) puede escribir como\[z=r(\cos \theta+i \sin \theta) .\] La forma (9.18) es tan ampliamente utilizada que hay una notación especial para ello.

    imagen

    FIGURA 9.17. Coordenadas polares

    Notación. \[\operatorname{Cis}(\theta):=\cos \theta+i \sin \theta .\]DEFINICIÓN CIS. Para el número complejo\(z=x+i y=r \operatorname{Cis}(\theta)\), tenemos lo siguiente:

    \(\Re(z) x\)se llama la parte real de\(z\), escrito\(\Re(z)\);

    \(\Im(z) y\)se llama la parte imaginaria de\(z\), escrito\(\Im(z)\);

    \(|z| r\)se llama el módulo de\(z\), o valor absoluto de\(z\), escrito\(|z|\);\(\arg (z) \theta\) se llama el argumento de\(z\), escrito\(\arg (z)\).

    \(\bar{z}\)El número\(x-i y\) se llama el conjugado de\(z\), escrito\(\bar{z}\).

    OBSERVACIÓN. Hay un punto importante a tener en cuenta sobre el argumento: sólo es único hasta la adición de múltiplos de\(2 \pi\). En otras palabras, si\(\theta_{0}\) es un argumento del número complejo\(z\), entonces también lo son todos los números\(\left\{\theta_{0}+2 k \pi: k \in \mathbb{Z}\right\}\). La adición es más fácil en coordenadas cartesianas: agregar las partes reales e imaginarias. La multiplicación es más fácil en coordenadas polares: multiplicar los módulos y sumar los argumentos.

    Proposición 9.19. Dejar\(z_{1}=r_{1} \operatorname{Cis}\left(\theta_{1}\right)\) y\(z_{2}=r_{2} \operatorname{Cis}\left(\theta_{2}\right)\). Después\[z_{1} z_{2}=r_{1} r_{2} \operatorname{Cis}\left(\theta_{1}+\theta_{2}\right) .\] Prueba. Multiplicando, obtenemos\ [\ begin {alineado} z_ {1} z_ {2} =r_ {1} r_ {2}\ left [\ cos\ theta_ {1}\ cos\ theta_ {2} -\ sin\ theta_ {1}\ sin\ theta_ {2}\ derecha. \\ &\ izquierda. +i\ izquierda (\ cos\ theta_ {1}\ sin\ theta_ {2} +\ cos\ theta_ {2}\ sin\ theta_ {1}\ derecha)\ derecha]. \ end {aligned}\] El resultado sigue por las identidades trigonométricas para el coseno y el seno de la suma de dos ángulos.

    Una consecuencia de la Proposición\(9.19\) es la siguiente fórmula para elevar un número complejo a una potencia, llamada teorema de De Moivre.

    TEOREMA 9.20. Teorema de De Moivre Let\(z=r \operatorname{Cis}(\theta)\) be a nonzero complex number, and let\(n \in \mathbb{Z}\). Después\[z^{n}=r^{n} \operatorname{Cis}(n \theta) .\] Prueba. Si\(n \geq 0\), entonces se\((9.21)\) puede probar por inducción a partir de la Proposición 9.19. Por\(n\) negativo, basta con observar que por Proposición Ahora\(9.19\)\[[r \operatorname{Cis}(\theta)]\left[r^{-1} \operatorname{Cis}(-\theta)\right]=1 \operatorname{Cis}(0)=1 .\] podemos demostrar que cada número complejo distinto de cero tiene\(n^{\text {th }}\) raíces exactamente\(n\) distintas.

    TEOREMA 9.22. Dejar\(z=r \operatorname{Cis}(\theta)\) ser un número complejo distinto de cero, y dejar\(n\) ser un entero mayor que 1. Entonces hay exactamente números\(n\) complejos que\(w\) satisfacen la ecuación\(w^{n}=z\). Ellos son\[\left\{r^{1 / n} \operatorname{Cis}\left(\frac{\theta}{n}+\frac{2 k \pi}{n}\right): k=0,1, \ldots, n-1\right\} .\] Prueba. Supongamos que\(w=\rho \operatorname{Cis}(\phi)\) es una\(n^{\text {th }}\) raíz de\(z\). Entonces por el teorema de De Moivre,\(\rho^{n}=r\) y\(n \phi\) es un argumento de\(z\). Como\(\rho\) debe ser un número real positivo, es la\(n^{\text {th }}\) raíz positiva única de\(r\). El número\(n \phi\) puede ser cualquier argumento de\(z\), así que tenemos\[n \phi=\theta+2 k \pi, \quad k \in \mathbb{Z} .\] Así\(\phi\) puede tener la forma\[\frac{\theta}{n}+\frac{2 k \pi}{n}\] para cualquier entero\(k\). No obstante,\(\phi\) diferentes's darán lugar al mismo número complejo\(w\) si difieren en un múltiplo de\(2 \pi\). Entonces hay exactamente\(n\) diferentes\(w\) de las que son\(n^{\text {th }}\) raíces de\(z\).

    EJEMPLO 9.24. ¿De qué nos\(9.22\) dice el Teorema son las raíces cuadradas\(-1\)? Dejamos\(r=1\) y\(\theta=\pi\), y obtenemos las raíces cuadradas son\(\operatorname{Cis}(\pi / 2)=i\) y\(\operatorname{Cis}(-\pi / 2)=-i\).

    EJEMPLO 9.25. Encuentra las raíces cubicas de\(1 .\)

    En la notación de Teorema\(9.22, r=1\) y\(\theta=0\). Por lo tanto las raíces cúbicas son\ [\ begin {alineadas} 1 &=\ operatorname {Cis} (2\ pi/3) =-\ frac {1} {2} +i\ frac {\ sqrt {3}} {2} \\ omega^ {2} &=\ operatorname {Cis} (4\ pi/3) =-\ frac {1} {2} -i\ frac {\ sqrt {3}} {2}. \ end {aligned}\] El número\(\omega\) se llama raíz cúbica primitiva de la unidad, porque todas las raíces cúbicas se obtienen como\(\omega, \omega^{2}, \omega^{3}\).

    DEFINICIÓN. Raíz primitiva de la unidad Una\(n^{\text {th }}\) raíz primitiva de la unidad es un número\(\omega\) tal que\(\left\{1, \omega, \omega^{2}, \ldots, \omega^{n-1}\right\}\) constituye todas las\(n^{\text {th }}\) raíces de 1.

    Proposición 9.26. Dejar\(z\) ser un número complejo, y\(w_{0}\) ser alguna\(n^{\text {th }}\) raíz de\(z\). \(\omega\)Sea una\(n^{\text {th }}\) raíz primitiva de unidad. Entonces todas las\(n^{\text {th }}\) raíces de\(z\) son\(\left\{w_{0}, \omega w_{0}, \omega^{2} w_{0}, \ldots, \omega^{n-1} w_{0}\right\}\).

    Tartaglia-Cardano Revisitado

    Consideremos de nuevo Ejemplo 9.9. Queríamos encontrar las raíces cúbicas de\[\zeta_{\pm}=\frac{-1 \pm \sqrt{-3}}{2} .\] Si tomamos la\(+\) señal, obtenemos\[\zeta_{+}=\operatorname{Cis}(2 \pi / 3),\] y si tomamos el - signo, obtenemos\[\zeta_{-}=\operatorname{Cis}(4 \pi / 3) .\] Así\(\zeta_{+}\) tiene 3 raíces, es decir\[\left\{\operatorname{Cis}\left(\frac{2 \pi}{9}+\frac{2 k \pi}{3}\right): k=0,1,2\right\} \text {, }\] y\(\zeta_{-}\) tiene 3 raíces, a saber\[\left\{\operatorname{Cis}\left(\frac{4 \pi}{9}+\frac{2 k \pi}{3}\right): k=0,1,2\right\} \text {, }\] Saber\(w\), queremos encontrar\(x\), que por ejemplo\(9.9\) viene dado por\(w+1 / w\). Para cualquier número\(w\) que pueda escribirse como\(\operatorname{Cis}(\theta)\) (es decir, cualquier número complejo de módulo 1), tenemos\ [\ begin {aligned} w+\ frac {1} {w} &=\ cos\ theta+i\ sin\ theta+\ cos (-\ theta) +i\ sin (-\ theta)\\ &=2\ cos\ theta. \ end {aligned}\] Por lo tanto las raíces del polinomio dadas en (9.10)\[\left\{2 \cos \frac{2 \pi}{9}, 2 \cos \frac{8 \pi}{9}, 2 \cos \frac{14 \pi}{9}, 2 \cos \frac{4 \pi}{9}, 2 \cos \frac{10 \pi}{9}, 2 \cos \frac{16 \pi}{9}\right\} .\] son ¿Son estas 6 raíces diferentes? Teorema\(4.10\) dice que\(p\) puede tener como máximo 3 raíces diferentes. Como\(\cos (\theta)=\cos (2 \pi-\theta)\), vemos nuestro conjunto (9.27) puede escribirse como\[\left\{2 \cos \frac{2 \pi}{9}, 2 \cos \frac{4 \pi}{9}, 2 \cos \frac{8 \pi}{9}\right\} .\] Resulta que la fórmula Tartaglia-Cardano (9.7) sí da las tres raíces del cúbico, y además no importa si uno elige el\(-\) signo\(+\) o, siempre y cuando como se calcula las 3 raíces cubitas de (9.6) para alguna elección de signo. Utilizaremos\(\mathbb{C}[z]\) para denotar el conjunto de polinomios en\(z\) con coeficientes de\(\mathbb{C}\).

    TEOREMA 9.29. Considerar el polinomio\[p(z)=z^{3}+a z+b\] en\(\mathbb{C}[z]\), y asumir\(a \neq 0\). Let\(c=-a / 3\), y\[\zeta=\frac{-b+\sqrt{b^{2}-4 c^{3}}}{2} .\] let\(\zeta\) be Let\(w_{1}, w_{2}, w_{3}\) be las tres distintas raíces cubitas de\(\zeta\). Para cada uno\(w_{i}\), defina\(z_{i} b y\)\[z_{i}=w_{i}+\frac{c}{w_{i}} .\] Entonces\[p(z)=\left(z-z_{1}\right)\left(z-z_{2}\right)\left(z-z_{3}\right) .\] REMARCA. De la prueba se deduce que no importa qué raíz cuadrada de\(b^{2}-4 c^{3}\) uno elija en (9.31).

    Comprobante. Si\(p\) está dado por (9.32), entonces\[p(z)=z^{3}-\left(z_{1}+z_{2}+z_{3}\right) z^{2}+\left(z_{1} z_{2}+z_{2} z_{3}+z_{3} z_{1}\right) z-\left(z_{1} z_{2} z_{3}\right) .\] Debemos demostrar que los coeficientes en (9.33) coinciden con los de (9.30). Por la Proposición 9.26, podemos asumir\[w_{1}=\omega w_{3}, \quad w_{2}=\omega^{2} w_{3}\] dónde\(\omega=-\frac{1}{2}+i \frac{\sqrt{3}}{2}\) está una primitiva raíz cubo de unidad. En los siguientes cálculos, utilizamos los hechos que\(\omega^{2}=1 / \omega\) y\(1+\omega+\omega^{2}=0\). (¿Por qué son ciertas estas?) Observe eso\(w_{3} \neq 0\), como eso obligaría\(c=0\).

    El coeficiente de\(z^{2}\) in (9.33) es\ [\ begin {alineado} -\ left (z_ {1} +z_ {2} +z_ {3}\ right) &=-w_ {3}\ left (\ omega+\ omega^ {2} +1\ right) -\ frac {1} {w_ {3}}\ left (\ omega^ {2} +\ omega+1\ derecha)\\ &=0. \ end {alineado}\] El coeficiente de\(z\) es\ [\ begin {alineado} z_ {1} z_ {2} +z_ {2} z_ {3} +z_ {3} z_ {1} =&\ left (\ omega w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ derecha)\ izquierda (\ omega^ {2} w_ {3} +c\ omega\ frac {1} {w_ {3}}\ derecha)\\ &+\ izquierda (\ omega^ {2} w_ {3} +c\ omega\ frac {1} {w_ {3}}\ derecha)\ izquierda (w_ {3} +c\ frac {1} {w_ {3}}\ derecha)\\ &+\ izquierda (w_ {3} +c\ frac {1} {w_ {3}}\ derecha)\ izquierda (\ omega w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ derecha)\\ =& w_ {3} ^ {2}\ izquierda (1+\ omega^ {2} +\ omega\ derecha) +3 c\ izquierda (\ omega+\ omega^ {2}\ derecha) +\ frac {c^ {2}} {w_ {3} ^ {2}}\ izquierda (1+\ omega+\ omega^ {2}\ derecha)\\ =&-3 c\ =& a. \ end {alineado}\] El término constante en (9.33) es\ [\ begin {alineado} -z_ {1} z_ {2} z_ {3} &=-\ left (\ omega w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ right)\ left (\ omega^ {2} w_ {3} +c\ omega\ frac {1} {w_ {3}}\ derecha)\ izquierda (w_ {3} +\ frac {1} {w_ {3}}\ derecha)\\ &=-w_ {3} ^ {3} -c w_ {3}\ izquierda (1+\ omega^ {2} +\ omega\ derecha) -\ frac {c^ {2}} {\ frac {1} {w_ {3}}}\ izquierda (\ omega+1+\ omega^ {2}\ derecha) -\\ &=-\ zeta-\ frac {c^ {3}} {\ zeta}\\ &=-\ frac {-b+\ sqrt {b^ {2} -4 c^ {3}}} {2} -\ frac {2 c^ {3}} {-b+\ sqrt {b^ {2} -4 c^ {3}}}\\ &=\ frac {-b^ {2} +2 b\ sqrt {b^ {2} -4 c^ {3}} -\ izquierda (b^ {2} -4 c^ {3}\ derecha) -4 c^ {3}} {2\ left (-b+\ sqrt {b^ {2} -4 c^ {3}} \ derecha)}\\ &=\ frac {b\ izquierda (-b+\ sqrt {b^ {2} -4 c^ {3}}\ derecha)} {-b+\ sqrt {b^ {2} -4 c^ {3}}}\\ &=b. \ end {aligned}\] Por lo tanto todos los coeficientes de (9.30) y (9.32) coinciden, por lo que son el mismo polinomio.

    Por lo tanto, la fórmula Tartaglia-Cardano da las tres raíces a un polinomio cúbico reducido\(p\) con coeficientes complejos (pueden ocurrir raíces repetidas). Si los coeficientes\(a\) y\(b\) son reales, sabemos por el Teorema del Valor Intermedio que al menos una de las tres raíces de\(p\) será real (Ver Ejercicio 8.31). Como muestra el Ejemplo 9.9, sin embargo, aún puede ser necesario tomar la raíz cúbica de un complejo\(\zeta\) para obtener las raíces reales de un cúbico real. Esta realización fue lo que llevó a la aceptación de los números complejos como objetos útiles más que como una fantasía extraña.

    Teorema Fundamental de Álgebra

    El álgebra sobre los números complejos es en muchos sentidos más fácil que sobre los números reales. La razón es que un polinomio de grado\(N\) en\(\mathbb{C}[z]\) tiene exactamente\(N\) ceros, contando multiplicidad. Esto se llama el Teorema Fundamental del Álgebra. Para probarlo, debemos establecer algunos resultados preliminares.

    Algún análisis.

    DEFINICIÓN. Decimos que una secuencia\(\left\langle z_{n}=x_{n}+i y_{n}\right\rangle\) de números complejos converge al número\(z=x+i y\) iff\(\left\langle x_{n}\right\rangle\) converge a\(x\) y\(\left\langle y_{n}\right\rangle\) converge a\(y\). Decimos que la secuencia es Cauchy iff ambos\(\left\langle x_{n}\right\rangle\) y\(\left\langle y_{n}\right\rangle\) son Cauchy.

    OBSERVACIÓN. Esto es lo mismo que decir que\(\left\langle z_{n}\right\rangle\) converge a\(z\) iff\(\left|z-z_{n}\right|\) tiende a cero, y eso\(\left\langle z_{n}\right\rangle\) es Cauchy iff\[(\forall \varepsilon>0)(\exists N)(\forall m, n>N)\left|z_{m}-z_{n}\right|<\varepsilon .\] DEFINICIÓN. Vamos\(G \subseteq \mathbb{C}\). Decimos que una función\(f: G \rightarrow \mathbb{C}\) es continua en\(G\) si, siempre que\(\left\langle z_{n}\right\rangle\) es una secuencia en\(G\) que converge a algún valor\(z_{\infty}\) en\(G\), entonces\(\left\langle f\left(z_{n}\right)\right\rangle\) converge a \(f\left(z_{\infty}\right)\).

    PROPOSICIÓN 9.34. Los polinomios son funciones continuas en\(\mathbb{C}\).

    Comprobante. Repita la prueba de Proposición\(5.23\) con números complejos en lugar de números reales.

    DEFINICIÓN. Un rectángulo cerrado es un conjunto de la forma\(\{z \in \mathbb{C} \mid a \leq\)\(\Re(z) \leq b, c \leq \Im(z) \leq d\}\) para algunos números reales\(a \leq b\) y\(c \leq d\). Nos gustaría una versión del Teorema del Valor Extremo, pero no está claro cómo deben definirse los valores mínimo y máximo de una función valorada compleja. Sin embargo, nuestra definición de continuidad tiene sentido incluso si el rango de\(f\) está contenido en\(\mathbb{R}\), y cada función continua de valor complejo\(g\) tiene tres funciones continuas de valor real asociadas naturalmente, a saber,\(\Re(g), \Im(g)\) y \(|g|\).

    TEOREMA 9.35. Dejar\(R\) ser un rectángulo cerrado en\(\mathbb{C}\), y función\(f: R \rightarrow \mathbb{R} a\) continua. Después\(f\) alcanza su máximo y su mínimo.

    Comprobante. Vamos\(R=\{z \in \mathbb{C} \mid a \leq \Re(z) \leq b, c \leq \Im(z) \leq d\}\). Dejar\(\left\langle z_{n}=x_{n}+i y_{n}\right\rangle\) ser una secuencia de puntos tal que\(f\left(z_{n}\right)\) tiende o bien al límite inferior superior del rango de\(f\), si esto existe, o dejar\(f\left(z_{n}\right)>n\) para todos\(n\), si el rango no está delimitado por encima. Por el Teorema de BolzanoWeiersTrass 8.6, hay alguna subsecuencia para la cual las partes reales convergen a algún número\(x_{\infty}\) en\([a, b]\). Por Bolzano-Weierstrass nuevamente, alguna subsecuencia de esta subsecuencia tiene la propiedad de que las partes imaginarias también convergen, hasta cierto punto\(y_{\infty}\) en\([c, d]\). Entonces, reemplazando la secuencia original por esta subsecuencia de la subsecuencia, podemos suponer que\(z_{n}\) converge al punto\(z_{\infty}=x_{\infty}+i y_{\infty} \in R\). Por continuidad,\(f\left(z_{\infty}\right)=\lim _{n \rightarrow \infty} f\left(z_{n}\right)\). Si la secuencia original no estaba delimitada entonces\(f\left(z_{n}\right)>n\) en la subsecuencia. Esto es imposible ya que la secuencia\(\left\langle f\left(z_{n}\right)\right\rangle\) converge a\(f\left(z_{\infty}\right)\). Por lo tanto, la subsecuencia está limitada y\(f\left(z_{\infty}\right)\) debe ser el límite inferior superior del rango de\(f\). Por lo tanto\(f\left(z_{\infty}\right)\) es el máximo de\(f\) más\(R\).

    Un argumento similar muestra que también se alcanza el mínimo.

    OBSERVACIÓN. El teorema anterior se puede mejorar para mostrar que una función continua de valor real en un conjunto delimitado cerrado\(\mathbb{C}\) alcanza sus extremos. Un conjunto\(F\) se cierra si cada vez que una secuencia de puntos\(\left\langle z_{n}\right\rangle\) converge a algún número complejo\(z_{\infty}\), entonces\(z_{\infty}\) está adentro\(F\). Un conjunto está delimitado si está contenido en algún rectángulo.

    Necesitamos un hecho geométrico más. LEMA 9.36. Desigualdad triangular Let\(z_{1}, z_{2}\) be complex numbers. Entonces\[\left|z_{1}+z_{2}\right| \leq\left|z_{1}\right|+\left|z_{2}\right|\]imagen

    FIGURA\(9.18\). Desigualdad triangular

    Comprobante. Escribir\(z_{1}=r_{1} \operatorname{Cis}\left(\theta_{1}\right)\) y\(z_{2}=r_{2} \operatorname{Cis}\left(\theta_{2}\right)\). Entonces\ [\ comenzar {alineado} \ izquierda|r_ {1}\ nombreoperador {Cis}\ izquierda (\ theta_ {1}\ derecha) +r_ {2}\ nombreoperador {Cis}\ izquierda (\ theta_ {2}\ derecha)\ derecha|\\ &=\ izquierda [\ izquierda (r_ {1}\ cos\ theta_ {1} +r_ {2}\ cos\ theta_ {2}\ derecha) ^ {2} +\ izquierda (r_ {1}\ sin\ theta_ {1} +r_ {2}\ operatorname {si}\ derecha. \ derecho. \\ &=\ izquierda [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {1} r_ {2}\ izquierda (\ cos\ theta_ {1}\ cos\ theta_ {2} +\ sin\ theta_ {1}\ sin\ theta_ {2}\ derecha)\ derecha]\ &= izquierda [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {1} r_ {2}\ cos\ izquierda (\ theta_ {1} -\ theta_ {2}\ derecha)\ derecha] ^ {1/2}\\ &\ leq\ izquierda [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {2} ^ {2} +2 _ {1} r_ {2}\ derecha] ^ {1/2 }\\ &=r_ {1} +r_ {2}. \ end {alineado}\] COROLARIO 9.38. Vamos\(z_{1}, \ldots, z_{n} \in \mathbb{C}\). Entonces\[\left|z_{1}+\cdots+z_{n}\right| \leq\left|z_{1}\right|+\cdots+\left|z_{n}\right| .\]

    La Prueba del Teorema Fundamental del Álgebra.

    Primero observamos que encontrar raíces y factores de hallazgo están estrechamente relacionados.

    LEMA 9.39. Dejar\(p\) ser un polinomio de grado\(N \geq 1\) en\(\mathbb{C}[z]\). Un número complejo,\(c\), es una raíz de\(p\) iff\[p(z)=(z-c) q(z),\] donde\(q\) es un polinomio de grado\(N-1\).

    Comprobante. Repita la prueba de Lema\(4.13\) con números reales reemplazados por números complejos.

    Ahora probamos el lema de D'Alembert, que establece que el módulo de un polinomio no puede tener un mínimo local excepto en una raíz.

    LEMA 9.40. Lema de D'Alembert Let\(p \in \mathbb{C}[z]\) y\(\alpha \in \mathbb{C}\). Si\(p(\alpha) \neq 0\), entonces\[(\forall \varepsilon>0)(\exists \zeta)[|\zeta-\alpha|<\varepsilon] \wedge[|p(\zeta)|<|p(\alpha)|]\] Prueba. Arreglar\(\alpha\), no una raíz de\(p\). Escribe\(p\) como\[p(z)=\sum_{k=0}^{N} a_{k}(z-\alpha)^{k},\] donde ni\(a_{0}\) ni\(a_{N}\) están 0. Que\[m=\min \left\{j \in \mathbb{N}^{+} \mid a_{j} \neq 0\right\} .\] Así\[p(z)=a_{0}+a_{m}(z-\alpha)^{m}+\cdots+a_{N}(z-\alpha)^{N} .\] Que Que\(a_{0}=r_{0} \operatorname{Cis}\left(\theta_{0}\right)\) Y\(a_{m}=r_{m} \operatorname{Cis}\left(\theta_{m}\right)\). Escogeremos\(\zeta\) de la forma de tal\[\zeta=\alpha+\rho \operatorname{Cis}(\phi)\] manera que obtengamos alguna cancelación en los dos primeros términos de (9.42). Entonces, vamos\[\phi=\frac{\theta_{0}+\pi-\theta_{m}}{m} .\] Entonces\[a_{0}+a_{m}(\zeta-\alpha)^{m}=r_{0} \operatorname{Cis}\left(\theta_{0}\right)-r_{m} \rho^{m} \operatorname{Cis}\left(\theta_{0}\right) .\] Queda por demostrar que, por lo suficientemente\(\rho\) pequeño, podemos ignorar todos los términos de orden superior. Tenga en cuenta que si\(\rho<1\), tenemos\ [\ begin {alineado} \ izquierda|a_ {m+1} (\ zeta-\ alpha) ^ {m+1} +\ cdots+a_ {N} (\ zeta-\ alpha) ^ {N}\ derecha|\\ &\ leq\ izquierda|a_ {m+1} (\ zeta-\ alpha) ^ {m+1}\ derecha|a_ {m+1}\ derecha|a_ {m+1} +\ cdots+\ izquierda|a_ {N} (\ zeta-\ alfa) ^ {N}\ derecha|\\ &=\ izquierda|a_ {m+1}\ derecha|\ rho^ {m+1} +\ cdots+\ izquierda|a _ {N}\ derecha|\ rho^ {N}\\ &\ leq\ rho^ {m+1}\ izquierda [\ izquierda|a_ {m+1}\ derecha|+\ cdots+\ izquierda|a_ {N}\ derecha|\ derecha]\\ &=: C\ rho^ {m+1}. \ end {alineado}\] Elija\(\rho\) para que\(r_{m} \rho^{m}<r_{0}\). Entonces\[p(\zeta)=\left(r_{0}-r_{m} \rho^{m}\right) \operatorname{Cis}\left(\theta_{0}\right)+a_{m+1}(\zeta-\alpha)^{m+1}+\cdots+a_{N}(\zeta-\alpha)^{N},\]\(\mathrm{SO}\)\[|p(\zeta)| \leq r_{0}-r_{m} \rho^{m}+C \rho^{m+1} .\] Si\(\rho<r_{m} / C\), el lado derecho de (9.43) es menor que\(r_{0}\).

    Por lo que concluimos que al tomar\[\rho=\frac{1}{2} \min \left(1, \frac{r_{m}}{C},\left[\frac{r_{0}}{r_{m}}\right]^{1 / m}, \varepsilon\right)\] entonces\[\zeta=\rho \operatorname{Cis}\left(\frac{\theta_{0}+\pi-\theta_{m}}{m}\right)\] satisface la conclusión del lema.

    TEOREMA 9.44. Teorema Fundamental de Álgebra Let\(p \in \mathbb{C}[z]\) Ser un polinomio de grado\(N \geq 1\). Entonces se\(p\) puede factorizar como\[p(z)=c\left(z-\alpha_{1}\right) \ldots\left(z-\alpha_{N}\right)\] para números complejos\(c, \alpha_{1}, \ldots, \alpha_{N}\). Por otra parte el factoring es único hasta el orden. Comprobante. (i) Demostrar que\(p\) tiene al menos una raíz.

    Vamos\(p(z)=\sum_{k=0}^{N} a_{k} z^{k}\), con\(a_{N} \neq 0\). Dejar\(S\) ser el cuadrado cerrado\(\{z \in \mathbb{C} \mid-L \leq \Re(z) \leq L,-L \leq \Im(z) \leq L\}\), donde\(L\) hay algún número (grande) para ser elegido posteriormente.

    Si\(|z|=R\) entonces\[\left|\sum_{k=0}^{N-1} a_{k} z^{k}\right| \leq \sum_{k=0}^{N-1}\left|a_{k}\right| R^{k} .\] Elige\(L_{0}\) para que si\(R \geq L_{0}\),\[\sum_{k=0}^{N-1}\left|a_{k}\right| R^{k} \leq \frac{1}{2}\left|a_{N}\right| R^{N} .\] entonces Entonces si\(L \geq L_{0}\) y\(z\) está afuera\(S\), tenemos\ [\ begin {alineado} \ izquierda|a_ {N} z^ {N}\ derecha| &=\ izquierda|p (z) -\ sum_ {k=0} ^ {N-1} a_ {k} z^ {k}\ derecha|\\ &\ leq|p (z) |+\ izquierda|\ sum_ {k=0} ^ {N-1} a_ {k} z^ {k}\ derecha|\\ &\ leq|p (z) +\ frac {1} {2}\ izquierda|a_ {N}\ derecha| L^ {N}, \ end {alineada}\] donde la primera desigualdad es la desigualdad triangular, y la segunda porque\(|z|>L\) . Elija\(L_{1}\) tal que\[\frac{1}{2}\left|a_{N}\right| L_{1}^{N}>\left|a_{0}\right| .\] Let\(L=\max \left(L_{0}, L_{1}\right)\), y deje\(S\) ser el cuadrado cerrado correspondiente. La función\(|p|\) es continua\(S\), por lo que alcanza su mínimo en algún momento,\(\alpha_{1}\) digamos, por el Teorema 9.35. En el límite de\(S\), sabemos\[|p(z)| \geq \frac{1}{2}\left|a_{N}\right| L^{N}>\left|a_{0}\right|=|p(0)| .\] Por lo tanto\(\alpha_{1}\) debe estar en el interior de\(S\). Por el lema de D'Alembert, debemos tener\(p\left(\alpha_{1}\right)=0\), o de lo contrario habría un punto cercano\(\zeta\), también en\(S\), donde\(|p(\zeta)|\) era más pequeño que\(\left|p\left(\alpha_{1}\right)\right|\). Entonces\(\alpha_{1}\) es una raíz de\(p\).

    (ii) Ahora aplicamos Lema\(9.39\) para concluir que podemos factorizar\(p\) como\[p(z)=\left(z-\alpha_{1}\right) q(z)\] dónde\(q\) está un polinomio de grado\(N-1\). Por un argumento directo de inducción, podemos factorizar\(p\) en factores\(N\) lineales.

    (iii) La singularidad es obvia. El número\(c\) es el coeficiente\(a_{N}\). Los números\(a_{k}\) son precisamente los puntos en los que la función\(p\) desaparece, ya que de Proposición se deduce\(9.19\) que el producto de finitamente muchos números complejos puede ser 0 si y solo si uno de los números es en sí mismo 0.

    Aplicación a polinomios reales

    Si\(p\) es un polinomio en\(\mathbb{R}[x]\), se deduce del Teorema Fundamental del Álgebra que sí tiene raíces, pero pueden ser complejas. Si tiene raíces complejas, deben ocurrir en pares conjugados complejos.

    TEOREMA 9.46. Vamos\(p \in \mathbb{R}[x]\). Dejar\(\alpha\) ser una raíz de\(p\). Entonces así es\(\bar{\alpha}\).

    Prueba. Vamos\(p(x)=\sum_{k=0}^{N} a_{k} x^{k}\). Entonces\[p(\alpha)=\sum_{k=0}^{N} a_{k} \alpha^{k}=0,\] Así que\[p(\bar{\alpha})=\sum_{k=0}^{N} a_{k} \bar{\alpha}^{k}=\overline{p(\alpha)}=0 .\] vamos\(\alpha=a+i b\). Entonces\ [\ begin {alineado} (x-\ alpha) (x-\ bar {\ alpha}) & =( x- (a+i b)) (x- (a-i b))\\ &=x^ {2} -2 a x+a^ {2} +b^ {2}\\ & =( x-a) ^ {2} +b^ {2}. \ end {aligned}\] Entonces aplicando el Teorema Fundamental del Álgebra al polinomio real\(p\), primero factorizamos las raíces reales, y por cada par de raíces conjugadas complejas obtenemos un factor como en (9.47). Así conseguimos:

    TEOREMA 9.48. Dejar\(p \in \mathbb{R}[x]\) ser un polinomio de grado\(N\). Entonces se\(p\) puede factorizar en un producto de factores lineales\(\left(x-c_{k}\right)\) y factores cuadráticos\(\left(\left(x-a_{k}\right)^{2}+b_{k}^{2}\right)\):\[p(x)=c\left(\prod_{k=1}^{N_{1}}\left(x-c_{k}\right)\right)\left(\prod_{j=1}^{N_{2}}\left(\left(x-a_{j}\right)^{2}+b_{j}^{2}\right)\right)\] para algunos números reales (no necesariamente distintos)\(c, c_{j}, a_{j}, b_{j}\). Tenemos\(N_{1}+2 N_{2}=N\), y el factoring es único, hasta ordenar y reemplazar cualquiera\(b_{j} b y-b_{j}\).

    Otras observaciones

    En el capítulo 5 definimos coseno y seno en términos de series de potencia. En la Sección 9.2, los interpretamos geométricamente y utilizamos identidades trigonométricas. Demostrar que la serie de potencias y la interpretación trigonométrica están describiendo realmente la misma función es parte de un curso de Análisis Complejo.

    Hay dos ingredientes principales para un primer curso en Análisis Complejos. El primero es mostrar que si una función\(f\) tiene un derivado en todas partes en algún disco abierto, en el sentido que\[\lim _{z \rightarrow z_{0}} \frac{f\left(z_{0}\right)-f(z)}{z_{0}-z}\] existe, entonces la función es automáticamente analítica, es decir, expresable por una serie de potencias convergentes. Esto no es cierto para las funciones reales, y explica gran parte de la naturaleza especial de las funciones diferenciables complejas.

    La segunda parte del curso se refiere a evaluar integrales de contorno de funciones diferenciables complejas. Esto es útil no sólo por derecho propio, sino en aplicaciones al análisis real, como invertir la transformación de Laplace, o evaluar integrales definidas.

    Una buena introducción al análisis complejo es el libro de Donald Sarason\([7]\).

    Ejercicios

    EJERCICIO 9.1. ¿Cuáles son las primitivas cuartas raíces de la unidad?

    EJERCICIO 9.2. Demostrar que si\(\omega\) hay alguna\(n^{\text {th }}\) raíz de unidad distinta a 1, entonces\(1+\omega+\omega^{2}+\cdots+\omega^{n-1}=0 .\) EJERCICIO 9.3. ¿Cuántas primitivas raíces cúbicas de unidad hay? ¿Cuántas primitivas sextas raíces? ¿Cuántas\(n^{\text {th }}\) raíces primitivas para un general\(n\)?

    EJERCICIO 9.4. Rehacer Ejemplo\(9.8\) para obtener las tres raíces de la fórmula Tartaglia-Cardano.

    EJERCICIO 9.5. Vamos\(p(x)=x^{3}+3 x+\sqrt{2}\). Mostrar sin usar la fórmula Cardano-Tartaglia que\(p\) tiene exactamente una raíz real. Encuéntralo. ¿Cuáles son las raíces complejas?

    EJERCICIO 9.6. Rellene el comprobante de la Proposición 9.34.

    EJERCICIO 9.7. Dejar\(g: G \rightarrow \mathbb{C}\) ser una función continua en\(G \subseteq \mathbb{C}\). \(\Re(g), \Im(g)\)Demuéstralo y\(|g|\) son continuos. Por el contrario, mostrar que la continuidad de\(\Re(g)\) e\(\Im(g)\) implica la continuidad de\(g\).

    EJERCICIO 9.8. Mostrar que cada función continua de valor real en un subconjunto cerrado y delimitado de\(\mathbb{C}\) alcanza sus extremos.

    APÉNDICE A

    El Alfabeto Griego

    Nombre en minúsculas en minúsculas

    imagen

    APÉNDICE B

    Axiomas de Zermelo-Fraenkel con el Axioma de Elección

    La paradoja de Russell (Sección 1.7) demuestra que el Principio de Comprensión General es falso, ya que da lugar a una contradicción. Entonces, ¿cómo decidimos si una colección definible es un conjunto? Esta pregunta engendró un programa para axiomatizar la teoría de conjuntos con el objetivo de producir suposiciones uniformes sobre conjuntos que satisficieran numerosas limitaciones:

    • Los axiomas son comprensibles e intuitivamente sólidos. Debemos ser capaces de reconocer cuando una declaración sobre conjuntos es un axioma.

    • Los axiomas son suficientes para derivar los teoremas estándar de las matemáticas.

    • Los axiomas no son redundantes. Es decir, ningún axioma puede derivarse de los axiomas restantes.

    • Toda afirmación matemática sobre conjuntos es demostrable o refutable a partir de los axiomas.

    • Los axiomas son lógicamente consistentes y por lo tanto no dan lugar a una contradicción.

    Como discutiremos más adelante, ninguna colección de axiomas puede alcanzar simultáneamente estos objetivos. Primero damos los axiomas sobre los que finalmente se asentaron los matemáticos.

    Axiomas de Zermelo-Fraenkel (con el Axioma de Elección):

    (1) Extensionalidad Si establece\(X\) y\(Y\) tiene los mismos elementos, entonces\(X=Y\).

    (2) Emparejamiento Para cualquier conjunto\(X\) y\(Y\), hay un conjunto\(Z=\{X, Y\}\). 268 B. AXIOMAS DE ZERMELO-FRAENKEL CON EL AXIOMA DE ELECCIÓN

    (3) Unión Let\(X\) Ser un conjunto de conjuntos. Entonces hay un conjunto\[\{x \mid(\exists Y \in X) x \in Y\}\] (4) Power Set Si\(X\) es un conjunto entonces la colección de todos los subconjuntos de\(X\) es un conjunto.

    (5) Infinito Hay un conjunto inductivo.

    (6) Esquema de Separación Si\(P\left(x, y_{1}, \ldots, y_{n}\right)\) es una fórmula con\(n+1\) variables, y\(X, X_{1}, \ldots, X_{n}\) son conjuntos, entonces hay un conjunto\[\left\{x \in X \mid P\left(x, X_{1}, \ldots, X_{n}\right\}\right.\] (7) Esquema de Reemplazo Si\(F\) es una función en colecciones arbitrarias,\(X\) es una set y\(f=\left.F\right|_{X}\), entonces el rango de\(f\) es un conjunto.

    (8) Regularidad Dejar\(X\) ser un conjunto. Entonces no hay una secuencia infinita de elementos de\(X,\left\langle x_{i}\right\rangle\), tal que para todos\(n \in \mathbb{N}, x_{n+1} \in x_{n}\).

    (9) Elección Let\(X\) Ser un conjunto de conjuntos no vacíos. Entonces hay una función\(f\) con dominio\(X\) tal que para todos\(x \in X, f(x) \in x\).

    Los axiomas de Zermelo-Fraenkel con el Axioma de Elección se conocen como\(Z F C\). Hay siete axiomas y dos esquemas de axiomas. Los esquemas dan infinitamente muchos axiomas. El Axioma de Extensionalidad caracteriza la identidad de conjunto. Dice que un conjunto es definido por sus miembros. Los Axiomas de Emparejamiento, Unión y Power Set garantizan que las colecciones construidas a partir de conjuntos con estas operaciones de conjuntos serán conjuntos. El Axioma del Infinito implica que los números naturales son un conjunto. El Esquema de Separación dice que cualquier subconjunto de un conjunto dado definido por una fórmula es un conjunto. Se trata de una versión debilitada del Principio de Comprensión General. El Esquema de Reemplazo dice que dada una función,\(F\), en colecciones arbitrarias (no necesariamente conjuntos) y un conjunto\(X\), el rango de\(\left.F\right|_{X}\) es un conjunto. El Axioma de la Regularidad es un axioma técnico que implica que ningún conjunto puede ser miembro de sí mismo.

    El Axioma de Elección es diferente a los otros axiomas en que no pretende que un objeto definible en el universo de conjuntos sea también B. AXIOMAS DE ZERMELO-FRAENKEL CON EL AXIOMA DE ELECCIÓN 269

    un conjunto. Más bien, implica la existencia de una función sin especificar la función. Si\(X\) es un conjunto y\(f\) es la función con dominio\(X\) cuya existencia está garantizada por el Axioma de Elección, entonces\(f\) se llama una función de elección para\(X\). El Axioma de Elección es lógicamente equivalente a axiomas que se utilizan frecuentemente en argumentos en muchas ramas de la matemática. Por ejemplo, el Axioma de Elección es equivalente a la afirmación de que cada conjunto puede estar bien ordenado (el Principio de Ordenación del Bien). El axioma da lugar a interesantes paradojas que provocaron que algunos matemáticos cuestionaran su validez. Kurt Gödel demostró que si los axiomas de Zermelo-Fraenkel sin Elección eran lógicamente consistentes, entonces los axiomas de Zermelo-Fraenkel con Choice fueron lógicamente consistentes. Hubo algunas ocasiones en el Capítulo 6 cuando invocamos el Axioma de Elección. Hubo ocasiones (e.g. Teorema de Cantor) en las que el axioma es realmente necesario, pero discutirlo habría sido inaceptablemente confuso. El axioma es considerado necesario por la mayoría de los matemáticos. Por ejemplo sin él, o algún axioma lógicamente equivalente, ni siquiera podemos concluir que se pueda comparar cualquier par de conjuntos (es decir, para cualquier conjunto\(X\) y\(Y\), cualquiera\(X \preceq Y\) o\(Y \preceq X\)). El Axioma de Elección se conoce como\(A C\), y los axiomas de Zermelo-Fraenkel sin el Axioma de Elección se conoce como\(Z F\).

    ¿\(Z F C\)Logra los objetivos de una axiomatización de la teoría de conjuntos? Los axiomas son generalmente intuitivos con las posibles excepciones de\(A C\) y el Axioma de Regularidad. También se sabe que si\(Z F C\) sin el Axioma de Regularidad es lógicamente consistente, entonces\(Z F C\) con el Axioma de Regularidad es lógicamente consistente. Los matemáticos asumen\(Z F C\) casi universalmente sin darle demasiada consideración. Los axiomas de\(Z F C\) han sido suficientes para probar los teoremas de las matemáticas estándar.

    Decimos que un conjunto es decidible (o recursivo) si la pertenencia al conjunto se puede determinar mediante cómputos de memoria. Por ejemplo, el conjunto de enteros pares es decidible: puede usar el algoritmo de división para verificar si un entero es divisible por\(2 . Z F C\) es un conjunto recursivo 270 B. AXIOMAS DE ZERMELO-FRAENKEL CON EL AXIOMA DE ELECCIÓN

    de axiomas. Efectivamente es necesario que un conjunto de axiomas sea recursivo para ser de cualquier utilidad práctica. Es un teorema de las matemáticas, el primer teorema de incompletitud de Gödel, que cualquier conjunto decidible de axiomas en el que se pueda hacer aritmética será lógicamente incompleto. Es decir, hay afirmaciones en el lenguaje de los axiomas que no son probables ni refutables desde los axiomas. No se sabe, ni puede conocerse por una prueba matemática (usando\(Z F C\)) si\(Z F C\) es lógicamente consistente. La consistencia de un conjunto decidible de axiomas en el que se puede hacer aritmética no puede ser una consecuencia lógica de esos axiomas. Este resultado es conocido como el Segundo Teorema de Incompletitud de Gödel, y es uno de los grandes resultados de las matemáticas del siglo XX.

    Para un buen tratamiento de la Teoría de Conjuntos a nivel de licenciatura, véase el libro de Y. Moschovakis\([\mathbf{5}]\).

    APÉNDICE C

    Consejos para comenzar a hacer ejercicios tempranos

    Ejercicio 1.2. Esto se podría hacer con un diagrama de Venn. No obstante, una vez que haya más de tres conjuntos (ver Ejercicio 1.13), este enfoque será difícil. Una prueba algebraica se generalizará más fácilmente, así que trata de encontrar una aquí. Argumentan por las dos inclusiones\ [\ begin {alineadas} (X\ copa Y) ^ {c} &\ subseteq X^ {c}\ cap Y^ {c}\ X^ {c}\ cap Y^ {c} &\ subseteq (X\ copa Y) ^ {c} \ end {alineado}\] por separado. En el primero, por ejemplo, asumir eso\(x \in(X \cup Y)^{c}\) y demostrar que debe ser en ambos\(X^{c}\) y\(Y^{c}\).

    Ejercicio 1.13. Parte del problema aquí es la notación - ¿y si tienes más conjuntos que letras? Comience con un número finito de conjuntos contenidos en\(U\), y llámalos\(X_{1}, \ldots, X_{n}\). ¿Cuál crees que es el complemento de su unión? Demuéstralo como lo hiciste cuando estás\(n=2\) en Ejercicio\(1.2\). (¿Ve la ventaja de tener una prueba en Ejercicio\(1.2\) que no utilizó diagramas de Venn? Una de las razones por las que a los matemáticos les gusta tener múltiples pruebas del mismo teorema es que es probable que cada prueba se generalice de una manera diferente).

    ¿Puedes hacer que funcione el mismo argumento si tus conjuntos están indexados por algún conjunto de índices infinito?

    Ahora haz lo mismo con el complemento de la intersección.

    Ejercicio 1.14. Nuevamente hay un problema notacional, pero mientras\(Y\) y\(Z\) juega el mismo papel en el Ejercicio 1.3,\(X\) juega un papel diferente. Así que reescribe las ecuaciones como\ [\ begin {aligned} &X\ cap\ left (Y_ {1}\ cup Y_ {2}\ right) =\ left (X\ cap Y_ {1}\ right)\ cup\ left (X\ cap Y_ {2}\ right)\\ &X\ cup\ left (Y_ {1}\ cap Y_ {2}\ right) =\ left (X\ copa Y_ {1}\ derecha)\ tapa\ izquierda (X\ copa Y_ {2}\ derecha), \ end {alineado}\] y mira si puedes generalizar estos.

    Ejercicio 1.35. (i) Nuevamente, esto reduce a probar dos contenciones. Si\(y\) está en el lado izquierdo, entonces debe haber algunos\(x_{0}\) en algunos\(U_{\alpha_{0}}\) tales que\(f(x)=y\). Pero luego\(y\) está adentro\(f\left(U_{\alpha_{0}}\right)\), así\(y\) está en el lado derecho.

    Por el contrario, si\(y\) está en el lado derecho, entonces debe estar en\(f\left(U_{\alpha_{0}}\right)\) para algunos\(\alpha_{0} \in A\). Pero luego\(y\) está adentro\(f\left(\cup_{\alpha \in A} U_{\alpha}\right)\), y también lo está en el lado izquierdo.

    Ejercicio\(3.1\) Hay cuatro posibles asignaciones de valores de verdad 0 y 1 a las dos afirmaciones\(P\) y\(Q\). Para cada una de esas tareas, evalúe los valores de verdad de los lados izquierdo y derecho de (3.3) y demuestre que siempre son los mismos.

    Bibliografía

    [1] M. Aigner y G.M. Ziegler. Pruebas del Libro. Springer, Berlín,\(2003 .\)

    [2] J.B. Fraleigh. Un primer curso de álgebra abstracta. Addison-Wesley, Lectura,\(1982 .\)

    [3] I.N. Herstein. Álgebra abstracta. J. Wiley, Nueva York, 1999.

    [4] I. Lakatos. Pruebas y refutaciones: La lógica del descubrimiento matemático. Prensa de la Universidad de Cambridge, Cambridge,\(1976 .\)

    [5] Y.N Moschovakis. Apuntes sobre Teoría de Conjuntos. Springer, Berlín, 1994.

    [6] El mActutor Historia de las Matemáticas Archivos. http://www-groups.des.stand.ac.uk/ history/index.html.

    [7] D. Sarason. Apuntes sobre Teoría de Funciones Complejas. Agencia de Libros Hindustan, Nueva Delhi,\(1998 .\)

    [8] E.M. Stein y R. Shakarchi. Análisis de Fourier. Prensa de la Universidad de Princeton, Princeton,\(2003 .\)


    This page titled Fuente is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by Bob Dumas and John E. McCarthy via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.