Fuente
( \newcommand{\kernel}{\mathrm{null}\,}\)
CAPÍTULO 0
Introducción
Por qué este libro es
Hoy en día más estudiantes que nunca toman cálculo en la preparatoria. Esto tiene un costo, sin embargo: cada vez menos toman un curso riguroso en geometría euclidiana. Además, el curso de cálculo que toman casi todos los estudiantes, ya sea en la preparatoria o en la universidad, evita pruebas, y muchas veces ni siquiera da una definición formal de límite. En efecto, algunos estudiantes ingresan a la universidad nunca habiendo leído o escrito una prueba por inducción, ni se encontraron con una prueba matemática de ningún tipo.
Como consecuencia, los profesores de los cursos de matemáticas de grado superior en álgebra lineal, álgebra abstracta, análisis y topología tienen que trabajar extremadamente duro inculcando el concepto de prueba mientras simultáneamente tratan de cubrir el plan de estudios. Este problema se ha abordado en muchas universidades introduciendo un curso puente, con un título como “Fundamentos para las Matemáticas Superiores”, tomado por estudiantes que han completado la secuencia regular de cálculo. Algunos de estos estudiantes planean convertirse en carreras de matemáticas. Otros solo quieren aprender algunas matemáticas más; pero si a lo que están expuestos es interesante y satisfactorio, muchos optarán por especializarse o doblarse en matemáticas.
Este libro está escrito para estudiantes que han tomado cálculo y quieren aprender qué es la “matemática real”. Esperamos que encuentre el material atractivo e interesante, y que se le anime a aprender matemáticas más avanzadas.
Qué es este libro
El propósito de este libro es introducirte en la cultura, el lenguaje y el pensamiento de los matemáticos. Decimos “matemáticos”, no “matemáticas”, para enfatizar que las matemáticas son, en el fondo, un esfuerzo humano. Si hay vida inteligente en Erewhemos, entonces los erewhemosianos seguramente estarán de acuerdo en eso2+2=4. Si han pensado detenidamente en la pregunta, no creerán que la raíz cuadrada de dos pueda estar exactamente dada por la proporción de dos números enteros, o que haya finitamente muchos números primos. Sin embargo, sólo podemos especular sobre si encontrarían estas últimas preguntas remotamente interesantes o qué podrían considerar satisfactorias respuestas a preguntas de este tipo.
Los matemáticos, después de milenios de luchas y argumentos, han llegado a un acuerdo generalizado (si no del todo universal) sobre lo que constituye un argumento matemático aceptable. A esto lo llaman “prueba”, y constituye un argumento cuidadosamente razonado basado en premisas pactadas. La metodología de las matemáticas ha sido espectacularmente exitosa, y ha generado muchos otros campos. En el siglo XX, la programación informática y la estadística aplicada se desarrollaron a partir de ramificaciones de las matemáticas a disciplinas propias. En el siglo XIX, también lo hicieron la astronomía y la física. La creciente disponibilidad de datos hace que el tratamiento de los datos de una manera matemática sofisticada sea uno de los grandes retos científicos del siglo XXI.
En este libro, trataremos de enseñarte qué es una prueba: qué nivel de argumento se considera convincente, qué se considera exagerado y qué nivel de detalle se considera demasiado. Intentaremos enseñarte cómo piensan los matemáticos, qué estructuras utilizan para organizar sus pensamientos. Una estructura es como un esqueleto - si quitas los detalles inesenciales puedes concentrarte en el problema real. Un gran ejemplo de ello es la idea del número, la estructura matemática humana más temprana. Si aprendes a contar manzanas, y que dos manzanas más dos manzanas hacen cuatro manzanas, y si piensas que se trata de manzanas en lugar de contar, entonces todavía no sabes qué hacen dos ovejas más dos ovejas. Pero una vez que te das cuenta de que hay una estructura subyacente de número, y que dos más dos son cuatro en abstracto, entonces agregar lana o piernas a los objetos no cambia la aritmética.
Lo que este libro no es
Existe un enfoque para impartir un curso de transición que muchos instructores favorecen. Es tener un curso de resolución de problemas, en el que los alumnos aprendan a escribir pruebas en un contexto donde su intuición pueda ayudar, como en combinatoria o teoría de números. Esto ayuda a que el curso sea interesante, y puede evitar que los estudiantes se pierdan por completo.
No hemos adoptado este enfoque. Nuestra razón es que además de enseñar la habilidad de escribir una prueba lógica, también queremos enseñar la habilidad de analizar cuidadosamente las definiciones. Gran parte del trabajo del instructor en un curso de álgebra o análisis de división superior consiste en obligar a los estudiantes a leer atentamente las definiciones de objetos nuevos y desconocidos, decidir qué objetos matemáticos satisfacen la definición y cuáles no, y entender qué sigue “inmediatamente” de la definiciones. En efecto, la principal razón por la que la definición épsilon-delta de límite ha desaparecido de la mayoría de los cursos introductorios de cálculo es la dificultad de explicar cómo los cuantificadores∀ε∃δ, precisamente en este orden, dan la noción exacta de límite por la que nos estamos esforzando. Así, si bien los estudiantes deben trabajar más duro en este curso para aprender más matemáticas abstractas, estarán mejor preparados para cursos avanzados.
Tampoco se trata de un texto en la lógica aplicada. Los primeros capítulos del libro introducen al estudiante a las estructuras matemáticas básicas a través de definiciones formales. Aunque brindamos un tratamiento bastante formal de la lógica de primer orden y la inducción matemática, nuestro objetivo es pasar a estructuras y argumentos matemáticos clásicos más avanzados tan pronto como el estudiante tenga una comprensión adecuada de la lógica subyacente a las pruebas matemáticas.
Asesoría al Alumno
¡Bienvenido a las matemáticas superiores! Si tu exposición a las matemáticas universitarias se limita al cálculo, este libro probablemente parecerá muy diferente de tus textos anteriores. Muchos estudiantes aprenden cálculo escaneando rápidamente el texto y procediendo directamente a los problemas. Al luchar con un problema, buscan problemas similares en el texto, e intentan emular la solución que encuentran. Por último, revisan la solución, que generalmente se encuentra al dorso del texto, para “validar” la metodología.
Este libro, como muchos textos que abordan temas más avanzados, no está escrito pensando en problemas computacionales. Nuestro objetivo es introducirte en los diversos elementos de las matemáticas de pregrado superior: la cultura, el lenguaje, los métodos, los temas, los estándares y los resultados. Los problemas en estos cursos son probar verdaderas afirmaciones matemáticas, o refutar afirmaciones falsas. En el contexto del cálculo, el matemático debe probar los resultados que utilizó libremente. Para la mayoría de la gente, esta actividad parece muy diferente a la computación. Por ejemplo, probablemente te resulte necesario pensar en un problema durante algún tiempo antes de comenzar a escribir. A diferencia del cálculo, en el que la dirección general de los métodos suele ser obvia, tratar de probar afirmaciones matemáticas puede parecer sin dirección o accidental. Sin embargo, es más estratégico que aleatorio. Este es uno de los grandes retos de las matemáticas en los niveles superiores, es creativo, no de memoria. Con la práctica y el pensamiento disciplinado, aprenderás a ver tu manera de probar afirmaciones matemáticas.
Comenzaremos nuestro tratamiento de las matemáticas superiores con un gran número de definiciones. Esto es habitual en un curso de matemáticas, y es necesario porque las matemáticas requieren una expresión precisa. Trataremos de motivar estas definiciones para que su utilidad sea obvia lo antes posible. Después de presentar y discutir algunas definiciones, presentaremos argumentos para algunas afirmaciones elementales relativas a estas definiciones. Esto nos dará algo de práctica en la lectura, escritura y discusión de las matemáticas. En los primeros capítulos del libro incluimos numerosas discusiones y comentarios para ayudarle a comprender la dirección básica de los argumentos. En los capítulos posteriores del libro, leerás argumentos más difíciles para algunos resultados clásicos profundos. Te recomendamos que leas estos argumentos deliberadamente para asegurar tu comprensión profunda del argumento y nutrir tu sentido del nivel de detalle y rigor que se espera en una prueba matemática de pregrado.
Al final de cada capítulo hay ejercicios diseñados para dirigir tu atención a la lectura y obligarte a pensar en los detalles de las pruebas. Algunos de estos ejercicios son sencillos, pero muchos de ellos son muy duros. No esperamos que cada alumno sea capaz de resolver todos los problemas. No obstante, pasar una hora (o más) pensando en un problema difícil es tiempo bien empleado aunque no resuelvas el problema: fortalece tus músculos matemáticos, y te permite apreciar, y entender más profundamente, la solución si finalmente se te muestra. En última instancia, podrás resolver algunos de los problemas difíciles tú mismo después de pensarlos profundamente. ¡Entonces serás un verdadero matemático!
Las matemáticas son, desde un punto de vista, un ejercicio lógico. Definimos objetos que no existen físicamente, y utilizamos la lógica para sacar las conclusiones más profundas que podamos sobre estos objetos. Si este fuera el final de la historia, las matemáticas no serían más que un juego, y serían de poco interés perdurable. Ocurre, sin embargo, que interpretar objetos físicos, procesos, comportamientos y otros sujetos de interés intelectual, como objetos matemáticos, y aplicar las conclusiones y técnicas del estudio de estos objetos matemáticos, nos permite extraer conclusiones confiables y poderosas sobre prácticas problemas. Este método de usar las matemáticas para entender el mundo se llama modelización matemática. El mundo en el que vives, la forma en que entiendes este mundo, y cómo se diferencia del mundo y la comprensión de tus ancestros lejanos, es en gran medida el resultado de la investigación matemática. En este libro, tratamos de explicar cómo sacar conclusiones matemáticas con certeza. Cuando estudiaste cálculo, utilizaste numerosos teoremas profundos para sacar conclusiones que de otra manera podrían haber tomado meses en lugar de minutos. Ahora vamos a desarrollar una comprensión de cómo se derivan los resultados de esta profundidad y poder.
Asesoría al Instructor
Aprender terminología - qué significan “contrapositivo” y “conversar” - llega fácilmente a la mayoría de los estudiantes. Tu reto en el curso es enseñarles a leer las definiciones de cerca, y luego cómo manipularlas. Esto es mucho más difícil cuando no hay una imagen concreta que los estudiantes puedan tener en cuenta. Los vectores enRn, por ejemplo, son más intimidantes que enR3, no por ningún gran aumento inherente en la complejidad, sino porque son más difíciles de pensar geométricamente, por lo que los estudiantes deben confiar solo en el álgebra. Esta confianza lleva tiempo para construir.
El capítulo 1 consiste principalmente en establecer la notación y discutir conceptos necesarios que algunos pueden haber visto ya (como inyecciones y suryecciones). Desafortunadamente esta puede ser la primera exposición a algunas de estas ideas para muchos estudiantes, por lo que el tratamiento es bastante largo. La velocidad a la que se cubra el material de forma natural dependerá de la fuerza y los antecedentes de los alumnos. Tómate un tiempo explicando por qué una secuencia puede pensarse como una función con dominioN; las variaciones de esta idea volverán a repetirse.
El capítulo 2 introduce las relaciones. Éstas son difíciles de entender, debido a la naturaleza abstracta de la definición. Las equivalencias y ordenamientos lineales se repiten a lo largo del libro, y la comodidad de los estudiantes con estos aumentará.
Ni el Capítulo 1 ni el Capítulo 2 habitan en las pruebas. De hecho, las pruebas matemáticas y la lógica elemental de primer orden no se introducen hasta el Capítulo 3. Nuestro objetivo es hacer que el estudiante piense en las estructuras y definiciones matemáticas sin el peso psíquico adicional de las pruebas de lectura y escritura. Usamos ejemplos para ilustrar las definiciones. Los primeros Capítulos proporcionan fundamentos conceptuales básicos para capítulos posteriores, y encontramos que la mayoría de los estudiantes tienen las manos ocupadas solo tratando de leer y entender las definiciones y ejemplos. En los ejercicios pedimos a los alumnos que “muestren” la verdad de algunas afirmaciones matemáticas. Nuestra intención es hacer que el estudiante piense en la tarea de probar afirmaciones matemáticas. No se espera que escriban argumentos exitosos antes del Capítulo 3. Animamos a los estudiantes a intentar los problemas aunque probablemente no estén seguros sobre los requisitos para una prueba matemática. Si cree firmemente que las pruebas matemáticas deben discutirse antes de lanzarse a definiciones matemáticas, puede cubrir primero el Capítulo 3.
El capítulo 3 es bastante formal, y debe ir rápido. El capítulo 4 introduce a los estudiantes a la primera técnica de prueba importante: la inducción. Con la práctica, se puede esperar que dominen esta técnica. También introducimos como tema continuo el estudio de polinomios, y demostramos por ejemplo que un polinomio no tiene más raíces que su grado.
Los capítulos 5,6 y 7 son completamente independientes entre sí. El capítulo 5 trata los límites y la continuidad, hasta demostrar que el límite uniforme de una secuencia de funciones continuas es continuo. El capítulo 6 es sobre conjuntos infinitos, demostrando los teoremas de Cantor y el teorema de Schröder-Bernstein. Al final del capítulo, los alumnos habrán llegado a apreciar que generalmente es mucho más fácil construir dos inyecciones que ¡una biyección!
El capítulo 7 contiene una pequeña teoría de números, hasta la prueba del pequeño teorema de Fermat. Luego muestra cuánto de la estructura se transfiere al álgebra de polinomios reales.
El capítulo 8 construye los números reales, usando cortes Dedekind, y demuestra que tienen la menor propiedad de límite superior. Esto se utiliza entonces para probar los teoremas básicos del análisis real: el teorema del Valor Intermedio y el Teorema del Valor Extremo. Las secciones8.1 a través8.4 requieren únicamente Capítulos1−4 y Sección 6.1. Las secciones8.5−8.8 requieren Secciones5.1 y 5.2. Sección8.9 requiere Capítulo 6.
En el Capítulo 9, introducimos los números complejos. Secciones9.19.3 prueban la fórmula Tartaglia-Cardano para encontrar las raíces de un cúbico, y señalan cómo es necesario usar números complejos incluso para encontrar raíces reales de cubiceros reales. Estas secciones requieren únicamente los Capítulos 1 - 4. En Sección9.4 probamos el Teorema Fundamental del Álgebra. Esto requiere el Capítulo 5 y el teorema de Bolzano-Weierstrass de la Sección 8.6.
¿Qué es un curso razonable basado en este libro? Los capítulos 1 a 4 son esenciales para cualquier curso. En un curso de un cuarto, también se podría abarcar el Capítulo 6 y bien el Capítulo 5 o el 7. En un curso de un semestre, uno podría abarcar Capítulos1−6 y uno de los tres capítulos restantes. El Capítulo 9 puede cubrirse sin el Capítulo 8 si uno está dispuesto a afirmar la propiedad del Límite Mínimo Superior como axioma de los números reales, y entonces la Sección8.6 puede cubrirse antes de la Sección9.4 sin ningún otro material del Capítulo 8.
Te sugerimos que estés de acuerdo con tus compañeros en un plan de estudios común para este curso, para que los temas que cubras a fondo (por ejemplo, cardinalidad) no tengan que repetirse en cursos sucesivos.
Este curso de transición se está convirtiendo en uno de los cursos más importantes del plan de estudios de matemáticas, y el primer curso importante para la especialidad de matemáticas. Para el estudiante talentoso e intelectualmente discriminante de primer o segundo año los cursos iniciales estándar en el plan de estudios de matemáticas -cálculo, ecuaciones diferenciales, álgebra matricial- proporcionan poco incentivo para estudiar matemáticas. En efecto, hay pocas matemáticas en estos cursos, y menos aún con la evolución de los planes de estudios de pregrado inferior hacia el servicio de las ciencias y la ingeniería. Esto es particularmente inquietante ya que se refiere al talentoso estudiante que aún no se ha decidido por una especialización y puede que nunca haya considerado las matemáticas. Creemos que se debe alentar a los mejores estudiantes a tomar este curso lo antes posible, incluso concurrente con el cálculo del segundo semestre o tercer trimestre del primer año. No es solo para ayudar a futuros estudiantes de matemáticas, sino que también puede servir un valioso papel en reclutarlos, al permitir que los estudiantes inteligentes vean que las matemáticas son desafiantes y, más al grano, interesantes y profundas. La matemática es su mejor apologista. Exponga a los estudiantes temprano al pensamiento y resultados matemáticos auténticos y déjelos tomar una decisión informada. Puede ser una sorpresa para algunos, pero los buenos estudiantes aún buscan lo que los matemáticos buscaban como estudiantes: la satisfacción de dominar una disciplina difícil, interesante y útil.
Agradecimientos
Hemos recibido mucha ayuda en la redacción de este libro. Además del apoyo de nuestras familias, hemos recibido valiosos consejos y comentarios de nuestros estudiantes y colegas, y de los revisores del manuscrito. En particular nos gustaría agradecer a Matthew Valeriote por muchas discusiones útiles, y a Alexander Méndez por dibujar todas las figuras del libro. CAPÍTULO 1
Preliminares
Para comunicar las matemáticas necesitarás entender y acatar las convenciones de los matemáticos. En este capítulo revisamos algunas de estas convenciones.
1. “Y” “O”
Las declaraciones son oraciones declarativas; es decir, una declaración es una oración que es verdadera o falsa. Los matemáticos hacen declaraciones matemáticas - oraciones sobre matemáticas que son verdaderas o falsas. Por ejemplo, la declaración:
“Todos los números primos, excepto el número 2, son impares”.
es una verdadera declaración. El enunciado:"3<2." es falso.
Utilizamos conectivos de lenguaje natural para combinar declaraciones matemáticas. Los conectivos “y” y “o” tienen un uso particular en la prosa matemática. DejarP yQ ser declaraciones matemáticas. El enunciadoP and Q es la afirmación de que ambosP yQ son ciertos.
Los matemáticos utilizan lo que se llama el “inclusivo o”. En el uso cotidiano la afirmaciónQ "Po" a veces puede significar que exactamente una (pero no ambas) de las afirmacionesP yQ es verdadera. En matemáticas, la afirmaciónP or Q es verdadera cuando una o ambas declaraciones son verdaderas, es decir, cuando se mantiene alguna de las siguientes:
Pes verdadero yQ es falso.
Pes falso yQ es cierto.
Pes verdad yQ es verdad.
Sets
Intuitivamente, un conjunto matemático es una colección de objetos matemáticos. Desafortunadamente esta sencilla caracterización de conjuntos, manejados descuidadamente, da lugar a contradicciones. Algunas colecciones resultarán no tener las propiedades que exigimos de conjuntos matemáticos. Un ejemplo de cómo esto puede ocurrir se presenta en la Sección 1.7. Aquí no vamos a desarrollar la teoría formal de conjuntos desde cero. En cambio, asumiremos que ciertos conjuntos de bloques de construcción son conocidos, y describir formas de construir nuevos conjuntos a partir de estos bloques de construcción.
Nuestros bloques de construcción iniciales serán los conjuntos de números naturales, enteros, números racionales y números reales. En el Capítulo 8, mostraremos cómo construir todos estos a partir de los números naturales. Sin embargo, no se puede ir mucho más allá de esto: para hacer matemáticas, hay que comenzar con axiomas que aseveran que existe el conjunto de números naturales.
Definición. Elemento,∈ SiX es un conjunto yx es un objeto enX, decimos quex es un elemento, o miembro, deX. Esto está escritox∈X. Escribimosx∉X si nox es miembro deX.
Existen numerosas formas de definir conjuntos. Si un conjunto tiene pocos elementos, puede definirse listando. Por ejemplo,X={2,3,5,7} es el conjunto de los primeros cuatro números primos. A falta de cualquier otra indicación, se supone que un conjunto definido por una lista tiene como elementos solo los objetos de la lista. Para conjuntos con demasiados elementos para enumerar, debemos proporcionar al lector un medio para determinar la pertenencia al conjunto. El autor puede informar al lector que no se han enumerado todos los elementos del conjunto, sino que se ha proporcionado suficiente información para que el lector identifique un patrón para determinar la pertenencia al conjunto. Por ejemplo, letX={2,4,6,8,…,96,98}. EntoncesX es el conjunto de enteros pares positivos menores a 100. Sin embargo, el uso de puntos suspensivos para definir un conjunto puede no funcionar siempre: asume que el lector identificará el patrón que desea caracterizar. Aunque esto suele funcionar, conlleva el riesgo de que el lector no pueda identificar correctamente el patrón pretendido por el autor.
Algunos conjuntos son tan importantes que tienen nombres estándar y anotaciones que necesitarás conocer.
Notación. Números naturales,N Los números naturales son los elementos del conjunto{0,1,2,3,…}. Este conjunto se denota porN.
Cuidado: Muchos autores llaman{1,2,3,…} al conjunto de números naturales. Esto es una cuestión de definición, y no hay convención universal; los logísticos tienden a favorecer nuestra convención, y los algebraistas el otro. En este libro, utilizaremosN+ para denotar{1,2,3,…}.
NOTACIÓN. N+N+es el conjunto de enteros positivos,{1,2,3,…}. NOTACIÓN. Enteros,ZZ es el conjunto de enteros,{…,−3,−2,−1,0,1,2,3,…}. NOTACIÓN. Números racionales,QQ es el conjunto de números racionales,{pq where p,q∈Z and q≠0}. NOTACIÓN. Números reales,RR es el conjunto de números reales. Una buena comprensión de los números reales requiere un poco de desarrollo matemático. De hecho, fue sólo en el siglo XIX cuando realmente llegamos a una comprensión moderna deR. Tendremos mucho que decir sobre los números reales del Capítulo 8.
DEFINICIÓN. Un númerox es positivo six>0. Un número nox es negativo six≥0.
NOTACIÓN. X+SiX es un conjunto de números reales, usamosX+ para los números positivos en el conjuntoX.
La notación que hemos presentado para estos conjuntos es ampliamente utilizada. Presentamos una convención final para los nombres de conjuntos que no es tan ampliamente reconocida, pero que es útil para la teoría de conjuntos.
NOTACIÓN. ⌜es el conjunto de todos los números naturales menores quen:\ulcorner n\urcorner=\{0,1,2, \ldots, n-1\} . Un propósito de esta notación es asociar canónicamente cualquier número naturaln con un conjunto que tenga exactamenten elementos.
El lector debe tener en cuenta que no hemos definido los conjuntos anteriores. Estamos asumiendo que estás familiarizado con ellos, y algunas de sus propiedades, en virtud de tu experiencia previa en matemáticas. Eventualmente definiremos los conjuntos sistemáticamente en el Capítulo8 .
Un método más preciso para definir un conjunto es utilizar condiciones inequívocas que caractericen la pertenencia al conjunto.
Notación. \{x \in X \mid P(x)\}DejarX ser un conjunto (previamente definido), y dejarP(x) ser una condición o propiedad. Entonces el conjuntoY=\{x \in X \mid P(x)\} es el conjunto de elementos en losX que cumplen condiciónP. El conjuntoX se llama el dominio de la variable.
En palabras, (1.1) se lee: "Yequivale al conjunto de todos (poco)x en (capital)X tal queP es cierto dex”. El símbolo "\mid" en (1.1) a menudo se escribe en su lugar con dos puntos, a saber\{x \in X: P(x)\}. En matemáticas,P(x) es una fórmula a menudo matemática. Por ejemplo, supongamos queP(x) es la fórmula "x^{2}=4”. PorP(2) nos referimos a la fórmula con 2 sustituido porx, es decir" 2^{2}=4 " Si la sustitución da como resultado una afirmación verdadera, decimos que seP(x) mantiene en 2, oP(2) es verdad. Si la afirmación que resulta de la sustitución es falsa, por ejemploP(1), decimos queP(x) no se sostiene en 1, o queP(1) es falsa.
EJEMPLO 1.2. Considera el conjuntoX=\{0,1,4,9, \ldots\} . Una definición precisa del mismo conjunto es la siguiente:X=\left\{x \in \mathbb{N} \mid \text { for some } y \in \mathbb{N}, x=y^{2}\right\} . EJEMPLO 1.3. DejarY ser el conjunto de enteros pares positivos menores a 100. Entonces seY puede escribir:\left\{x \in \mathbb{N} \mid x<100 \text { and there is } n \in \mathbb{N}^{+} \text {such that } x=2 \cdot n\right\} EJEMPLO 1.4. Un intervaloI es un subconjunto no vacío de\mathbb{R} con la propiedad que siemprea, b \in I ya<c<b, entoncesc está enI. Un intervalo delimitado debe tener una de las cuatro formas\ [\ begin {aligned} (a, b) &=\ {x\ in\ mathbb {R}\ mid a<x<b\}\\ {[a, b)} &=\ {x\ in\ mathbb {R}\ mid a\ leq x<b\}\\ (a, b] &=\ {x\ en math\ in\ mathbb {R}\ mediados a<x\ leq b\}\\ {[a, b]} &=\ {x\ in\ mathbb {R}\ mediados de a\ leq x \ leq b\} \ end {alineado}\] donde en los tres primeros casosa yb son números reales cona<b y en el cuarto caso solo requerimosa \leq b. Los intervalos no acotados tienen cinco formas:\ [\ begin {aligned} (-\ infty, b) &=\ {x\ in\ mathbb {R}\ mid x<b\}\ (-\ infty, b] &=\ {x\ in\ mathbb {R}\ mid x\ leq b\}\\ (b,\ infty) &=\ {x\ in\ mathbb {R}\ mediados x>b\}\\ {[b,\ infty)} &=\ {x\ in\ mathbb {R}\ mediados x\ geq b\}\\ \ mathbb {R} & \ end {aligned}\] dondeb hay algún número real. Un intervalo se llama cerrado si contiene todos sus extremos (ambosa yb en el primer grupo de ejemplos, solob en los primeros cuatro ejemplos del segundo grupo), y abierto si no contiene ninguno de ellos. Observe que esto hace que\mathbb{R} el único intervalo que sea a la vez cerrado y abierto.
En aras de la brevedad, un autor no puede identificar explícitamente el dominio de la variable. Tenga cuidado con esto, ya que el autor está confiando en el lector para hacer las suposiciones necesarias. Por ejemplo, considere el conjuntoX=\left\{x \mid\left(x^{2}-2\right)(x-1)\left(x^{2}+1\right)=0\right\} . Si se supone que el dominio de la variable es\mathbb{N}, entoncesX=\{1\} . Si se supone que el dominio de la variable es\mathbb{R}, entoncesX=\{1, \sqrt{2},-\sqrt{2}\} . Si se asume que el dominio de la variable es el números complejos, entonces,X=\{1, \sqrt{2},-\sqrt{2}, i,-i\} dóndei está el número complejo\sqrt{-1}. Recuerde, la carga de la comunicación clara recae en el autor, no en el lector.
Otra alternativa es incluir el dominio de la variable en la condición que define la pertenencia al conjunto. Entonces, siX es el dominio pretendido del conjunto yP(x) es la condición para la pertenencia al conjunto,\{x \in X \mid P(x)\}=\{x \mid x \in X \text { and } P(x)\} . siempre y cuando la definición sea clara, el autor tiene cierta flexibilidad con respecto a la notación.
1.2.1. Establecer Identidad. ¿Cuándo son iguales dos conjuntos? Podría inclinarse a decir que dos conjuntos son iguales siempre que sean la misma colección de objetos. Por supuesto que esto es cierto, pero la igualdad como relación entre objetos no es muy interesante. Sin embargo, probablemente hayas pasado mucho tiempo investigando ecuaciones (que son solo declaraciones de igualdad), y dudamos de que la igualdad pareciera trivial. Esto se debe a que en general la igualdad debe entenderse como una relación entre descripciones o nombres de objetos, más que entre los propios objetos. El enunciadoa=b es una afirmación de que el objeto representado pora es el mismo objeto que el representado porb. Por ejemplo, la sentencia5-3=2 es la afirmación de que el número representado por la expresión aritmética5-3 es el mismo número que el representado por el numeral 2.
En el caso de los conjuntos, esta noción de igualdad se llama extensionalidad.
DEFINICIÓN. Extensionalidad LetX andY be sets. EntoncesX=Y siempre que cada elemento de tambiénX sea un elemento deY y cada elemento de tambiénY sea un elemento deX.
Hay flexibilidad en cómo se caracteriza un conjunto siempre y cuando tengamos claro qué objetos constituyen el conjunto. Por ejemplo, consideremos la ecuación establecida\{\text { Mark Twain, Samuel Clemens }\}=\{\text { Mark Twain }\} . Si por “Mark Twain” y “Samuel Clemens”, nos referimos al autor estadounidense fallecido, estos conjuntos son iguales, por extensión, y la afirmación es verdadera. El conjunto en el lado izquierdo de la ecuación tiene un solo elemento ya que ambos nombres se refieren a la misma persona. Si, sin embargo, consideramos a “Mark Twain” y “Samuel Clemens” como nombres, la afirmación es falsa, ya que “Samuel Clemens” es miembro del conjunto en el lado izquierdo de la ecuación, pero no del lado derecho. Se puede ver que las definiciones de conjuntos pueden depender del dominio implícito de la variable aunque los conjuntos se definan listando.
Ejemplo 1.5. Considere los siguientes seis conjuntos:\ [\ begin {aligned} &X_ {1} =\ {1,2\}\\ &X_ {2} =\ {2,1\}\\ &X_ {3} =\ {1,2,1\}\\ &X_ {4} =\ {n\ in\ mathbb {N}\ mediados 0<n<3\}\\ &X_ {5} = izquierda\\ {n\ in\ mathbb {N}\ mid\ text {existen} x, y, z\ in\ mathbb {N} ^ {+}\ texto {tal que} x^ {n} +y^ {n} =z^ {n}\ derecha\}\\ &X_ {6} =\ {0,1,2\}. \ end {aligned}\] Los cinco primeros conjuntos son todos iguales, y el sexto es diferente. No obstante, si bien es obvio queX_{1}=X_{2}=X_{3}=X_{4}, el hecho queX_{5}=X_{1} es el célebre teorema de Andrew Wiles (su prueba del último teorema de Fermat).
1.2.2. Conjuntos Relativos. Para decir algo interesante sobre los conjuntos, necesitamos formas de relacionarlos, y vamos a querer formas de crear nuevos conjuntos a partir de conjuntos existentes.
Definición. Subconjunto,\subseteq LetX yY ser conjuntos. Xes un subconjunto deY si cada elemento deX es también un elemento deY. Esto se escribeX \subseteq Y . Superconjunto,\supseteq SiX \subseteq Y, entoncesY se llama un superconjunto deX, escrito Con elY \supseteq X . fin de mostrar dos conjuntos son iguales (o que dos descripciones de conjuntos se refieren a la misma set), se debe demostrar que tienen precisamente los mismos elementos. A menudo es más fácil si el argumento se rompe en dos argumentos más simples en los que se muestra contención mutua de los conjuntos. En otras palabras, decirX=Y es lo mismo que decirX \subseteq Y \text { and } Y \subseteq X, y verificar las dos afirmaciones separadas en (1.6) suele ser más fácil (o al menos más claro) que mostrarX=Y eso de una vez.
Agreguemos algunas nociones más elementales a nuestra discusión de conjuntos.
DEFINICIÓN. Subconjunto adecuado,\subsetneq, \supsetneq LetX yY ser conjuntos. Xes un subconjunto propio deY siX \subseteq Y \text { and } X \neq Y \text {. } Escribimos esto comoX \subsetneq Y oY \supsetneq X . DEFINICIÓN. Conjunto vacío,\emptyset El conjunto vacío es el conjunto sin elementos. Se denota por\emptyset.
Entonces para cualquier conjunto,X,\emptyset \subseteq X \text {. } (Piensa en por qué esto es cierto). \emptysetEl hecho de que esté vacío no quiere decir que no tenga importancia. En efecto, muchas preguntas matemáticas se reducen a preguntar si un conjunto en particular está vacío o no. Además, como verá en el Capítulo 8, podemos construir toda la línea real a partir del conjunto vacío usando operaciones de conjunto.
EJERCICIO. (Ver Ejercicios 1.1). Demostrar que\{n \in \mathbb{N} \mid n \text { is odd and } n=k(k+1) \text { for some } k \in \mathbb{N}\} está vacío.
Discutamos algunas formas de definir nuevos conjuntos a partir de conjuntos existentes. DEFINICIÓN. Unión,\cup LetX andY be sets. La unión deX yY, escritoX \cup Y, es el conjuntoX \cup Y=\{x \mid x \in X \text { or } x \in Y\} . (Recordemos nuestra discusión en la Sección 1.1 sobre el significado matemático de la palabra “o”.)
DEFINICIÓN. Intersección,\cap LetX andY be sets. La intersección deX yY, escritoX \cap Y, es el conjuntoX \cap Y=\{x \mid x \in X \text { and } x \in Y\} . DEFINICIÓN. Establecer diferencia,\backslash LetX andY be sets. La diferencia establecida deX yY, escritaX \backslash Y, es laX \backslash Y=\{x \in X \mid x \notin Y\} . definición de conjunto. Disjoint LetX andY be sets. XyY son disjuntos siX \cap Y=\emptyset . A menudo uno trata con conjuntos que son subconjuntos de algún conjunto fijo dadoU. Por ejemplo, cuando se trata de conjuntos de números naturales, el conjuntoU sería\mathbb{N}.
DEFINICIÓN. Complemento LetX \subseteq U. El complemento deX inU es el conjuntoU \backslash X. CuandoU se entiende desde el contexto,X se escribe el complemento deX^{c}.
¿Qué pasa con las operaciones de conjuntos que involucran más de dos conjuntos? A diferencia de la aritmética, en la que existe un orden de operaciones por defecto (potencias, productos, sumas), no existe una convención universal para el orden en que se realizan las operaciones de conjunto. Si las intersecciones y uniones aparecen en la misma expresión, entonces el orden en que se realizan las operaciones puede importar. Por ejemplo, supongamosX yY son conjuntos disjuntos, no vacíos, y consideramos la expresiónX \cap X \cup Y \text {. } Si queremos decir que la intersección se ejecute antes de la unión, entonces(X \cap X) \cup Y=X \cup Y . If, sin embargo pretendemos que la unión se compute antes de la intersección, entoncesX \cap(X \cup Y)=X . Since noY está vacía y disjunta deX,(X \cap X) \cup Y \neq X \cap(X \cup Y) . En consecuencia, el orden en que se ejecutan las operaciones de conjunto necesita prescribirse explícitamente con paréntesis.
EJEMPLO 1.7. DejarX=\mathbb{N} yY=\mathbb{Z} \backslash \mathbb{N}. Entonces(X \cap X) \cup Y=\mathbb{N} \cup Y=\mathbb{Z} . Sin embargoX \cap(X \cup Y)=\mathbb{N} \cap \mathbb{Z}=\mathbb{N} . DEFINICIÓN Producto cartesiano, Producto directo,X \times Y LetX andY be sets. El producto cartesiano deX yY, escritoX \times Y, es el conjunto de pares ordenados\{(x, y) \mid x \in X \text { and } y \in Y\} . El producto cartesiano también se llama el producto directo.
EJEMPLO 1.8. VamosX=\{1,2,3\} yY=\{1,2\} . EntoncesX \times Y=\{(1,1),(1,2),(2,1),(2,2),(3,1),(3,2)\} . Tenga en cuenta que el orden importa - es decir(1,2) \neq(2,1) . AsíX \times Y es un conjunto con seis elementos. Dado que los productos directos son en sí mismos conjuntos, podemos definir fácilmente el producto directo de más de dos factores. Por ejemplo, dejarX, Y yZ ser conjuntos, luego(X \times Y) \times Z=\{((x, y), z) \mid x \in X, y \in Y, z \in Z\} . Formalmente,(X \times Y) \times Z \neq X \times(Y \times Z), porque((x, y), z) y no(x,(y, z)) son lo mismo. Sin embargo en casi todas las aplicaciones, esta distinción no es importante, y los matemáticos generalmente consideran el producto directo de más de dos conjuntos sin tener en cuenta este detalle. Por lo tanto, generalmente verá el producto cartesiano de tres conjuntos escritos sin paréntesis,X \times Y \times Z \text {. } en este caso podrá interpretar el producto directo como cualquiera de los lados de la declaración 1.8.
Con un poco de pensamiento, se puede concluir que hemos descrito esencialmente el producto cartesiano de una colección finita arbitraria de conjuntos. Los elementos del producto cartesianoX \times Y son pares ordenados. Nuestra caracterización del producto cartesiano de tres conjuntos,X, Y yZ, indica que sus elementos podrían considerarse como pares ordenados de elementos deX \times Y yZ, respectivamente. Desde un punto de vista práctico, es más sencillo pensar en elementosX \times Y \times Z de triples ordenados. Esto lo generalizamos de la siguiente manera.
DEFINICIÓN. Producto cartesiano, producto directo,\prod_{i=1}^{n} X_{i} Letn \in\mathbb{N}^{+}, yX_{1}, X_{2}, \ldots, X_{n} ser conjuntos. El producto cartesiano deX_{1}, \ldots, X_{n}, escritoX_{1} \times X_{2} \times \ldots \times X_{n}, es el conjunto\left\{\left(x_{1}, x_{2}, \ldots, x_{n}\right) \mid x_{i} \in X_{i}, 1 \leq i \leq n\right\} . Esto también puede escribirse\prod_{i=1}^{n} X_{i} . Cuando tomamos el producto cartesiano de un conjuntoX consigo mismon tiempos, lo escribimos como X^{n}:X^{n}:=\overbrace{X \times X \times \cdots \times X}^{n \text { times }} .
Funciones
Al igual que los conjuntos, las funciones son omnipresentes en las matemáticas.
Definición. Función,f: X \rightarrow Y LetX andY be sets. Una funciónf deX aY, denotada porf: X \rightarrow Y, es una asignación de exactamente un elemento deY a cada elemento deX.
Para cada elementox \in X, la funciónf asocia o selecciona un elemento únicoy \in Y. La condición de singularidad no permitex ser asignada a distintos elementos deY. Permite que diferentes elementos deX sean asignados al mismo elemento deY sin embargo. Es importante para tu comprensión de las funciones que consideres este punto cuidadosamente. Los siguientes ejemplos pueden ayudar a ilustrar esto.
EJEMPLO 1.9. Letf: \mathbb{Z} \rightarrow \mathbb{R} be given byf(x)=x^{2} . Thenf es una función en la que el elemento de\mathbb{R} asignado al elementox de\mathbb{Z} es especificado por la expresiónx^{2}. Por ejemplo,f asigna 9 al entero 3. Esto lo expresamos por escritof(3)=9 \text {. } Observe que no todos los números reales están asignados a un número de\mathbb{Z}. Además, observe que 4 se asigna tanto a 2 como a-2. Comprobar quef sí satisface la definición de una función.
EJEMPLO 1.10. Dejarg: \mathbb{R} \rightarrow \mathbb{R} ser definido porg(x)=\tan (x). Entonces nog es una función, porque no se define cuandox=\pi / 2 (o siemprex-\pi / 2 es un múltiplo entero de\pi). Esto se puede arreglar definiendoX=\mathbb{R} \backslash\{\pi / 2+k \pi \mid k \in \mathbb{Z}\} . Entonces\tan : X \rightarrow \mathbb{R} es una función deX a\mathbb{R}. EJEMPLO 1.11. Considera dos reglasf, g: \mathbb{R} \rightarrow \mathbb{R},, definidas por\ [\ begin {array} {ll} f (x) =y &\ text {if} 3 x=2-y\\ g (x) =y &\ text {if} x=y^ {4}. \ end {array}\] Entoncesf es una función, y se puede dar explícitamente comof(x)=2-3 x. Perog no define una función, porquee . g. cuandox=16, entoncesg(x) podría ser o bien 2 o-2.
DEFINICIÓN. Imagen Letf: X \rightarrow Y. Sia \in X, entonces el elemento deY que sef asigna aa se denota porf(a), y se llama la imagen dea debajof.
La notaciónf: X \rightarrow Y es una declaración quef es una función deX aY. Esta afirmación tiene como consecuencia que para cadaa \in X,f(a) es un elemento específico deY. Damos una caracterización alternativa de funciones basada en productos cartesianos.
DEFINICIÓN. Gráfica de una función Letf: X \rightarrow Y. La gráfica def, \operatorname{graph}(f), es\{(x, y) \mid x \in X \text { and } f(x)=y\} . EJEMPLO 1.12. DejarX \subseteq \mathbb{R} yf: X \rightarrow \mathbb{R} ser definido porf(x)=-x. Entonces la gráfica def es\{(x,-x) \mid x \in X\} . EJEMPLO 1.13. La función vacíaf es la función con gráfico vacío (esa es la gráfica def es el conjunto vacío). Esto significaf: \emptyset \rightarrow Y para algún conjuntoY.
Sif: X \rightarrow Y, entonces,\operatorname{graph}(f) \subseteq X \times Y \text {. } VamosZ \subseteq X \times Y. EntoncesZ es la gráfica de una función deX aY si
(i) para cualquierax \in X, hay algunosy enY tal que(x, y) \in Z
(ii) si(x, y) está adentroZ y(x, z) está adentroZ, entoncesy=z. SupongamosX yY son subconjuntos de\mathbb{R}. Entonces Condición (i) es la condición de que cada línea vertical a través de un punto deX corta la gráfica al menos una vez. La condición (ii) es la condición de que cada línea vertical a través de un punto deX corta la gráfica como máximo una vez.
DEFINICIÓN. Dominio, Codominio Letf: X \rightarrow Y. El conjuntoX se llama el dominio def, y está escrito\operatorname{Dom}(f). El conjuntoY se llama el codominio def.
El dominio de una función es un componente necesario de la definición de una función. El codominio es un poco más sutil. Si piensas en las funciones como conjuntos de pares ordenados, es decir, si identificaste la función con su gráfica, entonces cada función tendría muchos codominios posibles (tomar cualquier superconjunto del codominio original). Los teóricos de conjuntos piensan en las funciones de esta manera, y si las funciones se consideran como conjuntos, la extensionalidad requiere que las funciones con la misma gráfica sean idénticas. No obstante, esta convención haría torpe una discusión de las suryecciones (véase más adelante), por lo que no la adoptaremos.
Cuando escribesf: X \rightarrow Y estás nombrando explícitamente el codominio previsto, y esto hace que el codominio sea una parte crucial de la definición de la función. Estás indicando al lector que tu definición incluye algo más que la gráfica de la función. La definición de una función incluye tres partes: el dominio, el codominio y la gráfica.
EJEMPLO 1.14. Dejarf: \mathbb{N} \rightarrow \mathbb{N} ser definido porf(n)=n^{2} . Letg: \mathbb{N} \rightarrow \mathbb{R} be defined byg(x)=x^{2} . Then\operatorname{graph}(f)=\operatorname{graph}(g). Sih: \mathbb{R} \rightarrow \mathbb{R} se define parah(x)=x^{2} entonces\operatorname{graph}(f) \subsetneq \operatorname{graph}(h), asíf \neq h yg \neq h. Si bien\operatorname{graph}(f)=\operatorname{graph}(g), consideramosf yg ser diferentes funciones porque tienen diferentes codominios.
DEFINICIÓN. Rango Letf: X \rightarrow Y. El rango def, \operatorname{Ran}(f), es\{y \in Y \mid \text { for some } x \in X, f(x)=y\} \text {. } So sif: X \rightarrow Y, entonces\operatorname{Ran}(f) \subseteq Y, y es precisamente el conjunto de imágenes bajof de elementos enX. Eso es\operatorname{Ran}(f)=\{f(x) \mid x \in X\} . Ningún subconjunto adecuado de\operatorname{Ran}(f) puede servir como codominio para una función que tiene la misma gráfica quef.
EJEMPLO 1.15. Con la misma notación que en el Ejemplo 1.14, tenemos\operatorname{Ran}(f)=\operatorname{Ran}(g)=\left\{n \in \mathbb{N} \mid n=k^{2}\right. para algunos\left.k \in \mathbb{N}\right\}. El rango deh es[0, \infty).
DEFINICIÓN. Función de valor real, función real Letf: X \rightarrow Y. Si\operatorname{Ran}(f) \subseteq \mathbb{R}, decimos quef es de valor real. SiX \subseteq \mathbb{R} yf es una función de valor real, entonces llamamosf una función real.
A veces se dice que una función es una regla que asigna, a cada elemento de un conjunto dado, algún elemento de otro conjunto. Si por una regla se entiende una instrucción de algún tipo, verá en el Capítulo 6 que hay “más” funciones que no pueden caracterizarse por reglas que funciones que las que pueden haber. En la práctica, sin embargo, la mayoría de las funciones que utilizamos están definidas por reglas.
Si una función viene dada por una regla, es común escribirla en la forma\ [\ begin {aligned} f: X &\ fila derecha Y\\ x &\ mapsto f (x). \ end {aligned}\] El símbolo\mapsto se lee “se asigna a”. Por ejemplo, la funcióng del ejemplo anterior podría definirse por\ [\ begin {aligned} g:\ mathbb {N} &\ rightarrow\ mathbb {R}\\ n &\ mapsto n^ {2}. \ end {alineado}\] Ejemplo 1.16. La función\ [\ begin {aligned} f:\ mathbb {R} &\ rightarrow\ mathbb {R}\\ x &\ mapsto\ begin {cases} 0 & x<0\\ x+1 & x\ geq 0\ end {cases} \ end {aligned}\] está definida por una regla, aunque para aplicar la regla a un dado primerox debes verificar dónde en el dominiox se encuentra.
Cuando una función real es definida por una regla y el dominio no se establece explícitamente, se toma como el conjunto más grande para el que se define la regla. Esta es la convención habitual en el cálculo: las funciones reales se definen por expresiones matemáticas y se entiende que el dominio implícito de una función es el subconjunto más grande\mathbb{R} para el que la expresión tiene sentido. Se supone que el codominio de una función real es a\mathbb{R} menos que se indique explícitamente lo contrario.
EJEMPLO 1.17. Quef(x)=\sqrt{x} sea una función real. Se supone que el dominio de la función es\{x \in \mathbb{R} \mid x \geq 0\} . DEFINICIÓN. Operación DejarX ser un conjunto, yn \in \mathbb{N}^{+}. Una operaciónX encendida es una función deX^{n} aX.
Las operaciones pueden considerarse como medios para combinar elementos de un conjunto para producir nuevos elementos del conjunto. Las operaciones más comunes son las operaciones binarias (cuandon=2).
Ejemplo1.18 .+ y\cdot son operaciones binarias en\mathbb{N}.
y no\div son operaciones en\mathbb{N}.
EJEMPLO 1.19. LetX=\mathbb{R}^{3}, pensado como el conjunto de 3 -vectores. La funciónx \mapsto-x es una operación unariaX encendida, la función(x, y) \mapsto x+y es una operación binaria y la función(x, y, z) \mapsto x \times y \times z es una operación ternaria. Sif: X \rightarrow Y, g: X \rightarrow Y, y\star es una operación binariaY encendida, entonces hay una manera natural de definir una nueva función alX usar\star. Definirf \star g por\ [\ comenzar {alineado} f\ estrella g: X &\ fila derecha Y\\ (f\ estrella g) (x) &=f (x)\ estrella g (x). \ end {alineado}\] Ejemplo 1.20. Supongamos quef es la función realf(x)=x^{3}, yg es la función realg(x)=3 x^{2}-1. Entoncesf+g es la función realx \mapsto x^{3}+3 x^{2}-1, yf \cdot g es la función realx \mapsto x^{3}\left(3 x^{2}-1\right).
Otra forma de construir nuevas funciones es por composición.
DEFINICIÓN. Composición,\circ Letf: X \rightarrow Y yg: Y \rightarrow Z. Entonces la composición deg conf es la función,\ [\ begin {aligned} g\ circ f: X &\ rightarrow Z\\ x &\ mapsto g (f (x)). \ end {alineado}\] Ejemplo 1.21. Dejarf ser la función realf(x)=x^{2} . Dejarg ser la función realg(x)=\sqrt{x} . Entonces(g \circ f)(x)=|x| . ¿qué esf \circ g? (Tenga cuidado con el dominio).
EJEMPLO 1.22. Vamos\ [\ comenzar {alineado} f:\ mathbb {R} &\ rightarrow\ mathbb {R}\\ x &\ mapsto 2 x+1 \ end {alineado}\] y dejar\ [\ comenzar {alineado} g:\ mathbb {R} ^ {2} &\ rightarrow\ mathbb {R}\\ (x, y) &\ mapsto x^ {2} +3 y^ {2}. \ end {alineado}\] Entonces\ [\ begin {alineado} f\ circ g:\ mathbb {R} ^ {2} &\ fila derecha\ mathbb {R}\\ (x, y) &\ mapsto 2 x^ {2} +6 y^ {2} +1. \ end {aligned}\] La función nog \circ f está definida (¿por qué?).
Inyecciones, Suryecciones, Biyecciones
Las más básicas entre las características que puede tener una función son las propiedades de inyectividad, surjectividad y bijectividad.
DEFINICIÓN. Inyección, Let Uno a Unof: X \rightarrow Y. La funciónf se llama inyección si, siempre quex yy son elementos distintos deX, tenemosf(x) \neq f(y). Las inyecciones también se llaman funciones uno-a-uno.
Otra forma de afirmar la definición (el contrapositivo) es que sif(x)=f(y) entoncesx=y.
EJEMPLO 1.23. La función realf(x)=x^{3} es una inyección. Para ver esto, dejemosx yy sean números reales, y supongamos quef(x)=x^{3}=y^{3}=f(y) .x=\left(x^{3}\right)^{1 / 3}=\left(y^{3}\right)^{1 / 3}=y . Entonces Así, porx, y \in X,f(x)=f(y) \text { only if } x=y . Ejemplo 1.24. La función real nof(x)=x^{2} es una inyección, ya quef(2)=4=f(-2) . Observe que un solo ejemplo es suficiente para demostrar quef no es una inyección.
EJEMPLO 1.25. Supongamosf: X \rightarrow Y yg: Y \rightarrow Z. Demostrar que sif yg son inyectables, así esg \circ f.
Prueba. Supongamos queg \circ f(x)=g \circ f(y). Ya queg es inyectivo, esto quiere decir quef(x)=f(y). Ya quef es inyectable, esto a su vez significa esox=y. Por lo tanto,g \circ f es inyectivo, según se desee. (Ver Ejercicio1.20 a continuación).
Definición. Surjección, Onto Letf: X \rightarrow Y. Decimos quef es una sobrejección deX aY si\operatorname{Ran}(f)=Y. También describimos esto diciendo quef está sobreY.
EJEMPLO 1.26. La funciónf: \mathbb{R} \rightarrow \mathbb{R} definida por nof(x)=x^{2} es una sobreyección. Por ejemplo,-1 está en el codominio def, pero-1 \notin \operatorname{Ran}(f). Por lo tanto,\operatorname{Ran}(f) \subsetneq \mathbb{R}.
EJEMPLO 1.27. DejarY=\{x \in \mathbb{R} \mid x \geq 0\}, yf: \mathbb{R} \rightarrow Y ser dado porf(x)=x^{2}. Entoncesf es una sobrejección. Para probarlo, tenemos que demostrarloY=\operatorname{Ran}(f). Eso lo sabemos\operatorname{Ran}(f) \subseteq Y, así que debemos mostrarY \subseteq \operatorname{Ran}(f). Vamosy \in Y, asíy es un número real no negativo. Entonces\sqrt{y} \in \mathbb{R}, yf(\sqrt{y})=y. Entoncesy \in \operatorname{Ran}(f). Ya quey fue un elemento arbitrario deY, Y \subseteq \operatorname{Ran}(f). De ahíY=\operatorname{Ran}(f) yf es una sobrejección.
El hecho de que una función sea una sobreyección depende de la elección del codominio. Una función está siempre en su rango. Quizás te preguntes por qué uno no definiría simplemente el codominio como el rango de la función (garantizando que la función es una suryección). Una razón es que podemos estar más interesados en relacionar dos conjuntos usando funciones que en cualquier función particular entre los conjuntos. Estudiamos una importante aplicación de funciones para relacionar conjuntos en el Capítulo 6, donde utilizamos funciones para comparar el tamaño de los conjuntos. Esto es de particular interés a la hora de comparar conjuntos infinitos, y ha llevado a profundizar en los fundamentos de las matemáticas.
Si juntamos las ideas de una inyección y una suryección, llegamos a la idea clave de una biyección.
Definición. Bijección,\mapsto Vamosf: X \rightarrow Y. Sif es una inyección y una sobreyección, entoncesf es una biyección. Esto está escrito comof: X \mapsto Y.
¿Por qué son tan importantes las bijecciones? Desde un punto de vista teórico, las funciones pueden ser utilizadas para relacionar el dominio y el codominio de la función. Si está familiarizado con un conjunto, es posible que pueda desarrollar conocimientos en un conjunto diferente al encontrar una función entre los conjuntos que conserve algunas de las características clave de los conjuntos. Por ejemplo, una inyección puede “interpretar” un conjunto en un conjunto diferente. Si la inyección conserva la información crítica del dominio, podemos comportarnos como si el dominio de la función fuera prácticamente un subconjunto del codominio mediante el uso de la función para “renombrar” los elementos del dominio. Si la función es una biyección, y conserva las características estructurales clave del dominio, podemos tratar el dominio y el codominio como prácticamente el mismo conjunto. Cuáles son las características estructurales clave depende del área de matemáticas que estés estudiando. Por ejemplo, si estás estudiando estructuras algebraicas, probablemente estés más interesado en preservar las operaciones de la estructura. Si estás estudiando geometría, te interesan las funciones que preserven la forma. La preservación de las características estructurales clave del dominio o codominio a menudo nos permite traducir el conocimiento de un conjunto en conocimiento equivalente de otro conjunto.
DEFINICIÓN. Permutación LetX Ser un conjunto. Una permutación deX es una biyecciónf: X \mapsto X.
EJEMPLO 1.28. Dejarf: \mathbb{Z} \rightarrow \mathbb{Z} ser definido porf(x)=x+1 . Entoncesf es una permutación de\mathbb{Z}.
Ejemplo 1.29. VamosX=\{0,1,-1\}. Entoncesf: X \rightarrow X dada porf(x)=-x es una permutación deX.
Imágenes e inversos
Las funciones se pueden utilizar para definir subconjuntos de conjuntos dados.
DEFINICIÓN. Imagen,f[] Letf: X \rightarrow Y yW \subseteq X. La imagen deW debajof, escritaf[W], es el conjunto\{f(x) \mid x \in W\} . Así que sif: X \rightarrow Y, entonces\operatorname{Ran}(f)=f[X] . EJEMPLO 1.30. Supongamos quef es la función realf(x)=x^{2}+3. VamosW=\{-2,2,3\}, yZ=(-1,2). Entoncesf[W]=\{7,12\}, yf[Z]=[3,7).
En aplicaciones de las matemáticas, las funciones suelen describir relaciones numéricas entre observaciones medibles. Entonces sif: X \rightarrow Y ya \in X, entoncesf(a) es la medida predicha o real asociada cona. En este contexto, a menudo uno está interesado en determinar qué elementos deX están asociados a un valor,b, en el codominio def.
Definición 1.31. Imagen inversa, Pre-imagen,f^{-1}() Letf: X \rightarrow Y yb \in Y. Entonces la imagen inversa deb underf, f^{-1}(b), es el conjunto\{x \in X \mid f(x)=b\} . Este conjunto también se llama la pre-imagen deb underf.
Tenga en cuenta que sib \notin \operatorname{Ran}(f), entoncesf^{-1}(b)=\emptyset. Sif es una inyección, entonces para cualquierab \in \operatorname{Ran}(f), f^{-1}(b) tiene un solo elemento.
Definición. Imagen inversa, Pre-imagen,f^{-1}[] Letf: X \rightarrow Y yZ \subseteq Y. La imagen inversa deZ underf, o la pre-imagen deZ underf, es el conjuntof^{-1}[Z]=\{x \in X \quad \mid f(x) \in Z\} que usamosf^{-1}[] para significar la imagen inversa de un subconjunto del codominio, yf^{-1} () para la imagen inversa de un elemento del codominio - ambos son subconjuntos del dominio def. SiZ \cap \operatorname{Ran}(f)=\emptyset, entoncesf^{-1}[Z]=\emptyset . EJEMPLO 1.32. fSea como en Figura1.33 Entoncesf[\{b, c\}]=\{1,3\}, yf^{-1}[\{1,3\}]=\{a, b, c, d\}.
FIGURA 1.33. Imagen def
EJEMPLO 1.34. gDéjese ser la verdadera funcióng(x)=x^{2}+3. Sib \in \mathbb{R} yb>3, entoncesg^{-1}(b)=\{\sqrt{b-3},-\sqrt{b-3}\} . Sib=3, entoncesg^{-1}(3)=\{0\}. Sib<3, entoncesg^{-1}(b) está vacío.
EJEMPLO 1.35. hDéjese ser la verdadera funciónh(x)=e^{x}. Sib \in \mathbb{R} yb>0, entoncesh^{-1}(b)=\left\{\log _{e}(b)\right\} . Por ejemplo,h^{-1}(1)=\{0\} . Porqueh es estrictamente creciente, la imagen inversa de cualquier elemento del codominio(\mathbb{R}) es o bien un conjunto con un solo elemento o el conjunto vacío.
LetI=(a, b), dondea, b \in \mathbb{R} y0<a<b (Ies decir, el intervalo abierto con puntos finalesa yb). Luegoh^{-1}[I]=\left(\log _{e}(a), \log _{e}(b)\right) . hemos discutido la construcción de nuevas funciones a partir de funciones existentes utilizando operaciones algebraicas y composición de funciones. Otra herramienta para construir nuevas funciones a partir de funciones conocidas es la función inversa.
Definición 1.36. Función inversa Letf: X \mapsto Y Ser una biyección. Entonces la función inversa def, f^{-1}: Y \rightarrow X, es la función con gráfica\{(b, a) \in Y \times X \mid(a, b) \in \operatorname{graph}(f)\} . La funciónf^{-1} se define por “revertir las flechas”. Para que esto tenga sentido,f: X \rightarrow Y debe ser biyectiva. En efecto, si nof fueran suryectivas, entonces habría un elementoy deY que no está en el rango def, por lo que no se puede mapear de nuevo a nada enX. Si nof fueran inyectables, habría elementosz deY que fueran la imagen de elementos distintosx_{1} yx_{2} enX. No se podría definirf^{-1}(z) sin especificar cómo elegir una preimagen en particular. Ambos problemas se pueden solucionar. Sif es inyectable pero no suryectiva, se puede definirg: X \mapsto \operatorname{Ran}(f) porg(x)=f(x) para todosx \in X. Entoncesg^{-1}: \operatorname{Ran}(f) \mapsto X. Si nof es inyectable, el problema es más complicado; pero si podemos encontrar algún subconjuntoX sobre el cualf es inyectable, podríamos restringir nuestra atención a ese conjunto.
EJEMPLO 1.37. fDéjese ser la verdadera funciónf(x)=x^{2}. La función nof es una biyección, por lo que no tiene una función inversa. Sin embargo la función\ [\ begin {aligned}
g: [0,\ infty) &\ rightarrow [0,\ infty)\\
x &\ mapsto x^ {2}
\ end {alineado}\] es una biyección. En este caso,g^{-1}(y)=\sqrt{y} .
FIGURA 1.38. Imagen deg
EJEMPLO 1.39. Quef sea la verdadera función,f(x)=e^{x}. Sabes por cálculo quef es una inyección, y eso\operatorname{Ran}(f)=\mathbb{R}^{+}. De ahíf que no sea una sobreyección, ya que el codominio implícito de una función real lo es\mathbb{R}. La función\ [\ begin {aligned} g:\ mathbb {R} &\ rightarrow\ mathbb {R} ^ {+}\\ x &\ mapsto e^ {x} \ end {aligned}\] es una biyección yg^{-1}(x)=\log _{e}(x) Advertencia: Paraf: X \mapsto Y una biyección hemos asignado dos significados diferentes af^{-1}(b). En la Definición 1.31, significa el conjunto de puntos en losX que se mapeanb. En la Definición 1.36, significa la función inversaf^{-1},, de la biyecciónf aplicada al puntob \in Y. Sin embargo, sif es una biyección, para que la segunda definición tenga sentido, entonces estas definiciones están estrechamente relacionadas. Supongamosa \in \operatorname{Dom}(f) yf(a)=b. De acuerdo con la Definición 1.31,f^{-1}(b)=\{a\} y por Definición1.36f^{-1}(b)=a. En la práctica el contexto dejará claro qué definición se pretende. DEFINICIÓN. Función de identidad, id\left.\right|_{X} LetX be a set. La función de identidad onX, id\left.\right|_{X}: X \mapsto X, es la función definida por\left.\operatorname{id}\right|_{X}(x)=x . Iff: X \rightarrow Y es una biyección, entoncesf^{-1} es la función única tal quef^{-1} \circ f=\left.\operatorname{id}\right|_{X} yf \circ f^{-1}=\left.\mathrm{id}\right|_{Y} . Porque f(x)=x^{2}no es una inyección, no tiene inversa, incluso después de restringir el codominio para que sea el rango. Por lo tanto, para “invertir”f, consideramos una función diferenteg(x), que era igual af sobre un subconjunto del dominio def, y era una inyección. En el Ejemplo 1.37, logramos esto definiendo la funcióng(x)=x^{2} con dominio\{x \in \mathbb{R} \mid x \geq 0\}. Muchas de las funciones que necesitamos invertir por razones prácticas y teóricas pasan por no ser inyecciones, y por lo tanto no tienen funciones inversas. Una forma de abordar este obstáculo es considerar la función en un dominio más pequeño.
Dada una función, es posiblef: X \rightarrow Y que deseemos definir una “inversa” def en algún subconjuntoW \subseteq X para el cual la restricción def aW es una inyección.
DEFINICIÓN. Dominio restringido,\left.f\right|_{W} Letf: X \rightarrow Y yW \subseteq X. La restricción def aW, escrita\left.f\right|_{W}, es la función\ [\ begin {aligned} \ left.f\ right|_ {W}: W &\ rightarrow Y\\ x &\ mapsto f (x). \ end {aligned}\] Así que sif: X \rightarrow Y yW \subseteq X, entonces\operatorname{graph}\left(\left.f\right|_{W}\right)=[W \times Y] \cap[\operatorname{graph}(f)] . EJEMPLO 1.40. Vamosf(x)=(x-2)^{4}. VamosW=[2, \infty). Entonces\left.f\right|_{W}: W \rightarrow[0, \infty) es una biyección. EJEMPLO 1.41. Quef sea la verdadera función,f(x)=\tan (x). Entonces\operatorname{Dom}(f)=\{x \in \mathbb{R} \mid x \neq \pi / 2+k \pi, k \in \mathbb{Z}\}, y\operatorname{Ran}(f)=\mathbb{R} . La funciónf es periódica con periodo\pi, y por lo tanto no es una inyección. No obstante, es importante responder a la pregunta,
“En qué ángulo (s),x, hace\tan (x) igual a un valor particular,a \in \mathbb{R} “”.
Esto es matemáticamente equivalente a preguntar,\text { "What is } \arctan (a) \text { ?". } En cálculo esta necesidad se satisfizo restringiendo el dominio a un intervalo mayor,I tal que\left.f\right|_{I}: I \mapsto \mathbb{R} Para cualquierak \in \mathbb{Z},\left(\frac{(2 k+1) \pi}{2}, \frac{(2 k+3) \pi}{2}\right) es tal intervalo. Para definir una función específica, se selecciona el más simple de estos intervalos, y definimos\operatorname{Tan}:=\left.\tan \right|_{(-\pi / 2, \pi / 2)} . Observar que\text { Tan : }(-\pi / 2, \pi / 2) \mapsto \mathbb{R} . Así la función es invertible, es decir, Tan tiene una función inversa,\operatorname{Arctan}=\operatorname{Tan}^{-1} \text {. }
Secuencias
En el cálculo pensamos en una secuencia como una lista (posiblemente infinita) de objetos. Ampliaremos un poco esa idea, y la expresaremos en el lenguaje de las funciones.
DEFINICIÓN. Secuencia finita,\left\langle a_{n} \mid n<N\right\rangle Una secuencia finita es una funciónf con dominio\ulcorner N\urcorner, dondeN \in \mathbb{N}. A menudo identificamos la secuencia con el conjunto finito ordenado\left\langle a_{n} \mid n<N\right\rangle, dondea_{n}=f(n), para0 \leq n<N.
Esta interpretación de una secuencia como un tipo de función se extiende fácilmente a secuencias infinitas.
DEFINICIÓN. Secuencia infinita,\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle Una secuencia infinita es una funciónf con dominio\mathbb{N}. A menudo identificamos la secuencia con el conjunto infinito ordenado\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle, dondea_{n}=f(n), paran \in \mathbb{N}.
OBSERVACIÓN. Intervalo en\mathbb{Z} Realmente, la secuencia de palabras se usa normalmente para significar cualquier función cuyo dominio sea un intervalo in\mathbb{Z}, donde un intervalo in\mathbb{Z} es la intersección de algún intervalo real con\mathbb{Z}. Por conveniencia en este libro, solemos suponer que el primer elemento de cualquier secuencia está indexado por 0 o 1.
EJEMPLO 1.42. La secuencia\langle 0,1,4,9, \ldots\rangle viene dada por la funciónf(n)=n^{2} .
La secuencia\langle 1,-1,2,-2,3,-3, \ldots\rangle viene dada por la funciónf(n)= \begin{cases}\frac{n}{2}+1, & n \text { even } \\ -\frac{n+1}{2}, & n \text { odd. }\end{cases} Secuencias puede tomar valores en cualquier conjunto (el codominio de la funciónf que define la secuencia). Hablamos de una secuencia real si los valores son números reales, una secuencia entera si todos son enteros, etc. resultará más tarde que las secuencias con valores en el conjunto de dos elementos\{0,1\} ocurren con bastante frecuencia, así que tenemos un nombre especial para ellos: los llamamos secuencias binarias.
DEFINICIÓN. Secuencia binaria Una secuencia binaria finita es una funciónf:\ulcorner N\urcorner \rightarrow\ulcorner 2\urcorner,, para algunosN \in \mathbb{N}. Una secuencia binaria infinita es una función,f: \mathbb{N} \rightarrow\ulcorner 2\urcorner.
A menudo usamos la expresión\left\langle a_{n}\right\rangle para la secuencia\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle.
Las funciones también se utilizan para “indexar” conjuntos con el fin de construir conjuntos más complicados con operaciones de conjunto generalizadas. Se discutió la unión (o intersección) de más de dos conjuntos. Podría preguntarse si es posible formar uniones o intersecciones de una gran colección (infinita) de conjuntos. Hay dos preocupaciones que deben abordarse al responder a esta pregunta. Debemos estar seguros de que la definición de la unión de infinitamente muchos conjuntos es precisa; es decir, caracteriza de manera única a un objeto en el universo matemático. También necesitamos notación para manejar esta idea - ¿cómo especificamos los conjuntos sobre los que estamos tomando el sindicato?
DEFINICIÓN. Unión infinita, Index set,\bigcup_{n=1}^{\infty} X_{n} \quad Forn \in \mathbb{N}^{+}, letX_{n} be a set. Entonces\bigcup_{n=1}^{\infty} X_{n}=\left\{x \mid \text { for some } n \in \mathbb{N}^{+}, x \in X_{n}\right\} \text {. } El conjunto\mathbb{N}^{+} se llama el conjunto de índices para la unión.
Esto puede escribirse de algunas maneras diferentes.
Notación. \bigcup_{n \in \mathbb{N}^{+}} X_{n}Las siguientes tres expresiones son todas iguales:
Podemos usar conjuntos de índices distintos a\mathbb{N}^{+}.
DEFINICIÓN. Familia de conjuntos, Unión indexada,\bigcup_{\alpha \in A} X_{\alpha} \quad LetA be a set, y para\alpha \in A, letX_{\alpha} be a set. El conjunto\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\} se llama familia de conjuntos indexados porA. Entonces\bigcup_{\alpha \in A} X_{\alpha} Se lee\bigcup_{\alpha \in A} X_{\alpha}=\left\{x \mid x \in X_{\alpha} \text { for some } \alpha \in A\right\} \text {. } la notación “la unión sobre alfa en A de los conjuntos X sub alfa”. Entonces las interseccionesx \in \bigcup_{\alpha \in A} X_{\alpha} \text { if } x \in X_{\alpha} \text { for some } \alpha \in A \text {. } generales sobre una familia de conjuntos se definen análogamente:\bigcap_{\alpha \in A} X_{\alpha}=\left\{x \mid x \in X_{\alpha} \text { for all } \alpha \in A\right\} . EJEMPLO 1.43. DejarX_{n}=\{n+1, n+2, \ldots, 2 n\} para cada unon \in \mathbb{N}^{+}. Entonces\ [\ begin {alineado} &\ bigcup_ {n=1} ^ {\ infty} X_ {n} =\ {k\ in\ mathbb {N}\ mid k\ geq 2\}\\ &\ bigcap_ {n=1} ^ {\ infty} X_ {n} =\ emptyset. \ end {alineado}\] Ejemplo 1.44. Por cada número real positivot, vamosY_{t}=[11 / t, t]. Entonces\ [\ begin {aligned} \ bigcup_ {t\ in (\ sqrt {11},\ infty)} Y_ {t} &=\ mathbb {R} ^ {+}\\ \ bigcap_ {t\ in [\ sqrt {11},\ infty)} Y_ {t} &=\ {\ sqrt {11}\}. \ end {alineado}\] Ejemplo 1.45. Dejarf: X \rightarrow Y, A \subseteq X yB \subseteq Y. Entonces\bigcup_{a \in A}\{f(a)\}=f[A] . y\bigcup_{b \in B} f^{-1}(b)=f^{-1}[B] .
Paradoja de Russell
A medida que se exploraron las ideas para la teoría de conjuntos, hubo intentos de definir conjuntos de la manera más amplia posible. Se esperaba que cualquier colección de objetos matemáticos que pudiera definirse por una fórmula calificaría como un conjunto. Esta creencia fue conocida como el Principio de Comprensión General (GCP). Desafortunadamente, el GCP dio lugar a conclusiones que eran inaceptables para las matemáticas. Considera la colección definida por la siguiente fórmula simple:V=\{x \mid x \text { is a set and } x=x\} . SiV se considera como un conjunto, entonces ya queV=V,V \in V \text {. } Si esto no es una inconsistencia, es al menos inquietante. Desafortunadamente, se pone peor. Considera la colecciónX=\{x \mid x \notin x\} . EntoncesX \in X \text { if and only if } X \notin X \text {. } Este último ejemplo se llama paradoja de Russell, y demostró que el GCP es falso. Claramente tendría que haber algún control sobre qué definiciones dan lugar a conjuntos. La teoría de conjuntos axiomática fue desarrollada para proporcionar reglas para definir rigurosamente conjuntos. Damos una breve discusión en el Apéndice B.
Ejercicios
EJERCICIO 1.1. Demostrar que
\{n \in \mathbb{N} \mid nes impar yn=k(k+1) para algunosk \in \mathbb{N}\}
está vacío.
EJERCICIO 1.2. DejarX yY ser subconjuntos de algún conjuntoU. Demostrar las leyes de Morgan:\ [\ begin {aligned} & (X\ copa Y) ^ {c} =X^ {c}\ cap Y^ {c}\\ & (X\ cap Y) ^ {c} =X^ {c}\ copa Y^ {c} \ end {alineado}\] EJERCICIO 1.3. DejarX, Y yZ ser conjuntos. Demostrar\ [\ begin {alineado} &X\ cap (Y\ copa Z) =( X\ cap Y)\ copa (X\ cap Z)\\ &X\ copa (Y\ cap Z) =( X\ copa Y)\ cap (X\ copa Z). \ end {alineado}\] EJERCICIO 1.4. VamosX=\ulcorner 2\urcorner, Y=\ulcorner 3\urcorner, yZ=\ulcorner 1\urcorner. Cuáles son los siguientes conjuntos:
(i)X \times Y.
ii)X \times Y \times Z.
iii)X \times Y \times Z \times \emptyset.
iv)X \times X.
(v)X^{n}.
EJERCICIO 1.5. Supongamos queX es un conjunto conm elementos, yY es un conjunto conn elementos. ¿Cuántos elementosX \times Y tiene? ¿La respuesta es la misma si uno o ambos conjuntos están vacíos?
EJERCICIO 1.6. ¿Cuántos elementos\emptyset \times \mathbb{N} tiene?
EJERCICIO 1.7. Describir todos los intervalos posibles en\mathbb{Z}.
EJERCICIO 1.8. DejarX yY ser conjuntos finitos no vacíos, conm yn elementos, respectivamente. ¿Cuántas funciones hay deX aY? ¿Cuántas inyecciones? ¿Cuántas sobrejecciones? ¿Cuántas bijecciones?
EJERCICIO 1.9. ¿Qué sucede en el Ejercicio1.8 sim on es cero?
EJERCICIO 1.10. Para cada uno de los siguientes conjuntos, cuáles de las operaciones suma, resta, multiplicación, división y exponenciación son operaciones en el conjunto:
(i)\mathbb{N}
ii)\mathbb{Z}
iii)\mathbb{Q}
iv)\mathbb{R}
v)\mathbb{R}^{+}.
EJERCICIO 1.11. Dejarf yg ser funciones reales,f(x)=3 x+8,g(x)=x^{2}-5 x. ¿Qué sonf \circ g yg \circ f? ¿Es(f \circ g) \circ f=f \circ(g \circ f)?
EJERCICIO 1.12. Anote todas las permutaciones de\{a, b, c\}.
EJERCICIO 1.13. ¿Cuál es la generalización natural del Ejercicio1.2 a un número arbitrario de conjuntos? Verifica tus leyes generalizadas. EJERCICIO 1.14. ¿Cuál es la generalización natural del Ejercicio1.3 a un número arbitrario de conjuntos? Verifica tus leyes generalizadas.
EJERCICIO 1.15. XSea el conjunto de todos los triángulos en el plano,Y el conjunto de todos los triángulos en ángulo recto, yZ el conjunto de todos los triángulos no isósceles. Para cualquier triánguloT, dejaf(T) ser el lado más largo deT, yg(T) ser el máximo de las longitudes de los lados deT. ¿En cuál de los conjuntosX, Y, Z esf una función? ¿Sobre cuál esg una función?
¿Cuál es el complemento deZ inX? ¿Qué esY \cap Z^{c}?
EJERCICIO 1.16. Por cada real positivot, vamosX_{t}=(-t, t) yY_{t}=[-t, t]. Describir
(i)\bigcup_{t>0} X_{t} y\bigcup_{t>0} Y_{t}.
ii)\bigcup_{0<t<10} X_{t} y\bigcup_{0<t<10} Y_{t}.
iii)\bigcup_{0<t \leq 10}^{0<t<10} X_{t} y\bigcup_{0<t \leq 10}^{0<t<10} Y_{t}.
iv)\bigcap_{t>10}^{0<t \leq 10} X_{t} y\bigcap_{t>10}^{0<t \leq 10} Y_{t}.
(\mathrm{v}) \bigcap_{t>10}^{t \geq 10} X_{t}y\bigcap_{t>10}^{t \geq 10} Y_{t}
vi)\bigcap_{t>0}^{t>10} X_{t} y\bigcap_{t>0}^{t>10} Y_{t}.
EJERCICIO 1.17. Dejarf ser la función real coseno, y dejar queg sea la función realg(x)=\frac{x^{2}+1}{x^{2}-1}.
(i) ¿Qué sonf \circ g, g \circ f, f \circ f, g \circ g yg \circ g \circ f?
(ii) ¿Cuáles son los dominios y rangos de las funciones realesf, g, f \circ g yg \circ f?
EJERCICIO 1.18. DejarX ser el conjunto de vértices de un cuadrado en el plano. ¿Cuántas permutacionesX hay? ¿Cuántos de estos provienen de rotaciones? ¿Cuántos vienen de reflexiones en líneas? ¿Cuántos provienen de la composición de una rotación y una reflexión?
EJERCICIO 1.19. Cuáles de las siguientes funciones reales son inyectoras y cuáles son suryectivas:
i)f_{1}(x)=x^{3}-x+2.
ii)f_{2}(x)=x^{3}+x+2. iii)f_{3}(x)=\frac{x^{2}+1}{x^{2}-1}.
iv)f_{4}(x)= \begin{cases}-x^{2} & x \leq 0 \\ 2 x+3 & x>0\end{cases}
EJERCICIO 1.20. Supongamosf: X \rightarrow Y yg: Y \rightarrow Z. Demostrar que sig \circ f es inyectable, entoncesf es inyectable.
Dé un ejemplo para mostrar que no esg necesario que sea inyectivo.
EJERCICIO 1.21. Supongamosf: X \rightarrow Y yg: Y \rightarrow Z.
(i) Demostrar que sif yg son suryectivas, así esg \circ f.
(ii) Demostrar que sig \circ f es suryectiva, entonces una de las dos funcionesf, g debe ser suryectiva (¿cuál?). Dé un ejemplo para mostrar que la otra función no necesita ser suryectiva.
EJERCICIO 1.22. Para cuáln \in \mathbb{N} es la funciónf(x)=x^{n} una inyección.
EJERCICIO 1.23. Dejarf: \mathbb{R} \rightarrow \mathbb{R} ser un polinomio de gradon \in \mathbb{N}. ¿Para qué valores den debef ser una sobreyección, y para qué valores no es una suryección?
EJERCICIO 1.24. Anote una bijección de(X \times Y) vezZ enX \times(Y cuandoZ). Demostrar que es uno a uno y sobre.
EJERCICIO 1.25. DejarX ser un conjunto conn elementos. ¿Cuántas permutacionesX hay?
EJERCICIO 1.26. Dejarf: \mathbb{R} \rightarrow \mathbb{R} ser una función construida usando solo números naturales y suma, multiplicación y exponenciación (por ejemplof podría definirse como\left.x \mapsto(x+3)^{x^{2}}\right). ¿Qué puedes decir sobref[\mathbb{N}] ? ¿Qué puedes decir si incluimos la resta o división?
EJERCICIO 1.27. Vamosf(x)=x^{3}-x . Encuentra conjuntosX yY tal quef: X \rightarrow Y es una bijección. ¿Hay una elección máxima deX ? Si la hay, es única? ¿Hay una elección máxima dey? Si la hay, ¿es única?
EJERCICIO 1.28. Vamosf(x)=\tan (x). Utilice la notación de conjunto para definir el dominio y el rango def. ¿Qué esf^{-1}(1)? Qué esf^{-1}\left[\mathbb{R}^{+}\right] ? EJERCICIO 1.29. Para cada una de las siguientes funciones reales, encuentra un intervaloX que contenga más de un punto y tal que la función sea una biyección deX af[X]. Encuentra una fórmula para la función inversa.
i)f_{1}(x)=x^{2}+5 x+6.
ii)f_{2}(x)=x^{3}-x+2.
iii)f_{3}(x)=\frac{x^{2}+1}{x^{2}-1}.
iv)f_{4}(x)= \begin{cases}-x^{2} & x \leq 0 \\ 2 x+3 & x>0\end{cases}
EJERCICIO 1.30. Encuentre fórmulas para las siguientes secuencias:
i)\langle 1,2,9,28,65,126, \ldots\rangle.
ii)\langle 1,-1,1,-1,1,-1, \ldots\rangle.
iii)\langle 2,1,10,27,66,125,218, \ldots\rangle.
iv)\langle 1,1,2,3,5,8,13,21, \ldots\rangle.
EJERCICIO 1.31. Que la función realf sea estrictamente creciente. Demostrar que para cualquierab \in \mathbb{R}, f^{-1}(b) está vacío o consiste en un solo elemento, y eso por lo tantof es una inyección. Si tambiénf es una biyección, ¿es la función inversa def también aumentar estrictamente?
EJERCICIO 1.32. fSea una función real que sea una biyección. Mostrar que la gráfica def^{-1} es el reflejo de la gráfica def en la líneay=x.
EJERCICIO 1.33. DejarX_{n}=\{n+1, n+2, \ldots, 2 n\} para cada unon \in \mathbb{N}^{+} como en el Ejemplo 1.43. ¿Qué son
i)\cup_{n=1}^{5} X_{n}.
ii)\cap_{n=4}^{6} X_{n}.
iii)\cap_{k=1}^{5}\left[\cup_{n=1}^{k} X_{n}\right].
iv)\cap_{k=5}^{\infty}\left[\cup_{n=3}^{k} X_{n}\right].
EJERCICIO 1.34. Verificar las aseveraciones del Ejemplo 1.44.
EJERCICIO 1.35. Dejemosf: X \rightarrow Y, y asumamos esoU_{\alpha} \subseteq X para cada\alpha \in A, yV_{\beta} \subseteq Y para cada uno\beta \in B. Demostrar:\ [\ begin {alineado} &\ text {(i)} f\ left (\ bigcup_ {\ alpha\ in A} U_ {\ alpha}\ right) =\ bigcup_ {\ alpha\ in A} f\ left (U_ {\ alpha}\ right)\\ &\ text {(ii)} f\ left (\ bigcap_ {\ alpha\ in A} U_ {\ alfa}\ derecha)\ subseteq\ bigcap_ {\ alpha\ in A} f\ izquierda (U_ {\ alpha}\ derecha)\\ &\ text {( iii)} f^ {-1}\ izquierda (\ bigcup_ {\ beta\ en B} V_ {\ beta}\ derecha) =\ bigcup_ {\ beta\ en B} f^ {-1}\ izquierda (V_ {\ beta}\ derecha)\\\\ texto {(iv)} f^ {-1}\ izquierda (\ bigcap_ {\ beta\ en B} V_ {beta\}\ derecha) =\ bigcap_ {\ beta\ in B} f^ {-1}\ izquierda (V_ {\ beta}\ derecha)\ text {.}\ end {alineado} \] Tenga en cuenta que (ii) tiene contención en su lugar de igualdad. Dar un ejemplo de contención adecuada en la parte (ii). Encontrar una condiciónf que garantice la igualdad en el (ii).
Consejos para comenzar con algunos ejercicios
Ejercicio 1.2. Esto se podría hacer con un diagrama de Venn. No obstante, una vez que haya más de tres conjuntos (ver Ejercicio 1.13), este enfoque será difícil. Una prueba algebraica se generalizará más fácilmente, así que trata de encontrar una aquí. Argumentan por las dos inclusiones\ [\ begin {alineadas} (X\ copa Y) ^ {c} &\ subseteq X^ {c}\ cap Y^ {c}\ X^ {c}\ cap Y^ {c} &\ subseteq (X\ copa Y) ^ {c} \ end {alineado}\] por separado. En el primero, por ejemplo, asumir esox \in(X \cup Y)^{c} y demostrar que debe ser en ambosX^{c} yY^{c}.
Ejercicio 1.13. Parte del problema aquí es la notación - ¿y si tienes más conjuntos que letras? Comience con un número finito de conjuntos contenidos enU, y llámalosX_{1}, \ldots, X_{n}. ¿Cuál crees que es el complemento de su unión? Demuéstralo como lo hiciste cuandon=2 en el Ejercicio 1.2. (¿Ve la ventaja de tener una prueba en Ejercicio1.2 que no utilizó diagramas de Venn? Una de las razones por las que a los matemáticos les gusta tener múltiples pruebas del mismo teorema es que es probable que cada prueba se generalice de una manera diferente). ¿Puedes hacer que funcione el mismo argumento si tus conjuntos están indexados por algún conjunto de índices infinito?
Ahora haz lo mismo con el complemento de la intersección.
Ejercicio 1.14. Nuevamente hay un problema notacional, pero mientrasY yZ juega el mismo papel en el Ejercicio 1.3,X juega un papel diferente. Así que reescribe las ecuaciones como\ [\ begin {aligned} &X\ cap\ left (Y_ {1}\ cup Y_ {2}\ right) =\ left (X\ cap Y_ {1}\ right)\ cup\ left (X\ cap Y_ {2}\ right)\\ &X\ cup\ left (Y_ {1}\ cap Y_ {2}\ right) =\ left (X\ copa Y_ {1}\ derecha)\ tapa\ izquierda (X\ copa Y_ {2}\ derecha), \ end {alineado}\] y mira si puedes generalizar estos.
Ejercicio 1.35. (i) Nuevamente, esto reduce a probar dos contenciones. Siy está en el lado izquierdo, entonces debe haber algunosx_{0} en algunosU_{\alpha_{0}} tales quef(x)=y. Pero luegoy está adentrof\left(U_{\alpha_{0}}\right), asíy está en el lado derecho.
Por el contrario, siy está en el lado derecho, entonces debe estar enf\left(U_{\alpha_{0}}\right) para algunos\alpha_{0} \in A. Pero luegoy está adentrof\left(\cup_{\alpha \in A} U_{\alpha}\right), y también lo está en el lado izquierdo.
(1)
5-2 \sqrt{-2}
\sqrt{5}-\sqrt{-2}
4=\sqrt{2}+\frac{}{}
4+\frac{2}{4}
\sqrt{4-2}+\frac{12}{}
4
\operatorname{sins}^{-2}+\frac{2}{}
1 |
(2.7
\sqrt{2-25}+
(2)
(2.7
(2
4=\sqrt{2}+
\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}
(2.7
4
(2020
(2
2
2
(
r.
a2+2
\sqrt{2-2 \cdot 2 \cdot
(
(
(\sqrt{2}+2
(
4
(200
(2-2
(
\mathrm{~ r e s ~ a ~}
(2-2=
(2)
4
(2+2)
4
4
(1)
CAPÍTULO 2
Relaciones
Definiciones
DEFINICIÓN. Relación LetX andY be sets. Una relación deX aY es un subconjunto deX \times Y.
Alternativamente, cualquier conjunto de pares ordenados es una relación. SiY=X, decimos queR es una relación sobreX.
Notación. xXRy Let andY be sets yR ser una relación sobreX \times Y. Six \in X yy \in Y, entonces podemos expresar quex llevaR relación cony (es decir(x, y) \in R) por escritox R y.
Entonces paraX yY establece,x \in X, y \in Y, yR una relación sobreX \times Y,x R y si y solo si(x, y) \in R.
EJEMPLO 2.1. Deje\leq ser el pedido habitual en\mathbb{Q}. Entonces\leq es una relación sobre\mathbb{Q}. Escribimos1 / 2 \leq 2 para expresar que1 / 2 lleva la relación\leq con 2.
EJEMPLO 2.2. Definir una relaciónR de\mathbb{Z} a\mathbb{R} porx R y six>y+3. Entonces podríamos escribir7 R \sqrt{2} o(7, \sqrt{2}) \in R decir que(7, \sqrt{2}) está en la relación.
EJEMPLO 2.3. VamosX=\{2,7,17,27,35,72\}. Definir una relaciónR porx R y six \neq y yx yy tener un dígito en común. Entonces
R=\{(2,27),(2,72),(7,17),(7,27),(7,72),(17,7),(17,27),(17,72),,(27,2),(27,7),(27,17),(27,72),(72,2),(72,7),(72,17),(72,27)\}. EJEMPLO 2.4. DejarP ser el conjunto de todos los polígonos en el plano. Definir una relaciónE diciendo(x, y) \in E six yy tener el mismo número de lados.
¿Cómo usan las relaciones los matemáticos? Una relación en un conjunto se puede utilizar para imponer la estructura. En el Ejemplo 2.1, la relación de orden habitual\leq sobre nos\mathbb{Q} permite pensar que los números racionales se encuentran en una línea numérica, lo que proporciona una visión adicional de los números racionales. En el Ejemplo 2.4, podemos usar la relación para romper polígonos en los conjuntos de triángulos, cuadriláteros, pentágonos, etc.
Una funciónf: X \rightarrow Y puede pensarse como un tipo muy especial de relación deX aY. En efecto, la gráfica de la función es un conjunto de pares ordenados enX \times Y, pero tiene la propiedad adicional de que cadax inX ocurre exactamente una vez como primer elemento de un par en la relación. Como discutimos en la Sección 1.3, las funciones son una forma útil de relacionar conjuntos.
XSea un conjunto, yR una relación sobreX. Aquí hay algunas propiedades importantes que la relación puede tener o no.
DEFINICIÓN. RReflejo es reflexivo si para cadax \in X,x R x . SimétricoR es simétrico si para algunox, y \in X,x R y \text { implies } y R x \text {. } AntisimétricoR es antisimétrico si para algunox, y \in X, [(x, y) \in R \text { and }(y, x) \in R] \text { implies } x=y \text {. }TransitivoR es transitivo si para algunox, y, z \in X,[x R y \text { and } y R z] \text { implies }[x R z] \text {. } ¿Cuál de estas cuatro propiedades se aplica a las relaciones dadas en los Ejemplos 2.1-2.4 (Ejercicio 2.1)?
Pedidos
Una relación en un conjunto puede pensarse como parte de la estructura impuesta al conjunto. Entre las relaciones más importantes en un conjunto están las relaciones de orden.
DEFINICIÓN. Ordenamiento parcial DejarX ser un conjunto yR una relación sobreX. Decimos queR es un ordenamiento parcial si:
(1)R es reflexivo
(2)R es antisimétrico
(3)R es transitivo.
EJEMPLO 2.5. XDéjese ser una familia de conjuntos. La relación\subseteq es un ordenamiento parcial sobreX. Cada conjunto es un subconjunto de sí mismo, por lo que la relación es reflexiva. SiY \subseteq Z yZ \subseteq Y, entoncesY=Z, entonces la relación es antisimétrica. Por último, siY \subseteq Z yZ \subseteq W entoncesY \subseteq W, entonces la relación es transitiva.
EJEMPLO 2.6. RSea la relación sobre\mathbb{N}^{+} definida porx R y si y sólo si hayz \in \mathbb{N}^{+} tal quex z=y . EntoncesR es un ordenamiento parcial de\mathbb{N}^{+}. (Demostrar esto: Ejercicio 2.2).
DEFINICIÓN. Ordenación lineal LetX Ser un conjunto yR ser un orden parcial deX. Decimos queR es un ordenamiento lineal, también llamado ordenamiento total, siempre que, para cualquierax, y \in X, ya seax R y oy R x.
Tenga en cuenta que dado que un orden lineal es antisimétrico, para cualquier distintox yy, exactamente uno dex R y yy R x mantiene.
Ejemplo 2.7. El orden\leq en\mathbb{N} (o\mathbb{R}) es un orden lineal. Así es la relación\geq. La relación no< es (¿por qué?).
EJEMPLO 2.8. VamosX=\mathbb{R}^{n}. Podemos definir una relación reflexiva de laX siguiente manera. Dejarx=\left(a_{1}, \ldots, a_{n}\right) yy=\left(b_{1}, \ldots, b_{n}\right) ser miembros distintos deX. Quek \in \mathbb{N}^{+} sea el menor número tal quea_{k} \neq b_{k}. Entonces definimosx R y \text { if and only if } a_{k}<b_{k} . EntoncesR es un ordenamiento lineal deX. Se llama el orden del diccionario.
La noción de un ordenamiento lineal es probablemente natural para ti, y la has usado intuitivamente desde que empezaste a estudiar aritmética. La relación\leq ayuda a visualizar el conjunto como una línea en la que la ubicación relativa de dos elementos del conjunto está determinada por el orden lineal. Si está considerando un conjunto con operaciones, esto a su vez puede ayudar a visualizar cómo se comportan las operaciones. Por ejemplo, piense en usar una recta numérica para visualizar suma, resta y multiplicación de enteros.
Los ordenamientos parciales son generalizaciones de ordenamientos lineales, y\leq es el ejemplo más obvio de un ordenamiento lineal. Debido a esto, el símbolo normal para un ordenamiento parcial es\preceq (también recuerda al símbolo\subseteq, que es el ejemplo que la mayoría de los matemáticos tienen en cuenta al pensar en un ordenamiento parcial).
EJEMPLO 2.9. DejaX ser el conjunto de todas las colecciones de manzanas y naranjas. Six, y están enX, entonces digax \preceq y si el número de manzanas enx es menor o igual que el número de manzanas eny, y el número de naranjas enx es menor o igual que el número de naranjas eny. Se trata de un ordenamiento parcial. Puede que no puedas comparar manzanas con naranjas, pero puedes decir que ¡2 manzanas y 5 naranjas es inferior a 4 manzanas y 6 naranjas!
Una forma de visualizar un orden parcial\preceq en un conjunto finitoX es imaginar flechas que conectan elementos distintos deX, x yy, six \preceq y y no hay un tercer punto distinto quez satisfaga x \preceq z \preceq y. Entonces dos elementosa yb enX satisfarána \preceq b si y sólo si se puede llegar dea ab siguiendo un camino de flechas.
EJEMPLO 2.10. Considera la gráfica en el conjuntoX=\{a, b, c, d, e, f\} dan en la Figura 2.11.
FIGURA 2.11. Imagen de un pedido parcial
Ilustra el orden parcial que podría describirse como la relación reflexiva, transitiva más pequeña\preceq sobre laX que satisfacea \preceq b, a \preceq c, b \preceqd, b \preceq e, c \preceq e, e \preceq f .
Relaciones de equivalencia
DEFINICIÓN. Relación de equivalencia LetX be a set andR a relation onX. Decimos queR es una relación de equivalencia si
(1)R es reflexivo
(2)R es simétrico
(3)R es transitivo.
EJEMPLO 2.12. Definir una relaciónR sobre\mathbb{R} porx R y si y solo six^{2}=y^{2}. EntoncesR es una relación de equivalencia.
EJEMPLO 2.13. RSea una relación definida de la\mathbb{Z} \times \mathbb{Z} siguiente manera. Sia, b, c, d \in \mathbb{Z},(a, b) R(c, d) \text { if and only if } a+d=b+c \text {. } EntoncesR es una relación de equivalencia. En efecto, vamos a revisar las tres propiedades.
Reflexivo: Por (2.14), tenemos(a, b) R(a, b) sia+b=a+b, que claramente sostiene. Simétrico: Supongamos(a, b) R(c, d), entoncesa+d=b+c. Para ver si(c, d) R(a, b), debemos comprobar sic+b=d+a; pero esto se sostiene por la conmutatividad de la adición.
Transitivo: Supongamos(a, b) R(c, d) y(c, d) R(e, f). Debemos comprobar que(a, b) R(e, f), en otras palabras quea+f=b+e . tenemosa+d=b+c yc+f=d+e, y sumando estas dos ecuaciones obtenemosa+d+c+f=b+c+d+e . Cancelandoc+d de cada lado de (2.16), obtenemos (2.15) como se desee.
EJEMPLO 2.17. DejarR ser una relación sobreX=\mathbb{Z} \times \mathbb{N}^{+} definida por(a, b) R(c, d) \text { if and only if } a d=b c \text {. } EntoncesR es una relación de equivalencia sobreX. (Demostrar esto; Ejercicio 2.4).
EJEMPLO 2.18. Vamosf: X \rightarrow Y. Definir una relaciónR_{f} onX porx R_{f} y \text { if and only if } f(x)=f(y) . EntoncesR_{f} es una relación de equivalencia. Comprobamos las condiciones para una relación de equivalencia:
R_{f}es claramente reflexivo, ya que, para cualquierx \in X,f(x)=f(x) .R_{f} es simétrico ya que, para cualquierax \in X yy \in X,f(x)=f(y) \text { if and only if } f(y)=f(x) . MostrarR_{f} es transitivo, vamos x, y, z \in X. Sif(x)=f(y) yf(y)=f(z) entoncesf(x)=f(z).
Las relaciones de equivalencia tienen tres de las propiedades clave de la identidad. Permiten relacionar objetos en un conjunto que deseamos considerar como “los mismos” en un contexto dado. Esto nos permite enfocarnos en qué diferencias entre objetos matemáticos son relevantes para la discusión en cuestión, y cuáles no. Por ello, es un símbolo común para una relación de equivalencia\sim.
DEFINICIÓN. Clase de equivalencia,[x]_{R} LetR Ser una relación de equivalencia en un conjuntoX. Six \in X entonces la clase de equivalencia dex móduloR, denotada por[x]_{R}, es[x]_{R}=\{y \in X \mid x R y\} . Siy \in[x]_{R} llamamos ay un elemento representativo de[x]_{R}. Se escribe el conjunto de todas las clases\left\{[x]_{R} \mid x \in X\right\} de equivalenciaX / R. Se le llama el cociente espacio deX porR.
Podemos utilizar[x] para la clase de equivalencia dex, siempre que la relación de equivalencia sea clara.
Notación. Equivalencia modR, \equiv_{R}, \sim LetR Ser una relación de equivalencia en un conjuntoX. Podemos expresarlox R y por escritox \equiv y \bmod Rx \equiv_{R} y o por lax \sim y . Proposición 2.19. Supongamos que\sim es una relación de equivalencia sobreX. Vamosx, y \in X. Six \sim y, entonces[x]=[y] . Si nox es equivalente ay(x \nsim y), entonces[x] \cap[y]=\emptyset . Prueba. (i) Asumirx \sim y. Demostremos eso[x] \subseteq[y]. Vamosz \in[x]. Esto significa quex \sim z. Ya que\sim es simétricox \sim y, y, tenemosy \sim x. Comoy \sim x yx \sim z, por transitividad de\sim lo conseguimosy \sim z. Por lo tantoz \in[y]. Ya quez es un elemento arbitrario de[x], lo hemos demostrado[x] \subseteq[y]. Comoy \sim x, el mismo argumento conx ey intercambiado da[y] \subseteq[x], y por lo tanto[x]=[y].
(ii) Ahora asuma esox y noy son equivalentes. Debemos demostrar que no existez tal quez \in[x] yz \in[y]. Vamos a argumentar por contradicción. Supongamos que hubiera talz. Entonces tendríamosx \sim z \quad \text { and } \quad y \sim z . Por simetría, tenemos también esoz \sim y, y por transitividad, entonces tenemos esox \sim y. Esto contradice la suposición que nox equivale ay. Entonces six y noy son equivalentes, noz pueden existir que sea simultáneamente en ambos[x] y[y]. Por lo tanto[x] y[y] son conjuntos disjuntos, según se requiera.
Entonces, ¿qué hemos mostrado? No hemos demostrado que ninguna relación en particular sea una relación de equivalencia. Más bien hemos demostrado que cualquier relación de equivalencia en un conjunto divide el conjunto en clases de equivalencia disjuntas.
Como veremos a lo largo de este libro, y verás a lo largo de tus estudios matemáticos, esta es una herramienta sorprendentemente poderosa.
Definición. Pares disjuntos Let\left\{X_{\alpha} \mid \alpha \in A\right\} be a family of sets. La familia es disjunta por parejas si es por alguna\alpha, \beta \in A, \alpha \neq \beta,X_{\alpha} \cap X_{\beta}=\emptyset . DEFINICIÓN. Partition LetY Ser un conjunto y\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\} ser una familia de conjuntos no vacíos. La colección\mathcal{F} es una partición deY si\mathcal{F} es disjunta por pares yY=\bigcup_{\alpha \in A} X_{\alpha} . Dada una relación de equivalencia\sim en un conjuntoX, las clases de equivalencia con respecto a \simdar una partición deX. Por el contrario, las particiones dan lugar a relaciones de equivalencia.
TEOREMA 2.21. (i)X Sea un conjunto, y\sim una relación de equivalencia sobreX. EntoncesX / \sim es una partición deX. (ii) Por el contrario, dejar\left\{X_{\alpha} \mid \alpha \in A\right\} ser una partición deX. Dejar\sim ser la relación enX definida porx \sim y siemprex yy son miembros del mismo conjunto en la partición. Entonces\sim es una relación de equivalencia.
PRUEBA. La parte (i) del teorema es Proposición2.19 replanteada, y dimos la prueba anterior. Para probar lo contrario, debemos demostrar que la relación\sim definida como en la parte (ii) del teorema es una equivalencia.
Reflexivity: Vamosx \in X. Entoncesx está en algunosX_{\alpha_{0}}, ya que la unión de todos estos conjuntos es todo deX. Por lo tantox \sim x.
Simetría: Supongamosx \sim y. Entonces hay algunosX_{\alpha_{0}} tales quex \in X_{\alpha_{0}} yy \in X_{\alpha_{0}}. Esto implica quey \sim x.
Transitividad: Supongamosx \sim y yy \sim z. Después hay conjuntosX_{\alpha_{0}} yX_{\alpha_{1}} tal que ambosx yy están enX_{\alpha_{0}}, y ambosy yz están enX_{\alpha_{1}}. Pero como los conjuntosX_{\alpha} forman una partición, yy está en ambosX_{\alpha_{0}} yX_{\alpha_{1}}, debemos tener esoX_{\alpha_{0}}=X_{\alpha_{1}}. Esto implica quex yz están en el mismo miembro de la partición, y asíx \sim z.
Construyendo Bijecciones
Consideremos una aplicación abstracta particularmente interesante e importante de las clases de equivalencia. Vamosf: X \rightarrow Y. Nof es necesario que la función sea una inyección o una sobreyección. Sin embargo, ya hemos discutido la conveniencia de encontrar una “inversa” paraf, aun cuando no cumpla con las condiciones necesarias para la existencia de una inversa. En la Sección1.3 consideramos la función\left.f\right|_{D}, dóndeD \subseteq X y\left.f\right|_{D} es una inyección. Otro enfoque es utilizar la funciónf para crear una nueva función en un dominio distinto que conserve gran parte de la información def.
Utilizamosf para inducir una relación de equivalencia sobreX. Definir una relación\sim sobreX porx \sim y \text { if and only if } f(x)=f(y) . Mostramos en Ejemplo2.18 que\sim es una relación de equivalencia; es la relación de equivalencia enX inducida porf. La relación de equivalencia\sim induce una partición deX, es decir,X / \sim( que es el conjunto\{[x] \mid x \in X\} de todas las clases de equivalencia). Notación. X / fDejarf: X \rightarrow Y y\sim ser la relación de equivalencia sobreX inducido porf. EscribimosX / f para el conjunto de clases de equivalencia inducidas por\sim onX.
Una clase de equivalencia inX / f es la imagen inversa de un elemento en\operatorname{Ran}(f). Es decir, six \in X yf(x)=y,[x]=f^{-1}(y) . EntoncesX / f=\left\{f^{-1}(y) \mid y \in \operatorname{Ran}(f)\right\} . Los elementos deX / f se llaman los conjuntos de niveles def. La inspiración para esto viene de pensar en un mapa topográfico. Las curvas en un mapa topográfico correspondientes a altitudes fijas se denominan curvas de nivel. Considera la función desde un punto en un mapa hasta la altitud de la ubicación física representada por el punto en el mapa. Las curvas de nivel en el mapa son subconjuntos de los conjuntos de niveles de esta función.
Notación. \Pi_{f}Vamosf: X \rightarrow Y. La función\Pi_{f}: X \rightarrow X / f se define por\Pi_{f}(x)=[x]_{f}, donde[x]_{f} está la clase de equivalencia dex con respecto a la relación de equivalencia inducida porf.
DejaZ \subseteq Y ser el rango def. Definimos una nueva función,\widehat{f}: X / f \rightarrow Z por\widehat{f}([x])=f(x) . La función\widehat{f} está estrechamente relacionada conf; de hecho, para cadax \in X,f(x)=\widehat{f} \circ \Pi_{f}(x) . Esto a veces se ilustra con un diagrama, como en la Figura 2.22.
La función\hat{f} es una biyección. En este sentido, cada función puede asociarse canónicamente con una biyección. Consideramos la función que vimos en la Sección 1.3.
FIGURA 2.22. Hacer una función en una biyección
EJEMPLO 2.23. Vamosf(x)=\tan (x). Como comentamos anteriormente, podemos “invertir” esta función considerando la función Tan:(-\pi / 2, \pi / 2) \rightarrow\mathbb{R} por\operatorname{Tan}=\left.\tan \right|_{(-\pi / 2, \pi / 2)} La función Tan es una biyección, y tiene una inversa,\operatorname{Arctan}: \mathbb{R} \rightarrow(-\pi / 2, \pi / 2) Para cualquierak \in \mathbb{Z} hay una restricción correspondiente de tan,\tan \mid\left(\frac{(2 k+1) \pi}{2}, \frac{(2 k+3) \pi}{2}\right) que es una biyección, y por lo tanto tiene una función inversa.
Otra biyección se puede construir sobre las clases de equivalencia inducidas porf(x)=\tan (x). Un conjunto de niveles def es[x]_{f}=\{x+k \pi \mid k \in \mathbb{Z}\}. XSea el dominio del bronceado. EntoncesX / f=\left\{[x]_{f} \mid x \in X\right\} podemos interpretar una clase de equivalencia[x]_{f} con respecto a los ángulos en posición estándar en el plano cartesiano. La clase de equivalencia dex es el conjunto de ángulos en posición estándar que tienen lado terminal colineal con el lado terminal del ángulox - ver Figura 2.24.
FIGURA 2.24. Ángulos colineales
Siguiendo la construcción descrita anteriormente, la función\Pi_{f}: X \rightarrowX / f es la función\Pi_{f}(x)=[x]_{f}=\{x+k \pi \mid k \in \mathbb{Z}\} . La función\widehat{f}: X / f \rightarrow \mathbb{R} dada por\widehat{f}\left([x]_{f}\right)=f(x) es una biyección. Además,\tan =\widehat{f} \circ \Pi_{f} . six \in X, entonces\Pi_{f}(x) es el conjunto de todos los ángulos que tienen lado terminal colineal con el lado terminal de ángulox en posición estándar. Así nos\Pi_{f} dice que solo\tan se puede distinguir la pendiente del lado terminal del ángulo - no el cuadrante del ángulo o cuántas revoluciones subtendió el ángulo.
Aritmética Modular
Definimos una relación de equivalencia que nos ayudará a obtener conocimientos en la teoría de números. DEFINICIÓN. Divide,a \mid b Leta yb ser enteros. Entoncesa divideb, escritoa \mid b, si hayc \in \mathbb{Z} tal quea \cdot c=b . DEFINICIÓN. Congruencia,x \equiv y \bmod n, \equiv_{n} Vamosx, y, n \in \mathbb{Z} yn>1. Entoncesx \equiv y \bmod n (ox \equiv_{n} y) sin \mid(x-y) . La relación\equiv_{n} on\mathbb{Z} se llama congruencia\bmod n.
TEOROMA2.25. Congruencia modn es una relación de equivalencia en\mathbb{Z}.
Ejercicio 2.5: Demostrar Teorema 2.25.
DEFINICIÓN. Clase de congruencia Las clases de equivalencia de la relación\equiv_{n} se denominan clases de congruencia, clases de residuo o clases de resto\bmod n. El conjunto de clases de congruencia\bmod n puede ser escrito\mathbb{Z}_{n} o\mathbb{Z} / n \mathbb{Z}.
Por supuesto\mathbb{Z}_{n} que es una partición de\mathbb{Z}. Cuandon=2, las clases de residuo se llaman los números pares e impares. Muchos de los hechos que conoces sobre números pares e impares se generalizan si piensas en ellos como clases de residuos. ¿Para qué sirven las clases de residuosn=3?
Lo dejamos como un ejercicio (Ejercicio 2.6) para probar que dos enteros están en la misma clase de resto\bmod n siempre que tengan el mismo resto cuando se dividan porn.
Notación. [a] Fijar un número naturaln \geq 2. Deja entrar a un\mathbb{Z}. Representamos la clase de equivalencia de a con respecto a la relación\equiv_{n} por[a].
Proposición 2.26. Sia \equiv r \bmod n yb \equiv s \bmod n, entonces\text { (i) } \quad a+b \equiv r+s \bmod n y\text { (ii) } a b \equiv r s \quad \bmod n . Prueba. (i) Supongamos quea \equiv r \bmod n yb \equiv s \bmod n. Entoncesn \mid(a-r) yn \mid(b-s). n \mid(a+b-(r+s))Por lo tantoa+b \equiv r+s \quad \bmod n demostrando (i).
Para probar (ii), tenga en cuenta que existeni, j \in \mathbb{Z} tales quea=n i+r yb=n j+s Entoncesa b=n^{2} j i+r n j+s n i+r s=n(n j i+r j+s i)+r s Por lo tanton \mid(a b-r s) ya b \equiv r s \quad \bmod n De ahí las operaciones algebraicas que\mathbb{Z}_{n} “hereda” de \mathbb{Z}están bien definidos. Es decir, podemos definir+ y seguir\cdot\mathbb{Z}_{n} por[a]+[b]=[a+b] y[a] \cdot[b]=[a \cdot b] En matemáticas, cuando preguntas si algo está “bien definido”, te refieres a que en algún lugar de la definición se hizo una elección, y quieres saber si una elección diferente habría resultado en el mismo resultado final. Por ejemplo, vamosX_{1}=\{-2,2\} y vamosX_{2}=\{-1,2\}. Definiry_{1} por: “EligexX_{1} y deja”y_{1}=x^{2}. Definiry_{2} por: “EligexX_{2} y deja”y_{2}=x^{2}. Entoncesy_{1} está bien definido, y es el número 4; pero noy_{2} está bien definido, ya que diferentes elecciones dex dan lugar a diferentes números.
En (2.27) y (2.28), los lados de la derecha dependen a priori de una elección particular de elementos de las clases de equivalencia[a] y[b]. Pero Proposición2.26 asegura que la suma y el producto así definidos sean independientes de la elección de los representantes de las clases de equivalencia.
EJEMPLO 2.29. Z_{2}Además y multiplicación se definen de la siguiente manera:
(1)[0]+[0]=[0]
(2)[0]+[1]=[1]+[0]=[1]
(3)[1]+[1]=[0]
(4)[0] \cdot[0]=[0] \cdot[1]=[1] \cdot[0]=[0]
(5)[1] \cdot[1]=[1].
Observe que si lee[0] como “par” y [1] como “impar”, estas son reglas que aprendió hace mucho tiempo.
Al trabajar con aritmética modular podemos elegir los representantes de las clases de resto que mejor se adapten a nuestras necesidades. Por ejemplo,79 \cdot 23 \equiv 2 \cdot 2 \equiv 4 \bmod 7 . en otras palabras[79 \cdot 23]=[79] \cdot[23]=[2] \cdot[2]=[4] . EJEMPLO 2.30. Puede recordar de su exposición temprana a las tablas de multiplicación que la multiplicación por nueve resultó en un producto cuyos dígitos sumaron a nueve. Esto generaliza muy bien con la aritmética modular. Específicamente, sia_{n} \in\ulcorner 10\urcorner para0 \leq n \leq N entonces\sum_{n=0}^{N} a_{n} 10^{n} \equiv \sum_{n=0}^{N} a_{n} \bmod 9 . El resto de cualquier entero dividido por 9 es igual al resto de la suma de los dígitos de ese entero cuando se divide por 9. Prueba. La observación clave es que10 \equiv 1 \bmod 9 . Por lo tanto\ [\ begin {array} {lll} 10^ {2}\ equiv 1\ cdot 1\ equiv 1 &\ bmod 9\\ 10^ {3}\ equiv 1\ cdot 1\ cdot 1\ equiv 1 &\ bmod 9, \ end {array}\] y así sucesivamente para cualquier potencia de 10:10^{n} \equiv 1 \bmod 9 \text { for all } n \in \mathbb{N} \text {. } (Esta inducción a todos poderes de 10 es sencillo, pero para probarlo formalmente necesitaremos la noción de inducción matemática del Capítulo 4). Por lo tanto en el lado izquierdo de (2.31), trabajando mod 9, podemos sustituir todas las potencias de 10 por 1, y esto nos da el lado derecho.
EJEMPLO 2.32. La observación de que el residuo de un número mod 9 es el mismo que el de la suma de los dígitos se puede utilizar en una técnica llamada “casting out nueves” para verificar la aritmética.
Por ejemplo, considere la siguiente suma (incorrecta). El número en la penúltima columna es la suma de los dígitos, y el número en la última columna es la suma repetida de los dígitos hasta alcanzar un número entre 0 y 9.
1588 | 22 | 4 |
+1805 | 14 | 5 |
3493 | 19 | 1 |
Si la suma se hubiera realizado correctamente, el resto mod 9 de la suma equivaldría a la suma de los restos; así sabemos que se cometió un error.
2.33EJEMPLO. ¿Cuál es el último dígito de7^{7}?
Queremos saber7^{7} \bmod 10. Tenga en cuenta que, módulo10,7^{0} \equiv 1,7^{1} \equiv7,7^{2} \equiv 9,7^{3} \equiv 3,7^{4} \equiv 1. Entonces7^{7}=7^{4} 7^{3} \equiv 1 \cdot 3 \equiv 3, y así 3 es el último dígito de7^{7}. EJEMPLO 2.34. ¿Cuál es el último dígito de7^{7^{7}}?
Por el Ejemplo 2.33, vemos que los residuos de7^{n} \bmod 10 repetición ellos mismos cada vezn aumenta en 4. Por lo tanto sim \equiv n \bmod 4, entonces7^{m} \equiv 7^{n} \bmod 10.
¿Qué es7^{7} \bmod 4? Bueno7^{1} \equiv 3 \bmod 4,7^{2} \equiv 1 \bmod 4, entonces7^{7} \equiv\left(7^{2}\right)^{3} \cdot 7 \equiv 3 \bmod 4. Por lo tanto7^{7^{7}} \equiv 7^{3} \equiv 3 \quad \bmod 10 .
Ejercicios
EJERCICIO 2.1. ¿Cuál de las propiedades de reflexividad, simetría, antisimetría y transitividad se aplica a las relaciones dadas en los Ejemplos 2.1-2.4?
EJERCICIO 2.2. Demostrar que la relación en Ejemplo2.6 es un ordenamiento parcial.
EJERCICIO 2.3. Enumere cada par en la relación dada en el Ejemplo 2.10.
EJERCICIO 2.4. Demostrar que la relación en Ejemplo2.17 es una equivalencia.
EJERCICIO 2.5. Demostrar que la congruencia\bmod n es una relación de equivalencia sobre\mathbb{Z}.
EJERCICIO 2.6. Demostrar que dos enteros están en la misma clase de congruencia\bmod n si y solo si tienen el mismo resto cuando se dividen porn.
EJERCICIO 2.7. Supongamos queR es una relación sobreX. ¿Qué significa siR es tanto un orden parcial como una equivalencia?
EJERCICIO 2.8. Considerar las relaciones sobre las personas “es hermano de”, “es hermano de”, “es padre de”, “está casado con”, “es descendiente de”. ¿Cuál de las propiedades de reflexividad, simetría, antisimetría y transitividad tiene cada una de estas relaciones? EJERCICIO 2.9. VamosX=\{k \in \mathbb{N}: k \geq 2\}. Considere las siguientes relaciones sobreX:
(i)j R_{1} k si y sólo si\operatorname{gcd}(j, k)>1(\operatorname{gcd} representa el mayor divisor común).
ii)j R_{2} k si y sólo sij yk son coprimos (es decir\operatorname{gcd}(j, k)=1).
iii)j R_{3} k si y sólo sij \mid k.
(iv)j R_{4} k si y sólo si\{p: p \text { is prime and } p \mid j\}=\{q: q \text { is prime and } q \mid k\} . Para cada relación, decir cuál de las propiedades de Reflexivity, Simetría, Antisimetría, Transitividad tiene.
EJERCICIO 2.10. Paraj, k en\mathbb{N}^{+}, definir dos relacionesR_{1} yR_{2} porj R_{1} k sij yk tener un dígito en común (pero no necesariamente en el mismo lugar) yj R_{2} k si jyk tener un dígito común en el mismo lugar (así, por ejemplo,108 R_{1} 82, pero(108,82) \notin R_{2}).
(i) Sij=\sum_{m=0}^{M} a_{m} 10^{m} yk=\sum_{n=0}^{N} b_{n} 10^{n}, cona_{M} \neq 0 yb_{N} \neq 0, ¿cómo se puede definir matemáticamenteR_{1} yR_{2} en términos de los coeficientesa_{m} yb_{n}?
(ii) ¿Cuál de las cuatro propiedades de reflexividad, simetría, antisimetría y transitividad tienenR_{1} yR_{2} tienen?
EJERCICIO 2.11. VamosX=\{a, b\}. Enumere todas las relaciones posibles sobreX, y diga cuáles son reflexivas, cuáles son simétricas, cuáles son antisimétricas y cuáles son transitivas.
EJERCICIO 2.12. ¿Cuántas relaciones hay en un set con 3 elementos? ¿Cuántos de estos son reflexivos? ¿Cuántos son simétricos? ¿Cuántos son antisimétricos?
EJERCICIO 2.13. Repita Ejercicio2.12 para un conjunto conN elementos.
EJERCICIO 2.14. La suma de dos enteros pares es par, la suma de un entero par y otro impar es impar, y la suma de dos enteros impares es par. ¿Cuál es la generalización de esta afirmación a las clases de residuos\bmod 3? EJERCICIO 2.15. ¿Cuál es el último dígito de3^{5^{7}}? De7^{5^{3}}? De11^{10^{6}}? De8^{5^{4}}?
EJERCICIO 2.16. ¿Qué es2^{1000000} \bmod 17? ¿Qué es17^{77} \bmod 14?
EJERCICIO 2.17. Mostrar que el residuo de un número\bmod 3 es el mismo que la suma de sus dígitos.
EJERCICIO 2.18. Demostrar que la afirmación de Ejercicio no2.17 es cierta\bmod n para ningún valor den excepto 3 y 9.
EJERCICIO 2.19. Demostrar que hay un número infinito de números naturales que no se pueden escribir como la suma de tres cuadrados. (Pista: Mira los posibles residuos mod 8).
EJERCICIO 2.20. Dejarf: X \rightarrow Y yg: Y \rightarrow Z. ¿Qué se puede decir de la relación entreX / f yX /(g \circ f)?
EJERCICIO 2.21. RSea la relación sobreX=\mathbb{Z} \times \mathbb{N}^{+} definida en el Ejemplo 2.17. Definir una operación\star de laX / R siguiente manera: parax=(a, b) yy=(c, d),[x] \star[y]=[(a d+b c, c d)] . ¿Está\star bien definida?
EJERCICIO 2.22. DejarX ser el conjunto de funciones de subconjuntos finitos de\mathbb{N} a\ulcorner 2\urcorner (es decirf \in X, si hay un conjunto finitoD \subseteq \mathbb{N} tal quef: D \rightarrow\ulcorner 2\urcorner). Defina una relaciónR de laX siguiente manera: sif, g \in X, f R g iff\operatorname{Dom}(g) \subseteq \operatorname{Dom}(f) yg=\left.f\right|_{\operatorname{Dom}(g)}. ¿EsR un pedido parcial? ¿EsR una relación de equivalencia?
EJERCICIO2.23. DejarX ser el conjunto de todas las secuencias binarias infinitas. Definir una relaciónR de laX siguiente manera: Para cualquierf, g \in X, f R g ifff^{-1}(1) \subseteqg^{-1}(1). ¿EsR un pedido parcial? ¿EsR una relación de equivalencia?
EJERCICIO 2.24. VamosX=\{\ulcorner n\urcorner \mid n \in \mathbb{N}\}. DejarR ser una relación sobreX definida porx, y \in R iffx \subseteq y. Demostrar queR es un ordenamiento lineal. EJERCICIO 2.25. VamosX=\{f: \mathbb{R} \rightarrow \mathbb{R} \mid f es una sobrejección\}. Definir una relaciónR sobreX porf R g ifff(0)=g(0). Demostrar queR es una relación de equivalencia. DejarF: X \rightarrow \mathbb{R} ser definido porF(f)=f(0). Mostrar que los conjuntos de niveles deF son las clases de equivalencia deX / R. Eso es demostrar queX / R=X / F . EJERCICIO 2.26. Vamosf: X \rightarrow Y. Mostrar queX / f se compone de singletons (conjuntos con exactamente un elemento) ifff es una inyección. CAPÍTULO 3
Pruebas
Matemáticas y Pruebas
La actividad principal de los matemáticos de investigación es probar afirmaciones matemáticas. Dependiendo de la profundidad de la reivindicación, la relación de la reivindicación con otras reivindicaciones matemáticas, y varios otros factores, una afirmación matemática que ha sido probada generalmente se denomina teorema, proposición, corolario o lema. Una afirmación matemática que no ha sido probada, pero que se espera que sea cierta, comúnmente se llama conjetura. Una afirmación que es aceptada como punto de partida para argumentos sin ser probada se llama axioma.
Algunos resultados matemáticos son tan fundamentales, profundos, difíciles, sorprendentes o de otra manera notables que se les nombra. Parte de su iniciación como miembro de la comunidad de matemáticos es familiarizarse con algunas de estas declaraciones nombradas -y probaremos algunas de ellas en este libro-.
Es probable que la mayor parte de las matemáticas que has estudiado haya sido la aplicación de teoremas para derivar soluciones de problemas relativamente concretos. Aquí comenzamos a aprender a probar teoremas. La mayoría de los estudiantes encuentran muy desafiante la transición de las matemáticas computacionales a las pruebas matemáticas.
¿Qué es una prueba matemática?
La naturaleza de una prueba matemática depende del contexto. Existe una noción formal de prueba matemática:
Una secuencia finita de declaraciones matemáticas formales tal que cada declaración
es un axioma o suposición, o
sigue por reglas formales de deducción lógica de declaraciones anteriores en la secuencia.
La mayoría de los matemáticos no piensan en las pruebas matemáticas como pruebas matemáticas formales, y prácticamente ningún matemático escribe pruebas matemáticas formales. Esto se debe a que una prueba formal es algo irremediablemente engorroso, y generalmente está fuera del alcance de la capacidad humana, incluso para los enunciados matemáticos más elementales. Más bien, los matemáticos escriben pruebas que son secuencias de declaraciones en una combinación de lenguaje natural y símbolos matemáticos formales (intercalados con diagramas, preguntas, referencias y otros dispositivos que están destinados a ayudar al lector a comprender la prueba) que se puede considerar como representando un argumento puramente formal. Una buena definición práctica de una prueba matemática es:
Un argumento a favor de una afirmación matemática que convencerá a la preponderancia de matemáticos conocedores de la verdad de la afirmación matemática.
Esta definición es algo imprecisa, y los matemáticos pueden estar en desacuerdo sobre si un argumento es una prueba, particularmente para argumentos extremadamente difíciles o profundos. No obstante, para prácticamente todos los argumentos matemáticos, después de algún tiempo para una cuidadosa consideración, la comunidad matemática llega a un consenso unánime sobre si es una prueba.
La noción de prueba matemática para el estudiante es similar a la idea general de una prueba matemática. Las diferencias se deben al tipo de declaración que el estudiante está demostrando, y las razones para solicitar que el estudiante acredite la declaración. Las declaraciones que estarás demostrando son conocidas por los matemáticos profesionales o pueden ser probadas con relativamente poco esfuerzo por tus instructores. Claramente las declaraciones que estarás demostrando requieren condiciones diferentes para una prueba satisfactoria a las señaladas anteriormente para el matemático profesional. Definamos un argumento exitoso por parte del alumno de la siguiente manera: Un argumento para una afirmación matemática que
el instructor puede entender
el instructor no puede refutar
utiliza únicamente supuestos que el instructor considere admisibles.
Obsérvese que refutar un argumento no es lo mismo que refutar la pretensión original. La frase “El cuadrado de cada número real no es negativo porque todos los números reales no son negativos”. es una prueba falsa de una afirmación verdadera. La frase “El cuadrado de cada número real no es negativo porque todos los triángulos tienen tres lados”. falla la primera prueba: si bien ambas afirmaciones son verdaderas, su instructor no verá cómo la primera se desprende de la segunda.
En este libro, las soluciones a los problemas serán una exposición en lenguaje natural potenciada por expresiones matemáticas. Se espera que el alumno aprenda las convenciones de gramática y argumentación matemática, y las use. Como la mayoría de las convenciones, éstas suelen estar determinadas por la tradición o el precedente. Puede ser bastante difícil, inicialmente, determinar si tu exposición matemática cumple con los estándares de tu instructor. La práctica, con la retroalimentación de un lector con experiencia en lectura matemática, es la mejor manera de desarrollar buenas habilidades de escritura de prueba. Recuerde, los lectores de matemáticas están bastante impacientes por tratar de descifrar lo que quiere decir el autor; las matemáticas son lo suficientemente desafiantes cuando el autor escribe precisamente lo que pretende. La mayor parte de la carga de la comunicación recae en el autor de una prueba matemática, no en el lector. Una prueba puede ser lógicamente correcta, pero tan difícil de seguir que es inaceptable para tu instructor.
¿Por qué pruebas?
¿Por qué las pruebas son el medio primario de las matemáticas? Los matemáticos dependen de las pruebas para la certeza y la explicación. Una vez que una prueba es aceptada por la comunidad matemática, es prácticamente inaudito que el resultado sea posteriormente refutado. Esto no siempre fue así: en el19^{\text {th }} siglo hubo serias disputas sobre si los resultados realmente se habían probado o no (ver Sección5.3 para un ejemplo, y el libro [4] para un tratamiento muy extenso del desarrollo del rigor en el razonamiento matemático). Esto llevó a nuestra noción moderna de un argumento matemático “riguroso”. Si bien se podría argumentar que es posible que en el21^{\text {st }} siglo un nuevo estándar de rigor rechace lo que actualmente consideramos como pruebas, nuestras ideas actuales se han mantenido estables durante más de un siglo, y la mayoría de los matemáticos (incluidos los autores de este libro) no esperan que haya un cambio filosófico.
Para resultados muy complicados, escribir una prueba detallada ayuda al autor a convencerse a sí mismo de la verdad de la afirmación. Después de que un matemático se haya topado con la idea clave detrás de un argumento, queda mucho trabajo para desarrollar los detalles del argumento. Muchas ideas prometedoras fracasan ya que el autor intenta escribir un argumento detallado basado en la idea. Finalmente, las pruebas a menudo proporcionan una visión más profunda del resultado y los objetos matemáticos que son objeto de la prueba. En efecto, incluso pruebas muy inteligentes que no proporcionan conocimientos matemáticos se mantienen en menor consideración, por algunos, que los argumentos que dilucidan el tema.
Las pruebas matemáticas están fuertemente relacionadas con las pruebas formales en un sentido puramente lógico. Se supone que la existencia de una prueba matemática informal es evidencia abrumadora de la existencia de una prueba matemática formal. Si no está claro que la prueba informal pueda concebiblemente interpretarse en un argumento formal, es dudoso que el argumento informal sea aceptado por la comunidad matemática. En consecuencia, los argumentos matemáticos tienen una estructura lógica subyacente transparente.
Por esta razón comenzaremos nuestra discusión sobre las pruebas matemáticas con una breve discusión de la lógica proposicional. A pesar de su abstracción, el tema es sencillo, y la mayoría de las afirmaciones de esta sección pueden confirmarse con un pensamiento cuidadoso y paciente.
Lógica Proposicional
La lógica proposicional estudia cómo la verdad o falsedad de los enunciados compuestos está determinada por la verdad o falsedad de los enunciados constitutivos. Nos da una manera de derivar de manera confiable conclusiones verdaderas a partir de verdaderas suposiciones.
DEFINICIÓN. Valor de verdad SiP es una declaración que es verdadera, entoncesP tiene valor de verdad 1. SiP es una declaración que es falsa,P tiene valor de verdad 0. EscribimosT(P) para el valor de verdad deP.
Los valores de la verdad pueden pensarse como una funciónT: S \rightarrow\ulcorner 2\urcorner, dondeS está el conjunto de todas las afirmaciones. Al investigar los principios abstractos de la lógica proposicional, consideramos posibles asignaciones de valores de verdad a variables que representan declaraciones. Nos interesan las afirmaciones que son independientes de cualquier asignación particular de valores de verdad a las variables proposicionales. Usamos los enteros 0 y 1 para representar valores de verdad porque nos permite usar operaciones aritméticas en lógica proposicional. Otros autores prefierenF yT.
DEFINICIÓN. Conectivos proposicionales Los símbolos\wedge, \vee, \neg y\Rightarrow son conectivos proposicionales. Se definen de la siguiente manera para declaracionesP yQ.
Conectivo | Nombre | Definición |
---|---|---|
\neg | negación | T(\neg P)=1-T(P) |
\hat{\vee} | conjunción | T(P \wedge Q)=T(P) \cdot T(Q) |
\Rightarrow | disyunción | T(P \vee Q)=T(P)+T(Q)-T(P) \cdot T(Q) |
\Rightarrow | implicación | T(P \Rightarrow Q)=1-T(P)+T(P) \cdot T(Q) |
En la expresión "P \Rightarrow Q“, el enunciadoP se denomina antecedente o hipótesis yQ se denomina la consecuencia o conclusión.
Los conectivos proposicionales son equivalentes formales de los conectivos del lenguaje natural.
Conectivo | Equivalente a Lenguaje Natural |
---|---|
\neg | no |
\wedge | y |
\vee | o |
\Rightarrow | implica |
Comprueba que las fórmulas que definen los conectivos proposicionales dan el significado que esperas. Por ejemplo, comprobar que la definición del valor de verdad paraP \wedge Q significa queP \wedge Q es cierto si y sólo si ambosP yQ son verdaderos.
Los conectivos proposicionales se aproximan a las conectivas del lenguaje natural. Los conectivos proposicionales son formales y precisos, mientras que los conectivos del lenguaje natural son imprecisos y algo más expresivos; en consecuencia, la aproximación es imperfecta. Vimos un ejemplo de esto al contrastar el uso de los matemáticos del “o” conectivo con su uso en el lenguaje cotidiano. Para mayor precisión en matemáticas interpretamos los conectivos formalmente, incluso cuando se utilizan expresiones de lenguaje natural.
Podemos construir declaraciones compuestas muy complicadas mediante el uso de conectivos lógicos. Naturalmente, existen reglas para construir declaraciones correctas con conectivos.
DEFINICIÓN. Declaración atómica Una declaración atómica es una declaración sin conectivos proposicionales explícitos.
Una declaración atómica suele estar representada por una letra mayúscula.
DEFINICIÓN. Declaración bien formada Definimos una declaración proposicional bien formada recursivamente de la siguiente manera.
Las declaraciones atómicas están bien formadas.
SiP yQ son declaraciones bien formadas, entonces las siguientes son declaraciones bien formadas:
(\neg P)
(P \wedge Q)
(P \vee Q)
(P \Rightarrow Q). En la práctica se dejan caer los paréntesis a menos que exista la posibilidad de ambigüedad. Adicionalmente, “[” y “]” pueden sustituirse por paréntesis en aras de la legibilidad. Para cualquier asignación de valores de verdad a las declaraciones atómicas en una declaración bien formada, la declaración compuesta tendrá un valor de verdad bien definido.
DEFINICIÓN. Declaración compuesta Una declaración compuesta es una declaración bien formada compuesta de declaraciones atómicas y conectivos proposicionales.
3.2.1. Equivalencia proposicional. Un propósito de la lógica proposicional es dar herramientas para evaluar la verdad de una declaración compuesta sin necesariamente tener que entender el significado específico de las declaraciones atómicas. Es decir, algunas afirmaciones son demostrablemente verdaderas o falsas en virtud de su forma. En este entendimiento es central la idea de equivalencia proposicional.
DEFINICIÓN. Equivalencia proposicional LetP yQ ser declaraciones bien formadas construidas a partir de declaraciones atómicas. Decimos esoP yQ son proposicionalmente equivalentes siempre queT(P)=T(Q) para cualquier asignación de valores de verdad a las declaraciones atómicas constitutivas.
SiP yQ son proposicionalmente equivalentes, podemos escribir elP \equiv Q . EJEMPLO 3.1. [P \Rightarrow Q] \equiv[(\neg Q) \Rightarrow(\neg P)]Este es un ejemplo muy importante de una equivalencia proposicional. Demostraremos esto considerando todas las posibles asignaciones de valores de verdad aP yQ. Vamos a poner esto en lo que popularmente se llama una tabla de la verdad. Consideramos todas las asignaciones posibles de valores de verdad aP yQ, y comparamos los valores de verdad de las afirmaciones compuestas bajo consideración:
\begin{array}{cccc}\frac{T(P)}{0} & \frac{T(Q)}{0} & \frac{T(P \Rightarrow Q)}{1} & \frac{T((\neg Q) \Rightarrow(\neg(P)))}{1} \\ 0 & 1 & 1 & 1 \\ 1 & 0 & 0 & 0 \\ 1 & 1 & 1 & 1\end{array}
Cada fila de la tabla de verdad representa una asignación particular de valores de verdad a las declaraciones atómicasP yQ. Las cuatro asignaciones posibles se agotan por las filas de la tabla de la verdad. Los valores de verdad de las declaraciones compuestas coinciden en cada fila de la tabla de verdad por lo que las declaraciones son equivalentes.
EJEMPLO 3.2. \ [\ begin {aligned} & {[\ neg (P\ wedge Q)]\ equiv [(\ neg P)\ vee (\ neg Q)]}\\ & {[\ neg (P\ vee Q)]\ equiv [(\ neg P)\ wedge (\ neg Q)]} \ end {alineado}\] Se conocen declaraciones (3.3) y (3.4) como las leyes de Morgan. (¿Cómo se relacionan con el Ejercicio 1.2?)
Con dos posibles excepciones, una vez que estudies cuidadosamente lo que significan estas conectivas, debes entenderlas intuitivamente. Una excepción es que el lógico y matemático “o”,\vee, es inclusivo. Esto lo discutimos al inicio del Capítulo 2. La otra excepción es el conectivo lógico "\Rightarrow”.
3.2.2. Implicación. A los estudiantes a menudo les resulta confuso que la implicaciónP \Rightarrow Q pueda ser cierta cuando la consecuencia,Q, es falsa. Esto es comprensible cuando consideramos que las implicaciones se suelen emplear en argumento en el silogismo siguiente:\ [\ begin {reunió} P\ P\ Rightarrow Q\ end {reunió} \] por lo tanto, (es decir, siP es cierto, yP \Rightarrow Q, entoncesQ es cierto). Este silogismo es la regla más importante de deducción lógica (llamada Modus Ponens). La implicación lógica se utiliza tan a menudo para demostrar la verdad de la consecuencia que es fácil entender por qué uno podría pensar erróneamente que la consecuencia debe seguir de la implicación, en lugar de seguir del antecedente. Considera la siguiente declaración:
Si eres el rey de Francia, entonces yo soy el tío de un mono.
¿Es cierta esta afirmación? Presumiblemente no eres el rey de Francia, y no creo que sea tío de mono. Entonces tanto el antecedente como la consecuencia son falsos. Sin embargo la afirmación es cierta. De hecho, esta afirmación es lógicamente equivalente a la afirmación:
Si no soy tío de mono, entonces tú no eres el rey de Francia.
La definición de implicación lógica dice que una implicación en la que el antecedente es falso no da información sobre la consecuencia. De ahí que cualquier implicación lógica con el antecedente “Tú eres el rey de Francia” será cierta.
Existe una preocupación adicional con implicación lógica. En el lenguaje natural (e intuitivamente en matemáticas), la afirmaciónP \Rightarrow Q sugiere una relación entre las afirmacionesP yQ -es decir, que la verdad deP alguna manera obliga a la verdad deQ. Como conectivo proposicional, esta relación entreP y noQ es necesaria para la implicación lógica. La verdad deP \Rightarrow Q es una función de los valores de verdad deP yQ, no de sus significados. En la escritura matemática, se entiende que no sólo es lógicamente cierta la implicación, sino queP yQ están relacionados y que la verdad deP hecho obliga a la verdad deQ. Por ejemplo, considere la afirmación\mathbb{N} \subset \mathbb{Q} \Rightarrow 3>2 . Esta afirmación es cierta por la definición formal de\Rightarrow. De hecho, como declaración proposicional, podríamos sustituir el antecedente por cualquier otra afirmación, verdadera o falsa, y la declaración condicional sería verdadera. No obstante, tal afirmación es matemáticamente inaceptable, ya que el antecedente y la consecuencia no tienen nada que ver entre sí. No nos preocupan los valores de verdad accidentales de las declaraciones atómicas, sino las conexiones matemáticas entre estas afirmaciones, que cumplen, sin embargo, van más allá de la definición formal de las conectivas lógicas.
3.2.3. Converse y Contrapositivo. La mayoría de las afirmaciones matemáticas tienen la forma de una implicación. Por lo tanto, es necesario estar familiarizado con la nomenclatura convencional que rodea la implicación lógica. Supongamos que nos interesa una implicación lógica particular,P \Rightarrow Q \text {. } Hay otras dos implicaciones lógicas con las que naturalmente se asocianP \Rightarrow Q. Uno es el contrapositivo,\neg Q \Rightarrow \neg P . Una implicación y sus contrapositivos son proposicionalmente equivalentes.
EJEMPLO 3.5. La declaración,
“Si esto es un insecto entonces tiene seis patas”.
es proposicionalmente equivalente a la declaración
“Si esto no tiene seis patas, no es un insecto”.
EJEMPLO 3.6. El contrapositivo de
“Una ballena es un pez”
es
“Si no es un pez entonces no es una ballena”.
Este último ejemplo ilustra que una declaración no necesita ser cierta para tener un contrapositivo (que es, por supuesto, todavía proposicionalmente equivalente a la declaración condicional original). También ilustra que las declaraciones condicionales en lenguaje natural no necesitan incluir la palabra “si” o “entonces”, ni ser escritas en una forma particular, para ser una declaración condicional. Lo contrario de una declaración condicional,P \Rightarrow Q es la declaración condicional,Q \Rightarrow P . Una declaración condicional y su inversa no son proposicionalmente equivalentes. Puedes comprobarlo fácilmenteP \Rightarrow Q yQ \Rightarrow P tener diferentes valores de verdad siT(P)=1 yT(Q)=0.
EJEMPLO 3.7. ¿Qué es lo contrario a la declaración?
¿"Todos los peces viven en el agua”?
Dado que esto está escrito en lenguaje natural, no hay una respuesta única.
Un obvio lo contrario es
“Si algo vive en el agua, entonces es un pez”.
Si armamos una implicación y su inversa, obtenemos el conectivo bicondicional.
DEFINICIÓN. Bicondicional,\Longleftrightarrow DejarP yQ ser declaraciones. El bicondicional, escrito\Longleftrightarrow, se define de la siguiente manera.
Conectivo | Nombre | Definición |
---|---|---|
\Longleftrightarrow | bicondicional | T(P \Longleftrightarrow Q)=T(P \Rightarrow Q) \cdot T(Q \Rightarrow P) |
El conectivo bicondicional es la interpretación formal de “si y solo si”. Esta frase es tan utilizada en matemáticas que tiene su propia abreviatura: iff.
Otras palabras del lenguaje natural que pueden traducirse en conectivos proposicionales son “necesarias” y “suficientes”. El comunicado
“PPara que pueda sostenerse, es necesario queQ sostenga” equivale aP \Rightarrow Q. El comunicado
“PPara que pueda sostenerse, basta con queQ sostenga”
es equivalente aQ \Rightarrow P. Combinando estos dos, conseguimos que la afirmación “PPara poder sostener, es necesario y suficiente queQ sostiene” es equivalente aP \Longleftrightarrow Q.
Fórmulas
Hablando vagamente, una fórmula es una expresión matemática con variables. Correspondiente a cada variablex_{i},, apareciendo en una fórmula es un universoU_{i},, del cual esa variable puede ser sustituida.
DEFINICIÓN. Fórmula abierta Una fórmula matemática abierta en variablesx_{1}, \ldots, x_{n} es una expresión matemática en la que la sustitución delx_{i}(1 \leq i \leq n) por elementos específicos deU_{i} produce una declaración matemática.
EJEMPLO 3.8. Considera la fórmula,x^{2}+y^{2}=z^{2} en variablesx, y yz, todas con universo\mathbb{N}. Cualquier sustitución de las variables con números naturales da como resultado una declaración. Por ejemplo,3^{2}+4^{2}=5^{2} o Por1^{2}+1^{2}=2^{2} . supuesto, las declaraciones pueden ser verdaderas o falsas, por lo que algunas sustituciones producen declaraciones verdaderas, mientras que otras darán declaraciones falsas.
Al discutir una fórmula general enn variables, podemos usar la notaciónP\left(x_{1}, \ldots, x_{n}\right). Para1 \leq i \leq n, dejaU_{i} ser el universo de la variablex_{i}, ya_{i} \in U_{i}. El enunciado que resulta de la sustitución dea_{i} forx_{i}, 1 \leq i \leq n, está escritoP\left(a_{1}, \ldots, a_{n}\right).
SiP\left(x_{1}, \ldots, x_{n}\right) es una fórmula en variablesx_{1}, \ldots, x_{n}, y para1 \leq i \leqn, U_{i} es el universo dex_{i}, entonces podemos pensar en\left(x_{1}, \ldots, x_{n}\right) como una sola variable con universoU=\prod_{1 \leq i \leq n} U_{i}.
Las fórmulas pueden cumplir muchos propósitos en matemáticas:
(1) Caracterizar las relaciones entre cantidades
(2) Definir cálculos (3) Definir conjuntos
(4) Definir funciones.
EJEMPLO 3.9. Considera una fórmula abiertaP(x, y),, en dos variables,x^{2}+y^{2}=1, con universo\mathbb{R}^{2}. Es decir, el universo dex es\mathbb{R} y el universo dey es\mathbb{R}. Una forma de pensarP(x, y) es como un medio para\mathbb{R}^{2} dividir en dos conjuntos:
(1) el subconjunto del Plano Cartesiano para el que la ecuación es verdadera, es decir, el círculo unitario;
(2) el subconjunto del Plano Cartesiano para el que la ecuación es falsa, el complemento del círculo unitario en\mathbb{R}^{2}.
DEFINICIÓN. Conjunto característico,\chi_{P} LetP(x) be a formula, yU el universo de la variablex. Se escribe el subconjuntoU para el que seP mantiene la fórmula\chi_{P}. El conjunto\chi_{P} se llama el conjunto característico deP(x).
Entonces,\chi_{\neg P}=U \backslash \chi_{P} . 3.3.1. Fórmulas y Conectivos Proposicionales. La lógica proposicional se extiende fácilmente a las fórmulas. DejarP(x) yQ(x) ser fórmulas en la variablex, con universoU. LetR(x)=P(x) \wedge Q(x) . Entonces el conjunto característico deR(x) viene dado por\chi_{R}=\{a \in U \mid T(P(a) \wedge Q(a))=1\} De ahí\chi_{R}=\chi_{P} \cap \chi_{Q} . El conectivo proposicional\wedge está fuertemente asociado con la operación de conjunto\cap. Del mismo modo\vee pueden estar asociados\cup, \neg con complemento (inU), y\Rightarrow con\subseteq.
Cuantificadores
DejarP(x) ser una fórmula en una variable. Si sustituimos una constantea \in U,,x pues llegamos a un comunicadoP(a). No obstante, supongamos que nos interesaP(x) con respecto a algún conjuntoX \subseteq U, más que a un elemento particular deU. En particular, preguntamos siP(a) es una verdadera declaración para todosa \in X. Recordemos que uno de los roles de una fórmula es definir conjuntos. Para cualquier fórmulaP(x), universoU yX \subseteq U, P(x) particionesX en dos conjuntos - aquellos elementos deX para los cualesP es cierto, y aquellos para los queP es falso. En este sentido, preguntar si seP sostiene para todosx \in X, o si se sostiene para algunosx \in X (lo que es complementario a preguntar si se\neg P mantiene para todosx \in X) es preguntar siP define una nuevo o interesante subconjunto deX.
Así como se introdujeron los conectivos proposicionales para formalizar el comportamiento lingüístico de ciertos conectivos de lenguaje natural ampliamente empleados (y, o, implica, no), también formalizaremos la “cuantificación” sobre conjuntos.
Definición. Cuantificador universal,(\forall x \in X) P(x) LetP(x) be una fórmula en una variable, con universoU. VamosX \subseteq U. QSea la declaración(\forall x \in X) P(x) EntoncesQ es verdad si por cadaa \in X, P(a) es verdad. De lo contrarioQ es falso.
La notación(\forall x \in X) P(x) es una taquigrafía para(\forall x)([x \in X] \Rightarrow[P(x)]) La declaración "(\forall x \in X) P(x) "se lee “para todosx enX, P(x) ". Tenemos(\forall x \in X) P(x) \Longleftrightarrow X \subseteq \chi_{P} DEFINITION. Cuantificador existencial,(\exists x \in X) P(x) LetP(x) Ser una fórmula en una variable con universoU . LetX \subseteq U, X \neq \emptyset. QSea el enunciado(\exists x \in X) P(x) . EntoncesQ es cierto si hay algunoa \in X, para lo cualP(a) es cierto. De lo contrarioQ es falso.
La expresión(\exists x \in X) P(x) es una taquigrafía para(\exists x)[(x \in X) \wedge P(x)] \text {. } La declaración(\exists x \in X) P(x) "" se lee “existex enX, tal queP(x)”. El cuantificador "\nabla" es el equivalente formal de la expresión del lenguaje natural “para todos” o “cada”. El cuantificador "\exists" es el equivalente formal de “para algunos” o “existe... tal que...”.
Siempre que el universo de una variable sea claro, o no relevante para la discusión, es común suprimir el universo en la expresión del enunciado. Por ejemplo, siP(x) es una fórmula con universoU, podemos escribir(\forall x) P(x) en lugar de(\forall x \in U) P(x) . 3.4.1. Cuantificadores Múltiples. DejarP\left(x_{1}, \ldots, x_{n}\right) ser una fórmula enn \geq 2 variables. Entonces la fórmula\left(\forall x_{1}\right) P\left(x_{1}, \ldots, x_{n}\right) es una fórmula en lasn-1 variablesx_{2}, \ldots, x_{n}. De igual manera, la fórmula\left(\exists x_{1}\right) P\left(x_{1}, \ldots, x_{n}\right) es una fórmula enn-1 variables.
EJEMPLO 3.10. Considera la fórmula en cinco variablesP\left(x, x_{0}, L, \varepsilon, \delta\right):=\left(0<\left|x-x_{0}\right|<\delta\right) \Rightarrow(|\sin (x)-L|<\varepsilon) con todas las variables teniendo universo\mathbb{R}. Entonces\left(\forall x_{0}\right) P\left(x, x_{0}, L, \varepsilon, \delta\right) es una fórmula en cuatro variables,\left(\forall x_{0}\right)(\exists L) P\left(x, x_{0}, L, \varepsilon, \delta\right) es una fórmula en tres variables, y\left(\forall x_{0}\right)(\exists L)(\forall \varepsilon) P\left(x, x_{0}, L, \varepsilon, \delta\right) es una fórmula en dos variables.
Definición. Variable abierta, Variable enlazada En la fórmulaP(x),x es una variable abierta. En las fórmulas(\forall x) P(x), \quad(\exists x) P(x), \quad(\forall x) Q(x, y), \quad(\exists x) Q(x, y)x hay una variable enlazada o cuantificada, y en las dos últimas,y es una variable abierta.
3.4.2. Orden del cuantificador. En la discusión a continuación, necesitamos discutir los cuantificadores genéricamente, es decir, sin tener en cuenta si el cuantificador en discusión es universal o existencial. Por lo que vamos a introducir alguna notación conveniente sólo para esta sección.
Notación. (\mathcal{Q} x) P(x)Utilizamos la notación\text { (Q } \mathcal{Q} x) P(x) para representar genéricamente(\forall x) P(x) y(\exists x) P(x) \text {. } Let\mathcal{Q}_{1}, \ldots, \mathcal{Q}_{n} be cuantificadores lógicos yP\left(x_{1}, \ldots, x_{n}\right) ser una fórmula con variables abiertasx_{1}, \ldots, x_{n}. Entonces\left(\mathcal{Q}_{1} x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) es una declaración.
EJEMPLO 3.11. Considerar una declaraciónS en la formaS=(\forall x \in X)(\exists y \in Y) P(x, y) .S es verdadera si para cada unoa \in X,(\exists y \in Y) P(a, y) es verdad. Esto se satisface siempre que para cada unoa \in X, haya un elemento deY (llamémoslob_{a} para recordarnos que este elemento particular deY está asociado con la elección anterior, a) tal queP\left(a, b_{a}\right) es cierto. Asíb_{a} se selecciona teniendoa en mente. Las declaraciones en esta forma son especialmente importantes en matemáticas porque la definición del límite en el cálculo es una declaración en la forma de este ejemplo.
Volvamos al enunciado\left(\mathcal{Q}_{1} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) El orden de los cuantificadores es significativo. Si1 \leq i<j \leq n, x_{i} se comporta como un parámetro desde el punto de vista dex_{j} (es decir,x_{i} se fija desde el punto de vista dex_{j}). Dicho de otra manera,x_{j} se elige con respecto a las sustituciones dex_{1}, \ldots, x_{j-1}, pero sin consideración parax_{j+1}, \ldots, x_{n}.
Siempre se lee desde la izquierda. El enunciado\left(\forall x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) es el mismo que\left(\forall x_{1}\right)\left[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\right] \text {, } o, en otras palabras, para cada elección dex_{1}, la afirmación\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) es cierta. De igual manera, la afirmación\left(\exists x_{1}\right)\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) es la misma que\left(\exists x_{1}\right)\left[\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right)\right] \text {, } o en otras palabras que hay alguna elección dex_{1} para la cual la afirmación\left(\mathcal{Q}_{2} x_{2}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) sobre lasn-1 variablesx_{2}, \ldots, x_{n} es verdadera.
EJEMPLO 3.12. El orden de los cuantificadores es importante, como se puede ver en lo siguiente: no(\forall x \in X)(\exists y \in Y) P(x, y) es equivalente a(\exists y \in Y)(\forall x \in X) P(x, y) . Por ejemplo, la afirmación(\forall x \in \mathbb{R})(\exists y \in \mathbb{R})\left(y=x^{2}\right) es verdadera. Pero(\exists y \in \mathbb{R})(\forall x \in \mathbb{R})\left(y=x^{2}\right) es falso. El enunciado[(\exists y \in Y)(\forall x \in X) P(x, y)] \Rightarrow[(\forall x \in X)(\exists y \in Y) P(x, y)] es cierto. Lo contrario claramente falla.
3.4.3. Negación de Cuantificadores. En un sentido importante,\wedge y\vee son complementarios. Por las identidades de Morgan (3.3) y (3.4), la negación de una simple conjunción es una disyunción de negaciones. De igual manera, la negación de una disyunción simple es una conjunción de negaciones. Los cuantificadores universales y existenciales también son complementarios. Observamos que[\neg(\forall x) P(x)] \equiv[(\exists x) \neg P(x)] para cualquier fórmula,P(x). Similarmente Por[\neg(\exists x) P(x)] \equiv[(\forall x) \neg P(x)] . supuesto,P(x) en sí misma puede ser una fórmula que tenga numerosos cuantificadores y variables enlazadas. Supongamos queP(x)=(\exists y) Q(x, y) . Entonces las siguientes declaraciones son equivalentes (para cualquier elecciónP yQ satisfacción de la identidad (3.13)):\ [\ begin {reunió} \ neg (\ forall x) P (x)\\ (\ existe x)\ neg P (x)\ \ neg (\ forall x) (\ existe y ) Q (x, y)\\ (\ existe x)\ neg (\ existe y) Q (x, y)\\ (\ existe x) (\ para todos y)\ neg Q (x, y). \ end {reunió}\] Este ejemplo sugiere que es permisible permutar una negación y un cuantificador cambiando el tipo de cuantificador, y de hecho esto es así.
Dejar\mathcal{Q}_{i} ser un cuantificador, para1 \leq i \leq n. Para cada uno\mathcal{Q}_{i}, deja\mathcal{Q}_{i}^{*} ser el cuantificador complementario. Es decir, si\mathcal{Q}_{i}=\forall, entonces vamos\mathcal{Q}_{i}^{*}=\exists; si\mathcal{Q}_{i}=\exists, entonces vamos\mathcal{Q}_{i}^{*}=\forall. Entonces,\neg\left(\mathcal{Q}_{1} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n} x_{n}\right) P(\bar{x}) \equiv\left(\mathcal{Q}_{1}^{*} x_{1}\right)(\ldots)\left(\mathcal{Q}_{n}^{*} x_{n}\right) \neg P(\bar{x}) .
Estrategias de prueba
Hay dos formas lógicas elementales que ocurren tan comúnmente en las afirmaciones matemáticas que justifican alguna discusión general.
3.5.1. Declaraciones Universales. Una forma lógica que es probable que encuentre muy a menudo es(\forall x)[H(x) \Rightarrow P(x)] \text {, } dóndeH(x) yP(x) son fórmulas en una variable. Las declaraciones en esta forma se denominan declaraciones universales. Las fórmulasH yP se utilizan para caracterizar las propiedades de los objetos matemáticos, de manera que las reivindicaciones en esta forma puedan considerarse como declarando:
Si un objeto matemático tiene propiedadH, entoncesP también tiene propiedad.
Esto es particularmente útil si sabemos mucho sobre objetos matemáticos que tienen propiedadP. Debido a que la afirmación que estamos tratando de probar es universal, los ejemplos no bastan para probar tales afirmaciones; el ejemplo que cita podría tener accidentalmente propiedadesH yP. Más bien, las afirmaciones universales deben probarse abstractamente, argumentando que satisfacer una definición o conjunto de propiedades implica la satisfacción de otras propiedades. Esto generalmente requiere evaluar cuidadosamente las definiciones. En la práctica, a menudo lo hacemos asumiendo que tenemos un elemento arbitrario que satisface una definición o supuestos explícitos, y lógicamente derivamos conclusiones adicionales sobre este objeto. Por arbitrario queremos decir que no se nos permite hacer ninguna afirmación sobre el elemento excepto aquellas que se deriven inmediatamente de definiciones, suposiciones explícitas, o que se deriven lógicamente de definiciones y suposiciones explícitas. Dado que el objeto era arbitrario (a excepción de las suposiciones explícitas que hagas al inicio del argumento), las conclusiones que derives sobre el objeto serán verdaderas universalmente para todos los objetos que satisfagan los supuestos.
EJEMPLO 3.15. Supongamos queF(x) es la fórmula:\text { " } x \in \mathbb{N} \text { and } x \text { is a multiple of } 4 . " LetE(x) be the formula:\text { " } x \text { is even." } Entonces No(\forall x)[F(x) \Rightarrow E(x)] . basta con observar que 4,8 y 12 son todos parejos. Para argumentar directamente a favor de la afirmación, se argumentaría abstractamente que cualquier objeto que satisfagaF(x) necesariamente satisfaceE(x).
Hay un par de enfoques que uno suele considerar al probar declaraciones condicionales. Elegir un enfoque es elegir una estrategia para la prueba. Normalmente, se puede hacer funcionar más de una estrategia, pero a menudo una puede ser más simple que las otras.
Las reclamaciones de la forma (3.14) generalmente se abordan de una de las siguientes maneras:
(1) Prueba Directa. Dejarx ser un objeto para el que seH sostiene. Al decodificar la propiedadH, es posible que también pueda mostrar directamente esaP propiedad.x Alx ser un objeto arbitrario satisfactorioP, se probará la reivindicación universal.
EJEMPLO 3.17. Demostrar (3.16) directamente.
Letx \in \mathbb{N} (tratamosx como un elemento fijo pero arbitrario de los números naturales). Six=4 n, entoncesx=2 \cdot(2 n), y por lo tanto es parejo.
EJEMPLO 3.18. Demostrar que cualquier 3 puntos en el plano son colineales o se encuentran en un círculo.
Comprobante. Etiquetar los puntosA, B, C. DejarL ser la bisectriz perpendicular deA B. Cada punto enL es equidistante deA yB.
DejarM ser la bisectriz perpendicular deB C. Cada punto enM es equidistante deB yC.
SiA, B y noC son colineales, las líneasL y noM son paralelas, por lo que se cruzan en algún momentoD. El puntoD es equidistante deA, B yC, por lo que estos puntos se encuentran en un círculo centrado enD.
EJEMPLO 3.19. El teorema de Pitágoras se puede afirmar en la forma (3.14). (¿Qué sonH yP en este caso?) La prueba de Euclides del teorema de Pitágoras es una prueba directa (Elementos I.47 de Euclides).
(2) Prueba Contrapositiva.
A veces es más fácil demostrar que el fracaso deP implica el fracaso deH. Supongamos que tiene un objeto para el cualP falla (es decir, asumir\neg P retenciones del objeto). Derivar queH debe fallar para el objeto también. En este caso habrás demostrado que(\forall x)[\neg P(x) \Rightarrow \neg H(x)] . Esto equivale a la reclamación(\forall x)[H(x) \Rightarrow P(x)] . EJEMPLO 3.20. Demostrar (3.16) demostrando el contrapositivo.
Vamosx \in \mathbb{N}, y supongamos\neg E(x), asíx es extraño. Comox es impar, entoncesx dividido por 4 tiene resto 1 o 3. Entonces,x \neq 4 n \text {. } Así nox es un múltiplo de 4.
EJEMPLO 3.21. Demostrar que six es un entero yx^{2} es par, entoncesx es par.
El contrapositivo es la afirmación de que six es un entero impar, entoncesx^{2} es impar. Esto lo demostraremos.
Supongamos quex es impar, así quex=2 n+1 para algún enteron. Entoncesx^{2}=4 n^{2}+4 n+1, asíx^{2} \equiv 1 \bmod 2, y por lo tantox^{2} es extraño.
(3) Contradicción.
Esta es una prueba en la que demostramos queH \wedge \neg P es necesariamente falsa. Es decir, asumir que seH sostiene para un objeto arbitrario yP falla para ese objeto, y demostrar que esto da lugar a una contradicción. Dado que las contradicciones son lógicamente imposibles, es lógicamente necesario aquello\neg(H \wedge \neg P) que es proposicionalmente equivalente a\neg H \vee P o, alternativamente,H \Rightarrow P \text {. } ya que habremos demostrado que para cualquier sustitución dex, el enunciado H \Rightarrow Psostiene, habremos mostrado el reclamo universal.
EJEMPLO 3.22. Demostrar (3.16) por contradicción.
Supongamos quex es un múltiplo de 4 y esox es impar. Dejarr ser el residuo delx módulo 2. Ya quex es un múltiplo de4=2 \cdot 2, tenemos esor \equiv 0 \bmod 2. Ya quer es extraño, tenemos esor \equiv 1 \bmod 2. Esto implica0 \equiv 1 \bmod 2, una contradicción. Por lo tanto, la suposición dex que había un que era a la vez un múltiplo de 4 e impar es falsa, y así ((3.16) debe ser verdadera. EJEMPLO 3.23. Demostrar que\sqrt{2} es irracional.
Comprobante. Reafirmamos esto como implicación: Si un número es racional, es cuadrado no puede igualar 2. Comenzamos por considerar la estructura lógica del reclamo. Aquí la hipótesisH(x) es quex es un número racional, y la conclusiónP(x) es quex^{2} \neq 2. (\forall x) H(x) \Rightarrow P(x) .Deseamos probar Daremos una prueba por contradicción. Es decir, asumimos que la afirmación es falsa y derivamos una contradicción. Entonces asumimos\neg((\forall x) H(x) \Rightarrow P(x)) . Esto es lógicamente equivalente a(\exists x) H(x) \wedge \neg(P(x)) . Volvamos a la prosa matemática ahora que hemos luchado a través de la lógica. Supongamos quex es un número racional, y asumir también esox^{2}=2; deseamos derivar una contradicción lógica. Escribirx=m / n, dondem yn son enteros distintos de cero que no tienen factores comunes. Entoncesx^{2}=m^{2} / n^{2}=2, asím^{2}=2 n^{2}. Por lo tantom^{2} es parejo, así que por el Ejemplo 3.21,m es parejo. Por lo tantom=2 k para algún enterok, y asím^{2}=4 k^{2}=2 n^{2} . Por lo tanton^{2}=2 k^{2} es par, asín es par. Pero entonces ambosm yn son parejos, y así tienen 2 como factor común, lo que contradice la suposición de quem / n era la forma reducida del número racionalx.
Las pruebas contrapositivas y las pruebas por contradicción son muy similares. En efecto, cualquier prueba contrapositiva, eso\neg P \Rightarrow \neg H, automáticamente cede eso(H \wedge \neg P) es imposible. La distinción es más lingüística que lógica. La razón de tener nombres para diferentes estrategias de prueba es brindar orientación al lector para que la prueba sea más fácil de seguir. En el Capítulo 4 veremos otro método poderoso para probar declaraciones universales sobrepasadas\mathbb{N}, a saber, el Principio de Inducción.
3.5.2. Pruebas de Existencia. Una segunda forma común para una afirmación matemática es una declaración existencial, es decir, una declaración en la forma(\exists x) P(x) \text {. } Hay tres enfoques comunes para probar afirmaciones existenciales.
(1) Construcción.
Obviamente, la forma más directa de mostrar que algo existe con ciertas propiedades es introducir o construir un objeto con propiedadP. Para las reclamaciones en esta forma, el ejemplo es la prueba, aunque habrá que demostrar que el objeto satisfaceP, si no es obvio.
EJEMPLO 3.25. Demostrar que existe una función real cuya primera derivada es en todas partes positiva, y cuya segunda derivada es en todas partes negativa.
Prueba. La forma más fácil de hacerlo es anotar una función con estas propiedades. Una de esas funciones esf(x)=1-e^{-x}. El derivado ese^{-x}, que en todas partes es positivo, y el segundo derivado lo es-e^{-x}, que en todas partes es negativo.
(2) Conteo.
A veces se puede establecer la existencia de un objeto mediante un argumento de conteo.
EJEMPLO 3.26. Supongamos que hay 30 alumnos en una clase. Demostrar que al menos dos de ellos comparten la misma última inicial.
PRUEBA. Por cada letraA, B, \ldots agrupa a todos los alumnos con esa letra como su última inicial. Como solo hay 26 grupos y30>26 estudiantes, al menos un grupo debe tener más que sobre estudiante en él.
El argumento que acabamos de dar se llama el “principio del casillero”, basado en la analogía de poner letras en casilleros. Si hay más letras que casilleros, entonces algún casillero debe tener más de una letra. Observe que a diferencia de una prueba constructiva, una prueba de conteo no le dice qué grupo tiene más de un elemento en ella.
Para conocer la espectacular generalización de Cantor del principio del casillero a conjuntos infinitos, ver Capítulo 6.
(3) Contradicción.
Puede ser difícil probar declaraciones existenciales por construcción. Una alternativa es asumir que la afirmación existencial es falsa (que no hay objeto que satisfagaP(x)). Si es imposible que ningún objeto tenga propiedadP, entonces algún objeto debe. Nuevamente, este enfoque puede no darnos mucha idea de los objetos que tienen propiedadP. Ver por ejemplo Ejercicio 3.27.
EJEMPLO 3.27. Supongamos que todos los puntos en el plano son de color rojo o azul. Demostrar que debe haber dos puntos del mismo color exactamente a una unidad de distancia.
Comprobante. Supongamos que no los hay. Dibuja un triángulo equilátero del lado 1. Etiquetar sus vérticesA, B yC. EntoncesA yB deben ser diferentes colores,B yC deben ser diferentes colores,C yA deben ser diferentes colores. Esto es imposible con solo dos colores para elegir.
Observe que no hemos dicho si hay un par rojo-rojo que esté separado por unidad de distancia, o un par azul-azul que esté a distancia unitaria, solo que uno de esos pares debe existir.
Ejercicios
EJERCICIO 3.1. Demostrar las leyes de Morgan, (3.3) y (3.4). (Pista: Hay cuatro posibles asignaciones de valores de verdad 0 y 1 a las dos afirmacionesP yQ. Para cada una de esas tareas, evalúe los valores de verdad de los lados izquierdo y derecho de (3.3) y demuestre que siempre son los mismos).
EJERCICIO 3.2. Demostrar que las declaraciones compuestasP yQ son proposicionalmente equivalentes iffP \Longleftrightarrow Q.
EJERCICIO 3.3. Dar un ejemplo de una declaración condicional verdadera en la que la consecuencia es falsa. EJERCICIO 3.4. SiP, Q yR son declaraciones, probar que son ciertas las siguientes:
a)P \wedge \neg P \Rightarrow Q
b)[(P \Rightarrow Q) \wedge(Q \Rightarrow R)] \Rightarrow(P \Rightarrow R)
c)[P \Rightarrow(Q \wedge \neg Q)] \Rightarrow \neg P
d)[P \wedge(P \Rightarrow Q)] \Rightarrow Q
e) P \Rightarrow(Q \vee \neg Q).
EJERCICIO 3.5. DejarP yQ ser declaraciones. Demostrar que hay declaraciones usando solamenteP, Q, \neg y\wedge que son proposicionalmente equivalentes a
a)P \wedge Q
b)P \vee Q
c)P \Rightarrow Q.
Demostrar que hay declaraciones usando solamenteP, Q, \neg y\vee que son equivalentes a lo anterior.
EJERCICIO 3.6. Demostrar las leyes distributivas para la lógica proposicional: SiP, Q yR son declaraciones, entonces
a)P \vee(Q \wedge R) \equiv(P \vee Q) \wedge(P \vee R)
b)P \wedge(Q \vee R) \equiv(P \wedge Q) \vee(P \wedge R).
EJERCICIO 3.7. Demostrar la ley distributiva para conjuntos: SiX, Y yZ son conjuntos, entonces
a)X \cup(Y \cap Z)=(X \cup Y) \cap(X \cup Z)
b)X \cap(Y \cup Z)=(X \cap Y) \cup(X \cap Z).
EJERCICIO 3.8. Dejar conjuntosX, Y yZ ser conjuntos característicos de fórmulasP(x), Q(x) yR(x) respectivamente. Para cada región posible del diagrama de VennX, Y yZ dar una fórmula compuesta (con fórmulas atómicasP, Q yR) que tiene esa región como su conjunto característico.
EJERCICIO 3.9. Escribe una fórmula en una variable que defina los enteros pares.
EJERCICIO 3.10. Escribe una fórmula que defina cuadrados perfectos. EJERCICIO 3.11. Escribe una fórmula en dos variables que defina los puntos en los\mathbb{R}^{2} que tengan distancia 1 del punto(\pi, e).
EJERCICIO 3.12. ¿Se puede escribir una fórmula en una variable usando solo suma, multiplicación, exponenciación, enteros e igualdad, para definir el conjunto de todas las raíces de un polinomio dado con coeficientes enteros? ¿Qué tal el conjunto de raíces de todos los polinomios con coeficientes enteros?
EJERCICIO 3.13. ¿Cuáles de las siguientes afirmaciones son ciertas?
a)(\forall x \in \mathbb{R}) x+1>x
b)(\forall x \in \mathbb{Z}) x^{2}>x
c)(\exists x \in \mathbb{Z})(\forall y \in \mathbb{Z}) x \leq y
d)(\forall y \in \mathbb{Z})(\exists x \in \mathbb{Z}) x \leq y
e)(\forall \varepsilon>0)(\exists \delta>0)(\forall x \in \mathbb{R})[0<|x-1|<\delta] \Rightarrow\left[\left|x^{2}-1\right|<\varepsilon\right].
EJERCICIO 3.14. ¿Cuál es la negación de cada enunciado en el Ejercicio 3.13? ¿Cuál de las negaciones es verdad?
EJERCICIO 3.15. Dejara, L \in \mathbb{R} yf ser una función real. Demostrar que las declaraciones(\forall \varepsilon>0)(\exists \delta>0)(\forall x \in \operatorname{Dom}(f))[0<|x-a|<\delta] \Rightarrow[|f(x)-L|<\varepsilon] y no(\exists \delta>0)(\forall \varepsilon>0)(\forall x \in \operatorname{Dom}(f))[0<|x-a|<\delta] \Rightarrow[|f(x)-L|<\varepsilon] son equivalentes. ¿Qué afirmación es consecuencia de la otra?
EJERCICIO 3.16. DejarP(x, y) ser una fórmula en dos variables. Demostrar que en general no(\forall x)(\exists y) P(x, y) necesita ser equivalente a(\exists y)(\forall x) P(x, y). Demostrar que(\forall x)(\forall y) P(x, y) es equivalente a(\forall y)(\forall x) P(x, y). ¿Y qué pasa(\exists x)(\exists y) P(x, y) con y(\exists y)(\exists x) P(x, y)?
EJERCICIO 3.17. Considera las siguientes afirmaciones. Anote lo contrapositivo y lo contrario a cada uno.
(i) Todos los hombres son mortales.
(ii) Me refiero a lo que digo. (iii) Toda función continua en el intervalo[0,1] alcanza su máximo
(iv) La suma de los ángulos de un triángulo es180^{\circ}.
EJERCICIO 3.18. Demostrar que un número es divisible por 4 si y sólo si sus dos últimos dígitos lo son.
EJERCICIO 3.19. Demostrar que un número es divisible por 8 si sus últimos tres dígitos son.
EJERCICIO 3.20. Demostrar que un número es divisible2^{n} por si sus últimosn dígitos son.
EJERCICIO 3.21. Supongamos quem es un número con la propiedad de que cualquier número natural esm divisible por si sus últimos tres dígitos son. ¿De qué dice estom? Demuestra tu aseveración.
EJERCICIO 3.22. Demostrar que un entero es divisible por 11 si la suma de los dígitos colocados extrañamente menos la suma de los dígitos colocados uniformemente es divisible por 11. (Entonces11 \mid 823493 iff 11 divide(2+4+3)-(8+3+9).)
EJERCICIO 3.23. Mostrar que cada intervalo contiene números racionales e irracionales.
EJERCICIO 3.24. Demostrar que\sqrt{3} es irracional.
EJERCICIO 3.25. Demostrar que\sqrt{10} es irracional.
EJERCICIO 3.26. Demostrar que la raíz cuadrada de cualquier número natural es o bien un número entero o irracional.
EJERCICIO 3.27. Demostrar que existen números irracionalesx yy entonces esox^{y} es racional. (Pista: considerar\sqrt{2}^{\sqrt{2}} y\left(\sqrt{2}^{\sqrt{2}}\right)^{\sqrt{2}}.)
EJERCICIO 3.28. Demostrar o refutar la siguiente aseveración: Cualesquiera 4 puntos en el plano, ninguno de los cuales tres son colineales, se encuentran en un círculo.
EJERCICIO 3.29. Demostrar que hay un número infinito de primos. EJERCICIO 3.30. Parak=0,1,2, dejaP_{k} ser el conjunto de números primos que son congruentes conk \bmod 3. Por el Ejercicio 3.29,P_{0} \cup P_{1} \cup P_{2} es infinito. ¿Se puede decir cuáles de los conjuntosP_{0}, P_{1} yP_{2} son infinitos?
(Comentario: Para dos de los tres conjuntos, este problema no es demasiado difícil. Para el tercero, es sumamente difícil, y es un caso especial de un célebre teorema de Dirichlet. Vere . g. [8] para un tratamiento del teorema de Dirichlet.)
EJERCICIO 3.31. Deja que los puntos en\mathbb{R}^{2} sean de color rojo, verde y azul. Demostrar que o bien hay dos puntos del mismo color a una distancia 1 de distancia, o bien hay un triángulo equilátero de longitud lateral\sqrt{3} todos cuyos vértices son del mismo color.
EJERCICIO 3.32. Demostrar quee=\sum_{n=0}^{\infty} \frac{1}{n !} es irracional. (Pista: Argumenta por contradicción. Asumire=\frac{p}{q} y multiplicar ambos lados porq ! Reorganizar la ecuación para obtener un entero igual a una suma infinita de números racionales que converge a un número en(0,1).)
(1)
5-2 \sqrt{-2}
\sqrt{5}-\sqrt{-2}
4=\sqrt{2}+\frac{}{}
4+\frac{2}{4}
\sqrt{4-2}+\frac{12}{}
4
\operatorname{sins}^{-2}+\frac{2}{}
1 |
(2.7
\sqrt{2-25}+
(2)
(2.7
(2
4=\sqrt{2}+
\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}
(2.7
4
(2020
(2
2
2
(
r.
a2+2
\sqrt{2-2 \cdot 2 \cdot
(
(
(\sqrt{2}+2
(
4
(200
(2-2
(
\mathrm{~ r e s ~ a ~}
(2-2=
(2)
4
(2+2)
4
4
(1)
CAPÍTULO 4
Principio de Inducción
Ordenamientos de bienestar
En este capítulo discutimos el principio de inducción matemática. Tenga en cuenta que la palabra inducción tiene un significado diferente en matemáticas que en el resto de la ciencia. El principio de inducción matemática depende de la estructura de orden de los números naturales, y nos da una técnica poderosa para probar afirmaciones matemáticas universales.
DEFINICIÓN. Bien ordenado LetX ser un conjunto, y\preceq un orden lineal enX. Decimos queX está bien ordenado con respecto a\preceq (o\preceq es un wellordering deX) si cada subconjunto no vacío deX tiene un elemento mínimo con respecto a\preceq. Es decir, para cualquier subconjunto no vacíoY deX(\exists a \in Y)(\forall y \in Y) a \preceq y . En general, los ordenamientos lineales no necesitan ser ordenamientos bien. El ordenamiento correcto es una propiedad universal: un conjuntoX con un orden\preceq está bien ordenado si cada subconjunto no vacío deX tiene un elemento mínimo con respecto a\preceq. Si hay algún subconjunto no vacío que no tenga un elemento mínimo, entonces\preceq no se ordena bienX.
EJEMPLO 4.1. \mathbb{Z}no está bien ordenado por\leq. Los enteros no tienen un elemento mínimo, lo que basta para demostrar que no\mathbb{Z} está bien ordenado por\leq.
EJEMPLO 4.2. VamosX=\{x \in \mathbb{R} \mid x \geq 2\}. Let\leq be the usual order on\mathbb{R} . X is linealmente ordenado por\leq, pero noX es bien ordenado por\leq. En este ejemplo,X tiene un elemento mínimo, pero cualquier intervalo abierto contenido en noX podrá tener un elemento mínimo. Las propiedades clave del orden\mathbb{N} son que está bien ordenado y cada elemento de\mathbb{N}, excepto 0, es el sucesor de un número natural:
PRINCIPIO DE BIENESTAR PARA LOS NUMEROS NATURALES: El conjunto\mathbb{N} está bien ordenado\leq
PROPIEDAD SUCESORA PARA LOS NÚMEROS NATURALES: Sin \in \mathbb{N} yn \neq 0, entonces haym \in \mathbb{N} tal quen=m+1.
Si uno acepta una comprensión intuitiva de los números naturales, estos principios son más o menos obvios. En efecto, dejemosY ser cualquier subconjunto no vacío de\mathbb{N}. Como no está vacío, hay algunosm adentroY. Ahora, considere cada uno de los números0,1,2, \ldots, m finitamente muchos a su vez. Si0 \in Y, entonces 0 es el elemento menor. Si 0 no está enY, proceda a 1. Si esto está enY, debe ser el elemento menor; de lo contrario proceder a 2. Continúa de esta manera, y encontrarás algún número menor o igual quem ese es el menor elemento deY.
Este argumento, aunque convincente, sí se basa en el hecho de que tenemos una idea de lo que\mathbb{N} “es”. Si queremos definir\mathbb{N} en términos de operaciones de conjunto, como hacemos en el Capítulo 8, esencialmente tenemos que incluir como axioma el principio bien ordenado para los números naturales.
Principio de Inducción
Comenzamos por probar un teorema que es equivalente al principio de inducción.
TEOREMA 4.3. Si
(1)X \subseteq \mathbb{N}
(2)0 \in X
(3)(\forall n \in \mathbb{N}) n \in X \Rightarrow(n+1) \in X,
luegoX=\mathbb{N} Discusión. Discutiremos por contradicción. Eso lo asumimosX \neq \mathbb{N}. QueY sea el complemento deX in\mathbb{N}. Dado que noY está vacío, tendrá un elemento mínimo. La tercera hipótesis del teorema no permitirá un elemento mínimo enY, que no sea 0, y esto es imposible por la segunda hipótesis. Por lo tanto,Y es necesariamente vacío.
Comprobante. VamosX a satisfacer las hipótesis del teorema. Y=\mathbb{N} \backslash X .Dejemos Supongamos que noY está vacío. Ya queY \subseteq \mathbb{N}, Y está bien ordenado por\leq. Dejara \in Y ser el menor elemento deY. Observamos que noa es 0, ya que0 \in X. Por lo tantoa \geq 1 y es un sucesor, asía-1 es en\mathbb{N} y no enY. De ahía-1 está enX. Pero luego por hipótesis (3) del teorema,a-1+1 \in X. Esto es una contradicción, por lo tantoY está vacío yX=\mathbb{N}.
OBSERVACIÓN. Ocasionalmente incluiremos discusiones informales etiquetadas en nuestras pruebas para guiarte en tu lectura. Esta no es una práctica habitual. No debe incluir tales discusiones en sus pruebas a menos que su instructor lo solicite.
El teorema4.3 se aplica más fácilmente en la siguiente forma.
COROLARIO 4.4. Principio de inducción DejarP(x) ser una fórmula en una variable. Si
(1)P(0)
(2)(\forall x \in \mathbb{N}) P(x) \Rightarrow P(x+1),
después(\forall x \in \mathbb{N}) P(x) . Prueba. Que\chi_{P}=\{x \in \mathbb{N} \mid P(x)\} . Deseemos demostrar eso\chi_{P}=\mathbb{N}. Por suposición (1),P(0), entonces0 \in \chi_{P}. Asumir eson \in \chi_{P}. EntoncesP(n). Por suposición (2)P(n) \Rightarrow P(n+1) . Por lo tantoP(n+1) yn+1 \in \chi_{P}. Ya quen es arbitrario,(\forall n \in \mathbb{N}) n \in \chi_{P} \Rightarrow n+1 \in \chi_{P} . Por Teorema 4.3,\chi_{P}=\mathbb{N} y(\forall x \in \mathbb{N}) P(x) Supongamos que se desea demostrar que una fórmulaP(x) sostiene para todos los números naturales. Al argumentar por inducción, el autor debe demostrar que las hipótesis para el teorema están satisfechas. Por lo general, el autor primero lo demuestraP(0). A esto se le llama el caso base de la prueba por inducción. Muy a menudo es una conclusión fácil, incluso trivial. No obstante, es necesario probar un caso base para poder argumentar por inducción (¿se puede demostrar esto?). Habiendo probado el caso base, el autor probará entonces la segunda hipótesis, a saber, que la afirmación de ser cierta para un número natural arbitrario implica que es cierto en el sucesor de ese número natural. Este es el paso de inducción. El paso de inducción requiere probar una declaración condicional, que a menudo se prueba directamente. Es importante entender que el autor no está alegando queP sostiene en un número natural arbitrario, de lo contrario el argumento sería circular e inválido. Más bien, el autor demostrará que si el resultado fuera cierto en un número natural arbitrario, entonces sería cierto para el número natural posterior. El supuesto que seP sostiene en un número natural fijo y arbitrario se denomina hipótesis de inducción. Si el autor prueba con éxito el caso base y el paso de inducción, entonces4.4 se satisfacen los supuestos de Corolario, yP mantiene en todos los números naturales.
Proposición 4.5. VamosN \in \mathbb{N}. Después\sum_{n=0}^{N} n=\frac{N(N+1)}{2} . Discusión. Este es un buen primer ejemplo de una prueba por inducción. El argumento es una aplicación directa de la técnica y el resultado es de interés histórico y práctico. Argumentamos por inducción en el índice superior de la suma. Es decir, la fórmula que estamos demostrando para todos los números naturales esP(x): \sum_{n=0}^{x} n=\frac{x(x+1)}{2} . Es importante identificar la cantidad sobre la que se está aplicando el principio de inducción, pero algunos autores que están escribiendo un argumento para lectores que están familiarizados con la inducción pueden no declarar explícitamente la fórmula.
Demostramos un caso baseN=0,, que corresponde a la suma con el término único 0. Luego argumentamos el paso de inducción. Este es nuestro primer argumento utilizando el principio de inducción. Preste mucha atención a la estructura de esta prueba. Debes esforzarte por seguir las convenciones de pruebas por inducción que establecemos en este libro.
Comprobante. Caso base:N=0.
Discusión. Tenga en cuenta que el caso base es la declaraciónP(0).
Ya que\sum_{n=0}^{0} n=0=\frac{(0)(1)}{2},P(0) sostiene.
Paso de inducción:
Discusión. Demostramos la afirmación universal(\forall x \in \mathbb{N}) P(x) \Rightarrow P(x+1) . demostrando que para un número natural arbitrarioNP(N) \Rightarrow P(N+1) . Así reducimos probar una declaración universal a probar una declaración condicional abstracta. Demostramos directamente la declaración condicional resultante. Es decir, asumimosP(N) y derivamosP(N+1). Le recordamos al lector que no estamos reclamando que el resultado se mantenga enN - es decir, no reclamamosP(N). Más bien, estamos demostrando la afirmación condicional asumiendo el antecedente, la hipótesis de inducción y derivando la consecuencia. Si no usas la hipótesis de inducción, no estás discutiendo por inducción. Desde luego, en el cuerpo del argumento esto es transparente, sin referencia a los principios lógicos subyacentes.
VamosN \in \mathbb{N} y supongamos que\sum_{n=0}^{N} n=\frac{N(N+1)}{2} . Entonces\ [\ begin {alineado} \ sum_ {n=0} ^ {N+1} n &=\ left (\ sum_ {n=0} ^ {N} n\ derecha) +N+1\\ &= {} _ {I H}\ frac {N (N+1)} {2} +N+1 \ end {alineado}\] por la hipótesis de inducción.
Discusión. Es un buen hábito, y una consideración para tu lector, identificar cuándo estás invocando la hipótesis de inducción. Utilizaremos el subíndice{ }_{I H} para indicar dónde invocamos la hipótesis de inducción.
Entonces\ [\ comenzar {alineado} \ sum_ {n=0} ^ {N+1} n &=\ frac {N (N+1)} {2} +N+1\\ &=\ frac {N (N+1)} {2} +\ frac {2 N+2} {2}\\ &=\ frac {N^ {2} +3 N+2} {2}\\ &= frac ac {(N+1) ((N+1) +1)} {2}. \ end {aligned}\] Por lo tanto,(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) . Por el principio de inducción, la proposición sigue.
Proposición 4.6. VamosN \in \mathbb{N}. Después\sum_{n=0}^{N} n^{2}=\frac{N(N+1)(2 N+1)}{6} . Prueba. La aseveraciónP(N) es que la ecuación (4.7) sostiene. El caso base,N=0, es obvio: Paso\sum_{n=0}^{0} n^{2}=\frac{0(0+1)(2 \cdot 0+1)}{6} . de inducción:
Supongamos queN \in \mathbb{N} y\sum_{n=0}^{N} n^{2}=\frac{N(N+1)(2 N+1)}{6} demostramos que\sum_{n=0}^{N+1} n^{2}=\frac{(N+1)(N+2)(2 N+3)}{6} Efectivamente\ [ \ begin {alineado}\ sum_ {n=0} ^ {N+1} n^ {2} &=\ left (\ sum_ {n=0} ^ {N} n^ {2}\ derecha) + (N+1) ^ {2}\\ &=I H\\ &=\ frac {N (N+1) (2 N+1)} {6} + (N+1) ^ {2}. \\ &=\ frac {N (N+1) (2 N+1)} {6} + (N+1) ^ {2}\\ &=\ frac {2 N^ {3} +9 N^ {2} +13 N+6} {6}\\ &\ frac {(N+1) (N+2) (2 (N+1) +1)} {6}. \ end {aligned}\] La proposición se desprende del principio de inducción.
Discusión. La prueba de la Proposición4.6 es muy similar a la prueba de la Proposición 4.5. Es posible que desee confirmar las identidades algebraicas en la última parte de la prueba, ya que no son obvias. Se incluye solo el detalle suficiente para guiarlo a través de la prueba de la implicación. El autor de una prueba por inducción asumirá que te sientes cómodo con la técnica, y con ello puede proporcionar menos detalles de los que te gusta.
OBSERVACIÓN. Hay más en las Proposiciones4.5 y4.6 que solo las pruebas. También están las fórmulas. En efecto, un uso de la inducción es que si adivina una fórmula, puede usar la inducción para demostrar que su fórmula es correcta. Ver Ejercicios4.12 y 4.16.
¿Por qué es necesario un caso base? Considera el siguiente argumento a favor de la falsa pretensión\sum_{n=0}^{N} n<\frac{N(N+1)}{2}. VamosN \in \mathbb{N} y supongamosP(N), dondeP(N) esta la sentencia\sum_{n=0}^{N} n<\frac{N(N+1)}{2} . Entonces\ [\ begin {alineada} \ suma_ {n=0} ^ {N+1} n &=\ left (\ sum_ {n=0} ^ {N} n\ derecha) +N+1\\ <_ {I H} &\ frac {N (N+1)} {2} +N+1\\ &=\ frac {N^ {2} +3} {2}\ \ &=\ frac {(N+1) ((N+1) +1)} {2}. \ end {aligned}\] De ahí, por(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) . supuesto que la desigualdadP(N) se demuestra fácilmente como falsa. ¿Qué salió mal? Sin un caso base, probar no(\forall N \in \mathbb{N}) P(N) \Rightarrow P(N+1) es suficiente para probar(\forall N \in \mathbb{N}) P(N). SiP(0) fuera verdad, entoncesP(1) sería verdad, y siP(1) fuera verdad, entonces loP(2) sería, y así sucesivamente. En efecto, si somos capaces de probarP(N) para algunoN \in \mathbb{N}, entonces sabemosP(M) por cualquier número naturalM>N. Pero la secuencia de declaraciones\langle P(0), P(1), P(2), \ldots\rangle nunca se inicia. P(N)falla para todosN.
Otra forma de pensar en la inducción es en términos de garantías. Supongamos que decide comprar un auto. Primero vas a Honest Bob's Bob garantiza que cualquier auto que venda irá por lo menos a una milla. Se compra un auto, lo sacas del lote, y después de 3 millas se descompone y no se puede arreglar. Regresas con enojo, pero Bob no te devolverá tu dinero porque el auto estuvo a la altura de la garantía.
Entonces cruzas la carretera hacia Honest John's John garantiza que si te vende un auto, una vez que arranca nunca se detendrá. Esto suena bastante bien, así que compras un auto, pones las llaves en el encendido, y... nada. El auto no arranca. John tampoco te devolverá tu dinero, porque el auto no dejó de hacer lo que reclamó.
Sentirse desesperado, terminas en Honest Stewart's Los autos de Stewart vienen con dos garantías:
(1) El auto arrancará y recorrerá al menos una milla.
(2) No importa qué tan lejos haya ido el auto, siempre se puede conducir una milla extra.
Piensas esto de nuevo, y finalmente decides que el auto irá para siempre. Lo mejor de todo es que el arrendamiento es de solo\$ 1 un mes por los dos primeros meses. Firmas el contrato de arrendamiento y conduces a casa bastante satisfecho contigo mismo. { }^{1}
Hay muchas generalizaciones útiles del principio de inducción. El primero que discutimos se llama inducción fuerte. Se llama así porque la hipótesis de inducción es más fuerte que la hipótesis de inducción en la inducción estándar, y por lo tanto el paso de inducción a veces es más fácil de probar en un argumento por inducción fuerte.
COROLARIO 4.8. Inducción fuerte DejaP(x) que sea una fórmula tal que
{ }^{1}Tienes razón en que el Principio de Inducción garantiza que tu auto conducirá para siempre. No obstante, como señala tu madre cuando le muestras el contrato de arrendamiento, después de los dos primeros meses tu pago cada mes es la suma de tus pagos en los dos meses anteriores. ¿Cuánto vas a pagar después de 5 años? (1)P(0)
(2) Para cada unon \in \mathbb{N},[(\forall x<n) P(x)] \Rightarrow[P(n)] entonces(\forall x \in \mathbb{N}) P(x) Intuitivamente esto no es muy diferente de la inducción básica. Empiezas en un caso base, y una vez iniciado puedes continuar por el resto de los números naturales. La distinción está justo en el número de suposiciones que usas al momento de probar algo por fuerte inducción. En la práctica, da la ventaja de que en el paso de inducción se puede reducir casoN a cualquier caso anterior, en lugar del caso inmediatamente anterior,N-1. En particular, esto simplifica los argumentos sobre la divisibilidad y los enteros.
Discusión. Reducimos el principio de inducción fuerte al principio de inducción. Esto lo logramos introduciendo una fórmulaQ(x), que dice: “P (y) es cierto para todosy<x ". La inducción fuerteP(x) es equivalente a la inducción básica enQ(x) .
PRUEBA. Supongamos queP(x) satisface las hipótesis del corolario. QueQ(x) sea la fórmula(\forall y \leq x) P(y) dondey está el universo de\mathbb{N}. EntoncesQ(0) \equiv P(0), así es cierto. VamosN \in \mathbb{N},N \geq 1, y asumirQ(N). Entonces(\forall y \leq N) P(y) y por lo tantoP(N+1). De ahí(\forall n \leq N+1) P(y) y asíQ(N+1). Por lo tanto(\forall x \in \mathbb{N}) Q(x) \Rightarrow Q(x+1) Por el principio de inducción,(\forall x \in \mathbb{N}) Q(x) . Sin embargo, para cualquierN \in \mathbb{N}, Q(N) \Rightarrow P(N), por lo que la inducción(\forall x \in \mathbb{N}) P(x) . Fuerte es particularmente útil a la hora de probar afirmaciones sobre división. Hay ejemplos de la técnica a lo largo del Capítulo 7. Los resultados en el Capítulo 7 no requieren el Capítulo 5 y el Capítulo 6, por lo que fácilmente puede saltarse adelante. Véase por ejemplo la Sección 7.1, donde se prueba el Teorema Fundamental de Aritemética mediante inducción fuerte. La inducción no tiene que comenzar en 0, ni siquiera en un número natural.
Corolario 4.9. Dejark \in \mathbb{Z}, yP(x) ser una fórmula en una variable tal que
(1)P(k)
(2)(\forall x \geq k) P(x) \Rightarrow P(x+1).
Después(\forall x \in \mathbb{Z}) x \geq k \Rightarrow P(x) Discusión. Esto se puede probar definiendo una nueva fórmula que se puede probar con inducción estándar. ¿Se puede definir la fórmula?
Polinomios
Ahora utilizamos la maquinaria desarrollada en Sección4.2 para emprender un modesto programa matemático. Como indicamos en el primer capítulo de este libro, la mayoría de ustedes, hasta ahora, han utilizado resultados matemáticos para resolver problemas en cómputos. Aquí nos interesa probar un resultado con el que te puede estar familiarizado.
Este resultado se refiere a polinomios con coeficientes reales (es decir, coeficientes que son números reales). Has pasado buena parte de tu vida matemática investigando polinomios, e indudablemente puedes hacer muchas afirmaciones interesantes y veraces sobre ellos. Pero, ¿qué tan seguro está de que estas afirmaciones son ciertas? Es posible que su creencia en estas afirmaciones sea, en general, mera confianza en las afirmaciones y creencias de expertos en la materia. En la práctica, se puede hacer peor que consentir las aseveraciones de los especialistas, y las limitaciones prácticas generalmente nos obligan a aceptar muchas afirmaciones sobre la fe. Por supuesto, esta práctica conlleva riesgos. Durante cientos de años, las aseveraciones de Aristóteles fueron ampliamente aceptadas, muchas veces a pesar de la evidencia empírica de lo contrario. Naturalmente, seguimos aceptando muchas afirmaciones sobre la fe. En el caso de la ciencia moderna, generalmente no tenemos acceso de primera mano a la evidencia primaria en la que se basan las teorías científicas modernas. Las matemáticas son diferentes de cualquier otro campo del esfuerzo intelectual porque tienes la oportunidad de verificar prácticamente cada reclamo matemático que encuentres. Ahora estás en el punto de tu carrera matemática en el que puedes confirmar directamente los resultados matemáticos.
El teorema que deseamos probar es que el número de raíces reales de un polinomio real es a lo sumo el grado del polinomio. Es posible que esté familiarizado con esta afirmación, pero no esté seguro de por qué se sostiene. Este resultado es interesante, en parte, porque garantiza que la gráfica de un polinomio cruzará cualquier línea horizontal solo finitamente muchas veces. Dicho de otra manera, los conjuntos de niveles de polinomios no pueden tener más elementos que el grado del polinomio.
Notación. \mathbb{R}[x] \mathbb{R}[x]es el conjunto de polinomios con coeficientes reales en la variablex.
TEOREMA 4.10. DejarN \in \mathbb{N} yp \in \mathbb{R}[x] tener gradoN \geq 1. Entoncesp tiene a lo sumo raícesN reales.
Discusión. Este resultado es lo suficientemente difícil como para que tengamos que probar tres resultados preliminares. Estos lemas{ }^{2} se prueban dentro del argumento a favor del teorema. A lo largo del argumento estaremos investigando un polinomio general,p, de gradoN.
{ }^{2}Un lema es un resultado auxiliar que se utiliza en la prueba de un teorema, algo así como una subrutina. En alemán, un teorema se llama “Satz” y un lema se llama “Hilfsatz”, un “teorema auxiliar”. Comprobante. Primero probamos que la propiedad distributiva generaliza a un número arbitrario de summands.
LEMA 4.11. DejarN \in \mathbb{N}^{+} y, para0 \leq n \leq N, a_{n} \in \mathbb{R}. Sic \in \mathbb{R}, entonces\sum_{n=0}^{N} c a_{n}=c\left(\sum_{n=0}^{N} a_{n}\right) . Discusión. Este resultado generaliza la propiedad distributiva a más de dos summands. Estamos asumiendo la propiedad distributiva de los números reales: paraa, b, c \in \mathbb{R},c \cdot(a+b)=c a+c b Probamos el lema por inducción. Es sorprendente que una afirmación que parece tan obvia utilice la poderosa maquinaria de inducción. Pero recuerden que estamos demostrando esto por todas las sumas finitas de arbitrariamente muchos summands. Por supuesto, puede sentir que el lema es del todo obvio. Si es así, deberías intentar producir tu propia prueba, o leer esta para practicar en inducción matemática en un contexto donde el contenido matemático sea fácil.
Argumentaremos por inducción sobre el número de términos en la suma. El caso base es para sumas con dos summands - esto es solo la propiedad distributiva. En el paso de inducción probamos el resultado condicional que si el lema tiene para todas las sumas conN términos, entonces se mantiene para todas las sumas conN+1 términos. En cada paso del argumento (pasos base e inducción) estamos argumentando por infinitamente muchas afirmaciones concretas argumentando a favor de una sola afirmación abstracta.
Comprobante. Argumentamos por inducción sobreN.
Estuche base:N=1 Letc, a_{0}, a_{1} \in \mathbb{R}. Por la propiedad distributiva,\ [\ begin {aligned} \ sum_ {n=0} ^ {1} c a_ {n} &=c a_ {0} +c a_ {1}\\ &=c\ left (a_ {0} +a_ {1}\ right)\\ &=c\ left (\ sum_ {n=0} ^ {1} a_ {n}\ derecha). \ end {aligned}\] Paso de inducción:
Dejarc \in \mathbb{R} ya_{n} \in \mathbb{R}, para0 \leq n \leq N+1. \sum_{n=0}^{N} c a_{n}=c\left(\sum_{n=0}^{N} a_{n}\right) .Suponemos que tenemos\ [\ begin {alineado} \ sum_ {n=0} ^ {N+1} c a_ {n} &=\ left (\ sum_ {n=0} ^ {N} c a_ {n}\ derecha) +c a_ {N+1}\\ &= {} _ {I H}\ quad c\ left (\ sum_ {n=0} ^ {N} a_ {n} a_ {n}\ derecha) +c a_ {N+1} \ end {alineado}\] Por la ley distributiva (para dos summands)\ [\ begin { alineado} c\ izquierda (\ suma_ {n=0} ^ {N} a_ {n}\ derecha) +c a_ {N+1} &=c\ izquierda (\ suma_ {n=0} ^ {N} a_ {n} +a_ {N+1}\ derecha)\\ &=c\ izquierda (\ suma_ {n=0} ^ {N+1} a_ {n}\ derecha). \ end {aligned}\] Por lo tanto,\sum_{n=0}^{N+1} c a_{n}=c\left(\sum_{n=0}^{N+1} a_{n}\right) . por el principio de inducción el resultado se mantiene para todosN \in \mathbb{N}. LEMA 4.12. Six, y \in \mathbb{R} yn \in \mathbb{N}^{+}, entonces\ [\ comenzar {alineado} x^ {n} -y^ {n} & =( x-y)\ izquierda (x^ {n-1} +x^ {n-2} y+\ cdots+x y^ {n-2} +y^ {n-1}\ derecha)\\ & =( x-y)\ izquierda (\ sum_ {\ subestack {i, j\ en\ matemáticas bb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ derecha). \ end {alineado}\] Discusión. La notación en la última línea del lema significa que la suma se toma sobre todos los números naturalesi yj que tienen la propiedad quei+j=n-1.
PRUEBA. Por Lema 4.11,\ [\ begin {alineado} (x-y)\ left (\ sum_ {\ subestack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ derecha) &=x\ izquierda (\ sum_ {\ subestack {i, j\ in\ mathbb {N}\ i+j=n= -1}} x^ {i} y^ {j}\ derecha) -y\ izquierda (\ sum_ {\ suback {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j}\ derecha)\\ &=\ sum_ {\ substack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i+1} y^ {j} -\ sum_ {\ substack {i, j\ in\ mathbb {N}\\ i+j=n-1}} x^ {i} y^ {j+1}\\ &=x^ {n} -y^ {n}. \ end {aligned}\] El siguiente lema asocia raíces de polinomios y factores lineales.
LEMA 4.13. Dejarp ser un polinomio de gradoN. Un número real,c, es una raíz dep iffp(x)=(x-c) q(x), dondeq(x) es un polinomio de gradoN-1.
Discusión. Este lema es una declaración bicondicional. Es decir, el lema es proposicionalmente equivalente a la conjunción de dos declaraciones condicionales. Demostramos las declaraciones condicionales de forma independiente. Una de las declaraciones condicionales es obvia (¿puedes determinar cuál?). La declaración condicional más difícil utilizará Lemma 4.12. Al probar un bicondicional,P \Longleftrightarrow Q, al probar las declaraciones condicionalesP \Rightarrow Q yQ \Rightarrow P, a menudo usamos(\Rightarrow) y(\Leftarrow) para identificar la declaración condicional bajo consideración. Comprobante. Dejarp ser un polinomio de gradoN. Luego haya_{0}, a_{1}, \ldots, a_{N} \in\mathbb{R}, a_{N} \neq 0, tal que,p(x)=\sum_{n=0}^{N} a_{n} x^{n} . (\Leftarrow) Supongamos que hayc \in \mathbb{R} y un polinomioq de gradoN-1 tal quep(x)=(x-c) q(x) . Entonces p(c)=(c-c) q(c)=0 .Entoncesc es una raíz dep.
(\Rightarrow)Dejarc \in \mathbb{R} ser una raíz dep. Entonces\ [\ begin {alineado} p (x) &=p (x) -p (c)\\ &=a_ {0} -a_ {0} +\ suma_ {n=1} ^ {N} a_ {n}\ izquierda (x^ {n} -c^ {n}\ derecha)\\ &=\ suma_ {n=1} ^ {N} a_ {n}\ izquierda (x^ {n} -c^ {n}\ derecha). \ end {alineado}\] Por Lema 4.12, paran \geq 1,x^{n}-c^{n}=(x-c) q_{n}(x) dondeq_{n}(x)=x^{n-1}+c x^{n-2}+\cdots+c^{n-2} x+c^{n-1}=\sum_{\substack{i, j \in \mathbb{N} \\ i+j=n-1}} x^{i} c^{j} . Por Lema 4.11,p(x)=\sum_{n=1}^{N} a_{n}\left(x^{n}-c^{n}\right)=(x-c) \sum_{n=1}^{N} a_{n} q_{n}(x) . Letq(x)=\sum_{n=1}^{N} a_{n} q_{n}(x) . Para todosn entre 1 yN, q_{n}(x) tiene grado(n-1). Entonces el grado deq(x) es menor queN. Sin embargo el coeficiente dex^{N-1} inq(x) esa_{N}, ya_{N} \neq 0 por suposición. Entonces el grado deq(x) esN-1, yp(x)=(x-c) q(x) . completamos la prueba del teorema. Dejarp ser un polinomio de gradoN. Argumentamos por inducción sobre el grado dep.
Caso base:N=1.
Sip es un polinomio de grado 1, entonces es de la formap(x)=a_{1} x+a_{0}, y la única raíz es-a_{0} / a_{1}.
Paso de inducción:
Supongamos que el teorema se sostiene paraN \in \mathbb{N}^{+}. Dejarp tener gradoN+1. Si nop tiene raíces, el teorema se sostiene parap. Entonces supongamos quep tiene una raíz real,c \in \mathbb{R}. Por Lemma4.13,p(x)=(x-c) q(x), dondeq es de gradoN. Por la hipótesis de inducción,q tiene a lo sumo raícesN reales. Six es una raíz dep, entonces por (4.14) o bienx es una raíz deq ox=c. Por lo tantop tiene como máximoN+1 raíces, demostrando el paso de inducción.
Como función, un polinomio en una variable particular es lo mismo que un polinomio con los mismos coeficientes en una variable diferente. Dejarp \in \mathbb{R}[x] serp(x)=\sum_{n=0}^{N} a_{n} x^{n}, yq \in \mathbb{R}[y] serq(y)=\sum_{n=0}^{N} a_{n} y^{n} . Entonces como funciones realesp yq son la misma función. Es decir,\operatorname{graph}(p)=\operatorname{graph}(q) . como objetos algebraicos, sin embargo, ocasionalmente se podría desear distinguir entre polinomios en distintas variables.
Terminamos esta sección demostrando que los polinomios son iguales como funciones si y sólo si tienen los mismos coeficientes.
COROLARIO 4.15. Vamosp, q \in \mathbb{R}[x]. Los coeficientes dep yq son iguales iff(\forall x \in \mathbb{R}) \quad p(x)=q(x) . Prueba. (\Rightarrow)Si los coeficientes dep yq son todos iguales, entonces, dejandoa_{n} denotar eln^{\text {th }} coeficiente, tenemos(\forall x \in \mathbb{R}) p(x)=\sum_{n=0}^{N} a_{n} x^{n}=q(x) . (\Leftarrow) Supongamos(\forall x \in \mathbb{R}) p(x)=q(x). Entoncesp-q es un polinomio con infinitamente muchas raíces. Sip y enq desacuerdo sobre algún coeficiente, entoncesp-q es un polinomio distinto de cero, tiene un grado, y por Teorema 4.10, finitamente muchas raíces. Por lo tanto,p yq deben acordar todos los coeficientes.
Desigualdad aritmética-geométrica
Se han presentado modestas generalizaciones de inducción matemática básica (Corolario4.8 y Corolario 4.9). La formalidad de nuestro enfoque podría sugerir que la inducción es una técnica rígida que debe aplicarse de manera inflexible de manera prescriptiva específica. A un matemático la inducción se rige por dos ideas:
(1) La inducción utiliza el ordenamiento bien de los números naturales, o más generalmente cualquier conjunto bien ordenado, para probar declaraciones universales cuantificadas sobre el conjunto.
(2) Cada elemento del conjunto sobre el que cuantifique debe ser contabilizado por la inducción.
Las caracterizaciones formales de inducción en Sección4.2 son suficientes pero no necesarias para lograr los objetivos de una prueba por inducción. El teorema de esta sección te dará un sentido sobre cómo se puede extender la técnica de inducción. DEFINICIÓN. Media aritmética Leta_{1}, \ldots, a_{N} Ser números reales. La media aritmética dea_{1}, \ldots, a_{N} es\frac{1}{N}\left(\sum_{n=1}^{N} a_{n}\right) . Definición. Media geométrica Leta_{1}, \ldots, a_{N} be números reales positivos. La media geométrica dea_{1}, \ldots, a_{N} es\sqrt[N]{a_{1} \cdots a_{N}} . TEOREMA 4.16. Desigualdad media aritmética-geométrica Leta_{1}, \ldots, a_{N} \in\mathbb{R}^{+}. Después\sqrt[N]{a_{1} \cdots a_{n}} \leq \frac{1}{N}\left(\sum_{n=1}^{N} a_{n}\right) . Discusión. Esto lo demostramos con un argumento interesante debido originalmente a Cauchy; nuestro tratamiento es del libro [1]. Argumentamos por inducción sobre el tamaño de la muestra sobre la cual estamos calculando las medias. Después de argumentar el caso base mostramos que si la desigualdad se mantiene para las medias aritméticas y geométricas deN los números, necesariamente se sostiene para las medias de2 N los números. Esto implica que el teorema se sostiene para las medias de2^{N} números para cualquierN \in \mathbb{N} (por un argumento de inducción estándar).
Luego mostramos que el resultado que se mantiene paraN los números implica que se mantiene paraN-1 los números. Esto implica que si el resultado se mantiene en un número naturalN, la desigualdad se mantiene para todos los medios de menos deN números. Dado cualquierak \in \mathbb{N}, 2^{k}>k y dado que el teorema se sostiene para medias de2^{k} números, se sostiene para medios dek términos.
Comprobante. Argumentamos por inducción sobre el número de términos en cada lado de la desigualdad.
Caso base:(N=2)
Vamosa_{1}, a_{2} \in \mathbb{R}^{+}. Entonces\left(a_{1}-a_{2}\right)^{2}=a_{1}^{2}-2 a_{1} a_{2}+a_{2}^{2} \geq 0 . Por lo tanto2 a_{1} a_{2} \leq a_{1}^{2}+a_{2}^{2}, y\ [\ comienzan {alineados} 4 a_ {1} a_ {2} &\ leq a_ {1} ^ {2} +2 a_ {1} a_ {2} +a_ {2} ^ {2}\\ &=\ izquierda (a_ {1} +a_ {2}\ derecha) ^ {2}. \ end {alineado}\] Así2 \sqrt{a_{1} a_{2}} \leq a_{1}+a_{2} . pues la desigualdad se mantiene por dos términos.
Paso de inducción:
P(N)Sea la afirmación que (4.17) sostiene para todosa_{1}, \ldots, a_{N}>0. Eso lo demostramosP(N) \Rightarrow P(2 N). VamosG_{N}=\prod_{n=1}^{N} a_{n} yA_{N}=\left(\frac{\sum_{n=1}^{N} a_{n}}{N}\right) . Así\ [\ comenzar {alineado} G_ {2 N} &=\ prod_ {n=1} ^ {2 N} a_ {n}\\ &=\ izquierda (\ prod_ {n=1} ^ {N} a_ {n}\ derecha)\ izquierda (\ prod_ {n=n+1} ^ {2 N} a_ {n}\ derecha)\\ &\ leq_ {I H}\ izquierda (\ suma_ {n=1} ^ {N}\ frac {a_ {n}} {N}\ derecha) ^ {N}\ izquierda (\ suma_ {n=n+1} ^ {2 N}\ frac {a_ {n}} {N}\ derecha) ^ {N} \ end {alineado}\] DejarB=\sum_{n=N+1}^{2 N} \frac{a_{n}}{N} . Por el caso base\ [\ comenzar {alineado} A_ {N} B &\ leq\ izquierda (\ frac {A_ {N} +B} {2}\ derecha) ^ {2}\ &=\ izquierda (A_ {2 N}\ derecha) ^ {2} \ fin {alineado}\] Así que\ [\ comenzar {alineado} \ izquierda (A_ {N}\ derecha) ^ {N} B^ {N} & ; =\ left (A_ {N} B\ right) ^ {N}\\ &\ leq\ left (\ left (A_ {2 N}\ right) ^ {2}\ right) ^ {N}\\ &=\ left (A_ {2 N}\ right) ^ {2 N} \ end {alineado}\] AsíG_{2 N} \leq\left(A_{2 N}\right)^{2 N} . pues, para cualquierN \in \mathbb{N}^{+},P(N) \Rightarrow P(2 N) . Discusión. Q(N)Déjese ser la declaraciónP\left(2^{N}\right). Entonces el argumento hasta el momento es una prueba estándar por inducción de\left(\forall N \in \mathbb{N}^{+}\right) Q(N). Por supuesto que queremos mostrar(\forall N \in \mathbb{N}) P(N). Esto lo hacemos demostrando\left(\forall N \in \mathbb{N}^{+}\right) P(N+1) \Rightarrow P(N) . LetN>2. Demostramos queP(N+1) \Rightarrow P(N) . AsumirP(N+1). Después\left(G_{N}\right)\left(A_{N}\right) \leq\left(\frac{\left(\sum_{n=1}^{N} a_{n}\right)+A_{N}}{N+1}\right)^{N+1} . Discusión. Recordemos queG_{N} es producto dea_{1}, \ldots, a_{N}. Estamos tratando la sumaA_{N} como elN+1^{\text {st }} factor,a_{N+1}, y aplicando la desigualdadP(N+1).
Como\ [\ comenzar {alineado} \ izquierda (\ frac {\ izquierda (\ suma_ {n=1} ^ {N} a_ {n}\ derecha) +A_ {N}} {N+1}\ derecha) ^ {N+1} &=\ izquierda (\ frac {N A_ {N} +A_ {N}} {N+1}\ derecha) ^ {N+1}\\ derecha) ^ {N+1}\ \\ left (A_ {N}\ right) ^ {N+1} \ end {alineado}\] La desigualdad4.18 daG_{N} A_{N} \leq A_{N}^{N+1} y asíG_{N} \leq\left(A_{N}\right)^{N} que es la declaraciónP(N). Entonces, de\left(\forall N \in \mathbb{N}^{+}\right) P(N+1) \Rightarrow P(N) . ahí para todosN \geq 2, P(N).
La media aritmética y la media geométrica son diferentes formas de entender los promedios. Se relacionan por la desigualdad aritmética de la media geométrica (llamada desigualdad AGM). ¿Podemos aplicar la desigualdad? Consideremos una fácil aplicación geométrica del estucheN=2. Considera el rectángulo con lados de largoa yb. El perímetro del rectángulo esP=2 a+2 b y el área esA=a b .
En cálculo se demostró que el rectángulo de perímetro fijo con mayor área es el cuadrado. Esto también se puede probar directamente a partir de la desigualdad AGM:\ [\ begin {aligned} P &=2 a+2 b\\ &=\ frac {4 a+4 b} {2}\\ &\ geq\ sqrt {16 a b}\\ &=4\ sqrt {a b}. \ end {aligned}\] Así\frac{P^{2}}{16} \geq a b=A . Recordemos queP es fijo, y por lo tanto así es\frac{P^{2}}{16}, y hemos demostrado que este es un límite superior para el área del rectángulo.
¿Se logra este límite superior? El áreaA del rectángulo varía según las dimensiones del rectángulo y sia=b\frac{P^{2}}{16}=\frac{(4 a)^{2}}{16}=A . Así se logra el área máxima del rectángulo cuandoa=b. Este resultado puede generalizarse a dimensiones superiores, sin necesidad de cálculo multivariable.
Demostrar teoremas no es solo una cuestión de técnica, aunque esto debe dominarse. También requiere creatividad y perspicacia. Una hermosa colección de pruebas está contenida en el libro [1] de Martin Aigner y Günter Ziegler.
Ejercicios
EJERCICIO 4.1. Demostrar por inducción que 3 divide7^{n}-4 por cadan \in \mathbb{N}^{+}.
EJERCICIO 4.2. Probar por inducción que(\forall n \in \mathbb{N}) 2^{n}>n . EJERCICIO 4.3. Demostrar que cualquier subconjunto de un conjunto bien ordenado es soldado. EJERCICIO 4.4. (1+x)^{n} \geq 1+n xDemuéstralo para todosn \in \mathbb{N}^{+} y cada unox \in(-1, \infty).
EJERCICIO 4.5. Demuestre por inducción que cada conjunto finito de números reales tiene un elemento más grande.
EJERCICIO 4.6. DejarX yY ser conjuntos conn elementos cada uno. ¿Cuántas bijecciones deX aY hay? ¿Qué te dice esto sobre el número de permutaciones de\ulcorner n\urcorner? Demuestre su reclamo.
EJERCICIO 4.7. Los coeficientes binomiales se\left(\begin{array}{l}n \\ k\end{array}\right) pueden definir a partir del triángulo de Pascal por:
i)\forall n \in \mathbb{N},\left(\begin{array}{l}n \\ 0\end{array}\right)=\left(\begin{array}{l}n \\ n\end{array}\right)=1.
ii)\forall 2 \leq n \in \mathbb{N}, \forall 1 \leq k \leq n-1,\left(\begin{array}{l}n \\ k\end{array}\right)=\left(\begin{array}{c}n-1 \\ k\end{array}\right)+\left(\begin{array}{c}n-1 \\ k-1\end{array}\right).
Demostrar por inducción que\ [\ left (\ begin {array} {l} n\\ k \ end {array}\ right) =\ frac {n!} {(n-k)! k!} .\] EJERCICIO 4.8. Demostrar el teorema binomial: con\left(\begin{array}{l}n \\ k\end{array}\right) definido por el Ejercicio 4.7n \in \mathbb{N}, para cualquiera, la siguiente identidad mantiene\ [(x+y) ^ {n} =\ sum_ {k=0} ^ {n}\ left (\ begin {array} {l} n\\ k \ end {array}\ right) x^ {n-k} y^ {k}.\] EJERCICIO 4.9. Demostrar\sum_{k=0}^{n}\left(\begin{array}{l}n \\ k\end{array}\right)=2^{n}.
EJERCICIO 4.10. Demostrarn \in \mathbb{N}^{+}, para todos,\ [\ left (\ begin {array} {c} 2 n\\ n \ end {array}\ right)\ geq\ frac {2^ {2 n-1}} {\ sqrt {n}}\] EJERCICIO 4.11. El Principio de Descenso dice que no hay una secuencia infinita estrictamente decreciente de números naturales. Demostrar el Principio de Descenso.
EJERCICIO 4.12. Los números de Fibonacci se definen recursivamente porF_{1}=1, F_{2}=1, y paran \geq 3, F_{n}=F_{n-1}+F_{n-2}. Demostrar que los números de Fibonacci vienen dados por la ecuaciónF_{n}=\frac{(1+\sqrt{5})^{n}-(1-\sqrt{5})^{n}}{2^{n} \sqrt{5}} . Este es un ejemplo de una fórmula que es difícil de adivinar, pero fácil de verificar. Para una explicación de cómo surge la fórmula, ver Ejercicio 5.29.
EJERCICIO 4.13. QueX sea un conjunto bien ordenado por una relación\preceq. Decimos que una secuencia de elementos enX,\left\langle x_{n} \mid n \in \mathbb{N}\right\rangle, es estrictamente decreciente (con respecto a\preceq) si para todosm, n \in \mathbb{N}[m<n] \Rightarrow\left[x_{n} \preceq x_{m} \wedge x_{n} \neq x_{m}\right] . Probar que no hay una secuencia estrictamente decreciente de elementos enX.
EJERCICIO 4.14. Demostrar que el último dígito de7^{7} \underbrace{7} es 3 para cualquier torre de sietes de altura superior a 1.
EJERCICIO 4.15. Dar otro ejemplo que ilustre la necesidad de un caso base en una prueba válida por inducción.
EJERCICIO 4.16. Supongamos que hay un polinomio de grado 4 enN que da\sum_{n=0}^{N} n^{3}. Encuentra el polinomio y luego prueba que la fórmula es correcta por inducción.
Usa el método de Arquímedes para demostrar que
EJERCICIO 4.17. Dejar\mathbb{N}[x] ser el conjunto de polinomios con coeficientes numéricos naturales. Definir una relación\preceq\mathbb{N}[x] por:
Vamosp(x)=\sum_{n=0}^{N} a_{n} x^{n}, yq(x)=\sum_{n=0}^{M} b_{n} x^{n}. Decir quep \preceq q iff, sik es el coeficiente de grado más alto en el quep yq difieren, entoncesa_{k} \leq b_{k}. ¿Es\preceq un ordenamiento lineal? ¿Es un buen orden de\mathbb{N}[x]?
EJERCICIO 4.18. Supongamos que existe un polinomiop de grado 5 tal que\sum_{n=0}^{N} n^{4}=p(N) . Encuentrap y prueba que la fórmula que propones es correcta.
EJERCICIO 4.19. Determinar el conjunto de números naturales positivos den tal manera que la suma de cada número naturaln consecutivo sea divisible porn. EJERCICIO 4.20. Quef sea una función real tal que, parax, y \in \mathbb{R},f(x+y)=f(x)+f(y) . Demostrar que
a)f(0)=0
b)f(n)=n f(1).
EJERCICIO 4.21. Demostrar Corolario 4.9.
EJERCICIO 4.22. Considera cajas con dimensionesa, b yc en las que se fija la suma de las dimensiones (i.e.a+b+c). Demostrar que la caja con mayor volumen posible tiene dimensiones que satisfacena=b=c.
EJERCICIO 4.23. Demostrar por inducción que cualquier declaración proposicional bien formada tiene un valor de verdad bien definido.
EJERCICIO 4.24. Demostrar por inducción en el número de conectivos proposicionales que cada declaración proposicional compuesta es equivalente a una declaración usando solo\neg y\vee.
EJERCICIO 4.25. Demostrar por inducción en el número de conectivos proposicionales que cada declaración proposicional compuesta es equivalente a una declaración usando solo\neg y\wedge.
EJERCICIO 4.26. DejarQ_{i} ser un cuantificador, para1 \leq i \leq n. Para cada unoQ_{i}, dejaQ_{i}^{*} ser el cuantificador complementario. Es decir, siQ_{i}=\forall, entoncesQ_{i}^{*}=\exists; siQ_{i}=\exists, entonces vamosQ_{i}^{*}=\forall. Demostrar por inducción en el número de cuantificadores que,\neg\left(Q_{1} x_{1}\right)(\ldots)\left(Q_{n} x_{n}\right) P\left(x_{1}, \ldots, x_{n}\right) \equiv\left(Q_{1}^{*} x_{1}\right)(\ldots)\left(Q_{n}^{*} x_{n}\right) \neg P\left(x_{1}, \ldots, x_{n}\right) .
EJERCICIO 4.27. Definir el número den^{\text {th }} Fermat para que seaF_{n}:=2^{2^{n}}+1, \quad n \in \mathbb{N} . (i) Mostrar que los números de Fermat satisfacen\prod_{k=0}^{n} F_{k}=F_{n+1}-2 . (ii) Concluir que dos números Fermat distintos son coprimos. EJERCICIO 4.28. Dejar\left\langle a_{n}: n \in \mathbb{N}\right\rangle ser una secuencia de números positivos. Supongamos quea_{0} \leq 1, y eso para todosN \in \mathbb{N},a_{N+1} \leq \sum_{n=0}^{N} a_{n} . Probar(\forall N \in \mathbb{N}) a_{n} \leq 2^{N} EJERCICIO 4.29. Dejar\left\langle a_{n}: n \in \mathbb{N}\right\rangle ser una secuencia de números positivos satisfactorios (4.21), ya_{0} \leq C. ¿Cuál es el análogo correcto de (4.22)? Demuestra tu aseveración.
EJERCICIO 4.30. Let\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in A\right\} Ser una familia indexada de conjuntos disgregados por pares. Supongamos que cada unoX_{\alpha} está bien ordenado por\preceq_{\alpha} y queA está bien ordenado por\preceq. Definir una relaciónR sobre la unión de todos los conjuntos en\mathcal{F} por: para todosa, b \in \bigcup_{\alpha \in A} X_{\alpha}, a R b iff (a)a \in X_{\alpha_{1}}, b \in X_{\alpha_{2}} y\alpha_{1} \preceq \alpha_{2},
o
b)(\exists \alpha \in A) a, b \in X_{\alpha} ya \preceq_{\alpha} b.
Demostrar queR es un orden bien de\bigcup_{\alpha \in A} X_{\alpha}.
EJERCICIO 4.31. DejarX ser un conjunto finito yf: X \rightarrow X. Demostrar quef es una inyección ifff es una sobreyección.
(1)
5-2 \sqrt{-2}
\sqrt{5}-\sqrt{-2}
4=\sqrt{2}+\frac{}{}
4+\frac{2}{4}
\sqrt{4-2}+\frac{12}{}
4
\operatorname{sins}^{-2}+\frac{2}{}
1 |
(2.7
\sqrt{2-25}+
(2)
(2.7
(2
4=\sqrt{2}+
\mathrm{~ ㄱ ㅏ ㄱ ㅏ ㄱ ㅏ}
(2.7
4
(2020
(2
2
2
(
r.
a2+2
\sqrt{2-2 \cdot 2 \cdot
(
(
(\sqrt{2}+2
(
4
(200
(2-2
(
\mathrm{~ r e s ~ a ~}
(2-2=
(2)
4
(2+2)
4
4
(1)
CAPÍTULO 5
Límites
La idea de un límite es la piedra angular del cálculo. Es algo sutil, razón por la cual, aunque estaba implícita en la obra de Arquímedes^{1}, y esencial para una adecuada comprensión de las paradojas de Zenón, tardó dos mil años en comprenderse plenamente. El cálculo fue desarrollado en el17^{\text {th }} siglo por Newton y Leibniz con un enfoque algo arrogante de los límites; no fue sino hasta el19^{\text {th }} siglo que se le dio una definición rigurosa de límite, por Cauchy.
En Sección5.1 definimos límites, y probamos algunas propiedades elementales. En la Sección5.2 discutimos las funciones continuas, y en la Sección5.3 analizamos los límites de las secuencias de funciones.
Límites
Dada una función realf: X \rightarrow \mathbb{R}, la idea intuitiva del enunciado\lim _{x \rightarrow a} f(x)=L es que, a medida quex se acerca cada vez mása, los valores def(x) acercarse cada vez másL. Hacer esta noción precisa no es fácil: intenta escribir una definición matemática ahora, antes de seguir leyendo.
La idea detrás de la definición es dar una secuencia de garantías. Imagínate como abogado, tratando de defender el reclamo (5.1). Por concreción, arreglemosg(x)=\frac{\sin (x)}{x}, e intentemos defender la afirmación de que\lim _{x \rightarrow 0} g(x)=1{ }^{1} Arquímedes (287-212 a.C.) calculó el área bajo una parábola (lo que ahora llamaríamos\int_{0}^{1} x^{2} d x) calculando el área de los rectángulos de ancho 1 / Nbajo la parábola y dejandoN tender al infinito. Esto es idéntico al enfoque moderno de encontrar una integral tomando un límite de sumas de Riemann.
FIGURA 5.3. Parcela de\sin (x) / x
El juez escéptico pregunta “¿Se puede garantizar queg(x) está dentro de .1 de 1?”
“Sí, señoría, siempre que eso”|x|<.7.
“Mmm, bueno, ¿puedes garantizar queg(x) está dentro.01 de 1?”
“Sí, señoría, siempre que|x|<.2 . "
Y así va. Si, por cada tolerancia posible que plantea el juez, puede encontrar una precisión (es decir, una desviación permisiblex dea) que garantice que la diferencia entre el valor de la función y el límite está dentro de la tolerancia permisible, entonces puede defender con éxito el Reclamación.
EJERCICIO. Ahora trata de dar una definición matemática de un límite, sin leer más.
Comenzaremos con el caso de que la función se defina en un intervalo abierto.
DEFINICIÓN. Limit,\lim _{x \rightarrow a} f(x) LetI be an open interval anda some point inI. Dejarf ser una función de valor real definida enI \backslash\{a\}. (No importa sif se define ena o no). Entonces decimos\lim _{x \rightarrow a} f(x)=L (en palabras, “el límite comox tiende aa def(x) esL “) si, por cada\varepsilon>0, existe\delta>0, de manera que0<|x-a|<\delta \quad \Longrightarrow \quad|f(x)-L|<\varepsilon
FIGURA 5.5. Una opción\delta para un determinado\varepsilon
La condición0<|x-a|<\delta significa que excluimosx=a de la consideración. Los límites son sobre el comportamiento de una función cerca del punto, no en el punto. Para una función comog(x)=\sin (x) / x, el valor en 0 es indefinido; sin embargo\lim _{x \rightarrow 0} g(x) existe, y es el mismo que\lim _{x \rightarrow 0} de la función\ [h (x) =\ left\ {\ begin {array} {cc} \ sin (x)/x & x\ neq 0\\ 5 & x=0. \ end {array}\ right.\] COMENTARIOS. El uso de\varepsilon para el error permisible y\delta para la precisión correspondiente requerida se santifica por el uso prolongado. Los matemáticos necesitan todos los símbolos convenientes que puedan encontrar. El alfabeto griego se ha utilizado durante mucho tiempo como un suplemento del alfabeto romano en las matemáticas occidentales, y hay que estar familiarizado con él (ver Apéndice A para el alfabeto griego). El punto principal a tener en cuenta en la definición es el orden de los cuantificadores:\forall \varepsilon, \exists \delta. Qué significaría decir(\exists \delta>0)(\forall \varepsilon>0) \quad[0<|x-a|<\delta \quad \Longrightarrow \quad|f(x)-L|<\varepsilon] ? Hablar cómodamente de límites, ayuda tener algunas palabras que describan las desigualdades (5.4). Digamos que el\varepsilon -vecindario deL es el conjunto de puntos dentro\varepsilon deL, es decir, el intervalo(L-\varepsilon, L+\varepsilon). El\delta barrio perforado dea es el conjunto de puntos dentro\delta dea, excluyéndose aa sí mismo, es decir(a-\delta, a) \cup(a, a+\delta). Cuando hablamos de\varepsilon -barrios y barrios perforados\delta -, siempre asumimos eso\varepsilon y\delta somos positivos, para que los barrios no estén vacíos.
Entonces la definición de límite se puede redactar como “cada\varepsilon -barrio deL tiene una imagen inversa debajof que contiene algún\delta barrio perforado dea”.
OBSERVACIÓN. Podemos volver a visitar nuestra analogía de sala de justicia, y decir que para demostrar quef tiene límiteL ena, necesitamos una estrategia que produzca un viable\delta para cualquier\varepsilon. Entonces una prueba es esencialmente una funciónF que toma cualquier positivo\varepsilon y escupe un positivo\delta=F(\varepsilon) para el cual (5.4) funciona.
EJEMPLO 5.6. Vamosf(x)=5 x+2. Demostrar\lim _{x \rightarrow 3} f(x)=17.
Vamos\varepsilon>0. Queremos encontrar un para\delta>0 que el\delta barrio perforado de 3 se mapee en el\varepsilon -barrio de 17.
FIGURA 5.7. Relación entre\delta y\varepsilon Tomando\delta=\varepsilon / 5 funcionará, al igual que cualquier elección más pequeña de\delta. En efecto, si0<|x-3|<\delta, entonces|f(x)-17|<5 \delta=\varepsilon.
EJEMPLO 5.8. Esta vez, vamosg(x)=55 x+2. Para probar\lim _{x \rightarrow 3} g(x)= 167, debemos tomar\delta \leq \varepsilon / 55.
Si dos funcionesf yg ambas tienen límites en el puntoa, entonces también lo hacen todas las combinaciones algebraicasf+g, f-g, f \cdot g yc f parac una constante. El cocientef / g también tiene un límite ena, siempre y cuando\lim _{x \rightarrow a} g(x) \neq 0. Además, estos límites son lo que cabría esperar.
TEOREMA 5.9. Supongamosf yg son funciones en un intervalo abiertoI, y en el puntoa enI ambos\lim _{x \rightarrow a} f(x) y\lim _{x \rightarrow a} g(x) existir. cSea cualquier número real. Entonces\ [\ comenzar {alineado} \ texto {(i)}\ lim _ {x\ fila derecha a} [f (x) +g (x)] &=\ lim _ {x\ fila derecha a} f (x) +\ lim _ {x\ fila derecha a} g (x)\ \ texto {(ii)}\ lim _ {x\ fila derecha a} [f (x) -g (x)] &=\ lim _ {x\ fila derecha a} f (x) -\ lim _ {x\ fila derecha a} g (x)\\ \ texto {(iii)}\ quad\ lim _ {x\ derecha a} c f (x) &=c\ izquierda [\ lim _ {x\ fila derecha a} f (x)\ derecha]\\ (i v)\ quad\ lim _ {x\ fila derecha a} [f (x) g (x)] &=\ izquierda [\ lim _ {x\ fila derecha a} f (x)\ derecha]\ cdot\ izquierda [\ lim _ {x\ fila derecha]\ cdot\ izquierda [\ lim _ _ {x\ fila derecha a} g (x) \ derecha]\\\ texto {(v)}\ quad\ lim _ {x\ fila derecha a}\ frac {f (x)} {g (x)} &=\ frac {\ lim _ {x\ fila derecha a} f (x)} {\ lim _ {x\ fila derecha a} g (x)},\ quad\ texto {proporcionado}\ lim _ {x\ fila derecha a} g (x)\ neq 0. \ end {alineado}\] Discusión. ¿Cómo vamos a probar un teorema así? Bueno, para empezar, no se deje intimidar por su longitud. Empecemos por la parte (i). Solo tenemos la definición de límite para trabajar, por lo que solo tenemos una opción estratégica: demostrar directamente que la definición está satisfecha.
COMPROBACIÓN DE (i). DejarL_{1} yL_{2} ser los límites def yg respectivamente ena. Dejar\varepsilon ser un número positivo arbitrario. Debemos encontrar un\delta>0 modo que0<|x-a|<\delta \quad \Longrightarrow \quad\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right|<\varepsilon . La idea clave, común a muchos argumentos de límite, es utilizar la observación de que Se\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| \leq\left|f(x)-L_{1}\right|+\left|g(x)-L_{2}\right| . trata de una aplicación de la llamada desigualdad triangular, que se le pide después que demuestre (Lema 5.14). Es la aseveración que para cualquier número realc yd, tenemos|c+d| \leq|c|+|d| . (¿Qué valores dec yd rendimiento (5.10)?) Entonces, si podemos hacer ambos\left|f(x)-L_{1}\right| y\left|g(x)-L_{2}\right| pequeños, entonces Desigualdad (5.10) obliga\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| a ser pequeños también, que es lo que queremos.
Desdef yg tenemos límitesL_{1} yL_{2} ata, sabemos que existen números positivos\delta_{1} y\delta_{2} tales que\ [\ begin {array} {lll} 0<|x-a|<\ delta_ {1} &\ Longrightarrow &\ izquierda|f (x) -L_ {1}\ derecha|<\ varepsilon\\ 0<|x-a|<\ delta_ {2} &\ Longrightarrow &\ izquierda|g (x) -L_ {2}\ derecha|<\ varepsilon \ end {array}\] Si|x-a| es menor que ambos\delta_{1} y\delta_{2}, luego ambos las desigualdades están satisfechas, y obtenemos\left|f(x)+g(x)-\left(L_{1}+L_{2}\right)\right| \leq\left|f(x)-L_{1}\right|+\left|g(x)-L_{2}\right| \leq \varepsilon+\varepsilon . Esto no es lo suficientemente bueno; queremos que el lado izquierdo de (5.11) esté limitado por\varepsilon, no2 \varepsilon. Estamos salvados, sin embargo, por el requisito de que para cualquier número positivo\eta, podamos garantizar esof yg estamos en un\eta -barrio deL_{1} yL_{2}, respectivamente. En particular,\eta dejémoslo\varepsilon / 2. Desdef yg tienen límites ena, hay números positivos\delta_{3} y\delta_{4} así que\ [\ begin {array} {lll} 0<|x-a|<\ delta_ {3} &\ Longrightarrow &\ izquierda|f (x) -L_ {1}\ derecha|<\ frac {\ varepsilon} {2}\\ 0<|x-a|<\ delta_ {4} &\ Longrightarrow &\ izquierda|g (x) -L_ {2}\ derecha|<\ frac {\ varepsilon} {2}. \ end {array}\] Así que establecemos\delta igual al menor de\delta_{3} y\delta_{4}, y obtenemos\ [\ begin {aligned} &0<|x-a|<\ delta\ Longrightarrow\\ &\ quad\ izquierda|f (x) +g (x) -\ left (L_ {1} +L_ {2}\ derecha)\ derecha|\ leq\ izquierda|f (x) -L_ {1}\ derecha|+\ izquierda|g (x) -L_ {2}\ derecha|<\ varepsilon, \ end {alineado}\] según sea necesario. EJERCICIO. Explique con palabras cómo funcionaba la prueba anterior. En mano corta, se podría decir que siF_{1} yF_{2} son estrategias para probar\lim _{x \rightarrow a} f(x)=L_{1} y\lim _{x \rightarrow a} g(x)=L_{2} respectivamente, entoncesF=\min \left\{F_{1}\left(\frac{\varepsilon}{2}\right), F_{2}\left(\frac{\varepsilon}{2}\right)\right\} es una estrategia para probar\lim _{x \rightarrow a} f(x)+g(x)=L_{1}+L_{2}.
Discusión. ¿Qué sigue? Podríamos probar (ii) de manera similar, pero a los matemáticos les gustan los atajos. Observe que si probamos (iii) y dejamosc=-1, entonces podemos aplicar (i)f+(-g) y obtener (ii) de esa manera. Además, (iii) es solo un caso especial de (iv), si sabemos que la función constanteg(x)=c tiene el límitec en cada punto. Entonces probemos (iv) siguiente.
Prueba de (iv). Nuevamente, dejemos\varepsilon ser un número positivo arbitrario. Debemos encontrar una\delta>0 para que no0<|x-a|<\delta \quad \Longrightarrow \quad\left|f(x) g(x)-\left(L_{1} L_{2}\right)\right|<\varepsilon . quede muy claro qué tan cercaf yg tiene que estar deL_{1} yL_{2} para conseguir que su producto esté lo suficientemente cerca deL_{1} L_{2}, así que vamos a jugarlo seguro al no elegir todavía. Por cada\varepsilon_{1}, \varepsilon_{2}>0, sabemos que existe\delta_{1}, \delta_{2}>0 tal que\ [\ begin {array} {lll} 0<|x-a|<\ delta_ {1} &\ Longrightarrow &\ izquierda|f (x) -L_ {1}\ derecha|<\ varepsilon_ {1}\\ 0<|x-a|<\ delta_ {2} &\ Longrighttarrow &\ izquierda |g (x) -L_ {2}\ derecha|<\ varepsilon_ {2} \ end {array}\] Ahora usamos el segundo truco común para probar la existencia de límites: sumar y restar la misma cantidad para que uno pueda factorizar. \ [\ comenzar {alineado} \ izquierda|f (x) g (x) -L_ {1} L_ {2}\ derecha| &=\ izquierda|f (x) g (x) -L_ {1} g (x) +L_ {1} g (x) -L_ {1} L_ {2}\ derecha|\\ &\ izquierda\ izquierda | f (x) g (x) -L_ {1} g (x)\ derecha|+\ izquierda|L_ {1} g (x) -L_ {1} L_ {2}\ derecha|\\ &\ izquierda\ izquierda|f (x) -L_ {1}\ derecha||g (x) |+\ izquierda|g (x) -L_ {2}\ derecha|\ izquierda|l_ {1}\ derecha|\ cdot\ quad (5.1 \ end {alineado}\] Ahora bien, si ambos summands en la última línea se pueden hacer menos que\varepsilon / 2, ganamos. El segundo término es fácil: elegimos\varepsilon_{2}=\frac{\varepsilon}{2\left|L_{1}\right|+1} . Luego hay un\delta_{2} modo que\ [\ begin {alineado} 0<|x-a|<\ delta_ {2} &\ Longrightarrow\ quad\ izquierda|g (x) -L_ {2}\ derecha| &<\ varepsilon_ {2}\ &\ Longrightarrow\ quad\ izquierda|g (x) -L_ {2}\ derecha|\ izquierda|L_ {1}\ derecha| &<\ frac {\ varepsilon\ izquierda|l_ {1}\ right|} {2\ izquierda|l_ {1}\ right|+1} <\ frac {\ varepsilon} {2} \ end {alineado}\] (SiL_{1} \neq 0, podríamos haber elegido\varepsilon_{2}=\frac{\varepsilon}{2\left|L_{1}\right|}; agregamos 1 al denominador solo para no tener que considerar los dos casos por separado.)
¿Y el primer summand en (5.12), el término\left|f(x)-L_{1}\right||g(x)|? Primero vamos a ponernos un poco atados sobre lo grande que|g| puede ser. Sabemos que si0<|x-a|<\delta_{2}, entonces\left|g(x)-L_{2}\right|<\varepsilon /\left(2\left|L_{1}\right|+1\right), entonces|g(x)|<\left|L_{2}\right|+\frac{\varepsilon}{2\left|L_{1}\right|+1}=: M . Si lo dejamos\varepsilon_{1}=\varepsilon /(2 M), sabemos que existe\delta_{1}>0 para que0<|x-a|<\delta_{1} \quad \Longrightarrow \quad\left|f(x)-L_{1}\right||g(x)|<\varepsilon_{1}|g(x)| . Finalmente, dejamos\delta=\min \left(\delta_{1}, \delta_{2}\right). Pues0<|x-a|<\delta, ambas summands en (5.12) son menores que\varepsilon / 2: la segunda suma porque\delta \leq \delta_{2}, y la primera porque cuando0<|x-a|<\delta, la Desigualdad5.13 se fortalece a\left|f(x)-L_{1}\right||g(x)|<\varepsilon_{1}|g(x)|<\varepsilon_{1} M=\varepsilon / 2 . Por lo tanto, para 0<|x-a|<\delta, tenemos\left|f(x) g(x)-L_{1} L_{2}\right|<\varepsilon, como se desee.
PRUEBA DE (iii). Este es un caso especial de (iv), una vez que sabemos que las funciones constantes tienen límites. Digamos esto como un lema. Dado Lema 5.15, se prueba el inciso iii), y por lo tanto también lo es (ii).
COMPROBACIÓN DE (v). Ejercicio.
LEMA 5.14. Desigualdad triangular Letc, d be números reales. Entonces|c+d| \leq|c|+|d| .
PRUEBA. Ejercicio.
LEMA 5.15. Dejarg(x) \equiv c ser la función constante c. Entonces,(\forall a \in \mathbb{R}) \lim _{x \rightarrow a} g(x)=c . PRUEBA. Ejercicio.
EJEMPLO 5.16. La función HeavisideH(t) está definida porH(t)= \begin{cases}0 & t<0 \\ 1 & t \geq 0\end{cases} Show queH no tiene límite en 0.
Discusión. Para probar que no existe un límite, debemos probar lo contrario de\forall \varepsilon \exists \delta, es decir, eso\exists \varepsilon \nexists \delta. Como la brecha entre la función on[0, \infty) y(-\infty, 0) es 1, está claro que cualquier banda de ancho<1 no puede ser lo suficientemente ancha como para contener valores deH(t) fort en ambos lados de 0. Entonces elegiremos algunos\varepsilon<.5, y discutiremos por contradicción.
Supongamos que el límite existe y es igualL. Vamos\varepsilon=\frac{1}{4}. Por hipótesis, existe\delta>0 tal que0<|t|<\delta \Longrightarrow|H(t)-L|<\frac{1}{4} . Pero parat negativo, esto significa|L|<\frac{1}{4}; y parat positivo, esto significa|L-1|<\frac{1}{4}. Así obtenemos una contradicción.
Si la función se define en el intervalo cerrado[c, d], es posible que aún queramos preguntar si tiene un valor limitante enc; si es así, sin embargo, solo queremos considerar puntos cercanosc que estén en el dominio de la definición. De manera más general, nos llevan a la siguiente definición de límite restringido.
DEFINICIÓN. Límite restringido,\lim _{X \ni x \rightarrow a} f(x) Supongamos quef es una función real yX \subseteq \operatorname{Dom}(f). Vamosa \in \mathbb{R}. Decimos que\lim _{X \ni x \rightarrow a} f(x)=L si(\forall \varepsilon>0)(\exists \delta>0)(\forall x \in X) \quad[0<|x-a|<\delta] \Longrightarrow|f(x)-L|<\varepsilon .
Leemos "\lim _{X \ni x \rightarrow a} f(x)=L" como “el límite comox tiende ala interiorX def(x) esL . " Un caso especial importante de límites restringidos son los siguientes:
DEFINICIÓN. Límite derecho,\lim _{x \rightarrow a^{+}} f(x) Leta, b, L \in \mathbb{R}, a<b yf ser una función real definida en(a, b). Decimos que\lim _{x \rightarrow a^{+}} f(x)=L si(\forall \varepsilon>0)(\exists \delta>0)[x \in(a, a+\delta)] \Rightarrow[|f(x)-L|<\varepsilon] El númeroL es el límite de la derecha def(x) ata. El límite de la izquierda se define de manera similar. Sia, c, L \in \mathbb{R}, c<a yf es una función real definida en(c, a), decimos que\lim _{x \rightarrow a^{-}} f(x)=L si los límites de la(\forall \varepsilon>0)(\exists \delta>0)[x \in(a-\delta, a)] \Rightarrow[|f(x)-L|<\varepsilon] mano derecha y los límites de la izquierda se denominan límites unilaterales. Los límites unilaterales son ejemplos de límites restringidos.
EJEMPLO 5.17. H(t)Sea la función Heaviside. Entonces\ [\ comenzar {alineado} &\ lim _ {t\ fila derecha 0^ {+}} H (t) =1\\ &\ lim _ {t\ fila derecha 0^ {-}} H (t) =0 \ final {alineado}\]
Continuidad
La mayoría de las funciones que has encontrado tienen la propiedad de que en (casi) cada punto la función tiene un límite que concuerda con su valor allí. Esta es una característica muy útil de una función, y se llama continuidad.
DEFINICIÓN. Continuo Letf ser una función real con dominioX \subseteq \mathbb{R} . Leta \in X. Entonces decimos quef es continuo ena si\lim _{X \ni x \rightarrow a} f(x)=f(a). Decimos quef es continuoX si es continuo en cada punto deX
Intuitivamente, la idea de una función continua en un intervalo es que no tiene saltos. Esto lo haremos preciso en el Capítulo 8 cuando probemos el Teorema del Valor Intermedio 8.10, que afirma que si una función continua en un intervalo toma dos valores distintosc yd, también debe asumir cada valor entrec y d.
EJEMPLO 5.18. Demostrar que la funciónf(x)=x^{2} es continua en\mathbb{R}. Discusión. ¿Cómo haríamos esto desde los primeros principios? Tenemos que demostrar que para cadaa \in \mathbb{R}, para cada\varepsilon>0, siempre podemos encontrar un\delta>0 tal que para cualquierax \in \mathbb{R}|x-a|<\delta \quad \Longrightarrow \quad\left|x^{2}-a^{2}\right|<\varepsilon . (¿Por qué no necesitamos agregar la hipótesis0<|x-a|?) La forma más fácil de hacerlo es anotar una fórmula que, dadaa y\varepsilon, produce una\delta satisfactoria (5.19).
Comox^{2}-a^{2}=(x-a)(x+a), si|x-a| es menor que algún número\delta (aún sin especificar), entonces\left|x^{2}-a^{2}\right| es menor que\delta|x+a|. Entonces queremos No\delta|x+a| \leq \varepsilon podemos elegir\delta=\varepsilon /|x+a|, porque\delta no podemos depender dex. Pero si|x-a|<\delta, entonces\ [\ begin {aligned} |x+a| &\ leq|x|+|a|\\ &<|a|+\ delta+|a|a|=2|a|+\ delta, \ end {alineado}\] SO\left|x^{2}-a^{2}\right|<\delta(2|a|+\delta) \stackrel{?}{\leq} \varepsilon . Debemos elegir\delta para que la última desigualdad se mantenga. Por la fórmula cuadrática,\delta(2|a|+\delta) \leq \varepsilon \quad \Longleftrightarrow \delta \leq \sqrt{|a|^{2}+\varepsilon}-|a| . Así que elige\delta=\sqrt{|a|^{2}+\varepsilon}-|a| y (5.19) sostiene.
OBSERVACIÓN. Una prueba formalmente correcta podría haberse reducido a:
PRUEBA. Dejara \in \mathbb{R} y\varepsilon>0. Entonces dejando\delta=\sqrt{|a|^{2}+\varepsilon}-|a| que tengamos|x-a|<\delta \Longrightarrow\left|x^{2}-a^{2}\right|<\varepsilon. Q.E.D.
Sin embargo, si bien un lector diligente podría verificar que esta prueba es correcta,\delta sacarse de un sombrero como este no le da al lector la idea de que nuestra prueba mucho más larga sí. Recuerde, una prueba tiene más de una función: no sólo debe convencer al lector de que el resultado reclamado es cierto, sino que también debe ayudar al lector a entender por qué el resultado es cierto. Una buena prueba debe ser descriptible en unas pocas frases en inglés, para que un oyente experto pueda entonces ir a escribir una prueba más detallada con bastante facilidad.
OBSERVACIÓN. No es necesario elegir el mayor valor de para\delta que la desigualdad\stackrel{?}{\leq} en (5.21) se mantenga - cualquier positivo\delta que satisfaga la desigualdad funcionará. Esto permite simplificar el álgebra. Por ejemplo,\delta_{1} seamos tales que|x-a|<\delta_{1} \Rightarrow|x+a|<2|a|+1 . (Tal\delta_{1} existe a partir de la continuidad de la función más simplex \mapsto x). Entonces vamos\delta=\min \left(\delta_{1}, \frac{\varepsilon}{2|a|+1}\right) y (5.20) sostiene.
Se podría imaginar repetir pruebas como las anteriores para demostrar esox^{3}x^{4},, y así sucesivamente son continuas, pero queremos dar grandes pasos. ¿Podemos mostrar que todos los polinomios son continuos?
Primero observe que debido a que los límites se comportan bien con respecto a las operaciones algebraicas (Teorema 5.9), y la continuidad se define en términos de límites, entonces las combinaciones algebraicas de funciones continuas son continuas.
Proposición 5.22. Supongamosf: X \rightarrow \mathbb{R} yg: X \rightarrow \mathbb{R} son funciones reales que son continuas ena \in X. Dejarc yd ser escalares{ }^{2}. Entoncesc f+d g y ambosf g son continuos a una, y así esf / g sig(a) \neq 0.
PRUEBA. Ejercicio.
Las funciones constantes son continuas (Lema 5.15), y la funciónf(x)=x es continua (Ejercicio 5.16). Así se puede demostrar por inducción sobre el grado de polinomio, utilizando la Proposición 5.22, que todos los polinomios son continuos (Ejercicio 5.27). Una vez que hayas demostrado que todos los polinomios son continuos, puedes probar que las funciones racionales son continuas donde el denominador no se desvanece.
Este resultado se utiliza con tanta frecuencia que lo declararemos formalmente.
{ }^{2}Un escalar es solo una palabra elegante para un número. PROPOSICIÓN 5.23. Cada polinomio es continuo en\mathbb{R}. Toda función racional es continua donde el denominador es distinto de cero.
Qué pasa con la función exponenciale^{x}:=\sum_{n=0}^{\infty} \frac{x^{n}}{n !} ? Cada suma parcial es un polinomio, y por lo tanto continuo; así que si supiéramos que el límite de una secuencia de funciones continuas era continuo, estaríamos hechos. Esto resulta, sin embargo, ser un problema sutil, que abordamos en la siguiente Sección.
Secuencias de funciones
Una secuencia infinita de números\left\langle a_{n}\right\rangle tiende a un límiteL sia_{n} se acercaL comon tiende al infinito. Trate de escribir una definición formal de esto antes de seguir leyendo.
Discusión. Pista. Ya hemos visto cómo codificar el enunciado “enfoquesL”. La dificultad es codificar “comon tiende al infinito”. ¿Cómo podrías hacer esto?
DEFINICIÓN. \lim _{n \rightarrow \infty} a_{n}, convergen, divergen La secuencia\left\langle a_{n}\right\rangle tiende al límiteL comon tiende al infinito, escrito\lim _{n \rightarrow \infty} a_{n}=L, si por cada\varepsilon>0 existeN \in \mathbb{N} tal que (\forall n \in \mathbb{N}) n>N \quad \Longrightarrow \quad\left|a_{n}-L\right|<\varepsilon .Decimos que la secuencia\left\langle a_{n}\right\rangle converge aL. Si una secuencia no converge, decimos que diverge.
EJEMPLO 5.24. Demostrar que la secuencia\left\langle\sin ^{2}(n) / n \mid n \in \mathbb{N}\right\rangle converge. Discusión. Generalmente es más fácil probar que una secuencia converge si tenemos una idea de su límite. Para probar la convergencia de secuencias sin candidato para el límite generalmente implica usar la propiedad de límite inferior superior de\mathbb{R} (que está cubierta en el Capítulo 8). Ciertamente parece que los términos en la secuencia se están acercando a 0, así que tratamos de mostrar esto rigurosamente.
Observamos que(\forall n \in \mathbb{N})\left|\sin ^{2}(n)\right| \leq 1 De ahí(\forall n \in \mathbb{N})\left|\sin ^{2}(n) / n\right| \leq|1 / n| . Dejar\varepsilon>0 yN \in \mathbb{N} ser tal que1 / N \leq \varepsilon. Entonces para cualquiern \geq N,\left|\sin ^{2}(n) / n-0\right| \leq 1 / n \leq \varepsilon Por lo tanto\lim _{n \rightarrow \infty} \frac{\sin ^{2}(n)}{n}=0 . EJEMPLO 5.25. Para cualquieran \in \mathbb{N}, vamosa_{n}=(-1)^{n}. Demostrar que la secuencia\left\langle a_{n}\right\rangle diverge.
Discusión. Dado que la secuencia alterna entre-1 y 1, es intuitivamente claro que la secuencia no tiende a ningún número en particular. Deseamos demostrar que una declaración en la forma(\exists L \in \mathbb{R})(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall n>N)(\ldots) es falsa. Por lo que debemos demostrar que la negación de la afirmación es cierta. Eso es(\forall L \in \mathbb{R})(\exists \varepsilon>0)(\forall N \in \mathbb{N})(\exists n>N) \neg(\ldots) . Para cualquieraL \in \mathbb{R}, si\varepsilon<1 escogemos no podremos capturar tanto como-1 1 en los\varepsilon -barrios de L. Esto demostrará que la secuencia diverge.
DejarL \in \mathbb{R} y\varepsilon<1. Demostramos que para cualquieraN \in \mathbb{N}, hayn>N tal que\left|(-1)^{n}-L\right| \geq \varepsilon VamosN \in \mathbb{N}^{+}. Argumentamos por casos.
SupongamosL<0. Entonces,\left|(-1)^{2 N}-L\right| \geq 1>\varepsilon supongamosL \geq 0. Entonces\left|(-1)^{(2 N+1)}-L\right| \geq 1>\varepsilon . Por lo tanto la secuencia\left\langle a_{n}\right\rangle diverge.
EJEMPLO 5.26. Para todosn \in \mathbb{N}, vamosa_{n}=\sum_{k=0}^{n}\left(\frac{k}{n}\right)^{2} \frac{1}{n}. ¿Cuál es el límite de la secuencia\left\langle a_{n}\right\rangle?
Discusión. Los términos de la secuencia pueden resultarle familiares ya que Riemann suma asociada con el área bajo la parábolaf(x)=x^{2} entrex=0 yx=1. Utilizaremos un resultado combinatorio que probamos por inducción en el último capítulo.
Por Proposición 4.6,\ [\ comenzar {alineado} \ lim _ {n\ fila derecha\ infty}\ suma_ {k=0} ^ {n}\ izquierda (\ frac {k} {n}\ derecha) ^ {2}\ frac {1} {n} &=\ lim _ {n\ fila derecha\ infty}\ izquierda (\ frac {1} {n^ {}}\ derecha)\ suma_ {k=0} ^ {n} k^ {2}\\ &=\ lim _ {n\ fila derecha\ infty}\ izquierda (\ frac {1} {n^ {3}}\ derecha)\ frac {(n) (n+1) (2 n+1)} {6 }\\ &=1/3. \ end {aligned}\] La verificación de la última igualdad se deja al lector como ejercicio.
En la siguiente sección nos interesan particularmente las sumas infinitas.
Definición. Suma infinita, suma parcial,\sum_{k=0}^{\infty} a_{k} Let\left\langle a_{k} \mid k \in \mathbb{N}\right\rangle Ser una secuencia de números. La suman^{\text {th }} parcial de la secuencia ess_{n}=\sum_{k=0}^{n} a_{k} . La suma infinita de la secuencia es\sum_{k=0}^{\infty} a_{k}:=\lim _{n \rightarrow \infty} s_{n} . La suma infinita es el límite de la secuencia de sumas parciales,\left\langle s_{n}\right\rangle. EJEMPLO 5.27. Demostrar que\sum_{k=0}^{\infty} \frac{1}{2^{k}}=2 . Lets_{n} sea la suman^{\text {th }} parcial. Tenemos que demostrar que\lim _{n \rightarrow \infty} s_{n}=2 . Let\varepsilon>0 yN \in \mathbb{N} ser tal que\frac{1}{2^{N}}<\varepsilon. Mostramos que sin \geq N, entonces\left|s_{n}-2\right|<\varepsilon Dado que la serie\sum_{k=0}^{\infty} \frac{1}{2^{k}} es geométrica, sabemos ques_{n}=\frac{1-2^{-(n+1)}}{1-1 / 2}=2-2^{-n} . Así que sin \geq N, entonces\left|s_{n}-2\right|=2^{-n}<\varepsilon . En análisis, a menudo se trata de una secuencia de funciones f_{n}. Por ejemplo,f_{n} podría ser el polinomio Taylor den^{\text {th }} orden -order de alguna funciónf, y uno quiere saber si esta secuenciaf_{n} converge af; o la secuenciaf_{n} puede representar funciones cuyas gráficas tienen una curva de límite fija en\mathbb{R}^{3} y tienen áreas decrecientes, y se quiere saber si la secuencia converge a la gráfica de una función con área mínima para ese límite. Este tipo de problema es tan importante que los matemáticos estudian diferentes formas en las que una secuencia de funciones podría converger. La forma más obvia es puntual:
DEFINICIÓN. Convergencia puntual Una secuencia de funcionesf_{n} en un conjuntoX converge puntualmente a la funciónf si, para todosx enX, la secuencia de números\left\langle f_{n}(x)\right\rangle converge a f(x).
Para que la definición tenga sentido, requerimos queX \subseteq \bigcap_{n \in \mathbb{N}} \operatorname{Dom}\left(f_{n}\right) . sia \in X, la convergencia puntual de una secuencia de funciones,\left\langle f_{n}\right\rangle, en el puntoa depende de la convergencia de la secuencia de números,\left\langle f_{n}(a)\right\rangle. Si no entiendes la convergencia de una secuencia de números no puedes entender la convergencia de una secuencia de funciones.
EJEMPLO 5.28. Considera las funcionesf_{n}(x)=x^{n}. En el intervalo abierto(-1,1), estas funciones convergen puntualmente a 0. En el punto 1, las funciones convergen a 1; en el punto-1, las funciones no convergen, porque los valores oscilan entre+1 y-1. Fuera del conjunto(-1,1] la secuencia de funciones diverge.
El ejemplo anterior ilustra el principal problema con la convergencia puntual: la secuencia de funciones continuasx^{n} en el conjunto[0,1] converge, pero la función a la que converge no es continua. Incluso Cauchy cometió este error: afirmó como teorema en su libro Cours d'analyse de 1821 que si una secuencia de funciones continuas converge puntualmente, entonces su límite es continuo{ }^{3}. Para sortear este problema, introducimos la noción de convergencia uniforme.
DEFINICIÓN. Convergencia uniformeX \subseteq \mathbb{R} Se dice que la secuencia de funciones realesf_{n} definidas en un conjunto converge uniformemente a la funciónf enX si, por cada\varepsilon>0, existeN \in \mathbb{N} tal que, para cada xenX, siempre quen>N entonces\left|f_{n}(x)-f(x)\right|<\varepsilon. En notación lógica:(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall x \in X)(\forall n>N) \quad\left|f_{n}(x)-f(x)\right|<\varepsilon Obsérvese la gran diferencia entre convergencia puntual y uniforme: en convergencia puntualN puede dependerx; en convergencia uniforme no puede. La importancia de la convergencia uniforme deriva del siguiente teorema.
TEOREMA 5.29. Dejarf_{n} ser una secuencia de funciones continuas sobreX que converge uniformemente af onX. Entoncesf es continuo encendidoX.
Discusión. Debemos mostrar|f(x)-f(a)| es pequeño cuandox está cerca de un. sabemos que\left|f_{n}(x)-f(x)\right| es pequeño para todosx; así que refinamos el
{ }^{3}Véase el libro [4] de Imre Lakatos para una interesante discusión histórica sobre el error de Cauchy y el descubrimiento de la convergencia uniforme, de Seidel y Stokes independientemente en 1847. engañar a partir de la p. 133, y sumar y restar lo mismo dos veces, escribiendof(x)-f(a)=\left[f(x)-f_{n}(x)\right]+\left[f_{n}(x)-f_{n}(a)\right]+\left[f_{n}(a)-f(a)\right] . Entonces tratamos de hacen que cada uno de los tres pares agrupados sea pequeño, por lo que su suma es pequeña. Esto a veces se llama\varepsilon / 3 argumento, porque si hacemos cada término más pequeño que\varepsilon / 3, entonces su suma es menor que\varepsilon.
Comprobante. Arreglar algún puntoa \in X, y dejar\varepsilon>0. Debemos encontrar|x-a|<\delta \quad \Longrightarrow \quad|f(x)-f(a)|<\varepsilon . para\delta>0 que Para ello, nosf(x)-f(a) dividimos en tres partes:f(x)-f(a)=\left[f(x)-f_{n}(x)\right]+\left[f_{n}(x)-f_{n}(a)\right]+\left[f_{n}(a)-f(a)\right] . Elegir para queN eson \geq N implique\left|f_{n}(x)-f(x)\right|<\varepsilon / 3 para todosx. Elige\delta>0 para que\left|f_{N}(x)-f_{N}(a)\right|<\varepsilon / 3 cuando sea|x-a|<\delta. Entonces por el triángulo desigualdad, para|x-a|<\delta, tenemos\ [\ begin {alineado} |f (x) -f (a) | &\ leq\ left|f (x) -f_ {N} (x)\ derecha|+\ izquierda|f_ {N} (x) -f_ {N} (a)\ derecha|+\ izquierda|f_ {N} (a) -f (a)\ derecha|\\ &\ leq\ frac {\ varepsilon} {3} +\ frac {\ varepsilon} {3} +\ frac {\ varepsilon} {3} =\ varepsilon. \ end {alineado}\] PREGUNTA. ¿Dónde se utilizó la hipótesis de que la convergencia era uniforme?
Podemos utilizar el teorema5.29, por ejemplo, para demostrar que la función exponencial es continua. Consideramos la función exponencial como su serie Taylore^{x}=\sum_{k=0}^{\infty} \frac{x^{k}}{k !} . Recordemos que la expresión\sum_{k=0}^{\infty} \frac{x^{k}}{k !} es una taquigrafía\lim _{n \rightarrow \infty} \sum_{k=0}^{n} \frac{x^{k}}{k !} . para Para cualquier número reala, \sum_{k=0}^{\infty} \frac{a^{k}}{k !} es una suma infinita que converge si su correspondiente secuencia de sumas parciales converge. Por la prueba de ratio, la serie exponencial converge para todos los realesa. (Para una prueba formal de la prueba de ratio, ver Teorema 8.9).
Proposición 5.31. La función exponencial es continua\mathbb{R}.
Comprobante. p_{n}(x):=\sum_{k=0}^{n} \frac{x^{k}}{k !}Déjese ser el polinomio de Taylor den^{\text {th }} orden. Sabemos que cada unop_{n} es continuo, por Proposición5.23. Si supiéramos quep_{n}(x) convergían uniformemente ae^{x}, estaríamos hechos por el Teorema5.29.
No es cierto quep_{n} converge uniformemente sobre\mathbb{R} (¿por qué?). Sin embargo, la secuencia converge uniformemente en cada intervalo[-R, R], y esto es lo suficientemente bueno para concluir quee^{x} es continuo en\mathbb{R} (¿por qué?).
Para ver esta última afirmación, arreglarR>0 y\varepsilon>0. Debemos encontrar paraN que, para todosn>N y para todosx \in[-R, R], tengamos\left|e^{x}-p_{n}(x)\right|<\varepsilon. Observe que\left|e^{x}-p_{n}(x)\right|=\left|\frac{x^{n+1}}{(n+1) !}+\frac{x^{n+2}}{(n+2) !}+\ldots\right| . Para cada unon, el lado derecho se maximiza[-R, R] por su valor enR (¿por qué?) ; y a medida quen aumenta, este resto disminuye monótonamente (porque se pierden cada vez más términos positivos). Como sabemos la serie exponencial parae^{R} converge, elige unaN así quee^{R}-p_{N}(R) sea menor que\varepsilon. Entonces para todosx en[-R, R] y todosn \geq N, tenemos\left|e^{x}-p_{n}(x)\right|<\varepsilon, como se desee.
Las funciones seno y coseno también se pueden definir en términos de su serie Taylor:\ [\ begin {aligned} &\ sin (x)\ quad: =\ sum_ {n=0} ^ {\ infty} (-1) ^ {n}\ frac {x^ {2 n+1}} {(2 n+1)!} \\ &\ cos (x)\ quad: =\ suma_ {n=0} ^ {\ infty} (-1) ^ {n}\ frac {x^ {2 n}} {(2 n)!} . \ end {aligned}\] Se puede demostrar que son continuos por argumentos similares. OBSERVACIÓN. Observe que en nuestras definiciones de límites y continuidad, estamos utilizando el valor absoluto solo para medir distancias. En otras palabras, estamos diciendo quef es continuo ena si, para todos\varepsilon>0, podemos encontrar\delta>0, de tal manera que siempre que la distancia dex aa sea menor que\delta, entonces la distancia def(x) af(a) es menor que\varepsilon. Esta definición tiene perfectamente sentido cuando se tiene una forma de medir distancias en el dominio y el codominio. Por ejemplo, si la función se mapea\mathbb{R}^{m} a\mathbb{R}^{n}, se pueden medir distancias de la manera euclidiana habitual. En una generalidad aún mayor, los matemáticos utilizan algo llamado métricas para medir distancias, y una vez que se tienen métricas, se puede discutir la continuidad de las funciones de manera similar a nuestra discusión para funciones reales.
Las matemáticas de este capítulo -una mirada cercana al comportamiento de las funciones reales- se llama Análisis. Esta comprende una de las tres principales disciplinas de la matemática pura; las otras dos son Geometría y Álgebra. Una buena introducción al análisis es el libro [?] de Walter Rudin.
Ejercicios
EJERCICIO 5.1. Demostrar que las definiciones de límite en las páginas 129 y 130 son las mismas.
EJERCICIO 5.2. Demostrar Lema 5.14, y la aseveración relacionada de que|c|-|d| \leq|c+d|.
EJERCICIO 5.3. Paran \in \mathbb{N}^{+}, a_{i} \in \mathbb{R}(1 \leq i \leq n), demostrar que\left|\sum_{i=1}^{n} a_{i}\right| \leq \sum_{i=1}^{n}\left|a_{i}\right| . EJERCICIO 5.4. Demostrar Lema5.15.
EJERCICIO 5.5. Demostrar parte (v) del Teorema 5.9.
EJERCICIO 5.6. Dé un ejemplo de dos funcionesf yg que no tengan límites en un puntoa pero tal quef+g sí. Para el mismo par de funciones,f-g también puede tener un límite ena? EJERCICIO 5.7. Supongamos quef es una función real y\lim _{x \rightarrow a} f(x)=L. Demostrar que siX \subseteq \operatorname{Dom}(f), entonces\lim _{X \ni x \rightarrow a} f(x)=L . EJERCICIO 5.8. Usa el método de Arquímedes (el método de las sumas de Riemann) para demostrarlo\int_{0}^{1} x^{2} d x=\frac{1}{3} (Necesitarás conocer una fórmula para\sum_{k=0}^{n} k^{2} - ver Proposición 4.6).
EJERCICIO 5.9. Utilice el método de Arquímedes para probarlo\int_{0}^{1} x^{3} d x=\frac{1}{4} . (Ver Ejercicio 4.16).
EJERCICIO 5.10. Demostrar que la función Heaviside tiene límites tanto a la izquierda como a la derecha en0 .
EJERCICIO 5.11. Demostrar que una función tiene un límite en un punto si y sólo si tiene límites tanto izquierdo como derecho en ese punto y sus valores coinciden.
EJERCICIO 5.12. Demostrar que el Teorema5.9 aplica a límites restringidos.
EJERCICIO 5.13. El puntoa es un punto límite del conjuntoX si, por cada\delta>0, existe un puntox adentroX \backslash\{a\} con|x-a|<\delta. Dejarf ser una función de valor real enX \subseteq \mathbb{R}. Demostrar que sia es un punto límite deX, entonces sif tiene un límite restringido ena él es único. Demostrar que si noa es un punto límite deX, entonces cada número real es un límite restringido def ata.
EJERCICIO 5.14. \lim _{x \rightarrow 0} \sin (x) / x=1Demuéstralo.
EJERCICIO 5.15. Demostrar Proposición 5.22.
EJERCICIO 5.16. Demostrar que la funciónf(x)=x es continua en todas partes\mathbb{R}. EJERCICIO 5.17. En el Ejercicio 4.12 se da una fórmula para los números de Fibonacci. Evaluar\lim _{n \rightarrow \infty} F_{n+1} / F_{n}.
EJERCICIO 5.18. ¿Qué tan grande deben ser para asegurar queF_{n+1} / F_{n} está dentro10^{-1} del límite en el Ejercicio 5.17? 10^{-2}¿Dentro? 10^{-k}¿Dentro?
EJERCICIO 5.19. Define la función\psi: \mathbb{R} \rightarrow \mathbb{R} por\psi(x):= \begin{cases}0 & x \notin \mathbb{Q} \\ 1 & x \in \mathbb{Q} .\end{cases} Demostrar que\psi es discontinuo en todas partes.
EJERCICIO5.20. Definir la función\phi: \mathbb{R} \rightarrow \mathbb{R} por\phi(x):= \begin{cases}0 & x \notin \mathbb{Q} \\ \frac{1}{n} & x \in \mathbb{Q} \backslash\{0\}, x=\frac{m}{n}, \operatorname{gcd}(m, n)=1, n>0 \\ 1 & x=0 .\end{cases} Probar que\phi es continua en cada número irracional y discontinuo en cada número racional.
EJERCICIO 5.21. Demostrar que una función de valor realf en un intervalo abiertoI es continua en cualquier punto donde exista su derivada, es decir, donde\lim _{x \rightarrow a} \frac{f(x)-f(a)}{x-a} exista. ¿Cuál es lo contrario de esta afirmación? Demostrar que lo contrario no es cierto.
EJERCICIO 5.22. Demostrar que si la funciónf tiene el límiteL de la derecha ena, entonces la secuenciaf\left(a+\frac{1}{n}\right) tiene límiteL comon \rightarrow \infty. Demostrar que lo contrario es falso en general.
EJERCICIO 5.23. Dejarf yg ser funciones reales. Vamosa \in \mathbb{R} y supongamos que\lim _{x \rightarrow a} g(x)=L_{1} y\lim _{x \rightarrow L_{1}} f(x)=L_{2} . Demostrar que\lim _{x \rightarrow a} f \circ g=L_{2} . Sig es continuo ena yf es continuo eng(a), esf \circ g continuo ena?
EJERCICIO 5.24. Quef sea una función real,a \in \mathbb{R} y\lim _{x \rightarrow a} f(x)=L. Si\left\langle a_{n}\right\rangle converge aa, demostrar que\left\langle f\left(a_{n}\right)\right\rangle converge aL.
EJERCICIO 5.25. Ejemplo Completo 5.26. Es decir, probar que\lim _{n \rightarrow \infty}\left(\frac{1}{n^{3}}\right) \frac{(n)(n+1)(2 n+1)}{6}=1 / 3 . EJERCICIO 5.26. Evaluar ¿\lim _{n \rightarrow \infty} \sum_{k=0}^{n}\left(\frac{k}{n}\right) \frac{1}{n} .Se puede dar una interpretación geométrica de este límite?
EJERCICIO 5.27. Utilice la inducción para demostrar que cada polinomio es continuo en cada número real.
EJERCICIO 5.28. Vamos-1<x<1. Demostrar que la serie geométrica con relaciónx, \sum_{k=0}^{\infty} x^{k}, converge a\frac{1}{1-x}.
EJERCICIO 5.29. Que los números de FibonacciF_{n} se definan como en el Ejercicio 4.12. Considera la serie PowerF(x)=\sum_{n=1}^{\infty} F_{n} x^{n}. Demostrar que la serie power satisfaceF(x)=x^{2} F(x)+x F(x)+x . Solve (5.32) paraF(x), descomponerla por fracciones parciales y usar Ejercicio5.28 para derivar Fórmula4.20. Esta técnica para encontrar una fórmula paraF_{n} estudiar la funciónF suele ser fructífera. La funciónF se llama la función generadora para la secuencia.
EJERCICIO 5.30. Supongamos que se define una secuencia con la misma relación de recurrencia que los números de FibonacciF_{n+2}=F_{n+1}+F_{n}, pero con diferentes valores iniciales paraF_{1} yF_{2}. Encontrar la función generadora para la nueva secuencia, y de ahí calcular una fórmula para el término general. ¿\lim _{n \rightarrow \infty} F_{n+1} / F_{n}Siempre es lo mismo?
EJERCICIO 5.31. Demostrar que el seno y el coseno son funciones continuas en todos\mathbb{R}.
CAPÍTULO 6
Cardinalidad
En este capítulo utilizamos funciones para explorar la idea del tamaño de un conjunto. Los resultados que obtenemos son profundos y muy interesantes, especialmente cuando consideramos la simplicidad de las herramientas que estamos utilizando. Por supuesto, tendremos que usar estas herramientas de alguna manera hábilmente.
La teoría de conjuntos viene en diferentes sabores. El más difícil es la teoría de conjuntos axiomática. Muchos resultados interesantes se han derivado en la teoría de conjuntos axiomática formal, pero el tema es avanzado y no es adecuado para una introducción a las matemáticas superiores. En cambio, estudiaremos lo que se llama teoría de conjuntos ingenua. El uso de la palabra “ingenuo” no es peyorativo, sino que pretende diferenciar este enfoque de la teoría de conjuntos axiomática. La mayoría de los matemáticos han estudiado la teoría de conjuntos ingenua, pero relativamente pocos han trabajado extensamente con axiomas de conjuntos.
Cardinalidad
Deseamos comparar el tamaño de los conjuntos. La herramienta fundamental para nuestra investigación es la biyección. En el caso de los conjuntos finitos, que se pueden enumerar exhaustivamente, esto es fácil. Dados dos conjuntos finitos cualesquiera,X yY, podríamos enumerar los elementos y contarlos. Siempre que nuestras listas no tengan redundancias, el conjunto más grande es el que tiene el conteo más alto. El acto de enumerar los elementos en un conjunto, donde esto es posible, también es definir una biyección desde un número natural (interpretado como un conjunto) hasta el conjunto que se está contando. La idea de usar funciones para comparar el tamaño de los conjuntos puede generalizarse a conjuntos arbitrarios.
A la hora de comparar el tamaño de los sets infinitos hay intuiciones en competencia. Por un lado tenemos la intuición de que si un conjunto es un subconjunto propio de otro conjunto, debería ser más pequeño. Por otro lado si dos conjuntos son infinitos, ¿cómo puede uno ser más grande que el otro? El uso de biyecciones, inyecciones y suryecciones para definir el tamaño relativo de los conjuntos nos permite ver nuestro camino a través de esta paradoja.
Definición. Equinumero, cardinalidad DejarX yY ser conjuntos. Eso decimosX yY tenemos la misma cardinalidad si hay una biyecciónf: X \mapsto Y. Podemos expresar que dos conjuntos tienen la misma cardinalidad por|X|=|Y| . Si|X|=|Y|, entonces decimos esoX yY son equinúmeros.
RECLAMACIÓN. La equinumerosidad es una relación de equivalencia.
(Demostrar esto: Ejercicio 6.2).
Si bien antes de ahora usamos las ideas finitas e infinitas, las definiremos en términos de bijecciones.
DEFINICIÓN. Finito, infinito LetX be a set. Xes finito si existe algunan \in \mathbb{N} y una biyecciónf:\ulcorner n\urcorner \mapsto X. En el caso de queX=\emptyset, decimos queX es biyectiva con\ulcorner 0\urcorner vía la función vacía. Si noX es finito, decimos queX es infinito.
Entonces un conjunto es finito si es biyective con un conjunto\ulcorner n\urcorner para algunosn \in \mathbb{N}. Probablemente no sea de sorprender que un conjunto no pueda ser biyective con diferentes números naturales.
PROPOSICIÓN 6.1. Vamosm, n \in \mathbb{N}. Después(|\ulcorner m\urcorner|=|\ulcorner n\urcorner|) \Longleftrightarrow(m=n) . Discusión. Demostramos la dirección no trivial de este bicondicional por inducción en uno de los enteros en el enunciado.
PRUEBA. \Leftarrow
Vamosm=n. Entonces es obvio que|\ulcorner m\urcorner|=|\ulcorner n\urcorner| .\Rightarrow
Argumentamos por inducción sobrem.
Caso base:
Sim=0 y\left|\left\ulcorner^{n}\right\urcorner\right|=\mid\left\ulcorner_{m}||\right. entonces claramenten=0.
Paso de inducción:
Dejemosm \in \mathbb{N} y supongamos que(\forall n \in \mathbb{N})\left[\left|\left\ulcorner^{\prime}\right\urcorner\right|=|\ulcorner\urcorner|\right] \Rightarrow[m=n] Demostramos que(\forall n \in \mathbb{N})[|\ulcorner m+1\urcorner|=|\ulcorner n\urcorner|] \Rightarrow[m+1=n] Supongamos que\left|\left\ulcorner^{m}+1\right\urcorner\right|=\left|\left\ulcorner^{\urcorner} n\right\rangle\right| Dejemosf:\ulcorner m+1\urcorner \longmapsto\ulcorner n\urcorner Discusión Una forma natural de proceder con este argumento es restringir el dominio def a\ulcorner m\urcorner y usar la hipótesis de inducción. Desafortunadamente sif(m) \neq n-1 entonces no\left.\left.f\right|_{\ulcorner m}\right\urcorner es una bijección de\ulcorner m\urcorner a\ulcorner n-1\urcorner, y la hipótesis de inducción no se aplicará directamente. Para abordar este tema, definiremos una permutacióng:\ulcorner m+1\urcorner \rightarrow\ulcorner m+1\urcorner que reordene los elementos de\ulcorner m+1\urcorner tal manera quef \circ g será una biyección satisfactoria(f \circ g)(m)=n-1 Definimos de lag:\ulcorner m+1\urcorner \rightarrow\ulcorner m+1\urcorner siguiente manera:\ [g (x) =\ left\ {\ begin {array} {clc}
f^ {-1} (n-1) &\ text {if} & x=m\\
m &\ text {si}\ quad x=f^ {-1} (n-1)\\
x &\ text {de lo contrario.}
\ end {array}\ derecho.\] Vamosh=f \circ g. Entoncesh es una bijección yh(m)=(f \circ g)(m)=n-1
FIGURA 6.2. Imagen de la permutacióng
Por lo tanto\left.h\right|_{\left\ulcorner_{m}\right\urcorner}:\ulcorner m\urcorner \mapsto\ulcorner n-1\urcorner . Por la hipótesis de inducciónm=n-1 .m+1=n . Por lo tanto Por el principio de inducción,(\forall m \in \mathbb{N})(\forall n \in \mathbb{N})(|\ulcorner m\urcorner|=|\ulcorner n\urcorner|) \Rightarrow(m=n) . COROLARIO 6.3. SiX es un conjunto finito, hay exactamente unon \in \mathbb{N} tal que\ulcorner n\urcorner es biyective conX.
Discusión. Este es un argumento de singularidad estándar. Suponemos que un conjunto es biyectiva con números naturales\ulcorner n\urcorner y\ulcorner m\urcorner, y usamos que la composición de las biyecciones es una biyección para demostrarlom=n. Esto no es una prueba por contradicción. Más bien estamos demostrando que dos nombres cualesquiera para los números naturales que son biyectivos conX deben nombrar al mismo número natural. Comprobante. Xes finito, entonces hayn \in \mathbb{N} tal que|X|=|\ulcorner n\urcorner| . Letm \in \mathbb{N} y|X|=|\ulcorner m\urcorner| . Letf: X \mapsto\ulcorner n\urcorner yg: X \mapsto\ulcorner m\urcorner. Entoncesg^{-1}:\ulcorner m\urcorner \mapsto X. La composición de las biyecciones es una bijección,f \circ g^{-1}:\ulcorner m\urcorner \mapsto\ulcorner n\urcorner . por lo que Por la Proposición 6.1,m=n . DEFINICIÓN. Cardinalidad finita SiX es un conjunto finito, decimos que tiene cardinalidad finita. Dejarn \in \mathbb{N} ser el número natural único tal que\ulcorner n\urcorner sea biyective conX. Entonces decimos queX tiene cardinalidadn, o|X|=n \text {. } Corolario6.3 garantiza que la cardinalidad de un conjunto finito está bien definida.
Conjuntos Infinitos
Los sets infinitos son misteriosos. Muchas paradojas clásicas abordan confusiones históricas sobre la idea del infinito. Al mismo tiempo, a matemáticos de los antiguos griegos les ha resultado imposible desarrollar el pensamiento matemático sin el uso del infinito. ¿Por qué es así? Desde un punto de vista metafísico, la idea del infinito probablemente no sea necesaria. Desde un punto de vista físico, no hay evidencia de infinito. Es decir, el universo, tal como lo entendemos, es finito. Incluso desde un punto de vista teológico, el infinito es en cierta medida el complemento de lo finito -y, en consecuencia, da origen a sus propias paradojas.
El infinito ha molestado a algunos matemáticos y filósofos, y algunos han tratado de prescindir de él. No hay muchos adeptos a esta escuela. La idea del infinito es tan útil que el estudiante de matemáticas tendrá que desarrollar cierta comodidad con la idea -y sus consecuencias lógicas. En cualquier caso, el infinito existe claramente en el universo matemático, exista o no en el mundo natural, y usar el infinito ha sido crucial para desarrollar una comprensión matemática del mundo natural. En esta sección iniciamos una investigación de conjuntos infinitos.
Utilizaremos inyecciones y suryecciones para construir alguna maquinaria analítica para comparar conjuntos.
NOTACIÓN. \preceqDejarX yY ser conjuntos. EscribimosX \preceq Y si hay una inyecciónf: X \rightarrow Y \text {. } Esta notación sugiere que, bajo las condiciones de la definición, pensamosX que es “no mayor que” queY. Esto tiene sentido, ya que somos capaces de asociarnos a cualquier elemento deX un elemento distinto deY. Sif en la definición hay una sobreyección, entonces tambiénf es una biyección y|X|=|Y|. De lo contrario,f es una función que se asocia con cada elemento del rango def (que es un subconjunto apropiado deY) un elemento único deX, yY todavía tiene algunos elementos no contabilizados por f. EntoncesY podría ser “más grande” queX, pero ciertamente no será “más pequeño”. Es posible que desee considerar esta definición en el caso especial de conjuntos finitosX yY. Observarás queX \preceq Y \Longleftrightarrow|X| \leq|Y| . En el Ejercicio 6.3 se te pide que demuestres que\preceq es transitivo y reflexivo.
OBSERVACIÓN. ¿Hay dos conjuntos comparables con respecto a\preceq? Sorprendentemente, requiere de una suposición más avanzada, llamada Axioma de Elección (ver Apéndice B), para garantizar la comparabilidad de todos los pares de conjuntos. Prácticamente todos los matemáticos aceptan el Axioma de Elección. Asumiremos el Axioma de Elección en este texto.
SiX \preceq Y yY \preceq X, esperaríamos queX yY sean del mismo tamaño. Esto es cierto, aunque la prueba es un poco complicada. El resultado es muy útil, ya que muchas veces es mucho más fácil anotar dos inyecciones que una biyección. TEOREMA 6.4. Teorema de Schröder-Bernstein LetX andY be sets. SiX \preceq Y yY \preceq X, entonces|X|=|Y|.
Discusión. La idea detrás de esta prueba es la siguiente. Lo demostramos|X|=|Y| construyendo una biyecciónF: X \nrightarrow Y. Nos dan inyeccionesf: X \rightarrow Y yg: Y \rightarrow X. ConstruimosF usando las inyeccionesf yg como guías. Es decir, queremos definir deF manera que para cada unox \in X, ya seaF(x)=f(x) oF(x)=g^{-1}(x). Es obvio que esto no se puede lograr ciegamente. Por ejemplo, six \in X \backslash g[Y], nuestra mano es forzada, yF(x)=f(x). De igual maneray \in Y \backslash f[X], si, nuestra única oportunidad de lograr nuestro objetivo es paraF(g(y))=y. Si tomamos la decisión equivocada paraF(x), perderemos el uso def yg como guías. Podríamos considerarF indecisos sobrex desde entoncesf yg^{-1} no estamos de acuerdo. La solución es usarf y movernos de un ladog a otro entreX yY hasta que encontremos que nuestra mano está forzada.
Comprobante. Dejarf: X \rightarrow Y yg: Y \rightarrow X ser inyecciones. Podemos suponer esoX yY somos disjuntos.
Discusión. SiX y noY son disjuntos, podemos reemplazarX conX \times\{0\} yY conY \times\{1\}. La existencia de una biyección implicag: X \times\{0\} \mapsto Y \times\{1\} claramente la existencia de una biyección deX aY.
Six \in X decimosy \in Y es el predecesor dex sig(y)=x. Análogamente, siy \in Y decimos quex \in X es el antecesor dey iff(x)=y. Es posible que un elemento no tenga predecesor. Por ejemplo, six \in X \backslash g[Y], entonces nox tiene predecesor. Sin embargo, si un elemento sí tiene un predecesor, ese predecesor es único (ya quef yg son ambas inyecciones). Dado un elementow, dejam(w) ser 0 siw no tiene predecesor. De lo contrario, dejem(w) ser el número máximoN \geq 1 tal que haya una secuencia finita\left\langle z_{n} \mid 0 \leq n \leq N\right\rangle para algunosN \geq 1 satisfactorios
(1)w=z_{N}
(2) Porquen<N, z_{n} es el predecesor dez_{n+1}, si existe el máximo. Si el máximo no existe (es decir, si se pueden hacer cadenas arbitrariamente largas de predecesores), vamosm(w)=\infty.
Ahora define\ [\ begin {alineado} X_ {e} &=\ {x\ in X\ mid m (x)\ text {es par}\}\\ X_ {o} &=\ {x\ in X\ mid m (x)\ text {es impar}\}\\ X_ {i} &=\ {x\ in X\ mid m (x) =\ infty\}\ Y_ {e} &=\ {y\ in Y\ mid m (y)\ text {es par}\}\\ Y_ {o} &=\ {y\ in Y\ mid m (y)\ text {es impar }\}\\ Y_ {i} &=\ {y\ in Y\ mid m (y) =\ infty\} \ end {alineado}\] La colección\left\{X_{e}, X_{o}, X_{i}\right\} es obviamente una partición deX. Del mismo modo,\left\{Y_{o}, Y_{e}, Y_{i}\right\} es una partición deY.
Ahora estamos en condiciones de definir una bijección entreX yY. Dejar\ [F (x) =\ left\ {\ begin {array} {ccc} f (x) &\ text {if} & x\ in X_ {i}\\ f (x) &\ text {if} & x\ in X_ {e}\\ g^ {-1} (x) &\ text {if} & x\ in X_ {o}. \ end {array}\ right.\] Discusión. Nos queda algo de trabajo en esta prueba. Tenemos que verificar queF es una bijección deX aY. La idea detrás de la definición deF puede no ser obvia, así que investiguemos la motivación para la definición. Supongamosg quef y no sean sobreyecciones (si alguna de las funciones es una suryección no habría nada que probar, ya que también sería una biyección). Dejarx \in X \backslash g[Y] yy \in Y \backslash f[X]. Ya quex \notin g[Y], la única opción posible paraF(x) esf(x). De igual maneray \notin f[X],, y el único valor posible deF^{-1}(y) esg(y). Pero esto no resuelve todos nuestros problemas. El conjuntoX \backslash g[Y] está conformado por aquellos integrantes de losX que no tienen antecesores, yY \backslash f[X] está integrado por los integrantes deY sin antecesores. Si vamos a definirF juntandof yg, encontramos que nuestras manos se vieron forzadas con estos conjuntos. Ahora supongamos que esox \in X tiene exactamente un antecedente. Entonces nog^{-1}(x) tiene predecesor. Como observamos anteriormente, necesitamos satisfacerF^{-1}\left(g^{-1}(x)\right)=g\left(g^{-1}(x)\right)=x y por lo tanto debemos satisfacerF(x)=g^{-1}(x) . De igual manera, siy \in Y tiene exactamente un antecedente, debemos satisfacerF^{-1}(y)=f^{-1}(y) . Si un elementow deX \cup Y tiene finitamente muchos antecedentes,\left.F\right|_{A(w)} estarán determinados por la restricción impuesta por el antecedente sin antecedente.
Afirmamos queF: X \mapsto Y . Se ve fácilmente queF está bien definido. Ya queX_{o} \subseteq g[Y] yg es una inyección,\left.F\right|_{X_{o}}=\left.g^{-1}\right|_{X_{o}} está bien definida. EsoF está bien definidoX_{e} yX_{i} es obvio. Además\ [\ begin {reunió} F\ left [X_ {e}\ right] =f\ left [X_ {e}\ right] =Y_ {o}\\ F\ left [X_ {o}\ right] =g^ {-1}\ left [X_ {o}\ right] =Y_ {e} \ end {reunió}\] yF\left[X_{i}\right]=f\left[X_{i}\right]=Y_{i} . Discusión. A pesar de que no tuvimos otra opción en la definición deF onX_{e} yX_{o}, podríamos haber definidoF así que\left.F\right|_{X_{i}}=\left.g^{-1}\right|_{X_{i}}.
Por lo tanto,
F[X]=F\left[X_{e} \cup X_{o} \cup X_{i}\right]=f\left[X_{e}\right] \cup g^{-1}\left[X_{o}\right] \cup f\left[X_{i}\right]=Y_{o} \cup Y_{e} \cup Y_{i}=Y .AsíF es una sobrejección. Demostramos queF es una inyección. Vamosx, z \in X, y supongamosF(x)=F(z). Six \in X_{e}, entoncesF(x) \in Y_{o} yz \in X_{e}. De ahíF(x)=f(x)=f(z)=F(z) . que Sincef sea una inyección, así es\left.f\right|_{X_{e}}. Por lo tantox=z.
Six \in X_{o}, entoncesF(x) \in Y_{e} yz \in X_{o}. EntoncesF(x)=g^{-1}(x)=g^{-1}(z)=F(z) . La funcióng es una inyección, por lo tanto\left.g^{-1}\right|_{X_{o}} es una inyección y asíx=z.
Por último, six \in X_{i}, entoncesF(x) \in X_{i} yz \in X_{i}. AsíF(x)=f(x)=f(z)=F(z) . que yaf es una inyección,x=z.
Por lo tantoF es una inyección. De ahí,F: X \mapsto Y y|X|=|Y| . TEOREMA 6.5. \mathbb{N}es un conjunto infinito.
Discusión. Mostramos que cualquier función con dominio\ulcorner n\urcorner, puesn \in\mathbb{N}, no logra ser una suryección. Por lo tanto, no\mathbb{N} es finito.
Comprobante. Asumirn \in \mathbb{N}, yf:\ulcorner n\urcorner \longrightarrow \mathbb{N} . Leta=1+\sum_{i=0}^{n-1} f(i) \in \mathbb{N} . Claramentea \notin f[\ulcorner n\urcorner], así nof es una sobrejección. En consecuencia, no hay ningunan \in \mathbb{N} que pueda ser mapeada de manera surjectiva\mathbb{N}. Por lo tanto, no\mathbb{N} es finito. No sólo es\mathbb{N} un conjunto infinito, es en cierto sentido el conjunto infinito “más pequeño”.
TEOREMA 6.6. SiX es infinito, entonces\mathbb{N} \preceq X.
Discusión. Definiremos una inyecciónf: \mathbb{N} \rightarrow X inductivamente, construyéndola paso a paso.
Prueba. ComoX es infinito, no está vacío, por lo que debe contener algún elementox_{0}. Definirf(0)=x_{0}.
Ahora, supongamos que todosx_{0}=f(0), x_{1}=f(1), \ldots, x_{n}=f(n) han sido elegidos, así que eso\left.f\right|_{\{0,1, \ldots, n\}}=\left.f\right|_{n+1\urcorner}: k \mapsto x_{k} es inyectivo. ComoX es infinita, la función\left.f\right|_{\left.{ }_{n+1}\right\urcorner} que hemos definido no puede ser suryectiva. Entonces existe algunosx_{n+1} enX \backslash\left\{x_{0}, \ldots, x_{n}\right\}. Definirf(n+1)=x_{n+1}. Continuando de esta manera, alcanzamos una inyecciónf definida en todos\mathbb{N}.
OBSERVACIÓN. El lector astuto pudo haber notado que en la prueba anterior, terminamos haciendo un número infinito de elecciones de elementos deX.
DEFINICIÓN. Cardinalidad,\aleph_{0} Utilizamos la expresión\aleph_{0} (léase “aleph nought” 1) para el tamaño de\mathbb{N}. Es decir\aleph_{0}:=|\mathbb{N}| \text {. } El tamaño de un conjunto se llama la cardinalidad del conjunto. Cualquier conjunto que sea biyective con\mathbb{N} tiene cardinalidad\aleph_{0}. Un conjunto finito tiene cardinalidad igual al número natural único con el que es biyectiva.
DEFINICIÓN. Contable Un conjunto que es finito o tiene cardinalidad\aleph_{0} se denomina conjunto contable.
No estamos desarrollando formalmente la idea de cardinalidad. Esto requeriría trabajar con los ordinales, lo que nos distraería de intereses matemáticos más inmediatos. Sin embargo, usaremos el lenguaje
{ }^{1} \alephes la primera letra del alfabeto hebreo. y convenciones de cardenales donde es intuitiva y no interfiere con nuestro programa.
Conjuntos incontables
En esta sección demostramos uno de los resultados más notables de las matemáticas modernas. Hay conjuntos que no son contables. Cuando este resultado fue comunicado por primera vez en 1878 por Georg Cantor, asombró al mundo matemático. De este resultado se deduce que, en el sentido más significativo, existen diferentes tamaños de infinito. Supongamos que noX es un conjunto contable. Por teorema 6.6,\mathbb{N} \preceq X. Por el Teorema de Schröder-BernsteinX \preceq \mathbb{N}, si|\mathbb{N}|=|X|, entonces, yX sería contable. Entonces si noX es contable,X \npreceq \mathbb{N}, y\mathbb{N} \prec X. Es decir,\aleph_{0}<|X| \text {. } DEFINICIÓN. Incontable Un conjunto que no es contable se llama incontable.
Por supuesto, todavía tenemos que demostrar que hay conjuntos incontables.
NOTACIÓN. \precDejarX yY ser conjuntos. EntoncesX \prec Y siempre queX \preceq Y y|X| \neq|Y| . escribimos|X| \leq|Y| siX \preceq Y, y|X|<|Y| siX \prec Y.
Definición. Power set,P(X) LetX be a set. EntoncesP(X)=\{Y \mid Y \subseteq X\} .P(X) se llama el conjunto de poder deX. Es el conjunto de todos los subconjuntos deX.
El siguiente teorema, debido a G. Cantor, es uno de los resultados más notables de las matemáticas. No sólo prueba la existencia de un conjunto incontable, implica que el conjunto de poder genera necesariamente conjuntos de cardinalidad mayor y con ello proporciona un medio para construir infinitamente muchas cardinalidades infinitas diferentes. TEOREMA 6.7. XDéjese ser un conjunto. Después|X|<|P(X)| . Discusión. Para probar este resultado necesitamos demostrar que una bijección entre un conjunto y su conjunto de potencia es imposible. ¿Cómo se muestra la imposibilidad de tal función? Podemos suponer que tal bijección existe y derivar una contradicción. Alternativamente, podemos demostrar que cualquier función, desde un conjunto hasta su conjunto de potencia, necesariamente falla en ser una suryección, que es casi lo mismo, y más elegante. Necesitamos demostrar que cualquier función de un conjunto a su conjunto de potencia “echa de menos” algunos elementos del conjunto de potencia. Utilizaremos una técnica conocida como argumento diagonal para construir un elemento del conjunto de potencia que no esté en el rango de la función. El dominio,X, actúa como un índice para realizar un seguimiento de los elementos del rango de la función (este es otro uso para las funciones). Construimos un elemento queY \in P(X) no está en el rango de la función agregandox \in X aY iff nox está en el elemento deP(X) indexado porx (es decir, nox está en el imagen dex debajo de la función). Es fácil demostrar que este subconjuntoY de noX está en el rango de la función y, por lo tanto, la función no logra ser una sobreyección sobreP(X).
Comprobante. Observamos que la funcióng: X \rightarrow P(X) definida porg(x)=\{x\} es una inyección. En el caso elX=\emptyset, g es la función vacía es decir, la función cuya gráfica es la\emptyset. (Debe verificar que la función vacía es una inyección.) Por lo tanto,|X| \leq|P(X)| \text {. }f: X \rightarrow P(X) vamos a definirY:=\{x \in X \mid x \notin f(x)\} . Discusión. Recordemos que para cada unox \in X, f(x) es un subconjunto deX. Por lo tanto, tiene sentido considerar six es un elemento def(x). ¡El sabor autorreferencial de este argumento lo hace desafiante en la primera lectura!
Claramente,Y \subseteq X ¿esY \in f[X]? Supongamos que lo fuera, así queY=f\left(x_{0}\right) para algunosx_{0} enX. Pero entonces,x_{0} estaría enY iff nox_{0} estaban enf\left(x_{0}\right)=Y. Esto es imposible, contradiciendo la suposición en la queY se encuentraf[X].
Podrías intentar repararf modificándolo para incluir en su rango el conjunto diagonal que construimos. Al aplicar nuevamente el argumento diagonal, se identificará un nuevo elemento que falta en el rango de la función modificada. De hecho, la mayoría de los elementos del codominio faltan en el rango de la función, aunque esto no es inmediatamente obvio a partir de la prueba.
Todavía podría estar confundido por el motivo por el que a esto se le llama argumento diagonal. Esto será obvio cuando apliquemos la técnica a secuencias binarias infinitas.
SiX es finito el teorema es obvio. En efecto, si hayn \in \mathbb{N} tal que|X|=n, entonces|P(X)|=2^{n}. El teorema6.7 implica que cualquier conjunto, incluido un conjunto infinito, es estrictamente más pequeño que su conjunto de potencia. De hecho, al iterar las aplicaciones de la función power set to\mathbb{N}, se ve fácilmente que hay infinitamente muchos conjuntos infinitos de cardinalidad distinta en la secuencia de conjuntos\langle\mathbb{N}, P(\mathbb{N}), P(P(\mathbb{N})), \ldots\rangle (¿Cuál es la cardinalidad de la unión sobre esta secuencia? ¿Cuál es la cardinalidad del conjunto de poder de esa unión?)
Demostraremos que dos conjuntos más son incontables. Ambos son conjuntos de interés matemático. Primero mostraremos que las secuencias binarias infinitas son incontables. Las secuencias binarias infinitas son funciones de\mathbb{N} a\ulcorner 2\urcorner. Como veremos, existe una relación muy estrecha entre secuencias binarias infinitas y el conjunto de potencias de\mathbb{N}. De manera más general, la colección de todas las funciones de un conjunto a otro puede ser de interés matemático. Introducimos una notación para tales colecciones.
NOTACIÓN. Y^{X}DejarX yY ser conjuntos. Se escribe el conjunto de todas las funciones con dominioX y codominioYY^{X}.
No confundas esto con exponenciación. Sin embargo siX yY son finitos,\left|Y^{X}\right|=|Y|^{|X|} . El conjunto de todas las funciones de algún conjuntoX en\ulcorner 2\urcorner está en correspondencia biyectiva conP(X):
Proposición 6.8. DejarX ser un conjunto, y definirF:\ulcorner 2\urcorner X \rightarrow P(X) por: para\chi \in\ulcorner 2\urcorner X,F(\chi)=\chi^{-1}(1) . Eso esF(\chi)=\{x \in X \mid \chi(x)=1\}. EntoncesF:\ulcorner 2\urcorner^{X} \rightarrow P(X) es una biyección.
PRUEBA. La prueba se deja como ejercicio.
La existencia de esta biyección nos permite probar fácilmente el siguiente teorema.
TEOREMA 6.9. El conjunto de secuencias binarias infinitas es biyective conP(\mathbb{N}) y por lo tanto es incontable.
PRUEBA. Por Proposición6.8\left|\ulcorner 2\urcorner^{\mathbb{N}}\right|=|P(\mathbb{N})| . Por Teorema 6.7,|\mathbb{N}| \prec|P(\mathbb{N})| . Por lo tanto\ulcorner 2\urcorner^{\mathbb{N}} es incontable.
Notación. 2^{\mathbb{N}_{0}}Utilizamos2^{\mathbb{N}_{0}} para la cardinalidad de\left\ulcorner 22^{\mathbb{N}}\right.. Vale la pena ilustrar mediante una aplicación a infinitas secuencias binarias por qué la técnica utilizada para probar el Teorema6.7 se denomina argumento diagonal (a veces llamado el segundo argumento diagonal, para distinguirlo del “primer argumento diagonal” en la Sección 6.4). Vamosf: \mathbb{N} \rightarrow\ulcorner 2\urcorner \mathbb{N}. Demostramos que nof es una sobreyección por aplicación directa del argumento diagonal en la prueba del Teorema 6.7. Enumeramos todos los elementos en el rango def; cada uno es una secuencia de 0's y 1's.\ [\ begin {aligned}
& f (0) =a_ {00}\ quad a_ {01}\ quad a_ {02}\ quad a_ {03}\ quad\ ldots\ quad a_ {0 j}\ ldots\\
& f (1) =a_ {10}\ aquad _ {11}\ cuádruple a_ {12}\ quad a_ {13}\ cuádruple\ lpuntos \ quad a_ {1 j}\ quad\ ldots\\
& f (2) =a_ {20}\ quad a_ {21}\ quad a_ {22}\ quad a_ {23}\ quad\ ldots\ cuádruple a_ {2 j}\ cuádruple\ lpuntos\\
& f (3) =a_ {30}\ quad a_ {31}\ quad a_ {32}\ a_ {33}\ quad\ ldots\ quad a_ {3 j}\ quad\ ldots
\ end {alineado}\] Ahora creamos una secuencia alterando la diagonal elementos de esta matriz infinita. sSea la secuencia de elementos diagonales\left\langle 1-a_{00}, 1-a_{11}, \ldots, 1-a_{i i}, \ldots\right\rangle .\ [\ begin {alineada}
& f (1) =a_ {10}\ izquierda\ langle\ izquierda\ langle 1-a_ {11}\ derecha\ rangle\ quad a_ {12}\ quad a_ {13}\ quad\ ldots\ quad a_ {1 i}\ quad\ ldots\ derecha. \\
& f (2) =a_ {20}\ quad a_ {21}\ izquierda\ langle\ begin {array} {lllllll}\ izquierda\ langle 1-a_ {22}\ derecha\ rangle & a_ {23} &\ ldots & a_ {2 i} &\ ldots\ end {array}\ derecha. \\
& f (3) =a_ {30}\ quad a_ {31}\ quad a_ {32}\ izquierda\ langle\ izquierda\ langle 1-a_ {33}\ derecha\ rangle\ cuádruple\ ldots\ quad a_ {3 i}\ quad\ ldots\ derecha. \\
& f (i) =a_ {i 0}\ quad a_ {i 1}\ quad a_ {i 2}\ quad a_ {i 3}\ quad\ ldots,\ izquierda\ langle 1-a_ {i i}\ derecha\ rangle^ {s_ {i}}\ ldots
\ end {alineado}\] FIGURA 6.10. El segundo argumento diagonal
La secuencias es un elemento de\ulcorner 2\urcorner^{\mathbb{N}}, y difiere de cada elemento en el rango def: de hecho,s difiere def(i) en al menos lai^{\text {th }} ranura. De ahí,s \notin f[\mathbb{N}], y así nof es una sobrejección. Lo dejamos como un ejercicio para mostrar ques es el conjunto diagonalY construido en la prueba del Teorema 6.7, dondeX=\mathbb{N}. Más precisamente,s es la imagen deY bajo la bijección natural deP(\mathbb{N}) a\ulcorner 2\urcorner^{\mathbb{N}} de la Proposición 6.8.
Consideramos otro conjunto de interés matemático, el conjunto de todas las secuencias decimales infinitas. Este conjunto tiene una estrecha relación con el intervalo cerrado[0,1]. Comprender esta relación requiere una comprensión más profunda y formal de los números reales de lo que la mayoría de los estudiantes han estado expuestos en el cálculo, y posponemos la discusión detallada de esta relación hasta la Sección 8.9. Con algunas modificaciones, el siguiente teorema demostrará que[0,1] es incontable, y por lo tanto\mathbb{R} es incontable (ver Sección 8.9).
TEOREMA 6.11. El conjunto de expansiones decimales infinitas es incontable. De hecho,\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} . DISCUSIÓN. La función de identidad en las secuencias binarias infinitas en las secuencias decimales infinitas es claramente una inyección. Construiremos una inyección de las secuencias decimales infinitas a secuencias binarias infinitas. El teorema seguirá del Teorema de Schröder-Bernstein.
Prueba. Es obvio que\left|\ulcorner 2\urcorner^{\mathbb{N}}\right| \leq\left|\ulcorner 10\urcorner^{\mathbb{N}}\right| . (¿Por qué?) Vamos a definir una inyecciónf:\ulcorner 10\urcorner^{\mathbb{N}} \rightarrow\ulcorner 2\urcorner^{\mathbb{N}} . Letx \in\ulcorner 10\urcorner^{\mathbb{N}}. Entonces,x=\left\langle x_{j} \mid j \in \mathbb{N}\right\rangle ¿dóndex_{j} está elj^{t h} miembro de la secuenciax y0 \leq x_{j} \leq 9 . queremos definir una secuencia binarias(x) que “codifica”x. Hay muchas maneras de hacerlo. Una es mirar bloques de 10 bits (abreviatura de “dígitos binarios”), y, enj^{\text {th }} dicho bloque, tener nueve de los bits 0, y poner un 1 en lax_{j}^{\text {th }} ranura. Formalmente, dada una secuencia decimal infinitax, definimos una secuencia binariaf(x)=\left\langle y_{i} \mid i \in \mathbb{N}\right\rangle para quey_{i}=1 si hayj \in \mathbb{N} tal quei=10 j+x_{j} . De lo contrarioy_{i}=0. Con ello definimos una funciónf:\ulcorner 10\urcorner \rightarrow\ulcorner 2\urcorner . Demostramos quef es una inyección. Dejarx yy ser elementos distintos de\ulcorner 10\urcorner^{\mathbb{N}}. Entonces hay algunosj \in \mathbb{N} tales quex_{j} \neq y_{j} . Entonces10 j+x_{j} \neq 10 j+y_{j} . Vamosi=10 j+x_{j}. Entoncesf(x) yf(y) difieren en eli^{\text {th }} componente. Es decir,(f(x))_{i}=1 \neq 0=(f(y))_{i} . Por lo tantof es una inyección y\left|\ulcorner 10\urcorner^{\mathbb{N}}\right| \preceq\left|\ulcorner 2\urcorner^{\mathbb{N}}\right| . Por el Teorema de Schröder-Bernstein, (6.12) y (6.13) rendimiento\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} . Demostramos en Sección8.9 que|[0,1]|=\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|, esencialmente identificando un real número con su expansión decimal. Si asumimos este resultado, podemos probar fácilmente que los números reales son incontables. COROLARIO 6.14. \mathbb{R}es incontable.
Conjuntos Contable
Los incontables conjuntos que hemos identificado hasta ahora tienen una cierta característica estructural en común. Hemos demostrado que el conjunto de todas las funciones desde un dominio infinito fijo hasta un codominio fijo de al menos dos elementos es incontable. El teorema de Cantor de que el conjunto de poder de un conjunto contable infinito es incontable también se puede interpretar de esta manera. SiX es un conjunto, entonces seP(X) puede entender como\ulcorner 2\urcorner X, el conjunto de todas las funciones deX a\ulcorner 2\urcorner. En el caso de conjuntos finitos,X yY, el conjunto de todas las funciones desdeX hastaY, Y^{X}, tiene cardinalidad|Y|^{|X|}. Es decir, la cardinalidad de\{f \subseteq X \times Y \mid f \text { is a function }\} es una función exponencial de|X|. Por supuesto, las funciones exponenciales crecen relativamente rápido. Para los conjuntos finitos, la cardinalidad de la unión de conjuntos disjuntos es la suma de las cardinalidades de los conjuntos. La cardinalidad del producto directo de dos conjuntos finitos es producto de las cardinalidades. ¿Qué pasa con la unión o el producto directo de conjuntos infinitos contables? ¿Pueden las operaciones de conjunto de unión y producto directo generar conjuntos incontables a partir de conjuntos contables? Respondemos primero a las preguntas para los sindicatos (adición).
La siguiente proposición simplificará algunos de los detalles técnicos en los argumentos que siguen.
PROPOSICIÓN 6.15. DejarX yY ser conjuntos. Luego hay una sobrejecciónf: X \rightarrow Y iff|Y| \leq|X| .
Discusión. Utilizaremos los conjuntos de niveles de la sobreyecciónf para definir la inyección deY aX. Esto utiliza la maquinaria de relaciones de equivalencia desarrollada en el Capítulo 2 con el Axioma de Elección.
Comprobante. (\Rightarrow)
DejarX, Y yf ser como en el enunciado de la proposición. \widehat{f}: X / f \rightarrow YSea la biyección canónica asociada a laf que se definió en la Sección 2.3. Nos preguntamos si hay una inyeccióng: X / f \rightarrow X dondeg([x]) \in[x]. Recordemos queX / f es la colección de subconjuntos de niveles deX, con respecto af, y es una partición deX. ¿Por qué no simplemente elegir un elemento de cada clase de equivalencia yg definir como la función deX / f aX definida por estas elecciones?
DISCUSIÓN. El Axioma de Elección es la afirmación de que existen tales funciones de “elección”.
La funcióng es claramente una inyección, también log \circ \widehat{f}^{-1}: Y \rightarrow X es una inyección. Por lo tanto si hay una sobrejecciónf: X \rightarrow Y, entonces|Y| \leq|X|.
(\Leftarrow)
La prueba de esta implicación se deja como ejercicio.
TEOREMA 6.16. Teorema de Cantor\left\{X_{n} \mid n \in \mathbb{N}\right\} Sea una familia de conjuntos tal queX_{n} sea contable para todosn \in \mathbb{N}, yX=\bigcup_{n \in \mathbb{N}} X_{n}. Después|X| \leq \aleph_{0} Discusión. Este Teorema, también debido a G. Cantor, es el resultado clave para demostrar que los conjuntos son contables. Se prueba mediante una técnica también llamada argumento diagonal (a veces llamado el primer argumento diagonal). Usamos el conjunto de índices\mathbb{N} para construir una matriz infinita, y usamos esa matriz para ilustrar una enumeración de la unión. Esta enumeración es una subyección de\mathbb{N} aX.
PRUEBA. Porquen \in \mathbb{N}, X_{n} es contable y por Proposición6.15 hay una sobrejecciónf_{n}: \mathbb{N} \rightarrow X_{n} Usa las funcionesf_{n} para construir una matriz infinita. La0^{\text {th }} columna contendrá todos los elementos deX_{0}, en el ordenf_{0}(0), f_{0}(1), f_{0}(2), \ldots (No importa si el mismo elemento se enumera varias veces). La siguiente columna tiene los elementos deX_{1} en el ordenf_{1}(0), f_{1}(1), f_{1}(2), etc. definimos una funcióng: \mathbb{N} \rightarrow X atravesando esta matriz a lo largo de las diagonales noreste a suroeste, a saberg(0)=f_{0}(0), g(1)=f_{1}(0), g(2)=f_{0}(1), g(3)=f_{2}(0), g(4)=f_{1}(1), g(5)=f_{0}(2), g(6)=f_{3}(0), y así sucesivamente.
FIGURA 6.17. El primer argumento diagonal
Entoncesg es una sobreyección, porque cada elemento de\bigcup X_{n} ocurre en la matriz, y por lo tanto está en el rango deg. Por Proposición 6.15,|X| \leq \aleph_{0} . COROLARIO 6.18. DejarA ser un conjunto contable y\left\{X_{\alpha} \mid \alpha \in A\right\} ser una familia de conjuntos contables indexados por A. Entonces\left|\bigcup_{\alpha \in A} X_{\alpha}\right| \leq \aleph_{0} \text {. } Prueba. Ya queA es contable, hay una sobrejecciónf: \mathbb{N} \rightarrow A . Por lo tanto\bigcup_{\alpha \in A} X_{\alpha}=\bigcup_{n \in \mathbb{N}} X_{f(n)} Por el Teorema de Cantor 6.16,\left|\bigcup_{\alpha \in A} X_{\alpha}\right| \leq \aleph_{0} . COROLARIO 6.19. \mathbb{Z}es contable.
Discusión. Sin demasiado esfuerzo, podríamos definir una bijección de\mathbb{N} a\mathbb{Z}. En cambio probaremos la existencia de la biyección sin definir explícitamente una biyección.
Comprobante. f: \mathbb{N} \rightarrow \mathbb{Z}Sea tal quef(n)=-n . Entoncesf[\mathbb{N}] sea contable. Por el teorema de Cantor\mathbb{Z}=\mathbb{N} \cup f[\mathbb{N}] es contable.
Volvemos nuestra atención a los productos directos.
TEOREMA 6.20. Sin \in \mathbb{N}, yX_{1}, X_{2}, \ldots, X_{n} son conjuntos contables, entoncesX_{1} \times X_{2} \times \cdots X_{n} es contable.
Comprobante. Suponemos que todos los factores, noX_{1}, \ldots, X_{n} están vacíos. Argumentamos por inducción sobre el número de factores.
Caso base:n=2. X_{1} \times X_{2}=\bigcup_{x \in X_{2}} X_{1} \times\{x\}Para cada unox \in X_{2},\left|X_{1}\right|=\left|X_{1} \times\{x\}\right| . Por Corolario 6.18,X_{1} \times X_{2} es contable.
Paso de inducción: Supongamos que para cualquier colección de conjuntosn contablesX_{1}, \ldots X_{n}, el productoX_{1} \times \cdots \times X_{n} es contable. LetX_{1}, \ldots, X_{n+1} Ser conjuntos no vacíos contables. EntoncesX_{1} \times \cdots \times X_{n+1}=\left(X_{1} \times \cdots \times X_{n}\right) \times X_{n+1} Por la hipótesis de inducción,X_{1} \times \cdots \times X_{n} es contable, y por el caso base el producto directo de dos conjuntos contables es contable. Por lo tanto,X_{1} \times \cdots \times X_{n+1} es contable.
COROLARIO 6.21. \mathbb{Q}es contable.
Comprobante. Dejarf: \mathbb{Z} \times \mathbb{Z} \rightarrow \mathbb{Q} ser definido por\ [f (a, b) =\ left\ {\ begin {array} {ccc} a/b &\ text {if} & b\ neq 0\\ 0 &\ text {de lo contrario.} \ end {array}\ right.\] Entoncesf es una sobrejección, y por Proposición6.15, \mathbb{Q} es contable.
Hemos evaluado la secuencia anidada de conjuntos,\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{R} \text {. } Estos son conjuntos matemáticos importantes y, con la excepción de\mathbb{R}, son contables. Investigamos la cardinalidad de un conjunto más entre\mathbb{Q} y\mathbb{R}.
DEFINICIÓN. Número real algebraico,\mathbb{K} Un número real\alpha es algebraico si hay un polinomiop (no idénticamente 0) con coeficientes enteros tales quep(\alpha)=0. Vamos a denotar el conjunto de todos los números algebraicos por\mathbb{K}.
Cualquier número racionala / b \in \mathbb{Q} es algebraico, ya quea / b es una raíz del polinomiop(x)=b x-a . Además, en el Ejemplo 3.23, demostramos que\sqrt{2} es irracional, y es claramente algebraico, ya que es una raíz dex^{2}-2. Por lo tanto tenemos\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{K} \subseteq \mathbb{R} . Finalmente lo demostramos\mathbb{K} \neq \mathbb{R} demostrando que\mathbb{K} es contable. TEOREMA 6.22. \mathbb{K}es contable.
Discusión. Este resultado se demuestra mostrando que los números reales algebraicos pueden ser construidos por un procedimiento contable. Es decir,\mathbb{K} puede construirse agregando a\mathbb{Q} contablemente muchos elementos a la vez contabilizadamente muchas veces. El Teorema de Cantor implica que cualquier conjunto así construido será contable.
PRUEBA. Dejarn \in \mathbb{N} y definirf: \prod_{i=0}^{n} \mathbb{Z} \rightarrow \mathbb{Z}[x]f\left(a_{0}, \ldots, a_{n}\right)=\sum_{i=0}^{n} a_{i} x^{i} . por Por Corolario 6.19,\mathbb{Z} es contable. Por Teorema 6.20,\prod_{i=0}^{n} \mathbb{Z} es contable. El rango def es el conjunto de polinomios con coeficientes enteros con grado\leq n (o el polinomio idénticamente igual a 0). Por Proposición6.15, el rango de una función con un dominio contable también es contable. Por lo tanto, el conjunto de polinomios de grado\leq n es contable.
DejarP_{n} ser el conjunto de polinomios con coeficientes enteros de grado\leq n. Entonces\mathbb{Z}[x]=\bigcup_{i=0}^{\infty} P_{n} . Por Teorema 6.16,\mathbb{Z}[x] es contable. Por Teorema 4.10, sip(x) es un polinomio con coeficientes reales de gradon, tiene a lo sumo raícesn reales. LetZ_{p}=\{\alpha \mid p(\alpha)=0\} . SoZ_{p} es finito para cada polinomiop. Aplicar nuevamente el Teorema de Cantor (Teorema 6.16),\mathbb{K}=\bigcup_{p \in \mathbb{Z}[x]} Z_{p} es contable.
COROLARIO 6.23. \mathbb{K} \neq \mathbb{R}
Dado que\mathbb{K} es contable y\mathbb{R} es incontable,\mathbb{K} es un subconjunto propio de\mathbb{R}. DEFINICIÓN. Número trascendental Un número real que no es algebraico se llama número trascendental.
Corolario6.23 afirma que hay números trascendentales. Se trata de una pretensión de existencia en la que no se presenta ningún testigo de la demanda. Más bien es un ejemplo de argumento de conteo (sobre conjuntos infinitos). Hay demasiados números reales para que todos sean algebraicos. A finales del siglo XIX se demostró que\pi ye son trascendentales, pero estas pruebas son mucho más complicadas que la prueba de existencia de Cantor anterior, que es, en esencia, una aplicación muy inteligente del principio del casillero.
COROLARIO 6.24. Hay incontables muchos números trascendentales.
PRUEBA. TSea el conjunto de números trascendentales. Como|\mathbb{R}|=|T \cup \mathbb{K}|>\aleph_{0}, y\mathbb{K} es contable,T debe ser incontable.
Por lo que hemos demostrado que\mathbb{N} \subsetneq \mathbb{Z} \subsetneq \mathbb{Q} \subsetneq \mathbb{K} \subsetneq \mathbb{R} . Sin embargo,|\mathbb{N}|=|\mathbb{Z}|=|\mathbb{Q}|=|\mathbb{K}|<|\mathbb{R}|
Funciones y Computabilidad
En Sección1.3 hicimos el comentario improvisado de que la mayoría de las funciones no están definidas por reglas (por lo que nos referimos a instrucciones para computar la función). Consideramos que una regla es una instrucción (en algún idioma) de longitud finita. Las funciones que están definidas inequívocamente por una regla de longitud finita se denominan funciones computables o recursivas. Naturalmente existe una definición matemática complicada de funciones recursivas, pero vamos a prescindir de las formalidades y decir que una función es recursiva, o computable, si existe una instrucción (de longitud finita) para encontrar la imagen de cualquier elemento en el dominio. ¿Cuántas funciones computables hay?
Restringiremos nuestra investigación a funciones desde\mathbb{N} hasta\mathbb{N}. Consideramos las funciones como gráficas de funciones. Es decir, cada subconjunto deP(\mathbb{N} \times \mathbb{N}) que satisface la definición de una función es una función en\mathbb{N}^{\mathbb{N}}. ¿Todas esas funciones son computables? Es obvio que2^{\aleph_{0}} \leq\left|\mathbb{N}^{\mathbb{N}}\right| \text {. } (¿Por qué?) De hecho se puede demostrar que los sets son biyectivos. Entonces hay incontables muchas funciones en\mathbb{N}^{\mathbb{N}}. ¿Cuántas instrucciones para las funciones de cómputos hay? Una instrucción es una cadena finita, o secuencia, de símbolos. Por ejemplo, una instrucción para la función que cuadra números naturales esf(x)=x^{2} . Esta es una secuencia finita de siete símbolos. La instrucción da suficiente información para calcular la imagen de cualquier número natural. Hay muchas otras reglas para computar esta función. Por ejemplo, la reglaf(x)=x \cdot x obviamente define la misma función, pero la instrucción es diferente, contiene un símbolo más. Considere el conjunto de todas las instrucciones posibles para computar funciones de números naturales. ¿Cómo se formulan las instrucciones? Se produce una secuencia finita de símbolos que forma una guía explícita para computar la imagen de cualquier número natural.
DejarX ser el conjunto de todos los símbolos que aparecen en las instrucciones para computar funciones de números naturales. El conjuntoX incluirá letras, dígitos, símbolos para operaciones, símbolos para relaciones y potencialmente cualquier otro símbolo que puedas ver en un libro sobre matemáticas. ¿Qué tan grande esX? Si requieres que cada símbolo aparezca en algún diccionario real, claramente sería finito. Probablemente desee permitir que aparezca cualquier número natural en la instrucción. Sin embargo, aunque hay infinitamente muchos números naturales, solo necesitamos diez símbolos para nombrarlos a todos. Parece que razonablemente podemos exigir queX sea finito, pero como resulta, podemos permitir que sea contablemente infinito sin cambiar nuestra conclusión.X
Si hay algún lenguaje con muchos símbolos contables en los que se pueda escribir el conjunto de todas las instrucciones para funciones de computación, entonces podemos suponer queX es contable. SiF es una instrucción o regla (y por lo tanto una secuencia finita de símbolos deX), entonces hayN \in \mathbb{N} tal queF \in X^{N} \text {. } Así se ve fácilmente que el conjunto de todas las instrucciones posibles para los elementos de\mathbb{N}^{\mathbb{N}}, I, satisface I \preceq \bigcup_{N \in \mathbb{N}} X^{N} .PorqueN \in \mathbb{N}, X^{N} es el producto directo deN factores deX, y por Teorema6.20,\left|X^{N}\right| \leq \aleph_{0} . El conjunto\bigcup_{N \in \mathbb{N}} X^{N} es la unión contable de conjuntos contables, y por Teorema 6.16es contable. Por lo tanto, son incontables muchas funciones de los números naturales que no están definidas por reglas.
Para un tratamiento más exhaustivo de la teoría de conjuntos, consulte el libro [5] de Yiannis Moschovakis.
Ejercicios
EJERCICIO 6.1. Dejarf: X \mapsto Y yg: Y \mapsto Z. Demostrar queg \circ f: X \rightarrow Z es una biyección.
EJERCICIO 6.2. Demostrar que la equinumerosidad es una relación de equivalencia.
EJERCICIO 6.3. Demostrar que la relación en los sets\preceq es reflexiva y transitiva. EJERCICIO 6.4. En la prueba del Teorema de Schröder-Bernstein, defina una función\ [G (x) =\ left\ {\ begin {array} {clc} g^ {-1} (x) &\ text {if} & x\ in X_ {i}\\ f (x) &\ text {if} & x\ in X_ {e}\\ g^ {-1} (x) &\ text {if} & X_ {o} \ end {array}\ right.\] Demostrar que G: X \mapsto Y.
EJERCICIO 6.5. Vamosn \in \mathbb{N}. Demuestra que|P(\ulcorner n\urcorner)|=2^{n} . EJERCICIO 6.6. VamosX=\{0,1,2\}. Anota alguna funciónf:X \rightarrow P(X). Para este particularf, ¿cuál es el conjuntoY del Teorema 6.7?
EJERCICIO 6.7. DejarX ser un conjunto y definir una secuencia de conjuntos\left\langle X_{n} \mid n \in \mathbb{N}\right\rangle porX_{0}=X yX_{n+1}=P\left(X_{n}\right) . LetY=\bigcup_{n=0}^{\infty} X_{n}. Prueba(\forall n \in \mathbb{N})\left|X_{n}\right|<|Y| . EJERCICIO 6.8. DejarX yY ser conjuntos finitos. Probar que\left|X^{Y}\right|=|X|^{|Y|} \text {. } EJERCICIO 6.9. Demostrar Proposición 6.8.
EJERCICIO 6.10. Letf: \mathbb{N} \rightarrow\ulcorner 2\urcorner^{\mathbb{N}} y parai, j \in N^{+}a_{i j}=(f(i))_{j} . (Es decir,a_{i j} es elj^{t h} término de lai^{t h} secuencia.) Déjeses ser la secuencia “diagonal” Eso los=\left\langle 1-a_{n n} \mid n \in N^{+}\right\rangle . sabemoss \notin f[\mathbb{N}]. SiF:\ulcorner 2\urcorner^{\mathbb{N}} \mapsto P(\mathbb{N}) es la biyección en la Proposición 6.8, entoncesF \circ f: \mathbb{N} \rightarrow P(\mathbb{N}). Demostrar que eseF(s) es el conjunto “diagonal” de Teorema6.7 (dondeX=\mathbb{N}, yF \circ f es la enumeración de subconjuntos de\mathbb{N}), y por lo tanto esoF(s) \notin(F \circ f)[\mathbb{N}]. EJERCICIO 6.11. Demostrar que siX \subseteq Y yX es incontable, entoncesY es incontable.
EJERCICIO 6.12. DejarX ser un conjunto incontable,Y ser un conjunto contable yf: X \rightarrow Y. Demostrar que algún elemento deY tiene una preimagen incontable.
EJERCICIO 6.13. Completar el comprobante de la Proposición 6.15.
EJERCICIO 6.14. Definir una bijección explícita de\mathbb{N} a\mathbb{Z}.
EJERCICIO 6.15. |\mathbb{K} \backslash \mathbb{Q}|=\aleph_{0}Demuéstralo.
EJERCICIO 6.16. Demostrar quee=\sum_{n=0}^{\infty} \frac{1}{n !} es irracional. (Pista: Argumenta por contradicción. ¡Asumire=\frac{p}{q} y multiplicar ambos lados porq!. Reorganice la ecuación para obtener un entero igual a una suma infinita de números racionales que converja a un número en el intervalo abierto)(0,1).
Comentario: Esto también fue el Ejercicio 3.32. ¿Ahora es más fácil?
EJERCICIO 6.17. Supongamos quea, b, c, d \in \mathbb{R}, a<b yc<d. Demostrar
a) El intervalo abierto(a, b) es biyectiva con el intervalo abierto(c, d).
b) El intervalo cerrado[a, b] es biyectiva con el intervalo cerrado[c, d].
c) El intervalo abierto(0,1) es biyectiva con el intervalo cerrado[0,1].
d) El intervalo abierto(a, b) es biyectiva con el intervalo cerrado[c, d].
e)|[0,1]|=|\mathbb{R}|.
EJERCICIO 6.18. Construir bijecciones explícitas para cada uno de los pares de conjuntos en el Ejercicio 6.17.
EJERCICIO 6.19. f(x)Sea un polinomio distinto de cero con coeficientes enteros, y supongamos que\alpha \in \mathbb{R} es trascendental. Demostrar quef(\alpha) es trascendental. EJERCICIO 6.20. F: \mathbb{K} \rightarrow \mathbb{R}Sea definido por: Six \in \mathbb{K}, F(x) es el grado más bajo de un polinomio con coeficientes enteros para el cualx es una raíz. ¿EstáF bien definido?
EJERCICIO6.21. Dejara \in \mathbb{R} ser una raíz de un polinomio con coeficientes racionales. Demostrar quea es una raíz de un polinomio con coeficientes enteros, y por lo tanto es un número algebraico.
EJERCICIO 6.22. Para cada uno de los siguientes conjuntos, indique y pruebe si es biyectiva con\mathbb{N}, P(\mathbb{N}) o es mayor queP(\mathbb{N}) (con respecto a la relación\prec):
a) El conjunto de subconjuntos finitos de\mathbb{N}
b) El conjunto de todas las permutaciones de conjuntos finitos de números naturales
c) El conjunto de secuencias finitas de números naturales
d) El conjunto de secuencias finitas de números enteros
e) El conjunto de secuencias finitas de números algebraicos
f) El conjunto de secuencias finitas de números reales
g) El conjunto de secuencias infinitas de números naturales
h) El conjunto de secuencias infinitas de números reales
i) Subconjuntos contables de\mathbb{R}.
h)\mathbb{N}^{\mathbb{R}}
k)\mathbb{R}^{\mathbb{R}}.
Puedes usar el hecho de que|\mathbb{R}|=2^{\aleph_{0}}.
EJERCICIO 6.23. \left|\mathbb{R}^{\mathbb{R}}\right| \geq|P(\mathbb{R})|Demuéstralo.
CAPÍTULO 7
Divisibilidad
En este capítulo investigamos la divisibilidad. Puede parecer peculiar que investiguemos un tema que has estudiado desde la primaria, pero no te dejes engañar por la aparente sencillez del tema. El estudio de la divisibilidad de los números enteros forma parte de la teoría de números. La geometría y la teoría de números son las áreas más antiguas del estudio matemático, y siguen siendo campos activos de la investigación matemática.
Teorema fundamental de la aritmética
DEFINICIÓN. Divide, factor Leta, b \in \mathbb{Z}. Decimos quea divideb, oa es un factor deb, si(\exists c \in \mathbb{Z}) a \cdot c=b . Escribimos esto comoa \mid b. Sia no divideb escribimosa \nmid b.
La divisibilidad es la idea central de la teoría de números. Es precisamente porque un entero no necesita ser un factor de otro entero, o un par de enteros puede no tener factores comunes no triviales, que la divisibilidad proporciona una visión de la estructura de los enteros. Dicho de otra manera, considere la definición de divisibilidad aplicada a los números racionales; encontrará que no proporciona ninguna idea en absoluto ya que un número racional distinto de cero es un factor de cualquier otro número racional. Además, muchas de las propiedades de los enteros con respecto a la divisibilidad generalizan muchas de las propiedades de los enteros con respecto a la divisibilidad generalizan de esta en la Sección 7.5.
DEFINICIÓN. Número primo Letp \in \mathbb{N}. Decimos quep es un número primo sip>1 y los únicos factores positivos dep sonp y 1. DEFINICIÓN. Relativamente prime Leta, b \in \mathbb{Z}. Eso decimosa yb son relativamente primos si no tienen un factor común mayor a 1.
DEFINICIÓN. Combinación entera Leta, b, c \in \mathbb{Z}. Entoncesc es una combinación entera dea yb si(\exists m, n \in \mathbb{Z}) c=m a+n b . PROPOSICIÓN 7.1. Vamosa, b \in \mathbb{Z}. Sia yb son relativamente primos, entoncesa-b yb son relativamente primos.
Discusión. Demostraremos lo contrapositivo demostrando que cualquier factor común dea-b y tambiénb es un factor dea.
Prueba. Dejarc>1 ser un factor común deb ya-b. Entonces(\exists m \in \mathbb{Z}) b=c m y(\exists n \in \mathbb{Z}) a-b=c n . Entoncesc(m+n)=a y asíc \mid a. Por lo tanto sia yb son relativamente primos, entoncesa-b yb son relativamente primos.
PROPOSICIÓN 7.2. Dejara yb ser enteros. Sia yb son relativamente primos, entonces(\exists m, n \in \mathbb{Z}) m a+n b=1 . Discusión. Argumentaremos a favor del caso en el quea yb son números naturales. Dada la propuesta para todos los pares de números naturales relativamente primos, podemos extenderla fácilmente a pares arbitrarios de números enteros relativamente primos cambiando el signo dem on en la combinación de enteros. Esta suposición nos permite argumentar por inducción sobre la suma de los enteros. El argumento base para este argumento por inducción seráa+b=3. Sia=0=b, entoncesa y nob son relativamente primos. Sia+b=1, entoncesa yb son relativamente primos y la elección dem yn es obvia. Sia=b=1 entoncesa yb son relativamente primos y nuevamente la elección dem yn es obvia.
Comprobante. Eso podemos suponera>b>0. Argumentamos por inducción sobrea+b.
Caso base:a+b=3.
Entoncesa=2 yb=1. Entonces pasoa-b=1 . de inducción:
Supongamos que el resultado se mantiene para todos los pares de números naturales relativamente primos con suma menor quea+b.
Por la Proposición 7.1,b ya-b son relativamente primos. Por la hipótesis de inducción, hayi, j \in \mathbb{Z} tales quei(a-b)+j b=1 . Discusión. Sia-b=b, no estamos en el caso donde tenemos dos números positivos distintos. ¿Cómo manejamos esta posibilidad?
Dejarm=i yn=j-i. Entoncesm a+n b=1 . Por el principio de inducción el resultado se mantiene para todos los pares relativamente primos de números naturales.
DEFINICIÓN. Mayor divisor común,\operatorname{gcd}(a, b) Leta, b \in \mathbb{Z}. El mayor divisor común dea yb, escrito\operatorname{gcd}(a, b), es el entero más grande que divide ambosa yb.
Entoncesa yb son relativamente primos iff\operatorname{gcd}(a, b)=1.
Proposición 7.3. Vamosa, b, c \in \mathbb{Z}, y asumamos eso\operatorname{gcd}(a, b)=1. Sia \mid c b, entoncesa \mid c.
PRUEBA. Por Proposición7.2 haym, n \in \mathbb{Z} tales quem a+n b=1 . Por lo tantoc m a+c n b=c . Claramentea \mid c n b( desdea \mid c b) ya \mid c m a. Entoncesa \mid(c m a+c n b) y por lo tantoa \mid c.
PROPOSICIÓN 7.4. Dejea, b, c \in \mathbb{Z} . Si\operatorname{gcd}(a, b)=1, a \mid c yb \mid c, luegoa b \mid c PRUEBA. Quem, n \in \mathbb{Z} sean tales quea m=c yb n=c. Entoncesa \mid b n Por Proposición7.3, a \mid n. De ahí que hayak \in \mathbb{Z} tal quea k=n Thereforea k b=c ya b \mid c LEMMA 7.5. Supongamos que
(1)p \in \mathbb{N} es primo
(2)N \geq 1 ya_{1}, \ldots, a_{N} \in \mathbb{Z}
(3)p \mid\left(\prod_{n=1}^{N} a_{n}\right).
Entonces hay algunosn \leq N tales quep \mid a_{n}.
Comprobante. Dejarp ser un número primo. Argumentamos por inducción sobreN.
Caso base:N=1
El caso base es obvio.
Paso de inducción:
VamosN>1 y supongamos que el resultado se mantiene para todos los productos de menos queN factores.
Vamosa=\prod_{n=1}^{N-1} a_{n} y supongamos quep \mid\left(\prod_{n=1}^{N} a_{n}\right) . Entoncesp \mid a \cdot a_{N} . Sip \mid a, entonces por la hipótesis de inducción,(\exists n<N) p \mid a_{n} . Supongamos que nop es un factor dea; ya quep es primo, \operatorname{gcd}(p, a)=1. Por la Proposición 7.3,p \mid a_{N}.
TEOREMA 7.6. Teorema Fundamental de la Aritmética LetN Ser un número natural mayor a 1. EntoncesN puede expresarse de manera única como el producto de números primos (hasta el orden de los factores).
DISCUSIÓN. Permitimos un “producto” con un solo factor. Así que cualquier número primo es su propio factoring primo único.
PRUEBA. Argumentamos por inducción sobre los números naturales mayores que1 .
Caso base:(N=2)
Por la discusión que precede a la prueba, 2 es su propio factoring principal.
Paso de inducción:
Supongamos que el resultado se mantiene para todos los números naturales mayores que 1 y menores queN. SiN es primo, el resultado sigue. Si noN es primo, entonces haya, b \in \mathbb{N}, a<N yb<N, tal quea \cdot b=N \text {. } Por la hipótesis de inducción,a yb tienen factorizaciones primos únicas. El producto de los factorings será un factoraje principal deN. ¿El factoring es único a la orden? Supongamos queN=\prod_{i=1}^{m} p_{i}=\prod_{j=1}^{n} q_{j} dondep_{i} es primo para1 \leq i \leq m, yq_{j} es primo para1 \leq j \leq n. Entoncesp_{1} \mid \prod_{j=1}^{n} q_{j} . Por Lema 7.5,(\exists j \leq n) p_{1} \mid q_{j} . Podemos reordenar los factoresq_{1}, \ldots, q_{n} para quep_{1} \mid q_{1}. Ambosp_{1} yq_{1} son primos, por lop_{1}=q_{1} . tanto\prod_{i=2}^{m} p_{i}=\prod_{j=2}^{n} q_{j}<N . Por lo tanto Por la hipótesis de inducción,p_{2}, \ldots, p_{m} es un factor primo único de\prod_{i=2}^{m} p_{i}, asím=n yq_{2}, \ldots, q_{n} es un reordenamiento dep_{2}, \ldots, p_{m}. Por lo tanto,q_{1} \cdots q_{n} es un reordenamiento dep_{1} \cdots p_{m} y el factoring principal deN es único.
OBSERVACIÓN. ¿Por qué el número 1 no se define como primo? Después de todo, ¡no tiene otros factores que él mismo o 1! La razón es porque es muy útil tener singularidad en el Teorema Fundamental de la Aritmética. Si 1 se considerara prime, podría incluirse arbitrariamente a menudo en la factorización deN.
El algoritmo de división
El Algoritmo de División, Teorema 7.11, es el resultado que garantiza que la división larga de los números naturales terminará en un cociente único y restará con el resto estrictamente más pequeño que el divisor. La división larga es difícil y tediosa para los jóvenes estudiantes. Por lo general, es el cálculo más desafiante que se espera que dominen los estudiantes de primaria. Es posible que hayas vuelto a visitar el algoritmo cuando aprendiste a dividir polinomios. Aquí el Algoritmo de División dice que el cociente y el resto son únicos y el resto es idéntico 0 o tiene grado estrictamente menor que el divisor. Frecuentemente comparamos la aritmética de enteros y la aritmética de polinomios, y es el Algoritmo de División el que hace útil esta comparación.
Extendamos el vínculo entre las combinaciones de enteros y los mayores divisores comunes. Según Lemma 7.2, un par de enteros son relativamente primos si hay una combinación entera del par que es igual a 1. Este resultado generaliza a los mayores divisores comunes distintos de1 .
TEOREMA 7.7. Vamosa, b \in \mathbb{Z}. El conjunto de combinaciones enteras de a yb es igual al conjunto de múltiplos enteros de\operatorname{gcd}(a, b).
Prueba. Letc=\operatorname{gcd}(a, b) yM=\{k c \mid k \in \mathbb{Z}\} . Desdec es un divisor dea yb, hayi, j \in \mathbb{Z} tal quea=i c yb=j c . LetI=\{m a+n b \mid m, n \in \mathbb{Z}\} . Mostramos primero que I \subseteq M.
Sim, n \in \mathbb{Z}, entoncesm a+n b=m i c+n j c=(m i+n j) c . De ahí cada combinación entera dea yb es un múltiplo dec yI \subseteq M . Ahora lo mostramosM \subseteq I. Dejark c \in M yr=\operatorname{gcd}(i, j) . Entonces haym, n \in \mathbb{Z} tales quer m c=i c=a yr n c=j c=b . Asír c \mid a yr c \mid b. De ahí\operatorname{gcd}(a, b) \geq r c \geq c . Sin embargo\operatorname{gcd}(a, b)=c, y asír=1. Por lo tantoi yj son relativamente primos.
Por la Proposición 7.2, hay una combinación entera dei yj que es igual a 1. Queu, v \in \mathbb{Z} sean tales queu i+v j=1 . Entoncesc(u i+v j)=c yk c=k c(u i+v j)=k(u a+v b) por ecuaciones7.14 y7.15. De ahík c \in I, y comok fue arbitrario,M \subseteq I . COROLARIO 7.8. Vamosa, b \in \mathbb{Z}. Entonces\operatorname{gcd}(a, b) es la combinación entera positiva más pequeña dea yb.
El teorema nos7.7 dice que las combinaciones enteras dea yb son precisamente los múltiplos enteros de\operatorname{gcd}(a, b) (que resulta ser la combinación entera positiva más pequeña dea yb). Pensamos en\operatorname{gcd}(a, b) como “generar” a través de la multiplicación el conjunto de combinaciones enteras dea yb. PROPOSICIÓN 7.9. Vamosa, b, k \in \mathbb{Z}. Después\operatorname{gcd}(a, b)=\operatorname{gcd}(a-k b, b) . Prueba. Sic \in \mathbb{Z}, c \mid a yc \mid b, entoncesc \mid a-k b. Por lo tanto\operatorname{gcd}(a, b) \leq \operatorname{gcd}(a-k b, b) . Del mismo modoc \mid b, sic \mid a-k b yc \mid a, entonces, así obtenemos la desigualdad inversa de (7.10), por lo que los dos lados son iguales.
TEOREMA 7.11. Algoritmo de división Leta, b \in \mathbb{Z}, b \neq 0 Entonces hay únicos deq, r \in \mathbb{Z} tal manera quea=q b+r donde0 \leq r<|b|.
Discusión. En el Algoritmo de Divisióna se llama dividendo,q divisor, cociente yr resto.b
Comprobante. Dejara, b \in \mathbb{Z} yb \neq 0. DefinirI \subseteq \mathbb{N} porI=\{a-k b \mid k \in \mathbb{Z}\} \cap \mathbb{N} .I tiene un elemento más pequeñoa-q b,, para algunosq \in \mathbb{Z}.
Reclamación:0 \leq a-q b<|b|.
Prueba de Reclamación. Argumentamos por casos.
Caso 1:b>0
Sia-q b \geq b entoncesa-(q+1) b \geq 0 . De ahía-(q+1) b \in I . Sin embargoa-q b es mínimo enI, entonces esto es imposible. Por lo tantoa-q b<|b| \text {. } Caso 2:b<0
Sia-q b \geq|b|, entoncesa-q b>a-(q-1) b \geq 0 . Como en el primer casoa-(q-1) b \in I Esto es imposible ya que por suposicióna-q b es mínima enI. Pora-q b<|b| lo tanto, sir:=a-q b tenemosa=q b+r y0 \leq r<|b|. Queda por demostrar que el cociente y el resto son únicos. Supongamosa=m b+r=n b+s dónde0 \leq r, s<|b|. Sir=s entoncesm b=n b ym=n. Entonces asumimos esor \neq s. Sin pérdida de generalidad asumimos esor<s. Entonces,0 \leq s-r=(m-n) b<|b| Entoncesm-n=0 yr=s, una contradicción.
Por supuesto,q yr podría encontrarse por división larga -es decir, se pueden restar múltiplos deb hasta que el resto sea menor que|b|.
Algoritmo euclidiano
¿Cómo encontramos\operatorname{gcd}(a, b), paraa, b \in \mathbb{N}? Uno podría invocar el Teorema Fundamental de la Aritmética y comparar las descomposiciones principales dea yb. Supongamosa=\prod_{n=1}^{N} p_{n}^{r_{n}} yb=\prod_{n=1}^{N} p_{n}^{s_{n}} donder_{n}, s_{n} \in \mathbb{N} para1 \leq n \leq N. Si est_{n}=\min \left(r_{n}, s_{n}\right) por1 \leq n \leq N, entonces\operatorname{gcd}(a, b)=\prod_{n=1}^{N} p_{n}^{t_{n}} Sin embargo encontrar la descomposición prima de un entero puede ser bastante difícil. Definiremos una operación sobre pares de enteros que después de un número razonable de aplicaciones producirá el mayor divisor común de los enteros.
Sia, b \in \mathbb{N}, a>b>0, definaE: \mathbb{N}^{2} \rightarrow \mathbb{N}^{2} porE(a, b)=(b, r) dónder está el resto único (al dividirloa porb) cuya existencia se comprobó en el Algoritmo de División. Es decir, sia=q b+r con0 \leq r<b, entonces definaE(a, b):=(b, r) . Sib=0, entoncesE(a, 0)=(a, 0) . vamos Let(a, b) \in \mathbb{N}^{2}, a>b>0. Definimos una secuencia de elementos en\mathbb{N}^{2},\left\langle E_{i}(a, b) \mid i \in \mathbb{N}\right\rangle, por recursión:E_{0}(a, b)=(a, b) y si Mientrasn>0E_{n}(a, b)=E\left(E_{n-1}(a, b)\right) .E_{n}(a, b) tenga componentes distintos de cero, la secuencia de segundos componentes es estrictamente decreciente, por lo que es claro que la secuencia debe eventualmente fijarse en un par ordenado (ver Ejercicio 4.11). Por el Algoritmo de División, esto ocurrirá cuando el segundo componente sea igual a 0. Dejark ser el entero más pequeño tal queE_{k}(a, b)=E_{k+1}(a, b) . Entonces decimos que se\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle estabiliza al pasok. Paran \geq k,E_{n}(a, b)=E_{n+1}(a, b)=E_{k}(a, b) . Si\left\langle E_{n}(a, b)\right\rangle se estabiliza al pasok, es obvio quek \leq b. Por lo general, la secuencia se estabiliza mucho más rápido que esto. TEOREMA 7.12. Vamosa, b \in \mathbb{N}, a>b>0. El componente distinto de cero sobre el que se\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle estabiliza la secuencia es\operatorname{gcd}(a, b).
Comprobante. aDéjese fijar, argumentamos por inducción sobre el menor de los enteros,b.
Caso base:b=1
Luego para cualquieraa>1,E(a, 1)=(1,0) y la secuencia se\left\langle E_{n}(a, 1)\right\rangle estabiliza en el paso 1 con componente distinto de cero1 .
Paso de inducción:
Vamosb>1. Supongamos que el resultado se mantiene para todosc<b, es decir, para cualquier(a, c) \in \mathbb{R}^{2}c<b<a, donde, es el componente distinto de cero del par ordenado en el que se\left\langle E_{n}(a, c)\right\rangle estabiliza la secuencia\operatorname{gcd}(a, c). Mostramos que el componente distinto de cero del par ordenado en el que se\left\langle E_{n}(a, b)\right\rangle estabiliza la secuencia es\operatorname{gcd}(a, b). Sia>b>0 entoncesE(a, b)=(b, a-q b) donde0 \leq a-q b<b. Por la hipótesis de inducción, el componente distinto de cero del par ordenado en el que se\left\langle E_{n}(b, a-q b)\right|n \in \mathbb{N}\rangle estabiliza la secuencia es\operatorname{gcd}(b, a-q b). Por Proposición7.9\operatorname{gcd}(a, b)=\operatorname{gcd}(b, a-q b) . Entonces el componente distinto de cero del par ordenado en el que se\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle estabiliza la secuencia es\operatorname{gcd}(a, b). Por el principio de inducción, el resultado se mantiene para todos los pares ordenados(a, b) \in \mathbb{N}^{2} dondea>b>0.
Un algoritmo es un conjunto de instrucciones computacionales ejecutables. El algoritmo euclidiano es el siguiente conjunto de instrucciones:
Dado un par de números naturales,a>b>0, computar la secuencia\left\langle E_{n}(a, b) \mid n \in \mathbb{N}\right\rangle hasta que la secuencia se estabilice. El componente distinto de cero del par ordenado sobre el que se estabiliza la secuencia es\operatorname{gcd}(a, b).
EJEMPLO 7.13. Dejara=29712375 yb=119119. Encuentra el\operatorname{gcd}(a, b). Utilizamos el Algoritmo Euclidiana. Así\ [\ comenzar {reunido} E_ {0} (a, b) = (a, b)\\ E_ {1} (a, b) =E (a, b) =( b, 51744)\\ E_ {2} (a, b) =E (b, 51744) =( 51744,4851)\\ E_ {3} (a, b) =E (51744,4851) =( 4851,1078)\\ E_ {4} (a, b) =E (4851,1078) =( 1078,539)\\ E_ {5} (a, b) =E (1078,539) =( 539,0). \ end {reunido}\] Por lo tanto\operatorname{gcd}(a, b)=539. Si empleas el Teorema Fundamental de la Aritmética, con algún trabajo puedes determinar119,119=\left(7^{2}\right)(11)(13)(17) . eso29,712,375=\left(3^{2}\right)\left(5^{3}\right)\left(7^{4}\right)(11) y So\operatorname{gcd}(a, b)=\left(7^{2}\right)(11)=539.
El pequeño teorema de Fermat
Notación. \mathbb{Z}_{n}^{*}Vamosn \in \mathbb{N}, n \geq 2. Después\mathbb{Z}_{n}^{*}=\mathbb{Z}_{n} \backslash\{[0]\} . LEMA 7.14. Quea, n \in \mathbb{Z}, n \geq 2, sea tal que\operatorname{gcd}(a, n)=1. Definir\phi_{a}: \mathbb{Z}_{n}^{*} \rightarrow \mathbb{Z}_{n}^{*} por\phi_{a}([b])=[a b] . Entonces\phi_{a} es una permutación de\mathbb{Z}_{n}^{*}. Comprobante. Mostramos que[a],[2 a], \ldots,[(n-1) a] son elementos distintos de\mathbb{Z}_{n}^{*}. Dejemos0<i \leq j<n y supongamos esoi a \equiv j a \bmod n. Entoncesn \mid j a-i a yn \mid(j-i) a . asumimos eso\operatorname{gcd}(n, a)=1, así por Proposición7.3, n \mid(j-i). Sin embargo0 \leq j-i<n, asíj-i=0 yi=j. De ahí, si0<i<j<n, De[i a] \neq[j a] . ello se deduce que\phi_{a} es una inyección de\mathbb{Z}_{n}^{*} a\mathbb{Z}_{n}^{*}. Cualquier inyección de un conjunto finito a sí mismo es una sobreyección, así\phi_{a} es una permutación de\mathbb{Z}_{n}^{*}.
DEFINICIÓN. Orden,o_{p}(a) Letp Ser un número primo ya \in \mathbb{Z} no un múltiplo dep. El orden dea in\mathbb{Z}_{p} es el menosk \in \mathbb{N}^{+} tal quea^{k} \equiv 1 \bmod p. Escribimos el orden dea en\mathbb{Z}_{p} comoo_{p}(a).
Sia es un múltiplo dep, entonces el orden dea in\mathbb{Z}_{p} es indefinido, ya quea \equiv 0 \bmod p, y para todosk \in \mathbb{N}^{+},a^{k} \equiv 0 \quad \bmod p . La siguiente proposición muestra en particular que si ano es un múltiplo dep, entonces el orden está bien definido (es decir, que hay algunosk cona^{k} \equiv 1\bmod p).
PROPOSICIÓN 7.15. Dejara \in \mathbb{Z}, yp ser un número primo tal quep \nmid a. Entonceso_{p}(a)<p.
Comprobante. Dejarp ser un número primo ya \in \mathbb{Z} ser tal que noa sea un múltiplo dep. Por Lema 7.5, comop \nmid a, entoncesp \nmid a^{n}, y por lo tanto\left[a^{n}\right] \in \mathbb{Z}_{p}^{*} para cualquiern \in \mathbb{N}. Ya que\left|\mathbb{Z}_{p}^{*}\right|=p-1, la secuencia finita\left\langle\left[a^{n}\right] \mid 1 \leq n \leq p\right\rangle debe tener una repetición. 1 \leq n<k \leq pSea tal quea^{n} \equiv a^{k} \quad \bmod p . Entoncesp \mid a^{k}-a^{n} . De ahíp \mid a^{n}\left(a^{k-n}-1\right) . Sin embargop \nmid a^{n} y así por la Proposición 7.3,p \mid a^{k-n}-1 . Asía^{k-n} \equiv 1 \quad \bmod p . Por tantoo_{p}(a) \leq k-n<p . la Proposición 7.16. Dejara \in \mathbb{Z} yp ser un número primo tal que noa sea un múltiplo dep. Entonces las clases restantes[1],[a],\left[a^{2}\right], \ldots,\left[a^{o_{p}(a)-1}\right] en\mathbb{Z}_{p} son distintas.
PRUEBA. Ejercicio.
NOTACIÓN. S_{a}(n)Arreglar un primop para el resto de esta sección. Dejar a ser un entero tal quep \nmid a. Entonces para cualquier número natural positivon, dejamosS_{a}(n) denotar el conjunto de clases de equivalencia\left\{\left[n \cdot a^{k}\right] \mid k \in \mathbb{N}\right\} en\mathbb{Z}_{p}. (AunqueS_{a}(n) depende de la elección dep, suprimimos esto en la notación y asumimos quep se entiende).
LEMA 7.17. Quea \in \mathbb{Z} sea tal quep \nmid a. Si non \in \mathbb{N}^{+} es múltiplo dep, entonces\left|S_{a}(n)\right|=o_{p}(a) . Prueba. Por Proposición 7.15,o_{p}(a)<p. Vamosk=o_{p}(a). Por Proposición7.16 las clases restantes[1],[a],\left[a^{2}\right], \ldots,\left[a^{k-1}\right] son distintas. Seamos\phi_{n} definidos como en Lema 7.14. Entonces\phi_{n} es una permutación de\mathbb{Z}_{p}^{*}. Por lo tanto, las clases restantes[n],\left[n a^{2}\right], \ldots,\left[n a^{k-1}\right] son distintas. Peron a^{k} \equiv n \quad \bmod p, SOS_{a}(n)=\left\{[n],\left[n a^{2}\right], \ldots,\left[n a^{k-1}\right]\right\} (¿Por qué?) Por lo tanto\left|S_{a}(n)\right|=o_{p}(a) LEMMA 7.18. Quea \in \mathbb{Z} sea tal quep \nmid a. Entonces para cualquieram, n \in \mathbb{N}^{+} que no sean múltiplos dep, los conjuntosS_{a}(m) yS_{a}(n) sean iguales o disjuntos.
PRUEBA. S_{a}(m) \cap S_{a}(n) \neq \emptyset .Supongamos Letm, n \in \mathbb{N}, \operatorname{gcd}(m, p)=1\operatorname{gcd}(n, p)=1 y\left[m a^{i}\right] \in S_{a}(n) Entonces hayj \in \mathbb{N} tal que\left[m a^{i}\right]=\left[n a^{j}\right] Podemos suponer quei<j, ya que hay infinitamente muchosj \in \mathbb{N}^{+} que satisfacen a la ecuación. Entonces[m]=\left[n a^{j-i}\right] Entonces[m] \in S_{a}(n) Por lo tanto siS_{a}(m) y noS_{a}(n) son disjuntos, tenemosS_{a}(m) \subseteq S_{a}(n) Por simetría, también tenemosS_{a}(n) \subseteq S_{a}(m) y así ya seaS_{a}(m)=S_{a}(n) oS_{a}(m) \cap S_{a}(n)=\emptyset TEOREMA 7.19 . El pequeño teorema de Fermat Sia \in \mathbb{Z} yp es un número primo tal quep \nmid a, entoncesa^{p-1} \equiv 1 \quad \bmod p . Prueba. Vamosk=o_{p}(a). Eso lo demostramosk \mid(p-1). Vamosn \in \mathbb{N}, donde non es un múltiplo dep. Por Lemma7.17\left|S_{a}(n)\right|=k . Por Lemma 7.18, los conjuntos\mathbb{Z}_{p}^{*} se\left\{S_{a}(n) \mid n \in \mathbb{N}^{+}, p \nmid n\right\} particionan en conjuntos de cardinalidadk. Por lo tantok divide\left|Z_{p}^{*}\right|. Ya que\left|Z_{p}^{*}\right|=p-1, tenemos Dek \mid(p-1) . ello se deduce que hayj \in \mathbb{N} tal quea^{p-1} \equiv\left(a^{k}\right)^{j} \equiv 1^{j} \equiv 1 \quad \bmod p . COROLARIO 7.20. Sia \in \mathbb{Z} yp es un número primo tal quep \nmid a, entonces el pequeño teorema dea^{p} \equiv a \quad \bmod p . Fermat es un resultado importante en el estudio teórico de los números primos, y determinando la primalidad. ¿Cómo podría utilizarse el teorema? Considera el problema de decidir si un número natural en particularn es primo. Para determinar sin es primo, puede invocar el Teorema Fundamental de la Aritmética, y comenzar a verificar todos los números primos\sqrt{n} hasta determinar si alguno son factores no triviales den. No es necesario verificar primos mayores que\sqrt{n} ya que la existencia de tal factor conlleva la existencia de un factor menor entonces\sqrt{n}, y por el Teorema Fundamental de la Aritmética, un factor primo menor que\sqrt{n}. Esto puede requerir verificar muchos candidatos, además de requerir que conozca todos los números primos más pequeños que\sqrt{n}, o esté dispuesto a verificar factores que no son primos. Para grandesn este es un reto formidable. Alternativamente, se puede buscara \in \mathbb{Z} tal que\left[a^{n}\right] \neq[a] para determinar que non es primo.\mathbb{Z}_{n}
Por ejemplo, ¿es 12,871 prime? Suponemos que tienes acceso a una computadora (hacer estos cálculos a mano puede ser tedioso). Un enfoque es verificar los factores entre los números primos menores que\sqrt{12,871}, es decir, los treinta números primos menores que 114. Alternativamente, paraa \in \mathbb{Z}, podemos comprobar sia^{12,871} \equiv a \quad \bmod 12,871 . Si la respuesta es no, entonces 12,871 no es primo. Intentaremosa=2:2^{12,871} \equiv 5732 \bmod 12,871 . Por lo tanto 12,871 no es primo. Si tuvieras que verificar los primos secuencialmente, tendrías que verificar 18 primos antes de encontrar que 61 es el primo más pequeño que divide 12,871.
Sia^{12,871} \equiv a \bmod 12,871 por una elección dada dea, entonces no podemos sacar ninguna conclusión. De hecho hay números no primos,n, de tal manera que para cualquier elección dea,a^{n} \equiv a \bmod n . Los números que satisfacen la conclusión del Teorema 7.19, pero que no son primos se llaman números de Carmichael. De modo que el pequeño teorema de Fermat se puede utilizar para demostrar que un número no es primo, sino para demostrar que un número es primo.
Divisibilidad y polinomios
Aplicamos algunas de las ideas sobre divisibilidad introducidas en secciones anteriores de este capítulo a polinomios con coeficientes reales,\mathbb{R}[x]. Esto requiere que tratemos a polinomios algebraicamente. Comenzamos definiendo formalmente las operaciones sobre\mathbb{R}[x]. Letf, g \in \mathbb{R}[x],f(x)=\sum_{n=0}^{N} a_{n} x^{n} yg(x)=\sum_{m=0}^{M} b_{m} x^{m} . Sof es un polinomio de gradoN como máximo yg es un polinomio de grado como máximoM. Para simplificar nuestras expresiones, suscribimos a la convención que para los polinomiosf yg, a_{n}=0 para todosn>N, yb_{m}=0 para todosm>M. Es decir, podemos considerar un polinomio como una serie de potencias en la que todos pero finitamente muchos de los coeficientes equivalen a 0.
OBSERVACIÓN. Si un polinomio es idénticamente igual a una constante distinta de cero, decimos que el polinomio tiene grado cero. Si el polinomio es idéntico cero, no definimos su grado. Esta es una conveniencia notacional: un polinomio de grado 0 es una constante distinta de cero.
Definimos suma y multiplicación en\mathbb{R}[x] porf(x)+g(x):=\sum_{i=0}^{\max (M, N)}\left(a_{i}+b_{i}\right) x^{i} yf(x) \cdot g(x):=\sum_{i=0}^{M+N}\left(\sum_{j=0}^{i} a_{j} \cdot b_{i-j}\right) x^{i} . Debe confirmar que0 \in \mathbb{R}[x] es la identidad aditiva en\mathbb{R}[x], y1 \in \mathbb{R}[x] es la identidad multiplicativa en\mathbb{R}[x]. También debes verificar que la suma y la multiplicación en\mathbb{R}[x] son
(1) asociativo
(2) conmutativo
(3) distributivo (es decir, la multiplicación distribuye sobre la suma).
Demostraremos que una versión del Algoritmo de División es válido para polinomios. En efecto, es la razón por la que la división larga de polinomios es esencialmente similar a la división de enteros.
TEOREMA 7.21. Algoritmo de división Sif, g \in \mathbb{R}[x]g \neq 0, y, entonces hay polinomios únicosq yr tal quef=q \cdot g+r y cualquierar=0 o el grado der es menor que el grado de g. Discusión. Argumentamos primero por la existencia de un cociente y resto que satisfaga la afirmación del teorema. Dejamosg ser un polinomio real arbitrario y argumentamos por inducción sobre el grado def - para este divisor particularg. El principio de inducción arrojará el resultado para el divisorg y cualquier dividendo. Alg ser un polinomio real arbitrario, se garantiza la existencia de un cociente y resto para cualquier divisor y dividendo. La singularidad se demuestra directamente.
Comprobante. Vamosg \in \mathbb{R}[x]. Sig es una constante, entoncesq(x)=(1 / g(x))(f(x)) yr=0 satisfacer la afirmación del teorema. Además, cualquier resto debe ser el polinomio cero, ya que es imposible tener un grado menor que el grado deg. Por lo tanto,q(x)=(1 / g(x))(f(x)) es el cociente único que satisface el Algoritmo de División.
Dejarg ser un polinomio de grado mayor a 0. Demostramos el resultado para todos los posiblesf (para este particularg) por inducción en el grado def. DejarM ser el grado deg yN ser el grado def.
Caso base:N<M
Entoncesq=0 yr=f satisfacer la conclusión del teorema.
Paso de inducción: Supongamos que el resultado se mantiene para todos los polinomios de grado menor queN.N \geq M Demostramos que se sostiene paraf \in \mathbb{R}[x] de gradoN. Asumimos quef(x)=\sum_{n=0}^{N} a_{n} x^{n} dondea_{n} \in \mathbb{R} (para\left.0 \leq n \leq N\right) ya_{N} \neq 0. Vamosg(x)=\sum_{m=0}^{M} b_{m} x^{m} dondeb_{m} \in \mathbb{R} (para0 \leq m \leq M) yb_{M} \neq 0. Leth(x)=\left(\frac{a_{N}}{b_{M}}\right) x^{(N-M)} . Entonces el grado def-h \cdot g es menor queN of-h \cdot g es idénticamente 0. Entonces hays \in \mathbb{R}[x] tal quef=h \cdot g+s dondes=0 o el grado des es menor queN. Sis=0, entonces vamosq=h yr=0.
De lo contrario, por la hipótesis de inducción, hay algún polinomio\bar{q} tal ques=\bar{q} \cdot g+r donder=0 o el grado der es menor queM. Asíf=h g+s=h g+\bar{q} g+r=(h+\bar{q}) g+r . si dejamosq=h+\bar{q} entoncesf=q g+r . Así, por el principio de inducción, para cualquieraf \in \mathbb{R}[x], hayq yr tal quef=q \cdot g+r . Desdeg era un polinomio arbitrario de grado mayor que 0, el resultado se mantiene para todosf yg.
Eso lo demostramosq yr somos únicos. Dejarf=q g+r=\bar{q} g+\bar{r} donde los restos,r y\bar{r}, tienen grado menor que el grado deg o son el polinomio 0. Entonces\ [\ comienzan {reunidos} q g+r- (\ bar {q} g+\ bar {r}) =\\ (q-\ bar {q}) g+ (r-\ bar {r}) =0. \ end {reunido}\] DejarQ=q-\bar{q} yR=r-\bar{r}. Asumir esoQ \neq 0. Entonces el grado de noQ \cdot g es menor que el grado deg. Sin embargo los restosr y\bar{r} tienen grado menor que el grado deg, o son el polinomio 0. Así el grado deR es estrictamente menor que el grado deg, oR=0. La suma de dos polinomios de diferente grado no puede ser idéntica a 0. De ahí que eso sea imposibleQ \neq 0. SiQ=0 entoncesR=0. Por lo tantoq=\bar{q}r=\bar{r} y y el cociente y resto son únicos.
COROLARIO 7.22. Sif \in \mathbb{R}[x] yx_{0} \in \mathbb{R}, entonces hayq \in \mathbb{R}[x] tal quef(x)=\left(x-x_{0}\right) \cdot q(x)+f\left(x_{0}\right) . Prueba. Aplicar el Algoritmo de División cong(x)=x-x_{0}. Entonces el restor es de grado 0, o idénticamente cero, así es constante, y evaluandof(x)=\left(x-x_{0}\right) q(x)+r(x) enx=x_{0} dar(x)=f\left(x_{0}\right). Por lo tanto,f(x)=\left(x-x_{0}\right) q(x)+f\left(x_{0}\right) . utilizamos estos resultados para probar una propiedad algebraica de polinomios.
DEFINICIÓN. Ideal SiI \subseteq \mathbb{R}[x] yI \neq \emptyset, entonces llamamosI un ideal de\mathbb{R}[x] siempre que se cumplan las siguientes condiciones:
(1) Sif, g \in I entoncesf+g \in I.
(2) Sif \in I yg \in \mathbb{R}[x] entoncesf \cdot g \in I.
Un ideal de\mathbb{R}[x] es un conjunto que se cierra bajo adición de elementos en el ideal, y multiplicación por todos los elementos de\mathbb{R}[x], estén o no en el ideal. Si observa de cerca la definición de combinación de enteros (Sección 7.1), observará que el conjunto de combinaciones de enteros de un par de enteros se cierra bajo adición de elementos en el conjunto y multiplicación por enteros arbitrarios. Por supuesto esta analogía entre los enteros y los polinomios no es accidental. Si generalizas la idea de una combinación entera a polinomios, dirías que las combinaciones polinómicas de un par de polinomios es un ideal de\mathbb{R}[x]. Para los enteros pudimos demostrar que el conjunto de combinaciones de enteros de un par de enteros es precisamente los múltiplos enteros del mayor divisor común de los enteros. ¿Podemos probar un resultado análogo para polinomios? DEFINICIÓN. Principal ideal Un idealI en\mathbb{R}[x] es principal si hayf \in \mathbb{R}[x] tal queI=\{f \cdot g \mid g \in \mathbb{R}[x]\} . en la definición de ideal principal,f se llama generador deI. El teorema se7.7 puede reafirmar para decir que el conjunto de combinaciones de enteros de un par de enteros es el ideal principal (in\mathbb{Z}) generado por el mayor divisor común del par.
TEOREMA 7.23. Cada ideal de\mathbb{R}[x] es principal.
Comprobante. DejaI ser un ideal de\mathbb{R}[x]. Dejarf ser un polinomio de grado más bajo enI. Demostramos quef generaI. Vamosh \in I. Es suficiente para demostrar queh es un múltiplo def. Por Teorema 7.21, hayq, r \in \mathbb{R}[x],r=0 o el grado der menos que el grado def, tal queh=q f+r . DesdeI es un ideal yf \in I,q f \in I y h-q f=r \in I .Por suposiciónf es de grado mínimo enI, entoncesr=0. Por lo tantoh=q f yf generaI.
Este programa parece estar moviéndonos hacia un resultado para polinomios que es análogo al Teorema Fundamental de la Aritmética. Un polinomio es irreducible si no puede escribirse como producto de polinomios de menor grado. Demostraremos en Teorema9.48 que cada polinomio en\mathbb{R}[x] factores singularmente en el producto de polinomios irreducibles (hasta el orden de factores y multiplicación por constantes), y además que todos los polinomios irreducibles son de grado como máximo2 . El estudio de las propiedades algebraicas de los polinomios es el principio motivador más importante en Álgebra. Los buenos textos sobre Álgebra incluyen [2] de John Fraleigh y [3] de Israel Herstein.
Ejercicios
EJERCICIO 7.1. Vamosn \in \mathbb{N}. Demostrar que si non es primo entoncesn tiene un factor primop \leq \sqrt{n}.
EJERCICIO7.2. ¿Son15,462,227 y15,462,229 relativamente primos?
EJERCICIO 7.3. Sin \in \mathbb{N}, ¿bajo qué condiciones sonn yn+2 relativamente prime?
EJERCICIO 7.4. Demostrar que cada número natural puede escribirse como producto de una potencia de 2 y un número impar.
EJERCICIO 7.5. Encontrar\operatorname{gcd}(8243235,453169).
EJERCICIO 7.6. Encontrar\operatorname{gcd}(15570555,10872579).
EJERCICIO 7.7. Dejara yb ser enteros ym=\operatorname{gcd}(a, b). \frac{b}{m}Demuéstralo\frac{a}{m} y son números enteros relativamente primos.
EJERCICIO 7.8. Dejara yb ser enteros positivos con descomposición prima dada pora=\prod_{n=1}^{N} p_{n}^{r_{n}} yb=\prod_{n=1}^{N} p_{n}^{s_{n}} dondep_{n}, r_{n}, s_{n} \in \mathbb{N} yp_{n} es primo para1 \leq n \leq N. Probar que si est_{n}=\min \left(r_{n}, s_{n}\right) por1 \leq n \leq N, entonces\operatorname{gcd}(a, b)=\prod_{n=1}^{N} p_{n}^{t_{n}} . EJERCICIO 7.9. En el comunicado de Lemma 7.14, supongamos que\operatorname{gcd}(a, n) \neq 1. Demostrar que la función no\phi_{a} es una permutación de\mathbb{Z}_{n}^{*}. EJERCICIO 7.10. Demostrar Proposición 7.16.
EJERCICIO 7.11. ¿4757 es primo?
EJERCICIO 7.12. Definir un ideal\mathbb{Z} de forma natural: Un conjuntoI \subseteq \mathbb{Z} es un ideal de\mathbb{Z} si para algunom, n \in I yc \in \mathbb{Z},
m+n \in I
y
m c \in I.
Sia, b \in \mathbb{Z}, demostrar que el conjunto de combinaciones enteras dea yb son un ideal de\mathbb{Z}.
EJERCICIO 7.13. Demostrar que cada ideal de\mathbb{Z} es principal. (Pista: encuentra el generador del ideal.)
EJERCICIO 7.14. Dejarp ser primo y\mathbb{Z}_{p}[x] ser el conjunto de polinomios con coeficientes en\mathbb{Z}_{p}. ¿Qué se puede decir de las raíces del polinomiox^{p-1}-[1] en\mathbb{Z}_{p}? (Decimos que[a] \in \mathbb{Z}_{p} es una raíz de un polinomiof \in \mathbb{Z}_{p}[x] si\left.f([a])=[0] .\right)
EJERCICIO 7.15. Demostrar que 0 es la identidad aditiva en\mathbb{R}[x] y 1 es la identidad multiplicativa en\mathbb{R}[x]. Utilizar las definiciones formales de suma y multiplicación en\mathbb{R}[x].
EJERCICIO 7.16. Demostrar que el grado del producto de polinomios es igual a la suma de los grados de los polinomios. Utilizar la definición formal de multiplicación en\mathbb{R}[x].
EJERCICIO 7.17. Vamosp \in \mathbb{R}[x]. Demostrar quep tiene una inversa aditiva en\mathbb{R}[x]. Demostrar quep tiene una inversa multiplicativa iffp tiene grado 0. Utilizar las definiciones formales de suma y multiplicación en\mathbb{R}[x].
EJERCICIO 7.18. Demostrar que la suma y multiplicación en\mathbb{R}[x] son asociativas y conmutativas, y que la propiedad distributiva posee. Utilizar las definiciones formales de suma y multiplicación en\mathbb{R}[x].
EJERCICIO 7.19. Para0 \leq n \leq N, vamosa_{n} \in \mathbb{R}. Sif=\sum_{n=0}^{N} a_{n} x^{n} yg(x)=x-1, encuentra el cociente único y el resto dondef está el dividendo yg es el divisor. EJERCICIO 7.20. Vamosf, g, q \in \mathbb{R}[x], g \neq 0. Supongamos que esef es el dividendo,g el divisor yq el cociente. Demostrar que la suma del grado deg y el grado deq igual al grado def.
EJERCICIO 7.21. ¿Existe una versión del Algoritmo Euclidiana para\mathbb{R}[x]?
CAPÍTULO 8
Los números reales
¿Cuáles son los números reales y por qué los números racionales no son suficientes para nuestras necesidades matemáticas? En última instancia, los números reales deben satisfacer ciertas propiedades axiomáticas que consideramos deseables para interpretar el mundo natural al tiempo que satisfacen el deseo del matemático de una base formal para el razonamiento matemático.
Por supuesto que los números reales deben contener los números racionales. También requerimos que los números reales satisfagan propiedades algebraicas bastante obvias que se mantienen para los números racionales, como la conmutatividad de la suma o la propiedad distributiva. Estos axiomas nos permiten utilizar el álgebra para resolver problemas. Adicionalmente debemos satisfacer propiedades geométricas como la desigualdad triangular que permiten la interpretación de números reales positivos como distancias. Necesitamos que nuestro sistema numérico contenga números que surgen de la interpretación algebraica y geométrica de los números. Desafortunadamente los números racionales no bastan para este objetivo limitado. Por ejemplo,\sqrt{2}, que sabes por ejemplo3.23 que es irracional, surge geométricamente como la longitud de la diagonal de la unidad cuadrada, y como la solución a la ecuación algebraicax^{2}=2.
El desarrollo del límite dio lugar a nuevas preguntas sobre los números reales. En particular, ¿cuándo estamos seguros de que una secuencia de números es convergente en nuestro sistema numérico? Los reclamos de prueba de convergencia suelen utilizar otra propiedad de los números reales, la propiedad de límite superior menor. Muchas de las poderosas conclusiones del cálculo son consecuencias de esta propiedad. Hablando vagamente, la propiedad de límite superior mínimo implica que la línea numérica real no tiene ningún “agujero”. Dicho de otra manera, si todos los elementos de un conjunto no vacío de números reales son menores que todos los elementos de otro conjunto no vacío de números reales, entonces hay un número real mayor o igual a todos los elementos del primer conjunto, y menor o igual a todos los elementos del segundo conjunto. Esta propiedad se denomina orden-integridad, y se define formalmente en la Sección 8.10. Orden-integridad, y sus consecuencias deseables, no se sostienen para los números racionales.
¿Cómo demostramos la existencia de un conjunto con orden y operaciones que satisfaga todas estas necesidades simultáneamente? No se puede simplemente suponer que tal estructura existe. Es posible que las propiedades especificadas sean lógicamente inconsistentes. Podríamos intentar construir el conjunto. ¿Cuáles son las reglas para la construcción de un objeto matemático? Esta pregunta impulsó a los matemáticos de finales del siglo XIX y principios del XX a desarrollar las reglas para tal construcción, los axiomas de la teoría de conjuntos.
Por esta razón construimos los números reales con una construcción set-teórica. Es decir, construiremos los números naturales, enteros, números racionales y números irracionales a su vez, utilizando conjuntos básicos, funciones y relaciones. Al hacerlo construiremos un conjunto con orden y operaciones que contenga los números racionales (o una estructura que se comporte precisamente como esperamos que se comporten los números racionales), satisfaga los axiomas algebraico y de orden, tenga las propiedades que necesitamos para el cálculo y se construye con las herramientas que usted desarrollados en los Capítulos 1 y 2.
Los números naturales
Cuando introdujimos los números naturales en el Capítulo 1 fuimos explícitos que no estábamos definiendo el conjunto. En cambio, procedimos bajo el supuesto de que estás familiarizado con los números naturales en virtud de tu experiencia matemática previa. Ahora definimos los números naturales en el universo de conjuntos, construyéndolos a partir del conjunto vacío. DEFINICIÓN. Función sucesora LetY be a set. La función sucesora,S, se define porS(Y):=Y \cup\{Y\} . DEFINICIÓN. Conjunto inductivo LetS Ser la función sucesora yX ser cualquier colección de conjuntos que satisfagan las siguientes condiciones:
(1)\emptyset \in X
(2)[Y \in X] \Rightarrow[S(Y) \in X].
EntoncesX se llama un conjunto inductivo.
DEFINICIÓN. Números naturales DejarX ser cualquier conjunto inductivo. El conjunto de números naturales es la intersección de todos los subconjuntos deX que son conjuntos inductivos.
¿Están bien definidos los números naturales? Es decir, ¿depende la definición de la elección del conjuntoX? Si\mathcal{F} es una familia de conjuntos, todos los cuales son inductivos, se demuestra fácilmente que la intersección también\mathcal{F} es inductiva. Si se nos dan conjuntosX yY que son inductivos, ¿darán lugar los conjuntos al mismo conjunto de “números naturales”? Nuevamente se ve fácilmente que la respuesta es sí ya queX \cap Y es un subconjunto de ambosX yY, y es inductivo. Los “números naturales” definidos en términos deX yY serán los “números naturales” definidos en términos deX \cap Y - constituyen el conjunto inductivo “más pequeño”. Para definir los números naturales en el universo de conjuntos, se debe otorgar que existe un conjunto inductivo. Es un axioma de la teoría de conjuntos que existe tal conjunto, llamado el axioma del infinito (ver Apéndice B para una discusión de los axiomas de la teoría de conjuntos).
¿Qué tiene que ver este conjunto con los números naturales tal y como los entendemos y utilizarlos en matemáticas? Considera la funcióni,, definida pori(0)=\emptyset yi(n+1)=i(n) \cup\{i(n)\} . Así\ [\ begin {aligned} i (0) &=\ emptyset\\ i (1) &=\ {\ emptyset\}\\ i (2) &=\ {\ emptyset,\ {\ emptyset\}\\ i (3) &=\ {\ emptyset,\ {\ emptyset\},\ {vaciado,\ {\ juego vacío\} \}\}. \ end {aligned}\] Luegoi da una bijección entre los números naturales, tal como los entendemos intuitivamente, y el conjunto inductivo mínimo que definimos anteriormente.
Definamos\ulcorner n\urcorner formalmente como el conjunto que se obtiene aplicando la función sucesoraS a losn tiempos establecidos vacíos. Entonces0=\emptyset y paran>0 el conjunto\ulcorner n\urcorner=\{\emptyset,\{\emptyset\}, \ldots\} tiene exactamenten elementos, y lo identificaremos con el conjunto\{0,1, \ldots, n-1\} que antes elegimos como el conjunto canónico conn elementos.
El conjunto\mathbf{N}:=\{\ulcorner n\urcorner \mid n \in \mathbb{N}\} es inductivo, y por lo tanto contiene los números naturales. Finalmente el lector puede confirmar que no\mathbf{N} tiene un subconjunto adecuado que sea inductivo.
Para resumir la construcción hasta el momento, el axioma del infinito garantiza que hay un conjunto que es inductivo. Escoge tal conjunto,X. La intersección de todos los subconjuntos deX que son inductivos es\mathbf{N}, que podemos identificar con los números naturales (concebidos intuitivamente) por la bijección i. Para continuar con la construcción, consideramos\mathbb{N} y\mathbf{N} ser el mismo conjunto. Necesitamos\mathbb{N} tener las operaciones+ y. así como la relación\leq. Definiremos adición\mathbb{N} con operaciones de conjunto básico y cardinalidad. Sim, n \in \mathbb{N}, entonces definimos suma porm+n:=|(\ulcorner m\urcorner \times\{\ulcorner 0\urcorner\}) \cup(\ulcorner n\urcorner \times\{\ulcorner 1\urcorner\})| . Recordemos que la cardinalidad de un conjunto finito es el número natural único que es biyectiva con el conjunto - de ahí que la expresión complicada en el lado derecho de la definición es un número natural. Es fácil confirmar que la adición definida de esta manera concuerda con la operación habitual en\mathbb{N}. ¿Por qué nos molestaríamos en definir una operación que has entendido desde hace muchos años? Hemos definido la adición de números naturales como una operación establecida.
La multiplicación es algo más fácil de definir. Sim, n \in \mathbb{N}, entoncesm \cdot n:=|\ulcorner m\urcorner \times\ulcorner n\urcorner| . (Por supuesto, por\ulcorner m\urcorner \times\ulcorner n\urcorner nos referimos al producto cartesiano de los conjuntos\ulcorner m\urcorner y\ulcorner n\urcorner.) Finalmentem, n \in \mathbb{N}[m \leq n] \Longleftrightarrow[\ulcorner m\urcorner \subseteq\ulcorner n\urcorner] . si se debe confirmar que las operaciones y la relación de acuerdo con lo habitual+, \cdot y\leq en los números naturales.
Habiendo concluido esta construcción es razonable preguntarse si\mathbb{N} es verdaderamente el conjunto de números naturales. Ciertamente es justificable que concluya que no se proporciona claridad sobre el número 2 identificándolo con el conjunto\{\emptyset,\{\emptyset\}\}. Lo que ganamos es una reducción de números a conjuntos que nos llevarán a través de la construcción de todos los números reales, incluyendo números que no son fáciles de construir.
Los números enteros
Construimos los enteros a partir de los números naturales. El propósito algebraico de los números enteros es incluir inversas aditivas para números naturales. Por supuesto esto naturalmente da lugar a la operación de resta.
VamosZ=\mathbb{N} \times \mathbb{N}. Definir una relación de equivalencia,\sim onZ by\left\langle m_{1}, n_{1}\right\rangle \sim\left\langle m_{2}, n_{2}\right\rangle \quad \Longleftrightarrow \quad m_{1}+n_{2}=m_{2}+n_{1} . Entonces los enteros son\mathbf{Z}:=Z / \sim . Pensamos en el par ordenado\langle m, n\rangle \in \mathbf{Z} como un representante del enterom-n. Decimos que un entero es positivo sim>n y negativo sim<n. Debe quedar claro que el conjunto de enteros no negativos (es decir\mathbb{N}) es\{[\langle m, n\rangle] \mid m \geq n\}=\{[\langle m, 0\rangle] \mid m \in \mathbb{N}\} . Let\mathbb{Z} be the (intuitivo) integer y leti: \mathbf{Z} \rightarrow \mathbb{Z} be defined byi([\langle m, n\rangle])=m-n . Theni es una biyección. Como hicimos con los números naturales, construiremos operaciones y ordenaremos sobre\mathbf{Z} eso de acuerdo con las operaciones habituales y un orden encendido\mathbb{Z}. Por supuesto, podríamos usari y las definiciones habituales en\mathbb{Z} para definir operaciones y relaciones sobre\mathbf{Z}, pero eso extrañaría el espíritu de la construcción, y descuidaría el deseo de establecer definiciones teóricas. Análogamente a la construcción de la sección anterior, definimos\mathbb{Z} como\mathbf{Z}. Dejemosx_{1}, x_{2} \in \mathbb{Z} dóndex_{1}=\left[\left\langle m_{1}, n_{1}\right\rangle\right] yx_{2}=\left[\left\langle m_{2}, n_{2}\right\rangle\right]. La adición se define porx_{1}+x_{2}=\left[\left\langle m_{1}+m_{2}, n_{1}+n_{2}\right\rangle\right] . La inversa aditiva de[\langle m, n\rangle] es[\langle n, m\rangle] (es decir, la suma de estos números enteros es[\langle 0,0\rangle] - la identidad aditiva en\mathbb{Z}).
La multiplicación se define porx_{1} \cdot x_{2}=\left[\left\langle m_{1} \cdot m_{2}+n_{1} \cdot n_{2}, n_{1} \cdot m_{2}+m_{1} \cdot n_{2}\right\rangle\right] . El orden lineal en\mathbb{Z} se define por lax_{1} \leq x_{2} \Longleftrightarrow m_{1}+n_{2} \leq n_{1}+m_{2} . suma y la multiplicación se han definido para los números naturales, y las operaciones y el orden lineal en\mathbb{Z} se definen con respecto a las operaciones y el orden lineal que se definieron previamente para\mathbb{N}. Obsérvese que todas nuestras definiciones fueron dadas en términos de representantes de clases de equivalencia. Para demostrarlo+, \cdot y\leq estar bien definidos, debemos demostrar que las definiciones son independientes de la elección del representante - ver Ejercicio 8.6.
Los números racionales
Los números racionales son proporciones de números enteros, o casi así. Por supuesto, diferentes numeradores y denominadores pueden dar lugar al mismo número racional; de hecho, una buena parte de la aritmética de la escuela primaria se dedica a determinar cuándo dos expresiones distintas para números racionales son iguales. Construimos los enteros a partir de los números naturales con clases de equivalencia de “diferencias” de números naturales. Construimos los números racionales a partir de los enteros de manera análoga, con clases de equivalencia de “cocientes” de enteros. Álgebraicamente esto da lugar a la división.
VamosQ=\mathbb{Z} \times \mathbb{N}^{+}. Definimos una relación de equivalencia\sim sobreQ. Si\langle a, b\rangle,\langle c, d\rangle \in Q, entonces\langle a, b\rangle \sim\langle c, d\rangle \Longleftrightarrow a \cdot d=b \cdot c . Definimos los números racionales,\mathbf{Q}, como las clases de equivalencia deQ con respecto a la relación de equivalencia\sim. Es decir,\mathbf{Q}:=Q / \sim \text {. } asociamos las clases de equivalencia de\mathbf{Q} con los números racionales intuitivos a través de la bijeccióni: \mathbb{Q} \rightarrow \mathbf{Q} definida pori\left(\frac{p}{q}\right)=[\langle p, q\rangle] for\langle p, q\rangle \in Q.
Definimos las operaciones y el ordenamiento lineal\mathbb{Q} en términos de las operaciones y el ordenamiento lineal en\mathbb{Z}. Definir suma por[\langle a, b\rangle]+[\langle c, d\rangle]:=[\langle a d+b c, b d\rangle] y multiplicar por[\langle a, b\rangle] \cdot[\langle c, d\rangle]:=[\langle a \cdot c, b \cdot d\rangle] . Definimos el ordenamiento lineal en\mathbb{Q} por[\langle a, b\rangle] \leq[\langle c, d\rangle] \quad \text { iff } \quad a \cdot d \leq b \cdot c . A través de la construcción de los números racionales, hemos utilizado operaciones de conjunto para construir estructuras matemáticas con las que ya estás familiar. En consecuencia usted es capaz de comprobar que la construcción se comporta como se espera. Por ejemplo, se puede probar fácilmente que las operaciones que hemos construido concuerdan con las operaciones habituales de suma y multiplicación sobre los números racionales. Del mismo modo, se puede verificar fácilmente que la relación sobre la que hemos construido\mathbb{Q} concuerda con el orden lineal habitual de los números racionales. Construir los números reales es más complicado.
Los números reales
Completamos nuestra construcción de los números reales (tenemos los números irracionales restantes) con el objetivo de probar el orden completo de los números reales, y derivar algunas consecuencias importantes de la integridad. Muchos de los resultados más potentes e interesantes del cálculo dependen de esta propiedad de los números reales. Si se le ha pedido que acepte algunos de estos teoremas sobre la fe, ahora es el momento de recompensar su confianza.
Hay un par de formas diferentes de construir los números reales a partir de los números racionales. Un enfoque es definir los números reales como secuencias convergentes de números racionales. El otro enfoque común es caracterizar los números reales como subconjuntos de números racionales que satisfacen ciertas condiciones.
DEFINICIÓN. Corte Dedekind Un corte DedekindL es un subconjunto propio no vacío de\mathbb{Q} que no tiene elemento máximo y satisface(\forall a, b \in \mathbb{Q})[a \in L \wedge b<a] \Rightarrow[b \in L] . LetL be a Dedekind cut. Entonces hay algún número racionala \in L, y por lo tanto todos los números racionales menos entoncesa están enL. VamosR=\mathbb{Q} \backslash L. Ya queL \neq \mathbb{Q}, hayc \in R y cada número racional mayor de lo quec está enR. Está claro que\{L, R\} es una partición de\mathbb{Q} y que cada elemento deL es menor que cada elemento deR. Entonces Dedekind corta “dividir” los números racionales. Asociaremos cada corte de Dedekind con un número real ubicado en la división de la línea numérica real.
OBSERVACIÓN. Para ayudar a nuestra imagen mental de lo que está pasando, pensamos enL como todos los números racionales a la izquierda de algún número real fijo\alpha, es decir, como(-\infty, \alpha) \cap \mathbb{Q}, yR como los números racionales a la derecha,[\alpha, \infty) \cap \mathbb{Q}. Por supuesto que aún no sabemos a qué nos referimos exactamente con “el número real\alpha “, pero esta es la idea a tener en cuenta. Tenga en cuenta queR tendrá un elemento mínimo iff\alpha es racional.
Para entender cómo los cortes de Dedekind se relacionan con los números, construimos una inyección desde los números racionales hasta los cortes de Dedekind. Déjese\mathcal{D} ser el conjunto de cortes de Dedekind. Definimos una inyeccióni: \mathbb{Q} \rightarrow \mathcal{D} pori(a)=\{b \in \mathbb{Q} \mid b<a\} . La funcióni es una inyección bien definida que nos informa de cómo\mathbb{Q} encaja en\mathcal{D}.
Determinaremos el orden y las operaciones sobre\mathcal{D} para que coincidan con el orden lineal habitual y las operaciones sobre las\mathbb{Q} que se hereden eni[\mathbb{Q}]. Es decir, vamos a definir el orden lineal, suma y multiplicación on para\mathcal{D} que paraa, b \in \mathbb{Q},\ [\ begin {alineado} {[a\ leq b]} &\ Longleftrightarrow [i (a)\ leq i (b)]\\ i (a+b) &=i (a) +i (b)\\ i (a\ cdot b) &=i (a)\ cdot i (b) \ fin {alineado} \] Si podemos hacer esto, podemos pensar en\mathcal{D} como una extensión de\mathbb{Q}. ¿Cómo lo hacemos?
ParaL, K \in \mathcal{D}, definimos la relación\leq en\mathcal{D} por[L \leq K] \Longleftrightarrow[L \subseteq K] . Usted debe confirmar que\leq es un orden lineal de\mathcal{D} y que la relación\leq eni[\mathbb{Q}] satisface (1). SiL \in \mathcal{D} yL<i(0) decimos queL es negativo. SiL>i(0), decimos queL es positivo. Con un objetivo similar en mente definimos la suma y multiplicación en\mathcal{D}. Es decir, queremos que las operaciones satisfagan ciertas propiedades de suma y multiplicación y queremos que las operaciones definidas eni[\mathbb{Q}] coincidan con las operaciones en\mathbb{Q}.
SiL, K \in \mathcal{D}, entoncesL+K:=\{a+b \mid a \in L \text { and } b \in K\} . Verifica queL+K sea un corte Dedekind, y que (2) se mantenga.
La multiplicación requiere un poco más de esfuerzo para definir. (¿Por qué no podemos dejarL \cdot K=\{a b \mid a \in L, b \in K\}?) SiL oK esi(0), entoncesL \cdot K:=i(0) . Si ambosL, K \in \mathcal{D} son positivos, entoncesL \cdot K=\{a \cdot b \mid a \in L, b \in K, a>0 \text { and } b>0\} \cup\{c \in \mathbb{Q} \mid c \leq 0\} . Verifica queL \cdot K sea un corte de Dedekind, y que (3) se mantenga paraa, b>0.
¿Cómo definimos la multiplicación por cortes “negativos” de Dedekind? Empecemos por definir la multiplicación por-1. DejarL \in \mathcal{D} yR=\mathbb{Q} \backslash L. Definimos-L por-L:=\{c \in \mathbb{Q} \mid(\exists r \in R)-c>r\} . Ahora podemos definir multiplicación sobre elementos arbitrarios de\mathcal{D} para satisfacer las propiedades que deseamos. SiL, K \in \mathcal{D} y ambos son negativos, entoncesL \cdot K:=(-L \cdot-K) . Si exactamente uno deL yK es negativo, entoncesL \cdot K:=-(-L \cdot K) . DEFINICIÓN. Números reales,\mathbb{R} Los números reales son los cortes de Dedekind, con suma, multiplicación y\leq definidos como arriba. Denotamos los números reales por\mathbb{R} cuando no necesitamos pensarlos explícitamente como recortes de Dedekind.
Hemos definido los números reales como conjuntos de números racionales. Ya que los números racionales se definieron utilizando ideas básicas sobre conjuntos, funciones y relaciones, también lo son los números reales. Las propiedades de los números reales que discutimos al inicio de esta sección están satisfechas por los cortes de Dedekind. Por cada número racionala, nos identificamosa con el corte Dedekindi(a).
TEOREMA 8.2. Los números reales definidos anteriormente satisfacen:
(i) La suma y la multiplicación son tanto conmutativas como asociativas.
ii)(\forall L \in \mathcal{D}) L+0=L, L \cdot 1=L.
iii)(\forall L \in \mathcal{D}) L+(-L)=0.
iv)(\forall L \in \mathcal{D} \backslash\{0\})(\exists K \in \mathcal{D}) L \cdot K=1.
v)(\forall L, K, J \in \mathcal{D}) L \cdot(K+J)=L \cdot K+L \cdot J.
Comprobante. Ejercicio.
La propiedad de límite inferior superior
DEFINICIÓN. Límite superior LetX \subset \mathcal{D}. Decimos queX está acotado arriba si hayM \in \mathcal{D} tal que(\forall x \in X) x \leq M . en este caso decimos queM es un límite superior paraX.
DEFINICIÓN. Límite inferior superior DejarX \subset \mathcal{D} delimitar arriba. Supongamos queM es un límite superior paraX tal que para cualquier límite superiorN paraX, M \leq N. Entonces el númeroM se llama el límite inferior superior paraX.
El límite inferior y el mayor límite inferior se definen análogamente.
TEOREMA 8.3. Propiedad de límite mínimo superior SiX es un subconjunto no vacío de\mathcal{D} y está delimitado por encima, entoncesX tiene un límite superior mínimo. Si está acotado por debajo, entonces tiene un mayor límite inferior.
PRUEBA. X \subset \mathcal{D}Déjese acotar arriba. DejarM=\bigcup_{L \in X} L \subseteq \mathbb{Q} . El conjuntoM está delimitado arriba (¿por qué?) , y por lo tantoM \neq \mathbb{Q}. Cualquier elemento deM es un elemento de algunosL \in X, y en consecuencia no puede ser un elemento máximo deL. Por lo tanto, noM tiene elemento más grande. Sia \in M,c \in \mathbb{Q} yc<a entoncesc \in M. Por lo tantoM es un corte Dedekind. Para cualquierL \in X, L \subseteq M y por lo tanto esL \leq M . decir,M es un límite superior paraX.
VamosK<M. Luego estáa \in M \backslash K. Asía es en algunosL_{0} enX. Por lo tanto noL_{0} está contenidoK y noK es un límite superior paraX. De ello se deduce queM es el límite inferior superior paraX.
Dejamos al lector el argumento a favor de la existencia de un mayor límite inferior.
La propiedad de límite inferior superior es la propiedad esencial de los números reales que permite los principales teoremas del cálculo. Es la razón por la que usamos este gran conjunto, en lugar de, digamos, los números algebraicos. Caracteriza de manera única a los números reales como una extensión de los números racionales - ver Teorema8.23 para una declaración precisa.
Ahora que hemos probado esta propiedad clave, utilizaremos\mathbb{R} para denotar el conjunto de números reales, identificando un número real\alpha con el corte Dedekind(-\infty, \alpha) \cap \mathbb{Q}. Ya no necesitaremos preocuparnos por los cortes de Dedekind per se.
Secuencias reales
Recordemos que una secuencia es una función con dominio\mathbb{N} (o\mathbb{N}^{+}). Una secuencia real es una secuencia de valor real (es decir, el rango de la secuencia es un subconjunto de los números reales).
DEFINICIÓN. Subsecuencia Let\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle Ser una secuencia yf \in \mathbb{N}^{\mathbb{N}} ser una secuencia estrictamente creciente de números naturales. Entonces\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle es una subsecuencia de\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle.
EJEMPLO 8.4. Dejars ser la secuencia\langle 2 n \mid n \in \mathbb{N}\rangle=\langle 0,2,4,6,8, \ldots\rangle . Entonces la secuenciat dada por\langle 6 n \mid n \in \mathbb{N}\rangle=\langle 0,6,12,18, \ldots\rangle es una subsecuencia des. En este ejemplo,f(n)=3 n es la función que demuestra quet es una subsecuencia des. Otra subsecuencia des es la secuencia\left\langle 2^{5 n+3} \mid n \in \mathbb{N}\right\rangle Recordemos que una secuencia\left\langle a_{n}\right\rangle se llama no decreciente sia_{n+1} \geq a_{n} para todosn. Se llama no creciente si se invierte la desigualdad. Todo lo que es cierto para una secuencia no decreciente es cierto, con desigualdades invertidas, para secuencias no crecientes (¿por qué?) , así que en lugar de declarar todo dos veces, podemos usar la palabra monotónico para significar una secuencia que no es creciente (en todas partes) o no decreciente.
LEMA 8.5. Cada secuencia real no decreciente\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle que está delimitada arriba converge a su límite inferior superior. Cada secuencia real no creciente que se limita a continuación converge a su mayor límite inferior.
Comprobante. Sólo probaremos la primera aseveración. DejarM ser el límite inferior superior de\left\langle a_{n}\right\rangle. Vamos\varepsilon>0. Ya queM es el límite inferior superior, existeN \in \mathbb{N} tal que,0<M-a_{N}<\varepsilon . Dado que la secuencia es no decreciente,(\forall n \geq N) 0<M-a_{n}<\varepsilon . Por lo tantoM es el límite de la secuencia, según se desee.
TEOREMA 8.6. Teorema de Bolzano-Weierstrass Let[b, c] Ser un intervalo delimitado cerrado de números reales ys=\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle ser una secuencia de números reales tal que(\forall n \in \mathbb{N}) a_{n} \in[b, c] . Entonces\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle tiene una subsecuencia convergente con límite en[b, c]. Discusión. Consideramos una secuencia anidada de intervalos, todos los cuales contienen infinitamente muchos elementos del rango de la secuencias, con el radio de los intervalos acercándose a 0. Construimos una subsecuencia des seleccionando secuencialmente elementos en la intersección del rango des y los intervalos sucesivos. Luego mostramos que la subsecuencia que construimos es convergente.
Prueba. Demostramos el teorema para el intervalo de unidad cerrada[0,1]. Es sencillo generalizar este argumento a intervalos delimitados cerrados arbitrarios.
Si el rango de la secuencia es un conjunto finito, entonces al menos un elemento del rango,a_{n}, debe tener una pre-imagen infinita. La pre-imagen dea_{n} da una subsecuencia que converge aa_{n}. Por lo tanto asumimos que el rango de la secuencia es infinito. DejarS ser el rango de la secuencia\left\langle a_{n}\right\rangle.
Definimos una secuencia anidada de intervalos cerrados,I_{n}=\left\langle\left[b_{n}, c_{n}\right]\right| n \in\mathbb{N}\rangle satisfaciendo
(1)I_{0}=[0,1]
(2) Para todosn \in \mathbb{N}, I_{n+1} \subset I_{n}
(3)c_{n}-b_{n}=\frac{1}{2^{n}}
(4) Porque todon \in \mathbb{N}, I_{n} \cap S es infinito.
VamosI_{0}=[0,1]. Supongamos que tenemosI_{n} satisfaciendo las condiciones anteriores. Al menos uno de los intervalos\left[b_{n}, b_{n}+\frac{1}{2^{n+1}}\right] y\left[b_{n}+\frac{1}{2^{n+1}}, c_{n}\right] debe contener infinitamente muchos elementos deS. QueI_{n+1}=\left[b_{n}, b_{n}+\frac{1}{2^{n+1}}\right] si la intersección de este conjunto conS es infinita; de lo contrario vamosI_{n+1}=\left[b_{n}+\frac{1}{2^{n+1}}, c_{n}\right]. EntoncesI_{n+1} satisface las condiciones anteriores.
La secuencia de puntos finales izquierdos de los intervalos noI_{n},\left\langle b_{n} \mid n \in \mathbb{N}\right\rangle es decreciente. La secuencia de extremos derechos de los intervalosI_{n}, no\left\langle c_{n} \mid n \in \mathbb{N}\right\rangle es creciente. Además, para cualquierm, n \in \mathbb{N},b_{m}<c_{n} . El conjunto\left\{b_{n} \mid n \in \mathbb{N}\right\} está delimitado arriba, por lo que por la Propiedad de Límite Mínimo Superior el conjunto tiene un límite superior mínimo,\beta. De igual manera el conjunto\left\{c_{n} \mid\right.n \in \mathbb{N}\} tiene un mayor límite inferior\gamma. Por Lema8.5\ [\ comenzar {alineado} &\ lim _ {n\ fila derecha\ infty} b_ {n} =\ beta\\ &\ lim _ {n\ fila derecha\ infty} c_ {n} =\ gamma. \ end {aligned}\] Por el triángulo de la desigualdad, para cualquiern \in \mathbb{N},|\beta-\gamma| \leq\left|\beta-b_{n}\right|+\left|b_{n}-c_{n}\right|+\left|c_{n}-\gamma\right| . Los tres términos en el lado derecho de la desigualdad tienden a 0 comon se acerca al infinito, así para cualquier\varepsilon>0,|\beta-\gamma|<\varepsilon . De ahí \beta=\gamma.
Ahora queremos definir una subsecuencia a la que converja\beta, eligiendo un punto en cada intervaloI_{n} en turno. Formalmente hacemos esto definiendof \in \mathbb{N}^{\mathbb{N}} recursivamente porf(0)=0 yf(n+1) es lo menosk \in \mathbb{N} tal que[k>f(n)] \wedge\left[a_{k} \in I_{n+1}\right] . Esto está bien definido ya queS \cap I_{n+1} es infinito. Entonces la secuencia\left\langle a_{f(n)}\right|n \in \mathbb{N}\rangle converge a\beta. Para ver esto, vamos\varepsilon>0. Para cualquiern \in \mathbb{N} tal que\frac{1}{2^{n}}<\varepsilon,\left|\beta-a_{f(n)}\right|<c_{n}-b_{n}=\frac{1}{2^{n}}<\varepsilon . Por lo tanto\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle es una subsecuencia convergente que converge a\beta.
DEFINICIÓN. Secuencia de Cauchy Let\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle Ser una secuencia. La secuencia\left\langle a_{n}\right\rangle es una secuencia de Cauchy si(\forall \varepsilon>0)(\exists N \in \mathbb{N})(\forall m, n \in \mathbb{N})[m, n \geq N] \Rightarrow\left[\left|a_{m}-a_{n}\right|<\varepsilon\right] . TEOREMA 8.7. Una secuencia real converge si es una secuencia de Cauchy. PRUEBA. \Rightarrow
\left\langle a_{n} \mid n \in \mathbb{N}\right\rangleSea una secuencia de números reales que converja aa \in \mathbb{R}.
Dejar\varepsilon>0 yN \in \mathbb{N} ser tal que(\forall n \geq N)\left|a-a_{n}\right|<\frac{\varepsilon}{2} . Entonces para cualquierm, n \geq N,\left|a_{n}-a_{m}\right| \leq\left|a_{n}-a\right|+\left|a-a_{m}\right|<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon . Por lo tanto\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle es una secuencia de Cauchy.
\Leftarrow
\left\langle a_{n} \mid n \in \mathbb{N}\right\rangleDéjese ser una secuencia de Cauchy. Entonces(\exists N \in \mathbb{N})(\forall m, n>N)\left|a_{n}-a_{m}\right|<1 . Cada término en la secuencia posterior alN^{\text {th }} término está en la\varepsilon -vecindad dea_{N}. Entonces(\forall n \geq N) a_{n} \in\left[a_{N}-1, a_{N}+1\right] . La secuencia\left\langle a_{n} \mid n \geq N\right\rangle satisface las hipótesis del Teorema de BolzanoWeiersTrass, y así tiene una subsecuencia convergente.
\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangleSea una subsecuencia convergente de\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle converger aa \in \mathbb{R}. Vamos\varepsilon>0. Ya que\left\langle a_{n}\right\rangle es Cauchy, hayN_{1} tal que\left(\forall m, n \geq N_{1}\right)\left|a_{m}-a_{n}\right|<\frac{\varepsilon}{2} . Además, hayN_{2} \in \mathbb{N} tal que\left(\forall n \geq N_{2}\right)\left|a_{f(n)}-a\right|<\frac{\varepsilon}{2} . LetN_{3} \geq N_{1}, f\left(N_{2}\right). EntoncesN_{3} \geq N_{2} y\left(\forall n \geq N_{3}\right)\left|a_{n}-a\right| \leq\left|a_{n}-a_{f(n)}\right|+\left|a_{f(n)}-a\right|<\varepsilon . Por lo tanto la secuencia\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle converge aa.
Las secuencias de Cauchy llegan a la esencia del orden-integridad de los números reales. Una secuencia Cauchy de números racionales no necesita converger a un número racional. Por ejemplo, leta be any irrational number, and leta_{n} be the decimal approximation ofa to then^{\text {th }} digit. La secuencia\left\langle a_{n}\right\rangle es una secuencia Cauchy de números racionales que converge en un número irracional. Sin embargo, si una secuencia de Cauchy no logra converger en un conjunto de números, es razonable decir que hay una brecha en el conjunto de números. Los números reales se definen para que se llenen estos vacíos.
Prueba de Ratio
Uno de los usos del orden-integridad de los números reales es demostrar que converge una secuencia infinita, sin tener que saber mucho sobre el número al que converge. En el Capítulo 5 aludimos a la prueba de ratio al afirmar que el polinomio Taylor para la función exponencial evaluada en un número reala, \sum_{k=0}^{\infty} \frac{a^{k}}{k !}, converge. ¿Cómo demostramos que converge una suma infinita? Si tenemos una idea de su límite, podríamos demostrar que la secuencia de sumas parciales se acerca a este valor. Es así como demostramos que la suma geométrica con relación menor a 1 converge. Muchas funciones matemáticas importantes se definen por sumas infinitas, y el límite de la suma define el valor de la función. En este caso necesitamos demostrar que la suma converge usando propiedades de los números reales.
DEFINICIÓN. Convergencia absoluta Let\left\langle a_{n}\right\rangle Ser una secuencia infinita. Si la suma infinita\sum_{k=0}^{\infty}\left|a_{k}\right| converge entonces\operatorname{sum} \sum_{k=0}^{\infty} a_{k} se dice que el infinito converge absolutamente.
LEMA 8.8. Si una suma infinita converge absolutamente, entonces converge.
Comprobante. Asumir\sum_{k=0}^{\infty} a_{k} converge absolutamente. Mostramos que la secuencia de sumas parciales de esta serie,\left\langle s_{n} \mid n \in \mathbb{N}\right\rangle, es una secuencia de Cauchy. Paran \in \mathbb{N}, vamosb_{n}=\left|a_{n}\right| . Entonces\sum_{k=0}^{\infty} b_{k} converge. Dejar\left\langle t_{n} \mid n \in \mathbb{N}\right\rangle ser la secuencia de sumas parciales de\sum_{k=0}^{\infty} b_{k}. Por teorema8.7,\left\langle t_{n}\right\rangle es una secuencia de Cauchy. Vamos\varepsilon>0. Entonces hayN \in \mathbb{N} tal que para cualquiern \geq m \geq N,\left|t_{n}-t_{m}\right| \leq \varepsilon . Por una generalización del triángulo la desigualdad (ver Ejercicio 8.24)\left|s_{n}-s_{m}\right|=\left|\sum_{k=m+1}^{n} a_{k}\right| \leq \sum_{k=m+1}^{n} b_{k}=\left|t_{n}-t_{m}\right|<\varepsilon De ahí\left\langle s_{n}\right\rangle es una secuencia Cauchy y converge. Por lo tanto\sum_{k=0}^{\infty} a_{k} converge.
TEOREMA 8.9. Prueba de ratio Supongamos que\left\langle a_{k}\right\rangle es una secuencia infinita de números reales y que hayN \in \mathbb{N} y un número real positivor<1 tal que para todosn \geq N,\left|\frac{a_{n+1}}{a_{n}}\right| \leq r . Entonces\sum_{k=0}^{\infty} a_{k} converge.
Comprobante. \sum_{k=0}^{\infty} a_{k}Sea una suma infinita con términos que satisfagan la hipótesis. Paran \in \mathbb{N}, vamosb_{n}=\left|a_{n}\right|. Por supuesto, hayN \in \mathbb{N} y un número real positivor<1 tal que para todosn \geq N,\frac{b_{n+1}}{b_{n}} \leq r . Podemos asumir sin pérdida de generalidad queN=0, ya que la serie\sum_{k=0}^{\infty} b_{k} converge iff \sum_{k=N}^{\infty} b_{k}converge, y si es necesario podemos ignorar finitamente muchos términos de la suma infinita. Afirmamos que para todosn \in \mathbb{N},b_{n} \leq b_{0} r^{n} . Sin=0 el reclamo es obvio. Asumir que el reclamo se mantiene enn. Por supuesto,\frac{b_{n+1}}{b_{n}} \leq r . Por lo tantob_{n+1} \leq r b_{n} \leq r b_{0} r^{n} \leq b_{0} r^{n+1} . Por Ejercicio 5.28, la suma geométrica con radio-1<r<1 converge a\frac{1}{1-r}. Por lo tanton \in \mathbb{N}, para cualquiera,s_{n}:=\sum_{k=0}^{n} b_{k} \leq \sum_{k=0}^{n} b_{0} r^{k}=b_{0}\left(\sum_{k=0}^{\infty} r^{k}\right) \leq \frac{b_{0}}{1-r} . La secuencia de sumas parciales\left\langle s_{n}\right\rangle,, es una secuencia acotada monotónica y por Lemma8.5, converge. Por lo tanto\sum_{k=0}^{\infty} a_{k} converge absolutamente. Por Lema8.8 la suma converge.
Funciones reales
Si relees tu texto de cálculo, observarás que muchos de los teoremas del cálculo dependen en última instancia del Teorema del Valor Intermedio.
TEOREMA 8.10. Teorema del Valor Intermedio Letf Ser una función real continua en un intervalo delimitado cerrado[a, b]. Sif(a)<L<f(b) of(b)<L<f(a) luego(\exists c \in(a, b)) \quad f(c)=L . Prueba. Dejarf ser una función real continua en un intervalo delimitado cerrado[a, b], yf(a)<L<f(b). Demostramos el caso especialL=0. Dado el resultado paraL=0, el teorema se desprende de la aplicación del caso especial a la funciónf(x)-L.
LetX=\{x \in[a, b] \mid(\forall y \in[a, x]) f(y) \leq 0\} . EntoncesX \neq \emptyset yX está delimitado arriba porb. Por la Propiedad Límite Mínimo Superior,X tiene un límite superior mínimo,m \leq b. La funciónf es continua, y por lo tanto\lim _{x \rightarrow m} f(x)=f(m). Sif(m)=0, se prueba el teorema.
(i) Supongamos quef(m)>0. Vamos0<\varepsilon<f(m). Para cualquierax \in[a, m),f(x) \leq 0 y en|f(x)-f(m)| \geq f(m)>\varepsilon consecuencia para cualquier\delta>0, hayx en el pinchado\delta -barrio dem tal que|f(x)-f(m)| \geq \varepsilon Esto contradice la suposición de que\lim _{x \rightarrow m} f(x)=f(m). Por lo tantof(m) \leq 0 .
ii) Supongamos quef(m)<0. Vamos0<\varepsilon<|f(m)|. Para cualquiera\delta>0, hayx \in(m, m+\delta) tal quef(x)>0. De lo contrario[a, m+\delta) \subseteq X, contradiciendo la suposición de quem es el límite superior mínimo paraX. Entonces para cualquiera\delta>0 hayx en el pinchado\delta -barrio dem tal que|f(x)-f(m)| \geq|f(m)|>\varepsilon . Esto contradice la suposición quef es continua enm. Por lo tantof(m)=0 .
TEOREMA 8.11. Teorema de Valor Extremo Sif es una función real continua en un intervalo delimitado cerrado[a, b], entoncesf logra un máximo y un mínimo encendido[a, b].
Prueba. Mostramos primero que el rango de\left.f\right|_{[a, b]} está delimitado por encima y por debajo. A modo de contradicción supongamos que el rango de nof está delimitado por encima. Porquen \in \mathbb{N}, quea_{n} \in[a, b] sea tal quef\left(a_{n}\right)>n. Por el Teorema de Bolzano-Weierstrass, la secuencia\left\langle a_{n}\right\rangle tiene una subsecuencia convergente,\left\langle a_{g(n)}\right\rangle, convergente a algún númeroc \in[a, b]. Por la continuidad def, sic \in(a, b) entoncesf(c)=\lim _{x \rightarrow c} f(x)=\lim _{n \rightarrow \infty} f\left(a_{g(n)}\right) . (Ver Ejercicio 8.25.) Sic es un punto final de[a, b], hacemos la reclamación correspondiente para el límite unilateral apropiado. No obstante, para cualquiern \in \mathbb{N},f\left(a_{g(n)}\right)>g(n)>n . por lo tanto,\lim _{n \rightarrow \infty} f\left(a_{g(n)}\right) no existe. Por lo tanto, el rango def está delimitado por encima. Del mismo modo, el rango def está delimitado por debajo. Por la Propiedad de Límite Mínimo Superior, el rango def tiene un límite superior mínimoM,, y un límite inferior mayor,L.
Ya queM es un límite mínimo superior para el rango def, para cualquier\varepsilon>0, hayx \in[a, b] tal que|f(x)-M|<\varepsilon . Forn \in \mathbb{N}^{+}, leta_{n} \in[a, b] be such that\left|f\left(a_{n}\right)-M\right|<\frac{1}{n} . The sequence \left\langle a_{n}\right\rangletiene una subsecuencia convergente según el Teorema de Bolzano-Weierstrass. Dejar\left\langle c_{n}\right\rangle ser una subsecuencia convergente de\left\langle a_{n}\right\rangle con límitec \in[a, b]. Dado que\left\langle c_{n}\right\rangle es una subsecuencia de\left\langle a_{n}\right\rangle, para cualquiern \in \mathbb{N}^{+},\left|f\left(c_{n}\right)-M\right|<\frac{1}{n} . De ahí\lim _{n \rightarrow \infty} f\left(c_{n}\right)=M . Por la continuidad def,\lim _{x \rightarrow c} f(x)=f(c)=\lim _{n \rightarrow \infty} f\left(c_{n}\right)=M . sic \in(a, b) entonces Ifc es un punto final de[a, b] tenemos la reivindicación análoga para el límite unilateral apropiado. Por lo tantof logra un valor máximo en[a, b]. Por un argumento análogo,f logra un valor mínimo on[a, b].
Por el Teorema del Valor Extremo, una función continua logra valores extremos en un intervalo delimitado cerrado. Es fácil construir ejemplos para los cuales el teorema falla para intervalos abiertos. El teorema del valor extremo tiene en común con la propiedad de límite inferior superior que garantiza la existencia de un número que satisface una condición deseable sin proporcionar información adicional sobre el número en sí. Muy a menudo basta con saber de manera abstracta que una función alcanza su extremo sin tener que distinguir aún más el objeto. ¿Qué más podemos concluir sobre los valores extremos de una función? TEOREMA 8.12. Dejarf ser una función real definida en un intervalo(a, b). Sic \in(a, b) es tal quef(c) es un valor extremo def on(a, b) yf es diferenciable enc, entoncesf^{\prime}(c)=0.
Prueba. Dejarf yc satisfacer las hipótesis del teorema. Supongamos quef(c) es el valor máximo alcanzado porf on(a, b). Para cualquierx \in(a, c), f(x) \leq f(c) y\frac{f(c)-f(x)}{c-x} \geq 0 . Por lo tanto\lim _{x \rightarrow c^{-}} \frac{f(c)-f(x)}{c-x} \geq 0 . De manera similar,\lim _{x \rightarrow c^{+}} \frac{f(c)-f(x)}{c-x} \leq 0 . Sin embargof es diferenciable enc, por lo que0 \leq \lim _{x \rightarrow c^{-}} \frac{f(c)-f(x)}{c-x}=f^{\prime}(c)=\lim _{x \rightarrow c^{+}} \frac{f(c)-f(x)}{c-x} \leq 0 . Un argumento similar prueba la pretensión def(c) un valor mínimo def on(a, b).
COROLARIO 8.13. Dejarf ser una función real continua en un intervalo delimitado cerrado[a, b]. Entoncesf logra un máximo y mínimo on[a, b] y sic \in[a, b] es un número en el quef logra un valor extremo, entonces uno de los siguientes debe ser cierto dec:
(i)f^{\prime}(c)=0
(ii) nof es diferenciable enc
(iii)c es un punto final de[a, b].
TEOREMA 8.14. Teorema del Valor Medio Dejarf ser una función real continua en un intervalo delimitado cerrado[a, b] y diferenciable en(a, b). Entonces hayc \in(a, b) tal quef^{\prime}(c)=\frac{f(b)-f(a)}{b-a} . Prueba. Primero probamos un caso especial del Teorema del Valor Medio, conocido como Teorema de Rolle. Asumir esof(a)=f(b). Demostramos que hayx \in(a, b) tal quef^{\prime}(x)=0.
Sif es constante entoncesf^{\prime}(x)=0 para todosx \in(a, b). Supongamos que nof es constante y que hayx \in(a, b) tal quef(x)>f(a). Por el Teorema del Valor Extremof logra un valor máximoM en[a, b]. Así,M>f(a)=f(b) . Seamosc \in(a, b) tal quef(c)=M. Por Teorema 8.12,f^{\prime}(c)=0. Si hayx \in(a, b) tal quef(x)<f(a), la prueba es similar.
Para probar el Teorema del Valor Medio en general, lo reducimos al Teorema de Rolle. Se resta del segmentof(x) de línea formado por(a, f(a)) y(b, f(b)). Dejarg(x)=f(x)-f(a)-\frac{f(b)-f(a)}{b-a}(x-a) . La funcióng(x) satisface las hipótesis del Teorema de Rolle. Entonces hayc \in(a, b) tal queg^{\prime}(c)=0. Ya queg^{\prime}(x)=f^{\prime}(x)-\frac{f(b)-f(a)}{b-a} tenemosg^{\prime}(c)=f^{\prime}(c)-\frac{f(b)-f(a)}{b-a}=0 yf^{\prime}(c)=\frac{f(b)-f(a)}{b-a} . El Teorema del Valor Medio tiene muchas consecuencias prácticas, una de las cuales exponemos aquí.
COROLARIO 8.15. Dejarf ser una función diferenciable en(a, b). Sif^{\prime}(x)>0 (resp. f^{\prime}(x)<0) en(a, b) entoncesf está aumentando (resp. decreciente) en(a, b).
Cardinalidad de los números reales
Terminamos el Capítulo 6 con la afirmación no probada de que los números reales son incontables. Ahora que tenemos una definición formal de los números reales, estamos listos para completar nuestra investigación de la cardinalidad de\mathbb{R}. Por Teorema6.11 el conjunto de secuencias decimales infinitas es incontable, con cardinalidad2^{\aleph_{0}}. Pasamos a afirmar que esto tuvo consecuencias para la cardinalidad de\mathbb{R}. Consideramos la cuestión relacionada de la cardinalidad del intervalo unitario cerrado[0,1].
Proposición 8.16. |[0,1]|=|\mathbb{R}|.
Comprobante. Definirf:[0, \infty) \rightarrow(1 / 2,1] porf(x)=\frac{1}{x+2}+1 / 2 \text {. } Entoncesf es una inyección. \mathbb{R}^{-}Dejen ser los números reales negativos, y definirg: \mathbb{R}^{-} \rightarrow[0,1 / 2) porg(x)=\frac{-1}{x-2} . Entoncesg es una inyección. Queh: \mathbb{R} \rightarrow[0,1] sea la unión de las funcionesf yg. Entoncesh es claramente una inyección. La función de identidad[0,1] es una inyección en\mathbb{R}. Por el Teorema de Schröder-Bernstein,|[0,1]|=|\mathbb{R}| \text {. } Investigamos la relación entre las expansiones decimales infinitas (que están relacionadas con secuencias decimales infinitas) y los números reales. Restringiremos nuestra atención a expansiones decimales infinitas de números en el intervalo unitario[0,1].
DEFINICIÓN. Expansión decimal infinita Para todosn \in \mathbb{N}^{+}, vamosa_{n} \in\ulcorner 10\urcorner. Entoncesa_{1} a_{2} \ldots a_{n} \ldots es una expansión decimal infinita. Dejars ser una expansión decimal infinitaa_{1} a_{2} \ldots. Paran \in \mathbb{N}, vamoss_{n}:=a_{1} \ldots a_{n}=\sum_{k=1}^{n} a_{k} 10^{-k} . Queremos asociar expansiones decimales infinitas con números reales (entendidos como cortes Dedekind). Interpretamos las expansiones decimales infinitas como secuencias Cauchy de números racionales.
DejarD ser el conjunto de expansiones decimales infinitas, y dejarf: D \rightarrow \mathbb{R} ser definido porf\left(. a_{1} \ldots\right)=\lim _{n \rightarrow \infty} s_{n} . La secuencia\left\langle s_{n}\right\rangle es una secuencia de Cauchy por lo que converge a un número real. LetL:=\left\{x \in \mathbb{Q} \mid(\exists n \in \mathbb{N}) x<s_{n}\right\} . El conjuntoL es un corte Dedekind yf(s)=L. Es decir,\lim _{n \rightarrow \infty} s_{n}=L .L es el límite inferior superior del conjunto\left\{s_{n} \mid n \in \mathbb{N}\right\}. Podemos asociar con cada expansión decimal infinita un número real en el intervalo unitario, y así podemos definir una funciónf: D \rightarrow[0,1]. ¿Esf una sobrejección? Es decir, ¿cada número real en el intervalo unitario puede realizarse como una expansión decimal infinita? Vamosx \in[0,1]. Definimos una secuencia creciente de números racionales convergiendo ax. Paran \in N^{+}, dejas_{n} ser la expansión decimal más grande a lugaresn decimales que no es mayor quex. Sin<m, entoncess_{n} es un truncamiento des_{m}. Vamoss=\lim _{n \rightarrow \infty} s_{n} . Entoncesf(s)=x. Por lo tanto,f es una sobreyección sobre[0,1].
Sería ideal sif fuera una inyección, pues de ello seguiría que los cortes de Dedekind son solo las infinitas expansiones decimales. Sin embargo esto no es cierto. Supongamos ques=. a_{1} \ldots a_{n} a_{n+1} \ldots dondea_{n} \neq 9 y para todosk>n, a_{k}=9. Sit=. a_{1} \ldots a_{n-1}\left(a_{n}+1\right) 000 \ldots entoncesf(s)=f(t) . Si nis nit son infinitas expansiones decimales que terminan en repetir 9'ss<t, y, entonces hay algunasn tales ques<t_{n}. Entonces el número racional\left(s_{n}+t_{n}\right) / 2 está en el corte de Dedekindf(t) y no enf(s), entoncesf(s) \neq f(t). Por lo tanto, hemos demostrado el siguiente teorema.
TEOREMA 8.17. D_{0}Sea el conjunto de expansiones decimales infinitas para los números en el intervalo unitario. Dejarf: D_{0} \rightarrow[0,1] ser definido porf\left(. a_{1} a_{2} \ldots\right)=\lim _{n \rightarrow \infty} . a_{1} \ldots a_{n}=\sum_{k=1}^{\infty} a_{k} 10^{-k} . Entoncesf es una surjección. Además, dos expansiones decimales distintas se identificanf por si una de ellas es de la formaa_{1} a_{2} \ldots a_{n} 9999 \ldots cona_{n} \neq 9 y la otra es. a_{1} a_{2} \ldots\left(a_{n}+1\right) 000 \ldots .
COROLARIO 8.18. |[0,1]|=2^{\aleph_{0}}.
PRUEBA. Por Lema 8.17, Proposición6.15 y Teorema 6.11,|[0,1]| \leq\left|D_{0}\right|=\left|\ulcorner 10\urcorner^{\mathbb{N}}\right|=2^{\aleph_{0}} .g\left(\left\langle a_{n}\right\rangle\right)=. a_{1} a_{2} \ldots yh: D_{0} \rightarrow[0,1] definirse como en el argumento para el Teorema 8.17. Entoncesh \circ g:\ulcorner 2\urcorner^{\mathbb{N}} \rightarrow[0,1] es una inyección, y así2^{\aleph_{0}} \leq|[0,1]| . Por el Teorema de Schröder-Bernstein,|[0,1]|=2^{\aleph_{0}} . COROLARIO 8.19. |\mathbb{R}|=2^{\aleph_{0}}.
Order-Completitud
Damos un argumento a favor de la inccountability de\mathbb{R} depender únicamente de sus propiedades abstractas de orden.
DEFINICIÓN. Pedido completo Let(X, \leq) Ser un conjunto ordenado linealmente. Se llama order-complete si, siempreA yB son subconjuntos no vacíos deX con la propiedad que(\forall a \in A)(\forall b \in B) \quad a \leq b, entonces existec enX tal que(\forall a \in A)(\forall b \in B) \quad a \leq c \leq b . Tenga en cuenta que cualquier order-complete set debe tener la menor propiedad de límite superior - siA es cualquier conjunto delimitado no vacío, letB ser el conjunto de todos los límites superiores paraA, y luegoc from (8.20) es el límite superior mínimo (único) para A.
DEFINICIÓN. Denso Let(X, \leq) Ser un conjunto linealmente ordenado, yY \subseteqX. Decimos queY es denso enX si(\forall a<b \in X)(\exists y \in Y) a<y<b . Definición. Extensión Let\left(X, \leq_{X}\right) y\left(Y, \leq_{Y}\right) ser conjuntos ordenados linealmente. Decimos que\left(Y, \leq_{Y}\right) es una extensión de\left(X, \leq_{X}\right) siX \subseteq Y y, para todosx_{1}, x_{2} enX,x_{1} \leq_{X} \quad x_{2} \quad \text { iff } \quad x_{1} \leq_{Y} x_{2} . TEOREMA 8.21. Dejar(X, \leq) ser una extensión de(\mathbb{Q}, \leq). Si(X, \leq) es orden-completo y\mathbb{Q} es denso enX, entoncesX es incontable.
Comprobante. Supongamos queX es una extensión completa de orden contable\mathbb{Q} y que\mathbb{Q} es densa enX.
Que la secuencia\left\langle a_{n} \mid n \in \mathbb{N}\right\rangle sea una bijección de\mathbb{N} aX. Observe que la secuencia impone un orden sobreX. Dejar\preceq ser definidoX por Es(\forall m, n \in \mathbb{N}) a_{m} \preceq a_{n} \Longleftrightarrow m \leq n . decir, para cualquierax, y \in X, x \preceq y six aparece en la secuencia\left\langle a_{n}\right\rangle anteriory. Entonces\preceq es un buen orden deX.
DadoY \subseteq X yy_{0} \in Y, decimos quey_{0} es el elemento\preceq -minimal deY if(\forall x \in Y) y_{0} \preceq x . Así que cada subconjunto deX tiene un elemento\preceq -minimal.
Vamos a definir dos subsecuencias de\left\langle a_{n}\right\rangle, llamado\left\langle a_{f(n)}\right\rangle y\left\langle a_{g(n)}\right\rangle, de modo que para cualquiern \in \mathbb{N}
(1)f(n+1)>g(n)
(2)g(n)>f(n)
(3)a_{f(n+1)} es el elemento\preceq -minimal del conjunto\left\{y \in X \mid a_{f(n)}<y<a_{g(n)}\right\} (4)a_{g(n+1)} es el elemento\preceq -minimal del conjunto\left\{y \in X \mid a_{f(n+1)}<y<a_{g(n)}\right\} . Definimos las subsecuencias por recursión usando la secuencia\left\langle a_{n}\right\rangle para controlar cuidadosamente la construcción. A este argumento se le llama argumento de ida y vuelta. Dadas secuencias finitas de longitud queN satisfacen las propiedades mencionadas anteriormente, definimosa_{f(N+1)} sujetas a restricciones impuestas pora_{f(N)} ya_{g(N)}. Luego definimosa_{g(N+1)} sujetos a las limitaciones impuestas pora_{f(N+1)} ya_{g(N)}. Luego definimosa_{f(N+2)}, a_{g(N+2)}, y así sucesivamente.
Vamosf(0)=0. Entoncesa_{f(0)}=a_{0}. Dejarg(0) ser el entero más pequeñon tal quea_{0}<a_{n}. Tenga en cuenta que esto equivale a definirg(0) por lo quea_{g(0)} es el elemento\preceq -minimal deX mayor quea_{0}. Supongamos que hemos definido subsecuencias finitas\left\langle a_{f(n)} \mid n \leq N\right\rangle,\left\langle a_{g(n)} \mid n \leq N\right\rangle que satisfacen las propiedades de orden enumeradas anteriormente. Definiremosa_{f(N+1)} ya_{g(N+1)} satisfaceremos las propiedades de pedido enumeradas anteriormente. El conjuntoX contiene los números racionales y dado que\mathbb{Q} es denso enX, hay un elemento deX,x, tal quea_{f(N+1)}<x<g_{(N+1)} . Leta_{f(N+1)} be the\preceq -elemento mínimo deX tal quea_{f(N)}<a_{f(N+1)}<a_{g(N)} . Since\preceq es un orden bien definido deX, f(N+1) está bien definido. Dejamosa_{g(N+1)} ser el elemento\preceq -minimal deX tal quea_{f(N+1)}<a_{g(N+1)}<a_{g(N)} . Por nuestra discusión anterior,g(N+1) está bien definido. Observe que para cualquierm, n \in \mathbb{N},a_{f(m)}<a_{g(n)} . Por lo tanto la secuencia creciente\left\langle a_{f(n)} \mid n \in \mathbb{N}\right\rangle está delimitada arriba, y por Lema 8.5, la secuencia converge a su límite inferior superior,a.
Para cualquieran \in \mathbb{N},a_{f(n)}<a<a_{g(n) .} . So noa es un término de ninguna subsecuencia. Demostramos que noa es un término en la secuencia\left\langle a_{n}\right\rangle. Supongamos a modo de contradicción quea=a_{n} para algunosn \in \mathbb{N}. Ya quef(0)=0, n \neq 0. LetY=(f[\mathbb{N}] \cup g[\mathbb{N}]) \cap\ulcorner n\urcorner . ThenY \neq \emptyset es finito, y tiene un elemento máximo.
Si el elemento máximo deY esf(0), entonces para cada1 \leq k<n, debemos tenera_{k}<a_{0}. Pero entoncesg(0) serían, lo que contradice el hecho de que non está en el rango deg.
Si el elemento máximo deY esf(m+1) para algunosm, entoncesg(m+1)>n, yf(m+1)<n<g(m+1) . Sin embargoa_{f(m+1)}<a_{n}<a_{g(m+1)}<a_{g(m) .} . Esto es imposible ya quea_{g(m+1)} es el\preceq - elemento mínimo deX en el intervalo abierto\left(a_{f(m+1)}, a_{g(m)}\right).
Si el elemento máximo deY esg(m) para algunosm, entoncesf(m+1)>n yg(m)<n<f(m+1) . Sin embargoa_{f(m)}<a_{f(m+1)}<a_{n}<a_{g(m)} . Esto es imposible ya quea_{f(m+1)} es el elemento\preceq -minimal de Xen el intervalo abierto\left(a_{f(m)}, a_{g(m)}\right). Entonces noa es un término en la secuencia\left\langle a_{n}\right\rangle. Por lo tanto no hay bijección de\mathbb{N} aX, yX es incontable.
Por el Ejercicio 8.20,\mathbb{Q} es denso en\mathbb{R}. Como el conjunto de números reales es orden-completado por el teorema de límite superior mínimo, obtenemos:
COROLARIO 8.22. El conjunto de números reales es incontable.
TEOREMA 8.23. Dejar\left(X, \leq_{X}\right) ser una extensión orden-completa de\mathbb{Q} en la que\mathbb{Q} es densa, y tal que noX tiene elemento máximo o mínimo. Luego hay una bijección conservadora de orden de\mathbb{R} hacia adelanteX que es la identidad en adelante\mathbb{Q}.
Comprobante. Definamos un mapaf: \mathbb{R} \rightarrow X. Siq \in \mathbb{Q}, definaf(q)=q. Si\alpha \in \mathbb{R} \backslash \mathbb{Q}, definaf(\alpha) que sea el límite inferior superior enX de\{q \in \mathbb{Q} \mid q \leq \alpha\}. La funciónf está bien definida, porqueX tiene la Propiedad de Límite Mínimo Superior. Es inyectivo, porque si\alpha \neq \beta, hay números racionales entre\alpha y\beta.
Mostrarf es sobre, supongamosx \in X. \alpha \in \mathbb{R}Definir para ser el límite inferior superior en\mathbb{R} de\left\{q \in \mathbb{Q} \mid q \leq_{X} x\right\}. Entoncesf(\alpha)=x.
Finalmente,f se preserva el orden porque si\alpha \leq \beta, entoncesf(\beta) se define como el límite inferior superior de un superconjunto del conjunto cuyo límite inferior superior esf(\alpha), y asíf(\alpha) \leq_{X} f(\beta).
OBSERVACIÓN. ¿Qué pasa si bajamos el requisito que noX tienen elemento máximo o mínimo?
Ejercicios
EJERCICIO 8.1. DejarS ser la función sucesora en la Definición 8.1. Demostrar queS(\emptyset) \neq \emptyset . Probar que para cualquier conjuntoX,S(X) \neq X . EJERCICIO 8.2. Demostrar que ningún subconjunto apropiado de\mathbf{N} (ver ecuación 8.1) es inductivo.
EJERCICIO 8.3. Dejar\mathcal{F}=\left\{X_{\alpha} \mid \alpha \in Y\right\} ser una familia de conjuntos inductivos indexados porY. Demostrar que\bigcap_{\alpha \in Y} X_{\alpha} es inductivo.
EJERCICIO 8.4. Demostrar que la suma y multiplicación en\mathbb{N} (como se define formalmente en la Sección 8.1) son asociativas, conmutativas y distributivas.
EJERCICIO 8.5. Demostrar que la relación\leq definida\mathbb{N} en Sección8.1 es un ordenamiento lineal de\mathbb{N}.
EJERCICIO 8.6. Demostrar que la suma y multiplicación en\mathbb{Z} (como se define formalmente en la Sección 8.2) son asociativas, conmutativas y distributivas.
EJERCICIO 8.7. Demostrar que la relación\leq definida\mathbb{Z} en Sección8.2 es un ordenamiento lineal de\mathbb{Z}.
EJERCICIO 8.8. Demostrar que\leq es un buen ordenamiento de\mathbb{N} pero no de\mathbb{Z} (utilizando la definición formal de la relación).
EJERCICIO 8.9. Demostrar que la suma y multiplicación en\mathbb{Z} y la relación\leq sobre\mathbb{Z} extiende las operaciones y la relación sobre\mathbb{N}. DejarI: \mathbb{N} \rightarrow \mathbb{Z} ser definido porI(n)=[\langle n, 0\rangle] . Demostrar queI es una inyección y eso para todosm, n \in \mathbb{N},I(m+n)=I(m)+I(n),I(m \cdot n)=I(m) \cdot I(n) ym \leq n \Rightarrow I(m) \leq I(n) Tenga en cuenta que las operaciones en los lados izquierdos de las ecuaciones 8.24y8.25 se definen en\mathbb{N} y en el lado derecho se definen en\mathbb{Z}. De igual manera, el antecedente de enunciado8.26 se define en\mathbb{N} y la consecuencia se define en\mathbb{Z}.
EJERCICIO 8.10. Demostrar que la suma y la multiplicación\mathbb{Q} (como se define formalmente en la Sección 8.3) son asociativas, conmutativas y distributivas.
EJERCICIO 8.11. Demostrar que la relación\leq definida\mathbb{Q} en Sección8.3 es un ordenamiento lineal de\mathbb{Q}.
EJERCICIO 8.12. Demostrar que la suma y multiplicación\mathbb{Q} y la relación\leq sobre\mathbb{Q} extiende las operaciones y la relación sobre\mathbb{Q}. DejarI: \mathbb{Z} \rightarrow \mathbb{Q} definirse porI(a)=[\langle a, 1\rangle] . Probar queI es una inyección y que para todosa, b \in \mathbb{Z},\ [\ begin {recopilados} I (a+b) =I (a) +I (b)\\ I (a\ cdot b) =I (a)\ cdot I (b) \ end {recopilados}\] ya \leq b \Rightarrow I(a) \leq I(b) Nota que las operaciones en los lados izquierdos de las ecuaciones8.27 y8.28 se definen en\mathbb{Z} y en el lado derecho se definen en\mathbb{Q}. De igual manera, el antecedente de enunciado8.29 se define en\mathbb{Z} y la consecuencia se define en\mathbb{Q}.
EJERCICIO 8.13. Demostrar que cada elemento distinto de cero de\mathbb{Q} tiene un inverso multiplicativo en\mathbb{Q}. EJERCICIO 8.14. Probar declaraciones (1), (2) y (3) en la Sección 8.4.
EJERCICIO 8.15. Demostrar Teorema 8.2.
EJERCICIO 8.16. DejarX \subseteq \mathbb{R}, Y \subseteq \mathbb{R} y dejar que cada elemento deX ser menos que cada elemento deY. Demostrar que hay(\forall x \in X)(\forall y \in Y) x \leq a \leq y . EJERCICIOa \in \mathbb{R} satisfactorio 8.17. X \subseteq \mathbb{R}Déjese acotar arriba. Demostrar que el límite inferior superior deX es único.
EJERCICIO 8.18. X \subseteq \mathbb{R}Déjese acotar a continuación. Demostrar queX tiene un mayor límite inferior.
EJERCICIO 8.19. Sólo se probó el caso especial del Teorema de Bolzano-Weierstrass (Teorema 8.6) (donde[b, c] está el intervalo unitario cerrado,[0,1]). Generalizar la prueba ab, c \in \mathbb{R} donde arbitrariab \leq c.
EJERCICIO 8.20. VamosX \subseteq \mathbb{R}. Decimos queX es denso en\mathbb{R} si se da algunoa, b \in \mathbb{R} cona<b, hayx \in X tal quea \leq x \leq b . a) Demostrar que\mathbb{Q} es denso en\mathbb{R}.
b) Demostrar que\mathbb{R} \backslash \mathbb{Q} es denso en\mathbb{R}.
EJERCICIO 8.21. Dejar\left\langle a_{n}\right\rangle ser una secuencia de inyección. ¿Cuál es la cardinalidad del conjunto de todas las subsecuencias de\left\langle a_{n}\right\rangle? ¿Qué se puede decir sobre el conjunto de subsecuencias de una secuencia no inyectable?
EJERCICIO 8.22. Dejars ser una expansión decimal infinita, y para cualquieran \in \mathbb{N}^{+}, dejars_{n} ser el truncamiento des a la posiciónn^{t h} decimal. Demostrar que la secuencia\left\langle s_{n}\right\rangle es una secuencia de Cauchy.
EJERCICIO 8.23. Dejar\left\langle a_{n}\right\rangle ser una secuencia convergente y\left\langle a_{f(n)}\right\rangle ser una subsecuencia de\left\langle a_{n}\right\rangle. Demostrar que\lim _{n \rightarrow \infty} a_{n}=\lim _{n \rightarrow \infty} a_{f(n)} . Exercise 8.24. Demostrar la siguiente generalización de la desigualdad triangular: si la serie\sum_{n=0}^{\infty} a_{n} converge, entonces\left|\sum_{n=0}^{\infty} a_{n}\right| \leq \sum_{n=0}^{\infty}\left|a_{n}\right| . EJERCICIO 8.25. Dejarf ser una función real continua ena, y dejar\left\langle a_{n}\right\rangle ser una secuencia convergente aa. Demostrar que\lim _{n \rightarrow \infty} f\left(a_{n}\right)=f(a) . Exercise 8.26. Dar un ejemplo de una función continua en un intervalo abierto que logre sus valores extremos en el intervalo. Dar un ejemplo de una función continua definida en un intervalo abierto que no alcanza sus valores extremos en el intervalo.
EJERCICIO 8.27. Completar la prueba del Teorema8.12 - es decir, probar el resultado porf(c) un valor mínimo def on(a, b).
EJERCICIO 8.28. Demostrar Corolario 8.15.
EJERCICIO 8.29. Demostrar que cualquier función real de inyección continua en un intervalo es monótona en ese intervalo.
EJERCICIO 8.30. Demostrar que no hay bijección continua de(0,1) a[0,1].
EJERCICIO 8.31. Demostrar que cada polinomio\mathbb{R}[x] de grado impar tiene al menos una raíz real.
EJERCICIO 8.32. Demuestra que si tienes una mesa cuadrada, con patas de igual longitud, y un piso continuo, siempre puedes rotar la mesa para que las 4 patas estén simultáneamente en contacto con el piso. (Pista: Aplicar el teorema del valor Intermedio a una función elegida apropiadamente). Esta es una de las primeras aplicaciones de las matemáticas a las cafeteras.
EJERCICIO 8.33. La prueba de la Proposición 8.16 requiere que los números reales distintos de cero tengan recíprocos (y de ahí que los cocientes de los números reales estén bien definidos). Demostrar que los números reales distintos de cero tienen recíprocos. EJERCICIO 8.34. Demostrar que hay exactamente 4 extensiones de orden completo de\mathbb{Q} en las que\mathbb{Q} es denso. CAPÍTULO 9
Números Complejos
Cubicos
¿Cómo se encuentran las raíces de un polinomio cúbico? Los babilonios conocían la fórmula cuadrática en el segundo milenio antes de Cristo, pero una fórmula para el cúbico solo se encontró en el16^{\text {th }} siglo. La historia del descubrimiento es complicada, pero la mayor parte del crédito debería ir a Nicolo Tartaglia. La solución fue publicada en 1545 en el influyente libro Artis magnae sive de regulis algebraicis liber unus de Girolomo Cardano. 9.2La fórmula se conoce hoy como la fórmula Tartaglia-Cardano. Para un relato histórico, véase por ejemplo [6].
Considerar un polinomio cúbico en\mathbb{R}[x]p(x)=a_{3} x^{3}+a_{2} x^{2}+a_{1} x+a_{0} . Si queremos encontrar las raíces, no hay pérdida de generalidad al asumir quea_{3}=1, ya que los ceros dep son los mismos que los ceros de\frac{1}{a_{3}} p.
La segunda simplificación es que podemos asumira_{2}=0. Efectivamente, hacer el cambio de variablex=y-\beta, para\beta que algunos sean elegidos posteriormente. Entonces\ [\ begin {alineado} p (x) &=x^ {3} +a_ {2} x^ {2} +a_ {1} x+a_ {0}\\ & =( y-\ beta) ^ {3} +a_ {2} (y-\ beta) ^ {2} +a_ {1} (y-\ beta) +a_ {0}\ & =y^ {3} +\ izquierda [a_ {2} -3\ beta\ derecha] y^ {2} +\ izquierda [a_ {1} -2 a_ {2}\ beta+3\ beta^ {2}\ derecha] y+\ izquierda [a_ {0} -a_ {1}\ beta+a_ {2}\ beta^ {2} -\ beta^ {3}\ derecho]\\ & ; =:\ quad q (y). \ end {alineado}\] Elija\beta=a_{2} / 3. Entonces el coeficiente dey^{2} in seq(y) desvanece. Supongamos que puedes encontrar las raíces deq, llámalos\alpha_{1}, \alpha_{2}, \alpha_{3}. Entoncesp son las raíces del polinomio original\alpha_{1}-\beta, \alpha_{2}-\beta, \alpha_{3}-\beta.
Por lo tanto, basta con encontrar una fórmula para las raíces de un cúbico en el que el término cuadrático se desvanece. A esto se le llama cúbico reducido. Como ahora solo quedan dos coeficientes, bajaremos los subíndices y escribiremos nuestro cúbico reducido comoq(x)=x^{3}+a x+b . La idea clave es hacer otra sustitución, más ingeniosa. Introduzcamos una nueva variablew, relacionada conx porx=w+\frac{c}{w}, dondec es una constante que elegiremos más adelante. Entonces\ [\ comenzar {alineado} q (x) &=\ izquierda (w+\ frac {c} {w}\ derecha) ^ {3} +a\ izquierda (w+\ frac {c} {w}\ derecha) +b\\ &=w^ {3} + [3 c+a] w+\ izquierda [3 c^ {2} +a c\ derecha]\ frac {1} {w} +c^ {3}\ frac {1} {w^ {3}} +b. \ end {aligned}\] Elijac=-\frac{a}{3}, para que tanto el coeficientew de como1 / w en (9.4) desaparezcan. xEntonces encontrar así queq(x)=0 es lo mismo que encontrarw para que\ [\ begin {aligned} w^ {3} +\ frac {c^ {3}} {w^ {3}} +b &=0\ \ Longleftrightarrow w^ {6} +b w^ {3} +c^ {3} &=0. \ end {aligned}\] La ecuación (9.5) es de grado 6, que parece peor que el cúbico original; pero desaparecen tantos términos que en realidad es una ecuación cuadrática enw^{3}. Por lo tanto se puede resolver por la fórmula cuadrática:w^{3}=\frac{-b \pm \sqrt{b^{2}-4 c^{3}}}{2} . Sabiendow, podemos recuperarnosx porx=w+\frac{c}{w}=w-\frac{a}{3 w} . Así llegamos a la fórmula Tartaglia-Cardano para las raíces del cúbico reducido (9.2):x=\left[\frac{-b \pm \sqrt{b^{2}+\frac{4 a^{3}}{27}}}{2}\right]^{1 / 3}-\frac{a}{3\left[\frac{-b \pm \sqrt{b^{2}+\frac{4 a^{3}}{27}}}{2}\right]^{1 / 3}} . ¿Cómo funciona el ¿trabajo de fórmula en la práctica?
EJEMPLO 9.8. Vamosp(x)=x^{3}-3 x+2. Entoncesc=1, y (9.6) dicew^{3}=-1. Por lo tantow=-1, y asíx=-2 es una raíz. Por lo tanto, por Lemma4.13,(x+2) es un factor dep. Factorización, obtenemosx^{3}-3 x+2=(x+2)\left(x^{2}-2 x+1\right) . El último término factores como(x-1)^{2}, por lo que concluimos que las raíces son-2,1,1.
En el Ejemplo 9.8, la fórmula funcionó, pero sólo nos dio una de las raíces. Considera el siguiente ejemplo:
EJEMPLO 9.9. Vamosp(x)=x^{3}-3 x+1 . Entoncesc=1, yw^{3}=\frac{-1 \pm \sqrt{-3}}{2} . Ahora tenemos un problema peor:w^{3} implica la raíz cuadrada de un número negativo, y aunque le demos sentido a eso, entonces tenemos que extraer una raíz cubo. ¿Es esto analágico a tratar de resolver la ecuación cuadrática?q(x):=x^{2}+x+1=0 ? La fórmula cuadrática vuelve a dar el lado derecho de(9.11), y lo explicamos diciendo que de hecho noq tiene raíces reales. En efecto, la gráfica muestra queq se parece a la Figura 9.12.
FIGURA 9.12. Parcela deq(x)=x^{2}+x+1
Pero esto no puede ser el casop. En efecto,\ [\ begin {aligned} p (-2) &=-1<0\\ p (0) &=1>0\\ p (1) &=-1<0\\ p (2) &=3>0 \ end {aligned}\] Por lo tanto, por el Teorema del Valor Intermedio8.10, p debe tener una raíz en cada uno de los intervalos(-2,0),(0,1) y (1,2). Comop puede tener como máximo 3 raíces por Teorema4.10, por lo tanto, debe tener exactamente tres raíces. Una gráfica dep se parece a la Figura 9.13.
Resulta que se pueden encontrar las raíces dep en Ejemplo9.9 interpretando correctamente la fórmula Tartaglia-Cardano. Volveremos a este ejemplo en la Sección 9.3, después de que desarrollemos las ideas necesarias. La gran idea es introducir la noción de un número complejo.
Números Complejos
DEFINICIÓN. Número complejo Un número complejo es una expresión de la formaa+i b, dondea yb son números reales.
FIGURA 9.13. Parcela dep(x)=x^{3}-3 x+1
Por el momento, se puede pensari en el ina+i b como un símbolo formal, o un lugaretero. Posteriormente, veremos que tiene otra interpretación.
Notación. \mathbb{C}Vamos a dejar\mathbb{C} denotar el conjunto de todos los números complejos:\mathbb{C}=\{a+i b: a, b \in \mathbb{R}\} . Como conjunto, uno puede identificarse\mathbb{C} con de la\mathbb{R}^{2} manera obvia. Esto nos permite definir la suma; lo que no es tan obvio es que también hay una buena definición para la multiplicación.
DEFINICIÓN. Dejara+i b yc+i d ser números complejos. Entonces su suma y producto son definidos por\ [\ begin {aligned} (a+i b) + (c+i d) & =( a+c) +i (b+d)\\ (a+i b)\ times (c+i d) & =( a c-b d) +i (a d+b c). \ end {aligned}\] La fórmula para la suma (9.14) es justo lo que obtendrías si identificaras el número complejoa+i b con el vector(a, b) en\mathbb{R}^{2} y usaras la suma del vector. El producto es más sutil. Si multiplicas el lado izquierdo de (9.15), obtienesa c+i(a d+b c)+i^{2} b d . Uno llega al lado derecho de (9.15) definiendoi^{2}=-1 \text {. } Asíi es la raíz cuadrada de-1; es decir, es una cantidad algebraica que introducimos que se define a tener la propiedad que es su plaza-1. Obviamente estoi impide ser un número real.
En esencia hemos continuado el programa de definición de sistemas numéricos que iniciamos en el Capítulo 8. La suma y multiplicación de números complejos se han definido por operaciones algebraicas sobre\mathbb{R} \times \mathbb{R}. Dado que las operaciones algebraicas sobre los números reales se definieron teóricamente, hemos definido operaciones algebraicas en operaciones\mathbb{C} por conjunto. A diferencia de los otros sistemas de números que hemos definido, no definimos un orden lineal de\mathbb{C}. Generalmente no es útil pensar en números complejos en una recta numérica. Sin embargo, es muy útil pensar en los números complejos como puntos en el plano\mathbb{R}^{2}, y describirlos en coordenadas polares.
Como es habitual, el punto con coordenadas cartesianas(x, y) tiene coordenadas polares(r, \theta), donde están relacionadas por\ [\ begin {array} {cl} r=\ sqrt {x^ {2} +y^ {2}} &\ tan (\ theta) =y/x\\ x=r\ cos\ theta & y=r\ sin\ theta. \ end {array}\] Así que el número complejo también sez=x+i y puede escribir comoz=r(\cos \theta+i \sin \theta) . La forma (9.18) es tan ampliamente utilizada que hay una notación especial para ello.
FIGURA 9.17. Coordenadas polares
Notación. \operatorname{Cis}(\theta):=\cos \theta+i \sin \theta .DEFINICIÓN CIS. Para el número complejoz=x+i y=r \operatorname{Cis}(\theta), tenemos lo siguiente:
\Re(z) xse llama la parte real dez, escrito\Re(z);
\Im(z) yse llama la parte imaginaria dez, escrito\Im(z);
|z| rse llama el módulo dez, o valor absoluto dez, escrito|z|;\arg (z) \theta se llama el argumento dez, escrito\arg (z).
\bar{z}El númerox-i y se llama el conjugado dez, escrito\bar{z}.
OBSERVACIÓN. Hay un punto importante a tener en cuenta sobre el argumento: sólo es único hasta la adición de múltiplos de2 \pi. En otras palabras, si\theta_{0} es un argumento del número complejoz, entonces también lo son todos los números\left\{\theta_{0}+2 k \pi: k \in \mathbb{Z}\right\}. La adición es más fácil en coordenadas cartesianas: agregar las partes reales e imaginarias. La multiplicación es más fácil en coordenadas polares: multiplicar los módulos y sumar los argumentos.
Proposición 9.19. Dejarz_{1}=r_{1} \operatorname{Cis}\left(\theta_{1}\right) yz_{2}=r_{2} \operatorname{Cis}\left(\theta_{2}\right). Despuész_{1} z_{2}=r_{1} r_{2} \operatorname{Cis}\left(\theta_{1}+\theta_{2}\right) . Prueba. Multiplicando, obtenemos\ [\ begin {alineado} z_ {1} z_ {2} =r_ {1} r_ {2}\ left [\ cos\ theta_ {1}\ cos\ theta_ {2} -\ sin\ theta_ {1}\ sin\ theta_ {2}\ derecha. \\ &\ izquierda. +i\ izquierda (\ cos\ theta_ {1}\ sin\ theta_ {2} +\ cos\ theta_ {2}\ sin\ theta_ {1}\ derecha)\ derecha]. \ end {aligned}\] El resultado sigue por las identidades trigonométricas para el coseno y el seno de la suma de dos ángulos.
Una consecuencia de la Proposición9.19 es la siguiente fórmula para elevar un número complejo a una potencia, llamada teorema de De Moivre.
TEOREMA 9.20. Teorema de De Moivre Letz=r \operatorname{Cis}(\theta) be a nonzero complex number, and letn \in \mathbb{Z}. Despuész^{n}=r^{n} \operatorname{Cis}(n \theta) . Prueba. Sin \geq 0, entonces se(9.21) puede probar por inducción a partir de la Proposición 9.19. Porn negativo, basta con observar que por Proposición Ahora9.19[r \operatorname{Cis}(\theta)]\left[r^{-1} \operatorname{Cis}(-\theta)\right]=1 \operatorname{Cis}(0)=1 . podemos demostrar que cada número complejo distinto de cero tienen^{\text {th }} raíces exactamenten distintas.
TEOREMA 9.22. Dejarz=r \operatorname{Cis}(\theta) ser un número complejo distinto de cero, y dejarn ser un entero mayor que 1. Entonces hay exactamente númerosn complejos quew satisfacen la ecuaciónw^{n}=z. Ellos son\left\{r^{1 / n} \operatorname{Cis}\left(\frac{\theta}{n}+\frac{2 k \pi}{n}\right): k=0,1, \ldots, n-1\right\} . Prueba. Supongamos quew=\rho \operatorname{Cis}(\phi) es unan^{\text {th }} raíz dez. Entonces por el teorema de De Moivre,\rho^{n}=r yn \phi es un argumento dez. Como\rho debe ser un número real positivo, es lan^{\text {th }} raíz positiva única der. El númeron \phi puede ser cualquier argumento dez, así que tenemosn \phi=\theta+2 k \pi, \quad k \in \mathbb{Z} . Así\phi puede tener la forma\frac{\theta}{n}+\frac{2 k \pi}{n} para cualquier enterok. No obstante,\phi diferentes's darán lugar al mismo número complejow si difieren en un múltiplo de2 \pi. Entonces hay exactamenten diferentesw de las que sonn^{\text {th }} raíces dez.
EJEMPLO 9.24. ¿De qué nos9.22 dice el Teorema son las raíces cuadradas-1? Dejamosr=1 y\theta=\pi, y obtenemos las raíces cuadradas son\operatorname{Cis}(\pi / 2)=i y\operatorname{Cis}(-\pi / 2)=-i.
EJEMPLO 9.25. Encuentra las raíces cubicas de1 .
En la notación de Teorema9.22, r=1 y\theta=0. Por lo tanto las raíces cúbicas son\ [\ begin {alineadas} 1 &=\ operatorname {Cis} (2\ pi/3) =-\ frac {1} {2} +i\ frac {\ sqrt {3}} {2} \\ omega^ {2} &=\ operatorname {Cis} (4\ pi/3) =-\ frac {1} {2} -i\ frac {\ sqrt {3}} {2}. \ end {aligned}\] El número\omega se llama raíz cúbica primitiva de la unidad, porque todas las raíces cúbicas se obtienen como\omega, \omega^{2}, \omega^{3}.
DEFINICIÓN. Raíz primitiva de la unidad Unan^{\text {th }} raíz primitiva de la unidad es un número\omega tal que\left\{1, \omega, \omega^{2}, \ldots, \omega^{n-1}\right\} constituye todas lasn^{\text {th }} raíces de 1.
Proposición 9.26. Dejarz ser un número complejo, yw_{0} ser algunan^{\text {th }} raíz dez. \omegaSea unan^{\text {th }} raíz primitiva de unidad. Entonces todas lasn^{\text {th }} raíces dez son\left\{w_{0}, \omega w_{0}, \omega^{2} w_{0}, \ldots, \omega^{n-1} w_{0}\right\}.
Tartaglia-Cardano Revisitado
Consideremos de nuevo Ejemplo 9.9. Queríamos encontrar las raíces cúbicas de\zeta_{\pm}=\frac{-1 \pm \sqrt{-3}}{2} . Si tomamos la+ señal, obtenemos\zeta_{+}=\operatorname{Cis}(2 \pi / 3), y si tomamos el - signo, obtenemos\zeta_{-}=\operatorname{Cis}(4 \pi / 3) . Así\zeta_{+} tiene 3 raíces, es decir\left\{\operatorname{Cis}\left(\frac{2 \pi}{9}+\frac{2 k \pi}{3}\right): k=0,1,2\right\} \text {, } y\zeta_{-} tiene 3 raíces, a saber\left\{\operatorname{Cis}\left(\frac{4 \pi}{9}+\frac{2 k \pi}{3}\right): k=0,1,2\right\} \text {, } Saberw, queremos encontrarx, que por ejemplo9.9 viene dado porw+1 / w. Para cualquier númerow que pueda escribirse como\operatorname{Cis}(\theta) (es decir, cualquier número complejo de módulo 1), tenemos\ [\ begin {aligned} w+\ frac {1} {w} &=\ cos\ theta+i\ sin\ theta+\ cos (-\ theta) +i\ sin (-\ theta)\\ &=2\ cos\ theta. \ end {aligned}\] Por lo tanto las raíces del polinomio dadas en (9.10)\left\{2 \cos \frac{2 \pi}{9}, 2 \cos \frac{8 \pi}{9}, 2 \cos \frac{14 \pi}{9}, 2 \cos \frac{4 \pi}{9}, 2 \cos \frac{10 \pi}{9}, 2 \cos \frac{16 \pi}{9}\right\} . son ¿Son estas 6 raíces diferentes? Teorema4.10 dice quep puede tener como máximo 3 raíces diferentes. Como\cos (\theta)=\cos (2 \pi-\theta), vemos nuestro conjunto (9.27) puede escribirse como\left\{2 \cos \frac{2 \pi}{9}, 2 \cos \frac{4 \pi}{9}, 2 \cos \frac{8 \pi}{9}\right\} . Resulta que la fórmula Tartaglia-Cardano (9.7) sí da las tres raíces del cúbico, y además no importa si uno elige el- signo+ o, siempre y cuando como se calcula las 3 raíces cubitas de (9.6) para alguna elección de signo. Utilizaremos\mathbb{C}[z] para denotar el conjunto de polinomios enz con coeficientes de\mathbb{C}.
TEOREMA 9.29. Considerar el polinomiop(z)=z^{3}+a z+b en\mathbb{C}[z], y asumira \neq 0. Letc=-a / 3, y\zeta=\frac{-b+\sqrt{b^{2}-4 c^{3}}}{2} . let\zeta be Letw_{1}, w_{2}, w_{3} be las tres distintas raíces cubitas de\zeta. Para cada unow_{i}, definaz_{i} b yz_{i}=w_{i}+\frac{c}{w_{i}} . Entoncesp(z)=\left(z-z_{1}\right)\left(z-z_{2}\right)\left(z-z_{3}\right) . REMARCA. De la prueba se deduce que no importa qué raíz cuadrada deb^{2}-4 c^{3} uno elija en (9.31).
Comprobante. Sip está dado por (9.32), entoncesp(z)=z^{3}-\left(z_{1}+z_{2}+z_{3}\right) z^{2}+\left(z_{1} z_{2}+z_{2} z_{3}+z_{3} z_{1}\right) z-\left(z_{1} z_{2} z_{3}\right) . Debemos demostrar que los coeficientes en (9.33) coinciden con los de (9.30). Por la Proposición 9.26, podemos asumirw_{1}=\omega w_{3}, \quad w_{2}=\omega^{2} w_{3} dónde\omega=-\frac{1}{2}+i \frac{\sqrt{3}}{2} está una primitiva raíz cubo de unidad. En los siguientes cálculos, utilizamos los hechos que\omega^{2}=1 / \omega y1+\omega+\omega^{2}=0. (¿Por qué son ciertas estas?) Observe esow_{3} \neq 0, como eso obligaríac=0.
El coeficiente dez^{2} in (9.33) es\ [\ begin {alineado} -\ left (z_ {1} +z_ {2} +z_ {3}\ right) &=-w_ {3}\ left (\ omega+\ omega^ {2} +1\ right) -\ frac {1} {w_ {3}}\ left (\ omega^ {2} +\ omega+1\ derecha)\\ &=0. \ end {alineado}\] El coeficiente dez es\ [\ begin {alineado} z_ {1} z_ {2} +z_ {2} z_ {3} +z_ {3} z_ {1} =&\ left (\ omega w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ derecha)\ izquierda (\ omega^ {2} w_ {3} +c\ omega\ frac {1} {w_ {3}}\ derecha)\\ &+\ izquierda (\ omega^ {2} w_ {3} +c\ omega\ frac {1} {w_ {3}}\ derecha)\ izquierda (w_ {3} +c\ frac {1} {w_ {3}}\ derecha)\\ &+\ izquierda (w_ {3} +c\ frac {1} {w_ {3}}\ derecha)\ izquierda (\ omega w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ derecha)\\ =& w_ {3} ^ {2}\ izquierda (1+\ omega^ {2} +\ omega\ derecha) +3 c\ izquierda (\ omega+\ omega^ {2}\ derecha) +\ frac {c^ {2}} {w_ {3} ^ {2}}\ izquierda (1+\ omega+\ omega^ {2}\ derecha)\\ =&-3 c\ =& a. \ end {alineado}\] El término constante en (9.33) es\ [\ begin {alineado} -z_ {1} z_ {2} z_ {3} &=-\ left (\ omega w_ {3} +c\ omega^ {2}\ frac {1} {w_ {3}}\ right)\ left (\ omega^ {2} w_ {3} +c\ omega\ frac {1} {w_ {3}}\ derecha)\ izquierda (w_ {3} +\ frac {1} {w_ {3}}\ derecha)\\ &=-w_ {3} ^ {3} -c w_ {3}\ izquierda (1+\ omega^ {2} +\ omega\ derecha) -\ frac {c^ {2}} {\ frac {1} {w_ {3}}}\ izquierda (\ omega+1+\ omega^ {2}\ derecha) -\\ &=-\ zeta-\ frac {c^ {3}} {\ zeta}\\ &=-\ frac {-b+\ sqrt {b^ {2} -4 c^ {3}}} {2} -\ frac {2 c^ {3}} {-b+\ sqrt {b^ {2} -4 c^ {3}}}\\ &=\ frac {-b^ {2} +2 b\ sqrt {b^ {2} -4 c^ {3}} -\ izquierda (b^ {2} -4 c^ {3}\ derecha) -4 c^ {3}} {2\ left (-b+\ sqrt {b^ {2} -4 c^ {3}} \ derecha)}\\ &=\ frac {b\ izquierda (-b+\ sqrt {b^ {2} -4 c^ {3}}\ derecha)} {-b+\ sqrt {b^ {2} -4 c^ {3}}}\\ &=b. \ end {aligned}\] Por lo tanto todos los coeficientes de (9.30) y (9.32) coinciden, por lo que son el mismo polinomio.
Por lo tanto, la fórmula Tartaglia-Cardano da las tres raíces a un polinomio cúbico reducidop con coeficientes complejos (pueden ocurrir raíces repetidas). Si los coeficientesa yb son reales, sabemos por el Teorema del Valor Intermedio que al menos una de las tres raíces dep será real (Ver Ejercicio 8.31). Como muestra el Ejemplo 9.9, sin embargo, aún puede ser necesario tomar la raíz cúbica de un complejo\zeta para obtener las raíces reales de un cúbico real. Esta realización fue lo que llevó a la aceptación de los números complejos como objetos útiles más que como una fantasía extraña.
Teorema Fundamental de Álgebra
El álgebra sobre los números complejos es en muchos sentidos más fácil que sobre los números reales. La razón es que un polinomio de gradoN en\mathbb{C}[z] tiene exactamenteN ceros, contando multiplicidad. Esto se llama el Teorema Fundamental del Álgebra. Para probarlo, debemos establecer algunos resultados preliminares.
Algún análisis.
DEFINICIÓN. Decimos que una secuencia\left\langle z_{n}=x_{n}+i y_{n}\right\rangle de números complejos converge al númeroz=x+i y iff\left\langle x_{n}\right\rangle converge ax y\left\langle y_{n}\right\rangle converge ay. Decimos que la secuencia es Cauchy iff ambos\left\langle x_{n}\right\rangle y\left\langle y_{n}\right\rangle son Cauchy.
OBSERVACIÓN. Esto es lo mismo que decir que\left\langle z_{n}\right\rangle converge az iff\left|z-z_{n}\right| tiende a cero, y eso\left\langle z_{n}\right\rangle es Cauchy iff(\forall \varepsilon>0)(\exists N)(\forall m, n>N)\left|z_{m}-z_{n}\right|<\varepsilon . DEFINICIÓN. VamosG \subseteq \mathbb{C}. Decimos que una funciónf: G \rightarrow \mathbb{C} es continua enG si, siempre que\left\langle z_{n}\right\rangle es una secuencia enG que converge a algún valorz_{\infty} enG, entonces\left\langle f\left(z_{n}\right)\right\rangle converge a f\left(z_{\infty}\right).
PROPOSICIÓN 9.34. Los polinomios son funciones continuas en\mathbb{C}.
Comprobante. Repita la prueba de Proposición5.23 con números complejos en lugar de números reales.
DEFINICIÓN. Un rectángulo cerrado es un conjunto de la forma\{z \in \mathbb{C} \mid a \leq\Re(z) \leq b, c \leq \Im(z) \leq d\} para algunos números realesa \leq b yc \leq d. Nos gustaría una versión del Teorema del Valor Extremo, pero no está claro cómo deben definirse los valores mínimo y máximo de una función valorada compleja. Sin embargo, nuestra definición de continuidad tiene sentido incluso si el rango def está contenido en\mathbb{R}, y cada función continua de valor complejog tiene tres funciones continuas de valor real asociadas naturalmente, a saber,\Re(g), \Im(g) y |g|.
TEOREMA 9.35. DejarR ser un rectángulo cerrado en\mathbb{C}, y funciónf: R \rightarrow \mathbb{R} a continua. Despuésf alcanza su máximo y su mínimo.
Comprobante. VamosR=\{z \in \mathbb{C} \mid a \leq \Re(z) \leq b, c \leq \Im(z) \leq d\}. Dejar\left\langle z_{n}=x_{n}+i y_{n}\right\rangle ser una secuencia de puntos tal quef\left(z_{n}\right) tiende o bien al límite inferior superior del rango def, si esto existe, o dejarf\left(z_{n}\right)>n para todosn, si el rango no está delimitado por encima. Por el Teorema de BolzanoWeiersTrass 8.6, hay alguna subsecuencia para la cual las partes reales convergen a algún númerox_{\infty} en[a, b]. Por Bolzano-Weierstrass nuevamente, alguna subsecuencia de esta subsecuencia tiene la propiedad de que las partes imaginarias también convergen, hasta cierto puntoy_{\infty} en[c, d]. Entonces, reemplazando la secuencia original por esta subsecuencia de la subsecuencia, podemos suponer quez_{n} converge al puntoz_{\infty}=x_{\infty}+i y_{\infty} \in R. Por continuidad,f\left(z_{\infty}\right)=\lim _{n \rightarrow \infty} f\left(z_{n}\right). Si la secuencia original no estaba delimitada entoncesf\left(z_{n}\right)>n en la subsecuencia. Esto es imposible ya que la secuencia\left\langle f\left(z_{n}\right)\right\rangle converge af\left(z_{\infty}\right). Por lo tanto, la subsecuencia está limitada yf\left(z_{\infty}\right) debe ser el límite inferior superior del rango def. Por lo tantof\left(z_{\infty}\right) es el máximo def másR.
Un argumento similar muestra que también se alcanza el mínimo.
OBSERVACIÓN. El teorema anterior se puede mejorar para mostrar que una función continua de valor real en un conjunto delimitado cerrado\mathbb{C} alcanza sus extremos. Un conjuntoF se cierra si cada vez que una secuencia de puntos\left\langle z_{n}\right\rangle converge a algún número complejoz_{\infty}, entoncesz_{\infty} está adentroF. Un conjunto está delimitado si está contenido en algún rectángulo.
Necesitamos un hecho geométrico más. LEMA 9.36. Desigualdad triangular Letz_{1}, z_{2} be complex numbers. Entonces\left|z_{1}+z_{2}\right| \leq\left|z_{1}\right|+\left|z_{2}\right|
FIGURA9.18. Desigualdad triangular
Comprobante. Escribirz_{1}=r_{1} \operatorname{Cis}\left(\theta_{1}\right) yz_{2}=r_{2} \operatorname{Cis}\left(\theta_{2}\right). Entonces\ [\ comenzar {alineado} \ izquierda|r_ {1}\ nombreoperador {Cis}\ izquierda (\ theta_ {1}\ derecha) +r_ {2}\ nombreoperador {Cis}\ izquierda (\ theta_ {2}\ derecha)\ derecha|\\ &=\ izquierda [\ izquierda (r_ {1}\ cos\ theta_ {1} +r_ {2}\ cos\ theta_ {2}\ derecha) ^ {2} +\ izquierda (r_ {1}\ sin\ theta_ {1} +r_ {2}\ operatorname {si}\ derecha. \ derecho. \\ &=\ izquierda [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {1} r_ {2}\ izquierda (\ cos\ theta_ {1}\ cos\ theta_ {2} +\ sin\ theta_ {1}\ sin\ theta_ {2}\ derecha)\ derecha]\ &= izquierda [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {1} r_ {2}\ cos\ izquierda (\ theta_ {1} -\ theta_ {2}\ derecha)\ derecha] ^ {1/2}\\ &\ leq\ izquierda [r_ {1} ^ {2} +r_ {2} ^ {2} +2 r_ {2} ^ {2} +2 _ {1} r_ {2}\ derecha] ^ {1/2 }\\ &=r_ {1} +r_ {2}. \ end {alineado}\] COROLARIO 9.38. Vamosz_{1}, \ldots, z_{n} \in \mathbb{C}. Entonces\left|z_{1}+\cdots+z_{n}\right| \leq\left|z_{1}\right|+\cdots+\left|z_{n}\right| .
La Prueba del Teorema Fundamental del Álgebra.
Primero observamos que encontrar raíces y factores de hallazgo están estrechamente relacionados.
LEMA 9.39. Dejarp ser un polinomio de gradoN \geq 1 en\mathbb{C}[z]. Un número complejo,c, es una raíz dep iffp(z)=(z-c) q(z), dondeq es un polinomio de gradoN-1.
Comprobante. Repita la prueba de Lema4.13 con números reales reemplazados por números complejos.
Ahora probamos el lema de D'Alembert, que establece que el módulo de un polinomio no puede tener un mínimo local excepto en una raíz.
LEMA 9.40. Lema de D'Alembert Letp \in \mathbb{C}[z] y\alpha \in \mathbb{C}. Sip(\alpha) \neq 0, entonces(\forall \varepsilon>0)(\exists \zeta)[|\zeta-\alpha|<\varepsilon] \wedge[|p(\zeta)|<|p(\alpha)|] Prueba. Arreglar\alpha, no una raíz dep. Escribep comop(z)=\sum_{k=0}^{N} a_{k}(z-\alpha)^{k}, donde nia_{0} nia_{N} están 0. Quem=\min \left\{j \in \mathbb{N}^{+} \mid a_{j} \neq 0\right\} . Asíp(z)=a_{0}+a_{m}(z-\alpha)^{m}+\cdots+a_{N}(z-\alpha)^{N} . Que Quea_{0}=r_{0} \operatorname{Cis}\left(\theta_{0}\right) Ya_{m}=r_{m} \operatorname{Cis}\left(\theta_{m}\right). Escogeremos\zeta de la forma de tal\zeta=\alpha+\rho \operatorname{Cis}(\phi) manera que obtengamos alguna cancelación en los dos primeros términos de (9.42). Entonces, vamos\phi=\frac{\theta_{0}+\pi-\theta_{m}}{m} . Entoncesa_{0}+a_{m}(\zeta-\alpha)^{m}=r_{0} \operatorname{Cis}\left(\theta_{0}\right)-r_{m} \rho^{m} \operatorname{Cis}\left(\theta_{0}\right) . Queda por demostrar que, por lo suficientemente\rho pequeño, podemos ignorar todos los términos de orden superior. Tenga en cuenta que si\rho<1, tenemos\ [\ begin {alineado} \ izquierda|a_ {m+1} (\ zeta-\ alpha) ^ {m+1} +\ cdots+a_ {N} (\ zeta-\ alpha) ^ {N}\ derecha|\\ &\ leq\ izquierda|a_ {m+1} (\ zeta-\ alpha) ^ {m+1}\ derecha|a_ {m+1}\ derecha|a_ {m+1} +\ cdots+\ izquierda|a_ {N} (\ zeta-\ alfa) ^ {N}\ derecha|\\ &=\ izquierda|a_ {m+1}\ derecha|\ rho^ {m+1} +\ cdots+\ izquierda|a _ {N}\ derecha|\ rho^ {N}\\ &\ leq\ rho^ {m+1}\ izquierda [\ izquierda|a_ {m+1}\ derecha|+\ cdots+\ izquierda|a_ {N}\ derecha|\ derecha]\\ &=: C\ rho^ {m+1}. \ end {alineado}\] Elija\rho para quer_{m} \rho^{m}<r_{0}. Entoncesp(\zeta)=\left(r_{0}-r_{m} \rho^{m}\right) \operatorname{Cis}\left(\theta_{0}\right)+a_{m+1}(\zeta-\alpha)^{m+1}+\cdots+a_{N}(\zeta-\alpha)^{N},\mathrm{SO}|p(\zeta)| \leq r_{0}-r_{m} \rho^{m}+C \rho^{m+1} . Si\rho<r_{m} / C, el lado derecho de (9.43) es menor quer_{0}.
Por lo que concluimos que al tomar\rho=\frac{1}{2} \min \left(1, \frac{r_{m}}{C},\left[\frac{r_{0}}{r_{m}}\right]^{1 / m}, \varepsilon\right) entonces\zeta=\rho \operatorname{Cis}\left(\frac{\theta_{0}+\pi-\theta_{m}}{m}\right) satisface la conclusión del lema.
TEOREMA 9.44. Teorema Fundamental de Álgebra Letp \in \mathbb{C}[z] Ser un polinomio de gradoN \geq 1. Entonces sep puede factorizar comop(z)=c\left(z-\alpha_{1}\right) \ldots\left(z-\alpha_{N}\right) para números complejosc, \alpha_{1}, \ldots, \alpha_{N}. Por otra parte el factoring es único hasta el orden. Comprobante. (i) Demostrar quep tiene al menos una raíz.
Vamosp(z)=\sum_{k=0}^{N} a_{k} z^{k}, cona_{N} \neq 0. DejarS ser el cuadrado cerrado\{z \in \mathbb{C} \mid-L \leq \Re(z) \leq L,-L \leq \Im(z) \leq L\}, dondeL hay algún número (grande) para ser elegido posteriormente.
Si|z|=R entonces\left|\sum_{k=0}^{N-1} a_{k} z^{k}\right| \leq \sum_{k=0}^{N-1}\left|a_{k}\right| R^{k} . EligeL_{0} para que siR \geq L_{0},\sum_{k=0}^{N-1}\left|a_{k}\right| R^{k} \leq \frac{1}{2}\left|a_{N}\right| R^{N} . entonces Entonces siL \geq L_{0} yz está afueraS, tenemos\ [\ begin {alineado} \ izquierda|a_ {N} z^ {N}\ derecha| &=\ izquierda|p (z) -\ sum_ {k=0} ^ {N-1} a_ {k} z^ {k}\ derecha|\\ &\ leq|p (z) |+\ izquierda|\ sum_ {k=0} ^ {N-1} a_ {k} z^ {k}\ derecha|\\ &\ leq|p (z) +\ frac {1} {2}\ izquierda|a_ {N}\ derecha| L^ {N}, \ end {alineada}\] donde la primera desigualdad es la desigualdad triangular, y la segunda porque|z|>L . ElijaL_{1} tal que\frac{1}{2}\left|a_{N}\right| L_{1}^{N}>\left|a_{0}\right| . LetL=\max \left(L_{0}, L_{1}\right), y dejeS ser el cuadrado cerrado correspondiente. La función|p| es continuaS, por lo que alcanza su mínimo en algún momento,\alpha_{1} digamos, por el Teorema 9.35. En el límite deS, sabemos|p(z)| \geq \frac{1}{2}\left|a_{N}\right| L^{N}>\left|a_{0}\right|=|p(0)| . Por lo tanto\alpha_{1} debe estar en el interior deS. Por el lema de D'Alembert, debemos tenerp\left(\alpha_{1}\right)=0, o de lo contrario habría un punto cercano\zeta, también enS, donde|p(\zeta)| era más pequeño que\left|p\left(\alpha_{1}\right)\right|. Entonces\alpha_{1} es una raíz dep.
(ii) Ahora aplicamos Lema9.39 para concluir que podemos factorizarp comop(z)=\left(z-\alpha_{1}\right) q(z) dóndeq está un polinomio de gradoN-1. Por un argumento directo de inducción, podemos factorizarp en factoresN lineales.
(iii) La singularidad es obvia. El númeroc es el coeficientea_{N}. Los númerosa_{k} son precisamente los puntos en los que la funciónp desaparece, ya que de Proposición se deduce9.19 que el producto de finitamente muchos números complejos puede ser 0 si y solo si uno de los números es en sí mismo 0.
Aplicación a polinomios reales
Sip es un polinomio en\mathbb{R}[x], se deduce del Teorema Fundamental del Álgebra que sí tiene raíces, pero pueden ser complejas. Si tiene raíces complejas, deben ocurrir en pares conjugados complejos.
TEOREMA 9.46. Vamosp \in \mathbb{R}[x]. Dejar\alpha ser una raíz dep. Entonces así es\bar{\alpha}.
Prueba. Vamosp(x)=\sum_{k=0}^{N} a_{k} x^{k}. Entoncesp(\alpha)=\sum_{k=0}^{N} a_{k} \alpha^{k}=0, Así quep(\bar{\alpha})=\sum_{k=0}^{N} a_{k} \bar{\alpha}^{k}=\overline{p(\alpha)}=0 . vamos\alpha=a+i b. Entonces\ [\ begin {alineado} (x-\ alpha) (x-\ bar {\ alpha}) & =( x- (a+i b)) (x- (a-i b))\\ &=x^ {2} -2 a x+a^ {2} +b^ {2}\\ & =( x-a) ^ {2} +b^ {2}. \ end {aligned}\] Entonces aplicando el Teorema Fundamental del Álgebra al polinomio realp, primero factorizamos las raíces reales, y por cada par de raíces conjugadas complejas obtenemos un factor como en (9.47). Así conseguimos:
TEOREMA 9.48. Dejarp \in \mathbb{R}[x] ser un polinomio de gradoN. Entonces sep puede factorizar en un producto de factores lineales\left(x-c_{k}\right) y factores cuadráticos\left(\left(x-a_{k}\right)^{2}+b_{k}^{2}\right):p(x)=c\left(\prod_{k=1}^{N_{1}}\left(x-c_{k}\right)\right)\left(\prod_{j=1}^{N_{2}}\left(\left(x-a_{j}\right)^{2}+b_{j}^{2}\right)\right) para algunos números reales (no necesariamente distintos)c, c_{j}, a_{j}, b_{j}. TenemosN_{1}+2 N_{2}=N, y el factoring es único, hasta ordenar y reemplazar cualquierab_{j} b y-b_{j}.
Otras observaciones
En el capítulo 5 definimos coseno y seno en términos de series de potencia. En la Sección 9.2, los interpretamos geométricamente y utilizamos identidades trigonométricas. Demostrar que la serie de potencias y la interpretación trigonométrica están describiendo realmente la misma función es parte de un curso de Análisis Complejo.
Hay dos ingredientes principales para un primer curso en Análisis Complejos. El primero es mostrar que si una funciónf tiene un derivado en todas partes en algún disco abierto, en el sentido que\lim _{z \rightarrow z_{0}} \frac{f\left(z_{0}\right)-f(z)}{z_{0}-z} existe, entonces la función es automáticamente analítica, es decir, expresable por una serie de potencias convergentes. Esto no es cierto para las funciones reales, y explica gran parte de la naturaleza especial de las funciones diferenciables complejas.
La segunda parte del curso se refiere a evaluar integrales de contorno de funciones diferenciables complejas. Esto es útil no sólo por derecho propio, sino en aplicaciones al análisis real, como invertir la transformación de Laplace, o evaluar integrales definidas.
Una buena introducción al análisis complejo es el libro de Donald Sarason[7].
Ejercicios
EJERCICIO 9.1. ¿Cuáles son las primitivas cuartas raíces de la unidad?
EJERCICIO 9.2. Demostrar que si\omega hay algunan^{\text {th }} raíz de unidad distinta a 1, entonces1+\omega+\omega^{2}+\cdots+\omega^{n-1}=0 . EJERCICIO 9.3. ¿Cuántas primitivas raíces cúbicas de unidad hay? ¿Cuántas primitivas sextas raíces? ¿Cuántasn^{\text {th }} raíces primitivas para un generaln?
EJERCICIO 9.4. Rehacer Ejemplo9.8 para obtener las tres raíces de la fórmula Tartaglia-Cardano.
EJERCICIO 9.5. Vamosp(x)=x^{3}+3 x+\sqrt{2}. Mostrar sin usar la fórmula Cardano-Tartaglia quep tiene exactamente una raíz real. Encuéntralo. ¿Cuáles son las raíces complejas?
EJERCICIO 9.6. Rellene el comprobante de la Proposición 9.34.
EJERCICIO 9.7. Dejarg: G \rightarrow \mathbb{C} ser una función continua enG \subseteq \mathbb{C}. \Re(g), \Im(g)Demuéstralo y|g| son continuos. Por el contrario, mostrar que la continuidad de\Re(g) e\Im(g) implica la continuidad deg.
EJERCICIO 9.8. Mostrar que cada función continua de valor real en un subconjunto cerrado y delimitado de\mathbb{C} alcanza sus extremos.
APÉNDICE A
El Alfabeto Griego
Nombre en minúsculas en minúsculas
APÉNDICE B
Axiomas de Zermelo-Fraenkel con el Axioma de Elección
La paradoja de Russell (Sección 1.7) demuestra que el Principio de Comprensión General es falso, ya que da lugar a una contradicción. Entonces, ¿cómo decidimos si una colección definible es un conjunto? Esta pregunta engendró un programa para axiomatizar la teoría de conjuntos con el objetivo de producir suposiciones uniformes sobre conjuntos que satisficieran numerosas limitaciones:
Los axiomas son comprensibles e intuitivamente sólidos. Debemos ser capaces de reconocer cuando una declaración sobre conjuntos es un axioma.
Los axiomas son suficientes para derivar los teoremas estándar de las matemáticas.
Los axiomas no son redundantes. Es decir, ningún axioma puede derivarse de los axiomas restantes.
Toda afirmación matemática sobre conjuntos es demostrable o refutable a partir de los axiomas.
Los axiomas son lógicamente consistentes y por lo tanto no dan lugar a una contradicción.
Como discutiremos más adelante, ninguna colección de axiomas puede alcanzar simultáneamente estos objetivos. Primero damos los axiomas sobre los que finalmente se asentaron los matemáticos.
Axiomas de Zermelo-Fraenkel (con el Axioma de Elección):
(1) Extensionalidad Si estableceX yY tiene los mismos elementos, entoncesX=Y.
(2) Emparejamiento Para cualquier conjuntoX yY, hay un conjuntoZ=\{X, Y\}. 268 B. AXIOMAS DE ZERMELO-FRAENKEL CON EL AXIOMA DE ELECCIÓN
(3) Unión LetX Ser un conjunto de conjuntos. Entonces hay un conjunto\{x \mid(\exists Y \in X) x \in Y\} (4) Power Set SiX es un conjunto entonces la colección de todos los subconjuntos deX es un conjunto.
(5) Infinito Hay un conjunto inductivo.
(6) Esquema de Separación SiP\left(x, y_{1}, \ldots, y_{n}\right) es una fórmula conn+1 variables, yX, X_{1}, \ldots, X_{n} son conjuntos, entonces hay un conjunto\left\{x \in X \mid P\left(x, X_{1}, \ldots, X_{n}\right\}\right. (7) Esquema de Reemplazo SiF es una función en colecciones arbitrarias,X es una set yf=\left.F\right|_{X}, entonces el rango def es un conjunto.
(8) Regularidad DejarX ser un conjunto. Entonces no hay una secuencia infinita de elementos deX,\left\langle x_{i}\right\rangle, tal que para todosn \in \mathbb{N}, x_{n+1} \in x_{n}.
(9) Elección LetX Ser un conjunto de conjuntos no vacíos. Entonces hay una funciónf con dominioX tal que para todosx \in X, f(x) \in x.
Los axiomas de Zermelo-Fraenkel con el Axioma de Elección se conocen comoZ F C. Hay siete axiomas y dos esquemas de axiomas. Los esquemas dan infinitamente muchos axiomas. El Axioma de Extensionalidad caracteriza la identidad de conjunto. Dice que un conjunto es definido por sus miembros. Los Axiomas de Emparejamiento, Unión y Power Set garantizan que las colecciones construidas a partir de conjuntos con estas operaciones de conjuntos serán conjuntos. El Axioma del Infinito implica que los números naturales son un conjunto. El Esquema de Separación dice que cualquier subconjunto de un conjunto dado definido por una fórmula es un conjunto. Se trata de una versión debilitada del Principio de Comprensión General. El Esquema de Reemplazo dice que dada una función,F, en colecciones arbitrarias (no necesariamente conjuntos) y un conjuntoX, el rango de\left.F\right|_{X} es un conjunto. El Axioma de la Regularidad es un axioma técnico que implica que ningún conjunto puede ser miembro de sí mismo.
El Axioma de Elección es diferente a los otros axiomas en que no pretende que un objeto definible en el universo de conjuntos sea también B. AXIOMAS DE ZERMELO-FRAENKEL CON EL AXIOMA DE ELECCIÓN 269
un conjunto. Más bien, implica la existencia de una función sin especificar la función. SiX es un conjunto yf es la función con dominioX cuya existencia está garantizada por el Axioma de Elección, entoncesf se llama una función de elección paraX. El Axioma de Elección es lógicamente equivalente a axiomas que se utilizan frecuentemente en argumentos en muchas ramas de la matemática. Por ejemplo, el Axioma de Elección es equivalente a la afirmación de que cada conjunto puede estar bien ordenado (el Principio de Ordenación del Bien). El axioma da lugar a interesantes paradojas que provocaron que algunos matemáticos cuestionaran su validez. Kurt Gödel demostró que si los axiomas de Zermelo-Fraenkel sin Elección eran lógicamente consistentes, entonces los axiomas de Zermelo-Fraenkel con Choice fueron lógicamente consistentes. Hubo algunas ocasiones en el Capítulo 6 cuando invocamos el Axioma de Elección. Hubo ocasiones (e.g. Teorema de Cantor) en las que el axioma es realmente necesario, pero discutirlo habría sido inaceptablemente confuso. El axioma es considerado necesario por la mayoría de los matemáticos. Por ejemplo sin él, o algún axioma lógicamente equivalente, ni siquiera podemos concluir que se pueda comparar cualquier par de conjuntos (es decir, para cualquier conjuntoX yY, cualquieraX \preceq Y oY \preceq X). El Axioma de Elección se conoce comoA C, y los axiomas de Zermelo-Fraenkel sin el Axioma de Elección se conoce comoZ F.
¿Z F CLogra los objetivos de una axiomatización de la teoría de conjuntos? Los axiomas son generalmente intuitivos con las posibles excepciones deA C y el Axioma de Regularidad. También se sabe que siZ F C sin el Axioma de Regularidad es lógicamente consistente, entoncesZ F C con el Axioma de Regularidad es lógicamente consistente. Los matemáticos asumenZ F C casi universalmente sin darle demasiada consideración. Los axiomas deZ F C han sido suficientes para probar los teoremas de las matemáticas estándar.
Decimos que un conjunto es decidible (o recursivo) si la pertenencia al conjunto se puede determinar mediante cómputos de memoria. Por ejemplo, el conjunto de enteros pares es decidible: puede usar el algoritmo de división para verificar si un entero es divisible por2 . Z F C es un conjunto recursivo 270 B. AXIOMAS DE ZERMELO-FRAENKEL CON EL AXIOMA DE ELECCIÓN
de axiomas. Efectivamente es necesario que un conjunto de axiomas sea recursivo para ser de cualquier utilidad práctica. Es un teorema de las matemáticas, el primer teorema de incompletitud de Gödel, que cualquier conjunto decidible de axiomas en el que se pueda hacer aritmética será lógicamente incompleto. Es decir, hay afirmaciones en el lenguaje de los axiomas que no son probables ni refutables desde los axiomas. No se sabe, ni puede conocerse por una prueba matemática (usandoZ F C) siZ F C es lógicamente consistente. La consistencia de un conjunto decidible de axiomas en el que se puede hacer aritmética no puede ser una consecuencia lógica de esos axiomas. Este resultado es conocido como el Segundo Teorema de Incompletitud de Gödel, y es uno de los grandes resultados de las matemáticas del siglo XX.
Para un buen tratamiento de la Teoría de Conjuntos a nivel de licenciatura, véase el libro de Y. Moschovakis[\mathbf{5}].
APÉNDICE C
Consejos para comenzar a hacer ejercicios tempranos
Ejercicio 1.2. Esto se podría hacer con un diagrama de Venn. No obstante, una vez que haya más de tres conjuntos (ver Ejercicio 1.13), este enfoque será difícil. Una prueba algebraica se generalizará más fácilmente, así que trata de encontrar una aquí. Argumentan por las dos inclusiones\ [\ begin {alineadas} (X\ copa Y) ^ {c} &\ subseteq X^ {c}\ cap Y^ {c}\ X^ {c}\ cap Y^ {c} &\ subseteq (X\ copa Y) ^ {c} \ end {alineado}\] por separado. En el primero, por ejemplo, asumir esox \in(X \cup Y)^{c} y demostrar que debe ser en ambosX^{c} yY^{c}.
Ejercicio 1.13. Parte del problema aquí es la notación - ¿y si tienes más conjuntos que letras? Comience con un número finito de conjuntos contenidos enU, y llámalosX_{1}, \ldots, X_{n}. ¿Cuál crees que es el complemento de su unión? Demuéstralo como lo hiciste cuando estásn=2 en Ejercicio1.2. (¿Ve la ventaja de tener una prueba en Ejercicio1.2 que no utilizó diagramas de Venn? Una de las razones por las que a los matemáticos les gusta tener múltiples pruebas del mismo teorema es que es probable que cada prueba se generalice de una manera diferente).
¿Puedes hacer que funcione el mismo argumento si tus conjuntos están indexados por algún conjunto de índices infinito?
Ahora haz lo mismo con el complemento de la intersección.
Ejercicio 1.14. Nuevamente hay un problema notacional, pero mientrasY yZ juega el mismo papel en el Ejercicio 1.3,X juega un papel diferente. Así que reescribe las ecuaciones como\ [\ begin {aligned} &X\ cap\ left (Y_ {1}\ cup Y_ {2}\ right) =\ left (X\ cap Y_ {1}\ right)\ cup\ left (X\ cap Y_ {2}\ right)\\ &X\ cup\ left (Y_ {1}\ cap Y_ {2}\ right) =\ left (X\ copa Y_ {1}\ derecha)\ tapa\ izquierda (X\ copa Y_ {2}\ derecha), \ end {alineado}\] y mira si puedes generalizar estos.
Ejercicio 1.35. (i) Nuevamente, esto reduce a probar dos contenciones. Siy está en el lado izquierdo, entonces debe haber algunosx_{0} en algunosU_{\alpha_{0}} tales quef(x)=y. Pero luegoy está adentrof\left(U_{\alpha_{0}}\right), asíy está en el lado derecho.
Por el contrario, siy está en el lado derecho, entonces debe estar enf\left(U_{\alpha_{0}}\right) para algunos\alpha_{0} \in A. Pero luegoy está adentrof\left(\cup_{\alpha \in A} U_{\alpha}\right), y también lo está en el lado izquierdo.
Ejercicio3.1 Hay cuatro posibles asignaciones de valores de verdad 0 y 1 a las dos afirmacionesP yQ. Para cada una de esas tareas, evalúe los valores de verdad de los lados izquierdo y derecho de (3.3) y demuestre que siempre son los mismos.
Bibliografía
[1] M. Aigner y G.M. Ziegler. Pruebas del Libro. Springer, Berlín,2003 .
[2] J.B. Fraleigh. Un primer curso de álgebra abstracta. Addison-Wesley, Lectura,1982 .
[3] I.N. Herstein. Álgebra abstracta. J. Wiley, Nueva York, 1999.
[4] I. Lakatos. Pruebas y refutaciones: La lógica del descubrimiento matemático. Prensa de la Universidad de Cambridge, Cambridge,1976 .
[5] Y.N Moschovakis. Apuntes sobre Teoría de Conjuntos. Springer, Berlín, 1994.
[6] El mActutor Historia de las Matemáticas Archivos. http://www-groups.des.stand.ac.uk/ history/index.html.
[7] D. Sarason. Apuntes sobre Teoría de Funciones Complejas. Agencia de Libros Hindustan, Nueva Delhi,1998 .
[8] E.M. Stein y R. Shakarchi. Análisis de Fourier. Prensa de la Universidad de Princeton, Princeton,2003 .