Algebra superior
 9786071510020, 6071510023

Table of contents :
Álgebra superior
Página legal
Contenido
Acerca de los autores
Prólogo
1. Lógica y conjuntos
1.1 Lógica matemática
Definición de proposición
Tautologías y absurdos
Proposiciones equivalentes
Argumentos y demostraciones
Algunas propiedades del símbolo “.–” (
El cálculo proposicional es consistente y completo
Cuantificadores
1.2 Conjuntos
Introducción
1.3 Conceptos primitivos, definiciones, axiomas y teoremas
Contención de conjuntos
Nuevos conjuntos
El conjunto vacío y el conjunto universal
Familia de conjuntos
Uniones
1.4 Álgebra de conjuntos
Intersecciones
Diferencias
Complemento
El conjunto potencia
1.5 Producto cartesiano
Pareja ordenada
Relaciones y funciones
Algunas propiedades del producto cartesiano
1.6 Suma y producto booleanos
Una representación gráfica
1.7 Algunas demostraciones en la teoría de conjuntos
1.8 El concepto de función
Álgebra de funciones
2. Sistemas de ecuaciones lineales, matrices y determinantes
2.1 Sistemas de ecuaciones lineales
Introducción
2.2 Matrices
Igualdad de matrices
Algunos tipos de matrices
Operaciones con matrices
Operaciones elementales en los renglones
Sistemas de ecuaciones lineales
Cómo seleccionar los parámetros
Aplicaciones de los sistemas de ecuaciones
Representación generalizada
Balanceo de ecuaciones químicas. Método algebraico
Ejemplos de balanceo de reacciones químicas
2.3 Análisis dimensional
Dimensión
Método de Rayleigh
Método de Buckingham
2.4 Determinantes
Cálculo de determinantes
3. Sistemas numéricos
3.1 El sistema de los números reales
Axiomas de campo
Algunas propiedades de campo de los números reales
Axiomas de orden
Subsistemas de los números reales
Axioma de completez
Algunas representaciones de los números reales
3.2 Números complejos
El modelo de Gauss y la inmersión de
La conjugación
La norma
La ecuación general de segundo grado
Sistemas de ecuaciones
Representación geométrica de los números complejos
Raíces
El argumento de un número complejo
La función exponencial compleja
Representación geométrica de algunas rectas bajo la transformación
La función logaritmo
Las funciones trigonométricas
4. Polinomios y teoría de ecuaciones
4.1 Polinomios
Suma y multiplicación
Grado
Inmersión de K en K[x]
Algoritmo de la división
4.2 Funciones polinomiales
Teorema del residuo
Raíces de ecuaciones polinomiales
Teorema del factor
Algoritmo de la división sintética
Raíces complejas
Raíces “surd”
Las ecuaciones generales de 2°, 3° y 4° grados
4.3 Algunos resultados de la teoría de números y su aplicación a los polinomios y a las funciones polinomiales
Máximo común divisor de dos enteros (algoritmo de Euclides)
Fracciones parciales
4.4 Métodos numéricos
Introducción
Error
Cálculo de raíces de ecuaciones
Método de iteración de punto fijo
Método de bisección
Método de Newton-Raphson
Aplicaciones
Estimación de las constantes de la ecuación de estado de Van der Waals
5. Álgebra lineal
5.1 Grupos abelianos (o conmutativos)
5.2 Anillos, dominios enteros y campos
5.3 Homomorfismos
5.4 Espacios vectoriales
Dependencia e independencia lineal. Bases y dimensión
Dimensión
5.5 Producto escalar, norma y métrica en
Norma
Distancia
Ángulos y ortogonalidad
Conjuntos y bases ortogonales
Proyecciones
Aplicaciones
5.6 Producto vectorial
Definición
Analogía con la solución como determinante
Interpretación geométrica de la norma del producto vectorial
Algunas propiedades del producto vectorial
5.7 Triple producto escalar
Definiciones
Interpretación geométrica
5.8 Rectas y planos
Las rectas en Rn
Una ecuación de la recta que pasa por dos puntos
Ángulo entre rectas
Planos en R3
Una ecuación del plano que pasa por tres puntos no colineales
Ecuación normal del plano
Ángulo entre planos
Ángulo entre recta y plano
5.9 Transformaciones lineales
Anexo 1
Combinatoria
Principio fundamental del conteo (PFC)
Permutaciones
Número de subconjuntos
Anexo 2
La función determinante
Sobre la existencia de la función determinante
Regla de Cramer
Anexo 3
Teoremas sobre funciones
Demostraciones de los teoremas
Funciones inducidas por una función
Anexo 4
Relaciones
Relaciones de orden
Relaciones de equivalencia
Relaciones de equivalencia y particiones
Tres ejemplos importantes
Una representación de relaciones
Anexo 5
Transformaciones lineales
Núcleo o kernel e imagen de una transformación lineal
Matriz asociada a una transformación lineal
Respuestas a los ejercicios
Índice analítico

Citation preview

Rincón

Álgebra superior tiene como propósito principal poner a disposición de los lectores un cúmulo de conocimientos básicos comprendidos en los cursos de álgebra superior a nivel universitario. La selección de los contenidos, objetivos de aprendizaje y, en especial, la determinación de la extensión y profundidad de lo abordado, así como la manera de presentar los temas, son resultado de la vasta experiencia de los autores como docentes y de un largo proceso de discusión académica. Los autores tomaron como directriz fundamental producir un texto que facilitara el aprendizaje a las personas interesadas en los temas de esta materia, transmitiendo los conceptos de una forma precisa, pero con un adecuado balance entre la formalidad deseada y el nivel académico de los usuarios de esta obra. Una de las bondades de este material es que reúne, en un solo documento, temas que se tratan de forma aislada en la mayoría de los libros convencionales de álgebra superior. En él se desarrollan los temas de: lógica matemática y teoría de conjuntos; sistemas de ecuaciones lineales, matrices y determinantes; sistemas numéricos, números reales y complejos; teoría de ecuaciones y fundamentos de álgebra lineal. Adicionalmente el material anterior está enriquecido con la inclusión de un conjunto de aplicaciones, tales como: balanceo de ecuaciones químicas, análisis dimensional, solución analítica de ecuaciones de tercer y cuarto grados, solución numérica de ecuaciones de grado superior como la de Van Der Waals, así como de ecuaciones trascendentes.

978-607-15-1002-0

César Alejandro Rincón Orta • Amado Salvador Granados Aguilar Eugenio León Fautsch Tapia • Susana Yalú Leticia Rubín Rivero Manuel Vázquez Islas • Antonio Francisco Díaz García

Álgebra superior

Álgebra superior César Alejandro Rincón Orta Amado Salvador Granados Aguilar Eugenio León Fautsch Tapia Susana Yalú Leticia Rubín Rivero Manuel Vázquez Islas Antonio Francisco Díaz García Departamento de Matemáticas Facultad de Química Universidad Nacional Autónoma de México

MÉXICO • BOGOTÁ • BUENOS AIRES • CARACAS • GUATEMALA • MADRID • NUEVA YORK SAN JUAN • SANTIAGO • SAO PAULO • AUCKLAND • LONDRES • MILÁN • MONTREAL NUEVA DELHI • SAN FRANCISCO • SINGAPUR • ST. LOUIS • SIDNEY • TORONTO

Director general México: Miguel Ángel Toledo Castellanos Editor sponsor: Pablo E. Roig Vázquez Coordinadora editorial: Marcela I. Rocha Martínez Editora de desarrollo: María Teresa Zapata Terrazas Supervisor de producción: Zeferino García García

ÁLGEBRA SUPERIOR

Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin la autorización escrita del editor.

DERECHOS RESERVADOS © 2014 respecto a la primera edición por McGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V. Edificio Punta Santa Fe Prolongación Paseo de la Reforma 1015, Torre A, Pisos 16 y 17, Colonia Desarrollo Santa Fe, Delegación Álvaro Obregón C.P. 01376, México, D. F. Miembro de la Cámara Nacional de la Industria Editorial Mexicana, Reg. Núm. 736

ISBN: 978-607-15-1002-0

1234567890 2356789014 Impreso en México

Printed in Mexico

Contenido Acerca de los autores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix Prólogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi Unidad 1  Lógica y conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Lógica matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Definición de proposición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Tautologías y absurdos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Proposiciones equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Argumentos y demostraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Algunas propiedades del símbolo “⊢–” (se puede demostrar) . . . . . . . . . . . . . . . . . 15 El cálculo proposicional es consistente y completo . . . . . . . . . . . . . . . . . . . . . . 15 Cuantificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.2 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.3 Conceptos primitivos, definiciones, axiomas y teoremas . . . . . . . . . . . . . . . . . . . . 22 Contención de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Nuevos conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 El conjunto vacío y el conjunto universal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Familia de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Uniones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.4 Álgebra de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Intersecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Diferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 El conjunto potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.5 Producto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Pareja ordenada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Relaciones y funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Algunas propiedades del producto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.6 Suma y producto booleanos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Una representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.7 Algunas demostraciones en la teoría de conjuntos . . . . . . . . . . . . . . . . . . . . . . . 31 1.8 El concepto de función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Álgebra de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes . . . 35 2.1 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.2 Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Igualdad de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Algunos tipos de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Operaciones con matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Operaciones elementales en los renglones . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Cómo seleccionar los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 v

vi

Contenido

Aplicaciones de los sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Representación generalizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Balanceo de ecuaciones químicas. Método algebraico . . . . . . . . . . . . . . . . . . . . 58 Ejemplos de balanceo de reacciones químicas . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.3 Análisis dimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Método de Rayleigh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Método de Buckingham . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 2.4 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Cálculo de determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Unidad 3  Sistemas numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 3.1 El sistema de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Axiomas de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Algunas propiedades de campo de los números reales . . . . . . . . . . . . . . . . . . . . 89 Axiomas de orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Subsistemas de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Axioma de completez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Algunas representaciones de los números reales . . . . . . . . . . . . . . . . . . . . . . . 102 3.2 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 El modelo de Gauss y la inmersión de  en  . . . . . . . . . . . . . . . . . . . . . . . . . . 113 La conjugación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 La norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 La ecuación general de segundo grado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Representación geométrica de los números complejos . . . . . . . . . . . . . . . . . . . . 122 Raíces n-ésimas de un número complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 El argumento de un número complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 La función exponencial compleja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Representación geométrica de algunas rectas bajo la transformación E . . . . . . . . 130 La función logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Las funciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

Unidad 4  Polinomios y teoría de ecuaciones . . . . . . . . . . . . . . . . . . 135 4.1 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Suma y multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Grado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Inmersión de K en K [x] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Algoritmo de la división . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 4.2 Funciones polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 Teorema del residuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Raíces de ecuaciones polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 Teorema del factor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 Algoritmo de la división sintética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 Raíces complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Raíces “surd” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Las ecuaciones generales de 2°, 3° y 4° grados . . . . . . . . . . . . . . . . . . . . . . . . . 155 4.3 Algunos resultados de la teoría de números y su aplicación a los polinomios y a las funciones polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Máximo común divisor de dos enteros (algoritmo de Euclides) . . . . . . . . . . . . . . . . 164 Fracciones parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 4.4 Métodos numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

Contenido

Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Cálculo de raíces de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Método de iteración de punto fijo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Método de bisección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 Método de Newton-Raphson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Estimación de las constantes de la ecuación de estado de Van der Waals . . . . . . . . . 193

Unidad 5  Álgebra lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 5.1 Grupos abelianos (o conmutativos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 5.2 Anillos, dominios enteros y campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 5.3 Homomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 5.4 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Dependencia e independencia lineal. Bases y dimensión . . . . . . . . . . . . . . . . . . . 203 Dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 5.5 Producto escalar, norma y métrica en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 Ángulos y ortogonalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 Conjuntos y bases ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 Proyecciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 5.6 Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Analogía con la solución como determinante . . . . . . . . . . . . . . . . . . . . . . . . . . 214 Interpretación geométrica de la norma del producto vectorial . . . . . . . . . . . . . . . . 215 Algunas propiedades del producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 5.7 Triple producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Interpretación geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 5.8 Rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Las rectas en n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Una ecuación de la recta que pasa por dos puntos . . . . . . . . . . . . . . . . . . . . . . . 218 Ángulo entre rectas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Planos en 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Una ecuación del plano que pasa por tres puntos no colineales . . . . . . . . . . . . . . . 220 Ecuación normal del plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 Ángulo entre planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 Ángulo entre recta y plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 5.9 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

Anexo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 Combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 Principio fundamental del conteo (PFC) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Número de subconjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

Anexo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 La función determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 Sobre la existencia de la función determinante . . . . . . . . . . . . . . . . . . . . . . . . . 233 Regla de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

vii

viii

Contenido

Anexo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Teoremas sobre funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Demostraciones de los teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Funciones inducidas por una función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239

Anexo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 Relaciones de orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 Relaciones de equivalencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 Relaciones de equivalencia y particiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 Tres ejemplos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Una representación de relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

Anexo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Núcleo o kernel e imagen de una transformación lineal . . . . . . . . . . . . . . . . . . . . 249 Matriz asociada a una transformación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 252

Respuestas a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 Índice analítico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

Acerca de los autores César Alejandro Rincón Orta Es profesor emérito de la UNAM. Se graduó como químico metalúrgico y matemático por la Universidad Nacional Autónoma de México (UNAM). Acreditó las asignaturas del plan de estudios del doctorado de Matemáticas. Es fundador del primer laboratorio de Geocronometría en México y también de la Maestría de Matemáticas, en la Universidad Autónoma de Querétaro. Es docente en la UNAM desde 1958, en donde ha impartido las asignaturas de Álgebra superior I y II, Álgebra lineal I y II, Álgebra moderna I y II, Cálculo I y II, Ecuaciones diferenciales, Análisis de variable compleja, Análisis matemático I y II, tanto en la Facultad de Química como en la Facultad de Ciencias. Es coautor de varios libros, entre los que destacan: Álgebra superior, Las Prensas de Ciencias, Facultad de Ciencias, UNAM, 2006; Métodos matemáticos de la termodinámica, Facultad de Química, UNAM, 1978, reeditado por el Departamento de Publicaciones del Instituto de Matemáticas, UNAM, 1996; Lógica matemática, UNAM, 2005. Asimismo, ha publicado diversos artículos de Geocronometría en los boletines del Instituto de Geología. Amado Salvador Granados Aguilar Se graduó como ingeniero químico por la Benemérita Universidad Autónoma de Puebla (BUAP) y en la maestría y el doctorado en Ingeniería Química por la UNAM. Es profesor de la Facultad de Química de la UNAM desde 1990, en la que ha impartido las asignaturas de Álgebra superior, Cálculo I y II, y Ecuaciones diferenciales a nivel licenciatura; así como Matemáticas aplicadas en el posgrado de Ingeniería. Es autor del libro Ejemplario: Ecuaciones diferenciales ordinarias (en proceso de publicación por la Facultad de Química, UNAM). Eugenio León Fautsch Tapia Se graduó como ingeniero químico por la Universidad Nacional Autónoma de México (UNAM) y es pasante de la Maestría en Educación en Matemáticas (UACPYP del CCH, UNAM). Fue asesor en el proceso de fundación de la Universidad Autónoma de la Ciudad de México (UACM) e impartió clases de matemáticas a nivel bachillerato en el Centro Universitario México por más de veinticinco años. Desde 1972 es profesor en la Facultad de Química de la UNAM, en la que ha impartido los cursos de Álgebra, Álgebra superior, Cálculo de funciones de una variable (Cálculo I), Cálculo de funciones de varias variables (Cálculo II) y Ecuaciones diferenciales a nivel licenciatura. Es coautor con Marco A. Flores Meyer de los libros: Temas selectos de matemáticas (1981), Cálculo básico (1982), Geometría analítica básica (1991), todos publicados y reeditados por la Editorial Progreso, México. También es coautor con Rincón y otros del libro Lógica matemática, UNAM, 2005. Ha diseñado desde el año 2000 diversas páginas de internet, como apoyo a sus actividades docentes. ix

x

Acerca de los autores

Susana Yalú Leticia Rubín Rivero Es ingeniera química metalúrgica por la UNAM. Ha sido profesora de la Facultad de Química de la UNAM desde 1984, en donde ha impartido las asignaturas de Ecuaciones diferenciales, Estadística, Álgebra superior y Cálculo. Es coautora con Rincón y otros del libro Lógica matemática, UNAM, 2005.

Manuel Vázquez Islas Es ingeniero químico y pasante de la maestría en Investigación de Operaciones, de la Facultad de Ingeniería de la UNAM. Desde 1973 es docente de la Facultad de Química de la UNAM, en donde ha impartido los cursos de Álgebra, Cálculo I, Cálculo II, Ecuaciones diferenciales, Métodos numéricos, Matemáticas aplicadas II; y, en el posgrado, Matemáticas aplicadas y Matemáticas avanzadas. Fue distinguido con la cátedra “Andrés Manuel del Río” en 1989 y con el Reconocimiento al Mérito por el AAPAUNAM en 1997.

Antonio Francisco Díaz García Ingeniero Químico, Licenciado en Derecho y Maestro en Enseñanza en Matemáticas por la UNAM. Profesor de Matemáticas en la Facultad de Química desde 1973 ha impartido diversas asignaturas del área. También cuenta con experiencia como profesor en la Facultad de Derecho y en el posgrado de Ciencias de la Administración de la UNAM. Ha publicado diversos artículos y es autor de algunos libros.

Prólogo El conocimiento científico necesita “matematizarse” para poder avanzar y expresarse adecuadamente en forma cuantitativa y, como lo indica el término entrecomillado, es la matemática lo que se requiere para tal propósito. Independientemente de su utilidad, el estudio de la matemática —que es bellísima— es un ingrediente esencial en la formación de los marcos conceptuales necesarios para el correcto funcionamiento de la mente, además de que proporciona el placer del orden y de lo bien estructurado. Einstein afirmó que quien no disfrute de una buena demostración geométrica, no nació para científico. A pesar del impresionante avance de la tecnología y de las ciencias de la computación, en cuya base aparece en forma muy significativa la lógica matemática, el álgebra no ha perdido ni un ápice de su lugar de ser el conocimiento básico sobre el que se construye la matemática toda. Es por esta razón que en los primeros semestres de las carreras científicas y en algunas de las humanísticas, aparece el álgebra como una de las materias curriculares obligatorias. Una de las dificultades con que tropiezan los maestros que imparten los primeros cursos de esta materia es la gran cantidad de material que debe cubrirse en ellos. Es necesario precisar la extensión (el tiempo que debe dedicarse a cada tema) y el rigor que resulte adecuado al heterogéneo nivel de los alumnos y que, a la vez, sea consistente con la formalidad matemática que su orientación profesional requiere. La experiencia de los autores al impartir estos cursos durante varios años ha guiado la extensión del desarrollo de cada tema, sus aplicaciones y la forma que les pareció adecuada para este nivel. La selección, tanto de los temas como de las aplicaciones, se hizo con el propósito de reunir en un solo volumen el contenido integral del programa de álgebra superior, y así ayudar a resolver la problemática que tienen los profesores y los estudiantes al tener que utilizar una bibliografía amplia y, en general, poco accesible, ya sea por su costo, su falta de disponibilidad en el mercado o su insuficiente existencia en el acervo de las bibliotecas. A continuación se presenta una breve introducción al contenido de cada capítulo y su intención: Capítulo 1  Se atienden los temas básicos de lógica, considerando que el alumno debe desarrollar un pensamiento matemático bien ordenado, en el cual emplee correctamente el lenguaje preciso que proporciona la matemática, que es el utilizado en la ciencia. Se enfatiza el análisis de argumentos que es esencial para determinar la validez de éstos. La inclusión de los temas elementales de la teoría de conjuntos se basa en la importancia que ésta tiene en la construcción de modelos para un gran número de problemas de la matemática. Capítulo 2  Se desarrolla el tema de sistemas de ecuaciones, debido al gran número de problemas cuyo modelado y solución los requiere. Además del tratamiento que generalmente se le da, se considera el balanceo de ecuaciones químicas y el análisis dimensional, ambas aplicaciones importantes. Con objeto de sustentar la teoría que se ocupa en este capítulo, se adjunta un breve tratamiento de matrices y determinantes. Capítulo 3  Se formaliza la estructura del álgebra de ecuaciones, mediante la construcción axiomática del campo de los números reales y sus subconjuntos más importantes —naturales, enteros y racionales—, cuyas propiedades se utilizan cotidianamente sin expresión explícita, así como su extensión al campo de los números complejos. El campo de los números reales, es el hábitat natural del cálculo de variable real, por lo que su estudio resulta indispensable en este nivel. En opinión de los autores, la problemática para el aprendizaje del cálculo se encuentra altamente influida por la falta de dominio adecuado del álgebra, razón que justifica el desarrollo del tema. xi

xii

Prólogo

La propiedad que tienen los números complejos de contener a todas las raíces de sus ecuaciones —ser algebraicamente cerrados— los hace especialmente adecuados para el estudio del álgebra y de sus aplicaciones en algunos temas de la matemática superior (geometría algebraica, por ejemplo). Capítulo 4  Se formaliza la definición de polinomio y de sus operaciones. Se estudian las funciones polinomiales y algunos de sus teoremas clásicos como el teorema del residuo, el teorema del factor y multiplicidad de raíces, entre otros. Se describen algunos métodos para encontrar las raíces de las ecuaciones o aproximarlas por métodos numéricos, cuando sea el caso. Capítulo 5  Se dedica a la parte más elemental del álgebra lineal, necesaria para el manejo adecuado de la matemática en cursos posteriores. Se da la definición de grupo, campo, espacio vectorial y subespacio generado. Utilizando el lema de Zorn, se demuestran los teoremas relacionados con la dependencia e independencia lineal, existencia de bases y se justifica la definición de dimensión de un espacio vectorial. Se utiliza el producto punto para aplicar el álgebra lineal en la geometría —rectas y planos—. Anexos  En los anexos se incluyen algunos temas y demostraciones (un poco más formales) con el objeto de llenar las lagunas que se dejaron —deliberadamente— en algunos capítulos. Además, se presenta un buen número de ejercicios como ayuda para que los estudiantes se familiaricen con los temas tratados y puedan adquirir una razonable comprensión de éstos, de manera que puedan autoevaluar el nivel de dominio adquirido al estudiarlos.

1



Unidad

1.1  Lógica matemática •  Definición de proposición •  Tautologías y absurdos •  Proposiciones equivalentes •  Argumentos y demostraciones •  Algunas propiedades del símbolo “⊢–” (se puede demostrar) •  El cálculo proposicional es consistente y completo •  Cuantificadores 1.2 Conjuntos •  Introducción

1.4  Álgebra de conjuntos •  Intersecciones •  Diferencias •  Complemento •  El conjunto potencia 1.5  Producto cartesiano •  Pareja ordenada •  Relaciones y funciones •  Algunas propiedades del producto cartesiano 1.6 Suma y producto booleanos •  Una representación gráfica 1.7 Algunas demostraciones en la teoría de conjuntos 1.8  El concepto de función •  Álgebra de funciones

juntos

1.3 Conceptos primitivos, definiciones, axiomas y teoremas •  Contención de conjuntos •  Nuevos conjuntos •  El conjunto vacío y el conjunto universal •  Familia de conjuntos •  Uniones

con Lógica y

1

2

Unidad 1  Lógica y conjuntos

1.1  Lógica matemática La lógica matemática puede considerarse como una parte de la filosofía que tiene como uno de sus objetivos centrales la clasificación de los principios y leyes que rigen a los razonamientos válidos. Se apellida matemática porque en su desarrollo se utiliza el método axiomático-deductivo, que es característico de esta rama del conocimiento y que ha trascendido al estudio de gran parte de las teorías científicas y humanísticas, las cuales deben matematizarse, para poder expresar correctamente sus conceptos y enriquecer sus resultados. Entre los componentes básicos de esta lógica está el cálculo proposicional que, enriquecido convenientemente con algunos conceptos y resultados del cálculo de predicados, permite interpretar con toda precisión las nociones básicas de la matemática. En esta unidad se hace una breve exposición del cálculo proposicional, el cual comienza describiendo cuáles son los elementos que lo constituyen y la forma en que éstos se combinan (conceptos y relaciones primitivas),1 las propiedades que estos objetos y relaciones tienen (axiomas o postulados)2 y la forma (correcta) en la cual se demuestran sus conclusiones, que una vez incorporadas al lenguaje lógico de la matemática se conocen como teoremas. En el álgebra, cuando se trata de números particulares, se usan símbolos para representarlos (sus numerales), por ejemplo, 0, 2, − 1 / 2, 7 , π , 4 − 7i, pero cuando no se especifica de qué números se trata, pueden utilizarse variables (como x, y, z) para referirse a ellos, los cuales en casos particulares pueden tomar valores que coinciden entre sí. Por ejemplo, si se desea encontrar los números x, y, z tales que su suma sea 9 ( x + y + z = 9 ), una interpretación podría ser x = y = z = 3 y otra x = y = 4, z = 1, entre una infinidad de posibilidades. En el cálculo proposicional (CP) existen las proposiciones simples (𝒫S) y los conectivos lógicos, que son conceptos primitivos de la teoría, en tanto que no se definen, y permiten precisar lo que son las proposiciones (𝒫) en general. También son primitivos los valores de verdad —{0, 1} o {F , V }— —{0, 1}oo {F , V }— , los cuales asignan a cada proposición simple su carácter de falsa o verdadera, asignación que, como se verá más adelante, se extiende al conjunto de las proposiciones por medio de las tablas de verdad. El hecho de que los valores de verdad sean dos y sólo dos, confiere a esta lógica su carácter de lógica binaria (en contraste con la lógica de la vida, que no lo es, ¿se entiende?). Las proposiciones simples pueden interpretarse como expresiones de las que puede decirse con precisión que son falsas o verdaderas. Se representan con las letras P, Q, …, y cuando se requiere considerar proposiciones simples no especificadas, pueden usarse las variables proposicionales A, B, C, … En el cálculo proposicional, cuando se usan letras distintas, éstas representan proposiciones simples diferentes, pero, al igual que en el álgebra, diversas variables proposicionales pueden estar representando proposiciones iguales. Los conectivos lógicos que aparecen en esta unidad tienen como función representar los correspondientes conectivos del lenguaje (español), los cuales se usan para reunir varias frases en una sola. Son no, y, o e implica. Algunos autores consideran también el conectivo si y sólo si, que aquí se define como una doble implicación, por lo cual no se incluye en las anteriores. Los símbolos usados para representar estos conectivos son: 1. 2. 3. 4.

para no: ¬, ∼ o ′ para y: ∧, ⋅, o & para o: ∨ para implica que también se conoce como si… entonces…, → De los valores de verdad, como ya se dijo, se utilizan:

1. para falso: 0 o F. 2. para verdadero: 1 o V.

1

En una teoría axiomática se llaman primitivos (o primitivas) los conceptos y relaciones que aparecen sin definición y a partir de los que se explica el significado de otros conceptos y relaciones, por la cual reciben el calificativo de definidas. 2 Los axiomas, o postulados, de una teoría, son definiciones implícitas de los objetos y relaciones de ésta. Dichas definiciones se logran al asignar a los objetos y relaciones las propiedades que se les suponen y que, de alguna manera, deben caracterizarlos.

1.1  Lógica matemática

3

Definición de proposición 1. Toda proposición simple es una proposición. 2. Si A y B son proposiciones, ¬ A, A ∧ B, A ∨ B y A → B también son proposiciones. 3. Una fórmula (colección de símbolos de proposiciones simples y/o conectivos lógicos) es pro-

posición si y sólo si tiene tal carácter justificado por las reglas 1 o 2. La regla 1 proporciona una base inicial de proposiciones (las simples). La regla 2 permite utilizar los conectivos lógicos para formar nuevas proposiciones a partir de las ya existentes. La regla 3 asegura que las únicas fórmulas que pueden considerarse proposiciones son las que se construyen usando las reglas 1 o 2. La definición anterior se resume utilizando el simbolismo matemático de la siguiente manera:

Definición 1.1.1 Sean 𝒫S las proposiciones simples y 𝒫 las proposiciones; entonces: 1. 𝒫S ⊂ 𝒫 2. A, B, ∈ 𝒫 ⇒ ¬ A, A ∧ B, A ∨ B y A → B ∈ 𝒫 3. y son todas (una fórmula está en 𝒫 si y sólo si lo es vía las reglas 1 o 2).

Como ya se mencionó en párrafos anteriores, las proposiciones simples se Note que estos adjetivos solamente usan para representar frases del idioma, las cuales deben tener un valor de verdad son los nombres de las etiquetas que bien determinado (deben ser falsas o ciertas). En el cálculo proposicional, este fin las proposiciones simples tienen, y se alcanza postulando que a cada proposición simple se le asocia un valor de verson independientes de las definiciones dad 0 o 1 según deba considerarse falsa o verdadera. (filosóficas) de falso y verdadero, Los valores de verdad que corresponden a las proposiciones compuestas por aunque están concebidas con objeto más de una proposición simple dependen de los que tengan éstas y se determinan de representarlas. aplicando las tablas de verdad, las cuales son definiciones implícitas de la forma en que actúan los conectivos lógicos, que, por supuesto, deben ser análogas a las que cumplen, en el idioma, los conectivos que estos símbolos representan. Así, el conectivo no cambia el valor de verdad de la proposición a la cual está asociado. En efecto, por tratarse de una lógica binaria, resulta que si una proposición P es cierta, su negación (¬P) tiene que ser falsa y, recíprocamente, la negación de una proposición falsa debe ser cierta. Por esta razón, la tabla de verdad del conectivo no se define así: P

¬P

0

1

1

0

en la cual el primer renglón ilustra lo que sucede cuando P es falsa y el segundo lo hace cuando P es cierta. La tabla tiene sólo esos dos renglones (uno para cada valor de verdad de P), y con ellos cubre todas las posibles situaciones que puedan darse. Los otros tres conectivos son binarios, cada uno conecta dos proposiciones y, por lo tanto, generan cuatro maneras de combinar los valores de verdad que puedan tener las proposiciones que conectan,3 a saber, (0, 0), (0, 1), (1, 0), (1, 1), y por lo tanto, las tablas de verdad que los definen, deben tener cuatro renglones, uno por cada combinación. Las tablas siguientes son las definiciones del efecto que cada conectivo produce en las proposiciones que se forman con ellos.

3 Un principio fundamental de numeración establece que si dos eventos pueden efectuarse independientemente de m y n maneras, respectivamente, la pareja puede hacerlo de m · n formas.

4

Unidad 1  Lógica y conjuntos

P

Q

P∧Q

P∨Q

P→Q

0

0

0

0

1

0

1

0

1

1

1

0

0

1

0

1

1

1

1

1

Observaciones 1. De la tabla de la negación se infiere que en el cálculo proposicional, la doble negación afirma

(lo que no sucede en el idioma español en el que la doble negación enfatiza; por ejemplo, él no sabe nada, no le dije nada a nadie, …). 2. El conectivo “∧” produce proposiciones que siempre resultan falsas, excepto en el caso en el que las dos proposiciones que la forman son ciertas. 3. La tabla del conectivo “∨” corresponde al uso del o incluyente del idioma. La proposición no es cierta sólo en el caso de que tanto A como B sean ambas falsas. 4. La tabla de la implicación, cuya validez es menos evidente que las de los otros conectivos, dice que de una proposición falsa puede seguirse lo que sea, falso o cierto, sin que la proposición completa (la implicación) pierda su valor de verdad. Por ejemplo, si P → Q representa la afirmación siguiente: Si x es un alumno de la universidad Entonces x estudia

(P) (Q)

sólo sería falsa si existiera algún estudiante que siendo universitario (P cierta) no estudiara (Q falsa). La verdad de la proposición anterior es independiente de la existencia de personas que no siendo universitarias (P falsa) estudian (Q cierta), o que no lo hacen (Q falsa). Un caso particular, que aparece con frecuencia en los argumentos matemáticos, es el referido a las propiedades de los elementos que pudieran estar en el conjunto vacío (no hay ninguno) y a los cuales, por lo tanto, puede suponérseles cualquier cosa. Así, de las implicaciones que comienzan con la proposición x ∈∅ se dice que son ciertas por vacuidad, independientemente del valor de verdad de la conclusión. Por ejemplo, las dos proposiciones siguientes son ciertas (por vacuidad): a)  7 ∈ ∅ → 7 es un número par b)  7 ∈ ∅ → 7 no es un número par Note que no se contradicen; es decir, una no es la negación de la otra (ver equivalencias más adelante). La proposición P → Q, entre otras formas, se expresa como: 1. 2. 3. 4. 5. 6.

P implica Q Si P entonces Q Si P, Q Q si P Q es una condición necesaria para P P es una condición suficiente para Q

Las tablas de verdad permiten conocer el valor de verdad que tiene cada proposición compuesta, el cual depende de la combinación de los valores de verdad de sus componentes. Con objeto de construirlas, se procede paso a paso, aplicando iteradamente las tablas de verdad básicas, que son las correspondientes a los conectivos lógicos que aparecen en ella. Ejemplo 1.1.1

Se desea conocer la tabla de verdad de la proposición P → (Q ∧ R ) . 1. Puesto que se trata de una proposición compuesta por tres proposiciones simples, sus valores

de verdad, dos para cada una de ellas, producen ocho posibles combinaciones ( 2 ⋅ 2 ⋅ 2 ) . Entonces la tabla que los considere debe tener ocho renglones. Constrúyase ésta.

1.1  Lógica matemática

P

Q

R

Q∧R

P → (Q ∧ R)

0 0 0 0 1 1 1 1

0 0 1 1 0 0 1 1

0 1 0 1 0 1 0 1

0 0 0 1 0 0 0 1

1 1 1 1 0 0 0 1

2. Se asigna valores a cada proposición simple y así se llenan las primeras tres columnas, las

cuales exhiben las ocho posibles combinaciones de ellos, que, por supuesto, pueden registrarse en cualquier orden, aunque es recomendable utilizar una manera específica para acomodarlas. Note que la que se usó tiene la ventaja de dejar numerados, en notación binaria, los renglones y además permite comprobar fácilmente que no falta ninguno y que no hay repeticiones, lo cual no es fácil de conseguir cuando la tabla tiene muchos renglones. 3. La tabla que se desea construir corresponde a una implicación y, por lo tanto, su valor depende de sus componentes P y (Q ∧ R). El paréntesis es un signo de agrupación que afirma que Q ∧ R es una sola proposición, a la cual se debe asignar su valor de verdad y que, por lo tanto, debe conocerse. Luego, se procede a determinarlo (columna 4). 4. Tomando en cuenta los valores de P y de Q ∧ R, se llena la columna 5 usando la tabla de la implicación. Con base en lo anterior, y para construir la tabla de verdad de una fórmula que consta de n proposiciones simples: 1. Considere 2n renglones, en cada uno de los cuales debe aparecer una posible combinación de

valores de verdad de las proposiciones simples. Es recomendable, según la observación hecha con anterioridad, comenzar con 2n − 1 ceros y luego con 2n − 1 unos en la primera columna. En la segunda se alternan 2n − 2 ceros con igual número de unos. La tercera columna se llena de arriba hacia abajo alternando ceros y unos, cada “paquete” con 2n − 3 elementos, y así sucesivamente, hasta llegar a la columna n-ésima para la que se usa la sucesión 0, 1, 0, 1, ... , 0, 1, siempre de arriba hacia abajo. Así, para n = 4 el arreglo de los 24 = 16 renglones debe ser el siguiente: Notación binaria P1

P2

P3

P4

0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1

0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1

0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1

0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1

Notación decimal 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

5

6

Unidad 1  Lógica y conjuntos

La última columna de la tabla anterior tiene la numeración decimal que corresponde a los arreglos de ceros y unos de los renglones (notación binaria). 2. Usando las tablas básicas, asigne valores de verdad a las proposiciones compuestas, empezando por las negaciones directas y luego por las que no tengan paréntesis dentro de ellas. 3. Prosiga la construcción de adentro hacia fuera de las proposiciones más interiores hacia las exteriores de las que forman parte, hasta terminar.

Tautologías y absurdos Cuando se construyen las tablas de verdad de algunas proposiciones se nota que, independientemente de los valores de verdad que puedan tener sus componentes, éstas son siempre ciertas. Se conocen como tautologías, y entre ellas destacan, por su utilidad en las demostraciones, los casos particulares de los ocho esquemas,4 los cuales reciben el nombre de esquemas de las tautologías básicas (o simplemente tautologías básicas). Esquemas de las tautologías básicas T1

A → ( B → A)

T2

( A → B ) → [( A → ( B → C )) → ( A → C )]

T3

A → ( B → ( A ∧ B ))

T4

A ∧ B → A, A ∧ B → B

T5

( A → C ) → [( B → C ) → [( A ∨ B ) → C ]]

T6

A → A ∨ B, B → A ∨ B

T7

( A → B ) → [( A → ¬B ) → ¬A]

T8

¬¬A → A

La negación de una tautología o los casos particulares del esquema A ∧ ¬A son proposiciones que siempre son falsas y se llaman absurdos.

Proposiciones equivalentes Las parejas de proposiciones X y Y tales que una es cierta si y sólo si la otra lo es (tienen tablas de verdad iguales) se llaman equivalentes. La lista siguiente enumera una colección de esquemas  de parejas de proposiciones equivalentes. Para ellas se usa la notación X ≡ Y. La equivalencia corresponde a la doble implicación Y → X y Y → X, que, como se señaló, también puede denotarse como X ↔ Y. Más adelante se dice que X es equivalente a Y si y sólo si a partir de X puede demostrarse Y y a partir de Y puede demostrarse X. Ambas definiciones son equivalentes. X

4

Nombre

Y

1.

A→ B

¬B → ¬A

Ley de la contrapuesta

2.

A→ B

¬A ∨ B

Equivalencia de la implicación

3.

¬( A → B )

A ∧ ¬B

Negación de la implicación

4.

(A ∨ B) ∨ C

A ∨ (B ∨ C )

Ley asociativa para la disyunción

5.

(A ∧ B) ∧ C

A ∧ (B ∧ C )

Ley asociativa para la conjunción

Un caso particular de un esquema es el resultado de sustituir las variables proposicionales por proposiciones. Por ejemplo,  P → ((Q ∧ R) → P) es un caso particular del esquema A → (B → A), en el que A se ha sustituido por P y B por Q ∧ R.

1.1  Lógica matemática

X

Nombre

Y

  6.

A∨B

B∨A

Ley conmutativa para la disyunción

  7.

A∧B

B∧A

Ley conmutativa para la conjunción

  8.

A ∧ (B ∨ C )

(A ∧ B) ∨ (A ∧ C )

Ley distributiva de la conjunción respecto a la disyunción

  9.

A ∨ (B ∧ C )

A( A ∨ B ) ∧ ( B ∨ C )

Ley distributiva de la disyunción respecto a la conjunción

10.

¬( A ∨ B )

¬A ∧ ¬B

Ley de De Morgan; negación de la disyunción

11.

¬( A ∧ B )

¬A ∨ ¬B

Ley de De Morgan; negación de la conjunción

12.

A ∨T

T

13.

A ∧T

A

14.

A∨∅

A

15.

A∧∅



16.

¬¬A

A

Leyes de idempotencia

Ley de la doble negación

En esta tabla, T es una tautología y ∅ un absurdo. La equivalencia de los tres primeros esquemas se utiliza en las demostraciones y la de los demás esquemas, en las aplicaciones del cálculo proposicional a la teoría de conjuntos (como se explica más adelante en esta unidad).

Argumentos y demostraciones Los objetos que estudia la matemática no tienen realidad física. Se representan por medio de símbolos o dibujos, pero no existen en el mundo real. Son creaciones (¿o descubrimientos?) de la mente humana.5 Nadie ha visto un círculo, un triángulo ni un número, y por esta razón, las afirmaciones hechas acerca de los entes matemáticos y de sus propiedades —por ejemplo, los teoremas del álgebra o de la geometría— no pueden demostrarse mediante experimentos. En el mundo científico, una demostración es un mecanismo de convencimiento, un proceso informal destinado al consumo humano, formulado en lenguaje humano, en el que se permite utilizar todas las complejidades y sutilezas de la inteligencia, así como las argucias del arte de persuadir. La persistente regularidad con que se presentan algunos fenómenos naturales ha permitido postular muchas leyes de la física, la química, la biología y la economía, y para comprobarlas los científicos diseñan experimentos que, cuando dan resultados coincidentes con lo esperado por ellos, se dice que tal resultado confirma la teoría o la demuestra. La aparición de nuevas evidencias obliga a que estas leyes y sus demostraciones deban modificarse. En la matemática esto no puede suceder. Sus teoremas son eternos. Por ejemplo, el teorema de Pitágoras tiene una vigencia mucho más larga que los resultados de la mecánica celeste de Newton o que la teoría de la relatividad de Einstein. El notable avance de las ciencias de la computación ha permitido comprobar un gran número de resultados de cálculos numéricos, los cuales apoyan y fortalecen algunas conjeturas aritméticas, pero no las demuestran. Por ejemplo, si quisiera demostrarse que todo número natural es menor o igual a 100 000 000 —lo cual es falso—, se podrían exhibir más de cien millones de ejemplos (0, 1, 2, . . ., 100 000 000) que cumplen con lo que la proposición asegura y, sin embargo, a pesar del multitudinario cúmulo de testigos, la falsedad del enunciado queda en evidencia al considerar el número 100 000 001, o cualquiera del infinito número de sus sucesores, 100 000 001 + n, n = 1, 2, . . .

5

Platón decía que los objetos de la matemática existen en un mundo ideal y que algunas veces se muestran a humanos geniales o dotados de gran talento, que son quienes los descubren.

7

8

Unidad 1  Lógica y conjuntos

René Thom (1923-2002). Matemático y topólogo francés, que destacó por su trabajo en el desarrollo de la teoría de las catástrofes, la cual está relacionada con sistemas dinámicos que no pueden modelarse adecuadamente mediante el cálculo diferencial.

René Thom afirma que la demostración de una proposición Q debe ser como un camino que, partiendo de una situación aceptada y que, por lo tanto, deba ser comprendida por todos, conduzca, a través de pasos sucesivos, hasta un estado psicológico en el que la verdad de la proposición resulte evidente [y agrega que] el rigor de esta demostración se basa en el hecho de que cada paso sea perfectamente claro, simplemente tomando en cuenta las extensiones de significado que se han ido efectuando en pasos previos.

Puede estarse de acuerdo con lo anterior, pero las fórmulas de la matemática, las cuales por supuesto pueden interpretarse, son entes abstractos. ¿Cómo comprender la demostración de una colección de símbolos que pueden no tener significado alguno? ¿Cuáles pueden ser las claras extensiones de significados que se han dado en pasos previos? Debe tenerse una formulación precisa de estas ideas dentro de la lógica matemática. En la ciencia se razona por medio de argumentos, que son reglas aceptadas que permiten obtener conclusiones a partir de ciertas hipótesis (las premisas). En lógica matemática se define un argumento como una pareja (Γ, Q), donde Γ es un conjunto de fórmulas (proposiciones) llamadas hipótesis y Q es una fórmula que se conoce como la conclusión. Se dice que un argumento (Γ, Q) es válido cuando la verdad de cada una de sus premisas fuerza a que la conclusión deba ser cierta. En un argumento válido no puede suceder que al ser ciertas las premisas, la conclusión no lo sea. En ese caso se dice que las premisas implican lógicamente la conclusión o que Γ → Q es una tautología, y de acuerdo con esta definición es claro que los argumentos válidos preservan el valor de verdad en el sentido de que a partir de premisas ciertas siempre se obtienen conclusiones ciertas. La definición anterior da origen a dos métodos prácticos para determinar la validez de un argumento.

Método directo Considere todos los valores de verdad que hagan ciertas las hipótesis, asignándolos a las proposiciones simples que las conforman, en el orden conveniente para que las disyunciones y las implicaciones sólo tengan una manera de ser ciertas. La asignación debe ser congruente, de manera que si a una proposición simple se le asigna un valor de verdad, debe conservarlo en todas sus apariciones en el argumento. Si este procedimiento obliga a la conclusión a ser cierta (no que pueda ser, sino que tenga que ser), entonces el argumento es válido, y, en caso contrario, no válido. Dado que los casos en que las hipótesis sean ciertas pueden ser varios (y entonces hay que considerar cada uno de ellos), conviene iniciar asignando valores a aquellas proposiciones que sólo tienen una combinación de valores que las hace ciertas, como las que están solas, las negaciones de una proposición y las conjunciones (por ejemplo, ¬B, R y M ∧ N).

Método indirecto Se asignan valores de verdad a las proposiciones simples que hagan falsa la conclusión y se incorporan esos valores a las que aparezcan en las hipótesis. Se continúa asignando valores de verdad a las proposiciones simples restantes de manera que hagan ciertas las hipótesis, si eso no es posible y alguna de las hipótesis falla (resulta falsa), entonces el argumento es válido. Si pudiera suceder que, siendo falsa la conclusión, todas las hipótesis resultaran ciertas, el argumento es inválido. Una manera de proceder es usar 1 para cierto y 0 para falso, en la forma de superíndice en cada proposición simple, como se ilustra en los ejemplos siguientes. Ejemplo 1.1.2

Demostrar la validez del argumento siguiente utilizando el método directo. C∧P P → (E ∨ L) E → ¬C ∴L

1.1  Lógica matemática

Otra manera de escribir el argumento es: C ∧ P, P → (E ∨ L), E → ¬C, ∴ L, o también 〈(C ∧ P) ∧ [P → (E ∨ L)] ∧ (E → ¬C)〉 → L En este caso, se comienza haciendo cierta la proposición (C ∧ P). La única manera en que esto pase es que tanto C como P sean ciertas. Luego, a C y a P les corresponde un uno. C ∧P 1 1 La P de la segunda hipótesis también debe ser cierta. P → (E ∨ L) 1 En la tercera hipótesis hay una ¬C que resulta falsa, ya que C es cierta. E → ¬C 0 Para ser cierta, esta última hipótesis obliga a la E a ser falsa. E → ¬C 0 0 Cuando se aplica este valor a la proposición P → ( E ∨ L ) se obtiene: P → (E ∨ L) 1 0 que para ser cierta fuerza a que L (la conclusión) tenga que ser cierta. Esto prueba la validez del argumento. P → (E ∨ L) 1 0 1

Ejemplo 1.1.3

Demostrar la validez del siguiente argumento utilizando el método indirecto. I →P C ∨ ¬P ¬C ∴ ¬I o bien, ( I → P ) ∧ (C ∨ ¬P ) ∧ ( ¬ C )  → ¬ I Para que la conclusión sea falsa se asigna a I el valor uno. ¬I 0 Luego, para que la primera hipótesis resulte cierta, P también debe tener valor uno. I→P 1    1 En la segunda hipótesis, ¬P es falsa y, por lo tanto, C tiene que ser cierta. C ∨ ¬P 1   0

9

10

Unidad 1  Lógica y conjuntos

Así, la tercera hipótesis, ¬C, no puede ser cierta. ¬C 0 Por lo tanto, el argumento es válido. Algunos argumentos válidos aparecen en las demostraciones con tal frecuencia que merecen ser señalados explícitamente (como los productos notables en el álgebra), y se les llama reglas válidas de inferencia. El ejemplo clásico es el conocido como modus ponendo ponens (modus ponens), el cual asegura que a partir de las hipótesis A y A → B se puede concluir B. Se denota como MP y se acostumbra representar con el esquema A, A → B B en el que las premisas se han escrito en el renglón de arriba y la conclusión en el de abajo. Siguiendo esa convención, se presentan los tres siguientes argumentos, que también son válidos y que, junto con el primero, forman las reglas válidas de inferencia usadas con más frecuencia en las demostraciones de la lógica proposicional: A → B, B → C Regla del silogismo hipotético (SH) A→C A ∨ B, ¬ A B

Regla de disyunción o modus tollendo ponens (disy)

A, ¬ A B

Regla de reducción al absurdo (RAA)

Cuando (Γ, Q) es un argumento, se dice que Q es consecuencia inmediata de Γ. En el caso del modus ponens, disyunción o absurdo de los esquemas anteriores, B es consecuencia inmediata de sus respectivas premisas. En teorías axiomáticas es frecuente suponer que, además de los axiomas, son ciertas algunas otras fórmulas, y en esos casos, considerar las que, debido a esa suposición (hipótesis), resultan también verdaderas. Por ejemplo, en la geometría de Euclides, puede suponerse que las rectas l y m son paralelas a una tercera recta k y concluir que entonces l y m son paralelas entre sí. En los casos análogos, cuando al suponer las hipótesis Γ puede concluirse Q, se dice que, en esa teoría, Q puede deducirse a partir de las hipótesis Γ. Tomando en cuenta las consideraciones anteriores se da la siguiente definición:

Definición 1.1.2 La deducción de una fórmula Q en una teoría axiomática 𝒯, a partir de la hipótesis Γ, es una lista ordenada de fórmulas B1, B2, . . ., Bn tal que cada una de ellas es: un axioma de la teoría. una hipótesis de Γ. una tautología6 (o cualquier proposición equivalente a ella).7 la consecuencia inmediata de una regla válida de inferencia, cuyas premisas ya están en la lista (son anteriores). 5. Bn es Q (cuya presencia también debe estar justificada8 por las condiciones 1 a 4). 1. 2. 3. 4.

6

Para evitar el uso de las tablas de verdad con objeto de justificar que alguna proposición que se desea utilizar es tautología, en este libro sólo se utilizarán casos particulares de las ocho tautologías básicas. 7 Se está utilizando la ley del reemplazo en la siguiente versión: Sea F(A) una fórmula que contiene a la proposición A y F(B), la que resulta de sustituir A por B en F. Entonces A ≡ B ⇒ F(A) ≡ F(B). En particular, F(A) se puede demostrar si y sólo si F(B) se puede demostrar. Esta ley permite sustituir cualquier fórmula de una deducción por otra equivalente (o anexar renglones). 8 Cuando una deducción se hace sin usar hipótesis (Γ = ∅) se dice que se trata de una demostración. En este libro no se hace tal distinción, de manera que se usará demostración o deducción como sinónimos.

1.1  Lógica matemática

Cuando se construye la deducción de una fórmula es conveniente numerar las proposiciones que van formándose para poder referirse a ellas sin ambigüedad; además, se acostumbra agregar una breve justificación de la presencia de cada fórmula de la cadena (en general, se escribe una demostración con objeto de comunicarla, o de recordar después cómo se hizo, y en esos casos la justificación mencionada ayuda a este propósito). No existen algoritmos que permitan indicar cómo hacer una demostración. Es un arte cuyos productos no siempre son fáciles de conseguir. Debe seleccionarse el camino y decidir cómo debe ser cada paso, qué tautologías deben usarse y cómo descubrir las reglas válidas de inferencia cuyas premisas van apareciendo. Una ayuda que facilita la labor de los demostradores consiste en recordar que las tautologías básicas son esquemas que expresan las relaciones que los conectivos tienen entre sí. Las tautologías 1 y 2 definen las propiedades esenciales de la implicación (son equivalentes a su tabla de verdad). Las tautologías 3 y 4 relacionan la implicación con el conectivo “y”; la 5 y la 6 con el “o” y la 7 y la 8 con el “no”. Estas relaciones sugieren los esquemas de tautologías que pueden usarse en cada caso. En los ejemplos 1.1.4 y 1.1.5, que se muestran a continuación, el único conectivo que aparece es la implicación; para construir sus demostraciones se aconseja tener en cuenta las dos primeras tautologías: la primera, A → (B → A), permite considerar cualquier proposición cierta A como consecuencia de cualquier premisa B, y la segunda, (A → B) → [(A → (B → C)) → (A → C)], afirma, de alguna manera, que la implicación es transitiva. En el ejemplo 1.1.6 aparece el conectivo no y, por lo tanto, es recomendable considerar, además de los esquemas 1 y 2, el 7 y el 8, e interpretar adecuadamente lo que dicen. El esquema 7,  (A → B) → [(A → ¬ B) → ¬ A], asegura que toda proposición A, que genera inconsistencias  (B y ¬ B), debe ser falsa (¬A). ¬¬A establece que, en el cálculo proposicional, la doble negación afirma. Es conveniente recordar las cuatro reglas válidas de inferencia y los esquemas de sus premisas para poder identificar los casos particulares de éstas, que van apareciendo en la lista, y así poder anotar en ella sus consecuencias inmediatas (sus conclusiones). Utilizando modus ponens como la única regla válida de inferencia, como sucede en algunos libros de lógica matemática, pueden justificarse las reglas de silogismo hipotético, reducción al absurdo y disyunción, que en este caso se llaman reglas derivadas. Los ejemplos 1.1.5 y 1.1.6 demuestran las primeras dos. El ejemplo 1.1.4 corresponde a un teorema que conviene considerar por la aplicación que tiene en otro teorema. Ejemplo 1.1.4

⊢– P → P 1. 2. 3. 4. 5.

(En este caso se trata de una deducción a partir de cero hipótesis.)

P → (P → P ) ( P → ( P → P ) ) → ( P → ( ( P → P ) → P ) ) → ( P → P )  ( P → ( ( P → P ) → P )) → ( P → P ) P → ( (P → P ) → P ) P→P

T1 ( A = B = P ) T2 ( A = C = P, B = P → P ) MP (1, 2) T1 ( A = P, B = P → P ) MP (4, 3)

Ejemplo 1.1.5

( P → Q ) , (Q → R ) ⊢– ( P → R ) 1.

P →Q

( P → Q ) → ( P → (Q → R )) → ( P → R )  3. ( P → (Q → R )) → ( P → R ) 4. (Q → R ) → [ P → (Q → R )] 2.

5. 6. 7.

Q→R P → (Q → R ) P →R

Hipótesis T2 ( A = P, B = Q, C = R ) MP (1, 2) T1 ( A = Q → R, B = P ) Hipótesis MP (5, 4) MP (6, 3)

11

12

Unidad 1  Lógica y conjuntos

Ejemplo 1.1.6

A, ¬ A ⊢– B 1. A → ( ¬ B → A)

2. 3. 4. 5. 6. 7. 8. 9. 10. 11.

A ¬B → A ¬ A → ( ¬ B → ¬ A) ¬A ¬B → ¬A (¬ B → A) → (¬ B → ¬ A) → ¬¬ B  (¬ B → ¬ A) → ¬¬ B ¬¬ B ¬¬ B → B B

T1 ( A = A, ¬ B = B ) Hipótesis MP (2, 1) T1 ( ¬ A = A, ¬ B = B ) Hipótesis MP (5, 4) T7 ( A = ¬ B, B = A) MP (3, 7) MP (6, 8) T8 MP (9, 10)

Una gran cantidad de demostraciones del cálculo proposicional, y la mayoría de las de la matemática, no son fáciles y casi siempre son demasiado largas. Es el precio que se paga por el deseo de analizar con todo detalle cada paso. Sin embargo, cuando la deducción de algún renglón es muy simple y salta a la vista, o es el resultado de un teorema cuyas hipótesis ya figuran en la lista, estas conclusiones pueden escribirse directamente como una abreviatura de sus deducciones. Por ejemplo, si se sabe (están en la lista) que a y b son catetos de un triángulo rectángulo de hipotenusa c, se puede escribir directamente que a2 + b2 = c2 sin tener que escribir la deducción completa del teorema de Pitágoras. En las demostraciones pueden omitirse algunos pasos, si éstos son muy obvios9 y si tal simplificación no hace que se pierda la idea general de la demostración. En álgebra suele decirse que lo que está sumando pasa restando o lo que está multiplicando y no es cero, pasa dividiendo, y así usar estas afirmaciones que son resultado de procesos deductivos muy simples: Si ax + b = c , ax + b − b debe ser igual a c − b, y como la suma es asociativa ( b − b = 0 ), y ax + 0 = ax, resulta finalmente que ax = c − b . En el cálculo proposicional, de la hipótesis A ∧ B puede deducirse fácilmente A y B. En efecto: A ∧ B → A T4 2. A ∧ B Hipótesis 3. A MP (2, 1) 1.

A ∧ B → B T4 2. A ∧ B Hipótesis 3. B MP (2, 1) 1.

Ambas deducciones pueden omitirse, de modo que cuando esté entre las hipótesis A ∧ B en una demostración, se vale usar cualquiera de ellas (A o B) sin escribir los tres pasos anteriores, anexando la justificación simplificación de la hipótesis… La mayoría de los teoremas de la matemática son de la forma si … entonces … (o pueden expresarse así). Por ejemplo: Si ab = 0, entonces a = 0 o b = 0; si ABC es un triángulo rectángulo, entonces la suma de las medidas de sus ángulos agudos es π/2...; son implicaciones cuya demostración comienza por lo general suponiendo que se cumplen las premisas (la parte si …), lo cual cambia el problema de demostrar la implicación (P → Q) por el que consiste en suponer P y demostrar Q. Este procedimiento suele justificarse con argumentos como el siguiente: Para probar la implicación P → Q, sólo debe considerarse el caso en que P es verdadera, ya que cuando no lo es, la implicación total es automáticamente cierta (toda implicación que parte de una premisa falsa es cierta por definición).

La validez del argumento anterior se encuentra en el teorema de la deducción, que junto con el de reducción al absurdo, son una herramienta fundamental en la demostración de los teoremas de la matemática.

9

La obviedad depende de la capacidad de análisis, la vista y el nivel de conocimiento de quien juzga.

1.1  Lógica matemática

 Teorema  1.1.1 Teorema de la deducción En una teoría axiomática 𝒯, a partir de Γ se puede deducir que P → Q si y sólo si a partir de Γ y P se puede demostrar Q. En símbolos: (Γ ⊢– P → Q) ⇔ (Γ, P ⊢– Q)

 Teorema 1.1.2 Teorema de la reducción al absurdo En una teoría axiomática 𝒯, a partir de Γ y de no P se puede deducir un absurdo ( ) si y sólo si a partir de Γ se puede deducir P. En símbolos: (Γ, ¬P) ⊢– ⇔ Γ ⊢– P La validez de estos teoremas se apoya en el análisis de las tablas de verdad, las cuales representan los enunciados de éstos y que se muestran a continuación: Tabla 1.1  Comprobación de la equivalencia de las proposiciones (Γ ∧ P) → Q y Γ → (P → Q) (Γ



P)



Q

Γ



(P



Q)

0

0

0

1

0

0

1

0

1

0

0

0

0

1

1

0

1

0

1

1

0

0

1

1

0

0

1

1

0

0

0

0

1

1

1

0

1

1

1

1

1

0

0

1

0

1

1

0

1

0

1

0

0

1

1

1

1

0

1

1

1

1

1

0

0

1

0

1

0

0

1

1

1

1

1

1

1

1

1

1

La tabla 1.1 asegura que las proposiciones (Γ ∧ P) → Q y Γ → (P → Q) son equivalentes  —una es cierta si y sólo si la otra lo es— y, por lo tanto, si una es tautología,10 la otra también  lo es. Es decir, (Γ ∧ P) implica lógicamente a Q si y sólo si Γ implica lógicamente (P → Q), como  lo afirma el teorema. De manera análoga: Tabla 1.2  Comprobación de la equivalencia de las proposiciones ¬P ∧ Γ → (¬P



Γ)



1

0

0

1

0

yΓ→P

Γ



P

0

1

0

1

1

1

0

0

1

0

0

0

0

0

1

0

0

1

1

0

0

1

1

0

1

1

1

La tabla 1.2 ilustra la equivalencia de las proposiciones ¬P ∧ Γ → y Γ → P, lo que demuestra la validez del teorema de la reducción al absurdo. Para ilustrar la forma en que el teorema de la deducción (1.1.1) simplifica algunas demostraciones, se repiten los problemas de los ejemplos 1.1.4 y 1.1.5, pero ahora usando el teorema mencionado.

10

Cuando se afirma que una proposición es tautología, se debe entender que no pueden darse los casos en que la proposición es falsa. En el caso que se ilustra, debe entenderse que la combinación de valores del renglón 7, que dice que las hipótesis son ciertas y la conclusión falsa, no puede suceder dado que se afirma que el argumento es válido.

13

14

Unidad 1  Lógica y conjuntos 1. ⊢– P → P se transforma en el que dice:

P ⊢– P cuya deducción consta de un solo paso: i) P Hipótesis (adicional) 2. P → Q, Q → R ⊢– P → R que se cambia en: P, P → Q, Q → R ⊢– R  La deducción de este último puede ser: i) P → Q ii) P iii) Q iv) Q → R v) R

Hipótesis Hipótesis adicional MP (2, 1) Hipótesis MP (3, 4)

Compare estas deducciones con las hechas anteriormente y compruebe que además de ser más cortas son mucho más sencillas y en ellas se ve más fácilmente cómo construirlas. El uso del teorema de reducción al absurdo (1.1.2) se ejemplifica en las tres importantes deducciones siguientes: 3. P, ¬P ⊢– Q, que se cambia por:

P, ¬P, ¬Q ⊢–     Una deducción puede ser: i) P Hipótesis ii) ¬P Hipótesis iii) P ∧ ¬ P (1, 2) Observe que la proposición Q no intervino en la deducción, lo cual prueba que una teoría axiomática en la que existe una proposición P y su negación ¬P entre sus teoremas es inconsistente.11 Cualquier fórmula puede demostrarse y su negación también, lo cual las hace inútiles y, por lo tanto, se rechazan. 4. ⊢– ¬ ( P ∧ ¬ P ) (El cálculo proposicional es simplemente consistente.)

Suponga lo contrario de lo que se desea probar, es decir, P ∧ ¬ P . Entonces i) P ∧ ¬ P Hipótesis que es absurda y, por lo tanto, prueba lo contrario de lo que se supuso, lo cual es lo que se debía demostrar. 5. ⊢– P ∨ ¬ P (Ley del tercero excluido.)

El problema se cambia por: ¬ ( P ∨ ¬ P ) ⊢– Observe que de ¬( P ∨¬ P ) , P puede derivarse un absurdo: i) P ii) P → ( P ∨ ¬ P ) iii) P ∨ ¬ P iv) ¬ ( P ∨ ¬ P ) v) ( P ∨ ¬ P ) ∧ ¬ ( P ∨ ¬ P ) por lo que ¬ ( P ∨ ¬ P ) ¬ ¬P

Hipótesis T6 MP (1, 2) Hipótesis (3, 4) Teorema reducción al absurdo

Análogamente, ¬ ( P ∨ ¬ P ) ¬ P ⊢– i) ¬ P ii) ¬ P → ( P ∨ ¬ P ) iii) P ∨ ¬ P

11

Hipótesis T6 MP (1, 2)

Una teoría axiomática con negación es inconsistente si y sólo si existe en ella una fórmula tal que ella y su negación son teoremas. A este tipo de inconsistencia se le llama simple.

1.1  Lógica matemática

iv) ¬ ( P ∨ ¬ P ) v) ( P ∨ ¬ P ) ∧ ¬ ( P ∨ ¬ P )

Hipótesis (3, 4)

lo cual señala que ¬ ( P ∨ ¬ P ) ⊢– P

Teorema reducción al absurdo

y de los dos resultados anteriores se sigue que ¬ ( P ∨ ¬ P ) ⊢– ¬ P ∧ P es decir,  ⊢– P ∨ ¬ P

Teorema reducción al absurdo

Algunas propiedades del símbolo “⊢–” (se puede demostrar) De la discusión realizada sobre las demostraciones se derivan, o pueden derivarse fácilmente, las propiedades del símbolo ⊢–, algunas de las cuales se enumeran a continuación y se usarán libremente para argumentar acerca de las demostraciones y sus métodos. 1. Toda tautología, hipótesis o axioma puede demostrarse (demostración de un solo paso) (∀Q,

hipótesis, axioma o tautología) ⊢– Q.

2. Si de las fórmulas de un conjunto M se puede demostrar cada una de las de otro conjunto N,

y con las de éste se puede probar Q, entonces de M se puede probar Q. Si N es un subconjunto de M, a partir de M puede demostrarse cada fórmula de N. (M ⊢– N) ∧ (N ⊢– Q) ⇒ M ⊢– Q 3. Si de Γ y P puede deducirse que Q y P es un teorema cuya demostración no requiere de nin-

guna hipótesis, entonces de Γ (solamente) puede deducirse Q (por ejemplo, si se supiera que Γ, (P ∨ ¬P) ⊢– Q, entonces Γ ⊢– Q). (Γ, P ⊢– Q) ∧ (⊢– P) ⇒ Γ ⊢– Q

4. Si de Γ pueden deducirse tanto P como Q, entonces de Γ puede deducirse P ∧ Q.

(Γ ⊢– P, Γ ⊢– Q ⇒ Γ ⊢– P ∧ Q)



5. Si de P puede deducirse R y de Q también puede deducirse R, entonces de P o Q puede dedu-

cirse R: (P ⊢– R) ∧ (Q ⊢– R) ⇒ (P ∨ Q) ⊢– R. Ejercicio 1.1

1.  Demuestre la equivalencia de las parejas de proposiciones: ( P → Q ) ≡ (¬Q → ¬ P ) P → Q ≡ ¬P ∨Q ¬ ( P → Q ) ≡ P ∧ ¬Q haciendo ver que, en cada caso, de una de ellas se puede demostrar la otra (dos demostraciones).

El cálculo proposicional es consistente y completo El cálculo proposicional tiene por objeto formalizar la manera en que se razona y, por lo tanto, es una teoría axiomática intuitiva12 de la cual se puede decir que es consistente y completa con respecto a la propiedad de ser cierta, de acuerdo con las siguientes definiciones:

12

Se llama así a toda teoría cuyo objetivo es formalizar una parte de la realidad de la que se tiene alguna idea (que generalmente es imprecisa).

15

16

Unidad 1  Lógica y conjuntos

Definición 1.1.3 Una teoría axiomática es consistente con respecto a una propiedad P, si todos sus teoremas la tienen.

Si la propiedad es ser cierta, una teoría axiomática resulta consistente si y sólo si todos sus teoremas son ciertos. Recuerde que en el cálculo proposicional, todo renglón de una demostración, incluido el último, es cierto de origen (es tautología, hipótesis o axioma), o es consecuencia de una regla válida de inferencia, que cuando parte de premisas ciertas, produce conclusiones ciertas; es decir, el cálculo proposicional es consistente con respecto a la propiedad de ser cierto. Todos sus teoremas resultan tautologías.

Definición 1.1.4 Una teoría axiomática es completa con respecto a una propiedad P, si toda fórmula que la tenga es demostrable (es un teorema).

Para justificar la afirmación de que el cálculo proposicional es completo con respecto a la propiedad de ser cierto, se debe demostrar que toda tautología es teorema, como lo muestra  el siguiente lema.

Lema Observe que cada renglón de una tabla de verdad puede interpretarse como un argumento válido del cálculo proposicional.

Suponga que se da un renglón de la tabla de verdad de una proposición Q que tiene n premisas P1, . . ., Pn. La manera de construir el teorema que corresponde a ese renglón es considerar el argumento: B1, B2, . . ., Bn, ∴ C en donde cada Bi es Pi si en ese renglón el valor de verdad de la proposición Pi es 1 y es ¬Pi si Pi es falsa. C es Q si Q es cierta y ¬Q si es falsa. Por ejemplo, suponga que la tabla correspondiente a la proposición Q tiene los siguientes valores: P1

P2

P3

P4

Q

1

1

0

1

0

En este caso, el teorema asociado es: P1, P2, ¬ P3, P4 ⊢– ¬Q. La tabla de verdad del conectivo ¬ es la siguiente: P

¬P

0

1

1

0

Y genera estos dos teoremas: ¬P ⊢– ¬P, que corresponde al primer renglón, y P ⊢– ¬ ¬P que corresponde al segundo.

1.1  Lógica matemática

Cada uno de los otros tres conectivos lógicos, cuyas tablas de verdad tienen cuatro renglones, da lugar a cuatro teoremas, uno para cada renglón, que se demuestran fácilmente. Se da un ejemplo de cada uno de ellos y se dejan los otros nueve como ejercicios. Ejemplo 1.1.7

El renglón 2 de la siguiente tabla de implicación P

Q

P→Q

1

0

0

señala que de P y no Q puede demostrarse ¬ (P → Q), es decir: P, ¬Q ⊢– ¬ (P → Q) que puede deducirse por reducción al absurdo, suponiendo lo contrario de lo que se quiere demostrar y derivando una contradicción. Es decir, se cambia el problema original por el siguiente: P, ¬Q, P → Q ⊢–  Una deducción puede ser: 1. 2. 3. 4. 5.

Hipótesis Hipótesis adicional MP (1, 2) Hipótesis (3, 4)

P P → Q Q ¬Q Q ∧ ¬Q Ejemplo 1.1.8

El renglón 3 del conectivo ∧ es:

Es decir: 1. 2. 3. 4. 5.

P

Q

P∧Q

1

1

1

P

Q

P∨Q

0

0

0

P, Q ⊢– P ∧ Q

P Q P → [Q →(P ∧ Q)] Q → (P ∧ Q) P ∧ Q

Hipótesis Hipótesis T3 MP (1, 3) MP (2, 4)

Ejemplo 1.1.9

El renglón 0 del conectivo ∨ es:

que corresponde al teorema: ¬P, ¬Q ⊢– ¬(P ∨ Q) y que puede demostrarse por reducción al absurdo al notar que ¬P, ¬Q, P ⊢– P ∧ ¬P ¬P, ¬Q, Q ⊢– Q ∧ ¬Q Así, ¬P, ¬Q, P ∨ Q ⊢– , lo que confirma la aserción del teorema.

17

1.1  Lógica matemática 18

Unidad 1  Lógica y conjuntos

La demostración de los 14 teoremas correspondientes a los renglones de las tablas de verdad de los conectivos lógicos muestran que, puesto que las tablas de verdad de toda fórmula se construyen aplicando iteradamente las de los conectivos lógicos que intervienen en ellas, cada renglón de cualquier tabla es un argumento válido deducible. La observación anterior es la base de la demostración del siguiente teorema:

 Teorema  1.1.3 En el cálculo proposicional toda tautología es demostrable. Se ilustra el teorema para el caso de una tautología que esté formada por dos proposiciones, y cuya tabla de verdad resulta ser: P

Q

T

0

0

1

0

1

1

1

0

1

1

1

1

De acuerdo con el lema anterior, para cada renglón se tienen los siguientes teoremas: 1. ¬P, ¬Q  ⊢– T 3. P, ¬Q 2. ¬P, Q,     ⊢– T 4. P, Q

⊢– T ⊢– T

De 1 y 2 se concluye que:

¬P, (Q ∨ ¬Q) ⊢– T  ∴  ¬P  ⊢– T

(1.1.3)

(Q ∨ ¬Q es teorema) Análogamente, de 3 y 4: P, (Q ∨ ¬Q) ⊢– T  ∴  P  ⊢– T

(1.1.4)

Finalmente, de (1.1.3) y (1.1.4): P ∨ ¬P  ⊢– T  ∴  ⊢– T. La demostración formal puede hacerse por inducción (aquí no se da), pero el paso inductivo se ejemplifica para una tautología con tres fórmulas P, Q y R, que muestra la manera como se pasa del caso 2 al caso 3. Sea T una tautología compuesta con las tres fórmulas P, Q y R. Su tabla, de ocho renglones, puede partirse en dos mitades, la primera de las cuales comienza con un cero para P y que, en conjunto, muestra todos los casos para los valores de Q y R, por lo que, de acuerdo con el resultado anterior (caso de dos fórmulas), de esta mitad se concluye: ¬P ⊢– T El resultado de la segunda mitad, en donde los cuatro renglones empiezan con uno para el valor de P, afirma: P ⊢– T y, por lo tanto, de la tabla completa se deduce que ¬P, P ⊢– T, de donde finalmente se obtiene ⊢– T.

Cuantificadores Suponga que A = {a, b, c} es un conjunto y P una propiedad que cada elemento de A puede o no tener. Se denota como P(x) a la proposición x tiene la propiedad P y ¬P(x) cuando x no la tiene. Entonces la afirmación P(a) ∧ P(b) ∧ P(c) es cierta si y sólo si cada elemento de A tiene la propiedad P.

1.1  Lógica matemática

Cuando tal situación se da en conjuntos con un número grande de elementos, la expresión anterior no es práctica. Se recurre entonces a notaciones más compactas, entre las que se destaca la que introduce el uso del llamado cuantificador universal ∀, que se lee como para todo o para cada, según convenga a la interpretación de la proposición a la cual se aplica. Note que, en este caso, ∀ es la abreviatura de un ∧ generalizado. La afirmación todo elemento de A tiene la propiedad P es falsa si y sólo si existe algún elemento de A que no la tenga. Entonces es natural definir la negación de un para todo con un existe. En símbolos: ¬(∀ x ∈ A, P ( x ) ) ≡ ∃ x ∈ A∋ ¬P ( x ) ∃ es el cuantificador existencial que se lee existe. Algunas veces se usa la notación ∃! para afirmar que algo existe y es único. Recíprocamente, si la proposición es existe un x (al menos uno) en A que tiene la propiedad P (que es un ∨ generalizado), entonces su negación es: Todo elemento de A carece de (no tiene) la propiedad P. En símbolos: ¬[ ∃ x ∈ A∋ P ( x )] ≡ ∀ x ∈ A, ¬ P ( x ) Como se señala a continuación, las definiciones anteriores son una generalización de las leyes de De Morgan. Ley de De Morgan

Generalización

Notación13

¬(A ∧ B) ≡ ¬ A ∨ ¬ B

¬ A 1 ∧  ∧ An ≡ ¬ A 1∨  ∨¬ An

( ) ¬( A1 ∨  ∨ An ) ≡ ¬ A 1∧  ∧¬ An

¬(∧i ∈ I Ai ) ≡ ∨i ∈ I (¬ Ai )

¬(A ∨ B) ≡ ¬ A ∧ ¬ B

¬(∨i ∈ I Ai ) ≡ ∧i ∈ I (¬ Ai )

Se puede abreviar así: la negación de un para todo es un existe y la negación de un existe es un para todo. Es necesario decir que cuando se agregan cuantificadores al cálculo proposicional, se incursiona en el cálculo de predicados, lo cual requiere de nuevos conceptos, nuevas relaciones y, consecuentemente, nuevas reglas de inferencia. El uso de variables en el cálculo proposicional ampliado complica la asignación de valores de verdad de las fórmulas, que ahora depende de los dominios de interpretación de las variables y de los objetos particulares que se sustituyen, pero a cambio de eso este cálculo ampliado permite representar en él la mayor parte de las proposiciones de la matemática. Ejercicios 1.1.

2. Señale si las siguientes frases pueden considerarse proposiciones (es decir, si aceptan uno y sólo uno de los dos valores de verdad: falso o verdadero). a)  El número 30 es divisible entre 8. e)  Esto es falso. b)  La montaña nevada. f)  Mejor vete a freír espárragos. c) 13 ≥ 2 + 8. g)  Todas las x son verdes. d)  No hay regla sin excepción. h)  x + y = 10. 3.  Escriba en forma simbólica las siguientes proposiciones. a) La matemática es sencilla y la lógica divertida. b) (2 + 2 = 4) o (7 × 8 = 46). c) Un elemento pertenece a la intersección de dos conjuntos si y sólo si pertenece a cada uno de ellos. d) Todo número real es algebraico o trascendente.

13 En las expresiones ∧ … ∧ A y A ∨ … ∨ A , se utiliza la notación i ∈ I para indicar i∈I Ai y ∨i∈I Ai, que son simplificaciones de Ai ∧ n i n que I es una colección de índices. Esto puede hacerse solamente cuando I es un conjunto.

19

20

Unidad 1  Lógica y conjuntos

4. Identifique el conectivo lógico utilizado en cada uno de los incisos. Use letras para designar proposiciones simples y finalmente reescriba en símbolos las proposiciones. a) Los osos no comen en invierno. b) Si Petra baila, es feliz. c) La materia favorita de todos es Lógica matemática. d) Si la envidia fuera tiña, todos andaríamos tiñosos. e) Si las miradas mataran, entonces ya estarías muerto. f ) (x + y = 1 y 2x − y = 4) o (z > 3). 5. Utilice: p: a es menor que b q: a es menor o igual que b r: b es menor que c s: c es igual a d t: a es menor que c para escribir en lenguaje común las siguientes proposiciones: a)  ( p ∨ ¬r ) → t c)  ( q → r ) → ¬t b)  [ ¬( p ∨ ¬q ) ∧ r ] → t d )  (t ∧ s ) ↔ [( r ∧ ¬p ) → t )] 6.  Construya las tablas de verdad para las ocho tautologías básicas. 7. Si p y r son verdaderas y q es falsa, indique si las siguientes proposiciones son o no verdaderas. a)  ( p ∧ q ) → p d)  ( p → q ) ↔ ¬( q → p ) b)  ( p ∨ q ) → ¬( q ∧ p ) e  )  ( p ∨ q ) → r c)  ( p → q ) → q 8. Diga cuáles de los siguientes argumentos son válidos. Analice con unos y ceros. a)  ¬P ∨ Q, ¬P → ¬R, Q → R ∴ P d)  ¬( ¬P ∧ ¬Q ) , P ∨ ¬Q ∴ P b)  ¬P → Q, Q → ¬R, ¬R ∴ P e  )  Q → ¬P, Q ∨ R, ¬R ∴ ¬P c)  P ∧ Q, R ∧ P ∴ P   9. Haga una deducción de los siguientes argumentos. a) S ∧ Q b) ¬Q → H c) D → (¬F → G) d) L → O R ∧ S H → ¬ F ¬E ∨ D M→D ∴ S F ∨ S ¬F ¬(D ∧ O) ∨ Z ¬S ∴ E → G ¬Z ∴ Q ∴ L → ¬M 10. Determine el valor de verdad de los siguientes enunciados y niéguelos sin anteponer un no. a)  ∀ x ∈ , x 2 = x d  )  ∀ x ∈ , x 2 = 4 → x = 2 b)  ∃ x ∈ , 2 x = x e)  ∀ x ∈ , ∃ y ∈ ; x + y = 0 c)  ∀ x ∈ , x = x f  )  ∃ y ∈  ∋ ∀ x ∈ , x + y = 0 g)  Sean A = {−2, − 1, 0, 3, 5} y B = {−1, 0, 1}, ∃ y ∈ A∋ ∀ x ∈ B, x + y ≤ −1

1.2 Conjuntos Introducción Se presentan algunos ejemplos que muestran un breve panorama del tema de conjuntos y una parte donde se describe el sustento matemático (axiomas y teoremas) de la teoría. Para ello se usan algunos resultados y métodos de la lógica matemática. En esta sección se jugará con unos “juguetes” llamados conjuntos. La matemática se estructura en Aunque el concepto conjunto no se define (se considera primitivo), puede desforma análoga a muchos juegos, en cribirse intuitivamente como una colección de objetos que tienen alguna caracteríslos que se dispone de objetos tica común bien definida; es decir, un conjunto puede considerarse como la colección (juguetes) y reglas para jugar. de elementos que forman parte de (pertenecen a, están en, …) ese conjunto.

1.2 Conjuntos

Se acostumbra describir los conjuntos encerrando entre llaves sus elementos, separándolos por comas, cuando se pueden listar. Por ejemplo, si A es el conjunto formado por los números 1, 2 y 3, se puede representar en la forma: A = {1, 2, 3} Como se puede observar, el elemento 1 está en el conjunto A, lo que se denota como 1 ∈A y 4 no está, es decir, 4 ∉A. Si se considera el conjunto B, formado por los enteros comprendidos entre 0 y 4, al analizar cuáles enteros cumplen esta condición, se observa que son los mismos del conjunto A. Cuando esto suceda, se dirá que los conjuntos son iguales. Si éste es el caso, se usa la notación A = B. Sea C = {0, 3, 4, 1, 2}. Se puede notar que todos los elementos de A también son elementos de C. Cuando esto sucede se dice que A está contenido en C y se usa la notación A ⊂ C. A ⊂ C resulta una proposición verdadera Sea D = {0, 2, 5}. Entonces D no está contenido en C, pues el 5 no es elemento de C, aunque 0 y 2 sí lo sean. La definición de contención requiere que todos los elementos del primero lo sean también del segundo. La proposición D ⊂ C es falsa y, por lo tanto, su negación D ⊄ C resulta verdadera. Al comparar los conjuntos A y C se observa que no tienen los mismos elementos, es decir, A ≠ C. Dado un conjunto, ¿se podrán construir otros? La respuesta es afirmativa. Por ejemplo, a partir de A se puede formar E como el conjunto de aquellos elementos x de A que hagan cierta la ecuación x − 3 = 0. El único elemento de A que la satisface es 3, y así E = {3}. Otra manera de representarlo es

Cuando se utiliza una proposición o condición P(x) como la anterior para construir un conjunto E a partir de otro A, se dice que un elemento pertenece al primero si y sólo si, estando en el segundo, hace verdadera esta proposición. P(x) también suele llamarse regla de formación del conjunto E. Lo anterior se puede expresar como E = {x ∈A; P(x)}; entonces: es verdadera) es falsa) En resumen, los conjuntos se pueden expresar: 1. En forma enunciativa o por comprensión: E = {x ∈A; P(x)}. 2. En forma tabular o por extensión: E = { elemento1, elemento2, … }.

Si F = {x ∈A; x − 5 = 0} y A = {1, 2, 3}, ¿qué elementos tiene F? ¿Es un conjunto o no lo es? En la teoría de conjuntos existe uno llamado conjunto vacío, que no tiene elementos. Dicho conjunto se denota con el símbolo ∅. Note que ∅ ≠ {∅}, ∅ ⊂ {∅}, ∅ ∈{∅}, ∅ ∉∅, ∅ ⊂ ∅ y {∅} ⊄ ∅. Al comparar los conjuntos G = {1, 2, 3, 4} y H = {0, 2, 4, 5} se puede ver que 2 y 4 están en ambos. Puede pensarse en la colección formada por los elementos comunes a éstos. Este nuevo conjunto se denota como G ∩ H = {2, 4} y se llama la intersección de G y H. Al eliminar del conjunto H aquellos elementos que son comunes con G se obtiene el conjunto {0, 5}, el cual se conoce como la diferencia de H menos G, y se denota H − G. Este conjunto también se conoce como el complemento de G con respecto a H. Para mayor claridad, H − G es el conjunto de todos los elementos de H que no están en G. Al unir los elementos de G con los de H se obtiene el conjunto {0, 1, 2, 3, 4, 5}, que se conoce como la unión de G y H, y se denota por G ∪ H.

21

22

Unidad 1  Lógica y conjuntos

Al formar el conjunto K como la colección de los conjuntos A, B, C, …, se obtiene K = {A, B, C, . . .}. ¡Un conjunto de conjuntos! Con los elementos de E = {a, b, c} se puede formar un nuevo conjunto, cuyos elementos sean los subconjuntos de E: {∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}} el cual se conoce como conjunto potencia de E, 2E o 𝒫(E). Si M = {a, e} y N = {b, d}, ¿qué “palabras” de dos letras se pueden formar si la primera de izquierda a derecha es del conjunto A y la segunda del conjunto N? Respuesta: ab, ad, eb, ed. Considere ahora el conjunto de parejas formadas por los elementos de los conjuntos M y N con la condición anterior, es decir, que el primer elemento sea de M y el segundo de N. Así se obtiene {(a, b), (a, d), (e, b), (e, d)}, que se conoce como el producto cartesiano de M y N y se denota como M × N. Sean I = {♣, ♦, ♥, ♠} y F = {A, D, E, C}. Puede pensarse en una correspondencia (función f de I en F) tal que Xi = f (i), y si además f (♣) = A, f (♦) = D, f (♥) = E y f (♠) = C, el conjunto F también puede representarse como {Xi}i∈I. Como puede observarse, cada elemento de F quedó etiquetado con un elemento de I. ¿Habrá un conjunto que tenga como elementos a todos los conjuntos, incluso a él mismo? ¿Cómo entran en la matemática las consideraciones anteriores? ¿Embonan o son un parche mal puesto? ¡Es necesario construirles un sustento! Se requiere formalizar.

1.3 Conceptos primitivos, definiciones, axiomas y teoremas Son conceptos primitivos conjunto y elemento. La única relación primitiva es estar en. Se postula que existen conjuntos (si no, ¿de qué se estaría tratando? Sería un juego vacío).

Axioma 1.3.1 Axioma de existencia Existe, al menos, un conjunto.

Axioma 1.3.2 Axioma de extensión Dos conjuntos son iguales si y sólo si tienen los mismos elementos. O bien:

A = B ⇔ ∀x, ( x ∈A → x ∈B ) ∧ ( x ∈B → x ∈A )

Observación Si A y B fueran conjuntos sin elementos, satisfarían la doble condición que da la igualdad (por vacuidad); luego, serían iguales, es decir, tal conjunto sería único. Su existencia se demostrará después del axioma de especificación (1.3.3).

Contención de conjuntos Definición 1.3.1 Sean A y B conjuntos. A está contenido en B si y sólo si todo elemento de A es también un elemento de B. Asimismo, se dice que B contiene a A o que A es un subconjunto de B. A ⊂ B ⇔ ∀x, x ∈A → x ∈B

1.3  Conceptos primitivos, definiciones, axiomas y teoremas

Si A fuera un conjunto sin elementos, estaría contenido en cualquier conjunto (ya que satisfaría la condición anterior por vacuidad).

Definición 1.3.2 Si A y B son dos conjuntos tales que A ⊂ B y A ≠ B, que se abrevia A ⊈ B, se dice que A es un subconjunto propio de B. Note que la pertenencia se refiere a una relación elemento-conjunto. x ∈A se lee x es elemento de A, es decir, x pertenece al conjunto A. La contención se refiere a una relación conjunto-conjunto. A ⊂ B se lee como A es un subconjunto de B, o A está contenido en B. B ⊃ A es equivalente a A ⊂ B.

Nuevos conjuntos Considere una proposición abierta P(x) que tiene sentido cuando se seleccionan elementos x de un conjunto A. La construcción del conjunto de elementos que hacen verdadera la proposición P está garantizada por el axioma de especificación.

Axioma 1.3.3 Axioma de especificación A todo conjunto A y a toda condición P(x) para A, corresponde un conjunto B cuyos elementos son precisamente aquellos elementos x de A que satisfacen la proposición P. (P(x) es cierta.)

Para usar una notación de lectura apropiada se utiliza B = {x ∈A; P(x)} y se lee: “B es el conjunto de los elementos x que están en A y cumplen la condición P”.

El conjunto vacío y el conjunto universal Sea A un conjunto (que existe según el axioma 1.3.1) y P(x) la proposición x ≠ x, que no se puede satisfacer. Entonces {x ∈A; P(x)} que, según el axioma 1.3.3, es conjunto y no tiene elementos. Este conjunto se conoce como el conjunto vacío y se denota por ∅. Como ya se vio, es único y está contenido en cualquier otro conjunto, incluido él mismo. Con respecto a la pregunta formulada en la introducción (¿habrá algún conjunto que tenga como elementos a todos los conjuntos, incluido él mismo?), ¿existe el conjunto universal? El teorema siguiente afirma que no es así.

 Teorema  1.3.1 Para cualquier conjunto A hay un conjunto B que no es elemento de A. La demostración de este teorema puede hacerse por reducción al absurdo.

Demostración Suponga que A es un conjunto cuyos elementos son conjuntos y sea B = {x ∈A; x ∉x}; entonces: Si B estuviera en A, aplicando la condición que lo define resultaría: B ∈B ⇒ B ∉B ∴ B ∉B, B ∉B ⇒ B ∈B ∴ B ∈B, es decir B ∈B y B ∉B

23

24

Unidad 1  Lógica y conjuntos

La contradicción se obtuvo de la hipótesis B ∈A, lo que prueba que B ∉A. El teorema 1.3.1 muestra que todo conjunto de conjuntos es incompleto. Siempre hay conjuntos que no están en él. Luego, no existe el conjunto de todos los conjuntos. La colección de todos los conjuntos no es un conjunto. A pesar de que no existe el conjunto universal, se acostumbra definir conjuntos universales para cada problema específico, que se refieren a todos los objetos que interesan en ese estudio particular. En seguida se plantean algunas preguntas: ¿Habrá suficientes conjuntos para garantizar que todo conjunto es un elemento de algún conjunto? ¿Será cierto que para cualquier número de conjuntos existe otro al cual pertenecen todos? ¿Existe alguno que los contiene? Se necesitan nuevos principios de construcción.

Axioma 1.3.4 Axioma de las parejas Para dos conjuntos cualesquiera, existe un conjunto al cual pertenecen ambos.

El axioma 1.3.4 garantiza que para cualesquiera dos conjuntos A y B existe un conjunto C tal que

C = {A, B, . . .}

Se puede aplicar a C el axioma de especificación (1.3.3), en el que P(x) es x ∈A ∨ x ∈B. El resultado es el conjunto y se llama la pareja no ordenada formada por A y B. Note que si A = B, entonces D = {A}. Nota: Se utilizan las familias de conjuntos (haciendo énfasis en que la colección de índices es un conjunto) para poder aplicar en ellas (las familias) las operaciones conjuntistas, las cuales se definen más adelante (uniones, intersecciones, diferencias, complementos, etcétera).

Familia de conjuntos Sea I un conjunto (de índices) y C una colección de conjuntos. Se llama familia de conjuntos a toda función η : I → C. Si η (i) = Ai, se acostumbra denotar a la familia como {Ai}i∈I.

Uniones Dada una familia de conjuntos, es posible formar otro que tiene como elementos a los elementos de cada uno de los conjuntos de la familia (axioma 1.3.5).

Axioma 1.3.5 Axioma de las uniones Para toda colección 𝒯 de conjuntos existe un conjunto C que contiene a todos los elementos que pertenecen cuando menos a uno de los conjuntos de la colección 𝒯. Lo que el axioma 1.3.5 asegura es la existencia de un conjunto que contiene a cada uno de los conjuntos de la familia. Al aplicar el axioma de especificación (1.3.3) se obtiene un conjunto llamado la unión de la familia, la cual está formada por los elementos de los conjuntos de la familia y sólo ésos. U = {x ∈C; x ∈A para algún A ∈ 𝒯} Si 𝒯 = {A, B} entonces U = A ∪ B A ∪ B = {x ∈C; x ∈A ∨ x ∈B}

1.5  Producto cartesiano

1.4  Álgebra de conjuntos Intersecciones De manera similar a la anterior, podemos pensar en los elementos que están en cada miembro de la colección 𝒯 y formar lo que se conoce como intersección de la familia: Si 𝒯 = {A, B} entonces J = A ∩ B ;

Diferencias Si A y B son dos conjuntos, la diferencia entre A y B, también conocida como el complemento de B con respecto a A, es el conjunto A − B definido como:

Complemento Sea U un conjunto universal (particular) y A un subconjunto de U. La diferencia U − A se llama complemento de A, y si se conoce el conjunto universal, el complemento de A se denota por Ac o por A′. Considere ahora los subconjuntos de un conjunto A. ¿Existe un conjunto cuyos elementos sean estos subconjuntos? El axioma 1.4.1 garantiza que la respuesta es afirmativa.

El conjunto potencia Axioma 1.4.1 Axioma de las partes Para cada conjunto A existe un conjunto C que tiene entre sus elementos a todos los subconjuntos del conjunto dado (es decir, B ⊂ A → B ∈C ).

El axioma de especificación (1.3.3) permite formar el conjunto potencia de A: 𝒫(A) = {B ∈C : B ⊂ A}, que también se denota como 2A, lo cual expresa el hecho de que todo conjunto A con n elementos tiene 2n subconjuntos (al número de diferentes elementos de un conjunto se le llama cardinalidad, y se acostumbra denotarlo como #A, n(A) o |A|; por ejemplo, si A = {a, a, a, b, b} su cardinalidad es |A| = 2, ya que A = {a, b}).

1.5  Producto cartesiano Pareja ordenada El orden en que aparecen los elementos de un conjunto es irrelevante. Si se quiere construir un conjunto con dos elementos de tal manera que se pueda distinguir cuál es el primero, necesita definirse una pareja ordenada:

Definición 1.5.1

(a, b) = {{a} , {a, b}}

25

26

Unidad 1  Lógica y conjuntos

Los elementos a y b se llaman primera y segunda coordenadas (o componentes), respectivamente. Con esto se consigue la propiedad esencial: (a, b) = (c, d ) ⇔ a = c ∧ b = d, cuya demostración es la siguiente: ⇒  Suponga que:

(a, b) = (c, d) {{a}, {a, b}} = {{c}, {c, d}}

esto es:

Dado que estos conjuntos son iguales, sus elementos deben ser iguales, con lo cual aparecen dos posibilidades:

{a} = {c} ∧ {a, b} = {c, d} en donde,

(1.5.1)

a = c  y  b = d

{a} = {c, d} ∧ {a, b} = {c} de donde, a=c∧a=d y: a = c ∧ b = c entonces: a=b=c=d

(1.5.2)

En ambos casos resulta a=c∧b=d ⇐ La demostración es inmediata.

Relaciones y funciones Si A y B son conjuntos, ¿existe un conjunto que contiene a todas las parejas ordenadas (a, b) con a en A y b en B? La respuesta es afirmativa y es el conjunto conocido como el producto cartesiano de A y B, el cual se define como: A × B = {(a, b): a ∈A ∧ b ∈B} Las parejas ordenadas (a, b) son elementos de 𝒫(𝒫(A ∪ B)). Cualquier subconjunto de A × B se conoce como una relación del conjunto A en el conjunto B. La más importante de las relaciones en la matemática es la de función, que se definirá más adelante. Cuando A = B, una relación de A en B se llama una relación en A y entre ellas se destacan las de orden y las de equivalencia. Sea ℜ una relación de A en B. Si la pareja (a, b) está en ℜ, también se puede denotar como aℜ b, y si no está, aℜ b. Si aℜ b se dice que a está en ℜ relacionado con b. El par ordenado (x, y) puede interpretarse como las coordenadas de un punto en el plano; inclusive, puede usarse esta idea para establecer una representación de tal par. En particular, ya que  es el conjunto de los números reales, se tiene:  ×  = {(x, y); x ∈ ∧ y ∈}  × , que también se denota como 2, resulta el conjunto de todas las parejas de números reales y su representación gráfica es el plano cartesiano (ver figura 1.1). Como se puede observar, existe una correspondencia biunívoca entre el producto cartesiano  ×  y el conjunto de puntos del plano, asociándose de esta forma el par ordenado (x, y) con el punto P(x, y).

27

1.5  Producto cartesiano

Ejemplo 1.5.1

Sean los conjuntos A = {1, 3}   y   B = {2, 4, 6}

y

P (x, y)

El producto cartesiano A × B es: A × B = {(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6)} y se ilustra en la figura 1.2. Ejemplo 1.5.2 x

Sean los conjuntos A = {x ∈  : 2 < x ≤ 4}  y  B = {y ∈ : −1 ≤ y < 1} Una representación gráfica de A × B se muestra en la figura 1.3. A × B es el conjunto de puntos interiores al rectángulo PQRS más los puntos que pertenecen a los segmentos QR y RS.

Figura 1.1  Representación del punto

P(x, y) en el plano cartesiano.

Ejemplo 1.5.3

Sean los conjuntos

6

A = {x ∈N : 1 ≤ x < 4}  y  B = {y ∈ : 1 ≤ y ≤ 5} La representación de A × B en el plano cartesiano se presenta en la figura 1.4. La definición de producto cartesiano puede generalizarse al producto entre n conjuntos mediante la función f de los índices en la unión de estos conjuntos. Así, si f :{1, 2}→ A1 ∪ A2 es tal que f (1) ∈A1 y f (2) ∈A2, la pareja (f (1), f (2)) es uno de los elementos del producto A1 × A2, de manera que este producto es el conjunto de todas esas funciones. Generalizando, el producto cartesiano entre los conjuntos

5 4 3 2 1 1

2

3

Figura 1.2  Representación de la relación

A × B.

A1, A2, A3, . . . es

×

que es el conjunto formado por todas las n-adas ordenadas (conjunto de las imágenes de cada f, ordenadas con el orden inducido por el correspondiente orden de los índices): f = (a1, a2, a3, . . . an); tales que ai ∈Ai, i = 1, 2, 3, . . ., n. Cada ai es f (i). Este producto cartesiano también se denota como A1 × A2 × . . . × An

o

An

Algunas propiedades del producto cartesiano i) ii) iii) iv) v)

A ⊂ X ∧ B ⊂ Y ⇔ A × B ⊂ X ×Y A× B = ∅ ⇔ A = ∅ ∨ B = ∅ A ≠ B ∧ A× B ≠ ∅ ⇒ A× B ≠ B × A A × (B ∩ C ) = ( A × B ) ∩ ( A ×C ) A × (B ∪ C ) = ( A × B ) ∪ ( A ×C )

P

1

−1

1

2 Q

S 3

4 R

Figura 1.3  Representación de la relación

A × B.

28

Unidad 1  Lógica y conjuntos

Se demuestran algunas y las demás se dejan como ejercicio al lector. ii)  ⇒ A × B = ∅ ⊢– A = ∅ ∨ B = ∅ Es decir, se supone A × B = ∅. Por demostrar A = ∅ ∨ B = ∅. Por reducción al absurdo, se supone lo contrario de lo que se quiere demostrar, es decir:

5 4 3

A ≠ ∅ ∧ B ≠ ∅

2

Entonces existen elementos a y b tales que

1

a ∈A ∧ b ∈B 1

2

3

en contradicción con la hipótesis de que A×B=∅

Figura 1.4  Representación de la relación

A × B.

(a, b) ∈A × B

Luego la pareja



A = ∅ ∨ B = ∅ ⊢– A × B = ∅ A×B≠∅

En contraposición,

∃ (a, b)

Por lo tanto, tal que,

(a, b) ∈A × B

es decir:

a ∈A y b ∈B A≠∅∧B≠∅

Entonces iv)  A × (B ∩ C) = (A × B) ∩ (A × C)

(x, y) ∈ A × (B ∩ C ) ⇔ x ∈ A ∧ y ∈B ∩ C ) x ∈ A ∧ y ∈ B ∩ C ⇔ x ∈ A ∧ (y ∈B ∧ y ∈C ) x ∈ A ∧ (y ∈ B ∧ y ∈C) ⇔ (x ∈ A ∧ y ∈B) ∧ (x ∈A ∧ y ∈C ) (x ∈ A ∧ y ∈ B) ∧ (x ∈ A ∧ y ∈C) ⇔ (x, y) ∈ A × B ∧ (x, y) ∈A × C (x, y) ∈ A × B ∧ (x, y) ∈ A × C ⇔ (x, y) ∈ (A × B) ∩ (A × C) Note que todos los conectivos anteriores si y sólo si, y por lo tanto, A × (B ∩ C) = (A × B) ∩ (A × C)

1.6  Suma y producto booleanos La diferencia simétrica de A y B es (A − B) ∪ (B − A), que es igual a (A ∪ B) − (A ∩ B) y se denota como A + B, que es la suma booleana de A y B. El producto booleano de A y B es la intersección de estos conjuntos: AB = (A ∩ B).

Una representación gráfica Si se representa una familia de conjuntos no vacíos en un plano (diagrama Venn-Euler) de manera que ilustre todas las regiones en las cuales pueda estar un elemento x, entonces cada región puede hacerse corresponder con los números, en notación binaria, que se obtienen de la tabla de “pertenencia” cuando ésta se construye en la forma ordenada que se usó para las tablas de verdad de las proposiciones. Por ejemplo, si A, B y C son conjuntos y las letras a, b, c representan las proposiciones x ∈A, x ∈B y x ∈C, respectivamente, se tiene la situación que se ilustra en la figura 1.5.

1.6  Suma y producto booleanos

A

B

6

4 5

2

7 3 1 C

0

a

b

c

Región

0

0

0

0

0

0

1

1

0

1

0

2

0

1

1

3

1

0

0

4

1

0

1

5

1

1

0

6

1

1

1

7

Figura 1.5  Diagrama de Venn-Euler y tabla asociada para tres conjuntos.

Cuando se usa este método, la suma y el producto booleanos quedan representados por las siguientes figuras (figuras 1.6 y 1.7). A

A + B = (A ∪ B) − (A ∩ B)

B a

b

(a ∨ b) ∧ ¬ (a ∧ b)

0

0

0

0

1

1

1

0

1

1

1

0

“en uno o en otro, pero no en ambos”

A+B

Figura 1.6  Diagrama de Venn-Euler y tabla asociada para la suma booleana.

A

AB = (A ∩ B)

B

AB

a

b

(a ∧ b)

0

0

0

0

1

0

1

0

0

1

1

1

“en ambos”

Figura 1.7  Diagrama de Venn-Euler y tabla asociada para el producto booleano.

 Teorema 1.6.1 La suma booleana: 1. 2. 3. 4.

Es asociativa Tiene elemento idéntico Cada elemento tiene inverso Es conmutativa

A + (B + C) = (A + B) + C igual al conjunto vacío, A + ∅ = A que es él mismo, A + A = ∅ (A + B) = B + A

El producto booleano: 5. Es asociativo 6. Es conmutativo 7. Tiene elemento idéntico 8. Se distribuye sobre la suma

A(BC) = (AB)C AB = BA que es el conjunto universal, AU = A A(B + C) = AB + AC 

29

30

Unidad 1  Lógica y conjuntos

Las observaciones anteriores muestran que los subconjuntos de un conjunto universal U, con la suma y el producto booleano, forman un anillo conmutativo con uno (como se verá más adelante). Como ilustración del resultado anterior se probarán las proposiciones 1 y 8. Para esto es conveniente recordar la forma en que se demostraron algunas proposiciones de lógica, es decir, construyendo las tablas de verdad correspondientes. La igualdad de las tablas mostrará la igualdad de los conjuntos que las proposiciones caracterizan. Sean A, B y C subconjuntos de U. Las letras a, b y c representan las proposiciones:

Entonces, Tabla 1.3  Comprobación de la propiedad asociativa de la suma booleana a

b

c

A+B

(A + B) + C

B+C

A + (B + C)

0

0

0

0

0

0

0

0

0

1

0

1

1

1

0

1

0

1

1

1

1

0

1

1

1

0

0

0

1

0

0

1

1

0

1

1

0

1

1

0

1

0

1

1

0

0

0

1

0

1

1

1

0

1

0

1

La igualdad de las columnas 5 y 7 prueba la afirmación del teorema correspondiente. Tabla 1.4  Comprobación de la propiedad distributiva del producto sobre la suma booleana a

b

c

B+C

A (B + C)

AB

AC

AB + AC

0

0

0

0

0

0

0

0

0

0

1

1

0

0

0

0

0

1

0

1

0

0

0

0

0

1

1

0

0

0

0

0

1

0

0

0

0

0

0

0

1

0

1

1

1

0

1

1

1

1

0

1

1

1

0

1

1

1

1

0

0

1

1

0

Note que las columnas 5 y 8 son iguales. Ejemplo 1.6.1

Sean A = {1, 2, 3} y B = {a, 1, b}; entonces:

A − B = {2, 3}

B − A = {a, b}

A ∪ B = {1, 2, 3, a, b}     A ∩ B = {1} De manera que A + B = {2, 3, a, b} = (A ∪ B) − (A ∩ B) = (A − B) ∪ (B − A) y AB = {1} = (A ∩ B).

1.7  Algunas demostraciones en la teoría de conjuntos

Ejemplo 1.6.2

Sean A = {m, n} y B = {1, m}; entonces:

A − B = {n}

B − A = {1}



A ∪ B = {1, m, n}

A ∩ B = {m}

De manera que A + B = {1, n} y AB = {m}.

1.7  Algunas demostraciones en la teoría de conjuntos Para demostrar proposiciones en la teoría de conjuntos usando la técnica de las tablas de verdad se requiere definir una relación entre las proposiciones de esta teoría y las correspondientes de la lógica matemática. De esta manera, sean A, B y C subconjuntos de U. Con las letras a, b, c y t y con el símbolo ∅ se definen las siguientes proposiciones: a:x∈A b:x ∈ B c:x ∈C t : x ∈U ∅:x ∈∅ Así, las operaciones con conjuntos quedarían definidas de la forma siguiente: Tabla 1.5  Relación entre las operaciones de la lógica y las de los conjuntos A=B A⊂B A∩B A∪B

¬a a↔b a→b a∧b a∨b

A−B

a ∧ ¬b

Ac

Ejemplo 1.7.1

( A ∩ B = A) ⇒ A ⊂ B a

b

a∧b



a



a→b

0 0 1 1

0 1 0 1

0 0 0 1

1 1 0 1

0 0 1 1

1 1 1 1

1 1 0 1

Ejemplo 1.7.2

( A ⊂ B ) ⇔ ( B c ⊂ Ac ) ⇔ ( A ∪ B = B ) a

b

¬a

¬b

a→b



¬b→¬a



(a ∨ b) ↔ b

0

0

1

1

1

1

1

1

1

0

1

1

0

1

1

1

1

1

1

0

0

1

0

1

0

1

0

1

1

0

0

1

1

1

1

1

31

32

Unidad 1  Lógica y conjuntos

Ejercicios 1.7

1.  ¿El conjunto (a, a) es igual al conjunto {{a}}? Explique. 2.  Encuentre en cada caso los valores de x y y que hacen verdaderas las siguientes igualdades:  x + y, 1  = 1, x − y )   ( 2 

( x + 2, y ) = ( 3 y, 2 x ) 3.  Demuestre las propiedades i), iii) y v) del producto cartesiano. 4.  Demuestre que (A × B) ∩ (C × D) = (A × D) ∩ (C × B). 5. ¿Cómo deben ser los conjuntos A y B para que en el conjunto A × B existan parejas cuyos dos componentes sean iguales? 6.  Demuestre que: a)  ( A ∪ B )c = Ac ∩ B c b)  ( A ∩ B )c = Ac ∪ B c

c)  ( A − B ) − C = A − ( B ∪ C ) d )  A ⊂ B ⇒ ([ A ∩ ( B ∩ C )] = [ ( A ∩ B ) ∩ C ])

1.8  El concepto de función Una función f del conjunto A en el conjunto B, que se denota f  : A → B, es una relación de A en B que satisface las condiciones siguientes: 1. ∀a ∈A , ∃b ∈ B∋ ( a, b ) ∈ f 2. (( a, b ) ∈ f ∧ (( a, c ) ∈ f )) → ( b = c )

Sea f una función de A en B. Los conjuntos A y B se llaman dominio y contradominio de f, respectivamente. Al conjunto de todas las segundas componentes de f se le llama rango de la función o imagen de A bajo f. El conjunto de todas las parejas —la función misma— es la gráfica de la función. Cuando el contradominio de f es el conjunto , se dice que la función es real, y si el dominio es un subconjunto de , es de variable real; por lo tanto, una función real de variable real es un conjunto de parejas de números reales que puede representarse en el plano cartesiano. A esta representación se le denomina dibujo de la gráfica f. Una manera de clasificar a las funciones es separarlas como: Inyectivas o “uno a uno”. Suprayectivas o “sobre”. Biyectivas o “uno a uno y sobre”, que se definen de la manera siguiente: Sea f una función de A en B. f es inyectiva si y sólo si f (a) = f (b) → a = b, o por contrapuesta a ≠ b → f (a) ≠ f (b), por lo cual se dice que las funciones inyectivas son las que mandan puntos distintos en puntos distintos. f es suprayectiva si y sólo si ∀b ∈B, ∃a ∈A∋ (a, b) ∈ f; es decir, si el rango de f es todo B. f es biyectiva si y sólo si es inyectiva y suprayectiva. Las funciones biyectivas se caracterizan por ser las únicas que tienen función inversa. Si g  : A → B y f  : B → C y si R(g) ⊆ D(f ) = B, entonces la función compuesta f ° g es la función de A a C definida por [f ° g](x) = f (g(x)) para toda x ∈A. Si f : A → B es una biyección de A sobre B, entonces g = {(b, a) ∈ B × A; (a, b) ∈ f } es una función de B en A. Esta función se denomina función inversa de f y se denota por f −1; con objeto de no confundirla con la expresión 1/f, se suele usar f * para representarla. Cuando la función inversa existe, las composiciones f ° g y g ° f son posibles y cada una de ellas resulta ser la identidad en su dominio. f ° g es la identidad en B y g ° f en A. La relación entre f y su inversa f −1 se caracteriza por b = f (a) si y sólo si a = f −1(b).

1.8  El concepto de función

Álgebra de funciones Las funciones que se considerarán en esta sección son funciones reales de variable real. Sean f : Df → , g  : Dg →  funciones reales y c una constante. Se define: 1. Multiplicación por un escalar

[c · f ] ( x ) = c · f ( x )

2. Suma 3. Resta 4. Multiplicación

Dc ⋅ f = D f

[ f + g ] ( x ) = f ( x ) + g ( x ) D f + g = D f ∩ Dg [ f − g ] ( x ) = f ( x ) − g ( x ) D f − g = D f ∩ Dg

[f

· g ] ( x ) = f ( x ) · g ( x ) D f · g = D f ∩ Dg

5. División 6. Composición

[ f / g ] ( x ) = f ( x ) / g ( x ) D f / g = D f ∩ Dg cuando g ( x ) ≠ 0, ∀x ∈Dg [ f  g ] ( x ) = f ( g ( x )) cuando R ( g ) ⊆ D f

D f  g = Dg

Ejercicios 1.8 1. De una encuesta a 60 personas, 30 de ellas respondieron que habían utilizado camión para

transportarse ese día, 15 dijeron que habían utilizado el tren subterráneo y 20 manifestaron que no utilizaron tren ni camión. ¿Cuántos utilizaron camión y tren ese día? ¿Cuántos utilizaron camión o tren? 2. Al verificar la inscripción de 537 alumnos en una escuela se encontró que 224 de ellos estaban inscritos en cálculo, 97 en álgebra y 250 en física; 200 no cursaban ninguna de esas tres asignaturas y sólo 20 llevaban las tres. 30 llevaban álgebra y física, pero no cálculo. Estudian física sólo 51. ¿Cuántos alumnos llevan cálculo y física? ¿Cuántos llevan cálculo y física, pero no álgebra? 3. Sea A = {a, b, c, d}. Defina una partición para A y encuentre la relación de equivalencia que induce. 4. Se define en  la congruencia módulo 5 de la manera siguiente: n ≡ m (5) si y sólo si m − n es un múltiplo de 5 (5 divide a m − n) Demuestre que la relación es de equivalencia y encuentre la partición que induce. 5. Sea A = {{a}, {b}, {c}, {a, b}, {b, c}, {d, e, f}} ordenado por contención. Encuentre: i) El mayor iii) Máximos y mínimos ii) El menor iv) Una cadena ¿O algunos no existen? (Ver anexo 4). 6. Sean f = {(1, 0), (2, 1), (3, 2), (4, 3)} y g = {(0, 0), (1, 1), (2, 4), (3, 9)}. Exprese los conjuntos que representan las siguientes operaciones: f + g, f − g, f ⋅ g, f / g, f  g y g  f 2 7. Si f (x) = x + 1 y g ( x ) = x , determine las expresiones para las funciones f ° g y g ° f. 8. Si f (x) = x2 − 1, obtenga h(x) = f 2 (x) + 3f (x). 9. Sean f y g funciones inyectivas,

. Demuestre que g ° f es inyectiva.

33



Unidad

2.1 Sistemas de ecuaciones lineales •  Introducción 2.2 Matrices •  Igualdad de matrices •  Algunos tipos de matrices •  Operaciones con matrices •  Operaciones elementales en los renglones •  Sistemas de ecuaciones lineales •  Cómo seleccionar los parámetros •  Aplicaciones de los sistemas de ecuaciones •  Representación generalizada •  Balanceo de ecuaciones químicas. Método algebraico •  Ejemplos de balanceo de reacciones químicas 2.3  Análisis dimensional •  Dimensión •  Método de Rayleigh •  Método de Buckingham 2.4 Determinantes •  Cálculo de determinantes

, lineales aciones s de ecu inantes Sistema y determ matrices

2

35

36

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

2.1  Sistemas de ecuaciones lineales Introducción El modelado de un buen número de problemas que dependen de más de una variable no puede conseguirse con una sola ecuación. En estos casos deben considerarse diferentes condiciones que el problema debe satisfacer de manera simultánea, lo que da origen a una colección de ecuaciones que constituyen los llamados sistemas de ecuaciones. A continuación se propone una serie de problemas cuya solución se obtiene al resolver un sistema de ecuaciones que, por contener solamente términos constantes o algebraicos de grado uno, se conocen como ecuaciones lineales. Se discute sólo la solución de los dos primeros.

Problema 2.1.1

Dos veces la edad de Juan más cuatro veces la edad de Lucía suman 40 años. ¿Cuáles son las edades de cada uno?

Problema 2.1.2

Dos veces la edad de Juan más cuatro veces la edad de Lucía suman 40 años, y cuatro veces la edad de Juan menos la edad de Lucía es igual a 35 años. ¿Cuántos años tiene cada uno?

Problema 2.1.3

Si en el problema anterior se añade la condición de que la edad de Juan más la edad de Lucía es 20, ¿cuáles son las edades de cada uno?

Problema 2.1.4

Hay dos cajas: una blanca y otra verde; en cada caja hay bolsitas que tienen letras de madera. En la caja blanca cada bolsita tiene exclusivamente una letra a y dos letras b. Cada bolsita de la caja verde tiene una letra c y dos letras b nada más. Se desea formar dos tipos de bolsas; las primeras deben tener una letra a y cuatro letras b; las segundas, dos letras c y dos b. ¿Cuál es el mínimo número de bolsitas de la caja blanca y la verde para formar, al menos, una de cada una de las bolsas con las características deseadas? Y con ese mínimo, ¿cuántas se obtienen de cada tipo?

Problema 2.1.5

Sean A = LT−1, B = ML−1 T−1, C = ML−3, D = L2 T−1, E = LT−2, F = L monomios. ¿A qué potencias a, b, c, d, e, f se deberán elevar A, B, C, D, E, F, respectivamente, para que el producto de ellos sea L0 M0 T0? ¿Esa solución es única?

Problema 2.1.6

F es una mezcla formada por las sustancias A, B y C. La fracción, en peso, de cada una de ellas es 0.1, 0.5 y 0.4, respectivamente. Una descomposición de F genera dos porciones, una V y otra L. Las fracciones de A, B y C en V son 0.5, 0.2, 0.3, y las correspondientes en L son 0.6, 0.3, 0.1. Si  F = 100, ¿cuánto se obtendrá de V y L?

Planteamiento y solución del problema 2.1.1 Sea J la edad, en años, de Juan, y L la de Lucía. Simbólicamente, el problema queda planteado así: 2J + 4L = 40 Se dice que una expresión de este estilo es una ecuación lineal con coeficientes reales en las incógnitas J y L. Una solución para ella es una pareja de números (s1, s2) tal que, al sustituirlos en la ecuación, la satisfacen. Es decir, 2s1 + 4s2 = 40. Por ejemplo, J = 10, L = 5 es una solución particular, ya que 2 (10) + 4 (5) = 40. Diofanto de Alejandría (200-284 d.C.) Se dice entonces que la pareja (10, 5) satisface la ecuación. Matemático griego considerado por Por otro lado, si L = α y se despeja J en términos de L, se tiene que J = (40 − algunos como el padre del álgebra. 4 α )/2. Así, resulta lo que se llama la solución general de la ecuación. Ejerció una influencia muy notable Observe que si α es un número entero, las soluciones son parejas de números tanto sobre el desarrollo del álgebra enteros (las ecuaciones con coeficientes enteros, de las que se pide que las soluciocomo en la teoría de números. nes sean enteras, se conocen como ecuaciones de Diofanto o diofantinas).

2.1  Sistemas de ecuaciones lineales

La solución general se puede expresar de la siguiente manera: [J, L] = [20 − 2α, α] con α ∈  o bien [J, L] = [20, 0] + α[−2, 1] con α ∈  Note que las representaciones anteriores son un arreglo rectangular de elementos. Este tipo de arreglos se conocen como matrices, y su igualdad, así como sus operaciones —suma, multiplicación por un escalar (elemento de un campo K) y multiplicación— se definen, en este caso particular, como sigue: 1. [a, b] = [c, d] ⇔ a = c ∧ b = d 2. [a, b] + [c, d] = [a + c, b + d] 3. α[a, b] = [αa, αb]

c  d 

4. [a, b]   = [ac + bd] = ac + bd 1

Las definiciones generales se darán más adelante. De acuerdo con el inciso 4, la ecuación 2J + 4L = 40 también se podrá representar en la forma siguiente: J  [ 2 4 ]   = [ 40 ] L Una manera cómoda de ilustrar esta multiplicación (de matrices) es: J  L   [2 4]

[2J +4L ]

Observe que la matriz resultante tiene el número de renglones de la matriz izquierda y tantas columnas como las de la matriz derecha. Esto no es casual. En efecto, para poder multiplicar matrices es necesario que el número de columnas de la matriz de la izquierda sea igual al número de renglones de la matriz de la derecha. Cuando se multiplica una matriz m × n (m renglones y n columnas) por otra n × k, el resultado es una matriz m × k. A continuación se ilustra la multiplicación de una matriz 2 × 2 por una 2 × 3 (el resultado es una matriz 2 × 3). 3 −1 2 0 4 1   1 2 3 7 4 0 1 0 4 1     En general, x p 

y q

z  r  a b  ax + bp ay + bq az + br c d  cx + dp cy + dq cz + dr      La matriz A se puede representar en la forma A = (aij ), en donde aij representa al elemento que está en el i-ésimo renglón y la j-ésima columna. Por ejemplo, los elementos a21, a23 y el a11 de la matriz 3 7 4   0 4 1  son 0, 1 y 3, respectivamente. 1

Cuando una matriz consta de un solo elemento, se identifica con ese elemento; por ejemplo, [5] = 5.

37

38

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Como se verá más adelante, cuando se haya definido el producto punto de vectores, el producto de matrices se puede definir de la siguiente manera: Sean A = (aij ) una matriz m × n con renglones Ai i = 1,, m, y B = (bij ) una matriz n × p con columnas B j j = 1,, p. Entonces, AB = (cij ) es la matriz m × p tal que cij = Ai · B j.

Planteamiento y solución del problema 2.1.2 Nuevamente, sea J los años que tiene Juan y L los que tiene Lucía. El problema se establece de la siguiente manera: 2J + 4L = 40 (2.1.1) 4J − 1L = 35 (2.1.2) expresión que se conoce como un sistema de dos ecuaciones con coeficientes reales en las incógnitas J y L. Un procedimiento de solución es éste: si se resta a la ecuación 2.1.2 el doble de la ecuación 2.1.1, el sistema se transforma en

2J + 4L = 40 −9L = − 45

(2.1.1) (2.1.2′)

De la nueva ecuación (2.1.2′) se puede ver que L = 5. Si este valor se sustituye en la ecuación 2.1.1, resulta

2J + 4(5) = 40

de donde se obtiene J = 10. La solución al problema es (J, L) = (10, 5), que en este caso es única. El arreglo de los coeficientes de las incógnitas se llama matriz del sistema o matriz de coeficientes, que para el problema 2.1.2 es 2 4    4 −1 40 Y si se le añaden, como columna, los términos independientes  , se obtiene la matriz 35 aumentada 2 4 40   4 −1 35 La multiplicación de matrices ilustrada previamente permite expresar el sistema anterior en la forma matricial 2 4   J  40   =    4 −1 L  35 En efecto, ya que J  L   2 4   2J +4L  4 −1 4J − 1L     esta expresión matricial representa el sistema 2J + 4L = 40 4J − L = 35

2.1  Sistemas de ecuaciones lineales

que es de la forma a11x1 + a12 x2 a21x1 + a22 x2

= b1       (*) = b2

a11 a12  donde la matriz del sistema es   y la matriz aumentada es a21 a22 

a11 a12 b1   . a21 a22 b2 

El sistema (*) se puede representar en forma matricial de la siguiente manera: a11 a12   x1   b1     =   a21 a22  x2  b2  ya que

a11  a21

 x1    x2   b1  a12   a11x1+a12 x2   =    a22  a21x1+a22 x2  b2 

El sistema (*) se resuelve de manera análoga al problema 2.1.2. El término a21x1 se elimina de la ecuación 2.1.2 multiplicando la ecuación 2.1.1 por −a21 y la ecuación 2.1.2 por a11 , y luego sumando el resultado de la ecuación 2.1.1 al de la ecuación 2.1.2. Es decir, − a21a11x1 + − a21a12 x2 a11a21x1 + a11a22 x2 − a21a12 x2

y sumando

a11a22 x2

se factoriza

x2 : a11a22 − a21a12 x2

Si

(

)

= − a21b1 = a11b2 = a11b2 − a21b1 = a11b2 − a21b1

a11a22 − a21a12 ≠ 0, entonces x2 = (a11b2 − a21b1 ) (a11a22 − a21a12 )

Análogamente, eliminando x2 del sistema se obtiene x1 = (a22 b1 − a12 b2 ) (a11a22 − a21a12 ). Como puede notarse, el denominador de x1 y de x2 está formado por los elementos de la matriz del sistema. Es el número a11a22 − a21a12 y se denota por Δ, Δ(A), •A•, D(A) o det (A). Este número se llama determinante, ya que determina la naturaleza del conjunto de soluciones. Para diferenciar la matriz (un arreglo) del determinante de la matriz (un escalar) se usan barras en lugar de corchetes o paréntesis. Así, a11 a12  a11 a12 si A =  = a11 a22 − a21 a12  , entonces Δ(A) = a21 a22 a21 a22  Note lo siguiente: 1 0 =1 0 1

αa11 a12 = α a11a22 − α a21a12 = α (a11a22 − a21a12 ) = α ∆ αa21 a22 a11 αa12 = a11α a22 − a21α a12 = α (a11a22 − a21a12 ) = α ∆ a21 αa22 ′ a12 a11 + a11 ′ a22 − a21 ′ a12 ) = ∆ + ∆′ ′ ) a22 − (a21 + a2′ 1 ) a12 = (a11a22 − a21a12 ) + (a11 = (a11 + a11 ′ a22 a21 + a21

39

40

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

′ a11 a12 + a12 ′ ) = (a11a22 − a21a12 ) + (a11a22 ′ − a21a12 ′ ) = ∆ + ∆′ ′ ) − a21 (a12 + a12 = a11 (a22 + a22 ′ a21 a22 + a22 Trate de contestar las siguientes preguntas: 1. ¿Todo sistema de ecuaciones lineales tiene solución? 2. Si un sistema tiene solución, ¿la solución es única o tiene muchas soluciones? 3. ¿Dos matrices cualesquiera se pueden sumar? 4. ¿Dos matrices cualesquiera se pueden multiplicar? 5. Dada la matriz A, ¿habrá alguna matriz B tal que A × B = I? 6. Dada la matriz A, ¿habrá alguna matriz B tal que B × A = I? 7. Sea B la matriz que resulta de intercambiar renglones por columnas de una matriz A. ¿Cuán-

do B es igual con A? ¿Cuándo A = −B?

8. ¿Toda matriz tiene determinante?

Una ecuación lineal puede tener:   i) una solución   ii) un número infinito de soluciones iii) ninguna solución En los primeros dos casos se dice que la ecuación es consistente y en el último que es inconsistente. La expresión (a2 − 1)x = a + 1 permite ilustrar los tres casos anteriores dando valores adecuados a la a. Así, 1. Si a = 1, la ecuación no tiene solución. 2. Si a = −1, la ecuación tiene un número infinito de soluciones. 3. Si a no es 1 ni −1, la ecuación tiene solución única.

Las ecuaciones lineales se pueden resolver despejando cualquiera de las variables cuyo coeficiente sea distinto de cero. Algunas veces a ésta se le llama variable delantera y, en ese caso, a las demás, variables libres. Siempre que una ecuación tenga variables libres, tiene un número infinito de soluciones. El conjunto de todas las soluciones se denomina conjunto solución, y la solución general es la, condición que define al conjunto solución. En el problema 2.1.1, el conjunto solución es [J , L] ∈  2 ; [J , L] = [20, 0] + α[−2,1], α ∈  .   La solución general es [J, L] = [20, 0] + α[−2, 1] con α ε .

{

}

Ejercicios 2.1 1. Escriba las ecuaciones siguientes en la forma general ax + by + cz = d, en los casos en que sea

posible.

  i) Para cada una escriba sus coeficientes y su término constante.   ii) Diga cuál es la variable delantera y cuáles son las variables libres. iii) Determine la solución general de cada una y, si es posible, dos particulares.

1. 2. 3. 4. 5.

4x −3−x = 3x + 2y + 3 5x + 2y − x = x + 2y − 6 2 + 5x + 7y − 7x = 2 x + y + z = 6 + y xy +3z = x − y ... ¿se puede?

2. Encuentre todos los valores reales de s, tales que cada una de las siguientes ecuaciones tenga

a) un número infinito de soluciones, o b) ninguna solución.

i) 2s(x + y) − 9x − 9y − s + 3 = 0 ii) sx − 5y − s + 5 + sy − 5x = 0

2.2 Matrices

2.2 Matrices Definición 2.2.1 Una matriz A de m × n sobre un campo K es un arreglo rectangular de m × n elementos aij ∈K en m renglones y n columnas, con i = 1, 2, …, m y j = 1, 2, …, n.  a11 a12  a a22 A =  21     am1 am 2

 a1n    a2 n       amn 

Ejemplo 2.2.1

1

2

0

−2

2

3

−1

1

1

0

3

5

−1

1

0

2

Esta matriz es de 4 × 4 y tiene (4)(4) = 16 elementos. Ejemplo 2.2.2

1

2

0

−2

Esta es una matriz de 1 × 4 y tiene cuatro elementos. Ejemplo 2.2.3

1 2 1 −1 Esta es una matriz de 4 × 1 y tiene cuatro elementos. Los renglones de la matriz A de m × n se denotarán como A1, A2, ..., Am y sus columnas como A1, A2 ,…, An . 

Ejemplo 2.2.4

1 0  Si A = 0 1 1 2

−1  2, entonces 4 

A1 = [1 0 −1] , A2 = [0 1 2] y A3 = [1 2 4] 1 0 −1   A = 0,, A2 = 1 , A3 =  2  ,      a23 = 2,    a = 1 31 1 2   4     1

41

42

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se llamará Mm × n(K), o simplemente Mm × n, al conjunto de las matrices de m × n sobre el campo 𝕂.

Igualdad de matrices Dos matrices son iguales si tienen el mismo tamaño (igual número de renglones en cada una y el mismo número de columnas en cada una) y sus elementos correspondientes son iguales. Es decir:

Definición 2.2.2 Dos matrices A, B ∈ Mm × n son iguales si y sólo si ∀ i, j, aij = bij .

Algunos tipos de matrices Definición 2.2.3 Sea A ∈ Mm × n. Se dice que A es una matriz cuadrada si y sólo si n = m. Ejemplo 2.2.5

2

3

1

5

Una matriz diagonal es una matriz cuadrada en la que los elementos distintos de a11, a22, …, ann son cero. Formalmente:

Definición 2.2.4 Sea A ∈ Mm × n. Se dice que A es una matriz diagonal si y sólo si ∀i ≠ j, aij = 0.

Ejemplo 2.2.6

A=

1

0

0

0

0

3

0

0

0

0

3

0

0

0

0

2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

Ejemplo 2.2.7

B=

Una matriz triangular superior es una matriz cuadrada en la que los elementos que están abajo de la diagonal son cero.

2.2 Matrices

Definición 2.2.5 Sea A ∈ Mm × n. Se dice que A es una matriz triangular superior si y sólo si ∀ i > j, aij = 0.

Ejemplo 2.2.8

A=

1

2

0

3 −1

0 −2 1

0

0

3

5

0

0

0

2

Una matriz triangular inferior es una matriz cuadrada en la que los elementos que están arriba de la diagonal son cero.

Definición 2.2.6 Sea A ∈ Mm × n. Se dice que A es una matriz triangular inferior si y sólo si ∀ j > i, aij = 0.

Ejemplo 2.2.9

1

0

0

0

2

3

0

0

1

0

3

0

−1

1

0

2

A=

Cuando los renglones de una matriz A se intercambian con sus columnas, se obtiene la transpuesta de A, que se denota por At.

Definición 2.2.7 Sea A ∈ Mm × n. La transpuesta de A, denotada por At, es la matriz B ∈ Mn × m de elementos bij, tales que bij = aji.

Ejemplo 2.2.10

A=

1

2

0

2

3

1

1

0

3

1

1

0

At

1

2

1

1

= 2

3

0

1

0

1

3

0

Definición 2.2.8 Sea A ∈ Mn × n. Se dice que A es una matriz simétrica si y sólo si A = At.

43

44

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Ejemplo 2.2.11

A=

1

2

1

−2

2

3

0

1

1

0

3

0

−2

1

0

2

1

2

1

−2

2

3

0

1

1

0

3

0

−2

1

0

2

At =

Definición 2.2.9 Sea A ∈ Mn × n. Se dice que A es una matriz antisimétrica si y sólo si At = −A. Ejemplo 2.2.12

A=

0

−2

1

−2

2

0

2

5

−1

−2

0

−3

2

−5

3

0

At =

0

2

−1

2

−2

0

−2

−5

1

2

0

3

−2

5

−3

0

= −A

Operaciones con matrices La multiplicación de una matriz por un escalar se lleva a cabo multiplicando cada elemento de la matriz por el escalar.

Definición 2.2.10 Sea A ∈ Mm × n. La multiplicación de la matriz A por un escalar α se denota por αA y se define como la matriz B ∈ Mm × n, tal que si A = (aij), entonces B = α A = (α aij).

Ejemplo 2.1.13

1 0 −1 3 0 −3     3 0 1 2 = 0 3 6 1 2 4  3 6 12  Dadas dos matrices del mismo tamaño, la suma de ellas se realiza elemento a elemento. Formalmente:

Definición 2.2.11 Sean A, B ∈ Mm × n. La suma de las matrices A y B se denota por A + B y se define como la matriz C ∈ Mm × n de elementos cij, tales que cij = aij + bij Ejemplo 2.2.14

1 0 −1 2 1 −3 3 1 −4       0 1 2 + 1 3 1 = 1 4 3 1 2 4 3 6 1 4 8 5 

2.2 Matrices

Para multiplicar dos matrices A y B es necesario que el número de columnas de A sea igual al número de renglones de B. La matriz resultante, C, tendrá el número de renglones de A y el número de columnas de B. Así, el elemento cij de C = AB se obtiene de la operación Ai · B j.

Definición 2.2.12 Sean A ∈ Mm × p y B ∈ Mp × n. El producto de las matrices A y B, que se denota por AB, se define como la matriz C ∈ Mm × n de elementos cij, tales que p

cij = Ai · B j = ∑ aik bkj k =1

Ejemplo 2.2.15

 1 2    0 1 −1 0 _______________________________ ___________ __________  1 2 –1  2 4  0 −3 2  −2 −3     −2 5 0  −2 1      1  1 0  0 2

Definición 2.2.13 Sea A ∈ Mm × n y Ai el i-ésimo renglón de A. El orden de Ai se denota por Or(Ai) y se define como min{ j ; aij ≠ 0, j = 1, 2,..., n}, si Ai ≠ 0 Or( Ai ) =  n + i , si Ai = 0  Ejemplo 2.2.16

1  0 Sea A =  0  0

0 −2  3 −1 1  0 0 5  0 0 0 

2

Or(A1) = 1, Or(A2) = 2, Or(A3) = 4, Or(A4) = 8

Definición 2.2.14 Se dice que A ∈ Mm × n está escalonada por renglones si ∀ i, k, i < k → Or(Ai) < Or(Ak) Ejemplo 2.2.17

A=

1

2

0

−2

0

3

−1

1

0

0

0

5

0

0

0

0

45

46

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

A está escalonada porque Or(A1) = 1 Or(A2) = 2 Or(A3) = 4 Or(A4) = 8 Ejemplo 2.2.18

A=

1

2

0

−2

0

0

−1

1

0

0

0

5

0

2

0

0

A no está escalonada porque Or(A3) > Or(A4): Or(A1) = 1 Or(A2) = 3 Or(A3) = 4 Or(A4) = 2

Definición 2.2.15 Si el orden de Ai es j, el elemento aij se llama elemento principal o pivote (o delantero) de Ai (los renglones cero no tienen pivote). Si en una matriz escalonada todos los renglones distintos de cero tienen pivote igual a uno y, además, en la columna de cada pivote todos los otros elementos son cero, se dice que la matriz está escalonada en forma reducida o que tiene forma de escalón reducido.

Ejemplo 2.2.19

A=

1

0

1

0

0

1

2

0

0

0

0

1

0

0

0

0

A tiene forma de escalón reducido.

Operaciones elementales en los renglones Definición 2.2.16 Son operaciones elementales en los renglones de una matriz las siguientes: Intercambio de dos renglones Ai ↔ Aj Multiplicación de un renglón por un escalar distinto de cero aAi → Ai, a ≠ 0 Sumar un múltiplo de un renglón a otro aAi + Aj → Aj

Definición 2.2.17 Se dice que dos matrices A y B son equivalentes por renglones (lo que se denota por A ∼ B) si y sólo si una de ellas se obtiene a partir de la otra mediante un número finito de operaciones elementales por renglones.

2.2 Matrices

Ejemplo 2.2.20

Si

A=

2

0

3

1

1

0

3

5

1

2

0

−2

1

2

0

−2

2

3

−1

1

3

5

−1

−1

1

0

3

5

2

0

3

1

−1

1

0

2

−3

3

0

6

y

B=

entonces A ∼ B, ya que B5 = 3A5, B4 = A1, B1 = A4, B3 = A3 + A2.

Definición 2.2.18 El rango de una matriz A ∈ Mm × n, denotado por r, es el número de renglones no cero de una matriz equivalente a A, que está en forma escalonada.2 Ejemplo 2.2.21

A=

1

2

0

−2

0

3

−1

1

0

0

0

5

0

0

0

0

Dado que A está en la forma escalonada y su número de renglones distintos de cero es 3, entonces su rango es 3.

Sistemas de ecuaciones lineales Definición 2.2.19 Una ecuación lineal sobre el campo K en las variables x1, x2, ..., xn es una expresión de la forma a1 x1 + a2 x2 + ⋅ ⋅ ⋅ + an xn = b, donde a1, a2, ..., an, b ∈ K, y las variables están restringidas a tomar valores en K. Si b = 0, se llama ecuación lineal homogénea; y si b ≠ 0, se conoce como ecuación lineal no homogénea. Ejemplo 2.2.22

La ecuación x1 + x2 = 2 no es homogénea.

Definición 2.2.20 Un sistema de m × n ecuaciones lineales sobre el campo K es una colección de m ecuaciones lineales con n variables sobre K, es decir, a11 x1 + a12 x2 + ⋅ ⋅ ⋅ + a1n xn = b1 a21 x1+ a22 x2+ ⋅ ⋅ ⋅ + a2n xn = b2 ∙ am1 x1+ am2 x2+ ⋅ ⋅ ⋅ + amn xn = bm

2

En álgebra lineal se define el rango de una matriz como la dimensión del espacio generado por los renglones, que es igual que la dimensión del espacio generado por las columnas. Las tres definiciones son equivalentes.

47

48

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Ejemplo 2.2.23

x1 − 2x1 +

x2 x2

= 1 = 0

x1 + x2 = 1 −x1 + 2x2 = 0 x1 − x2 = 1 x1 − 3x2 − 2x1 + x2 +



x3 x3

= 1 = 2

Si todos los términos bi para i = 1, 2, 3, … m son cero, se tiene un sistema de ecuaciones lineales homogéneo; de lo contrario, se trata de un sistema de ecuaciones lineales no homogéneo. Del mismo modo que las ecuaciones lineales, los sistemas de ecuaciones lineales pueden tener: i) solución única, ii) un número infinito de soluciones (en estos dos casos se dice que el sistema es consistente), iii) ninguna (en este último caso se dice que el sistema es inconsistente). Los sistemas lineales homogéneos siempre tienen la solución cero (o trivial, cuando todas las variables son iguales a cero), o bien un número infinito de soluciones.

x

x y



x y

    

y − x = 0  y+x=4

y

    

x − y = 3  3x + 3y = 9

y + x = 3  y+x=1

a)  Solución única (2, 2)       b)  Un número infinito de soluciones      c)  Ninguna solución Los sistemas de ecuaciones lineales pueden expresarse en forma matricial como a11

a12



a1n

x1

=

b1

a21

a22



a2n

x2

=

b2







xn

=

bm

∙ …

am1 am2

amn



A

X

o en forma simbólica como AX = b. Ejemplo 2.2.24

El sistema x2 x2

= 1 = 0

1 −1  x 1 2 1  x    2

 1 =   0

x1 − 2x1 + se puede expresar como

b

2.2 Matrices

A se conoce como la matriz del sistema o matriz de coeficientes. Al adjuntar el vector b a la matriz A se construye lo que se conoce como matriz aumentada. Así, la matriz del sistema es a  11 a A =  21   a  m1

a m2

a1n    a2 n       amm 

a12



a

 a

a a

12 22





y la matriz aumentada  a11   a [ A | b ] =  21   a  m1

a

22

 m2

a1n 2n

  a  mn

b1   b  2    bm  

Ejemplo 2.2.25

Las matrices 1  1 1 1  1     − 1 2  y −1 2 0   1 −1  1 −1 1 son la matriz de coeficientes y la matriz aumentada del sistema x1 −x1 x1

+ x2 + 2x2 − x2

= 1 = 0 = 1

Definición 2.2.21  s1  s  2 S=      sn 

Se dice que

donde s1, s2, ..., sn ∈ K es una solución del sistema de ecuaciones lineales si y sólo si la colección de las si (el vector S) satisface cada una de las ecuaciones. Es decir que, para cada i (i = 1, 2, …, m), ai1 s1+ ai2 s2 + ⋅ ⋅ ⋅ + ain sn = bi En forma matricial, S es solución si y sólo si AS = b. Ejemplo 2.2.26

S= es una solución al sistema x1 2x1

− x2 + x2

2 1 = 1 = 5

49

50

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

ya que 2 − 1 2(2) + 1

= 1 = 5

En forma matricial, 2   1

1 −1 2 1 2 1  1 = 5  1 1 −1 1 · 2 − 1 · 1          =  2 1 2 · 2 + 1 · 1 5

Definición 2.2.22 Dos sistemas de ecuaciones lineales, con las mismas variables, son equivalentes si y sólo si tienen el mismo conjunto solución.3

Ejemplo 2.2.27

y

x1 − 2x1 +

x2 = 1 x2 = 5

x1 −

x2 = 1 x2 = 1

son equivalentes, ya que tienen la misma solución (2, 1). 2 S=   1 En efecto, 2 2(2)

− 1 + 1

= 1 = 5

y 2

− 1 1

= 1 = 1

y ambos sistemas tienen solución única. El rango de la matriz aumentada [A|b] se denota como r(A|b). El sistema de ecuaciones AX = b tiene solución si y sólo si el rango de la matriz del sistema es igual al rango de la matriz aumentada, es decir, r = r(A|b). En efecto, el sistema Ax = b de m ecuaciones tiene solución si y sólo si el vector b de constantes es una combinación lineal de las columnas de la matriz del sistema, lo que sucede si y sólo si b es una combinación lineal de las columnas, lo que implica que el espacio que generan las columnas es igual al generado por las columnas más el vector de constantes, lo que ocurre si y sólo si el rango de la matriz del sistema es igual con el rango de la matriz aumentada.

3

Esta definición es equivalente a la que se dio en términos de operaciones elementales.

2.2 Matrices

Definición 2.2.23 Sea Ax = b un sistema de m ecuaciones que tiene solución. Entonces, los grados de libertad (o número de parámetros de la solución) se definen como GL = n − r, donde GL = grados de libertad, n = número de incógnitas y r = rango de la matriz A. La siguiente matriz está escalonada:  1 1 0 1   0 1 1 2 0 0 1 3   r = 3 y r(A|b) = 3 Como los rangos son iguales, el sistema tiene solución y los grados de libertad son GL = n − r = 3 − 3 = 0 (la solución del sistema es única). La siguiente matriz está escalonada: 1 0  0  0

1 1 0 0

2 1 0 0

0 1 1 −1 1 3  0 0

Aquí, r = 3 y r(A|b) = 3. Como los rangos de las matrices del sistema y la aumentada son iguales, el sistema tiene solución y los grados de libertad (o número de parámetros) son GL = n − r = 4 −3 = 1 (el sistema tiene un número infinito de soluciones que dependen del valor que se asigne al parámetro). La siguiente matriz está escalonada:  1 1 0 1   0 1 1 2 0 0 0 3  

En este caso, r = 2 y r(A|b) = 3. Puesto que los rangos no son iguales, el sistema no tiene solución. Como ya se dijo, otra forma de representar el sistema de ecuaciones es expresar el vector b en la forma siguiente:  a1n   b1   a12   a11          a2 n   b2  a21  a22     = + ... + xn + x2 x1                    amn  bm  am 2  am1  Ejemplo 2.2.28

El sistema de ecuaciones lineales x1 + −x1 + x1 −

x2 = 1 2x2 = 0 x2 = 1

se puede expresar en forma vectorial



 1 1  1       x1 −1 + x2  2 = 0 −1 1  1



51

52

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se desea resolver el sistema de ecuaciones y 2x − 4 y −x + 2 y x − 2y

+ + − +

z 4 z + 6w 2 z − 2w 2 z + 3w

= 1 = 2 = −2 = 1

Método de Gauss (eliminación gaussiana) 1. Obtenga la matriz aumentada del sistema

1 0 0 1  2 −4 4 6  −1 2 −2 −2  3  1 −2 2

1 2  −2  1 

2. Aplique operaciones elementales con renglones para obtener su forma de escalón reducido

1 0 1  0 1  2 −4 4 6 2   1    R → R2 … −1 2 −2 −2 −2 2 2   2 3 1  1 −2

1 0 1  0 1  1 −2 2 3 1 ,  −1 2 −2 −2 −2   2 3 1  1 −2

2 3 1 1 0 1  1 −2  0 1  0 1  1 −2 2  3 1 1 0 1 ,   R1 ↔ R2 …  −1 2 −2 −2 −2 −1 2 −2 −2 −2     2 3 1 2 3 1  1 −2  1 −2 1 −2 2 3 1  1 −2   0 1  1 1 0 1 R + R → R … 0  1 3 3 0 −1 2 −2 −2 −2 0    2 3 1 1 −2  1 −2 1 −2 0 1  0 0  1 −2

2 1 0 2

2 1 0 2

3 0 1 3

1 1 , −1  1

3 1 1 −2 2 3 1  0 1 −R + R → R … 0 1 1 0 1 1 4 4 0 1 −1 0 0 1 −1    3 1 0 0 0 0 0

3. En la última matriz calcule el rango de la matriz del sistema y de la matriz aumentada (en

ambas hay tres renglones distintos de cero); por lo tanto, r = 3 y r(A|b) = 3 y entonces el sistema tiene solución. 4. Calcule los grados de libertad

GL = 4 − 3 = 1 5. Observe que el resultado anterior indica que existe una variable a la que se le puede asignar

un valor arbitrario. 6. Identifique la variable (parámetro) a la que se asignarán valores arbitrarios.

2.2 Matrices

53

Cómo seleccionar los parámetros De cada renglón de la matriz aumentada, que ya esté en forma escalonada, se marcan los primeros elementos de cada renglón distintos de cero, de izquierda a derecha. En este caso son los elementos a11, a22 y a34. 1  0  0 0 

−2 2 1

1

0 0

0 0

1  0 1  1 −1 0 0 3

El parámetro (α) corresponde con la variable libre asociada a la columna que no tiene elementos marcados (que no es pivote o variable delantera). En este caso los valores arbitrarios se asignarán a la variable z. Se despejan las variables restantes en términos de z, iniciando de abajo hacia arriba como se indica (sustitución hacia atrás). z=α w = −1 y + z = 1, de donde x −2y + 2z + 3w = 1, por lo que

y = 1− α x = 1 − 2(1 − α) − 2(α) −3(−1) = 6 − 4α

Entonces la solución se expresa como x   6   − 4  y   1  − 1 S =   =   +α    z   0  1       w −1  0 En seguida se muestra un ejemplo de un sistema de ecuaciones lineales no homogéneo con solución única. 3x − 6y + 8z = 15 5x + 3y − 2z = 5 x − 2y + 2z = 3 Este ejemplo se resuelve usando el método de Gauss-Jordan, que consiste en aplicar las operaciones elementales en los renglones para obtener una matriz escalonada bien bonito (escalonada reducida). Se escribe la matriz aumentada del sistema 1 0   0

1 2 2 5 2 2 5 R3 / 2 = R3   −7 −12 −14 ≈ 7R3 + ( −6 )R2 = R3 0 −7 −12 −14    −6 1 −1 −R3 + R1 = R1  0 −12 2 −2 R2 + 6R3 = R2  1 −2 ≈ R1 − R3 = R1  0 13  0 R3 / 2 = R3  0

Se dice que una matriz se encuentra escalonada bien bonito cuando  está escalonada y para cada renglón que comienza con un uno la correspondiente columna es un vector unitario (el resto de las componentes de la columna son cero). Por definición, la matriz cero está escalonada bien bonito.

 1 0 0 1 0 −3 R2 / 13 = R2   0 26 ≈ 0 1 0 2   R + 2R = R  1 2 1 1 3  0 0 1 3

Como se observa, no hay variables libres, el rango es 3 y el número de variables es 3, por lo que se tiene un sistema con solución única. A continuación se muestra el ejemplo de un sistema de ecuaciones lineales no homogéneo con un número infinito de soluciones. x + y − 3z = 2  −3x + y + z = 6

2.2 Matrices 54

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se escribe la matriz aumentada del sistema  1  −3 

1 −3 1 1

2 ≈ 6 

3R1 + R2 = R2  1 R2 / 4 = R2   0 R1 − R2 = R1

0 −1 −1 1 −2 3 

de manera que la solución general expresada en forma paramétrica es x=r−1 y = 2r + 3    r ∈  z=r o escrita en forma vectorial paramétrica   x− =   

 1  −1 x      y = r  2 +  3     1  0 z     

r ∈

Como se observa, hay dos variables delanteras y una variable libre. El rango es 2 y el número de variables es 3, por lo que se tiene un sistema con un parámetro y, por lo tanto, con un número infinito de soluciones. El conjunto solución se escribe así:      x; x =     

 1  −1 x      y = r  2 +  3     1  0 z     

  r ∈   

Se obtienen soluciones particulares al asignar valores a r. Si r = 1, entonces   x =   

x  1  −1  0   y =  2 +  3 =  5     z   1  0  1

Se comprueba en el sistema original y se ve que la solución anterior satisface las dos ecuaciones 1(0) + 1(5) − 3(1) = 2 −3(0) + 1(5) + 1(1) = 6 Ejemplo de un sistema de ecuaciones lineales no homogéneo sin solución: x + y = 3z =2 2x + 2y − 6z = 7 Se escribe la matriz aumentada del sistema y se escalona  1  2 

1 −3 2 −6

2  R2 + ( −2 )R1 = R2  1  0 7  ≈ 

1 −3 0 0

2 3 

La segunda ecuación dice 0x + 0y + 0z = 3.    ¡El sistema es inconsistente!

2.2 Matrices

Ejercicios 2.2 1. Reescriba en forma ordenada el sistema lineal siguiente:

3x − 5y + 9 = 0 −z + 4w – 11 = −3x −x – z + 3y − w = 18 −y − z + 8t = −w − 5 Determine: a) La matriz de coeficientes. b) El vector de constantes. c) La matriz aumentada.

d ) El sistema homogéneo asociado. e) Escriba en la forma matricial AX = b. f ) Escriba el vector de constantes como combinación lineal de las columnas.

2. Escriba las siguientes matrices en forma de sistemas de ecuaciones y resuélvalas.  2  a)  0  0  

0 3 0

π 0 −2  4 e 0

1 0

0 −2 1 1 3 −2

 3 c)   0

0 −1 5 2 −2 −3

b)  

2  4

 7 d)  0   0

4 0 0

0 1 0

 1 e)  0   0

4 0 0

0 −3 1 2 0 0

0 −1 3 0 −2 8 3 4 −7 0 1 0 −1 1 −2

3 1  2 2 7  8

4 9

3. Determine los sistemas consistentes y calcule sus soluciones generales. a)

3x + 2 y + 3z = 19 −x + y − z = −3 2x − y + z = 8

b) 2 x + 3 y + 6 z = 5 −x − y − z = −3 2x + y + z = 7 c) x w x y

+ y = + z = + w = + z =

d)

e)

3 y + z = −9 y 3x + = −8 3x + 7 y + 2 z = −26

17 − 2 z = x − 3 y − = 3y 14 + 2 x 7y − 1 = 3x + 2 z

1 1 1 1

Aplicaciones de los sistemas de ecuaciones Balanceo de reacciones químicas Una reacción química es un proceso termodinámico en el que uno o más reactivos se transforman en productos por efecto de un factor energético. Las sustancias (reactivos y productos) que intervienen en la reacción pueden ser elementos o compuestos químicos, también conocidos con el nombre genérico de especies. Las reacciones químicas se representan simbólicamente mediante ecuaciones químicas. Por ejemplo, en algunas estufas domésticas de gas, cuando se enciende una hornilla, ocurre una reacción de combustión en la que el gas butano (compuesto cuya molécula está formada por 4

55

56

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

átomos de carbono y 10 átomos de hidrógeno, y que se representa con el símbolo C4H10) reacciona con el oxígeno del aire (molécula con 2 átomos, O2) cuando se ponen en contacto con una chispa o con la flama de un piloto (factor energético). Si la hornilla está bien calibrada (cuando permite que la combustión se lleve a cabo completamente), esta reacción produce dióxido de carbono (1 átomo de carbono y 2 de oxígeno, CO2) y agua (2 átomos de hidrógeno y uno de oxígeno, H2O), y se representa mediante la siguiente ecuación (balanceada): 2C4H10 + 13O2 → 8CO2 + 10H2O en donde los números que anteceden a los símbolos de las diversas sustancias se denominan coeficientes estequiométricos e indican las cantidades en moles,4 en que los reactivos se combinan y las cantidades de producto que se obtienen (es decir, 2 moles de butano reaccionan con 13 moles de oxígeno para producir 8 moles de dióxido de carbono y 10 moles de agua). El hecho de que una ecuación química esté balanceada significa que el número de átomos de cada elemento que interviene en los reactivos corresponda exactamente con el número de átomos del mismo elemento que estén presentes en los productos; es decir, que ningún elemento se genere ni se destruya en la reacción. Número de átomos de un  Número de átomos del mismo  elemento en los reactivos  =  elemento en los productos      Este principio se conoce como la ley de Lavoisier de conservación de la materia. Para determinar el número de átomos de cada elemento con que cada especie química contribuye en la reacción, se multiplica el coeficiente estequiométrico de la especie por el número que se encuentra como subíndice del elemento en el símbolo que representa a la especie (si no existe un subíndice, éste se asume como la unidad). De esta manera, como se puede verificar en la reacción de combustión del butano, la cantidad de átomos de carbono en los reactivos es 2 × 4 = 8, la de hidrógeno 2 × 10 = 20 y la de oxígeno 13 × 2 = 26, mientras que la cantidad de átomos de carbono en los productos es 8 × 1 = 8, la de hidrógeno 10 × 2 = 20 y la de oxígeno 8 × 2 + 10 × 1 = 16 + 10 = 26. Como la cantidad de átomos de cada elemento en los reactivos es igual que la de los productos, se dice que la ecuación química está balanceada. Desde esta perspectiva (conservación de los átomos), la ecuación química se puede escribir en forma análoga a una ecuación algebraica: 2C4 H10 + 13O 2 = 8CO 2 + 10H 2O o bien 2C 4H10 + 13O2 + (−8)CO2 + (−10)H2 O = 0 Observe que esta última representación de la ecuación química implica asumir que los coeficientes estequiométricos de los productos tienen signo negativo. Para ilustrar el procedimiento involucrado en el balanceo de reacciones químicas, se plantea determinar los coeficientes de la reacción de combustión del butano, presentada anteriormente. La ecuación química es la siguiente: x1C 4H10 + x2 O2 → x3CO2 + x4H2 O

en donde x1, x2, x3 y x4 son los coeficientes estequiométricos. El balance atómico para cada elemento (C, H y O) presente en la reacción se puede simplificar mediante la siguiente tabla: Número de átomos en los reactivos 4 x1

Número de átomos en los productos x3

Hidrógeno, H

10 x1

2 x4

Oxígeno, O

2 x2

2 x3 + x4

Elemento Carbono, C

4

En química, el número de moles equivale al resultado que se obtiene al dividir la cantidad en masa de una especie entre su peso molecular.

2.2 Matrices

Al igualar las expresiones de la segunda y la tercera columnas de la tabla se obtiene el siguiente sistema de ecuaciones: 4x1 = x3 10 x1 = 2 x4 2 x2 = 2 x3 + x4 que en forma análoga se escribe: 4x1 10x1

2x2



x3



2x3

− −

2x4 x4

= 0 = 0 = 0

Este sistema homogéneo es de tres ecuaciones con cuatro incógnitas, por lo que la solución no es única. Se puede resolver usando alguno de los métodos desarrollados en esta unidad (por ejemplo, el método de Gauss-Jordan). La matriz aumentada  4 0 −1 0  10 0 0 −2  0 2 −2 −1 

0  0 0

da como resultado la siguiente matriz escalonada:  1 0  0 1   0 0 

0 0 1

 1 0 5  13  − 0 10   4 − 0  5 −

que se puede escribir como el sistema de ecuaciones siguiente: x1 x2



1 x4 = 0 5



13 x4 = 0 10

x3 −

4 x4 = 0 5

De este sistema simplificado se obtiene la siguiente solución: x1 x=

x2 x3 x4

1 5 13 = α 10 α ∈  4 5 1

Cuando se está modelando una reacción química conviene considerar coeficientes enteros, por lo que en la solución anterior se puede cambiar el parámetro α por el símbolo (o parámetro) α = 10t y hacerlo variar sobre los enteros, para obtener soluciones particulares.  x1   2   2  x   13   13   2   x = t   ,   t ∈     Por ejemplo, para t = 1   x =   =   x3 8  8       x 10  4   10 

57

58

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Finalmente, sustituya los valores de los coeficientes obtenidos en la reacción: 2 C 4H10 + 13O2 → 8 CO2 + 10 H2 O ¡La reacción está balanceada!

Representación generalizada Con objeto de generalizar los procedimientos anteriores, se puede plantear la siguiente notación para escribir una especie química (Aj) que contiene un número E de elementos (ei): , que no es un producto sino una notación, en donde ei es el símbolo del elemento i y el subíndice si,j representa el número de átomos con que el elemento i está presente en la especie Aj. Por ejemplo, en el caso del butano, A1 = C 4H10 ; e1 = C, e2 = H; s1,1 = 4, s2,1 = 10 De esta manera, en una reacción química en la que intervienen N especies, R reactivos y P = N − R productos, el principio de conservación de la materia se puede enunciar mediante la siguiente ecuación:

(x1A1 +  + xR AR ) − (xR +1AR +1 +  + xN AN ) = j∑=1x j Aj − j =∑R +1x j Aj = 0 R

N

en donde xj es el número estequiométrico asociado a la especie Aj en la reacción química.

Balanceo de ecuaciones químicas. Método algebraico Balancear una reacción química general

(x1A1 +  + xR AR ) − (xR +1AR +1 + L + xN AN ) = 0

significa determinar los valores que deben tener los coeficientes estequiométricos de cada especie involucrada para que se satisfaga la ley de conservación de la materia (en donde cada especie Aj es una fórmula que contiene una cantidad de átomos de los elementos ei determinada por el subíndice si,j). La teoría general de la química proporciona distintos métodos para este propósito (óxidoreducción, tanteos, ion-electrón, entre otros), pero la ley de conservación de la materia, que se puede interpretar como el balance atómico de las especies presentes en cada reacción, cuando se escribe en forma ordenada, genera un sistema homogéneo de ecuaciones lineales algebraicas, cuya solución se puede obtener usando los métodos que se tratan en esta unidad. El ordenamiento adecuado para realizar el balance anterior consiste en construir una tabla en la que los renglones correspondan a cada uno de los E elementos y las columnas a cada una de las N especies que se encuentran presentes en la reacción química. Posteriormente, las celdas de la tabla se llenan colocando en cada una de ellas el número de átomos que corresponda; por ejemplo, para la celda que involucra al renglón del elemento i y la columna de la especie j se debe colocar la expresión que resulta de multiplicar el coeficiente estequiométrico de la especie j (xj) por el número que corresponde al subíndice del elemento i en la especie j (si,j). En el caso en que algún elemento k no esté contenido en la fórmula de una especie m, entonces sk,m = 0. La suma algebraica en cada renglón corresponderá con el balance atómico de cada elemento, que tiene que ser cero. A continuación se muestra el proceso completo para una reacción química general: ⋅⋅⋅

A1 e1

s11, x1





ei  eE

+

si,1x1 +

⋅⋅⋅

+ s x 1,R R 

⋅⋅⋅

 sE,1x1 +

AR

+ s x i ,R R 

⋅⋅⋅

+ s x E ,R R

AR +1

⋅⋅⋅

− s − 1,R + 1xR + 1

⋅⋅⋅

AN −

 − s − i ,R + 1xR + 1

=

0

=

 0

 ⋅⋅⋅



 − s − E ,R + 1xR + 1

s1,N x N si ,N xN 

⋅⋅⋅



s E ,N x N

 =

0

2.2 Matrices

En la solución de tal sistema homogéneo se pueden presentar los siguientes casos:5 i) Cuando la única manera de satisfacer la ecuación química es la trivial, es decir, x1 = x2 = … = x = 0, se dice que no representa una reacción química. N ii) La ecuación química representa una sola reacción si la solución del sistema de ecuaciones conduce a obtener N − 1 coeficientes estequiométricos (x1, x2, …, xN−1) como función del N-ésimo (xN). En estos casos se acostumbra seleccionar un valor entero para xN, tal que genere números enteros reducidos a su mínima expresión para los demás x1, x2, …, xN−1. iii) La ecuación tiene F grados de libertad (o parámetros independientes) y F > 1. Esto sucede si y sólo si la solución del sistema implica F coeficientes que pueden seleccionarse arbitrariamente, y para cada selección existe un único conjunto de números que se asignan a los demás coeficientes y que balancean la ecuación. Es importante notar aquí que la elección de soluciones (por lo tanto, de las F reacciones independientes) no es única.

Ejemplos de balanceo de reacciones químicas 1. Una ecuación que no representa una reacción química:

(

)

x1 NH 4 2 SO4 → x2 NH 4OH + x3SO2 Balance atómico: (NH4)2 SO4

NH4OH

SO2

N

2x1



x2

= 0

H

8x1



5x2

= 0



x2

S

x1

O

4x1

La matriz aumentada:

2 −1 0  8 −5 0 1 0 −1  4 −1 −2

0  0 0  0

1  0 0  0

0  0 0  0

que resulta en

0 −1 1 −2 0 2 0 0



x2

= 0



2x3

= 0

El renglón cuatro de la matriz se hace cero, por lo que el sistema tiene solución única que es la trivial. 1 0 0 0   0 1 0 0    0 0 1 0 

Matriz escalonada:

En efecto,

5

x1

x2

x3

= = =

0 0 0

Rincón, C. y Garritz, A. “Capricho Valenciano (II). Fundamento matemático del método de balanceo por números de oxidación”, Educación Química, Vol. 8, Núm. 2, pp. 76-86, 1997.

59

60

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Por lo tanto, la ecuación x1(NH4)2SO4 → x2NH4OH + x3SO2 no representa reacción química alguna. 2. Una ecuación que representa una reacción química única (con un solo parámetro): x1HCl + x2 KMnO4 → x3Cl2 + x4KCl + x5 MnCl2 + x6H2 O Balance atómico: HCl H

x1

Cl

x1

KMnO4

KCl

MnCl2

H2O −

K

x2

Mn

x2

O

4x2

Matriz aumentada:

Matriz escalonada:

Sistema reducido:

Cl2 − 2x3 −

x4



x4



= 0 = 0

x5 −

1  1 0  0  0

0 0 0 0 −2 0 −2 −1 −2 0 1 0 −1 0 0 1 0 0 −1 0 4 0 0 0 0

0  0 0  0  0

1   0   0   0   0 

0 0 0 0 −

16 8 2 − 8 5 − 8 2 − 8 2 − 8

0   0   0   0   0 

0 1 0 0 0 0 1 0 0 0 0 1



x1 x2 x3 x4

= 0 = 0

2x5



1 0 0 0

2x6

16 x = 0 8 6



2 x 8 6

= 0



5 x 8 6

= 0



2 x 8 6

= 0

x5 −

2 x 8 6

= 0

x6

= 0

2.2 Matrices

La solución del sistema homogéneo es: x1 x2 x=

x3 x4 x5 x6

16    8 2 8 5   x = x6  8  = 6 2 8   8 2 8   1

16

16

2

2

5

=t

5

2

2

2

2

8

8

t∈

Reacción balanceada (t = 1): 16HCl + 2KMnO4 → 5Cl2 + 2KCl + 2MnCl2 + 8H2 O Para que se puedan apreciar las ventajas que representa hacer algunas consideraciones que permiten reducir el sistema, a continuación se trata lo que aquí se denomina método corto. Balancee la siguiente reacción: HCl + KMnO4 → Cl2 + KCl + MnCl2 + H2O Encuentre cuáles elementos aparecen sólo en un reactivo y van a dar sólo a un compuesto de los productos con objeto de asociar la misma variable a las moléculas que los contienen; en este caso son las del hidrógeno, del potasio y del manganeso. Debido a que la molécula de agua tiene 2 hidrógenos, se le pone a, con lo cual a la molécula del ácido clorhídrico le corresponde 2a; al permanganato de potasio se le pone b y, en consecuencia, al cloruro de potasio y al cloruro de manganeso también les corresponde b. Al resto de los compuestos (sólo hay cloro) se les asignan otras letras. El resultado es HCl + KMnO4 → Cl2 + KCl + MnCl2 + H2O 2a b c b b a



Se plantea ahora el sistema de ecuaciones lineales, obedeciendo la ley de la conservación de la materia. El número de átomos de cada especie reactiva tiene que coincidir con el número de átomos de cada especie producto. H: 2a = Cl: 2a = K: b = Mn: b = O: 4b =

2a 2c + b + 2b b b a

Como se observa, las ecuaciones que deben considerarse son las que corresponden al cloro y al oxígeno. El resto no aporta información útil.

El sistema ordenado 2a − 3b − 2c = 0 a − 4b =0

se resuelve por el método matricial.  8  1 0 − 5 ≈  2 0 0 1 −   5

2 −3 −2 1 −4

Escriba el sistema en forma de ecuaciones lineales. Observe que a y b quedaron como variables delanteras y c como parámetro, es decir c = r.

61

62

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

8 a= r 5 2 b= r 5 5 c= r 5

 8  a     r  Conjunto solución  x ; x =  b  =  2    c  5 5      

  r ∈   

Una solución particular haciendo r = 5 es:  a  8  8 5      = b = 2 = 2   5     c   5  5 HCl + KMnO4 → Cl2 + KCl + MnCl2 + H2O 2a b c b b a 16 2 5 2 2 8 16 HCl + 2 KMnO4 → 5 Cl2 + 2 KCl + 2 MnCl2 + 8 H2O que es la misma solución que se obtuvo antes. 3. Una ecuación que representa una reacción química con coeficientes inusuales:6

(

)

( )

x1 Cr N 2 H 4CO 6  Cr CN 6  + x2 KMnO4 + x3H2SO4  4  3 → x4K 2 Cr2 O7 + x5 MnSO4 + x6CO2 + x7 KNO3 + x8K 2SO4 + x9H2 O que, para efectos de representar en el balance de átomos, se escribe en la forma x1A1 + x2 A 2 + x3 A 3 → x4 A 4 + x5 A 5 + x6 A 6 + x7 A 7 + x8 A 8 + x9 A 9 Balance atómico: A1 Cr

A2

A3

A4

A5

A6

A7

A8

A9

− 2x4

7x1

= 0 −

N 66x1

= 0

x7

+ 2x3

H 96x1

− 2x9 = 0 −

C 42x1

= 0

x6

O 24x1 + 4x2 + 4x3 − 7x4 − 4x5 − 2x6 − 3x7 − 4x8 − K

x2

Mn

x2

S

6

− 2x4 x3

− −

x5



x5

x7

− 2x8

x9

= 0 = 0 = 0



x8

= 0

En 1995, Roland Stout, Ph.D, actual profesor de la Universidad de Carolina del Norte en Pembroke, publicó esta reacción en un artículo científico (J. Chem. Educ. 1995, 72, 1125). Indicó que a veces se la proponía a sus estudiantes con objeto de que la balancearan, ofreciendo la calificación más alta para su materia en el caso de que lo lograran. Dice que ninguno pudo. Tiempo después, Jim Diamond (J. Chem. Educ. 1997, 74, 1256) publicó que un estudiante de matemáticas pudo resolver la misma reacción por el método algebraico, una semana después de que se la propuso.

2.2 Matrices

Matriz aumentada: 7  66 96  42 24   0  0   0

0 0 0 0 4 1 1 0

0 −2 0 0 0 0 0 0  0 0 0 0 −1 0 0 0 2 0 0 0 0 0 −2 0  0 0 0 −1 0 0 0 0 4 −7 −4 −2 −3 −4 −1 0  0 −2 0 0 −1 −2 0 0 0 0 −1 0 0 0 0 0  1 0 −1 0 0 −1 0 0

Matriz escalonada:

Sistema reducido: −

x1



x2



x3



x4



x5



x6 x7

− x8 −

10 1 879 1 176 1 879 1 399 1 879 35 1 879 1176 1 879 420 1 879 660 1 879 223 1 879

x9 = 0 x9 = 0 x9 = 0 x9 = 0 x9 = 0 x9 = 0 x9 = 0 x9 = 0

63

64

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Solución del sistema homogéneo:  x1   10  x   1176   2    x3  1 399       x4   35  x x  x5  = 9  1176  = t   1 879    x6   420  x   660   7    x8   223       x9  1 879 

 10   1176    1 399     35   11776  t ∈     420   660     223    1 879 

Reacción balanceada (t = 1): 10Cr (N 2 H 4CO)6 4 Cr (CN)6 3 + 1176KMnO4 + 1399H2SO4 → 35K 2 Cr2 O7 + 1176MnSO4 + 420CO2 + 660KNO3 + 223K 2SO4 + 1879H2 O Comprobación: Elemento

Número de átomos en los reactivos

Número de átomos en los productos

10 × (4 + 3) = 70

35 × 2 = 70

Nitrógeno, N

10 × (48 + 18) = 660

660 × 1 = 660

Hidrógeno, H

10 × 96 + 1 399 × 2 = 3 758

1 879 × 2 = 3 758

Carbono, C

10 × (24 + 18) = 420

420 × 1 = 420

Oxígeno, O

10 × 24 + 1176 × 4 +1399 × 4 = 10 540

35 × 7 + 1176 × 4 + 420 × 2 + 660 × 3 +223 × 4 + 1 879 × 1 = 10 540

Potasio, K

1176 × 1 = 1176

35 × 2 + 660 × 1 + 223 × 2 = 1176

Manganeso, Mn

1176 × 1 = 1176

1176 × 1 = 1176

Azufre, S

1 399 × 1 = 1 399

1176 × 1 + 223 × 1 = 1 399

Cromo, Cr

Aunque los coeficientes son inusuales, la ecuación está balanceada. Al igual que en el ejemplo anterior, a continuación se resuelve el mismo problema utilizando el método corto. [Cr(N2H4CO)6]4[Cr(CN)6]3 + KMnO4 + H2SO4 → K2Cr2O7 + MnSO4 + CO2 + KNO3 + K2SO4 + H2O 7 b a a + c b a 42b 66b c d 2

Conjunto solución:

2.2 Matrices

Solución particular:

[Cr(N2H4CO)6]4[Cr(CN)6]3 + KMnO4 + H2SO4 → K2Cr2O7 + MnSO4 + CO2 + KNO3 + K2SO4 + H2O

b

a

a + c

7 b 2

a



10

1 176

1 399

35

1 176

42b 66b 420

660

c

d

223 1 879

Comprobación Los elementos que se usaron para asignar las letras son Cr, N, C, Mn, S, por lo que no se incluyen en la comprobación. H: 960 + 2(1 176) + 2(223) = 3 758 = 2(1 879) O: 240 + 4(1 176) + 4(1 176) + 4(223) = 10 540 = ( 49 )(10) + 4(1 176) + 840 + 1 980 + 4(223) + 1 879 2 K:  1 176 = 70 + 660 + 2(223) 4. Una reacción cuyo balanceo indica que algo anda mal (¡la matemática da información rele-

vante!). x1FeI2 + x2HIO3 + x3ICl → x4FeCl3 + x5HCl + x6H2O Balance atómico: FeI2 Fe

  x1

I

2x1

HIO3

ICl −

+

x2

H

x2

O

3x2

+

Matriz escalonada:

 1  0   0   0   0 

H2O = 0

x4

= 0

x3 x5

− 2x6 = 0 −

x3 1  2 0  0  0

HCl



Cl Matriz aumentada:

FeCl3

0 1 1 3 0



3x4



x5

0 −1 0 0 0  1 0 0 0 0 0 0 −1 −2 0  0 0 0 −1 0  1 −3 −1 0 0 4 15 5 − 15 13 15 4 − 15 25 15

0 0 0 0 − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1

 0  0   0   0   0 

x6

= 0 = 0

65

66

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Solución del sistema:

 4  4  5  5      −13  α  −13  x=  =t  t∈ 15  4   4  −25   −25       15   15 

y de acuerdo con los coeficientes calculados, la reacción es 4FeI2 + 5HIO3 −13IC1 → 4FeC13− 25HCI + 15H2O  a matemática indica de manera clara que, en este ejercicio, el cloruro de yodo y el ácido L clorhídrico están en posición equivocada; es decir, el ICl debe ser producto y el HCl debe ser reactivo. Así, la reacción balanceada (escrita correctamente) es 4FeI2 + 5HIO3 −25HCl → 4FeCl3 − 13ICl + 15H2O 5. Cinco reacciones independientes:

x1 Zn + x2 HNO3 → x3 Zn (NO3)2 + x4 H2O + x5 H2 + x6 NH4NO3 + x7 Zn (NH2)2 + x8 NO + x9 NO2 que, otra vez, para simplificar se representa mediante: x1A1 + x2A2 → x3A3 + x4A4 + x5A5 + x6A6 + x7A7 + x8A8 + x9A9 Balance atómico: A1 Zn

A2

A3 −

x1

A4

A5

A6

A7 −

x3

A8

A9 = 0

x7

− 2x4 − 2x5 − 4x6 − 4x7

H

x2

N

x2

O

3x2 − 6x3 −

− 2x3 x4

= 0

− 2x6 − 2x7 −

x8



− 3x6

x8

− 2x9 = 0



Matriz aumentada: 1  0 0  0

0 −1 0 0 0 −1 0 0 1 0 −2 −2 −4 −4 0 0 1 −2 0 0 −2 −2 −1 −1 3 −6 −1 0 −3 0 −1 −2

0  0 0  0

 1  0  0  0

3 1 − 2 2 1 0 0 −2 −10 −16 −4 −2 3 1 0 1 0 −1 −4 −77 − − 2 2 0 0 1 0 −3 −6 −2 −1

 0  0  0  0

Matriz escalonada: 0 0 0 −1

−4

−8



x9

= 0

2.2 Matrices

Solución del sistema: 1  x1  1 4 8 3 4 x  2  10  16  8     2         1  x3  1 4 3 7             2   x4  0 3 6 4           x = x5 = α1 1 + α2 0 + α3 0 +α4 0 +α5  0              0  x6  0 1 0 0 0 x  0 0 1 0    7         0  x8  0 0 2  0             2   x9  0 0 0 0

αi ∈ 

i = 1, 2, 3, 4, 5

Una reacción balanceada, αi = 1, i = 1, 2, 3, 4, 5

(

17Zn + 40HNO3 → 16 Zn NO3

)2 + 15H 2O + H 2 + NH 4 NO3 + Zn(NH 2 )2 + 2NO + 2NO2

La solución vectorial significa que la ecuación química planteada es el resultado de integrar las cinco reacciones siguientes, que se obtienen haciendo cada parámetro uno y los demás ceros: 1. 2. 3. 4. 5.

(

)

Zn + 2HNO3 → Zn NO3 2 + H 2 4Zn + 10HNO3 → 4Zn NO3 2 + 3H 2O + NH 4 NO3 8Zn + 16HNO3 → 7Zn NO3 2 + 6H 2O + Zn NH 2 2 3Zn + 8HNO3 → 3Zn NO3 2 + 4H 2O + 2NO Zn + 4HNO3 → Zn(NO3 )2 + 2H2 O + 2NO2

(

( (

)

) )

(

)

 i el tratamiento matemático corresponde o no con la realidad química es ya otro asunto S (Rincón y Garritz, obra citada). 6. Balancee la siguiente reacción (hipotética):7 PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S  e observa que el plomo, el cobre y el hidrógeno van de un reactivo a un producto. Se pone a S las dos moléculas donde aparece el plomo a. Como la molécula Cu2S tiene dos átomos de cobre y el producto Cu(NO3)2 sólo uno, el primer coeficiente es b y el segundo 2b. Análogamente, para el HNO3 y H2O los coeficientes son 2c y c, respectivamente,

PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S a b 2c 2b a c

Note que todo el azufre que sale de los reactivos va a dar a una sola molécula, por lo que le toca a + b. Para el resto de los compuestos utilizamos las letras del alfabeto d y e.

PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S a b 2c 2b a d e c a + b

Como ya quedaron balanceados el Pb, Cu, S e H, para el sistema de ecuaciones, sólo resta revisar el nitrógeno y el oxígeno. Pb: Cu: S: H: N: O: 7 Algunos

a = 2b = a+b= 2c = 2c = 6c =

a 2b a+b 2c 4b + 2a + d + e 12b + 6a + d + 2e + c

Como se observa, las ecuaciones que deben tomarse en cuenta son las que corresponden al nitrógeno y al oxígeno.

químicos dicen que cada molécula de S tiene 8 átomos, por lo que la reacción debería tener S8. En ese caso, basta multiplicar cada coeficiente de la reacción balanceada, excepto el del azufre, por 8.

67

68

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se ordena el sistema 2a + 4b − 2c + d + e = 0

que escrito en forma de matriz queda

6a + 12b − 5c + d + 2e = 0 2

4

6 12

 3 1 2 0 − ≈ 2  −5 1 2  0 0 1 −2 −2 1 1

1 −  2  −1 

Observe que a y c quedaron como variables delanteras y b, d y e como variables libres, que se convierten en parámetros. Sean b = r, d = s, e = t. El conjunto solución es 3 1 a = −2 r + s + t 2 2 b= r 2s + t c= d= e=

s t

   a   −2  3   1           0 0   b   1    1 1   s = x x =  c  = r  0  + s  4  + t  2  , r, s, t ∈    2 2         d   0 2  0   e   0  0 2           

La solución general es

Para que la solución general represente la reacción química planteada es necesario que todos los coeficientes de los parámetros sean no negativos; por lo tanto, deben satisfacer la desigualdad 3 3t t ss+ s++− 2 r−− >2 r02r > 0 > 0, de donde 3s + t > 4r. Se puede escoger r = 1 y s = t = 2, y la solución particular 2 22 2 que resulta es

de donde PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S

a b 2c 2 1 12

2b 2

a 2

d e 2 2

c a + b 6 3

que escrita en forma de reacción química es la siguiente: 2PbS + Cu2S + 12HNO3 → 2Cu(NO3)2 + 2Pb(NO3)2 + 2NO + 2NO2 + 6H2O + 3S Verifique que la reacción está balanceada. La misma reacción resuelta con el método largo: PbS + Cu2S + HNO3 → Cu(NO3)2 + Pb(NO3)2 + NO + NO2 + H2O + S

2.2 Matrices

Se pasa directamente a la matriz: Ph: Cu: S: H: N: O:

1 0  1  0 0  0

0 2 1 0 0 0

0 0 0 0 −1 0 0 0 −1 0 0 0 0 0  0 0 0 0 0 0 −11   1 0 0 0 0 −2 0  1 −2 −2 −1 −1 0 0  3 −6 −6 −1 −2 −1 0 

Se lleva a la forma de escalón reducido: 1   0  0  ≈  0  0   0 

El conjunto solución es 

1 4 1 0 4 0 0 1 0 2 1 0 − 4 1 1 2

0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0



3 4 3 − 4 −2 3 − 2 3 4 1 − 2

−2   1  0   2  −2    0 

.

Con objeto de tener coeficientes de los parámetros con números positivos se deben satisfacer las siguientes desigualdades: r 3s Es evidente de la cuarta desigualdad que s > r, y como el denomi− + 2t > 0 nador de las primeras dos es 4, se escogen para s y r múltiplos de 4 4 4. Sea s = 8 y r = 4. r 3s − + −t > 0 4 4

Para la primera desigualdad queda 1 − 6 + 2t > 0, y por lo tanto, 5 , 2

r 3s − + −t > 0 2 2

t>

r s − + >0 2 2

5 < t < 5, con lo cual t puede ser 3 o 4. Para la tercera desigualdad se ve que 2 −2 + 12 – t > 0; por lo tanto, t < 10.

la segunda −1 + 6 – t > 0; por lo tanto, t < 5, y entonces

69

70

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Se puede escoger r = 4, s = 8 y t = 3, con lo que  1 −3  2   1 − 6 + 6  1             −1  3  −1  −1 + 6 − 3  2  0  8  0  16 16            −2  6  −2 −2 + 12 − 6  4 x =  1 + 2 −3 + 3  2  =  1 − 6 + 6 =  1            −2 + 4  2 −2  2  0    4  0  0   4  4            0  4  0   8  8            3  3  0  0  1   1PbS + 2Cu2S + 16HNO3 → 4Cu(NO3)2 + 1Pb(NO3)2 + 2NO + 4NO2 + 8H2O + 3S Otro balance posible se obtiene haciendo r = 4, s = 8 y t = 4: 3PbS + 1Cu2S + 16HNO3 → 2Cu(NO3)2 + 3Pb(NO3)2 + 2NO + 4NO2 + 8H2O + 4S Compruebe que ambas reacciones están balanceadas. En el proceso anterior se consideraron desigualdades estrictas. Si se considerara la posibilidad de la igualdad en cada una, se obtienen tres ecuaciones distintas y la solución general resulta ser el conjunto de combinaciones lineales de ellas. r − 3s + 8t ≥ 0 − r + 3s − 4t ≥ 0 − r + 3s + 4t ≥ 0 s≥r Por ejemplo, si s = r, s = 4t, haciendo t = 1 y r = s = 4 el sistema queda: a   1 −3  8   0 b   −1  3 −4  4           c   0  8  0 32           d  −2  6 −8  8   x = e = 4  1 + 4 −3 + 1 8  =  0 , que simplificando representa la reacción           f −2  2  0  0 g  4  0  0 16            h   0  4  0 16  i   0  0  4  4           0 1   8   2 x = 0   0 4   4 1  

Cu2S + 8HNO3 → 2Cu(NO3)2 + 4NO2 + 4H2O + S

Análogamente se obtienen las dos restantes.

2.3  Análisis dimensional

2.3  Análisis dimensional Dimensión En el mundo físico es común realizar mediciones de: a) b) c) d) e) f) g) h) i) j) k) l) m)

Lo largo de un oleoducto. La cantidad de varilla para una construcción. El tiempo de vida de una lámpara. La temperatura en una ciudad en un momento dado. La corriente eléctrica que circula en una red eléctrica. La intensidad luminosa emitida por los faros de un automóvil. Las moles de un compuesto químico. Los metros cúbicos de agua suministrados a una casa habitación durante un mes. La densidad de una sustancia. La viscosidad de un líquido. Los metros cuadrados de construcción. El calor específico de una sustancia. La conductividad calorífica de un metal.

Cada una de ellas requiere de instrumentos específicos de medición. A continuación se listan: longitud (L), masa (M), tiempo (T), temperatura (θ), corriente eléctrica (I), intensidad luminosa (J) y cantidad de una sustancia (N), conocidas como dimensiones básicas o fundamentales. En la tabla siguiente se resume lo expuesto: en la primera columna está la magnitud; en la segunda, su dimensión; en la tercera, la unidad de medida en el Sistema Internacional de Unidades (SI) y en la cuarta, el símbolo de la unidad.8 Magnitud

Dimensión

Unidad (SI)

Símbolo de la unidad

Longitud

L

metro

m

Masa

M

kilogramo

kg

Tiempo

T

segundo

s

Temperatura termodinámica

θ

kelvin

K

Corriente eléctrica

I

ampere

A

Intensidad luminosa

J

candela

cd

Cantidad de una sustancia

N

mol

mol

Estas dimensiones pueden combinarse para generar las unidades derivadas, de las cuales son ejemplos las siguientes: Magnitud

Dimensión

Unidad (SI)

Área

L2

m2

Volumen

L3

m3

Densidad

/ M/LT L2/T2θ ML/T3θ

/ kg/ms m2/s2K kgm/s3K

Viscosidad Calor específico Conductividad calorífica

M

L3

kg m3

El análisis dimensional es un ejemplo de la utilización de métodos matemáticos para obtener soluciones al problema de determinar si una variable interviene o no en un experimento, sin hacer 8 La

nomenclatura utilizada en este apartado se apega al uso generalizado de la literatura científica, que no siempre coincide con la norma oficial mexicana.

71

72

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

experimentos; esto se logra a través de una función, que se denota por [ ] y que, aplicada a una variable física, muestra sus dimensiones. Por ejemplo, si µ denota la viscosidad de un líquido, sus dimensiones son [µ] = M/LT = ML−1T−1. El siguiente ejemplo muestra algunas de las propiedades de la función [ ]: De la física se sabe que la velocidad de un móvil tiene la forma v = v0 + at expresión que debe ser dimensionalmente consistente para que la suma sea posible: [v] = [v0] = L/T, [a] = L/T 2 y [t] = T. Como se dijo, las dimensiones del término at tienen que ser las mismas de v0, es decir: [at] = L/T = [a][t] = (L/T 2)T, análogamente, [v0 + at] = [v0] = [at] Si se divide v entre v0, la cantidad resultante no tiene dimensiones. Cuando esto sucede se dice que la variable v/v0 es adimensional. Al aplicar la función [ ] se tiene [v/v0] = (L/T)/(L/T) = L0T0 = (LT)0 = 1.

Definición 2.3.1 Sea VF = {v; v es una variable física} ∀ v, w ∈ VF 1. vw = v   w

v / w = v  /  w . En particular, si [v] = [ w] entonces [v / w] = 1.

2. v  =  w ⇒ v ± w = v  .

En particular, ([v] = 1 ∧ [ w] = 1) ⇒ ([vw] = 1 ∧ [v ⁄w ]= 1 ∧ [v ± w] = 1 ) . La ecuación v = v0 + at relaciona v con v0 y at, pero existen fenómenos donde no se conoce una relación entre las variables relevantes asociadas con ellos. El análisis dimensional proporciona una manera de encontrar alguna relación entre ellas. Si se desea plantear alguna relación entre un grupo de variables con otras en un fenómeno, aplicando la propiedad 2, se verifica que en muchos casos es posible escribir una relación entre las variables de un fenómeno en la forma f (x1, x2,…, xn) = g (y1, y2,…, ym), en donde Note que como

f (x1, x2 ,, xn )

g ( y1, y2 , , ym )

f (x1, x2 , , xn )

g ( y1, y2 , , ym )

=1

=1

el cociente es adimensional. Para encontrar estas relaciones se dispone de varios métodos, pero aquí se tratarán dos: el de Rayleigh y el de Buckingham, íntimamente ligados con la teoría de los sistemas de ecuaciones lineales. A continuación se ilustran ambos métodos considerando el siguiente problema. Suponga que hay una esfera lisa de diámetro (D) dentro de un líquido en movimiento. Se desea hallar una relación entre la fuerza de arrastre (F) que el fluido ejerce sobre la esfera, sabiendo que éste tiene densidad (ρ), viscosidad (µ) y velocidad (v).

Método de Rayleigh 1. Identifique las dimensiones de las variables: Magnitud Fuerza Diámetro Velocidad Densidad Viscosidad

Dimensión MLT−2 L LT−1 ML−3 ML−1T−1

2.3  Análisis dimensional

2. Se propone el siguiente modelo: expresar una de las variables como el producto de potencias

de las otras, cuyos exponentes deben determinarse. F = cv x1 ρ x2 D x3 µ x4, donde c es una constante. 3. Ecuación dimensional: [ F ] = cv x 1 ρ x 2 D x 3 µ x 4 





(

LMT−2 = LT−1

) (L−3M) x1

x2

(L)x3 (L−1MT−1 )

x4

LMT −2 = Lx1 T − x1 L−3x2 M x2 Lx3 L− x4 M x4 T − x4 LMT −2 = Lx1 −3x2 + x3 − x4 M x2 + x4 T − x1 − x4

4. Sistema de ecuaciones que resulta de igualar los exponentes de cada dimensión:

L : x1 − 3x2 + x3 − x4 = 1 M: x2 + x4 = 1 T : − x1 − x4 = −2

5. Matriz aumentada del sistema:

 1 −3 1 −1 1   1  0 1 0 1  − 1 0 0 −1 −2    6. Aplicando el método de Gauss-Jordan:

 1   0  −1  La solución es x1 = 2 − α

−3 1 1 0 0 0 x2 = 1 − α

7. Se sustituyen los valores hallados en F = cv

exponente:

1  1 0 0 1   1 ≈  0 1 0 1 − 2  0 0 1 1

−1 1 −1

x4 = α

x3 = 2 − α x1

2  1 2

α ∈

ρ x2 D x3 µ x4 y se agrupan las variables con el mismo

F = cv 2 − α ρ1− α D2 − α µα F = cv 2 ρ1D2 v −α ρ −α D −α µα  µ  ∴ F = cv 2 ρD2   vρD  El término

α

es el recíproco de un número adimensional conocido como número de Rey-

nolds, lo que sugiere el cambio de variable α = 2 − β, de lo cual resulta la expresión equivalente F = c 

.

Los pasos 3, 4 y 5 se pueden simplificar usando una tabla que en su primera columna tiene las dimensiones y en su primer renglón las variables. Los exponentes de las dimensiones de cada variable son los coeficientes de la matriz aumentada del sistema. La última columna son los tér-

73

74

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

minos independientes que corresponden a los exponentes de las dimensiones de la variable que se despejó. v

ρ

D

µ

F

L

1

−3

1

−1

1

M

0

1

0

1

1

T

−1

0

0

−1

−2

Método de Buckingham 1. Se propone el siguiente modelo: igualar el producto de potencias de todas las variables con

una constante adimensional. v x1 ρ x2 D x3 F x4 µ x5 = c 2. Construir con el modelo una tabla como la del ejemplo anterior.

ρ

v

D

F

µ

L

1

−3

1

1

−1

0

M

0

1

0

1

1

0

T

−1

0

0

−2

−1

0

 1 −3 1 1 −1 0   ∴  0 1 0 1 1 0 −1 0 0 −2 −1 0   3. Aplicar el método de Gauss-Jordan.

1 −3 1 1 −1 0 1 0 0 2 1 0     0 1 0 1 1 0 ≈ 0 1 0 1 1 0 0 −3 1 −1 −2 0 0 0 1 2 1 0  x1  −2 x   −1  2   Solución: x3  = α −2 + β     x4   1 x5   0

−1 −1   x x x x x −1 v 1 ρ 2 D 3 F 4 µ 5 = c    0  1

La ecuación resultante queda en función de dos grupos adimensionales:  v 2 ρD 2  c = F   

−α

 µ     vρD 

β

Si α = −1 y β = 2 − λ, entonces λ

µ 2  vρD  µ2 φ (Re) F=C   , o bien F = C ρ µ  ρ A pesar de que, aparentemente, las soluciones obtenidas en cada método no coinciden, se puede comprobar que son equivalentes al observar que los dos parámetros del segundo método suelen relacionarse de manera conveniente. En resumen, sean B = {v1, v2,…, vn} un conjunto de variables que describen un fenómeno físico y D = {D1, D2,…, Dk} un conjunto de dimensiones básicas para ellas.

2.3  Análisis dimensional

n

( )

x 1. Ecuación que relaciona las variables: c = ∏ vi i , i =1

k

a

v j  = ∏ Di i j   i =1 k

0

2. Análisis de dimensiones: c  = ∏ Di i =1

( )xi  = i∏= j  i∏=1Di i j 

n  ∏ vi i =1

n

k

a

xj



n



∑ ai j x j k k n = ∏ Di0 son iguales si ∑ ai j x j = 0, i = 1, 2,, k ∏ Di j =1

i =1

j =1

i =1

3. Se construye una tabla con k + 1 renglones y n + 2 columnas. En la columna uno se colocan

los elementos de A y en el primer renglón los elementos de B. Debajo de cada variable se escriben los exponentes de sus dimensiones. v1

v2



vj



vn

D1

a11

a12



a1 j



a1n

0

D2

a21 a22



a2 j



a2 n

0

















Di

ai1

ai 2



ai j



ai n

0



















ak j



ak n

0

Dk

ak1 ak 2

4. La solución al sistema es:

e1m  x1  e11  e12          x2  = α e21  + α e22  + α e2 m  donde m = n − r, y r es el rango de la matriz. 1 2 m                 enm  xn  en1  en 2  La solución de esta ecuación homogénea es la solución al problema de análisis dimensional. El número de grados de libertad del sistema, m = n − r, donde r es el rango de la matriz, es el número de grupos adimensionales básicos que se obtienen. El producto de grupos adimensionales es:

Recuerde que el producto y el cociente de grupos adimensionales es un grupo adimensional. Ejemplo 2.3.1

Se ha encontrado que la caída de presión (ΔP) en una tubería es una función del diámetro (D), rugosidad de la pared (ε) y longitud (l) del tubo, y de la densidad (ρ), velocidad (v) y viscosidad (µ) del líquido. Se desea determinar una expresión que relacione la caída de presión con el resto de las variables.

75

2.3  Análisis dimensional 76

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Solución Dimensiones de cada variable: Magnitud

Símbolo

Dimensión(es)

v

LT−1

ΔP

ML−1T−2

Densidad

ρ

ML−3

Viscosidad

µ

ML−1T−1

Diámetro

D

L

Longitud

l

L

Rugosidad

ε

L

Velocidad Caída de presión

1. Ecuación que relaciona las variables:

v x1 ∆P x2 ρ x3 µ x4 D x5 l x6 ε x7 = π 2. Tabla de dimensiones:

µ

D

l

ε

L

1 −1 −3 −1

1

1

1

0

M

0

1

0

0

0

0

0 −1

0

0

0

0

v

T

ΔP

1

−1 −2

ρ

1

1 0 −2 0 1 1 1  0 1 1 0 −1 −1 −1 0 0 0 1 1 1 1 

0  0 0

3. Solución del sistema de ecuaciones:

 x1  x   2 x3    x4  = r x5    x6  x   7  v2 ρ     ∆P 

α1

 2 −1    1    0 + s  0    0  0  

 ∆PD   µv 

α2

−1  1    0   −1 + t  1    0  0    ∆Pl   µv 

−1  1    0   −1 + u  0    1  0  

α3

 ∆Pε   µv 

−1  1    0   −1  0    0  1  

α4



Cada uno de los términos entre paréntesis corresponde a un grupo adimensional (las operaciones de suma, resta, producto y cociente de grupos adimensionales es un grupo adimensional), los cuales se denotan con la letra π. v2 ρ ∆PD ∆Pε ∆Pl , π2 = , π3 = , π4 = ∆P µv µv µv ∆P 1 1 1 µ π π ε l = = = , , 3 = , 4 = π 1 v 2 ρ π 1π 2 v 2 ρ ∆PD vρD π 2 D π 2 D ∆P µv

π1 =

2.3  Análisis dimensional

Por último, α

β

γ

 µ   l  ε ∆P = kv 2 ρ  ,  vρD   D   D  donde k, α, β y γ son constantes que se determinan experimentalmente. Ejemplo 2.3.2

Considere la transferencia de masa que resulta cuando un fluido fluye sobre una superficie sólida. Las variables que contribuyen a la transferencia global se muestran en la tabla siguiente: Dimensiones de cada variable Magnitud

1. Ecuación v

x1

Símbolo

Dimensiones

Velocidad

v

LT−1

Viscosidad

µ

ML−1T−1

Densidad

ρ

ML−3

Difusividad de masa

D

L2T−1

Coeficiente de transferencia de masa

k

LT−1

Longitud característica

l

L

µ x2 ρ x3 D x4 k x5 l x6 = π ρ

D

kc

l

L

1 −1 −3

2

1

1

0

M

0

0

0

0

0

0 −1

0

0

0

v

T

µ 1

−1 −1

1

1 0 0 0 −1 −1 0   0 1 0 1 1 1 0 0 0 1 −1 −1 −1 0 2. Solución del sistema de ecuaciones:

 x1   0 −1  1 x  −1  0 −1  2       x3   1  0  1   = r  + s  + t  x4   1  0  0 x5   0  1  0         x6   0  0  1 3. Sustitución en la ecuación v

x1

µ x2 ρ x3 D x4 k x5 l x6 = π : α

α3

 ρD  1  k α2  vρl  π = α       µ  v  µ  Los grupos adimensionales obtenidos son:

π1 =

ρD k vρl , π2 = , π3 = µ µ v

y

π 2π 3 kl = D π1

77

78

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Los grupos adimensionales se conocen como: Grupo adimensional

Símbolo

Nombre

ρD µ

Sc

Schmidt

vρl µ

Re

Reynolds

Sh

Sherwood

kl D

Ejercicios 2.3 1. Balancee las siguientes ecuaciones químicas hipotéticas usando el método algebraico.

a) P2I4 + P4 + H2O −→ PH4I + H3PO4 b) KOH + H2SO4 + H2O −→ KHSO4 c) FeI2 + HIO3 + HCl −→ FeCl3 + I2 + H2O d) Na2Cr2O7 + NaI + HCl −→ CrCl3 + I2 + H2O + NaCl e) HCl + KMnO4 −→ Cl2 + KCl + MnCl2 + H2O f ) CaF2 + H2SO4 −→ CaSO4 + HF g) FeS + O2 −→ Fe2O3 + SO2 h) K2Cr2O7 + H2O + S −→ SO2 + KOH + Cr2O3 i) CaC2O4 + KMnO4 + H2SO4 −→ CaSO4 + MnSO4 + K2SO4 + CO2 + H2O j) CuSCN + KIO3 + HCl + O2 −→ CuSO4 + ICN + KCl + H2O k) PbCrO4 + KI + HCl −→ PbCl2 + Crl3 + KCl + I2 + H2O

l ) Cl2 + KOH −→ KCl + KClO3 + H2O m) Ba(OH)2 + HCl + H2O −→ BaCl2 n) K2Cr2O7 + CH3CH2OH + H2SO4 −→ Cr2(SO4)3 + CH3COOH + K2SO4 + H2O o) KClO3 + HCl −→ KCl + H2O + Cl2 + ClO2 p) C + O2 −→ CO + CO2 q) C2H4 + HCl −→ C2H6 + C5H5Cl + C2H4Cl r) C3H8 + O2 −→ H2O + C + CO + CO2 s) As2S5 + HNO3 −→ H3AsO4 + H2SO4 + H2O + NO + NO2 t) NaBrO + H2O2 −→ NaBr + O2 + H2O u) Cu + HNO3 −→ Cu(NO3)2 + NO2 + NO + H2O v) CH3CH2CH3 + O2 −→ C + CO2 + CO + H2O

2. Con la información que se da en cada ejercicio, encuentre los exponentes y los grupos adimen-

sionales correspondientes: a) v x1 ρ x2 Lx3 F x4 µ x5 = π Magnitud

Símbolo

Dimensiones

Fuerza

F

M LT2

Velocidad

v

Densidad

ρ

Viscosidad

µ

/ / M/LT

Longitud

L

L

/

LT

M L3

b) v x1 D x2 ρ x3 ∆P x4 Lx5 ε x6 µ x7 = π Magnitud

Símbolo

Dimensiones

Caída de presión

ΔP

ML T2

Velocidad

V

LT

/

/

2.3  Análisis dimensional

Magnitud

Símbolo

Dimensiones

Diámetro de la tubería

D

L

Longitud de la tubería

L

L

Rugosidad de la tubería

ε

L

Viscosidad del fluido

µ

M LT

Densidad del fluido

ρ

M L3

/ /

c) D x1 k x2 µ x3 v x4 ρ x5 C p x6 h x7 = π Magnitud

Símbolo

Dimensiones

Coeficiente de transferencia de calor

H

Q TL2θ

Velocidad

V

LT

Diámetro del tubo

D

L

Conductividad térmica del fluido

k

Q LTθ

Capacidad calorífica del fluido

Cp

Viscosidad del fluido

µ

Densidad del fluido

ρ

/ Q/Mθ M/LT M/L3

Símbolo

Dimensiones

Coeficiente de transferencia de calor

H

Q TL2θ

Longitud significativa

L

L

Densidad

ρ

Viscosidad del fluido

µ

Conductividad térmica del fluido

K

Capacidad calorífica del fluido

Cp

Coeficiente de expansión térmica

β

/ M/LT Q/LTθ Q/Mθ 1/θ

Diferencia de temperaturas

∆T

θ

Aceleración gravitacional

G

L T2

Símbolo

Dimensiones

Coeficiente de transferencia de masa

kc

Velocidad del fluido

V

/ L/T

Diámetro del tubo

D

L

Difusividad del fluido

DAB

L2 T

Viscosidad del fluido

µ

Densidad del fluido

ρ

/ M/ L3

/

/

1 d) LxAB µ x 2 k x 3 g x 4 β x 5 C px 6 ρ x 7 ∆T x 8 h x 9 = π

Magnitud

/

M L3

/

x1 x 2 e) DAB ρ D x 3 kcx 4 v x 5 µ x 6 = π

Magnitud

LT

/

M LT

79

80

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes x x1 x 2 x 3 x 4 x5 f ) DAB L µ kc ρ ( g∆ρ a ) 6 = π

Magnitud

Símbolo

Dimensiones

Coeficiente de transferencia de masa

kc

LT

Longitud característica

L

L

Difusividad del fluido

DAB

L2 T

Viscosidad del fluido

µ

M LT

Densidad del fluido

ρ

M L3

Fuerza de flotación

g ∆ρa

M L2T2

/

/

/ /

/

2.4 Determinantes Existe una función9 det: Mn × n (R) → R que asocia a cada matriz cuadrada un número que se llama su determinante; se denota como det(A); |A|; D(A); Δ; ...… y es la única que tiene las siguientes propiedades:  A1        Ai    Sea A =    la matriz escrita según sus renglones. Entonces,  Aj       A   n  A1        kAi    1. det    = k det  Aj       A   n

 A1        Ai       (La función determinante saca escalares de cada renglón.)  Aj       A   n

 A1        Ai + Bi      = det 2. det   Aj        A  n  

9

 A1        Ai       + det  Aj       A   n

 A1        Bi       (La función determinante abre sumas en cada renglón.)  Aj       A   n

La teoría de la función determinante, su existencia y unicidad, se desarrolla en el apéndice 2 correspondiente.

2.4 Determinantes

 A1        Aj    3. det    = −det  Ai       A   n

 A1        Ai       (La función determinante es alternante.)  Aj       A   n

1   e1       ei  0    4. det    = e j  0     e  0   n

0  0  0 1  0  0  = 1 (El determinante de la matriz idéntica es uno.) 0  1  0  0  0  1

La información anterior se resume diciendo que la función determinante es la única n-lineal, alternante y que valuada en la identidad es uno.

Consecuencias  A1        Ai    1. det    = 0 (Si una matriz tiene dos renglones iguales, su determinante vale cero.)  Ai       A   n     Ai  2. det      

A1     + kAj     = det Aj     An 

 A1        Ai       (El determinante de una matriz no se altera si a un renglón se le  Aj  suma cualquier múltiplo de otro.)      A   n

Por lo tanto, 3. El determinante de una matriz vale cero si un renglón es combinación lineal10 de los demás. 4. det(A) = det(At ). En consecuencia, todo lo que se afirma para los renglones, resulta válido para las columnas, y recíprocamente (ver más adelante). Un corolario importante de las propiedades anteriores es lo que se conoce como regla de Cramer.

Sea β = {A1, A2, …, An} una colección de columnas. Una columna B es combinación lineal de β si y sólo si existen coeficientes k1, k2, …, kn, tales que B = k1A1 + k2A2 + ⋅⋅⋅ + knAn.

10

81

82

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Sea a11x1 +  + a1n xn   an1x1 +  + ann xn

=

k1  = kn

Un sistema de ecuaciones lineales n × n y Δ el determinante de la matriz del sistema: a11 a12  a1n ∆=    an1 an 2  ann Al multiplicar la primera columna por x1: ∆x1 =

a11x1 a12  a1n    an1x1 an 2  ann

Al sumar a la primera columna múltiplos de las otras (el determinante no se altera): a11x1 + a12 x2 +  + a1n xn ∆x1 =  an1x1 + an 2 x2 +  + ann xn Gabriel Cramer (1704-1752). Matemático suizo y profesor de la Universidad de Ginebra. En 1750 publicó su regla en el libro Introduction à l'analyse des lignes courbes algébriques.

k1 a12  a1n   =  an 2  ann kn

a12  a1n   = ∆1 an 2  ann

Observe que ∆1 se obtuvo sustituyendo la primera columna de la matriz del sistema por los términos independientes. En forma análoga, se pueden desarrollar los determinantes ∆ 2 ,..., ∆ n ; por lo tanto, para cada i = 1,, n se obtiene la igualdad ∆xi = ∆i y si ∆ ≠ 0 resulta xi =

∆i ∆

que es lo que se conoce como la regla de Cramer, la cual asegura que si el determinante de la matriz del sistema es diferente de cero, el sistema tiene solución única y se obtiene aplicando las fórmulas anteriores.

Cálculo de determinantes Para aplicar la regla de Cramer, así como para otros cálculos, es indispensable conocer el valor del determinante de una matriz cuadrada. A continuación se describe uno de los métodos que se utilizan para estos efectos, denominado desarrollo por cofactores. Dada la matriz  a11 a12  a1n    A=       an1 an 2  ann  se define el cofactor del elemento aij como Cij = (−1)i + j Mij , en donde Mij es el determinante de la submatriz que se obtiene de la matriz A eliminando el renglón i y la columna j, y se llama el menor ij. El cálculo del determinante de la matriz A puede realizarse de la manera siguiente: Al desarrollar por el i-ésimo renglón: det (A) = ai1Ci1 + ai 2Ci 2 +  + ainCin .

2.4 Determinantes

Al desarrollar por la j-ésima columna: det (A) = a1 jC1 j + a2 jC2 j +  + anjC nj . Se puede demostrar que ambos desarrollos coinciden y que son independientes de la i y de la j; es decir, el desarrollo puede hacerse por cualquier renglón o columna. Se recomienda elegir el renglón o columna que tenga más ceros. Observe que el método anterior está basado en un argumento inductivo. Presupone que se conoce la manera de calcular determinantes de matrices m × m con m = n − 1, y la inducción comienza con el cálculo de los determinantes de las matrices 2 × 2 (que se suponen conocidos). a11 a12 = a11a22 − a21a12 a21 a22 Ejemplo 2.4.1

 −1 2 0 −3   2 −2 −1 − 4  . Calcular el determinante de la matriz A =   4 −1 1 3   5  3 1 2 De acuerdo con la sugerencia anterior, se selecciona el renglón 1 para hacer el desarrollo por cofactores. Los menores son: −2 −1 −4 M11 = −1 1 3 = 6 1 2 5 2 −2 − 4 M13 = 4 −1 3 = −22 3 1 5

M12

2 −1 − 4 = 4 1 3 = −11 3 2 5

M14

2 −2 −1 = 4 −1 1 = −3 3 1 2

por lo que los cofactores resultan: C11 = 6   C12 = 11   C13 = −22   C14 = 3 det (A) = (−1)(6) + 2 (11) + 0 (−22) − 3(3) = 7 Al desarrollar ahora el determinante por la tercera columna:  −1 2 0 −3   2 −2 −1 −4   A=  4 −1 1 3     3 1 2 5 det (A) = 0 (−22) − 1(35) + 1(−62) + 2 (52) = 7 Un método alternativo consiste en obtener una matriz triangular superior por medio de operaciones elementales y, utilizando las propiedades de los determinantes, calcular la forma en que se van modificando los de las matrices equivalentes. El valor del determinante final se obtiene multiplicando los elementos de la diagonal principal, lo que corresponde al desarrollo por cofactores de la matriz triangular.

83

84

Unidad 2  Sistemas de ecuaciones lineales, matrices y determinantes

Por ejemplo, −1 2 0 − 3 −1 2 −2 −1 − 4 0 = 4 −1 1 3 0 3 1 2 5 0 −1 0 0 −1 − 0 1 0 2

2 0 −3 −1 0 0 −1 2 −1 −10 =− 0 1 7 1 −9 −4 0 2 7 2

2 −3 −1 0 2 −3 2 −10 0 −1 2 −10 =− =− 7 −9 0 0 9 −19 7 −4 0 0 11 −24

2 −3 2 −10 7 −9 7 −4

−1 0 2 0 −1 2 0 0 9 0

0 0

−3 −10 −19 = 7 7 − 9

Note que en el segundo paso, en el que se intercambiaron columnas, se puso un signo menos, ya que el determinante cambia de signo cuando esto pasa. En los otros pasos se sumó el múltiplo de un renglón al que se desea modificar. Esta operación no altera el resultado del determinante. En algunos libros de nivel intermedio (álgebra de licenciatura) se menciona la regla de Sarrus para calcular determinantes de matrices 3 × 3, lo que no es un método diferente, sino un artificio visual para simplificar el desarrollo por cofactores. Consiste en repetir los dos primeros renglones abajo del tercero (o las dos primeras columnas a la derecha de la matriz) y sumar los productos de las diagonales (en forma análoga a los determinantes 2 × 2); como se muestra en el siguiente ejemplo: Pierre Frédéric Sarrus (1798-1861). Matemático francés cuya celebridad entre los estudiantes de matemáticas se debe a la regla de cálculo de determinantes de matrices de 3 × 3 que lleva su nombre: regla de Sarrus.

2 −2 1 3 4 2 → −1 1 2

2 −2 1 − 3 4 2 = 35 −1 1 2 2 −2 1 3 4 2 +

Ejercicios 2.4 1. Calcule los siguientes determinantes

i) 

2 1 2 −1 1 1   ii)  2 −1 3

1 2 3 5 6 7 9 10 11

4 8 12

π

2

−1

0

2. Sean A y B las matrices

 2  1 2 3 1 2   A = −1 1 1    B =  4 5 6      2 −1 3  7 8 0 Compruebe que el determinante del producto AB de las matrices es igual al producto de sus determinantes. 3. Demuestre que el determinante de una matriz triangular es igual al producto de los elementos de su diagonal. 4. Resuelva el siguiente sistema de ecuaciones utilizando la regla de Cramer. x + 2y − z = 3 3y − 2z = 2 z=2

85



icos

3.2  Números complejos •  El modelo de Gauss y la inmersión de  en  •  La conjugación •  La norma •  La ecuación general de segundo grado •  Sistemas de ecuaciones •  Representación geométrica de los números complejos •  Raíces n-ésimas de un número complejo •  El argumento de un número complejo •  La función exponencial compleja •  Representación geométrica de algunas rectas bajo la   transformación E •  La función logaritmo •  Las funciones trigonométricas

s numér

Unidad

3.1  El sistema de los números reales •  Axiomas de campo •  Algunas propiedades de campo de los números reales •  Axiomas de orden •  Subsistemas de los números reales •  Axioma de completez •  Algunas representaciones de los números reales

Sistema

3

86

Unidad 3  Sistemas numéricos

3.1  El sistema de los números reales Se presenta una breve discusión acerca de uno de los conjuntos más importantes de las matemáticas: el sistema de los números reales. Una gran parte de las matemáticas se construye sobre las propiedades de los números reales y su discusión se realiza aquí, a través de un método axiomático, a diferencia de los cursos elementales, en donde usualmente se adopta un enfoque intuitivo de este sistema. A pesar de que al principio de la discusión se requiere una cierta capacidad de abstracción, su desarrollo permitirá adquirir nociones más concretas en torno al uso, representación e interpretación geométrica de los números reales. El sistema de los números reales se denota por  y consiste en un conjunto de objetos primitivos a, b, c, ..., que contiene al menos dos elementos. En él están definidas dos operaciones (relaciones primitivas), llamadas adición y multiplicación, representadas por los signos “+” y “·”, respectivamente, que cumplen con un conjunto de axiomas que pueden separarse, de manera natural, en tres partes: i) Axiomas y propiedades de campo (adición y multiplicación). ii) Axiomas y propiedades de orden. iii) Axioma de Dedekind o propiedad de ser completos o completez. Para una presentación fluida, estos axiomas se consideran por separado.

Axiomas de campo Las leyes que gobiernan las operaciones adición y multiplicación en el conjunto de los números reales se llaman propiedades de campo, y en general todo conjunto que las satisfaga se denomina campo.

Axioma 3.1.1 Leyes conmutativas ∀ a, b ∈ 

a+b=b+a a·b=b· a

Axioma 3.1.2 Leyes asociativas ∀ a, b, c ∈ 

a + (b + c ) = (a + b) + c

Axioma 3.1.3 Leyes distributivas ∀ a, b, c ∈ 

(a + b) · c = a · c + b · c Axioma 3.1.4 Elementos idénticos ∃ 0, 1 ∈ , 0 ≠ 1, tales que ∀a ∈ 

a+0=a =0+a

3.1  El sistema de los números reales

Axioma 3.1.5 Elementos inversos ∀a, b ∈ , con b ≠ 0 ∃ x, y ∈  tales que a+x =0=x+a b · y =1= y · b x y y se denotan por −a y b −1 , respectivamente. Ya que en virtud de tales axiomas a + (b + c) = (a + b) + c, la expresión a + b + c se puede utilizar sin ambigüedad alguna. Análogamente, la notación a . b . c se puede usar para representar ya sea a . (b . c) o (a . b) . c. En este sentido, cuando se suman cuatro números reales a, b, c y d existe una situación similar; por ejemplo, si se considera (a + b) + (c + d ) a + [(b + c ) + d ]

[(a + b) + c] + d 

es posible demostrar que, sin importar cómo se asocien los números, se obtendrá siempre el mismo resultado, por lo que usualmente se escribe: a+b+c+d en lugar de alguna de las expresiones anteriores. Esta observación puede hacerse aun para sumas de cualquier número de sumandos. Una demostración general de este hecho requiere del método de inducción matemática, que será discutido posteriormente. Existe una situación análoga en el caso de la multiplicación, en donde la expresión a.b.….n se emplea para denotar el producto de cualquier cantidad de factores. Con el propósito de simplificar aún más la notación, se puede omitir el signo “ . ”, en los casos en que no se complique la interpretación, lo que permite escribir “ab” en lugar de “a . b”. Adicionalmente, la notación a(b), (a)b o (a)(b) también se empleará para denotar el producto a . b. Análogamente, para la multiplicación de más de dos elementos, cualquiera de las expresiones a(bc), (ab)c o abc podrá usarse en lugar de a . b . c. En los casos en donde intervienen simultáneamente la adición y la multiplicación de números reales, estas operaciones se deben jerarquizar de modo tal que todas las multiplicaciones se realicen antes que las sumas. Debe hacerse notar que los paréntesis se usan para representar números únicos, de manera que las operaciones que estén dentro de ellos deberán realizarse primero. El elemento 0 del axioma 3.1.4 se denomina el idéntico aditivo o cero. El elemento 1 es el idéntico multiplicativo o uno. Estos elementos idénticos son los únicos que satisfacen las propiedades que les confiere el axioma 3.1.4. El número real —a del axioma 3.1.5— se llama el inverso aditivo de a o negativo de a, mientras que el inverso multiplicativo b−1 de un número real b, distinto de cero, se llama el recíproco de b. El principio de sustitución de la lógica matemática, aplicado a las operaciones de adición y multiplicación, establece que, al ser a, b, c y d números reales: a = c ∧ b = d ↔ a + b = c + d ∧ ab = cd En particular, si a = c, es correcto escribir a + b = c + b y ab = cb. Por conveniencia, algunas veces se refiere uno a estas manipulaciones diciendo: “agregando b a ambos lados de la igualdad a = c” o “multiplicando ambos lados por b”. Las consideraciones anteriores hacen ver que la formulación de algunas de las propiedades de las operaciones (que se expusieron con objeto de agilizar el desarrollo de la teoría) resultan redundantes. Por ejemplo, la ley de la distribución por la derecha se puede obtener a partir de las propiedades de campo.

87

88

Unidad 3  Sistemas numéricos

En efecto, como la multiplicación es conmutativa, se puede escribir

(b + c) a = a (b + c) Por la ley de la distribución por la izquierda a (b + c ) = ab + ac

(b + c) a = ab + ac

o bien y aplicando otra vez la conmutatividad

ab = ba

y

ac = ca

(b + c) a = ba + ca

se obtiene finalmente

que es lo que queríamos demostrar. Los siguientes ejemplos ilustran los desarrollos que pueden llevarse a cabo usando las propiedades de campo. En ellos, todas las letras minúsculas representan números reales. Ejemplo 3.1.1 Pruebe que

(a + b) + (c + d ) = (a + d ) + (c + b) Solución

(a + b) + (c + d ) = a + [b + (c + d )] = a + [(b + c ) + d ] = a + [d + (b + c )] = (a + d ) + (b + c ) = (a + d ) + (c + b)

(ley asociativa) (ley asociativa) (ley conmutativa) (ley asociativa) (ley conmutativa)

Ejemplo 3.1.2 Pruebe que

(a + b) + (− a ) = b Solución

(a + b) + (−a) = (−a) + (a + b) = (−a + a ) + b



= 0 + b = b



Ejemplo 3.1.3 Demuestre que si a y b son no nulos:

(ley conmutativa) (ley asociativa) (elemento inverso) (elemento idéntico)

(ab)(a −1b −1 ) = 1

Solución

En virtud de que a y b son no nulos, por el axioma 3.1.5 existen los recíprocos a−1 y b−1. Entonces es posible escribir

(ab)(a −1b −1 ) = (ba)(a −1b −1 ) = (ba ) a −1 b −1

(

)

= b aa b −1 = [b · 1]b −1

−1

−1

= bb = 1

(ley conmutativa) (ley asociativa) (ley asociativa) (elemento inverso) (elemento idéntico) (elemento inverso)

3.1  El sistema de los números reales

Ejemplo 3.1.4 Pruebe que

(a + b)(c + d ) = ac + ad + bc + bd

Solución (a + b)(c + d ) = a (c + d ) + b (c + d ) = ( ac + ad ) + ( bc + bd ) = ac + ad + bc + bd 

(ley distributiva por la derecha) (ley distributiva por la izquierda)

Algunas propiedades de campo de los números reales En esta sección se presentan teoremas básicos de los números reales. En un principio se expresará la razón que justifique cada paso de una demostración, refiriéndola a un axioma específico, un teorema o una definición que se haya empleado. Posteriormente se espera que las referencias involucradas en cada razonamiento puedan ser identificadas.   Teorema

3.1.1

Ley de la cancelación para la adición. Sean a, b, c ∈ 

a+c =b+c ⇒ a =b

Demostración a+c =b+c

Suponga que

Por el axioma 3.1.5, el número real c tiene un inverso aditivo, el número real –c. Al sumar –c en ambos lados de la igualdad dada se tiene

(a + c) + ( −c ) = (b + c) + ( −c ) Ahora

(a + c) + ( −c ) = a + [c + ( −c )]

(ley asociativa) (elemento inverso) (elemento idéntico)

= a+ 0 =a



y, siguiendo exactamente los mismos pasos:

(b + c) + ( −c ) = b a=b

Entonces De la ley conmutativa se sigue

c+a =c+b ⇒ a =b a+c =c+b ⇒ a =b

y también que

  Teorema

3.1.2

∀ a, ∈ ,

.

Demostración

= a· 0 +a · 0

(elemento idéntico) (ley distributiva)

También



(elemento idéntico)

89

90

Unidad 3  Sistemas numéricos

Entonces

  Teorema



(ley de cancelación de la adición) (ley conmutativa)

3.1.3

1 ≠ 0 .

Demostración Se hará una demostración por reducción al absurdo. De esta manera, suponga que 1= 0 Si a es cualquier elemento de los números reales, entonces (elemento idéntico) (1 = 0 por hipótesis) = 0 (teorema 3.1.2) Por lo tanto,  consta solamente del cero, lo que contradice el hecho de que el conjunto de los reales contiene más de un elemento. Entonces la suposición original es falsa y consecuentemente 1≠ 0

  Teorema

3.1.4

0 no tiene un inverso multiplicativo.

Demostración Para todo a ∈ : y 0 ≠ 1 Por lo tanto, 0 no tiene inverso multiplicativo (por el axioma 3.1.5, es el único número real que no lo tiene).

En general, por el axioma 3.1.5, todo número real a tiene un inverso aditivo, llamado –a. El siguiente teorema muestra que sólo hay un inverso aditivo para un elemento de .   Teorema

3.1.5

Cada número real tiene un único inverso aditivo.

Demostración Sea −x un inverso aditivo de x. Entonces, si x + y = 0 sumando −x a ambos lados se obtiene: − x + (x + y) = − x + 0

3.1  El sistema de los números reales

Además − x + (x + y) = (− x + x ) + y =0+ y =y

(ley asociativa) (elemento inverso) (elemento idéntico)

y también −x + 0 = −x (elemento idéntico)

Entonces

y = −x

Corolario 1

0 = −0

Demostración Como

0+0 =0

del teorema 3.1.5 se verifica que

0 = −0

∀ a ∈ , −(−a ) = a

Corolario 2

Demostración

(− a ) + a = 0 el inverso de –a, que es –(–a), es a.

  Teorema

3.1.6

Cada número real, distinto de cero, tiene un único inverso multiplicativo.

Demostración Sea x ≠ 0, x−1 un inverso multiplicativo y suponga que xy = 1. Por demostrar y = x−1 de xy = 1 se obtiene, multiplicando ambos lados por x−1, x −1 (x y) = x −1 (1) , 

(x −1x) y = x −1 , 

∴ y = x −1

1( y) = x −1

91

92

Unidad 3  Sistemas numéricos

En el ejemplo 3.1.3 se demostró que

(ab)(a −1b −1 ) = 1 para cualesquiera números reales no nulos a y b. Al aplicar el teorema 3.1.6 con x = ab ∧ y = a −1b −1 se obtiene el siguiente resultado: a −1b −1 = (ab)−1   Teorema

3.1.7

Regla de los signos

∀ a, b ∈ , (−a)b = −(ab); a(−b) = −(ab).

Demostración Se mostrará que

(−a)b + ab = 0 (−a)b + ab = (−a + a)b = 0b = 0

lo que demuestra que (−a)b es el inverso aditivo de ab, como se quería demostrar. a (−b) = −(ab) y se sigue de la ley conmutativa.

Corolario 1

∀ a, b ∈ ; (−a )(−b) = ab

Demostración

(−a)(−b) = −[a (−b)]

= − −(ab) = ab

(teorema 3.1.7) (corolario 1)

Como un caso especial del corolario 3.1.3 se observa que

Asimismo, a partir del teorema 3.1.7 y del hecho de que

se obtiene la siguiente regla:

(−1) a = −a La operación de sustracción en los números reales se define de la siguiente manera:

3.1  El sistema de los números reales

Definición 3.1.1 Definición de sustracción Sean a, b ∈ . La expresión

a−b

se lee “a menos b” y se define como a + (−b).   Teorema

3.1.8 ∀ a, b, c ∈ ; a (b − c ) = ab − ac .



Demostración a (b − c ) = a[b + (−c )] = ab + a (−c ) = ab + −(ac ) = ab − ac

Es posible establecer otras reglas para la sustracción. En el siguiente ejemplo se describe una de ellas. Ejemplo 3.1.5 Demuestre que ∀ a, b ∈ ; −(a + b) = −a − b Solución −(a + b) = (−1)(a + b) = (−1) a + (−1)b = − a + ( −b ) = −a − b 



Definición 3.1.2 Definición de división Sean a, b ∈  y b ≠ 0. La expresión

a / b

se puede leer “a entre b”, “cociente de a entre b”, “a sobre b” o “fracción de a sobre b”, y se define como ab−1

Esta operación de división se puede expresar en distintas formas, entre ellas a a ÷ b, , b a , a : b b en donde a y b se conocen como numerador y denominador o dividendo y divisor.

93

94

Unidad 3  Sistemas numéricos

La definición de división permite escribir los inversos multiplicativos de otra forma; específicamente, si b ≠ 0, entonces Por lo tanto, se puede escribir Es importante notar que como el número real cero no tiene inverso multiplicativo, la expresión a / 0 no está definida; esto es, en los números reales no es posible dividir entre cero. El siguiente teorema contiene algunas propiedades de la división.

 Teorema 3.1.9 Sean a, b, c, d ∈  con b ≠ 0 y d ≠ 0. Entonces 1. 2. 3.



4.

Las propiedades 1 y 4 se demuestran a continuación. Como ejercicio, se deja a usted que demuestre las otras dos. 1.

(



= (ac ) b −1d −1



= (ac )(bd )

)

−1

2.



= a (1)b −1 + c (1) d −1 = a d d −1 b −1 + c bb −1 d −1



= (ad ) b d

(

(

)

−1 −1

(

)

) + (bc)(b −1d −1)

= (ad + bc )(bd )

−1

El método de demostración dado para la propiedad 4 del teorema 3.1.9 recurre al uso de un común denominador bd para las dos fracciones.   Teorema

3.1.10 a, b ∈  ∧ ab = 0 ⇒ a = 0 ∨ b = 0 



Demostración ab = 0

Suponga que Si a = 0, no hay más por demostrar. Si existe y es posible escribir

a≠0 a−1 a−1(ab) = a−1 . 0 = 0

3.1  El sistema de los números reales

95

a−1(ab) = (a−1a)b = 1 . b = b

Sin embargo, Entonces

b=0

Por lo tanto, si

ab = 0 a=0 ∨ b=0

es necesario que

Axiomas de orden Este postulado permite hacer referencia a algunos números reales como positivos y a otros como negativos. Se usa también para definir las relaciones mayor que, menor que, máximos, mínimos, cotas superiores e inferiores, ínfimo y supremo en el conjunto .

Axioma Axioma de orden El conjunto de los números reales contiene un subconjunto llamado conjunto de los reales positivos. Se representa como + y posee las siguientes propiedades: i) a, b ∈ + ⇒ a + b ∈ + ∧ ab ∈ + (cerradura bajo sumas y productos) ii) si a ∈ , entonces una y sólo una de las siguientes proposiciones es cierta: a = 0 ∨ a ∈ + ∨ −a ∈ + (ley de tricotomía) Los números reales no nulos que no están en + se llaman números reales negativos. La colección de números reales negativos se denotará por −. El conjunto + es no vacío, como puede verse en el siguiente teorema.   Teorema

3.1.11

a ∈  ∧ a ≠ 0 ⇒ a 2 ∈ +.

Demostración Si a ≠ 0, entonces, por el axioma de orden, a ∈ + ∨ −a ∈ +. Si a ∈ +, como + es cerrado con respecto a la multiplicación, se tiene que a . a = a2 ∈ +. Por otra parte, si −a ∈ +, por el corolario 1, (−a)(−a) = a . a = a2, o bien (−a)(−a) ∈ +. En ambos casos se tiene a2 ∈ +. En resumen, ∀a ∈ , a ≠ 0 → a2 ∈ +.

Sean a, b ∈ . Considere a − b. Por el axioma de orden, sólo una de las siguientes proposiciones es cierta: a − b = 0, a − b ∈

+

o −(a − b) ∈

+.

Cuando a − b ∈ +, se dice que b es menor que a y se escribe b < a.

Nota

2 + 1 ≠ 0 ∴ 1 = 1 ∈  . Además, + + k ∈  → 1 + k ∈  . Por lo tanto,

todo número natural distinto de cero es un real positivo.

Definición 3.1.3 Si a, b ∈ , entonces b ≤ a si b = a o b < a. Esta definición determina una relación de orden lineal en ; b está relacionado con a si y sólo si b ≤ a.

96

Unidad 3  Sistemas numéricos

Definición 3.1.4 Si a, b ∈ , entonces a ≥ b ↔ b ≤ a. Mediante el uso de la relación de orden, la ley de tricotomía quedaría así: Para todos a, b ∈ , una y sólo una de las siguientes proposiciones es cierta: a = b, a > b, a < b La conexión entre el axioma de orden y las definiciones de mayor que y menor que se confirma aún más mediante el siguiente teorema.   Teorema

3.1.12

Sea a ∈ . Entonces a ∈ + si y sólo si a > 0; −a ∈ + si y sólo si a < 0.

Demostración a∈

Si se puede escribir Por lo tanto,

a = a + 0 = a + (−0) = a − 0 a ∈ + ⇔ a − 0 ∈ +

Entonces, por la definición de mayor que, a ∈ R+ ⇔ a > 0 Análogamente, para demostrar la segunda parte del teorema se escribe −a = 0 −a − a ∈ + ⇔ a < 0

Entonces,

resultado que puede obtenerse de la definición de menor que.

En otras palabras, el resultado anterior indica que un número real es positivo si y sólo si es mayor que cero, y es negativo si y sólo si es menor que cero. También nótese que, por el teorema 3.1.11, para cada número real a no nulo se tiene que a2 > 0. Podemos utilizar el teorema 3.1.12 para enunciar alternativamente el axioma de orden en la siguiente forma.   Teorema

3.1.13

1. Si a, b ∈ , son tales que a > 0 ∧ b > 0, entonces a + b > 0 ∧ ab > 0. 2. Si a ∈ , entonces una y sólo una de las siguientes proposiciones es cierta: a = 0, a > 0 o a < 0.

Las relaciones “>” y “ b ∧ b > c ⇒ a > c 2. a > b ⇒ a + c > b + c

3.  a > b ∧ c > 0 ⇒ ac > bc 4.  a > b ∧ c < 0 ⇒ ac < bc 

3.1  El sistema de los números reales

Demostración 1. Si a > b ∧ b > c, entonces, por la definición de mayor que:

a − b ∈ + ∧ b − c ∈ + Como + es cerrado con respecto a la adición, (a − b) + (b − c) ∈ + Entonces, a − c ∈ + lo cual, por definición, quiere decir que a>c Esto significa que la relación “>” es transitiva. 2. Sea a>b Entonces las siguientes proposiciones son ciertas: a − b ∈ + (definición de mayor que) (elemento idéntico) (a − b) + 0 ∈ + + (elemento inverso) (a − b) + (c − c) ∈  (ley asociativa) (a + c) − (b + c) ∈ + a + c > b + c (definición de mayor que) El resto de la demostración se deja como ejercicio.

Los resultados que se obtienen para la relación “ b ⇒ a + c > b + c

3.  a < b ∧ c > 0 ⇒ ac < bc 4.  a < b ∧ c < 0 ⇒ ac > bc

La notación

a>b>c

significa que

a>b ∧ b>c

al mismo tiempo, y puede leerse b está entre a y c. De manera similar, uno puede escribir a −3 > −4 >  Al combinar ambas sucesiones resulta  < −4 < −3 < −2 < −1 < 0 < 1 < 2 < 3 < 4 <  Observe que 1 ≤ a para todo a ∈ * . Algunas veces se hace referencia a este hecho diciendo que 1 es el menor entero positivo. Dado que no todo entero tiene inverso multiplicativo en ,  no es un campo, aunque satisface todas las demás propiedades de campo. Siempre es posible expresar un entero dado como un producto de otros enteros. Por ejemplo, el entero 6 puede escribirse como 2 . 3, (−2)( −3), 1 . 6, (−1)( −6), (−1)(2)( −3), y así sucesivamente. Los enteros 2, −2, 3, −3, 1, −1, 6 y −6, que aparecen en estos productos, se llaman factores o divisores de 6, como se indica en la siguiente definición.

Definición 3.1.5 Definición de factor o divisor Si a, b ∈ , y si a = bc para algún c ∈ , entonces b es llamado un factor o divisor de a, y este último se conoce como múltiplo de b (y también de c). Todo entero a tiene factores a, −a, 1 y −1. A éstos se les denomina frecuentemente como factores triviales de a. Si existen otros factores se les llama factores no triviales. Para el entero 6, los factores no triviales son 2, 3, −2 y −3.

Definición 3.1.6 Definición de número primo Un entero no nulo p, diferente de 1 y −1, se llama primo o irreducible si y sólo si sus únicos factores son triviales.

3.1  El sistema de los números reales

99

Observe que, de acuerdo con esta definición, 1 y −1 no se consideran como primos. Los primeros primos positivos son 2, 3, 5, 7, 11, 13, 17 y 19. Una de las razones de la importancia de los números primos radica en que todo entero positivo a > 1 se puede escribir de una y sólo una forma (excepto por el orden de los factores) como un producto de primos positivos. Por ejemplo, se tiene 12 = 2 . 2 . 3, 126 = 2 . 3 . 3 . 7, 540 = 2 . 2 . 3 . 3 . 3 . 5. La demostración de este resultado, que se conoce como el teorema fundamental de la aritmética, no se dará aquí. En la práctica, algunas veces es muy difícil encontrar la factorización prima de un número dado. Sin embargo, tal factorización es siempre posible. Como se ha observado, una característica de los enteros es la no existencia de los inversos multiplicativos para la mayoría de sus elementos. Los únicos enteros invertibles, que se conocen como unidades, son 1 y −1. Con objeto de extender al conjunto de los enteros, de manera que en el nuevo conjunto todos sus elementos no cero sean invertibles, se construye el conjunto  de los números racionales, que por esta razón constituye un subcampo de los números reales. Un número real se llama número racional si puede escribirse en la forma a / b, en donde a y b son enteros y b ≠ 0. Para denotar el conjunto de todos los números racionales se emplea la letra . El conjunto  es cerrado con respecto a la adición y a la multiplicación. Si el cociente a / b ≠ 0, entonces a ≠ 0 y, por lo tanto, b / a ∈ . Observe que (a / b)(b / a) = ab / ba = 1, lo que prueba que todo elemento distinto de cero tiene inverso.  es un campo y la demostración de esta afirmación se sugiere como ejercicio. Como cada entero a puede escribirse como a = a / 1, resulta que  está inmerso en  (la definición de inmersión se da más adelante). Puede demostrarse que no existe un número racional x tal que x2 = 2. Sin embargo, un número real cuyo cuadrado es 2 existe y se denota por 2 . Existen muchos números reales que no son racionales y se llaman números irracionales, entre ellos π, e, la raíz n-ésima de todo entero que no sea entera, como 2 , 3 . El sistema  contiene muchos más números irracionales que números racionales. 22 En ocasiones, para cálculos prácticos, π se aproxima con los números racionales 7 o 3.1416; e con 2.718; 2 con 1.4142, ..., donde el número de cifras decimales queda determinado por el grado de aproximación que el cálculo requiera.

Definición 3.1.7 Definición de valor absoluto El valor absoluto |a| de un número real a se define como i) a = a si a ≥ 0     ii) a = −a si a < 0 De esta definición se observa que el valor absoluto de todo número real no nulo es positivo, pues si a > 0, entonces |a| = a, que está en +. Si a < 0, entonces |a| = −a, que también está en +. De manera equivalente se puede definir a = max{a, − a} lo que significa que el valor absoluto de a es igual al mayor de a y −a. Ejemplo 3.1.6 Encuentre |3|, |−3|, |0|,

2 −2| y |2− 2

Solución Como 3, 0 y 2 −

2 son no negativos, 3 = 3, 0 = 0 y

Por otro lado, −3 y

2− 2 =2− 2

2 − 2 son negativos, y entonces − 3 = −( −3) = 3 y

2 − 2 = −( 2 − 2 ) = 2 − 2 

Aunque en español las palabras máximo y mínimo llevan acento, en las abreviaturas max y min no se han puesto intencionalmente para usar una notación uniforme con otros textos.

100

Unidad 3  Sistemas numéricos

  Teorema

3.1.17

Para todo a, b ∈ : 1. a = − a     2. ab = a b     3. − a ≤ a ≤ a 

Demostración La primera afirmación resulta obvia ya que: a = max{a, − a} y −a = max{−a, a} . La segunda, ab = a b , puede demostrarse revisando las diferentes posibilidades para a y b. Note que si alguno de los dos es cero, el resultado es obvio, y los otros casos se ilustran en la siguiente tabla. Tabla 3.1  Diferentes posibilidades para a y b a

b

ab

|a|

|b|

|ab|

|a||b|

+

+

+

 a

 b

 ab

 ab

+





 a

−b

−ab

−ab



+



−a

 b

−ab

−ab





+

−a

−b

 ab

 ab

La demostración de la tercera afirmación se deja como ejercicio.

  Teorema 3.1.18 Si a, b ∈  y b > 0, entonces 1. |a| < b si y sólo si −b < a < b     3.  |a| = b si y sólo si a = b o a = −b 2. |a| > b si y sólo si a > b o a < −b

Demostración Demostración de 1 ⇒ Sea |a| < b. Del inciso 3 del teorema 3.1.17 se tiene que a ≤ |a| y, por lo tanto, a < b. Al multiplicar ambos lados de |a| < b por −1 resulta que −b < −|a|. Nuevamente, del teorema 3.1.17, −|a| ≤ a, y entonces −b < a. Esto permite concluir que −b < a < b. ⇐ −b < a < b, donde b > 0. Si a es no negativo, entonces |a| = a, de donde |a| < b. Si a es negativo, entonces ocurre que |a| = −a, como −b < a, −a < b, de donde se concluye otra vez que |a| < b, por lo que en ambos casos |a| < b.

Las demostraciones de 2 y 3 se dejan como ejercicios. El teorema 3.1.18 nos dice que |a| < b si y sólo si a está entre −b y b. Por ejemplo, |a| < 2 si y sólo si −2 < a < 2.

Axioma de completez Para caracterizar al sistema de los números reales se necesita un axioma, el de completez o teorema de Dedekind,1 cuyo enunciado requiere de algunas definiciones preliminares. 1

Cuando los números reales se construyen usando el método de cortaduras, el enunciado es un teorema, pero cuando se definen axiomáticamente, tiene que ser un axioma.

3.1  El sistema de los números reales

Definición 3.1.8 Sea S un conjunto no vacío de números reales. i) Un número real u es una cota superior de S si s ≤ u para todo s ∈ S. ii) Un número real l es una cota inferior de S si l ≤ s para todo l ∈ S. iii) Un número real u′ es la menor cota superior o supremo de S (sup S) si u′ es una cota superior de S y es menor o igual que cualquier otra cota superior de S. Es decir, una cota superior u′ es el supremo del conjunto S si y sólo si para cualquier número a menor que u′ existe un elemento del conjunto mayor que a, ya que a no es una cota superior. iv) Un número real l ′ es la mayor cota inferior o ínfimo de S (inf S) si l ′ es una cota inferior de S y es mayor o igual que cualquier otra cota inferior de S. No siempre existen cotas superiores o inferiores para subconjuntos de . Sin embargo, está claro que si u es una cota superior de S, entonces cualquier número mayor que u también es cota superior. De la misma manera, cualquier número menor que una cota inferior también es cota inferior. Por ejemplo, sea S = {−4 / 3, 3, 0, 2 / 9, −1 / 2, 7 / 5}. Cualquier número real u tal que u ≥ 3 es una cota superior de S. En particular, 4, 17, π, 468, 3.001 y 3 son cotas superiores. También cualquier número l tal que l ≤ −4 / 3 es una cota inferior de S. Observe que las cotas superiores e inferiores de un conjunto S no tienen por qué pertenecer a S. El conjunto * = {1, 2, 3, …} tiene muchas cotas inferiores. Entonces, 0, 2  / 2, 7 / 8, −5 y 1 son números menores o iguales a todos los números en *, conjunto que no tiene cotas superiores como se probará más adelante. En el conjunto S del ejemplo anterior se observan varias cotas superiores. Una de ellas, el número 3, puede considerarse la “mejor” cota superior en el sentido de que es el menor número real entre todas las cotas superiores. Análogamente, entre todas las cotas inferiores de S, −4 / 3 es la mayor. De acuerdo con los incisos iii) y iv) de la definición 3.1.8 resulta, que 3 = sup S, −4 / 3 = inf S.   Teorema 3.1.19 Para un conjunto, si un supremo o un ínfimo existen, son únicos. Para demostrar este teorema, suponga que u′ y v′ son supremos del conjunto S. Una y sólo una de las siguientes relaciones es cierta: u′ < v′, v′ < u′ o u′ = v′. Sin embargo, si u′ < v′, se tiene una contradicción con el hecho de que v′ es la menor cota superior de S. De la misma manera, v′ < u′ contradice el hecho de que u′ es la menor cota superior. Entonces, u′ = v′, lo cual demuestra que el conjunto sólo puede tener un supremo. Análogamente, un conjunto puede tener a lo más un ínfimo. El inf ∗ es 1. Ejemplo 3.1.7

Suponga a, b ∈ , con a < b, y sea Demuestre que b es el sup S.

S = {x ∈ 

a < x < b} .

Solución Como x < b para todo x ∈ S, el número b es una cota superior de S. Obviamente, cualquier número real menor o igual que a no es cota superior. Para probar que b es el sup S considere cualquier c+b c+b número real c tal que a < c < b. Se puede probar entonces que c < < b. De esta manera, 2 2 está en S y es mayor que c; por lo tanto, c no es cota superior de S. Entonces, b es el sup S, dado que es cota superior y que ningún elemento menor que él lo es. Para demostrar que a es el inf S se puede emplear un argumento análogo.

Axioma 3.1.6 Axioma de completez (o teorema de Dedekind) Sea S un conjunto no vacío de números reales. Si S tiene una cota superior, entonces tiene supremo. Análogamente, si S tiene una cota inferior, tiene ínfimo.

101

102

Unidad 3  Sistemas numéricos

A un campo que satisface el axioma de orden y el de completez se le conoce como campo ordenado completo. Puede demostrarse que el sistema de los números reales  es el único campo  ordenado completo. Ejemplo 3.1.8

Demuestre que el conjunto  de los números naturales no tiene cotas superiores. Solución Se demuestra por reducción al absurdo. Suponga que  tiene una cota superior. 1 Entonces, por la propiedad de completez, existe el sup  (digamos u); entonces u − 2 no es una 1 cota superior, y por lo tanto existe un n0 ∈  tal que u − 1 < n0.2 Entonces ¡ u + 2 < (n0 + 1) ≤ u !, 2 absurdo que demuestra el teorema.

(

)

Del ejemplo anterior se sigue que para todo número real x existe un entero positivo n tal que n > x.

Propiedad arquimediana de los números reales Dado un número arbitrariamente pequeño μ ∈ + y un número M ∈  tan grande como se quiera, existe un número natural n0 tal que n0μ > M.

Demostración El número M µ es un número real y, por lo tanto, existe un natural n0 mayor que él, es decir, M < n . Dado que la multiplicación por positivos no altera el sentido de las desigualdades, µ 0 n0 µ > M . Un corolario importante de la propiedad arquimediana es el hecho de que en  no existen los infinitésimos.3 La propiedad de completez desempeña un papel muy importante en el estudio de los números reales. Por ejemplo, con ella se pueden demostrar los siguientes teoremas: • Sea f : [a, b] →  una función continua tal que f (a) f (b) < 0. Entonces existe c ∈ (a, b) tal que f (c) = 0. Este teorema afirma que no se puede pasar en forma continua de un semiplano al otro sin cortar el borde (la recta no tiene hoyos). • Para cada número real positivo a existe un número real x tal que x2 = a. De manera más general, si a > 0 y n ∈ , entonces existe un único número real b > 0 tal que bn = a. Este número b se llama raíz n-ésima de a. • El conjunto de los números racionales es denso en el conjunto de los números reales; es decir, entre cualesquiera dos números reales x y y existe un número racional.

Algunas representaciones de los números reales Hasta este momento se ha trabajado para desarrollar un sistema de axiomas que caracterice a los números reales, de tal manera que cualquier otra propiedad que tengan pueda deducirse de éstos. Para continuar esta vertiente se procede a desarrollar: i) las representaciones de los números reales y ii) la interpretación geométrica de los números reales como puntos en una línea recta, lo que no se hará de manera totalmente rigurosa; por el contrario, se hará hincapié en el trabajo matemático que todo estudiante ha realizado previamente.

2

Ver la definición de supremo. Un infinitésimo positivo puede definirse como un real positivo menor que –1n para toda n ∈ *. Este concepto fue empleado en los inicios del cálculo diferencial. Por razones históricas, algunos libros de cálculo conservan el nombre (incorrecto) de cálculo infinitesimal. 3

3.1  El sistema de los números reales

Representación decimal de los números reales Se asume familiaridad con el proceso de la división y con expresiones como: 1 1 1 9 = 0.1, = 0.01, = 0.001, = 9( 0.01) , 10 100 1 000 100 y así sucesivamente. A una expresión de la forma 7.4934 se le llama decimal que termina y es igual al número racional 7 493 / 1 000, que también puede interpretarse como la suma de 7, 0.4, 0.09 y 0.003. Es posible preguntar ahora qué sentido puede darse a un número decimal que no termina, por ejemplo, una expresión de la forma 13.4637 = 13.4637637637 donde la línea superior en los números y los puntos suspensivos indican que los dígitos 6, 3, 7 se repiten en ese orden un número infinito de veces. Tal expresión se llama expresión periódica infinita. No es necesario decir que también existen decimales infinitos no periódicos, donde tal repetición de dígitos no ocurre. Al trabajar con expresiones de este tipo se pueden suprimir las terminaciones decimales infinitas usando la propiedad de completez; específicamente, se puede estar de acuerdo en que un símbolo como 4.176429… (ya sea periódico o no) es una notación para el supremo del siguiente conjunto de números reales: {4, 4.1, 4.17, 4.176, 4.1764, …} De manera incidental, un decimal que termina como 7.493, puede ser considerado también como un decimal infinito, o sea 7.493000…, y también como 7.4929 . A expresiones como éstas se les llama representaciones decimales de números reales. El término “decimal” se refiere a que usa como base el número 10 y sus potencias. Esta representación, introducida por los árabes, es la que más se emplea actualmente; sin embargo, desde la antigüedad se han utilizado diversas bases, como la sexagesimal5 (base 60), vigesimal6 (base 20), y en la actualidad, con el desarrollo de la informática, adquirieron relevancia la binaria (base 2), la octal (base 8) y la hexadecimal (base 16). De los párrafos anteriores se sigue que toda expresión decimal, periódica o no, representa un número real. En sentido inverso, es posible demostrar que todo número real tiene una representación decimal. Para números racionales, esta representación se encuentra por medio de la división; por ejemplo, cuando se divide 7 434 entre 2 310 se obtiene 3.218 . Se puede demostrar que la representación decimal de todo número racional es periódica y recíprocamente toda representación decimal periódica es un número racional. Las representaciones decimales que no son periódicas corresponden a números irracionales y se pueden aproximar mediante procedimientos como los aprendidos en aritmética para extraer raíces cuadradas o algunas otras maneras de aproximación sucesiva. Se dispone de recursos numéricos para denotar números reales cuyo mayor empleo se tiene en el trabajo con problemas de aplicación de la matemática en las ciencias. Los números reales se pueden definir como el conjunto de todas las posibles expresiones decimales infinitas; sin embargo, en este caso existe el problema (no resuelto hasta ahora) de definir la igualdad, la adición y la multiplicación de tales expresiones, por lo que la demostración de las propiedades de los números reales requiere de otro tipo de representación (como la axiomática o la de cortaduras de Dedekind).

Interpretación geométrica de los números reales como puntos en una línea recta Es posible asociar el conjunto de los números reales  con los puntos sobre una línea recta l de tal manera que a cada número real a corresponda uno y sólo un punto, e inversamente, a cada punto P en l le corresponda precisamente un número real. Tal asociación entre dos conjuntos se conoce como una correspondencia uno a uno, que se inicia seleccionando un punto arbitrario O en l, llamado el origen a quien se asocia el número real 0; posteriormente se escoge cualquier otro punto P1 y se asocia con el número real 1. El segmento lineal OP1 de O a P1 se dice que tiene longitud unitaria. A cada número real a le corresponde el punto de la recta que está situado a la dis-

4

7,493 según la Norma Oficial Mexicana, aunque el uso del punto decimal (que también está autorizado) es más frecuente que el de la coma. 5 Que sobrevive en la geometría (medidas angulares) y en la medición del tiempo (minutos y segundos). 6 Representación usada por los mayas.

103

104

Unidad 3  Sistemas numéricos

tancia a del origen y, recíprocamente, a cada punto le corresponde el número real que marca su distancia. La construcción geométrica7 -3 -2 -1 0 1 2 3 de algunos de esos puntos se puede continuar marcando segmentos sucesivos de longitud unitaria a lo largo de l a partir de P1, con lo Figura 3.1  Correspondencia entre el conjunto de que se obtienen los puntos P2, P3, …, los que se asocian con los núlos enteros y puntos en l. meros enteros 2, 3, …, respectivamente. Este proceso corresponde a la operación algebraica de sumar 1 consigo mismo muchas veces. De la misma forma, trabajando sobre l en el lado opuesto se localizan los puntos P−1, P−2, …, que corresponden a los enteros negativos −1, −2, …. La figura 3.1 ilustra la correspondencia que existe entre el conjunto de los enteros y ciertos puntos en l. Cada segmento lineal en l se puede subdividir en n partes iguales, para cualquier entero positivo n, trazando una diagonal a partir del cero y marcando en ella n segmentos de igual dimensión, de manera que el origen del primero coincida con el cero. Se traza una recta desde el final del último punto con el que corresponde al uno. La intersección de las paralelas desde cada punto de los extremos de los n segmentos con el segmento OP1 define la división deseada. Si el segmento OP1 se subdivide de esta forma, el punto final de la primera subdivisión corresponde al número racional 1 / n, y contando un número m de dichos segmentos podemos asociar un punto en l con cualquier número racional positivo m / n, que equivale con la multiplicación m(1 / n). Entonces, el punto correspondiente a 13 / 5 está a 13 / 5 de unidades del origen (o a 3 / 5 del punto P (1, 1) 2 en el segmento P2P3). Los números racionales negativos se manejan en forma análoga. De todo punto que se localice geométricamente en √2 1 l la recta l, de la manera anterior, se dirá que se ha construido. Es posible determinar ciertos puntos en l asociados con números -1 0 1 √2 2 3 irracionales; por ejemplo, el punto que corresponde con 2 se puede construir trazando un arco de circunferencia con centro en 0 y que Figura 3.2  Trazo geométrico de la raíz de 2. pase por el punto (1, 1), como se indica en la figura 3.2. En general, se puede construir geométricamente la raíz cuadrada de cualquier número real positivo que se haya construido previamente, como se ilustra a continuación: Sea a un número real positivo ya construido. Marque en la recta un segmento AM de longitud a y otro MB de longitud 1, A B determine el punto medio del segmento AB y, haciendo centro en él, trace una cira M 1 cunferencia de diámetro (a + 1) (figura 3.3). Por el punto M trace una perpendicular al diámetro AB y llame C al punto de intersección de esta perpendicular con la circunferencia. Los triángulos AMC y CMB son rectángulos (CM ⊥ AB). El triángulo ACB también es rectángulo, ya que el ángulo C interseca un diámetro de la circunferenFigura 3.3  Primer paso en la conscia en la que está inscrito (figura 3.4). trucción de la raíz de a. l

P-3

P-2

P-1

O

P1

P2

P3

C

A

a

M

CC

1

B

Figura 3.4  Segundo paso en la

AA

aa

MM 1 1

CC

BB

AA

aa

MM 1 1

BB

Figura 3.5  Tercer paso en la construcción de la raíz de a.

construcción de la raíz de a.

7 Se dice que un punto se puede construir geométricamente (es constructible) si y sólo si puede dibujarse utilizando sólo regla y compás.

3.1  El sistema de los números reales 105

3.1  El sistema de los números reales

Por lo tanto, los triángulos AMC y CMB son semejantes, de donde las longitudes de sus lados correspondientes son proporcionales. AM CM = Razón por la cual . CM CM a x Dado que MB = 1, AM = a y CM = x resulta que = , de donde CM = x es la x 1 raíz cuadrada de a (figuras 3.6 y 3.7). No todos los puntos que correspondan a números irracionales se pueden construir. El número π = 3.1415927… es irracional, pero su construcción es imposible; sin embargo, la posición de este o de cualquier otro número irracional en l puede aproximarse teóricamente con tanta precisión como se quiera. Por ejemplo, los puntos correspondientes a los números 3, 3.1, 3.14, 3.141, 3.1415, … que aproximan π, se pueden situar de manera sucesiva. Es posible demostrar que a cada número irracional le corresponde un punto único en l, e inversamente, a cada punto que no esté asociado con un número racional le corresponde un número irracional. El estudio de los números constructibles (C 0 ) se remonta a la época en que Platón y sus discípulos (aproximadamente 300 años antes de nuestra era) plantearon lo que se conoce como los tres problemas clásicos de la geometría: la trisección del ángulo, la duplicación del cubo y la cuadratura del círculo, que consisten en: i) dado un ángulo cualquiera, construir dos rayos que lo dividan en tres ángulos congruentes (de igual medida), ii) dado un cubo regular (su arista), construir otro cuyo volumen sea el doble del primero, iii) construir el lado de un cuadrado cuya área sea igual a la de un círculo dado,

C x A

a

M

1

B

Figura 3.6  Semejanza de los triángulos involucrados. C

√a A

a

M

1

B

Figura 3.7  Raíz cuadrada de a.

en donde, por supuesto, las construcciones deben hacerse utilizando únicamente un compás y una regla no graduada (sin marcas). La solución de cada uno de los problemas anteriores requiere de la determinación, con regla y compás, de números inconstructibles y, por lo tanto, no es posible resolverlos. La demostración de la insolubilidad de estos problemas se basa en argumentos del álgebra abstracta, esencialmente en los trabajos de Galois, cuyos teoremas permiten diferenciar completamente los números constructibles de los no constructibles. La demostración de estos resultados no se presenta aquí porque no corresponde al nivel en el que están escritas estas notas y, simplemente, como un “breviario cultural”, se apuntan los siguientes hechos: 1. Cero es constructible: 0 ∈C 0. 2. La suma de constructibles es constructible: a, b ∈C 0 ⇒ (a + b) ∈C 0. 3. El inverso aditivo de todo número constructible es constructible: a ∈C 0 ⇒ − a ∈C 0 .

La suma de números reales (los constructibles lo son) es conmutativa; por lo tanto, C 0 es un grupo abeliano. 4. 1 es constructible: 1 ∈C 0 . 5. El producto de números constructibles es constructible: a, b ∈C 0 ⇒ ab ∈C 0. 6. El inverso multiplicativo de todo número constructible diferente de cero es constructible: a ∈C 0 , a ≠ 0 ⇒ a −1 ∈C 0 . La multiplicación de números reales es conmutativa y se distribuye sobre la suma; por lo tanto, C 0 es un subcampo de los números reales. 7. Se puede demostrar que un número real es constructible si y sólo si está en una extensión de ℚ de grado alguna potencia de 2. El coseno de 20° es raíz de la ecuación 8x3 + 6x − 1 = 0 y la raíz cúbica de 2 satisface x3 − 2 = 0, que son ecuaciones con coeficientes enteros, por lo que, aplicando el método de la división sintética, se puede comprobar que ninguna tiene raíces racionales, lo que implica que son irreducibles en ℚ(x). Si se pudieran factorizar, tendrían necesariamente un factor de primer grado y, por lo tanto, una raíz racional; es decir, tanto cos 20° como 3 2 están en extensiones de ℚ de grado 3. π es trascendente. Lo anterior demuestra que cos 20°, 3 2 y π son inconstructibles y que, por lo tanto, no se puede trisecar el ángulo de 60°, duplicar el cubo unitario, ni cuadrar el círculo de radio uno.

106

Unidad 3  Sistemas numéricos

Todo número x que esté asociado con un punto X en l es la coordenada de X, y a X se le llama la gráfica de x. Esta asociación se denomina sistema de coordenadas para l, y l se conoce como una línea coordenada y se representa generalmente como una línea horizontal, tomando los números reales positivos como coordenadas de puntos a la derecha de O y los números reales negativos como coordenadas de puntos a la izquierda de O. De tal manera, es posible asignar una dirección a l, tomando como dirección positiva a lo largo de l aquella en la que las coordenadas crecen y como dirección negativa aquella en la que decrecen. La dirección positiva se denota colocando una punta de flecha en l, como se muestra en la figura 3.2. En caso de que las coordenadas estén asignadas de esta manera, es evidente que si los números reales a y b son coordenadas de los puntos A y B, respectivamente, entonces a < b si y sólo si B está a la derecha de A. Si se desea describir geométricamente al conjunto S = {x ∈  | a < x < b} la porción de l que corresponda a los puntos entre A y B se remarca, como se observa en la figura 3.8. El paréntesis en la figura indica que los puntos correspondientes a a ( ) y b no se incluyen; en caso de que se quiera incluir a A o B, se emplearán corchetes a b en lugar de paréntesis. El conjunto S se llama un intervalo abierto de a a b y se denota por el símbolo Figura 3.8  Intervalo (a, b). (a, b),8 de manera que el conjunto de puntos en l entre A y B se denominará gráfica de (a, b); asimismo, los intervalos cerrados se denotarán por [a, b] y los intervalos semiabiertos por los símbolos [a, b) y (a, b], los cuales se definen de la manera siguiente: A

B

[ a, b ] = {x ∈  | a ≤ x ≤ b} [ a, b ) = {x ∈  | a ≤ x < b} ( a, b ] = {x ∈  | a < x ≤ b} Sus gráficas se presentan en la figura 3.9. A

A

A

B

    ] ][ b

[

[

[

]

a

a

a

b

B

BA

ba

A

B

[

[

)

a

a

b

A

A

B

B

B

)

( )    (

(

]

]

]

b

ba

a

b

b

b

B

BA

A

a

Figura 3.9  Representación de intervalos cerrados y semiabiertos.

Ocasionalmente se considerarán los siguientes conjuntos de puntos en l no acotados: ( a, ∞ ) = {x ∈  | x > a} [ a, ∞ ) = {x ∈  | x ≥ a} ( −∞, a ) = {x ∈  | x < a} ( −∞, a ] = {x ∈  | x ≤ a} ( −∞, ∞ ) =  (

El símbolo ∞, que se lee infinito, es solamente un artificio de notación y nunca debe interpretarse como la representación de un número real.9 La figura 3.10 presenta una parte de la gráfica de (a, ∞), donde la flecha indica que la gráfica continúa indefinidamente hacia la dereFigura 3.10  Intervalo cha, en virtud de que no es posible dibujar la gráfica completa. (a, ∞). Finalmente, es posible asignar valores numéricos a los segmentos en l, de acuerdo con la siguiente definición: a

8

En algunos libros, el intervalo abierto (a, b) también se dibuja con círculos blancos en los puntos A y B, usando corchetes invertidos ]a, b[, o de alguna otra forma. 9 En el estudio del cálculo, algunas veces conviene considerar ∞ y −∞ como números; en ese caso el conjunto que resulta se llama el conjunto de los números reales aumentados, cuya aritmética debe modificarse en la forma adecuada.

3.1  El sistema de los números reales

Definición 3.1.9 Definición de longitud Sean a y b las coordenadas de dos puntos A y B, respectivamente, sobre la recta coordenada l, y sea AB el segmento lineal de A a B. La longitud d(A, B) de AB se define por d(A, B) = |b − a| y señala la distancia de A a B. Observe que la distancia entre dos puntos se definió como un valor absoluto y, por lo tanto, para todos los puntos A, B y C de l: i) d (A, B) ≥ 0; d (A, B ) = 0 ⇔ A = B ii) d (A, B) = d (B, A) iii) d (A, B) ≤ d (A, C ) + d (C , B ) Ejemplo 3.1.9

Suponga que los puntos A, B, C y D tienen las coordenadas −5, −3, 1 y 6, respectivamente (figura 3.11). Encuentre d(A, B), d(C, B), d(O, A) y d(C, D). A

B

O C

D

-5

-3

0 1

6

Figura 3.11  Coordenadas de los puntos A, B, C y D.

Solución Por la definición se tiene d ( A, B ) = −3 − ( −5 ) = −3 + 5 = 2 = 2 d (C , B ) = −3 − 1 = −4 = 4 d (O, A) = −5 − 0 = −5 = 5 d (C , D ) = 6 − 1 = 5 = 5 



En algunos casos se desea trabajar con distancias a lo largo de l que consideren la dirección de l, por lo que se presenta la siguiente definición.

Definición 3.1.10 Distancia dirigida Sean a y b las coordenadas de dos puntos A y B, respectivamente, sobre la línea coordenada l. → → La distancia dirigida AB de A a B se define como AB = b − a. →





Como BA→ = a − b se tiene que AB = − BA. Evidentemente, el punto B está a la derecha de → A si y sólo si AB > 0, y está a la izquierda de A si y sólo si AB < 0. De esta manera, la distancia dirigida indica, además de la magnitud, la dirección de A a B, que es positiva cuando coincide con la dirección asignada a l. Ejemplo 3.1.10 →







Si A, B, C y D son los puntos del ejemplo 3.1.9, encuentre AB , BA , CB y OA .

107

108

Unidad 3  Sistemas numéricos

Solución De la definición se obtiene





AB = −3 − (−5) = 2



BA = −5 − (−3) = −2



CB = −3 − 1 = −4



OA = −5 − 0 = −5











Considere que M es el punto medio del segmento AB. Entonces, AM = MB , ya sea que → AB > 0 o AB < 0 (figura 3.12). →

A A

M M

B B

B B

M M

A A

a a

m m

b b

  b b

m m

a a

Figura 3.12  Punto medio del segmento de extremos A y B.

Entonces, si m es la coordenada de M, se tiene m − a = b − m. Al sumar m + a a ambos lados y a+b simplificando se obtiene 2m = a + b, y entonces m = , lo que demuestra el siguiente teorema. 2

 Teorema 3.1.20 Sean a y b las coordenadas de dos puntos A y B, respectivamente, sobre la línea coordenada l. Entonces la coordenada del punto medio M del segmento AB es m=

a+b 2

Ejemplo 3.1.11

Sean A, B, C y D como en el ejemplo 3.1.9. Encuentre las coordenadas de los puntos medios de los segmentos AB, BC y CD. Solución Por el teorema 3.1.20 se tienen las siguientes coordenadas de los puntos medios: Segmento AB: m1 =

−5 + ( −3) −8 = = −4 2 2

Segmento BC: m2 =

−3 + 1 −2 = = −1 2 2

Segmento CD: m3 =

1+ 6 7 =  2 2

Uno de los errores más comunes en la determinación del punto medio de un segmento AB consiste en sustraer las coordenadas de A y B y dividir entre 2, por lo que es muy recomendable notar que el teorema 3.1.20 establece que las coordenadas deben sumarse y la suma dividirse entre 2.

3.1  El sistema de los números reales

Ejercicios 3.1 1. Pruebe, por medio de las propiedades de un campo, cada una de las reglas siguientes, indicando

la razón de cada paso. a) (a + c ) + (d + b) = (a + b) + (c + d ) b) d + [(c + b) + a] = (a + b) + (c + d ) c) (−b + a ) + (−a + b) = 0 d) c[(db) a] = (ab)(cd ) e) a[(b + c ) + d ] = ab + a (d + c ) f ) Si a ≠ 0, entonces a −1b a = b g) Si a ≠ 0, b ≠ 0, entonces (ab) (a–1 + b–1) = a + b h) Si a ≠ 0, b ≠ 0, entonces a–1b (a + b–1) = a–1 + b

(

)

2. Justifique las igualdades indicadas:

c) (a − b)(c − d ) = (ac + bd ) − (ad + bc)

a) a − (b + c ) = (a − b) − c b) −[−(−a )] = −a

d) Si b ≠ 0, entonces –(a/b) = −a/b = a/(−b)

3. Demuestre que

a) si d ≠ 0, entonces a / d + c / d = (a + c) / d b) si a ≠ 0 y b ≠ 0, entonces (a / b)−1 = b / a c) en la expresión (a + c) / (b + c) no vale cancelar c d) lo siguiente no es cierto para todo a, b y c ∈ : c / (a + b) = c / a + c / b 4. Demuestre que, para todos a, b, c, d ∈ .

a) Si a > b y c > d, entonces a + c > b + d . b) Si a ≤ b, entonces a + c ≤ b + c. c) Si a ≤ b y b < c, entonces a < c. d) a < b si y sólo si −a > −b. e) Si a ≤ b y b ≤ a, entonces a = b. f) Si b, d ∈ +, demuestre que a / b < c / d si y sólo si ad < bc. Y si alguno de ellos, b o d, es negativo, ¿cuál sería la expresión? 5. Encuentre tres cotas superiores e inferiores, así como el supremo y el ínfimo, cuando éstos exis-

tan, en los siguientes conjuntos:

a) b) {x ∈  | −2 < x ≤ 2}

c) {x ∈  | x < 4} 1 d) n | n ∈  2

{

}

6. Demuestre que

a) si S = {x ∈  | x ≥ π} inf S = 5, ¿o no? b) un conjunto tiene, a lo más, un ínfimo. c) el conjunto Z− no tiene cotas inferiores. d) para todo x ∈ R existe n, m ∈ Z tales que n < x < m . 7. Explique cómo usar un triángulo rectángulo para encontrar un punto en una línea coordenada

que represente 8. Demuestre que

5. →





a) si J, K y L son tres puntos cualesquiera en una línea coordenada l, entonces JK + KL = JL . b) si J, K, L y M son cuatro puntos cualesquiera en una línea coordenada l, entonces → → → → JK − LK = JM + ML . c) si J, K y L son puntos cualesquiera en una línea coordenada l, entonces no siempre es cierto que d(J, K) + d(K, L) = d(J, L).

109

110

Unidad 3  Sistemas numéricos

3.2  Números complejos Una característica importante del conjunto  de los números reales es que tiene una clase positiva +, que define al orden canónico en , que por ser compatible con las operaciones tiene, entre otras, la propiedad de que para toda a diferente de cero, a2 es un positivo y, por lo tanto, la ecuación x2 + 1 = 0 no puede tener solución en . Como en otros casos (construcciones de ℤ y ℚ), se pensó en extender  a un campo más grande, en el que la mencionada ecuación pudiera resolverse. Era necesario construir un campo en el que existiera un número imaginario,“i”, que satisficiera la ecuación x2 + 1 = 0 que fuera una extensión de  y, por supuesto, que resultara el más “económico”, en el sentido de la contención, con esas propiedades. En la época en que surgió este problema no se conocía el teorema que asegura que para todo campo K y todo polinomio f (x) no constante, con coeficientes en K, existe una extensión de K en la que el polinomio tiene al menos una raíz, teorema que valida la construcción, que resulta más natural y que la hubiera librado de las objeciones —injustificadas— que en su momento se hicieron, y que se referían al invento de los números imaginarios. Es pertinente observar que en el campo cuya construcción se deseaba no puede haber una relación de orden compatible con las operaciones, que es la única que interesa al álgebra, ya que en ese caso, como en el de los reales, los cuadrados tendrían que ser no negativos. Por esta razón, algunos autores que enfatizan la propiedad dicen que  es el “desordenado” campo de los números complejos, a pesar de que, como una consecuencia del axioma de selección, resulta que en todo conjunto se puede definir un buen orden. Lo que no puede asegurarse es que ese orden resulte compatible con las operaciones. Puestos a estudiar ese hipotético campo en el que figura esa misteriosa i, se vio que tenían que estar también todas sus potencias (i2, i3, ...) productos de éstas por números reales y sumas de tales productos, es decir, debían estar consideradas todas las expresiones de la forma:





(3.2.1)

además de sus inversos multiplicativos. Se notó que como i2 = −1 i3 = i2 · i = (−1)i = −i i4 = i2 · i2 = (−1)(−1) = 1 si n es un número natural tal que n = 4q + r, 0 ≤ r < 4 i n = (i 4)q · i r = 1 · i r = i r o sea, i n es 1, i, –1 o –i, observación que permite simplificar las expresiones 3.2.1, que pueden reducirse a binomios de la forma a + bi , a, b ∈  .

Ejemplo 3.2.1



3 + 2i − 7i 2 + 2i 3 − i 4 + 7i 5 = 3 + 2i − 7 (−1) + 2 (−i ) − 1 + 7i = 9 + 7i  Ejemplo 3.2.2

1 + i 3 + i 37 − i 204 = 1 − i + i − 1 = 0 

Ejercicio 3.2

Exprese en la forma a + bi : 3

7

1. 2 − 8i + 7i − 3i + 16i

20



( )

2.  2i 3

5



3. 

(2 − 7i )2 1 + 3i − 2i 2 + i 3 + 2i 7



3.2  Números complejos

Tomando en cuenta lo anterior, se procedió a estudiar al subconjunto β formado por los elementos del nuevo campo que pueden expresarse como binomios. Es decir,

β = { a + bi ∈ ; a, b ∈ , i 2 = −1 } Como siempre que se define un conjunto nombrando a sus elementos, es conveniente aportar un criterio que permita decidir cuando dos nombres corresponden al mismo individuo. Se hace notar que, puesto que se trata de un campo, a + bi = c + di ⇒ (a − c ) = (b − d )i , y que, por lo tanto, (a − c)2 = −(d − b)2 i;, que es una igualdad en  que implica que cada cuadrado debe ser necesariamente 0, y por lo tanto, a = c y b = d . Es decir que en β cada elemento tiene una representación única. Por ejemplo, si se supiera que i = u + vi , se sabría que u = 0 y v = 1. Como β es subconjunto de un campo, (a + bi) (c + di) = (a + c) + (b + d)i, de donde resulta que la adición, en , de elementos de β, produce un elemento de β (β es cerrado bajo la adición de ), y, por lo tanto, la restricción de ésta a β × β es una operación binaria en β que, por herencia, resulta asociativa y conmutativa. 0 = 0 + 0i está en β, y para cada a + bi ∈ β (−a ) + (−b) i el inverso aditivo de a + bi también es un elemento de β; luego, {β, +} es un grupo abeliano. Ejemplo 3.2.3

(3 + 4i ) + (6 + 5i ) = (3 + 6) + (4 + 5) i = 9 + 9i 



Ejemplo 3.2.4

(6 − 14i ) − (−10 + 17i ) = 16 − 31i 

Ejercicio 3.2

2. Exprese el resultado de las operaciones siguientes en la forma a + bi.

(4 + 7i ) + (8 − 3i ) (2 + 7i ) − (6 + 2i ) (11 + i ) + (3 − 4i ) (9 − i ) − (2 − 3i ) e) (5 + 2i ) − (6 + 5i )

f)

(

) (

)

j)

(2 + i 3) − (5 + 2 3i ) + (7 − 3 3i )

2 + i 3 − 5 2 − 3i g) (9 − i ) + (2 − 2i ) h) [(2 + 4i ) + (6 − 2i )] − (6 − 11i ) i) (−6 + 4i ) − [(1 − 6i ) − (−5 − i )]

a) b) c) d)

El producto, en , de dos elementos de β está en β. En efecto, (a + bi) (c + di) = (ac − bd) + (ad + bc)i, y, por lo tanto, β tiene también una multiplicación que, por ser la restricción de la de un campo, es asociativa, conmutativa, tiene idéntico (1 = 1 + 0i) y se distribuye sobre la suma por ambos lados. Ejemplo 3.2.5

(6 + 3i )(2 + 4i ) = (12 − 12) + (6 + 24)i = 30i 

Ejemplo 3.2.6



(2 + i 3) (5 − 6

)

(

)

3 i = (10 + 18) + 5 3 − 12 3 i = 28 − 7 3 i 

Finalmente, si a + bi ∈ β y es a + bi ≠ 0 + 0i ( a ≠ 0 o b ≠ 0 y, por lo tanto, a 2 + b2 > 0 ),

(a + bi )−1 =

a −bi + 2 2 a + b2 a +b 2

111

1.1  Lógica matemática 112

Unidad 3  Sistemas numéricos

 a −bi  + 2 como puede comprobarse efectuando el producto (a + bi) 2  , por lo que resulta 2 a + b a + b2  que β es un campo. Cada número real a = a + 0i está en β, así como i = 0 + 1i. Obviamente, β es el menor campo en el sentido de la contención con esas dos propiedades. Luego, β =  es el campo que se deseaba construir. Para ver cómo se obtiene el inverso multiplicativo de a + bi considere un número x + yi tal que multiplicado por a + bi resulte igual a 1 + 0i, es decir,

(x + yi )(a + bi ) = 1 + 0i al efectuar la multiplicación

(ax − by) + (ay + bx)i = 1 + 0i de donde ax − by = 1 bx + ay = 0 Como a + bi ≠ 0, a ≠ 0 o b ≠ 0 y, por lo tanto, a 2 + b2 > 0, por lo que, aplicando la regla de Cramer, se obtiene

1 −b 0 a a x= = a −b a 2 + b2 b a es decir,

(a + bi )−1 =

a b y= a b

1 0 −b = −b a 2 + b2 a

a −bi + a 2 + b2 a 2 + b2

Ejemplo 3.2.7

Considere el ejemplo siguiente. Se desea encontrar (3 + 4i )−1 , que de acuerdo con lo anterior resulta , y se comprueba

Se define el conjugado de un número complejo z = a + bi como z = a − bi. Así, si z = 3 + 4i , su conjugado z = 3 − 4i , y entonces, al recordar que la expresión a / b representa al producto de a por el inverso de b, (a / b = ab−1), se encuentra que para efectuar la división de z entre w basta multiplicar el cociente por , con lo que se obtiene el resultado deseado. Ejemplo 3.2.8

Divida (2 − i ) entre (1 + i ) :

En efecto, Ejemplo 3.2.9

6 + 7i 4 + 3i se multiplica por 4 − 3i 4 + 3i

2 − i 2 − i 1 − i 1 − 3i 1 3 = · = = − i 1+ i 1+ i 1 − i 2 2 2 .

3.2  Números complejos

113

Ejemplo 3.2.10

z w (6 + 7i)(4 + 3i) (24 − 21) + (28 + 188)i 3 + 46i 1 · = = = = (3 + 46i) 16 + 9 25 25 w w (4 − 3i)(4 + 3i) z 7 +i 5 = w 5 +i 7



( (

z w · = w w



)( 7 )(

)=( 7)

7 +i 5

5 −i 7

5 +i

5 −i

)

35 + 35 + (5 − 7)i 5+7

=

2 35 − 2i 1 = 12 6

(

)

35 − i 

Ejercicio 3.2 3. Exprese en la forma a + bi el resultado de las siguientes operaciones:

a) (9 + 4i ) (7 − 6i ) b) (6 − 2i ) (2 + 5i )

m) 5i ÷ (1 − 7i ) 3 − i 2 ÷ 2 3 − 2 2i n)

c) (6 − 4i )(2 + 5i )

ñ)

d) (6 − i )(1 − 5i )

o)

e) (−2 + 3i )(4 − 5i )

p) (2 + 2i )(3 − 3i ) ÷ (2 + 3i )

f) (5 − 2i )(3 − 2i )

q) (2 + 3i )2 ÷ (5 − 3i )

g)

(7

)(

2 − 6 3i − 2 − 7 3i

h) (3 + 2i )[(7 − 3i )(−2 + i )]

)

( ) ( (4 5 + 2 3i ) ÷ ( ( 6 + 10i ) ÷ (3

5 − 2 3i

)

6 − 2 10 i

s) Relájese.

(10i − 3)(4i + 3)

t)

j) (3 − 5i )3 k) (8 − 3i ) ÷ (9 + 4i )

u)

9i − 8 (1 + 2i )(2 + i ) (3 + 2i )(4 + 5i )

v)

(3 − 5i )(7 + 4i ) (5 + 3i )(6 − i )

El modelo de Gauss y la inmersión de  en  Gauss, tomando como base los resultados anteriores y con objeto de contestar las objeciones que se hicieron a la construcción anterior; es decir, la existencia de números imaginarios, propuso el siguiente modelo:  = { (a, b); a, b ∈ } Sea

Definición 3.2.1 1. (a, b) = (c, d ) ⇔ a = c, b = d (representación única) 2. (a, b) ⊕ (c, d ) = (a + c, b + d ) (la suma dentro del último paréntesis es la de ) 3. (a, b) ⊗ (c, d ) = (ac − bd , ad + bc)

)

r) (−5 + 4i ) ÷ (2 + 2i )2

i) (5 − 2i )2

l) (2 − 4i ) ÷ (3 − 2i )

)

Carl Friedrich Gauss (1777-1855). Matemático alemán de quien existen varias anécdotas sobre su gran talento matemático, el cual se manifestó desde su infancia. Contribuyó ampliamente al desarrollo de la teoría de los números y creó el primer modelo de geometría no euclidiana. Hizo también aportaciones importantes en astronomía y en física.

114

Unidad 3  Sistemas numéricos

Con esto se pudo demostrar que {, ⊕, ⊗, 0, e} es un campo, en el cual 0 = (0, 0) ,    −(a, b) = (−a, − b),    e = (1, 0) z = (a, b) es z ≠ 0

y si

a −b  ( z ≠ 0 ⇒ a 2 + b2 ≠ 0 ) z −1 =  2 , 2 2 2 a +b a +b 

entonces

En este modelo se acostumbra llamar a la primera componente de cada pareja la parte real y a la segunda, la imaginaria. Observe que ambas partes son números reales; así, si z = (a, b) es un complejo, Re z = a, Imz = b, y esta costumbre queda justificada con la inmersión f :  →  , definida como f ( a ) = ( a, 0 ). (Recuerde que una inmersión de una estructura en otra es una función inyectiva que “respeta” las relaciones de ambas. Explícitamente, f debe ser inyectiva y ∀a, b ∈  f ( a + b ) = f ( a ) ⊕ f (b ) f ( ab ) = f ( a ) ⊗ f ( b ) en donde, por supuesto, las operaciones de la izquierda de las igualdades son operaciones en  y las de la derecha, en .) En vista de que las operaciones de las parejas, adición y multiplicación, se definieron tomando como modelo las de los binomios, estas nuevas operaciones tienen, necesariamente, las propiedades de las anteriores y, por lo tanto,  = {{(a, b) | a, b ∈ }, ⊕, ⊗} , como se dijo y puede comprobarse, resulta un campo. La inmersión f :  →  definida f ( a ) = ( a, 0 ) muestra que  puede considerarse  como una extensión de campo de  y bautizando i como i = (0, 1) . Además, identificando a con f(a) = (a, 0), puede verse que 1. i = (0, 1) ⊗ (0, 1) = (−1, 0) = −1 2

2.

(a, b) = (a, 0) ⊕ (0, b) = (a, 0) ⊕ (b, 0) ⊗ (0, 1) = a + bi

con lo que se recuperan los binomios de los que se partió como base en la construcción de Gauss. La construcción del inverso multiplicativo de un complejo (a,  b) distinto de cero, −b  −1  a (a, b) =  2 2 , 2 2  , mostró la conveniencia de definir dos funciones (f :  →  y a +b a +b g :  → ) por medio de las fórmulas f ((a, b)) = (a, − b)



g ((a, b)) = a + b 2



2

la conjugación el módulo o tamaño

La conjugación Si z = (a, b), z = f ( z) = (a, − b).

Cuando se identifican los complejos como puntos del plano coordenado 2, es decir, cuando z = (a, b) es el punto de abscisa a y de ordenada b, la conjugación puede interpretarse geométricamente como la reflexión sobre el eje x. Entre otras propiedades, la conjugación tiene las que expresa el siguiente teorema.

 Teorema 3.2.1 ∀ z, w ∈ . 1. 2. 3. 4. 5. 6.

z + w = z + w “El conjugado de la suma es la suma de los conjugados”. z · w = z · w “El conjugado de un producto es el producto de los conjugados”. z = z ⇔ z∈ z =z z =w⇔z=w z + z = 2Re z z − z = 2i Im z

3.2  Números complejos

Demostración Sean z = (a, b), w = (c, d ) . 1. z + w = (a + c, b + d ) = ((a + c ), − (b + d )) = (a, − b) + (c, − d ) = z + w

(

)

2. z · w = (ac − bd , ad + bc ) = ac − bd , − (ad + bc ) = (a, − b)(c, − d ) = z · w 3. z ∈  ⇔ b = 0 ∴ z = (a, − 0) = (a, 0) = z 4. z = (a, b) = (a, − b) = (a, b) = z 5. z + z = 2 a = 2 Re z

z − z = 2bi = 2i Im z

Corolario 1  (De 4) Puesto que la conjugación es autoinversa, resulta biyectiva.

Corolario 2 (De 2) Si w es w ≠ 0 (z / w) = z / w . En efecto,

y, por lo tanto,

. (Observe

que w ≠ 0 ⇒ w ≠ 0.) Cuando se interpreta la conjugación como una función f :  → , el teorema prueba que f es una función biyectiva que “va bien” con las operaciones de  y que “deja fijo” a  en el sentido del inciso 3 del teorema 3.2.1.10

 Teorema 3.2.2 Si η :  →  es un automorfismo que deja fijo a , (η( a ) = a ∀a ∈ ), entonces η es la conjugación o la identidad en .

Demostración Sea z = (a, b) = a + bi . Entonces η(z ) = η(a + bi ) = η(a ) + η(b)η(i ) = a + bη(i ) ( a, b ∈  ⇒ η ( a ) = a, η ( b ) = b ) Además, −1 = η(−1) = η(i · i ) = η2 (i ) y, por lo tanto, η(i ) tiene que ser una raíz cuadrada de −1, o sea, η(i ) = i o η(i ) = −i . Si η(i ) = i muestra que η es la identidad en  y si η(i ) = −i , η es la conjugación.

Ejemplo 3.2.11

Se desea calcular z si iz + (2 − i ) z = 10 + 6i .

10

Las funciones biyectivas que respetan las operaciones se llaman isomorfismos, y cuando “van” de un campo en éste se conocen como automorfismos.

115

116

Unidad 3  Sistemas numéricos

Entonces, z = x + yi , z = x − yi ∴ iz + ( 2 − i ) z = i ( x + yi ) + ( 2 − i )( x − yi ) = ( 2 x − 2 y ) − 2 yi ( 2 x − 2 y ) − 2 yi = 10 + 6i ⇒ −2 y = 6, 2 x − 2 y = 10 ∴ x = 2, y = −3 Comprobación i (2 − 3i ) + ( 2 − i )(2 − 3i ) = 3 + 2i + 7 + 4i = 10 + 6i 

Ejercicio 3.2 4. Resuelva:

a) (1 + i ) z + (1 − i ) z = 4

d ) (1 + i ) z − ( 6 + i )w = 4

b) zz + 3( z + z ) = 7

e) zz − 3(z + z ) = i

c) i z + (1 + i ) z = 3 + i

f ) 2 z + z − z = 4 − 2i

¿Alguna de las operaciones anteriores no tiene solución?

La norma Si z = (a, b) es un número complejo, se define su norma z como z = g ( z ) = a 2 + b2 . Aquí también, si se identifican los complejos como puntos del plano, la norma o tamaño de z puede interpretarse como la distancia euclidiana de (a, b) al origen. Entre otras propiedades, la función norma tiene las que están enumeradas en el siguiente teorema.   Teorema

3.2.3

∀ z, w ∈ . 1.

z = zz

2.

z ≥ 0;

z = 0 ⇔ z = 0

3.

zw = z w

4.

z+w ≤ z + w 

Demostración 2

2

1. zz = ( a, b )( a, − b ) = a + b = z . 2. La demostración es inmediata, ya que el tamaño de z es la raíz cuadrada de un número

no negativo, y ésta sólo es cero si el radicando (a2 + b2) lo es. 2 2 2 3. zw = zw · zw = zz · ww = z w , y como los tamaños son números reales, “se vale” extraer raíces cuadradas. Luego, zw = z w . 4. Observe que ∀z, z = z y que Re z ≤ z ; Im z ≤ z . z + w = (z + w)(z + w) = zz + zw + zw + ww = 2 2 2 2 = z + 2 Re( zw ) + w ≤ z + 2 zw + w = 2

= z + 2 z w + w = ( z + w ) , que es una desigualdad de números reales no negativos. 2

2

Por lo tanto, z + w ≤ z + w .

2

3.2  Números complejos

Corolario 1  (De 3) Si t ∈ , t = t t = t 2 = t ∴ t z = t z . En particular, si t = −1, − z = z . Una función de 2 en  con las propiedades 2, 3 y 4 del teorema 3.2.3 (una norma) permite definir la distancia entre dos puntos de 2, en este caso dos complejos z, w, como sigue: Def: ∀ z, w ∈ , d (z, w) = z − w De la definición y de las propiedades de la norma se deducen las propiedades siguientes que confieren a d la categoría de métrica.   Teorema

3.2.4

∀ z, y, w ∈ . 1. d ( z, w ) ≥ 0; d ( z, w ) = 0 ⇔ z = w 2. d ( z, w ) = d ( w, z ) 3. d ( z, w ) ≤ d ( z, y ) + d ( y, w ) 

En efecto: 1. z − w ≥ 0;

z −w = 0 ⇔ z −w = 0 ∴ z = w 2. z − w = w − z 3. z − w = z − y + y − w ≤ z − y + y − w (de las propiedades consignadas en los corolarios).

La ecuación general de segundo grado Un teorema cuya importancia le ha valido el nombre de teorema fundamental del álgebra11 asegura que  es algebraicamente cerrado; es decir, que todo polinomio f (x) ∈ [x] grado n tiene n raíces, bien contadas, en . Vale la pena demostrar la existencia de algunas de éstas, en particular las raíces cuadradas que deben calcularse cuando se usa la fórmula para resolver la ecuación general de segundo grado. Se desea resolver la ecuación ax2 + bx + c = 0, en donde a, b, c ∈ , a ≠ 0.

/

1. Se divide la ecuación entre a (a ≠ 0) y se resta c   a de cada lado:

bx c =− a a b2 a cada lado: 2. Se completa el trinomio cuadrado perfecto por la izquierda, sumando 4a 2 x2 +

b b2 b2 c x2 + x + 2 = 2 − a a 4a 4a 2

o sea

2  x + b  = b − 4ac   2a  4a 2 

3. Suponiendo que se puede sacar raíz cuadrada a b2 − 4ac, que se representa como

la ecuación anterior queda

x+ 11

b2 − 4ac ,

b b2 − 4ac =± 2a 2a

La demostración de este teorema dentro del análisis complejo es tan elegante (breve) que justifica plenamente que se posponga, dado que a este nivel resulta complicada y larga, y que por descansar, necesariamente, en alguna construcción de , no puede ser algebraica pura.

117

118

Unidad 3  Sistemas numéricos

en donde el doble signo expresa el hecho de que para el caso sirve tanto la raíz cuadrada de b2 − 4ac, cuya existencia se supuso, como su inverso. Finalmente, x=

−b ± b2 − 4ac 2a

Queda por justificar la antes mencionada existencia de las raíces cuadradas de b2 − 4ac, que es lo que afirma el teorema siguiente.

 Teorema 3.2.5 Para cada complejo z = a + bi diferente de cero existen (exactamente) dos raíces cuadradas complejas: una raíz y su inversa aditiva.

Demostración Sea w = x + yi, tal que w2 = z. Entonces, ( x + yi )( x + yi ) = x 2 − y2 + 2 xyi = a + bi ∴ x 2 − y2 = a 2xy = b

Al elevar al cuadrado cada ecuación y al sumar: x 4 − 2 x 2 y2 + y 4 = a 2 4x 2 y 2 = b 2

(

x 4 + 2 x 2 y2 + y 4 = a 2 + b2 ∴ x 2 + y2

)

2

= a 2 + b2

Entonces, x 2 + y2 = a 2 + b2 2

(= z )

2

x −y =a ∴ x2 =

a 2 + b2 + a 2

( = Re z ) y2 =

a 2 + b2 − a 2

y como a 2 + b2 ≥ a cada una de las expresiones de la derecha en estas igualdades tiene raíces cuadradas (reales), de donde resulta que a 2 + b2 + a a 2 + b2 − a , y=± 2 2 Para seleccionar la pareja de raíces que satisface nuestro problema —producir una raíz cuadrada de z— debe tenerse en cuenta que como 2xy es igual a b, si b > 0, deben escogerse signos iguales para x y y (ambos positivos o ambos negativos), y si b < 0 x y y deben tener signos diferentes. x=±

Ejemplo 3.2.12

Encuentre las raíces cuadradas de 5 − 12i entonces si w = x + yi es una de ellas: x 2 + y2 = 52 + 122 = 13 (el tamaño de 5 − 12i) x2 − y2 = 5 (la parte real) x2 = 9, x = ±3 Entonces,

y2 = 4,

y = ±2

y como b es menor que cero, x y y deben escogerse con signos diferentes. Entonces, w1 = 3 − 2i y w2 = −3 + 2i son las raíces cuadradas de z.

3.2  Números complejos

Ejemplo 3.2.13

Obtenga las raíces de la ecuación z 2 − 3z + 3 − i = 0 . Entonces, a = 1, b = −3,

c = 3 − i,

y, por lo tanto, b2 = 9 −4ac = −4(1)(( 3 − i ) = −12 + 4i ; b2 − 4ac = −3 + 4i Para calcular

b2 − 4ac se necesita encontrar x y y tales que

(x + yi )2 = b2 − 4ac = −3 + 4i ∴ x 2 + y2 = 5 (el tamaño) x 2 − y2 = −3 (la parte real) ∴ x=

5−3 = ±1 2

y=

5+3 = ±2 2

Como 2xy = 4, los signos deben escogerse iguales. Entonces, las raíces deben ser 1 + 2i y − 1 − 2i 3 ± (1 + 2i ) 2 z1 = 2 + i   y  z2 = 1 − i z=

Finalmente, Comprobación (Sólo se hará para z1.)

(2 + i )2 − 3(2 + i ) + 3 − i = 3 + 4i − 6 − 3i + 3 − i = (6 − 6) + (4 − 4)i = 0 



Ejemplo 3.2.14

Obtenga las raíces de la ecuación z 2 − 2iz − 9 − 6i = 0 . a =1 b = −2i c = −9 − 6i b2 − 4ac = −4 + 36 + 24i = 32 + 24i Debe obtenerse de manera que

32 + 24i = x + yi

x 2 + y2 = 40, 2 xy = 24 (signos iguales) 2 2 x − y = 32 x = ±6, y = ±2 ∴ las raíces son 6 + 2i y − 6 − 2i de donde, regresando a la ecuación, 2i ± (6 + 2i ) z= 2 z1 =

2i + 6 + 2i = 3 + 2i 2

z2 =

2i − 6 − 2i = −3 2

Comprobación Para (−3): Para (3 + 2i):

(−3)2 − 2i (−3) − 9 − 6i = 9 + 6i − 9 − 6i = 0

(3 + 2i )2 − 2i (3 + 2i ) − 9 − 6i = 9 − 4 + 12i − 6i + 4 − 9 − 6i = 5 + 4 − 9 + 12i − 12i = 0  La comprobación también puede hacerse, notando que la suma de las raíces debe ser r1 + r2 = −b y su producto r1r2 = c. En efecto, si r1 y r2 son raíces de x2 + bx + c = 0, se tiene que x2 + bx + c = (x − r1)(x − r2) = x2 − (r1 + r2)x + r1 r2

119

120

Unidad 3  Sistemas numéricos

r1 + r2 = −b r1r2 = c

o sea

Haga esta comprobación en los ejemplos anteriores.

Ejercicios 3.2 5. Encuentre las raíces cuadradas.

a)

z = 1 − 3i

g) z = 24 − 10i

m)

z = −3 + 4i

b) c) d)

z = −1 − 3i z = 2i z = −16

h) z = 2 + 2 3i i) z = −8i j) z = 5 − 12i

n)

z = −3 − 4i

e) f)

z = −2i z = −4

k) z = 3 − 4i l) z = 3 + 4i

ñ) z = 12 + 5i o) z = 15 + 8i p) z = −40 + 42i

6. Resuelva las ecuaciones siguientes:

a)

z 2 − 3z + 3 − i = 0

f) −5x 2 + 2 x − 1 = 0

b)

z 2 − 2iz − 9 − 6i = 0

c) d)

z 2 − 3(1 + i ) z + 5i = 0 (1 + i ) z 2 + (1 + 2i ) z − 2 = 0

g) z 2 − (4 + i ) z + 5 − i = 0 h) z 2 − (5 − 3i ) z + 2 − 6i = 0 i) z 2 + (2 − 3i ) z − (5 + 5i ) = 0

e)

z 2 − 2iz + 1 = 0

j) z 6 + z 3 + 1 = 0

Sistemas de ecuaciones I.  Se desea resolver el sistema iz + (1 + i )w = 3i (1 + i ) z − (6 + i )w = −12 + 3i Se observa que las incógnitas de la segunda ecuación son las conjugadas de la primera, por lo que se puede conjugar, con lo que se obtiene una ecuación equivalente (con las mismas raíces). El sistema, equivalente al primero, queda así: iz + (1 + i )w = 3i (1 − i ) z − (6 − i )w = −12 − 3i y procediendo por suma y resta:

(1 − i )iz + (1 − i )(1 + i )w = (1 − i )3i −i (1 − i ) z − (−i )(6 − i )w = −i (−12 − 3i )

i (1 − i ) z + 2w = 3 + 3i −i (1 − i ) z + (1 + 6i )w = −3 + 12i

Por lo tanto,

(3 + 6i )w = 15i ∴ (1 + 2i )w = 5i ∴ w =

5i (1 − 2i ) = 2 +i 5

y sustituyendo en la primera ecuación, iz + (1 + i )(2 + i ) = 3i iz + 1 + 3i = 3i iz = −1; z = Comprobación

−1 =i i

i (i ) + (1 + i )(2 + i ) = −1 + 1 + 3i = 3i

(1 + i ) i − (6 + i )(2 + i ) = 1 − i − 13 + 4i = −12 + 3i

3.2  Números complejos

II.  Se desea resolver el sistema iz + 2w = 3 + 4i 2 z − iw = 5 − 3i Calcule i 2 ∆ = = −3 Por lo tanto, el sistema tiene solución única. 2 −i

Comprobación

III.  Se desea resolver el sistema

i (2 − i ) + 2 (1 + i ) = 3 + 4i 2 (2 − i ) − i (1 + i ) = 5 − 3i x + y + z = 4 + 2i x + 2 y − 2 z = −4 − 2i 2 x − 2 y − z = −5 + 5i

Indicando las operaciones con Rn′ (nuevo renglón n), Rn − Rm (renglón n menos el renglón m). La matriz aumentada es: 1 1 1 4 + 2i     1 2 −2 −4 − 2i   2 −2 −1 −5 + 5i   

R3′ = R3 − 2R1

 1 0 4 12 + 6i     0 1 −3 −8 − 4i  0 0 1 3 + i   

R1′ = R1 − R2 R3′ =

R2′ = R2 − R1

R3 + 4R2 −15

1 1 1 4 + 2i     0 1 −3 −8 − 4i   0 −4 −3 −13 + i    R1′ = R1 − 4R3 R2′ = R2 + 3R3

1 0 0 2i    − 0 1 0 1 i  0 0 1 3 + i   

Por lo tanto, x = 2i y = 1− i z = 3+i Comprobación Sustituyendo estos valores en el sistema original, 2i + (1 − i ) + (3 + i ) = 4 + 2i 2i + 2 (1 − i ) − 2 (3 + i ) = 2i + 2 − 2i − 6 − 2i = −4 − 2i 2 (2i ) − 2 (1 − i ) − (3 + i ) = 4i − 2 + 2i − 3 − i = −5 + 5i Como puede verse, satisfacen cada una de las ecuaciones del sistema original.

Ejercicio 3.2 7. Resuelva:

a) i z + (1 + i )w = 3 + i  (1 + i ) z − ( 6 + i )w = 4

b)

121

122

Unidad 3  Sistemas numéricos

c)  3z + w = 4 + 2i  2 z − iw = 3 + 2i

e)

d) (1 + i ) z + (1 − i )w = 0  (1 − i ) z + (1 + i )w = 4

  iz1 + (1 + i ) z2 + (1 − i ) z3 = 7 + 4i  

f)  z1 + 2 z2 + 3z3 = 1 − 2i  4 z1 + 5 z2 + 6 z3 = 2 + i 7 z + 8 z + 9 z = 3 + 4i 2 3  1

Representación geométrica de los números complejos Como se ha mencionado en párrafos anteriores, todo número complejo a + bi puede hacerse corresponder con el punto del plano cuyas coordenadas son a y b. Cuando se usa esta representación, el eje x se conoce como el eje real y el eje y es el imaginario. Cada número complejo z puede considerarse como la suma a + bi, la pareja (a, b), el punto del plano P = (a, b) o el vector apoyado en el origen de extremo P. Si la longitud del segmento OP es r y el ángulo que forma OP con el eje real es θ, el complejo z puede expresarse también en coordenadas polares (r, θ), en donde, por supuesto, a = r cos θ y b = r sen θ. El cambio inverso, rectangulares a polares (que debe hacerse tomando en cuenta los signos de a y de b, que definen el cuadrante en el que se encuentra z), está dado por las relaciones r = a 2 + b2

II

I

III

IV

Figura 3.13  Los cuadrantes del plano. Tabla 3.2  Argumento de un número complejo

Ángulo θ

No definido

a=0

b=0

Cuadrante

Ángulo θ

π/2

a=0

b>0

I

b Arctan  

−π/2

a=0

b0

b=0

π

a π 1 2  Así, por ejemplo, si z1 = z2 = −1; −1 = cis π ∴ c ( z1, z2 ) = − 1

entonces

( −1)( −1) = 1 cis ( 2π − 2π ) = 1 cis 0

La función exponencial compleja Sea η: [a, b] →  la descripción de una trayectoria en 2. Entonces, η(t) = x(t) + iy(t) muestra que tanto la parte real como la imaginaria de η(t) son funciones que dependen de t, y entonces la derivada de η con respecto a t se define como

η′(t) = x′(t) + iy′(t) Por ejemplo, si η(t) = cos t + i sen t describe la rotación de una partícula alrededor del origen con radio uno, donde la variable t se interpreta como “el tiempo”, la velocidad de la partícula (la derivada de η con respecto a t) es η′(t) = −sen t + i cos t, y del mismo modo su aceleración resulta η″(t) = −cos t + i sen t. Se desea extender exp :  →  a E :  →  de manera que se conserven las propiedades básicas de la exponencial. Explícitamente, se desea que E tenga las propiedades siguientes: a) E ( x ) = exp ( x ) ∀x ∈  b) ∀z, w ∈ , E ( z + w ) = E ( z ) E ( w ) c) E ′( z ) = E ( z ) · z ′ En vista de esto, si z = x + iy, con x, y ∈ , debe suceder que E ( z ) = E ( x + iy ) = E ( x ) E (iy ) = e x E (iy )

12 Algunos

autores definen el rango de θ en el intervalo [0, 2π).

3.2  Números complejos

y, por lo tanto, nuestro problema, encontrar la forma correcta de definir E(z), se reduce a decidir la manera en que debe interpretarse E(iy), que obviamente es un complejo cuyas partes real e imaginaria dependen de y. Es decir, E (iy ) = U ( y ) + iV ( y ) y se deben encontrar funciones U y V que resulten adecuadas para nuestro propósito (conseguir que E tenga las propiedades deseadas a), b) y c)). Entonces, 1. E (iy ) = U ( y ) + iV ( y ) por definición. Derivando en el supuesto de que E satisface a c), 2. E ′(iy ) = i E (iy ) = U ′( y ) + iV ′( y ), en donde U ′ y V ′ son derivadas con respecto a su variable y.

Al derivar una vez más 3. E ′′(iy ) = − E (iy ) = U ′′( y ) + iV ′′( y ) = − U ( y ) − iV ( y ). Este resultado muestra que tanto U

como V son funciones que satisfacen la ecuación f ′′ + f = 0. Al hacer y = 0 en 1 y en 2 se obtiene:

4. 1 = U ( 0 ) + iV ( 0 ) ∴U ( 0 ) = 1; V ( 0 ) = 0. 5. i = U ′( 0 ) + iV ′( 0 ) ∴ U ′( 0 ) = 0; V ′( 0 ) = 1.

Los resultados anteriores muestran que tanto U como V deben ser las soluciones a los problemas de valores iniciales siguientes: U : y ′′ + y = 0,

y( 0 ) = 1,

y ′( 0 ) = 0

V : y ′′ + y = 0, y( 0 ) = 0, y ′( 0 ) = 1

y

y como las soluciones a tales problemas son únicas, como se demuestra en los cursos de ecuaciones diferenciales, U debe ser la función coseno y V la función seno. Luego, E ( x + iy ) = e x (cos y + i sen y ) = e x cis y

 Teorema 3.2.8 La función E  :  →  así definida tiene las propiedades a), b) y c).

Demostración a)  E ( x ) = exp ( x ) ∀x ∈  z ∈  → z = x + 0i ∴ E ( z ) = exp ( x ) cis ( 0 )

cis ( 0 ) = 1 ∴ E ( z ) = E ( x ) = exp ( x ) b)  E ( z1 + z2 ) = E ( z1 ) E ( z2 ) z j = x j + iy j j = 1, 2 z1 + z2 = ( x1 + x2 ) + i ( y1 + y2 ) c)  E ′( z ) = E ( z ) z ′ z (t ) = x(t ) + iy(t ) ∴ E ( z ) = e x (cos y + i sen y ) E ′( z ) = x′e x (cos y + i sen y ) + y′e x ( −sen y + i cos y )



129

130

Unidad 3  Sistemas numéricos

 Teorema  3.2.9 La función exponencial es periódica y cada periodo es de la forma 2πki, k ∈ .

Demostración Sea w un periodo de E, luego ∀ z ∈ , E(z) = E(z + w). Al hacer z = 0, E(w) = 1, y si w = x + yi, E(w) = ex cis y = 1 ⇒ x = 0, cos y = 1 y sen y = 0, entonces y = 2πk, k ∈ . Una consecuencia de la demostración es que

Representación geométrica de algunas rectas bajo la transformación E Sea T :  →  la transformación T(z) = E(z). Observe que el origen de  va a dar al punto (1, 0), y a medida que la variable recorre el eje x alejándose del origen en el sentido positivo, ex aumenta exponencialmente, pero y se mantiene igual a cero. Luego la imagen de [0, ∞) es [1, ∞), mientras que E(−∞, 0) es (0, 1). De la misma manera puede analizarse la imagen bajo la transformación E de cualquier recta horizontal (y es constante). Se encuentra que la imagen de la semirrecta cuyos puntos tienen abscisa positiva es la parte que queda fuera del círculo unitario, del rayo que parte del origen y cuyo argumento es la y de la recta. La semirrecta de puntos con x negativa tiene por imagen la porción del rayo que queda dentro del círculo. Observe que como E(z) · E(−z) = 1, ∀ z ∈  y, por lo tanto, ∀ z ∈ , E(z) ≠ 0, el origen del plano  no es imagen de ningún complejo z bajo la transformación exponencial. Las rectas verticales x = cte (tamaño fijo y argumento de −∞ a ∞) van a dar a circunferencias de radio ex las rectas que parten del origen se “retratan” como espirales que “arrancan” de (1, 0). Las imágenes van aumentando tanto de tamaño como de argumento a medida que la variable se va alejando del origen.

e2

1

1

g

1

1

e

Figura 3.21  Transformación exponencial de algunas rectas, de 2 en 2 (imagen proporcionada por el

Dr. Carlos Bruno Velarde Velázquez).

3.2  Números complejos

La función logaritmo Con el deseo de definir la función inversa de la exponencial (el logaritmo complejo), se observa que si (por supuesto, E ( z ) = e x , Arg E ( z ) = y ). Por lo tanto, debe definirse Observe que si , es decir, L es una extensión de la función logaritmo natural. Si z = − x, L ( z ) = ln x + πi . Ya que la exponencial es una función periódica, debe escogerse una banda del plano de 2π para seleccionar en ella los argumentos de los logaritmos complejos. En efecto, si se escoge la región {( x, y ) ∈ | − π < y ≤ π}, entonces la función exponencial definida en ella la “mapea” biyectivamente en todo el plano, menos el origen. Otra vez, si se define D = {x + yi ∈  | − π < y ≤ π} , E : D →  − {0} es biyectiva y su inversa es L:  − {0} → D. En efecto, ∀z ∈ D, z = x + yi , E ( z ) = e x cis y; L ( e x cis y ) = ln e x + iy = x + yi. Si z = x + yi es un complejo no cero de tamaño r y de argumento θ (x = r cos θ, y = r sen θ), entonces L ( z ) = ln r + iθ y, por lo tanto, E(L(z)) = eln r cis θ = r cos θ + ir sen θ = x + yi = z. Note que la función L :  − {0} → D está bien definida (en el sentido de que ∀z ≠ 0, L ( z ) ∈ D ), ya que, según se convino, el argumento de L(z) debe satisfacer −π < Arg z ≤ π . Ejemplo 3.2.20 1. 2. L ( −1) = ln −1 + i Arg ( −1) = ln 1 + πi = πi 

 Teorema 3.2.10 Si z1 = r1 cis θ1, z2 = r2 cis θ2 , entonces L ( z1z2 ) = L ( z1 ) + L ( z2 ) + 2 πic ( z1, z2 ).

Demostración L ( z1z2 ) = L ( r1r2 cis (θ1 + θ2 + 2π c ( z1, z2 ))) = ln ( r1r2 ) + i (θ1 + θ2 + 2π c ( z1, z2 )) = ln r1 + iθ1 + ln r2 + iθ2 + 2 π ic ( z1, z2 ) = L ( z1 ) + L ( z2 ) + 2π ic ( z1, z2 )

Definición 3.2.2 Si z es z ≠ 0, w ∈, z w = E ( wL ( z ))

En el caso de que z = x ∈  + y w = y ∈ , E ( x y ) = E ( yL ( x )) = E ( y ln x ) = exp( y ln x ), por lo que, como puede verse, la definición anterior extiende a la que se tenía para . De z w = E ( w( z )), al aplicar la función L, se ve L ( z w ) = wL ( z ) .

  3.2.11 Teorema 1. ∀z ≠ 0, w1 , w2 ∈, z w

w

w1 + w2

= z w1 · z w2

ww

2. ( z 1 ) 2 = z 1 2 3. Si z1 y z2 son distintos de cero,

w ∈ , ( z1z2 )w = z1w z2w E ( 2π wic ( z1z2 ))

131

132

Unidad 3  Sistemas numéricos

Demostración 1. z

w1 w 2

= E (( w1 + w2 )L ( z )) = E ( w1L ( z ) + w2 L ( z )) = E ( w1L ( z )) · E ( w2 L ( z )) = z



w1

·z

w2

w

w1 w2

= E ( w2 L ( z 1 )) w w = E ( w2 · w1L ( z )) = z 1 2 w 3. ( z1z2 ) = E ( wL ( z1z2 )) = E [ w( L ( z1 ) + L ( z2 ) + 2πic ( z1z2 ))] = E [ wL ( z1 ) + wL ( z2 ) + 2πwic ( z1z2 )] 2. ( z

)



= E ( wL ( z1 )) · E ( wL ( z2 )) · E ( 2 π wic ( z1z2 ))



= z1w · z2w · E ( 2 π wic ( z1z2 ))

Ejemplo 3.2.21



1.

En la enseñanza del álgebra elemental se asegura que para obtener la raíz cuadrada de un número negativo, se toma la correspondiente a su valor absoluto multiplicada por i. Así, por ejemplo, se dice que −4 = 2i, y se justifica escribiendo −4 = 4( −1) = 4 −1 = 2i. Observe que en el paso intermedio 4( −1) = 4 −1 no se tomó en cuenta la corrección, multiplicar por que en este caso es cero, ya que la suma de los argumentos de los factores no excede π, y así el resultado es correcto, aunque el procedimiento no. Si lo fuera, entonces valdría la conocida “paradoja” siguiente: 1 = 1 = ( −1)( −1) = −1 −1 = i 2 = −1. ¿1 = −1? La falacia aparece cuando se sustituye ( −1)( −1) por ( −1) ( −1) , ya que aquí la corrección no es cero. En efecto, Arg ( −1) = π y, por lo tanto, Arg ( −1) + Arg ( −1) = 2π , suma que excede el rango que se escogió y que obliga en este caso a aplicar la corrección, c( −1, − 1) = −2π ; es decir, debe multiplicarse el lado derecho de la igualdad por Ahora sí: ( −1)( −1) = −1 −1( −1) = i 2 ( −1) = ( −1)( −1) = 1.

Las funciones trigonométricas Al recordar que para todo número real θ , eθ i = cos θ + i sen θ ,

e −θ i = cos θ − i sen θ , se puede ver θi −θ i eθ i + e −θ i θi −θ i y sen θ = e − e , que e + e = 2 cos θ y eθ i − e −θ i = 2 i sen θ . Por lo tanto, cos θ = 2 2i zi − zi zi −zi e − e e + e en vista de lo cual se conviene en definir para cada z ∈ , cos z = y sen z = . 2 2i Con este acuerdo, las nuevas funciones (que extienden a las correspondientes coseno y seno de variable real) adquieren, entre otras, las siguientes propiedades:

 Teorema  3.2.12 ∀ z, w ∈ .

3.2  Números complejos

2

2

1. sen z + cos z = 1

4.

2. (sen z )′ = cos z 3. (cos z )′= − sen z

5.

cos ( z + w ) = cos z cos w − sen z sen w sen ( z + w ) = sen z cos w + cos z sen w

Demostración 2

2

 e zi − e − zi  e 2 zi + e −2 zi − 2 =  2i −4  

1. sen z = 

2

 e zi + e − zi  e 2 zi + e −2 zi + 2 cos z =   = 2 4   2

Por lo tanto, sen2 z + cos2 z =

 e zi − e − zi 2i 

2. (sen z )′= 

e 2 zi + e −2 zi + 2 − e 2 zi − e −2 zi + 2 =1 4

′ i ( e zi + e − zi ) e zi + e − zi = cos z =  = 2i 2 

 e zi + e − zi ′ i ( e zi − e − zi ) i 2 ( e zi − e − zi ) = −sen z =  = 2 2 2i  

3. (cos z )′= 

4. cos z cos w =

( e zi + e − zi )( e wi + e −wi ) e ( z +w )i + e ( z −w )i + e ( − z +w )i + e −( z +w )i = 4 4

sen z sen w =

( e zi − e − zi )( e wi − e −wi ) e ( z +w )i − e ( z −w )i − e ( − z +w )i + e −( z +w )i = ( 2i )( 2i ) −4

∴ cos z cos w − sen z sen w = 5. sen z cos w =

2 e ( z + w )i + 2 e ( z + w )i = cos ( z + w) 2

( e zi − e − zi )( e wi + e −wi ) e ( z +w )i + e ( z −w )i − e ( − z +w ) − e −( z +w )i = 2( 2i ) 4i

cos z sen w =

( e zi + e − zi )( e wi − e −wi ) e ( z +w )i − e ( z −w )i + e ( − z +w )i − e −( z +w )i = 2( 2i ) 4i

∴ sen z cos w + cos z sen w =

2 e ( z + w )i − 2 e − ( z + w )i = sen ( z + w ) 4i

Ejercicios 3.2

14.  Defina tan z, cot z, csc z (expresiones explícitas).   Demuestre que: 1.

tan2 z + 1 = sec2 z

2.

cot2 z + 1 = csc2 z

3.

sen2 i + cos2 i = 1

4.

cos2 z =

5.

sen 2 z =

2

1 + cos z 2 2

1 − cos z 2

133



Unidad

4.1 Polinomios •  Suma y multiplicación •  Grado •  Inmersión de K en K [x] •  Algoritmo de la división 4.2  Funciones polinomiales •  Teorema del residuo •  Raíces de ecuaciones polinomiales •  Teorema del factor •  Algoritmo de la división sintética •  Raíces complejas •  Raíces “surd” •  Las ecuaciones generales de 2º, 3º y 4º grados 4.3 Algunos resultados de la teoría de números y su aplicación a los polinomios y a las funciones polinomiales •  Máximo común divisor de dos enteros (algoritmo de Euclides) •  Fracciones parciales

ría ios y teo Polinom ciones de ecua

4

135

4.4  Métodos numéricos •  Introducción •  Error •  Cálculo de raíces de ecuaciones •  Método de iteración de punto fijo •  Método de bisección •  Método de Newton-Raphson •  Aplicaciones •  Estimación de las constantes de la ecuación de estado de Van der Waals

136

Unidad 4  Polinomios y teoría de ecuaciones

4.1 Polinomios Los polinomios son objetos matemáticos que el estudiante encuentra desde sus estudios de secundaria. Son expresiones de la forma siguiente: a0 + a1x + a2x2 + … + anxn, que por tener estructura de sumas se conocen como sumas formales. El conjunto {a0, …, an} consta de elementos de algún campo, usualmente el de los números reales o el de los complejos, y se llaman coeficientes; x es la indeterminada. Cuando se trata de funciones polinomiales (vea más adelante), la x también se llama la variable o incógnita. Los estudiantes aprenden a operar con ellos (sumarlos, restarlos, multiplicarlos, dividirlos y también usarlos para resolver gran variedad de problemas); sin embargo, el sustento teórico de lo que están haciendo es muy poco claro. En efecto, ¿qué son esas indeterminadas? ¿La x2 qué significa? ¿Cómo se multiplican entre sí o con los coeficientes? ¿Qué clase de sumas son esas, en las que no está clara la naturaleza de los sumandos? Esas sumas y esas multiplicaciones, ¿conmutan? ¿Son asociativas? ¿Qué leyes obedecen y cuáles no? Con objeto de establecer una base teórica adecuada para contestar las preguntas anteriores y poder extender la teoría convenientemente, se proponen las definiciones pertinentes que, por supuesto, están basadas en el conocimiento intuitivo previo, el que se tiene y que se usará junto con el concepto de grado (que se formalizará más adelante) para orientar las definiciones correspondientes.

Suma y multiplicación La observación de que tanto la suma como la multiplicación de polinomios pueden definirse prescindiendo de las indeterminadas permite identificar cada polinomio con la colección de sus coeficientes. Así, el polinomio a0 + a1x + a2x2 + … + anxn se hace corresponder con la colección  (a0, a1, …, an). Por ejemplo, al polinomio x5 + 3x4 − x2 + 2x − 3 le corresponde la colec-  ción (−3, 2, −1, 0, 3, 1). Note que en estas colecciones los coeficientes aparecen en el orden inverso del que se usa en la forma acostumbrada. Puede verse que con esta identificación para sumar polinomios de distinto grado es necesario agregar tantos ceros como sea preciso para igualar el número de términos de cada sumando, así como para “rellenar” los huecos que dejan las “potencias faltantes”. Con objeto de obviar estos “estiramientos” parciales se propone un “estirón” general que sirva para todos los casos, y con esta consideración se define: el polinomio a0 + a1x + a2x2 + … + a xn es la sucesión casi nula1 (a , a , …, a , 0, 0, …). De acuerdo con esto, dos polinomios n 0 1 n resultan iguales si y sólo si son idénticos. [Recuerde que dos funciones f y g son iguales si y sólo si tienen igual dominio, igual contradominio y producen la misma imagen en cada elemento al que se le aplican (f : A → B) = (g : C → D) si y sólo si A = C, B = D y f(x) = g(x) para toda x ∈ A.] La suma de polinomios se define de manera natural como la suma de imágenes, esto es, si a y b son los polinomios a = (a0, a1, …, an, 0, …) y b = (b0, b1, …, bn, 0, …), el polinomio a + b es  a + b = (a0 + b0, a1 + b1, …, ai + bi, 0, …), que por supuesto resulta también una sucesión casi nula. Se hace cero, al menos, a partir del lugar que corresponde al máximo de m y n. Por ejemplo, sean a = (1, −2, 0, 7, 0,…) y b = (5, 0, 4, 0,…). Entonces la suma a + b resulta  a + b = (1 + 5, −2 + 0, 0 + 4, 7 + 0, 0 + 0,…), o sea, a + b = (6, −2, 4, 7, 0,…). Como los coeficientes (imágenes de los números naturales correspondientes) pertenecen a un campo, es claro que la suma que se ha definido resulta asociativa, conmutativa, con elemento cero y con un inverso aditivo para cada polinomio. Explícitamente, 0 = (0, 0, …), y si a = (a0, a1, …, an, 0, …), −a = (−a0, −a1, …, −an, 0, …), que tiene las propiedades que se requieren. Así, 0 + a = a y −a + a = 0. Con objeto de que la multiplicación de polinomios coincida con la que conocemos, se define, para a = (a0, a1, …, an, 0, …) y b = (b0, b1, …, bm, 0, …), ab = (c0, c1, …, cj, 0, …), en donde cada n+m ck es ckk = ∑ ai b j . Así, c = (a0b0, a0b1 + a1b0, a0b2 + a1b1 + a2b0, …). k =i + j

sucesión es una función S : ℕ → D cuyo dominio es el conjunto de los números naturales. Se dice que es casi nula si y sólo si S(n) = 0 para todos los números naturales, excepto por un número finito de ellos. 1 Una

4.1 Polinomios

La multiplicación resulta asociativa, conmutativa, con 1 = (1, 0, …) y se distribuye sobre la suma, con lo que el conjunto de los polinomios con coeficientes en un campo K resulta un anillo conmutativo con uno,2 que se denota como K [x].

Grado Definición 4.1.1 Se define el grado de un polinomio a = (a0, a1, …, an, 0, …) como n si an ≠ 0 y am = 0 para todo m > n. Por ejemplo, si a = (0, 2, 1, 5, 0, …), es de grado 3; recuerde que los “lugares” se cuentan desde el lugar cero. b = (7, 0, 0, …) es de grado cero; note que los polinomios que corresponden a los elementos diferentes de cero del campo de los coeficientes son precisamente los de grado cero (vea inmersión). Observe que para definir el grado de un polinomio es preciso que algún coeficiente de éste sea diferente de cero. Por esta razón resulta que el polinomio cero no puede tener grado (el polinomio cero está “degradado”). Al sumar (o restar) dos polinomios de distinto grado, la suma (o la diferencia) resulta del mismo grado que el del mayor. Sin embargo, cuando ambos sumandos son de igual grado, pue-  de suceder que se cancelen algunos términos (uno, varios o todos), y así se dice que el resultado de una suma (o resta) es el polinomio cero o un polinomio de grado menor o igual que el grado común de los sumandos. Ejemplo 4.1.1

(1 ,2, 0, 1, 0, ...) − (0, 3, −1, 0, ...) = (1, −1, 1, 1, 0, ...) (1, 2, 0, 1, 0, ...) + (− 1, 2, 0, −1, 0, ...) = (0, 0, 0, 0, 0,...) (x3 + 3x2 − 2x + 4) + (−x3 −3x2 + x + 7) = −x + 11



Esta falta de precisión en el grado de una suma no ocurre para el producto. En efecto, en K [x] “vale” el siguiente teorema.

 Teorema  4.1.1 Sean a = (a0, …, an, 0, …) y b = (b0, …, bm, 0, …) dos polinomios de grado n y m, respectivamente. Entonces el grado del producto ab es n + m.

Demostración El término cn+m del producto consta de la suma de los productos ai bj con i + j = n + m. Cuando i es i > n, ai = 0 (el grado de a es n). Por otro lado, si i < n, j resulta mayor que m y, por lo tanto, bj . = 0, de modo que el único término de la suma que sobrevive es anbm , que es distinto de cero, ya que ambos factores lo son. Los coeficientes del producto mayores a n + m son todos cero, ya que la condición  i + j > n + m fuerza a que necesariamente i sea mayor que n, y en ese caso ai = 0 o que j sea mayor que m, y ahora es bj la que se anula.

anillo es una terna {A, +, .}, en donde A es un conjunto y +, . son operaciones binarias en A tales que {A, +} es un grupo abeliano y la multiplicación . se distribuye sobre la suma por ambos lados. Si la multiplicación conmuta el anillo se conoce como anillo conmutativo, y si tiene idéntico (uno) se dice que es un anillo con uno. Un anillo conmutativo se llama dominio entero si y sólo si en la multiplicación se pueden cancelar factores iguales, distintos de cero o equivalentemente, cuando cero no tiene divisores propios, es decir, que un producto es cero si y sólo si alguno de sus factores es cero. El ejemplo más importante de los dominios enteros es el conjunto de los enteros ℤ (que además tiene idéntico multiplicativo: uno). 2 Un

137

138

Unidad 4  Polinomios y teoría de ecuaciones

Una consecuencia inmediata del teorema anterior es la proposición siguiente: Sean a, b ∈ K [x]. Entonces a ≠ 0 y b ≠ 0 ⇒ ab ≠ 0 o, por contraposición, ab = 0 ⇒ a = 0 o b = 0, y cuando tal proposición se cumple se dice que “cero no tiene divisores propios” y que el anillo es un dominio entero.

 Teorema 4.1.2 En un anillo conmutativo, cero no tiene divisores propios si y sólo si se “vale cancelar” factores diferentes de cero, es decir, ab = ac y a ≠ 0 ⇒ b = c.

Demostración ⇒ Hipótesis: ab = 0 ⇒ a = 0 o b = 0. PD ab = ac y a ≠ 0 ⇒ b = c. El teorema de la deducción permite incorporar ab = ac y a ≠ 0 como hipótesis adicional, y entonces demostrar que b = c. De ab = ac se sigue que 0 = ab − ac = a(b − c), por lo que a = 0 o (b − c) = 0. Pero a ≠ 0 por hipótesis, de modo que (b − c) tiene que ser cero. Por lo tanto, b = c. ⇐ Suponga que se vale cancelar factores diferentes de cero y que ab = 0. Debe demostrarse que a = 0 o b = 0. Equivalentemente, a ≠ 0 ⇒ b = 0. Sea pues a ≠ 0 y ab = 0; entonces, ab = a · 0, y como a ≠ 0, al cancelarla queda b = 0.

Inmersión de K en K [x] Cada elemento a0 ∈ K, mediante la identificación natural, puede considerarse como el polinomio (a0, 0, 0,...) ∈ K [x]. Si se define η : K → K [x] como η ( a0 ) = ( a0 , 0, 0, ) , η resulta una función inyectiva tal que para todos a, b ∈ K, η ( a + b ) = η ( a ) + η ( b ) y η ( ab ) = η ( a ) η ( b ) . (Es decir, η es lo que se conoce como un monomorfismo de anillos o inmersión.)

Demostración 1. η ( a ) = η ( b ) ⇒ ( a, 0, 0, ) = ( b, 0, 0, ) y, por lo tanto, a = b (es decir, η es inyectiva). 2. η ( a + b ) = ( a + b, 0, 0, ) = ( a, 0, 0, ) + ( b, 0, 0, ) = η ( a ) + η ( b ) . η “respeta” sumas. 3. η ( ab ) = ( ab, 0, 0, ) = ( a, 0, 0, )( b, 0, 0, ) = η ( a ) η ( b ) ∙ (η “respeta” productos.) 

{

}

Se define K+ [ x ] = ( a0 , , an , 0, ) ; an > 0 y entonces puede verse que K+[x] resulta una clase positiva3 y que a ∈ K+ ⇔ η (a) ∈ K+ [x], con lo que se puede concluir que η también “respeta” el orden.

3 Sea D un dominio entero (o un campo). D+⊂ D es una clase positiva si y sólo si para todos los elementos de D: 1.  a, b ∈D+ ⇒ a + b, ab ∈D+ (es cerrado bajo sumas y productos). 2.  Vale una y sólo una de a ∈D+, a = 0 o −a ∈D+(vale la ley de tricotomía).

4.1 Polinomios

Definición 4.1.2 x = ( 0, 1, 0,  , 0, )

Entonces, x 2 = (0, 0, 1, 0, , 0, )  x = (0, 0, 0, , 1, 0, ) n

En este último paréntesis, el “1” se encuentra en el n-ésimo lugar (recuerde que los “lugares” se cuentan desde el lugar cero). También an x n = (an , 0, , 0, )(0, 0, , 0, 1, 0, ) = (0, 0, , 0, an , 0, ) , en donde an está en el n-ésimo lugar. Y finalmente, a0 = (a0 , 0, 0, , 0, ) a1x = ( 0, a1, 0, , 0, )

a2 x 2 = ( 0, 0, a2 , , 0, )  an x = (0, 0, 0, , an , ) n



a0 + a1x +  + an x n = (a0 , a1, a2 , …, an , …)

con lo que se recuperan las sumas formales, que ahora sí son sumas de polinomios con todo  derecho.

Algoritmo de la división El algoritmo de la división asegura que, como en el caso de los enteros, en el anillo K [x] la división es una operación bien definida en el sentido que afirma el siguiente teorema:

  Teorema 4.1.3 Sean a, b ∈ K [x], b ≠ 0. Entonces existen únicos q y r polinomios tales que a = bq + r, en donde r es cero o su grado es menor que el de b. El teorema asegura dos cosas que se demostrarán separadamente: la existencia del cociente y del residuo, y la unicidad de éstos.

Demostración Demostración de la primera parte (existencia) Se hará por inducción sobre el grado de a, utilizando el segundo principio. La hipótesis es “el teorema se cumple para el cero y para todo polinomio de grado menor que el grado de a”. Observe que si a es el polinomio cero o su grado es menor que el grado de b, entonces q = 0 y r = a satisfacen lo que el teorema asegura. En efecto, a = 0 · b + a, gr (a ) < gr (b) o a = 0. Por lo tanto, se supone que gr (b) ≤ gr (a ) y sean a = (a0 , … , an , 0,…) = an x n +  + a0 ,   an ≠ 0 b = (b0 , …, bm , 0, …) = bm x m +  + b0 ,   bm ≠ 0 m ≤ n

139

140

Unidad 4  Polinomios y teoría de ecuaciones

Recuerde que cuando se divide a entre b, el primer término del cociente se construye dividiendo an entre bm, y tomando n − m como exponente para la x, es decir, se construye

α=

an n − m x bm

Se multiplica después α por b y el producto se resta de a. Al hacer esto, el primer término de a se cancela y se obtiene el primer residuo r1, que puede ser cero, y que si no lo es, tiene grado menor que n. Entonces, a = αb + r1



(4.1.1)

Si r1 = 0, el proceso termina. Si no, aplicando la hipótesis de inducción a r1 resulta que r1 = q1b + r2 con r2 = 0 o gr (r2 ) < gr (b). Al sustituir esta expresión para r1 en la ecuación (4.1.1) se obtiene: a = α b + q1b + r2 = (α + q1 )b + r2 Las definiciones q = α + q1 y r2 = r producen a = qb + r , r = 0 o gr (r ) < gr (b). Demostración de la segunda parte (unicidad) Para demostrar la unicidad de un objeto, se supone que existen dos y se demuestra que éstos son diferentes representaciones del mismo. Sean q1(x), r1(x), q2(x), r2(x) polinomios que satisfacen la condición que el algoritmo de la división requiere, es decir, a = q1b + r1   r1 = 0 o gr (r1 ) < gr (b) a = q2 b + r2   r2 = 0 o gr (r2 ) < gr (b) Entonces, q1b + r1 = q2 b + r2. Luego,

(q1 − q2 )b = (r2 − r1 )

(4.1.2)

es decir, b divide a (r2 − r1), que también se escribe b (r2 − r1 ). Si r2 ≠ r1, gr (r2 − r1 ) < gr (b), lo cual es absurdo,4 por lo que r2 − r1 tiene que ser cero; es decir, r2 = r1, y por lo tanto, de la ecuación (4.1.2) se obtiene (q1 − q2 )b = 0, lo que dice que  q1 = q2 (recuerde que b ≠ 0). 

4.2  Funciones polinomiales Sean K un campo y E una extensión (K es un subcampo de E, por ejemplo,  y ). Con cada polinomio f ∈ K [x] se puede definir una función f (x) : E → E de la manera siguiente: sea f (x) = (a0, a1, ..., an, 0, ...) ∈ K [x] y z ∈ E. Entonces, f (z ) = a0 + a1z +  + an z n , que es una suma de productos de elementos de E. Así, f (x) viene a ser la función f (x) : E → E definida por el polinomio f. A tales funciones (que están definidas por medio de un polinomio) se les denomina funciones polinomiales. Se puede comprobar que si f y g son polinmios con coeficientes en K, y f(x) y g(x) son las funciones polinomiales correspondientes, resulta que las funciones que se asocian a los polinomios f + g, fg son precisamente las definidas como ( f + g )(x) = f (x) + g (x), ( fg )(x) = f (x) · g (x).

4 Observe que: p|q ⇒ ∃ r ∋ pr = q, y entonces si q no es cero, su grado es la suma de los grados de sus factores, es decir,  gr(q) = gr(p) + gr(r). Por lo tanto, p|q y  q ≠ 0 ⇒ gr (q) ≥ gr (p)

y por contrapuesta, si el grado de p fuera mayor que el posible grado de q, la afirmación p|q obliga a que entonces q = 0.

4.2  Funciones polinomiales

Entonces, si η la función que asocia a cada polinomio f en K [x], la correspondiente función polinomial f(x)η es un homomorfismo de anillos, que cuando el campo K es infinito permite identificar a cada polinomio con su función polinomial, de manera que ambas estructuras (polinomios y funciones polinomiales) resultan indistinguibles desde el punto de vista de sus propiedades algebraicas. Es por esto que en los estudios elementales del álgebra (secundaria y preparatoria) no se hace distinción alguna entre ellas. Vale la pena notar que, de acuerdo con la definición, los elementos del campo, cuando se convierten en polinomios, producen funciones constantes. Así, si a0 → (a0, 0,…), a0(x) = a0 + 0 x + … = a0. Cuando se plantea una ecuación polinomial (por ejemplo, x2 − 7x + 12 = 0), ésta no puede referirse a una igualdad de polinomios. En efecto (12, − 7, 1, 0, 0, …) = x2 − 7x + 12 no puede ser igual al polinomio 0 = (0, 0, 0,…). Por lo tanto, se trata de una igualdad entre funciones polinomiales, que sólo se cumple cuando x toma el valor de 3 o 4. Cuando se utiliza el método de las fracciones parciales para integrar un cociente f(x)/g(x) de polinomios, se factoriza g(x) como producto de factores irreducibles (los polinomios reales irreducibles son de primero o de segundo grado con discriminante menor que cero), g(x) = (x − α1) (x − α2)(x2 + αx + β)..., se buscan constantes A, B, C, … que satisfagan la igualdad f (x ) A B Cx + D + = + + g (x) (x − α1 ) (x − α2 ) x 2 + αx + β Se trata ahora de una igualdad entre polinomios, de manera que si, por ejemplo, resultara Ax 3 + Bx 2 + C x + D = 2 x 2 − 7 , es decir (D, C , B, A, 0, ) = (−7, 0, 2, 0, ), , se tendría D = −7,  C = 0, B = 2 y A = 0. La estrecha relación de las propiedades algebraicas entre polinomios y funciones polinomiales (homomorfismo de anillos) permite utilizarla para la demostración de algunos teoremas básicos de la teoría de ecuaciones, como los que se presentan a continuación, en los que se usará indistintamente f o f(x).

Teorema del residuo Sean f (x) ∈ K [x], E una extensión de K y a ∈ E. Entonces el residuo de dividir f(x) entre (x − a)  es f(a).

Demostración f(x) ∈ K [x] y K ⊂ E aseguran que f(x) puede considerarse también como un polinomio con coeficientes en E y, por lo tanto, el algoritmo de la división garantiza la existencia de q(x) y r(x) (en E [x]) tales que f(x) = q(x − a) + r, en donde r = 0 o gr(r) = 0 (es decir, r es un polinomio constante). Esta igualdad vale para las funciones polinomiales y, por lo tanto, ∀ x ∈ E, f (x) = q (x)(x − a ) + r (x), y si x = a, f (a ) = q (a )(a − a ) + r (a ) = r. (Recuerde que r ∈ K implica que r(x) es una función constante y que, por lo tanto,  ∀ x ∈ R, r(x) = r.) 

Raíces de ecuaciones polinomiales Definición 4.2.1 Sea f(x) ∈ K [x], K es un subcampo de E; a ∈ E es un cero de f (o una raíz de la ecuación  f(x) = 0) si f(a) = 0.

141

142

Unidad 4  Polinomios y teoría de ecuaciones

Definición 4.2.2 a ∈ E es un cero de multiplicidad m de f (o una raíz de multiplicidad m de f(x) = 0) si (x − a)m divide a f(x) y (x − a ) m +1 ya no la divide.

Definición 4.2.3 Las raíces de multiplicidad uno se llaman raíces simples. Las de multiplicidad dos, dobles; las de tres, triples; y, en general, para m > 3 se denominan como “raíces de multiplicidad m”. Aquellas de multiplicidad cero son las que no son raíces (vea más adelante).

Teorema del factor Sea f(x) ∈ K [x], K ⊂ E; a ∈ E es una raíz de f(x) = 0 si y sólo si (x − a ) f (x). 

Demostración ⇒ Hipótesis: a es una raíz f(x) = 0. PD (x − a ) f (x). Al dividir f (x) entre (x − a), el residuo que se obtiene, de acuerdo con el teorema del residuo, es f (a), y como a es cero del polinomio f, la expresión que resulta es f (x) = q (x)(x − a ) + 0, de lo que se sigue inmediatamente que (x − a) divide a f (x). ⇐ Hipótesis: (x − a ) f (x). PD f (a ) = 0. Dado que x − a divide a f (x), ∃ q (x) ∈ E [x] ∋ f (x) = q (x)(x − a ), lo que dice que al dividir f (x) entre x − a, el residuo que resulta es cero, que, de acuerdo con el teorema del residuo, es igual al valor f (a). Una aplicación importante del teorema del factor consiste en transformar el problema de encontrar raíces de las ecuaciones polinomiales por medio de fórmulas (lo que en el caso del polinomio general de grado mayor o igual que cinco, está demostrado que es imposible) en un problema de divisibilidad. En efecto, cada vez que al dividir f (x) entre x − a se obtenga el residuo cero, se habrá encontrado la raíz a de la ecuación f (x) = 0. Por supuesto, en el caso de los números reales es imposible probar con cada uno de ellos si es o no cero del polinomio de que se trate; sin embargo, el conjunto de los números racionales que pueden ser cero de los polinomios con coeficientes enteros está bien definido y no es muy numeroso, por lo que en estos casos resulta adecuado utilizar el método de la división. Puede demostrarse que si f (x) ∈ Z [x] es f (x) = a0 + a1x +  + an x n , con los coeficientes ai ∈ Z, entonces las únicas raíces racionales p/q (simplificadas, es decir, tales que (p, q) = 1) de la ecuación f (x) = 0 pertenecen al conjunto de las fracciones para las que p a0 y q| an. En particular, si an = 1 (y en este caso se dice que f (x) es un polinomio mónico), las únicas raíces racionales tienen que ser enteras, con lo que la búsqueda se simplifica bastante. Ejemplo 4.2.1

Sea f (x) = x 6 + 10 x5 + 40 x 4 + 82 x 3 + 91x 2 + 52 x + 12 = 0. Las posibles raíces racionales pertenecen al conjunto de los divisores de 12, a saber: { ± 1, ± 2, ± 3, ± 4, ± 6, ± 12} . Puede probarse que x 6 + 10 x5 + 40 x 4 + 82 x 3 + 91x 2 + 52 x + 12 = (x + 1)3 (x + 2)2 (x + 3) , que por lo tanto tiene raíces

4.2  Funciones polinomiales

−1, −2 y −3. (−1 es raíz triple; −2, doble; y −3, simple. Cualquier otro racional es raíz de multiplicidad cero, es decir, no es raíz.) Ejemplo 4.2.2 6

8x + 28x5 + 10 x 4 − 35x 3 − 5x 2 + 16x − 4 = 0. En este ejemplo, las raíces racionales se deben buscar entre las fracciones cuyo numerador es un divisor de 4 y con denominador divisor de 8. Así, el p conjunto de números sospechosos de ser raíces racionales de la ecuación son { q }, en donde p ∈ { ± 1, ± 2, ± 4}   y  q ∈ { ± 1, ± 2, ± 4, ± 8}. Entonces, p / q ∈ ± 2, ± 1, ± 1 , ± 1 , ± 1 . f(x) resulta ser 2 4 8 3 igual a 8(x + 2)2 (x + 1) x − 1 , y, por lo tanto, sus raíces son −2 de multiplicidad 2, −1 de multi2 1 plicidad 1 y 2 de multiplicidad 3. 

(

)

{

}

Ejemplo 4.2.3 4

x + x 3 + 3x 2 − 2 x + 2 = 0 . En este caso, las raíces racionales tienen que estar en el conjunto de los divisores de 2, a saber: ± 1, ± 2. Se puede ver que el conjunto {(x + 1), (x − 1), (x + 2), (x − 2)} no 4 3 2 tiene ningún divisor de x + x + 3x − 2 x + 2, de lo que se concluye que la ecuación propuesta  no tiene raíces racionales.  Como puede verse, una vez que se han localizado los posibles sospechosos de ser raíces racionales, su búsqueda requiere de divisiones f (x) entre binomios de la forma x − a, proceso que se puede simplificar utilizando el algoritmo conocido como “división sintética”, que se detalla a continuación.

Algoritmo de la división sintética Cuando se divide un polinomio an x n +  + a0 entre un binomio x − a, el procedimiento (aprendido en secundaria) produce una colección de expresiones:

x−a

bn x n −1 + (bn −1 + abn ) x n − 2 +  bn x n + bn −1x n −1 + bn − 2 x n − 2  + b0

−bn x n + abn x n −1 

r

El procedimiento general es el siguiente: 1. El primer término del cociente es el resultado de dividir el primer término del dividendo entre

el primero del divisor, que es x; por lo tanto, si el primer término del dividendo fuera anxn, el que corresponde al primero del cociente es anxn−1.5 2. Se multiplica anxn−1 por (x − a) y el producto se resta del dividendo, con lo que se obtiene el primer residuo parcial (o segundo dividendo), en el que el término anxn queda cancelado.

(an x n −1)(x − a) = an x n − aan x n −1

y an x n + an −1x n −1 +  + a0 – an x n + aan x n −1 (an −1 + aan ) x n −1 +  + a0 (primer residuo parcial o segundo dividendo) 5

El signo de an entre 1 es el signo de an, el valor de an entre 1 es an y xn entre x es xn−1.

143

144

Unidad 4  Polinomios y teoría de ecuaciones

Los siguientes términos del cociente se construyen repitiendo el procedimiento de dividir entre x cada uno de los residuos parciales, en los que el primer término del anterior resulta cancelado, y se continúa hasta que el último de los residuos parciales sea constante. Ejemplo 4.2.4



x−2

−3x 2 − 6 x − 10 −3x 3 + 2 x − 7

(

− −3x 3 + 6x 2

)

−6x 2 + 2 x − 7

(

− −6x 2 + 12 x

)

−10 x − 7 −(−10 x + 20) −27 Observe que: 1. En el cociente aparecen las potencias decrecientes de la x, empezando por xn−1 (algunos coefi-

cientes pueden ser cero). 2. El signo y el coeficiente de cada término del cociente coinciden con los de los primeros térmi-

nos de cada dividendo (el original y cada residuo parcial). Cada uno es el resultado de dividir los correspondientes coeficientes entre 1. Estas operaciones sólo involucran a los coeficientes, de manera que se puede prescindir de las x en todas las expresiones. 3. Al efectuar cada resta se cambian los signos al sustraendo y se suman, por lo que el primer término de cada dividendo se anula. En vista de las observaciones anteriores, la división se puede simplificar escribiendo solamente los coeficientes del dividendo y el término independiente del divisor, al que se le cambia de signo para evitar el proceso de cambiarlo cada vez que se tenga que restar. Finalmente se pueden compactar las restas en una sola línea. Así, para el ejemplo anterior puede escribirse: 2

−3

0

2 −7

y seguir de acuerdo con las etapas antes descritas. −3 2 −3 0 2 −7 −6 −6 2 −7 −6 2 −6 2 −7 −12 −10 −7 2

−10 −10 −7

−20 −27

4.2  Funciones polinomiales

es decir:

−3 −6 −10

2 −3 0 2 −7 −6 −12 −20 −6 −10 −27 El proceso de dividir −3x 3 + 2 x − 7 entre x − 2 da como cociente −3 x 2 − 6 x − 10 y deja residuo –27. En efecto, compruebe que −3x 3 + 2 x − 7 = (x − 2) −3x 2 − 6x − 10 − 27. Observe que al escribir los coeficientes del dividendo se tuvo la precaución de poner cero en el lugar correspondiente al término en x2, que no aparece explícito en el polinomio −3x 3 + 2 x − 7. En resumen, para dividir un polinomio f (x) entre x − a:

(

)

1. Escriba, dentro del calderón de la división, los coeficientes f (x) en el orden que ocupan cuan-

do se escribe el polinomio como dividendo, teniendo cuidado de poner cero en los lugares correspondientes a las potencias faltantes. Por ejemplo, si f (x) = −3x 2 + 2 x − 7 y a = 2:

−3

0

2 −7

2. Afuera del calderón escriba “a” (note que se está dividiendo entre x − 2).

2

−3

0

2 −7

3. Copie el primer coeficiente del divisor y póngalo en la parte superior del calderón:

2

−3 −3

0

2 −7

4. Multiplique ese número (−3) por (2), súmelo al segundo término dentro del calderón (0) y

escriba la suma en la parte de arriba: −3 −6 2 −3 0 2 −7 −6 5. Prosiga en forma ordenada (ahora es 2 × − 6 que se suma al 2. El –10 sube).

−3 −6 −10 2 −3 0 2 −7 −6 −12 6. El proceso termina con la última suma, que es el residuo:

−3 −6 −10 2 −3 0 2 −7 −6 −12 −20 (−27) 7. Escriba en el cociente las potencias de x que corresponden, empezando de derecha a izquierda, con x0 (que es igual a 1 y no se pone). Entonces la división de −3x 3 + 2 x − 7 entre x − 2 tiene cociente −3x 2 − 6x − 10 y residuo –27. Ejemplo 4.2.5

Encuentre las raíces racionales de la ecuación 12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = 0 y factorícela. Solución Note que como los coeficientes de la ecuación son enteros, las posibles raíces racionales son números p donde p es un divisor de 2 y q es un divisor de 12; es decir, las raíces racionales pertenecen q al conjunto ±1, ± 2, ± 1 , ± 1 , ± 1 , ± 1 , ± 1 , ± 2 . 2 3 4 6 12 3

{

}

145

146

Unidad 4  Polinomios y teoría de ecuaciones

Observe que como la suma de los coeficientes es cero, 1 es una raíz; entonces, x − 1 divide al polinomio. En efecto, 1

12

16

−17

−1

2

0

12

4

−33

16

3

−2

12

16

−17

(

−1

2

)

Entonces, 12 x + 4x − 33x + 16x + 3x − 2 = (x − 1) 12 x + 16x − 17 x 2 − x + 2 . Ahora el problema es encontrar las raíces racionales del factor de la derecha, que es un polinomio un grado menor que el original. Como el coeficiente principal y el término independiente no han cambiado, las posibles raíces racionales siguen perteneciendo al mismo conjunto. Se puede ver (división sintética) que 1, −1 y 2 no son raíces. Entonces ensayamos con el −2, con lo que resulta: 5

4

3

−2

2

4

3

12

−8

−1

1

0

12

16

−17

−1

2

−24

16

2

−2

(

)

Como resultado queda 12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = (x − 1)(x + 2) 12 x 3 − 8x 2 − x + 1 .  1 1 1 1 1 Ahora las posibles raíces racionales pertenecen al conjunto ± , ± , ± , ± , ± . 2 3 4 6 12   Si se ensaya con 1 resulta: 2 12 0 −2 −2 Nota 1 Ya que el polinomio original es de 12 1 −8 −1 2 coeficientes enteros, la aparición  6 −1 −1 p

de una raíz q fuerza a que el  polinomio reducido (el último cociente) tenga a q como común divisor (en este caso 2).

Como resultado queda

(

1 12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = (x − 1)(x + 2) x −  12 x 2 − 2 x − 2 2  1 = 2 (x − 1)(x + 2) x −  6x 2 − x − 1 . 2 

(

)

{

)

}

1 1 1 Ahora las posibles raíces racionales pertenecen al conjunto ± , ± , ± . 2 3 6 En efecto,

Nota Como 1 sigue siendo candidato, 2 debe seguirse probando como posible raíz.

1 2

6

2

0

6

−1

−1

3

1

Como resultado queda 1 1 12 x5 + 4x 4 − 33x 3 + 16x 2 + 3x − 2 = 2 (x − 1) (x + 2)  x −   x −  (6x + 2) 2  2  2

1 = 4(x − 1)(x + 2) x −  (3x + 1) 2  Nota Los últimos pasos se pueden cambiar por la solución de la ecuación 6x 2 − x − 1 = 0 mediante el uso de la fórmula general para resolver las ecuaciones de segundo grado.

2

1 1 = 12 (x − 1)(x + 2) x −   x +  . 2  3  1 1 1 Finalmente, las raíces racionales son 1, − 2, , , − . 2 2 3

4.2  Funciones polinomiales

Ejemplo 4.2.6

Encuentre las raíces racionales de x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = 0 x. Solución Como el polinomio es mónico, las posibles raíces son enteras y pertenecen al conjunto

{±1, ± 2, ± 3, ± 4, ± 6, ± 7, ± 8, ± 12, ± 14, ± 21, ± 24, ± 28, ± 42, ± 56 ± 84, ± 168}. Es claro que evaluar el polinomio con x = 1 es equivalente a sumar sus coeficientes, mientras que cuando x = −1, los coeficientes correspondientes a las potencias impares de la variable cambian de signo. Como al evaluar el polinomio en los valores 1 y ­­−1 se obtienen valores distintos de cero, los factores (x − 1) y (x + 1) no lo dividen:

(1)5 − 16(1)4 + 93(1)3 − 254(1)2 + 332 (1) − 168 = 1 − 16 + 93 − 254 + 332 − 168 = −12 (−1)5 − 16(−1)4 + 93(−1)3 − 254(−1)2 + 332 (−1) − 168 = −1 − 16 − 93 − 254 − 332 − 168 = −874 Por lo tanto, pruebe con 2: 2

1

−14

65

−124

84

0

1

−16

93

−254

332

−168

2

−28

130

−248

168

(

)

Entonces, x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2) x 4 − 14x 3 + 65x 2 − 124x + 84 . Como el término independiente cambió y hemos probado que 1 y ­­−1 no son raíces, el conjunto de posibles raíces racionales es ahora {±2, ± 3, ± 4, ± 6, ± 7, ± 12, ± 28, ± 42, ± 84} . Así, es conveniente continuar probando con 2: 2

1

−12

41

−42

0

1

−14

65

−124

84

2

−24

82

−84

(

)

El resultado es x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2)2 x 3 − 12 x 2 + 41x − 42 y las posibles raíces racionales pertenecen al conjunto {±2, ± 3, ± 6, ± 7, ± 14, ± 21, ± 42} . Nuevamente se recomienda continuar con 2:

2

1

−10

21

0

1

−12

41

−42

2

−20

42

(

)

El resultado es x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2)3 x 2 − 10 x + 21 . Ahora las posibles raíces racionales pertenecen al conjunto {±3, ± 7, ± 21} . Pruebe con 3. No es necesario investigar las raíces siguiendo el orden natural (lexicográfico); la regla de Descartes y la aparición de cotas pueden dar información que reduzca el trabajo.

3

1

−7

0

1

−10 3

21 −21

El resultado es x5 − 16x 4 + 93x 3 − 254x 2 + 332 x − 168 = (x − 2)3 (x − 3)(x − 7). Entonces las raíces racionales son 2, 2, 2, 3, 7. Note que el polinomio x 2 − 10 x + 21 = 0 se puede descomponer directamente en factores en la forma x 2 − 10 x + 21 = (x + a )(x + b), de manera tal que a + b = −10 y ab = 21. Entonces a = −3 y b = −7; por lo tanto, x 2 − 10 x + 21 = (x − 3)(x − 7). 

147

148

Unidad 4  Polinomios y teoría de ecuaciones

Ejemplo 4.2.7

Encuentre las raíces racionales de la ecuación x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = 0. Solución Como este polinomio carece de término independiente, es conveniente factorizarlo antes de plantear el conjunto de las posibles raíces. Así,

(

x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x x5 − 3x 4 − 5x 3 + 15x 2 + 4x − 12 y dado que x = (x − 0) , el polinomio queda factorizado en la forma

(

)

x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = (x − 0) x5 − 3x 4 − 5x 3 + 15x 2 + 4x − 12

)

es decir, cero es una de sus raíces (cero anula el primer factor). Las posibles raíces del factor de la derecha pertenecen al conjunto {±1, ±2, ±3, ±4, ±6, ±12}. Como la suma de los coeficientes es cero y 1 es una raíz, entonces x − 1 divide al polinomio. En efecto, 1

1

−2

−7

8

12

0

1

−3

−5

15

4

−12

1

−2

−7

8

12

(

)

Así, x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1) x 4 − 2 x 3 − 7 x 2 + 8x + 12 . En este caso, las posibles raíces racionales que faltan siguen perteneciendo al mismo conjunto: {±1, ±2, ±3, ±4, ±6, ±12} y como la suma de los coeficientes es distinta de cero, 1 ya no es raíz; proceda con −1: −1

1

−3

−4

12

0

1

−2

−7

8

12

−1

3

4

−12

(

)

Entonces, x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1)(x + 1) x 3 − 3x 2 − 4x + 12 . Al sumar los coeficientes cambiando los signos de aquellos cuyas potencias son impares no se obtiene cero, es decir, −1 ya no se repite. Las posibles raíces racionales pertenecen al conjunto reducido {±2, ±3, ±4, ±6, ±12}. Pruebe ahora con 2: 2

1

−1

−6

0

1

−3

−4

12

2

−2

−12

(

)

De esta manera, x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1)(x + 1)(x − 2) x 2 − x − 6 . Ahora las posibles raíces racionales pertenecen al conjunto{±2, ±3}, pero x = 2 ya no es raíz (división sintética). Pruebe con −2: −2

1

−3

0

1

−1 −2

−6 6

El resultado es x 6 − 3x5 − 5x 4 + 15x 3 + 4x 2 − 12 x = x (x − 1)(x + 1)(x − 2)(x + 2)(x − 3) . Entonces, las raíces racionales son −2, −1, −0, 1, 2, 3.

Raíces complejas En el campo  de los números complejos existe una función, la conjugación, η :  → , que asocia a cada número complejo z = a + bi , su conjugado z = a − bi , y que puede verse, geométricamente, como la reflexión de los puntos del plano (­números complejos) sobre el eje de las abscisas. Recuerde que la función η tiene las propiedades siguientes:

4.2  Funciones polinomiales

 Teorema  4.2.1 Si η(z) se denota como z , entonces ∀ z, w ∈  se cumple: 1. z = z   El conjugado del conjugado de z es z (es decir, η es autoinversa). 2. z + w = z + w ∴ z − w = z − w   El conjugado de la suma es la suma de los conjugados (la

conjugación conmuta con la suma). (z / w) = z / w   El conjugado de un producto es el producto de los conjugados (la conjugación conmuta con el producto). 4. z = z si y sólo si z ∈   La conjugación deja fijo a ℝ. 3. zw = z w ∴ si w ≠ 0

Corolario 1 Si un complejo z es cero de un f(x) con coeficientes reales, entonces z también, y ambos complejos son raíces de igual multiplicidad de la ecuación f(x) = 0.

Demostración n

Si f (x) = a0 + a1x +  + an x n , ai ∈ , i = 1, 2, ..., n y z ∈  es tal que 0 = f (z ) = ∑ ai z i :. n

Al conjugar ambos lados de la igualdad 0 = ∑ai z i se obtiene

0

0

. Tanto 0 como cada ai son números reales (y, por lo tanto, coinciden con sus conjugados), y como además se puede probar (por inducción) que ∀ n ∈ , z n = ( z ) n , de i n 0 = a0 + a1 z +  + an z se obtiene 0 = a0 + ∑ ai (z ) = f (z ). Finalmente, si z ∈  es un cero de multiplicidad m de f(x), (x − z ) m f (x), es decir, ∃ g (x) ∈  [x] ∋ f (x) = (x − z ) m g (x), y conjugando (note que f (x) ∈  [x ] ⇔ f (x) = f (x), f (x) = (x − z ) m g (x), es decir, (x − z ) m f (x), y por lo tanto, z es un cero f(x), de multiplicidad al menos m. Un argumento análogo muestra que la multiplicidad de z es mayor o igual a la de z y que, por lo tanto, son de igual multiplicidad como ceros de f(x).

La discusión anterior muestra que si un complejo z es raíz de una f(x) = 0 con coeficientes reales, entonces z también y que, por lo tanto, (x − z ) y (x − z ) son divisores de f(x). Dado que (x − z) y (x − z ) son primos relativos, (x − z)(x − z ) f (x). Note que si z = a + bi, (x − z )(x − z ) es (x − a − bi )(x − a + bi ) = x 2 + 2 ax + a 2 + b2 ∈  [x] y, f (x) por lo tanto, = g (x) ∈  [x], que es de grado 2 unidades menor que el de f(x), lo que

(x − z)(x − z )

en general facilita la búsqueda de las demás raíces.

Raíces “surd” El razonamiento anterior también se aplica en el caso de los elementos del campo

( p ) = {a + b p; a, b ∈ , p primo} en donde la función η : ( p ) → ( p ), que está definida: η(a + b p ) = a − b 

p , tiene las mismas propiedades que la conjugación compleja; es decir, es un automorfismo de campos que deja fijos a los números racionales. Entonces si un “surd” a + b p es raíz de una ecuación f(x) = 0 con coeficientes racionales, su conjugado a − b p también lo es y de la misma multiplicidad. La demostración es análoga a la anterior.

149

150

Unidad 4  Polinomios y teoría de ecuaciones

Ejemplo 4.2.8

Si se sabe que 1 − 2 3 es raíz de x 4 − 2 x 3 − 10 x 2 − 2 x − 11 = 0 , de acuerdo con el corolario 1, 1 + 2 3 también es raíz y, por lo tanto, x − 1 − 2 3 y x − 1 + 2 3 dividen al polinomio. Como éstos son factores primos relativos, su producto también divide. Es decir, x − 1 + 2 3 x − 1 − 2 3 es un divisor del polinomio original. Para encontrar el producto, los factores se pueden agrupar en la forma (x − 1) + 2 3 (x − 1) − 2 3 , que, como se ve, resulta una diferencia de cuadrados, es 2 decir, (x − 1) + 2 3 (x − 1) − 2 3 = (x − 1)2 − 2 3 = x 2 − 2 x − 11 , que es un polinomio con coeficientes enteros.

(

(

(

x2

)(

)(

−2x

)

−11

)

)

(

(

)

(

)(

)

)

x2

+0x

+1

x4

−2x3

−10x2

−x4

+2x3

+11x2

0x3

+x2

−2x

0x3

+0x2

+0x

−2x

−11

x2

−2x

−11

−x2

+2x

+11

0 Note que las raíces que faltan son los ceros del polinomio que está en el numerador, o sea,  x2 + 1. Entonces, x 4 − 2 x 3 − 10 x 2 − 2 x − 11 = x − 1 + 2 3 x − 1 − 2 3 (x + i )(x − i ). Finalmente, los ceros de f (x) = x 4 − 2 x 3 − 10 x 2 − 2 x − 11 son 1 − 2 3, 1 + 2 3 , i , −i 

(

)(

)

Ejemplo 4.2.9

Se sabe que i es raíz de x 4 − 7 x 3 + 13x 2 − 7 x + 12 = 0. Encuentre las otras raíces. Solución Como i es raíz, de acuerdo con el teorema anterior, −i también, y, por lo tanto, el producto (x − i )(x + i ) = x 2 + 1 divide al polinomio. Al efectuar la división se obtiene: x2

+0x

+1

x2

−7x

+12

x4

−7x3

+13x2

−x4

+0x3

−x2

−7x3

+12x2

−7x

7x3

+0x2

+7x

12x2

+0x

+12

−12x2

+0x

−12

−7x

+12

0 Note que el procedimiento anterior puede simplificarse empleando solamente los coeficientes. Es decir, 1

0

1

1

−7

12

1

−7

13

−1

−7

12

0

−1

−7

12

−7

7

0

7

12

0

12

−12

0

−12

0

4.2  Funciones polinomiales

(

)(

)

(

)

Entonces, x 4 − 7 x 3 + 13x 2 − 7 x + 12 = x 2 + 1 x 2 − 7 x + 12 = (x − i ) (x + i ) x 2 − 7 x + 12 . Proceda ahora a buscar los ceros de la función f (x) = x 2 − 7 x + 12. Las posibles raíces están en el conjunto {±1, ± 2, ± 3, ± 4, ± 6, ± 12} , y puede probarse por división sintética que ni ±1 ni ±2 lo son; por lo tanto, pruebe con 3. 3

1

−4

0

1

−7

12

3

−12

Entonces, x 4 − 7 x 3 + 13x 2 − 7 x + 12 = (x − i )(x + i )(x − 3)(x − 4). Finalmente, los ceros de f (x) = x 4 − 7 x 3 + 13x 2 − 7 x + 12 son i, − i, 3, 4. Ejemplo 4.2.10

Encuentre las raíces de la ecuación 12 x 7 − 32 x 6 + 39x5 + 5x 4 − 28x 3 + 16x 2 + 20 x + 4 = 0, sabiendo que 1 − i es una raíz de multiplicidad 2. Solución De acuerdo con el teorema 4.2.1, si 1 − i es una raíz doble de la ecuación, entonces su conjugado también lo es, por lo que el producto

[(x − 1 − i )(x − 1 + i )] 2 = (x2 − 2x + 2)

2

= x 4 − 4x 3 + 8x 2 − 8x + 4

divide al polinomio original. Al efectuar la división se obtiene: 1

−4

8

−8

4

12

16

7

12

−32 48

39

5

−28

−96

96

−48

−57 64

101

−76 128

−12

16 −16

7 −7

1

−128 −27 28 1 −1

16

20

4

16 −64 −48 56

52 −56 −4 4

8 −8 0

20 −28 −8 8

4 −4

Entonces,

(

12 x 7 − 32 x 6 + 39x5 + 5x 4 − 28x 3 + 16x 2 + 20 x + 4 = x 2 − 2 x + 2

(

)

= [(x − 1 − i )(x − 1 + i )] 12 x 3 + 16x 2 + 7 x + 1 . 2

) (12x3 + 16x2 + 7x + 1) 2

Ahora el problema consiste en encontrar los ceros del polinomio f (x) = 12 x 3 + 16x 2 + 7 x + 1. Nuevamente, como los coeficientes de la ecuación son enteros, las posibles raíces racionales son números qp donde p es un divisor de 12 y q es 1; es decir, las raíces racionales pertenecen al

  conjunto ±1, ± 1 , ± 1 , ± 1 , ± 1 , ± 1 .  2 3 4 6 12  Como todos los coeficientes f(x) son positivos, la ecuación f(x) = 0 no puede tener raíces positivas, por lo que deben probarse solamente los “sospechosos” negativos. Al evaluar el polinomio en −1 se obtiene

12 (−1)3 + 16(−1)2 + 7 (−1) + 1 = −12 + 16 − 7 + 1 = −2

151

152

Unidad 4  Polinomios y teoría de ecuaciones

lo que demuestra que −1 no es raíz. 1 Se sugiere probar con − . 2 −

12 12

1 2

10 16

2 7

0 1

−6

−5

−1

(

)

(

)

1 Entonces, 12 x 3 + 16x 2 + 7 x + 1 =  x +  12 x 2 + 10 x + 2 = (2 x + 1) 6x 2 + 5x + 1 . 2  1 Al probar nuevamente con − se encuentra: 2 6 6

1 − 2

2 5

0 1

−3

−1

Entonces, 12 x + 16x + 7 x + 1 = (2 x + 1) (3x + 1). 3

2

2

1 1 Como 3x + 1 = 0 tiene raíz x = − , y 2x + 1 = 0, x = − , las raíces del polinomio original son 2 3 1 1 1 1 + i, 1 + i, 1 − i, 1 − i, − , − , − 2 2 3

Ejemplo 4.2.11

Sea f (x) = 2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 10 x 2 + x − 3 un polinomio del que se sabe (de alguna manera) que i es un cero de multiplicidad 2, y se desea resolver la ecuación f (x) = 0. Puesto que f (x) ∈ [x], y de acuerdo con el teorema anterior, se sabe que entonces  (x − i) 2 y también (x + i)2 dividen a f(x). Solución

(

)

2

El producto (x − i )2 (x + i )2 = x 2 + 1 = x 4 + 2 x 2 + 1 divide a f(x), y al efectuar la división se ob-  tiene 1 0 2 0 1

2

−3

−3

−10

16

1

−3

2 −2

−3 0 −3 3

1 −4 −3 0 −3 3

−16 0 −16 6 −10 0 −10 10

12 −2 10 0 10 6 16 0 16 −16

−22

26

−8

26 3 29 0 29 −32 −3 0 −3 −3

−8 10 2 0 2 −2 0 0

−22 3 −19 0 −19 20 1 0 1 −1

10

10 −16 −6 0 −6 −6 0

Entonces, 2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 10 x 2 + x − 3

( )( ) 2 = (x 2 + 1) (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3) = (x − i )2 (x + i )2 (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3). = x 4 + 2 x 2 + 1 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3  

1

−3

1 −1 0 0

−3 −3

2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 104.2  x 2 Funciones + x − 3 polinomiales

( )( ) 2 = (x 2 + 1) (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3) = (x − i )2 (x + i )2 (2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3). = x 4 + 2 x 2 + 1 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3  

Ahora se deben encontrar las raíces de 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3 = 0. En este caso, las posibles raíces racionales pertenecen al conjunto

{

}

1 3 ±1, ± , ± , ± 3 . 2 2

Otra vez, como la suma de los coeficientes es cero, 1 debe ser raíz: 1

2

−1

−4

−14

2

3

0

2

−3

−3

−10

16

1

−3

2

−1

−4

−14

2

3

(

)

Entonces, 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3 = (x − 1) 2 x5 − x 4 − 4x 3 − 14x 2 + 2 x + 3 . De esta manera, el problema ahora es encontrar las raíces de 2 x5 − x 4 − 4x 3 − 14x 2 + 2 x + 3 = 0. En este caso las posibles raíces racionales pertenecen al mismo conjunto, excepto que, como la suma de los coeficientes es distinta de cero, 1 no lo es y se puede probar por división sintética que –1 tampoco. Entonces el conjunto de las posibles raíces de la nueva ecuación es

{

}

1 3 ± , ± , ±3 . 2 2

1 Pruebe con : 2 1 2

2

0

−4

−16

−6

0

2

−1

−4

−14

2

3

1

0

−2

−8

−3

(

)

1 Entonces, 2 x 6 − 3x5 − 3x 4 − 10 x 3 + 16x 2 + x − 3 = (x − 1)  x −  2 x 4 − 4x 2 − 16x − 6 2  = (x − 1)(2 x − 1) x 4 − 2 x 2 − 8x − 3 .

(

)

4

2

El problema se ¿reduce? ahora a la solución de la ecuación de 4° grado: x − 2 x − 8x − 3 = 0. El conjunto de sus posibles raíces racionales es

{±1, ± 3} pero, como probamos anteriormente, los valores ±1 no son raíces. Pruebe con ±3: 3

2

6

14

26

72

2

0

−4

−16

−6

6

18

42

78

−3

2

−6

14

−58

168

2

0

−4

−16

−6

−6

18

−42

174

Evidentemente, ±3 tampoco son raíces. Entonces,

2 x10 − 3x 9 + x8 − 16x 7 + 12 x 6 − 22 x5 + 26x 4 − 8x 3 + 10 x 2 + x − 3

(

)

= (x − i )2 (x + i )2 (x − 1)(2 x − 1) x 4 − 2 x 2 − 8x − 3



1 Las raíces racionales de la ecuación original son i , i , − i , − i , 1, . ¿Está claro que la ecuación 2 no tiene más raíces racionales?¿Qué hacer ahora? … ¡No se pierda la próxima sección! Resumen 1. Asegúrese de que f (x) ∈  [x], es decir, el polinomio tiene coeficientes enteros. 2. Escriba los coeficientes en forma ordenada, poniendo cero en el lugar de cada coeficiente de

los términos faltantes.

153

154

Unidad 4  Polinomios y teoría de ecuaciones 3. Identifique el coeficiente principal y el independiente, an y a0. 4. Haga una lista de “sospechosos” (las posibles raíces racionales), es decir, el conjunto

 p  ; p a0 , q an , p y q primos relativos q   5. Observe:

•  Si los coeficientes de f(x) son todos positivos, no hay raíces positivas. •  Si los coeficientes de f(−x) son todos negativos o todos positivos, no hay raíces negativas. 6. Si la suma de los coeficientes de f(x) es cero, 1 es raíz. Si la suma de los coeficientes de f(−x)

es cero, −1 es raíz. Si los últimos r términos del polinomio son cero, 0 es una raíz de multiplicidad r. En particular, si el término independiente es cero, 0 es raíz. 7. Si encuentra una raíz, busque las demás en el polinomio degradado, incluida la que encontró cuando sea el caso (es decir, cuando permanezca en la lista de las posibles). 8. Haga buen uso de la información (raíces irracionales y complejas conjugadas). Recuerde que, como consecuencia del teorema fundamental del álgebra, todo polinomio de grado n tiene exactamente n raíces (bien contadas, es decir, cada raíz de multiplicidad r cuenta como r raíces); por lo tanto, si sólo encontró m raíces racionales (y las buscó bien) con m < n, faltan n − m raíces que pueden ser irracionales o complejas conjugadas (vea el ejemplo 4.2.10). A continuación se enuncian cuatro teoremas importantes sin demostración.

 Teorema  4.2.2 Teorema fundamental del álgebra Todo polinomio f(x) no constante, con coeficientes complejos, tiene (al menos) un cero complejo. [Para cada ecuación f (x) = 0, si f (x) no es un polinomio constante existe un número complejo z tal que f (z) = 0.]

 Teorema  4.2.3 Sea K un campo, f (x) ∈ K [x] y f (x) no constante. Entonces existe una extensión F del campo K (un campo F del cual K es un subcampo) en el que f (x) tiene un cero (al menos uno).

Corolario 16 Existe una extensión del campo K en la que f (x) tiene tantos ceros (bien contados) como su grado.

 Teorema  4.2.4 Sea f (x) un polinomio de grado n con coeficientes en un campo K. Entonces f (x) tiene a lo más n raíces en cualquier extensión del campo K.

 Teorema  4.2.5 El campo  de los números complejos es algebraicamente cerrado, es decir, contiene a todas las raíces de las ecuaciones polinomiales complejas (cada ecuación f (x) = 0 con f (x) ∈ C [x], tiene todas sus raíces en ).

6

La condición de que se trate de campos es esencial para que los teoremas se cumplan. En el conjunto de los cuaternios reales QR = {a + bi + cj + dk; a, b, c, d ∈ R}, cuyas operaciones cumplen todas las propiedades requeridas por las operaciones de los campos, excepto la conmutatividad de la multiplicación, el polinomio x2 + 1 tiene un número infinito de ceros, a saber, todos los cuaternios de la forma bi + cj + dk con b2 + c2 + d2 = 1 (es decir, la ecuación x2 + 1 = 0 tiene tantas raíces como puntos tiene la esfera con centro en el origen y radio uno).

4.2  Funciones polinomiales

Las ecuaciones generales de 2°, 3° y 4° grados El teorema fundamental del álgebra garantiza la existencia de n raíces (bien contadas) para cada ecuación polinomial compleja f (x) = 0 de grado positivo n (f (x) ∈  [x], gr f = n), pero no dice cómo encontrarlas. Se sabe (como consecuencia de la teoría de Galois) que para la ecuación general de grado n, con n ≥ 5 no pueden existir métodos que permitan calcular sus raíces a partir de efectuar operaciones racionales (suma, resta, multiplicación o división), más la extracción de raíces n-ésimas efectuadas con los coeficientes; sin embargo, se conocen fórmulas que permiten resolver las ecuaciones polinomiales de grado 1, 2, 3 o 4, y que se discutirán en los párrafos siguientes: 1. La ecuación general de 1° grado ax + b = 0, a ≠ 0 tiene la solución x = − b / a. 2 2. La conocida “fórmula del chicharronero” para la ecuación de 2° grado ax + bx + c = 0,   2 a ≠ 0 es x = −b ± b − 4ac , que, como se ve, involucra la extracción de la raíz cuadrada del 2a “discriminante” ∆ = b2 − 4ac (se llama así porque, cuando los coeficientes son reales, permite conocer la naturaleza de sus raíces. En efecto, si Δ es mayor que cero, las raíces de la ecuación son dos números reales distintos. Si Δ = 0, la ecuación tiene una sola raíz real doble  −b / (2a), y si Δ < 0, las raíces son complejos conjugados). 3. Las fórmulas de Cardano y el método de “completar cuadrados” de Ferrari permiten resolver las ecuaciones de 3° y 4° grados.

Deducción de la fórmula general para las ecuaciones de 2° grado Sea ax2 + bx + c = 0, a ≠ 0, a, b, c ∈ una ecuación. 2 1. Se divide cada miembro entre a, y el término c  a pasa al segundo miembro: x + b x = − c .

/ a a a cada lado de la igualdad para completar el trinomio cuadrado 2 2 2 2 perfecto del lado izquierdo x 2 + b x + b =  x + b  = b − c = b − 4ac . Al extraer las a 2 2 a 2a  4a 2 4a 4a  2 raíces cuadradas de ambos lados de la ecuación se obtiene x + b = ± b − 4ac y, final2a 2a 2 mente x = −b ± b − 4ac . 2a

2. Se agrega el término

La ecuación de 3° grado Sea ax3 + b ′x2 + c ′x + d ′ = 0, a, b ′, c′, d ′ ∈ , a ≠ 0. 3 2 1. Se divide entre a y se obtiene x + bx + cx + d = 0. Al definir y d ′ = d / a. Una observación importante: en casi todos los casos, cuando se trata de resolver una ecuación  f (x) = 0 conviene transformar el problema en otro en donde f (x) sea un polinomio mónico (con coeficiente principal 1), lo que en general simplifica los cálculos. Esto se consigue dividiendo el polinomio entre el coeficiente principal. El resultado es un polinomio que tiene exactamente los mismos ceros que el original. En efecto, si g(x) es igual a k f (x), k ≠ 0, g(x) = 0 si y sólo si f (x) = 0. 2. Al hacer el cambio de variable x = y − b / 3 se elimina el término de segundo grado. Entonces,

155

156

Unidad 4  Polinomios y teoría de ecuaciones

Finalmente,

  2b3 bc  b2  0 = y3 +  c −  y +  − + d  = y3 + py + q 3 3   27    2b3 bc  b2  p = c −  ; q =  − +d 3 3   27 

en donde

La ecuación ahora es y3 + py + q = 0. Se propone entonces el cambio y = u + v y se obtiene u3 + 3u2 v + 3uv 2 + v 3 + p(u + v) + q = 0, es decir, u3 + (3uv + p)(u + v) + q + v 3 = 0. 3 p3 p 3 2 3  p + − = 0 , que Al hacer v = − , queda u3 + q − y equivalentemente ( u ) qu = 0   3u 27 u3 3 3 es una ecuación de 2° grado en u , por lo que 3

p −q ± q 2 + 4   q 3 u3 = =− ± 2 2

2

3

q  +  p     2 3

u3 tiene tres raíces cúbicas (u1, u2 y u3), y si se denota a una cualquiera de ellas como 2

3

q q p u = 3 − +   +   2 2  3 

las otras dos resultan ser uω y uω2, en donde ω = − 1 + 3 i y ω 2 = − 1 − 3 i son dos de las raíces 2 2 2 2 cúbicas de la unidad. 2 3 q q   p Si ahora se considera como v3 = − 2 −  2  +  3  existen tres valores para v, y si a uno de     ellos lo denotamos como v = y vω2.

3

 q 2 q − −   + 2  2

 p 3   , se tiene que los otros dos valores para v son vω 3

Al multiplicar u por v, dadas las identificaciones anteriores se obtiene  2 3 q q p uv =  3 − +   +     2 2  3    

 2 3  3 −q −  q  +  p       2 2  3  

 =  

3

2 3  q q p   − +   +     2 2  3    

3

2 3  q q p   − −   +     2 2  3    

p p uv = 3  −  = − 3  3 p es decir, v satisface la igualdad v = − 3u , que es lo que se pidió en un paso anterior. 2 3 2 3 q q q   p q   p La moraleja de todo este cuento es que las fórmulas u3 = − 2 +  2  +  3  y v3 = − 2 −  2  +  3          2 3 q q p  permiten encontrar un valor para u y otro para v que satisfacen la condición   −   +   2 2 3 p anterior, es decir, v = − y, por lo tanto, permiten calcular y1 = u + v , que es una raíz de la 3u ecuación reducida que se deseaba resolver y3 + py + q = 0 . p Ahora, si u y v son tales que uv = − , las parejas uω con vω2 y uω2 con vω también satisfacen 3 la condición requerida y, por lo tanto,  y2 = uω + v ω2 ,  y3 = uω2 + v ω son las otras dos raíces  de la ecuación reducida. Finalmente, y así:

(

x1 = y1 −

)

b b b ,   x2 = y2 − ,   x3 = y3 − 3 3 3

son las tres raíces de la ecuación original.

4.2  Funciones polinomiales

Ejemplo 4.2.12

x 3 − 6x 2 − 12 x − 8 = 0 x = y+2 x3 −6x2 −12x −8 x 3 − 6x 2 − 12 x − 8

= = = =

y3 + 6y2 + 12y + 8 − 6y2 − 24y − 24 − 12y − 24 − 8

= y3 − 24 y − 48 p = − 24   q = − 48

 q 2  p 3 ∆ =   +   = 576 − 512 = 64 ∴ 2   3 

∆ =8

u3 = 24 + 8 = 8 · 4;

u = 2 3 4 , 2 3 4 ω , 2 3 4 ω2

v 3 = 24 − 8 = 8 · 2;

v = 2 3 2 , 2 3 2 ω2 , 2 3 2 ω

23 4 · 23 2 = 43 8 = 8 = −

p 3

( 3 4 + 3 2 ) ;    x1 = 2( 3 4 + 3 2 + 1) y2 = 2 3 4 ω + 2 3 2 ω2 = 2 ( 3 4 + 3 2 ω2 ) ;      x2 = 2 ( 3 4 ω + 3 2 ω2 + 1) y3 = 2 3 4 ω2 + 2 3 2 ω = 2 ( 3 4 ω2 + 3 2 ω) ;    x3 = 2 ( 3 4 ω2 + 3 2 ω + 1) 

    ∴ y1 = 2 3 4 + 2 3 2 = 2

Como puede verse,  y1 + y2 + y3 = 0, y1 y2 y3 = 48, como debe ser (relaciones entre raíces y coeficientes), que es una comprobación (parcial) de que y1, y2 y y3 son las raíces de la ecuación reducida y3 − 24 y − 48 = 0 . Note que también x1 + x2 + x3 = 6.

La ecuación de 4° grado Un método general para resolver las ecuaciones de cuarto grado ax 4 + bx 3 + cx 2 + dx + e = 0 con a, b, c, d , e ∈ , a ≠ 0, consiste en lograr una factorización del polinomio en dos factores de segundo grado que se resuelven después con la “fórmula del chicharronero”. La factorización se consigue completando trinomios cuadrados perfectos de la manera que se ilustra en los siguientes ejemplos. Ejemplo 4.2.13

x 4 + x 3 − 3x 2 + 7 x − 6 = 0.7 a) Considere los dos primeros términos y complete el trinomio cuadrado perfecto agregando y 2 1 13 1 2 restando 4 x ; x 4 + x 3 + 1 x 2 − 13 x 2 + 7 x − 6 = 0 y reordenando  x 2 + x  = x 2 − 7 x + 6. 4 4 2  4  1 u2 b) Agregue u  x 2 + x  + a cada lado. 2  4 

7

Recuerde que, según la observación que se hizo anteriormente, se considerarán sólo polinomios mónicos (o monificados).

157

158

Unidad 4  Polinomios y teoría de ecuaciones

2



2 2  x 2 + 1 x  + u  x 2 + 1 x  + u =  u + 13  x 2 +  u − 7  x + u + 6         2  2  4  4 4   2  2

1 13  u2 u   u  +6 es decir,  x 2 + x +  =  u +  x 2 +  − 7  x + 2 2  4 4  2 

(4.2.3)

c) Encuentre una u que convierta la expresión de la derecha en un trinomio cuadrado perfecto, 2  2   13  es decir, busque una u que resuelva la ecuación  u − 7  = 4 u + 6   u +  (que es de ter4 2  4    cer grado y se conoce como la ecuación auxiliar). En este caso, resulta u3 + 3u2 + 31u + 29 = 0, una de cuyas raíces es −1. Sea pues u = − 1. En ejercicios “sencillos” puede ensayarse el método de “tanteo” para encontrar la u requerida (vea los ejemplos 4.2.14 y 4.2.15). 2

2

La ecuación (4.2.3) queda  x 2 + 1 x − 1  = 9 x2 − 15 x + 25 =  3 x − 5  . 2 2 4 2 4 2 2  d) Al extraer las raíces, y tomando en cuenta los signos, se obtienen las dos ecuaciones siguientes: 1 1 3 5 i) x 2 + x − = x − , o sea, x 2 − x + 2 = 0. 2 2 2 2 1 1 3 5 ii) x 2 + x − = − x + , es decir, x 2 + 2 x − 3 = 0. 2 2 2 2 e) Compruebe que el procedimiento se ha seguido correctamente, multiplicando i) por ii):

x4 x4

x2



x

+

2

x2

+

2x



3

+

3x



6

+

4x

+

7x



6



3x2

2x3



2x2



x3

+

2x2

+

x3



3x2

(

)(

)

que es el polinomio original. Luego, x 4 + x 3 − 3x 2 + 7 x − 6 = x 2 − x + 2 x 2 + 2 x − 3 = 0. f) Resuelva las ecuaciones i) y ii) y compruebe los resultados. La multiplicación efectuada en el paso e) permite que la comprobación pueda hacerse solamente en los factores i) y ii).

1± 1− 8 1 7 1 7 ;       x1 = + i x2 = − i 2 2 2 2 2 −2 ± 4 + 12 de x 2 + 2 x − 3 = 0 x = ; x3 = 1 x4 = −3 2 de x 2 − x + 2 = 0 x =

 1 7   1 7  g) Finalmente, x 4 + x 3 − 3x 2 + 7 x − 6 = (x − 1)(x + 3)  x − − i  x − + i 2 2 2 2    

8

 1 7 1 7 8 i, − i . ker f = 1, − 3, + 2 2 2 2  

El núcleo o kernel de una función f, ker f, representa al conjunto de números complejos tales que, bajo la función polinomial f (x), van a dar al cero. Es decir, ker f es el conjunto de las raíces de la ecuación f (x) = 0.

159

4.3  Algunos resultados de la teoría de números y su aplicación

Ejemplo 4.2.14

x 4 − 6x 3 + 16x 2 − 54x + 63 = 0 i) x 4 − 6x 3 + 9x 2 + 7 x 2 − 54x + 63 = 0



u2 u2 = (u − 7) x 2 + (54 − 3u) x + − 63 4 4 2 2  x 2 − 3x + u  = u − 7 x 2 + 54 − 3u x + u − 63 ) ( )   ( 2 4 

(x2 − 3x)



2

(

)

+ u x 2 − 3x +

(4.2.4)

 u2  2 La ecuación auxiliar es (54 − 3u) = 4 − 63  (u − 7); es decir, u3 − 16u2 + 72 u + 1 152 , que  4  se puede factorizar (con división sintética) en la forma u3 − 16u2 + 72 u + 1152 = (u − 16) u2 + 72 , de modo que u = 16 transforma al segundo miembro de la ecuación (4.2.4) en 9x 2 + 6x + 1 , que es igual a (3x + 1)2 . Entonces,

(

)

x 2 − 3x + 8 = ±(3x + 1) lo que resulta en los polinomios x 2 − 6x + 7 y x 2 + 9, cuyo producto es el polinomio original. 2 El cálculo de u puede efectuarse por tanteos. Para esto, note que si u −63 debe ser un cua4 2 drado real, u −63 debe ser mayor o igual que cero, por lo que u2 debe ser u2 ≥ 252, y ∴ u ≥ 16 4 152 = 225, 225 < 252; 162 = 256, 256 − 252 = 4 . El lado derecho de la ecuación (4.2.4), haciendo u = 16, queda 9x2+ 6x + 7, que es igual a  (3x + 1)2. Ahora puede continuar con el procedimiento indicado.

(

)

Ejemplo 4.2.15

Resuelva x 4 − 11x 2 + 28x − 6 = 0. Observe que, por no existir término en x3, la compleción del primer trinomio cuadrado perfecto no tiene que hacerse. i)

x 4 = 11x 2 − 28x + 6.

ii) x 4 + ux 2 +

 u2  u2 = (u + 11) x 2 − 28x +  + 6  . 4  4 

(4.2.5)

Puede verse (por tanteos) que u = 5 transforma la ecuación (4.2.5) en 2

2

 x 2 + 5  =  4x − 7      2  2  lo que conduce a la factorización final

(

) (

)

x 4 − 11x 2 + 28x − 6 = x 2 + 4x − 1 + x 2 − 4x + 6 . 



4.3 Algunos resultados de la teoría de números y su aplicación a los polinomios y a las funciones polinomiales Recuerde que la suma y el producto de los números enteros tienen entre sus propiedades básicas las siguientes: ∀ a, b, c ∈ Z. 1. La suma

a) es asociativa: (a + b) + c = a + (b + c). b) es conmutativa: a + b = b + a.

160

Unidad 4  Polinomios y teoría de ecuaciones

c) tiene neutro aditivo: ∃ 0 ∈ Z ∋ a + 0 = 0 + a = a. d ) tiene un inverso aditivo en cada entero a: −a; − a + a = 0. Y, por lo tanto, {Z, +} es un grupo abeliano (o conmutativo). 2. La multiplicación a) es asociativa: (ab)c = a(bc). b) es conmutativa: ab = ba. c) tiene idéntico multiplicativo: ∃ 1∈ , 1 ≠ 0 ∋ a · 1 = a. d ) se distribuye sobre la suma: (a + b)c = ac + bc. Con estas propiedades, Z resulta un “anillo conmutativo con uno”. El producto de dos enteros ab es igual a 0 si y sólo si alguno de los factores es cero; ab = 0 ⇒ a = 0 o b = 0, lo que equivale a decir que en Z vale la ley de cancelación de factores iguales que sean diferentes de cero. Es decir que si ab = ac y a ≠ 0, entonces b = c. Las propiedades 1 y 2 confieren a Z la categoría de dominio entero. Existe en Z la función valor absoluto que se define: n si n ≥ 0    o   ∀ n ∈ , n =  − n si n < 0

n = máx { n, − n}

es decir, que el valor absoluto de un número entero n es el número no negativo mayor de la pareja n, − n.

 Teorema  4.3.1 De la definición resulta que ∀ n, m ∈ ,     i) n ≥ 0, n = 0 si y sólo si n = 0.   ii) nm = n m . *) n < m si y sólo si −m < n < m ∴(|n| ≤ m si y sólo si −m ≤ n ≤ m). iii) n + m ≤ n + m . Propiedades cuya demostración es directa de la definición.

Demostración En efecto,

  i) Si n es cero, −n también y, por lo tanto, n = 0.

Si no es cero, n o −n es positivo y entonces coincide con n , que, por lo tanto, es positivo.   ii) En el caso en que n = 0 o m = 0, nm es cero y entonces tanto nm como n m resultan ser ambas cero y, por lo mismo, iguales entre sí. Para analizar los otros cuatro casos se puede construir una tabla como la que sigue, en la que puede verse, comparando las dos últimas columnas, que el teorema es cierto.

Tabla 4.1  Análisis de los casos de la propiedad ii) n

m

|n|

|m|

nm

|nm|

+ + − −

+ − + −

n n −n −n

m −m m −m

+ − − +

nm −nm −nm nm

|n||m| = = = =

nm n (−m) (−n)m (−n)(−m)

*) ⇒ Hipótesis: n < m PD − m < n < m  n < m ⇒ m mayor que n y que −n, por lo que n < m, − n < m. Al multiplicar la segunda desigualdad por −1 se obtiene − m < n, de donde − m < n < m. ⇐ Hipótesis: − m < n < m, es decir, n < m y − m < n; por lo tanto, al multiplicar la segunda desigualdad por −1 se obtiene − n < m, de donde resulta que m es más grande que el máximo de { n, − n}, que es n ; es decir, n < m.

4.3  Algunos resultados de la teoría de números y su aplicación

iii)

Note que el teorema es válido si se consideran las desigualdades débiles.9 PD n + m ≤ n + m . En efecto, n ≤ n ∴− n a. Luego, β = {m ∈ + ; m b > a} es no vacío ((a + 1) ∈ β ) ((a + 1) ∈ β ) y, por lo tanto, por el principio del buen orden tiene un elemento menor m0, y en vista de que a ≥ b , m0 es mayor que uno y, por lo tanto, q0 = m0 − 1∈ + , y al ser menor que m0 no puede estar en β. Luego, q0 b ≤ a. Sea r = a − q0 b , entonces a = q0 b + r 0 ≤ r, y sólo falta probar que r < b . Suponga que no, es decir, r ≥ b . Luego, r = a − q0 b ≥ b , de donde a ≥ (q0 + 1) b = m0 b , lo que es absurdo. Por lo tanto, r < b . q0 si b = b Finalmente, se define q =  y se obtiene la igualdad deseada: −q0 si b = −b a = bq + r,    0 ≤ r < b . 2. Después de haber probado el teorema cuando a es no negativo, considere el caso a < 0.

Entonces, para −a ∈ + y |b| existen q0 , r0 ∈  ∋ −a = q0 b + r0 , 0 ≤ r0 < b . Al multiplicar por −1, a = −q0 b − r0  (4.3.1) Si r0 es r0 = 0, a = −q0 b . Si r0 no es cero, en la igualdad de la ecuación (4.2.6) sume y reste b , con lo que se obtiene a = −(q0 + 1) b + b − r0 , y al definir b − r0 = r se tiene a = −(q0 + 1) b + r, 0 ≤ r < b .

−(q0 + 1) si b = b Finalmente, al hacer q =  se tiene a = bq + r, 0 ≤ r < b . (q0 + 1) si b = −b 

|a| ≤ x si y sólo si −x ≤ a ≤ x. En efecto, si a ≥ 0, a = x, −a ≤ 0 ∴ −a ≤ a = x ≤ a. Si a < 0, |a| = −a = x, y por lo tanto −a ≤ x. −a > 0 ∴ a < −a... (propiedad 1) x = −a ...(2). De (2), −x = a y de (propiedad 1) a < x, y entonces −x ≤ a ≤ x. 9

161

162

Unidad 4  Polinomios y teoría de ecuaciones

Demostración Demostración de la unicidad de q y de r Suponga que: a = bq 1 + r1 a = bq 2 + r2

0 ≤ r1 < b 0 ≤ r2 < b y que r1 ≤ r2 .

Entonces, bq1 + r1 = bq 2 + r2 ∴ b( q1 − q 2 ) = r2 − r1 ≥ 0, es decir, b ( r2 − r1 ) , pero r2 − r1 < b , de donde r2 − r1 = 0,10 ∴ r2 = r1, b( q1 − q 2 ) = 0 y b ≠ 0, y consecuentemente q1 = q2.  Las propiedades 1 y 2 de las operaciones y el algoritmo de la división caracterizan a las estructuras matemáticas conocidas como anillos euclidianos. En el caso de los enteros, la función euclidiana11 es el valor absoluto. Entre los anillos euclidianos más importantes, además de  están los polinomios  [x] con coeficientes reales y función euclidiana “grado” (el polinomio cero no tiene grado y por eso en la definición de “función euclidiana” se excluye el cero del dominio de ésta), y los enteros gaussianos  [i] = {a + bi ∈ ; a, b ∈}, en donde la función euclidiana es d (a + bi ) = a 2 + b2 . En el anillo euclidiano de los enteros  existen teoremas que se demuestran usando solamente los axiomas y que, por lo tanto, valen (son teoremas) también en toda estructura en la que se cumplan los axiomas equivalentes. Tal es el caso del anillo  [x] de los polinomios y el anillo  [i] de los enteros gaussianos. Recíprocamente, todo teorema en  [i] o en  [x] (de hecho en cualquier anillo euclidiano), vale también en  (algunos teoremas importantes de la teoría de números  —aritmética— se demostraron en [i ]). Entre los teoremas que valen en  y que se utilizarán (sin requerir demostración) en los polinomios se señalan los siguientes: 1. ∀ m, n ∈ , n > 1, m se puede escribir como una suma de múltiplos de potencias de n,

m = a0 + a1n + a2 n2 +  + ak n k con 0 ≤ ai < n, i = 1, 2, , k.

El procedimiento para calcular los coeficientes ai consiste en dividir primero m entre n. Si m = q0 n + r0 0 ≤ r0 < n, se define a0 = r0 . Se divide ahora q0 entre n, q0 = q1n + r1, 0 ≤ r1 < n y se hace a1 = r1. Se prosigue dividiendo los cocientes entre n y definiendo como ai a los residuos correspondientes. El principio del buen orden12 garantiza que finalmente se llegue al residuo cero, con lo que el proceso termina. Ejemplo 4.3.1

Exprese 27 como múltiplos de las potencias de 2 (note que en este caso los coeficientes —residuos— sólo pueden ser 0 o 1).



27 13 6

1 1

a0 = 1 a1 = 1

3 1 0

0 1 1

a2 = 0 a3 = 1 a4 = 1

27 = 1 + 1 · 2 + 0 · 22 + 1 · 23 + 1 · 2 4 27 = 1 + 2 + 8 + 16

Lema: En . Sean b y c tales que b|c. Entonces c ≠ 0 ⇒ |b| ≤ |c| y por contrapuesta si |b| > |c|, c tiene que ser cero. En efecto, b|c ⇒ ∃ d ∈ ∋ bd = c y, por lo tanto, |b||d| = |c|. Si c ≠ 0 , d y b no pueden ser cero ∴ 1 ≤ |d| y 1 ≤ |b|, y de ahí, |b| ≤ |b||d| = |c|. 11 Una función euclidiana d, en un dominio entero D, es una función d : D* → N, tal que para todos los elementos a, b diferentes de cero en el dominio d(a) ≤ d(ab) y ∀ a, b ∈ D, b ≠ 0, ∃ q, r ∈ D∋ a = bq + r, r = 0 o d(r) < d (b) (vale el algoritmo de la división). 12 El principio del buen orden para  garantiza que todo conjunto no vacío de enteros positivos (en este caso los residuos) tiene primer elemento. Al dividir este entre n, el residuo es necesariamente 0. 10

4.3  Algunos resultados de la teoría de números y su aplicación

4.3  Algunos resultados de la teoría de números y su aplicación

Ejemplo 4.3.2

En  [x] exprese 2 x 4 + 3x − 7 como una suma de múltiplos de potencias de x − 1. Los coeficientes deben ser ceros o polinomios de grado menor que gr (x − 1) (que es 1), o sea, deben ser constantes. Mediante la división sintética se obtiene:

(2 = a4 ) 2

(8 = a3 )

1

2

6

(12 = a2 )

1

2

4

6

(11 = a1 )

1

2

2

2

5

(−2 = a0 )

1

2

0

0

3

−7

Entonces 2 x 4 − 3x − 7 = −2 + 11(x − 1) + 12 (x − 1)2 + 8(x − 1)3 + 2 (x − 1)4 .  La  comprobación puede hacerse utilizando el triángulo de Pascal de la siguiente manera: 1

(x − 1)0 = (x − 1) = (x − 1)2 = (x − 1)3 = (x − 1)4 =



−2 11 (x – 1) 12 (x − 1)2 8(x − 1)3 2(x − 1)4 2x4 + 3x − 7

−1

1 −2

1 −3

1

−1

3

−4

1

1 −4

6

1

−2 −11

11 −24

12 −24

8

−8

12

2

−8

24

−8

2

12

0

0

2 3

−7

Ejemplo 4.3.3

Exprese 3x 4 + 2 x 3 − 1 como múltiplos de potencias de x 2 + x + 1 . Usando la división de polinomios simplificada (escribiendo sólo los coeficientes): 1

1

1

3 3 −3

−1 2 −3 −1 1

−2 0 −3 −3 1

−1

0 0 1

−2 2

2

−1 2

3

1

1

; a0 = 3x + 1

3 1

1

1

−1 −2 −3 −3 −3 −4 −5 ; a1 = −4x − 5 3

1

1

1

0 3 3 ; a2 = 3

163

164

Unidad 4  Polinomios y teoría de ecuaciones

(

) (

)

2

Entonces 3x 4 + 2 x 3 − 1 = (3x + 1) − (4x + 5) x 2 + x + 1 + 3 x 2 + x + 1 . Comprobación 3x +

1

− 4x 3 − 9x 2 − 9x −

5

3x 4 + 6x 3 + 9x 2 + 6x +

3

3x 4 + 2 x 3 + 0 x 2 + 0x −

1

 El máximo común divisor de dos enteros, de dos polinomios, de dos enteros gaussianos o..., no ambos cero, existe y es combinación lineal de ellos. Este máximo común divisor es múltiplo de cualquier otro divisor común (en el caso de los enteros, es la menor combinación lineal de ellos).

Definición 4.3.1 Se dice que dos enteros (o polinomios, o...) son primos relativos si su máximo común divisor es la unidad, lo que se cumple si y sólo si 1 es combinación lineal de ambos.

Ejemplo 4.3.4 1. En , (8, 15) = 1;

(1 = 2(8) + (−1) 15)

2. (11, 19) = 1; (1 = 7 (11) − 4(19)) 3. En  [x],

(x + 1, x + 2) = 1;

1 = (x + 2) − (x + 1) 1 1 2 2 4. x + 1, x + 4 = 1; 1 = x2 + 4 − x2 + 1 3 3 2 2 5. x + 1, x = 1; 1 = x + 1 − x (x) 

( (

)

)

(

(

)

) (

)

Note que en  [x] las combinaciones lineales de los polinomios f (x) y g(x) son expresiones de la forma a (x) f (x) + b (x) g (x), en las que los “coeficientes” a(x) y b(x) son también polinomios.

Máximo común divisor de dos enteros (algoritmo de Euclides) Sean a, b ∈ , b ≠ 0. Entonces, si a b, (a, b) = a . En efecto, (a, b) es el mayor divisor de a y b. El mayor de los divisores de a es a , y como a b, (a, b) = a . Por otra parte, (a, b) es la combinación lineal positiva mínima de a y de b, y genera a todas las combinaciones lineales de a y de b. Por lo tanto, si las combinaciones lineales de a y b (ℒab) coinciden (son iguales) con las de c y d, entonces (a, b) = (c, d ) (vea el ejemplo 4.3.5). Sean a, b ∈ , b ≠ 0, cuyo máximo común divisor se desea encontrar. •

Divida a/b y sea a = bq + r 0 ≤ r < b . (4.3.1) Si r es cero, b a, y por lo tanto (a, b) = b , y el proceso termina. Si r ≠ 0, (a, b) = (b, r) , ya que ℒab = ℒbr. En efecto, sea x  ℒab, es decir, ∃ α, β ∈  ∋ x = αa + βb, por lo que, sustituyendo a por su valor en la ecuación (4.3.1), x = α (bq + r) + β b = (α q + β )b + α r ∈ ℒb r ; por lo tanto, ℒab⊂ ℒ. Sea ahora y ∈ ℒbr ∴ ∃ u, v ∈  ∋ y = ub + vr, y como r = a − bq, y = ub + v(a − bq) = va + (u − vq) b ∈ ℒab. Luego, ℒb r ⊂ ℒa b y ∴ ℒa b = ℒb r , de donde resulta, que (a, b) = (b, r).

4.3  Algunos resultados de la teoría de números y su aplicación



Divida ahora b entre r : b = q1r + r1 0 ≤ r1 < r y note que ahora (a, b) = (b, r) = (r, r1 ).

Prosiga dividiendo hasta obtener un residuo cero (principio del buen orden). En ese paso, el divisor es el máximo común divisor buscado. Ejemplo 4.3.5

(Si (a, b) = (c, d ), entonces ℒa ,b = ℒc , d ). Demuestre que ℒ15,21 = ℒ9,12 . 

Demostración Se calcula (15, 21)

1 15 21 6

6

 2 15 3

3

2 6 0

3 = 15 − (2 · 6) = 15 − 2 (21 − 15) = 3(15) − 2 (21)

Por lo tanto, (15, 21) = 3 De manera análoga se calcula (9, 12) = 3 : 3 = 12 − 9. Luego, ℒ15,21 debe ser igual a ℒ9,12 . En efecto, para toda a y toda b en : 15a + 21b = 9xa + 12 yb 5(12 − 9) a + 7 (12 − 9)b Al desarrollar y reagrupar se obtiene (−5a − 7b)9 + (5a + 7b)12 ∈  9,12 Análogamente, para toda y en ℒ9,12 : y = 9a + 12b = 3(3(15) − 2 (21)) a + 4(3(15) − 2 (21))b y = (9a + 12b)15 − (6a + 8b)21∈ ℒ15,21.

Ejemplo 4.3.6

Encuentre el máximo común divisor de dos números.

(11, 19) = 1 1 1 2  1  1 2 3 8 11 19 0 1 2 3 8 Note que el proceso también permite encontrar los coeficientes que se requieren para expresar (a, b) como combinación lineal de ellos. En el ejemplo, el último residuo diferente de cero, que es el máximo común divisor de 11 y 19, es 1. Entonces (vea las divisiones), 2

1= 3−2 2 = 8 − 2 (3) ∴ 1 = 3 − (8 − 2 (3)) = −8 + 3(3) 3 = 11 − 8 ∴ 1 = −8 + 3(11 − 8) = 3(11) − 4(3). Finalmente, 8 = 19 − 11 ∴ 1 = 3(11) − 4(19 − 11) = 7 (11) − 4(19).  Ejemplo 4.3.7

(15, 51) = 3

3

2 6 0

 2 15 3

 3 51 6

165

166

Unidad 4  Polinomios y teoría de ecuaciones

3 = 15 − 2 (6) 6 = 51 − 3(15) ∴ 3 = 15 − 2 (51 − 3(15)) = 7 (15) − 2 (51). 

Fracciones parciales El teorema fundamental de la aritmética (TFA) asegura que todo entero n mayor que uno se puede escribir como producto (generalizado) de números primos y que esta factorización es única, excepto por el orden y por asociados.13 Por ejemplo, 12 = 2 · 2 · 3 = 2 · 3 · 2 = 3 · 2 · 2 = 2 (−2)(−3) =  = (−3)(−2)2. El TFA aplicado a los polinomios dice que en  [x] existen polinomios primos o irreducibles (que son los de grado 1 o los de grado 2 con discriminante negativo), y que todo polinomio de grado mayor que cero se puede escribir en forma única, excepto por el orden y por asociados, como producto de primos. Aquí hay que mencionar que en  [x] cada polinomio f (x) es asociado con k f (x), k ≠ 0, ya que en este anillo las unidades son todos los polinomios de grado cero, es decir, las constantes diferentes de cero. Entre las aplicaciones de este teorema se menciona la que permite encontrar expresiones equivalentes a funciones polinomiales racionales (cocientes de polinomios) que se pueden convertir en sumas de fracciones parciales, con lo que algunas veces se simplifican los procesos que involucran f (x ) a tales cocientes. La integración de funciones racionales, de la forma , en donde f (x) y g(x) g (x ) son polinomios, es un ejemplo de esto. Se tienen los teoremas siguientes:

 Teorema  4.3.3 Sea f (x) / g (x) un cociente de polinomios en donde g(x) es el producto de h(x) por k(x) con h(x) y k(x) primos relativos, es decir, (h (x), k (x)) = 1. Entonces existen polinomios a (x), b (x) ∈  [x] tales que f (x ) a (x ) b (x ) = + g (x ) h (x ) k (x )

Demostración

(h(x), k (x)) = 1 ⇒ ∃ α (x), β (x) ∈  [x],

tales que 1 = α (x) h (x) + β (x) k (x); por lo tanto, f (x) = f (x) ∙ 1 = f (x)(α(x)h(x) + β(x)k(x)). Al dividir entre g (x), f (x ) f (x ) α ( x ) f ( x ) h (x ) β ( x ) f ( x ) k ( x ) α ( x ) f ( x ) β ( x ) f ( x ) = = + = + g (x ) h (x ) k (x ) h (x ) k (x ) h (x ) k (x ) k (x ) h (x ) Entonces,

a (x ) = β (x ) f (x ) b (x ) = α (x ) f (x ) 



 Teorema  4.3.4

Sea f (x) ∈  [x]. Entonces el cociente

f (x)

se puede escribir como una suma de fracciones a n (x) α 0 (x) α1 (x) α (x) + n −1 + ... + n −k k , n a (x) a (x) a (x) en donde cada αi (x) es cero o un polinomio de grado menor que el grado de a(x). Note que si k ≥ n, el desarrollo termina con un polinomio.

13

Las unidades de un anillo son los elementos de éste que tienen inverso multiplicativo. Se define en un anillo A “a es asociado con b” si y sólo si existe una unidad u ∈ A tal que a = bu. En  las únicas unidades son 1 y −1 y, por lo tanto, cada entero n es asociado sólo con él mismo y con su inverso aditivo.

4.3  Algunos resultados de la teoría de números y su aplicación

Demostración Al desarrollar f (x) como suma de potencias de a(x) se obtiene f (x) = α0 (x) + α1 (x) a (x) + α2 (x) a 2 (x) +  + α k (x) a k (x) y al dividir entre an(x), k f (x ) = ∑ αi (x) a i − n (x).  n a (x ) i = 0 Ejemplo 4.3.8 1. Obtenga el máximo común divisor y expréselo como una combinación lineal.

a) ((x + 1), (x + 2)) = 1 1

1 1 2 −1 −1 1

1

1 = (x + 2) − (x + 1)

(

)

b) x, x 2 + 1 = 1 1

1 1 −1

0

) c) ((x 2 + 1), (x 2 + 4)) = 1

0 0 0

1 1

(

1 = x 2 + 1 − x (x )

1

(

) (

)

(

1 1 −1

1

) (

0 4 0 −1 3

)

1 2 1 x + 4 − x2 + 1 3 3

3 = x2 + 4 − x2 + 1 ∴ 1 =

(

0

)

d) x 2 − 7 x + 12, x 2 − 6x + 5 = 1 −1

( (

) )

−1 −1

1

1 −6 −1 7 1 −1

7

1 −7 12 −1 6 −5 −1 7

5 5 7 12

12 = x 2 − 6x + 5 + (x + 1)(−x + 7) 12 = x 2 − 6x + 5 + (x + 1)  x 2 − 7 x + 12 − x 2 − 6x + 5  12 = (x + 1) x 2 − 7 x + 12 − x x 2 − 6x + 5 . Finalmente, 1 1 1 = (x + 1) x 2 − 7 x + 12 − x x 2 − 6x + 5 .  12 12

(

(

(

) ( ) (

) ( ) )

)

Ejemplo 4.3.9

Descomponga en fracciones parciales. a)

3x 4 + 2 x 3 − 1

(x2 + x + 1)

4

3x 4 + 2 x 3 − 1

(x

2

)

+ x +1

4

= =

(3x + 1) − (4x + 5)(x 2 + x + 1) + 3(x 2 + x + 1)

(x2 + x + 1)

(x

(3x + 1) 2



) (x

+ x +1

4

(4x + 5) 2

4

+

) (x

+ x +1

3

3 2

)

+ x +1

2

2

167

168

Unidad 4  Polinomios y teoría de ecuaciones 4 2 3 4 b) 2 x − 3x − 7 = −2 + 11(x − 1) + 12 (x − 1) + 8(x − 1) + 2 (x − 1) (x − 1)2 (x − 1)2

2 x 4 − 3x − 7 2 11 =− + + 12 + 8(x − 1) + 2 (x − 1)2 (x − 1)2 (x − 1)2 (x − 1) c)

x 8 + x 7 + 4x 6 + 5x 5 + 6x 4 + 8x 3 + 4x 2 + 4x + 2

(x2 + 1)

2

Se expresa el numerador como suma de potencias de x 2 + 1 :

(

)

(

)

(

)

(

)

2

(

) (

)

(

) (

)

3

x 8 + x 7 + 4x 6 + 5x 5 + 6x 4 + 8x 3 + 4x 2 + 4x + 2 = 1 + x x 2 + 1 + 2 x x 2 + 1 + x x 2 + 1 + x 2 + 1

4

Entonces, x 8 + x 7 + 4x 6 + 5x 5 + 6x 4 + 8x 3 + 4x 2 + 4x + 2

(x2 + 1)

2

= =

2

3

1 + x x2 + 1 + 2x x2 + 1 + x x2 + 1 + x2 + 1

(x

1 2

+

) (x

+1

2

x 2

(x2 + 1) )

+1

2

(

) (

)

+ 2x + x x2 + 1 + x2 + 1

4

2

4.4  Métodos numéricos Introducción La ciencia y la tecnología tratan de describir fenómenos reales mediante modelos matemáticos con el fin de que, a través de su planteamiento, resolución, análisis y discusión, sea posible disponer de un conocimiento más profundo acerca de ellos, así como de su posible evolución posterior. La matemática aplicada se funda en la búsqueda y aplicación de las herramientas más adecuadas para la solución de los problemas basados en estos modelos; sin embargo, por diversas razones, no siempre es posible aplicar los métodos analíticos clásicos en virtud de que a) no se adecuan al modelo concreto, b) su aplicación resulta extremadamente compleja, c) su solución formal es tan complicada que hace imposible cualquier interpretación posterior, d) no existen métodos analíticos capaces de proporcionar soluciones al problema. Es en estos casos que los métodos numéricos son de amplia utilidad. Un método numérico es aquel en el que, mediante una labor de cálculo (que suele ser intensa), es posible obtener soluciones aproximadas de un problema. El esfuerzo de cálculo que implica la mayoría de estas técnicas hace que su uso esté íntimamente ligado al de las computadoras. De hecho, sin el desarrollo actual en el campo de la informática resultaría difícil imaginar el nivel de utilización que poseen los métodos numéricos en ámbitos cada día más diversos. Por ejemplo, en la determinación de los perfiles de composición en una columna de destilación multicomponente, mediante un algoritmo numérico, se requiere de una cantidad significativa de cálculos para los que una “calculadora humana” debería dedicar muchas horas.

Error El concepto de error es inherente al cálculo numérico. En la solución de problemas es importante realizar un seguimiento de los errores cometidos a fin de poder estimar el grado de aproximación de la solución que se obtiene. Los errores asociados a todo cálculo numérico tienen su origen en: a) Factores debidos a la formulación del problema. Entre ellos se incluyen aquellos en los que la definición matemática del problema es sólo una aproximación a la situación física real. Estos errores son normalmente despreciables; por ejemplo, el que se comete al obviar los efectos relativistas en la solución de un problema de mecánica

4.4  Métodos numéricos

clásica. En los casos en que estos errores no sean realmente despreciables, la solución será poco precisa independientemente de la precisión empleada para encontrar las soluciones numéricas. b) Factores debidos a la obtención de los datos. Imprecisión de las constantes físicas y de los datos empíricos (en caso de errores en la medición de éstos y teniendo en cuenta su carácter generalmente aleatorio, el tratamiento analítico es especialmente complejo pero imprescindible para contrastar el resultado obtenido vía un método numérico). c) Factores que son consecuencia del método empleado para encontrar la solución del problema (error computacional). Sus fuentes principales son: i) Equivocaciones en la realización de las operaciones. Esta fuente de error es bien conocida por cualquiera que haya realizado cálculos manualmente o empleando una calculadora. El empleo de computadoras ha reducido de manera significativa la probabilidad de ocurrencia de este tipo de errores. Sin embargo, la probabilidad de que el programador cometa uno de éstos (calcular correctamente un resultado erróneo) no es despreciable. Cuando no es posible verificar que la solución calculada es razonablemente correcta, la posibilidad de que se haya cometido un error no debe ser ignorada; sin embargo, ésta no es la fuente de error más preocupante. ii) Error causado por algún tipo de aproximación. Generalmente se encuentra asociado a la sustitución de un proceso infinito por una aproximación finita (en problemas de integración y/o diferenciación). Por ejemplo, en el cálculo de una función elemental usando solamente n términos de una expansión en serie de Taylor; en la aproximación de la integral de una función por una suma finita de los valores de la función, como en el método de los trapecios; en la resolución de una ecuación diferencial reemplazando las derivadas por una aproximación (diferencias finitas); en la solución de una ecuación por el método de Newton-Raphson, proceso iterativo que, en general, converge sólo cuando el número de iteraciones tiende a infinito. En cualquiera de sus formas, este error se conoce como error por truncamiento; en estos casos es relevante estimar, o al menos acotar, este error. Cálculos aritméticos que no pueden realizarse con precisión ilimitada. Muchos números iii)  requieren infinitos decimales para ser representados correctamente; sin embargo, para operar con ellos es necesario redondearlos. Aun en el caso en que un número pueda representarse exactamente, algunas operaciones aritméticas pueden dar lugar a errores (las divisiones pueden producir números que deben ser redondeados y las multiplicaciones dar lugar a más dígitos de los que conviene utilizar); en estos casos el error se denomina error de redondeo.

Definiciones de error Ahora que se dispone de una idea concreta del origen y significado de los errores, se puede formalizar el concepto. En general, cuando no se conoce el valor de una cierta magnitud x, es posible aceptar un valor aproximado x de ella. Para estimar la magnitud del error involucrado se requiere de dos definiciones básicas: ea ( x ) = x − x  (4.4.1) Error absoluto de x: Error relativo de x:

er ( x ) =

ea ( x ) x − x = , x ≠ 0 x x

(4.4.2)

Para efectos prácticos se emplea la expresión

er ( x ) =

ea ( x ) , x≠0 x

(4.4.3)

En general, el valor de este error no se conoce, ya que no es habitual disponer del valor exacto de la magnitud, sino el de una acotación de su valor, esto es, un número ε (x) tal que

ea ( x ) ≤ ε ( x )

(4.4.4)

169

170

Unidad 4  Polinomios y teoría de ecuaciones

er ( x ) ≤ ε r ( x ) 

o bien

(4..4.5)

De acuerdo con este formalismo, es posible representar un número en la forma siguiente: x = x ± ε (x )



x = x[ 1 ± ε r ( x ) ]

Análisis más completos sobre las causas y predicciones del error se dan en los libros de análisis numérico.



(4.4.6)

Cálculo de raíces de ecuaciones El objeto del cálculo de las raíces de una ecuación es determinar los valores de x para los que se cumple: f (x ) = 0



(4.4.7)

La determinación de las raíces de una ecuación es uno de los problemas más antiguos de la matemática. Su importancia radica en que, en caso de ser posible determinar las raíces de una ecuación, también lo es la determinación de máximos y mínimos, valores propios de matrices, resolución de sistemas de ecuaciones lineales y diferenciales, etcétera. El cálculo de las soluciones de la ecuación (4.4.7) puede llegar a ser un problema muy difícil. Si f (x) es una función polinomial de grado 1 o 2, existen expresiones simples que permitirán determinar sus raíces, mientras que en la mayoría de los casos de funciones polinomiales de grado 3 o 4 es necesario emplear métodos complejos y laboriosos. Sin embargo, si la función f (x) es de grado mayor de cuatro, o bien no es una función polinomial, no existe algún procedimiento analítico conocido que permita determinar las raíces de la ecuación (excepto en casos muy particulares). La matemática ha desarrollado una serie de reglas que pueden ayudar a determinar las raíces de una ecuación; por ejemplo, el teorema de Bolzano, que establece que si una función f (x) continua asume valores de signo opuesto en los extremos de un intervalo dado [a, b], entonces la función tiene, al menos, una raíz en dicho intervalo. En el caso en que f (x) sea una función algebraica (polinomial) de grado n y coeficientes reales, es posible afirmar que tendrá n raíces (reales o complejas). La propiedad más importante que poseen las raíces racionales de una ecuación algebraica establece que si el número p q es una raíz racional de la ecuación de coeficientes enteros a0 + a1x + a2 x 2 +  +an x n = 0, (ai ∈ ) entonces el denominador q divide al coeficiente an y el numerador p divide al término independiente a0. Ejemplo 4.4.1

Para calcular las raíces racionales de la ecuación 3x 3 + 3x 2 − x − 1 = 0 primero es necesario efectuar el siguiente cambio de variable: y x= 3 para obtener Al multiplicar ahora por 32

3

y3 y2 y + 3 − −1 = 0 33 32 3 y3 + 3 y2 − 3 y − 9 = 0

4.4  Métodos numéricos

por lo que las posibles raíces de la ecuación son y = ±9, ± 3, ± 1. Al sustituir estos valores en la ecuación se obtiene que la única raíz real es y = −3 x=

es decir,

−3 = −1 3

y es, además, la única raíz racional de la ecuación.  La mayoría de los métodos numéricos utilizados para el cálculo de las raíces de una ecuación son iterativos y se basan en modelos de aproximaciones sucesivas. En estos métodos se trabaja en la forma siguiente: A partir de una primera aproximación al valor de la raíz, se calcula una mejor aproximación aplicando una determinada regla de cálculo, y así sucesivamente, hasta que se obtiene el valor de la raíz con el grado de aproximación deseado.

Método de iteración de punto fijo El método de iteración de punto fijo es un método numérico que se aplica para resolver ecuaciones que se puedan expresar en la forma x = g (x ) (4.4.8) Así, en el caso de que la ecuación cuyas raíces reales se pretende conocer tenga la forma f (x ) = 0 (4.4.9) es posible obtener una expresión equivalente en forma de la ecuación (4.4.8), o bien sumar x en ambos lados de la ecuación (4.4.9). Ejemplo 4.4.2

La ecuación polinomial

2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0

se puede transformar, factorizando x en los primeros cuatro términos y despejándola, en 5 x= 3 2 x − 3x 2 + 2 x − 5  Ejemplo 4.4.3

Al sumar x en ambos miembros de la ecuación tan x − e 3x = 0 se obtiene

x = x + tan x − e 3x 

Descripción del método El proceso de búsqueda de los valores reales de la variable x que satisfacen la ecuación, llamados raíces de la ecuación, es un proceso iterativo que inicia mediante la suposición de un valor inicial de la variable x, que se denota xi, cuyo conocimiento permite evaluar la siguiente aproximación mediante la relación xi +1 = g (xi ) Este cálculo debe repetirse, asignando el valor calculado xi +1 al valor supuesto xi hasta obtener la exactitud deseada (ε ); es decir, hasta que la diferencia en valor absoluto entre los valores supuesto y calculado xi +1 − xi sea tan pequeña como se requiera.

171

172

Unidad 4  Polinomios y teoría de ecuaciones

g (x)

x

x

g (x)

x0

x2

x3

x4

x1

Figura 4.1  Convergencia del método de iteración de

x2

x0 x1

x3

Figura 4.2  Divergencia del método de iteración de punto fijo.

punto fijo.

Visualización gráfica del método La convergencia del método de iteración de punto fijo se puede visualizar con toda claridad en la figura 4.1. La suposición inicial de la variable se identifica en la gráfica con el valor x0. Con ese valor se calcula g(x0), y se supone que x1 = g(x0); si el valor absoluto de la diferencia |x1− x0| es mayor que el prefijado para el cálculo (ε );, se calcula la siguiente aproximación por medio de la relación x2 = g(x1). Este proceso se repite hasta cumplir con la condición xn +1 − xn < ε ,, lo que representa un punto aproximado de intersección de las dos funciones x y g(x). Existen funciones para las que el método diverge, como se puede observar en la figura 4.2. En este caso, la evolución del método permite apreciar que los valores calculados de la variable, a partir de la suposición inicial x0, se alejan del punto de intersección.

Criterio de convergencia del método de iteración de punto fijo Suponga, por ejemplo, que una raíz real de una ecuación dada es xr , es decir, que el valor xr satisface la relación xi +1 = g (xi ) en la forma

xr = g (xr )

Al restar las dos últimas ecuaciones se obtiene xr − xi +1 = g (xr ) − g (xi ) Del teorema del valor medio para derivadas se sabe que si la función g(x) es continua en [a, b] y diferenciable en (a, b), entonces existe un punto c ∈ (a, b) tal que g ′(c ) =

g (b) − g (a ) b−a

Por lo anterior, existe un punto c en el intervalo determinado por xi y xr tal que g ′(c ) = de donde se obtiene o bien

g (xr ) − g (xi ) xr − xi

g (xr ) − g (xi ) = g ′(c )(xr − xi ) xr − xi +1 = g ′(c )(xr − xi )

4.4  Métodos numéricos

y considerando valor absoluto en ambos miembros xr − xi +1 = g ′(c ) (xr − xi ) . Es preciso observar que el término xr − xi +1 es precisamente el error absoluto en la (i + 1)-ésima iteración, mientras que el término xr − xi corresponde al error absoluto en la i-ésima iteración, por lo que la magnitud del error en la (i + 1)-ésima iteración disminuirá solamente si g ′(c ) < 1. En caso contrario, el valor del error irá en aumento.

Secuencia de cálculo Con el fin de calcular una raíz real de la ecuación f (x ) = 0 por medio del método de iteración de punto fijo, considere la siguiente secuencia, conocida como algoritmo: 1. Exprese la ecuación en la forma x = g (x). 2. Suponga un valor inicial de la variable xi y determine una

ε (magnitud del error mayor que cero). 3. Calcule la siguiente aproximación xi +1 con la relación xi +1 = g (xi ). 4. Con el valor de xi +1 , calcule el valor absoluto de la derivada de g (x). 4.1. Si g ′(xi +1 ) < 1, siga al paso 5. 4.2. Si g ′(xi +1 ) ≥ 1, el método no converge y debe utilizarse otro método. 5. Compare el error calculado xi +1 − xi con el error definido en el paso 2. 5.1. Si xi +1 − xi ≥ ε , entonces asigne el valor calculado xi +1 al valor supuesto xi y vuelva al

paso 3.

5.2. Si xi +1 − xi < ε, se concluye que el valor xi +1 es una buena aproximación de la raíz de



f (x) = 0.

Ejemplo 4.4.4

Use el método de iteración de punto fijo para aproximar una raíz real de la función polinomial 2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0 iniciando con x0 = 0 y hasta que xi +1 − xi < ε = 0.01. Solución La ecuación polinomial 2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0 se puede transformar en x = g (x ) =

5 2 x 3 − 3x 2 + 2 x − 5

y la derivada de esta función g(x) es

g ′(x) =

(

) 2 + 2 x − 5) 

−10 3x 2 − 3x + 1

(2 x

3

− 3x

2

Como fue discutido previamente, el método converge a la raíz real cuando el valor absoluto de la derivada de la función g(x) evaluada en una vecindad de la raíz es menor que uno.

173

174

Unidad 4  Polinomios y teoría de ecuaciones

Al aplicar la fórmula iterativa para x0 = 0 se tiene x1 = g (x0 ) =

5 2 x03

− 3x02

+ 2 x0 − 5

=

5 = −1 2 · 0 − 3 · 02 + 2 · 0 − 5 3

Entonces, x1 − x0 = − 1 − 0 = 1 > ε y como el error es mayor que 0.01 se continúa con

(

)

−10 3 · 02 − 3 · 0 + 1

g ′(x0 ) =

(2 · 0

3

2

)

−3 · 0 +2 · 0 −5

2

=

2 ε − (−1) = 12 12

y g ′ (x1 ) =

(

)

−10 3 · (−1)2 − 3 · (−1) + 1

(2 · (−1)

3

)

− 3 · (−1) + 2 · (−1) − 5 2

2

=

70 = .486 1 < 1 144

Para simplificar este procedimiento es recomendable construir una tabla que permitirá observar la evolución del método y calcular la raíz de la ecuación con la aproximación que se desea. Tabla 4.2  Resumen del cálculo I

xi

xi+1 = g(xi)

g′(xi)

| xi+1 − xi |

0

0

−1

0.4

1

1

−1

−0.4167

0.4861

0.5833

2

−0.4167

−0.7694

0.6561

0.3527

3

−0.7694

−0.5419

0.5974

0.2274

4

−0.5419

−0.6865

0.6611

0.1445

5

−0.6865

−0.5929

0.6289

0.0936

6

−0.5929

−0.6530

0.6538

0.0601

7

−0.6530

−0.6141

0.6393

0.0389

8

−0.6141

−0.6392

0.6493

0.0251

9

−0.6392

−0.6229

0.6431

0.0162

10

−0.6229

−0.6334

0.6473

0.0105

11

−0.6343

−0.6267

0.6447

0.0068

En la tabla 4.2 se observa que el error aproximado se va reduciendo lentamente. De esta manera, se requieren 12 iteraciones para reducir el error aproximado a un valor menor de 1%. El resultado final que se obtiene es x12 = −0.6267 con un error aproximado de 0.0068.

175

4.4  Métodos numéricos

Ejemplo 4.4.5

Use el método de iteración de punto fijo para aproximar la raíz de la función trascendente f (x ) = x 2 − 5 x − e x = 0 iniciando con x0 = 0 hasta que xi +1 − xi < ε = 0.01.

g′(x)

Solución Si se obtiene la x del término lineal, la ecuación equivale a x2 − e x 5 x2 − e x g (x ) = de donde 5 2x − e x En este caso, la derivada g ′(x) = 5 cuya gráfica es la de la figura 4.3, permite observar que x=

g ′(x) < 1 Para

-0.1

x ∈ [−1, 1]

-0.2

-0.3

-0.4

-0.5 -1.0

x4 = −0.1638. 

0.0

Figura 4.3  Gráfica de g ′(x) =

lo que es suficiente para inferir que el método converge a la raíz buscada. La tabla 4.3 muestra el procedimiento de búsqueda de una raíz real de la ecuación. En este ejemplo, el método solamente requiere cuatro iteraciones para reducir el error a menos de 1%, lo que corresponde con la aproximación de la solución buscada

-0.5

0.5

1.0

x

2x − e . 5

Tabla 4.3  Resumen del cálculo i

xi

xi+1 = g(xi)

| xi+1 − xi |

0 1 2 3

0 −0.2 −0.1557 −0.1663

−0.2 −0.1557 −0.1663 −0.1638

0.2 0.0443 0.0106 0.0025

Método de bisección Éste es un método numérico de búsqueda de raíces que permite aproximar las raíces reales de una ecuación. Consiste en determinar un intervalo en el dominio de la variable independiente que garantice la existencia de un punto interno en donde el valor de la ecuación sea cero. El método se basa en el teorema del valor intermedio (TVI), que establece que toda función continua f (x) en un intervalo cerrado [a, b] asume todos los valores que se hallan entre f (a) y f (b); esto es, que todo número que se encuentre entre f (a) y f (b) es imagen de, al menos, un valor en el intervalo (a, b). En caso de que la función evaluada en a y b tenga signos opuestos, f (a ) · f (b) < 0, el cero es un valor intermedio entre f (a ) y f (b), por lo que existe un punto interior p ∈ (a, b) tal que f ( p) = 0, lo que asegura la existencia de una solución de la ecuación f (x) = 0. En caso de que se asigne el punto medio del intervalo como valor de la raíz, el posible error es menor o igual que la mitad de la longitud del intervalo.

Descripción del método Sea f (x) una función continua en el intervalo [a, b] tal que f (a ) · f (b) < 0. El método consiste en lo siguiente: a+b Se calcula el punto medio del intervalo [a, b]: m = . 2 Se evalúa la función en ese punto.

176

Unidad 4  Polinomios y teoría de ecuaciones

f (b)

a

0

b

En caso de que la función evaluada en el punto medio sea igual con cero, ya se ha encontrado la raíz requerida. En caso de que no sea así, se compara el signo de este valor con los f (a ) y f (b) y se define el nuevo intervalo [a, m] o [m, b] según se haya determinado en cuál de estos intervalos ocurre el cambio de signo. Se continúa sucesivamente encerrando la solución en un intervalo cada vez más pequeño, hasta alcanzar la precisión deseada.

Visualización gráfica del método f (a) Figura 4.4  Gráfica de un intervalo en donde f (x) tiene un cero.

El procedimiento descrito se ilustra en la figura 4.4, que representa a la función f. En la figura se observa que la función tiene una raíz en el intervalo [a, b] y que f (a) < 0 y f (b) > 0. El punto m1 corresponde con el punto medio del intervalo [a, b] y el valor de la función en ese punto medio es negativo, por lo que el nuevo intervalo, en donde se encuentra la raíz, es [m1, b]. La bisección de este intervalo genera un nuevo punto m2 y el valor de la función es nuevamente negativo, por lo que el intervalo se reduce a [m2, b]. La siguiente bisección permite obtener el punto m3 y, al evaluar la función en ese punto, resulta f (m3) > 0. El intervalo de búsqueda se reduce ahora a [m2, m3]. Este procedimiento continúa hasta que el tamaño del error sea del orden de magnitud preestablecido (figura 4.5).

Secuencia de cálculo Para calcular una raíz real de la ecuación a

m1 m1

m2 m2

m3

Figura 4.5  Ilustración gráfica del método de

bisección.

b

f (x ) = 0

b

por medio del método de bisección, considere la siguiente secuencia:

b

1.  Obtenga dos números a y b en el dominio de la función tales que

f (a ) f (b) < 0.

2.  Defina la magnitud deseada para el error

ε > 0.

3.  Calcule el punto medio xm del intervalo [a, b] xm =

a+b . 2

4. Con el valor de xm, evalúe f (xm). 4.1.  Si f (xm) = 0, ha finalizado el cálculo y la raíz es xm. 4.2.  Si f (xm) ≠ 0, siga al paso 5. 5. El nuevo intervalo, que se seguirá denotando como [a, b], de longitud h = b − a, es 5.1.  a, xm , si f (a ) · f (xm ) < 0; la nueva b es xm.

[ ] 5.2.  [xm , b],

si f (a ) · f (xm ) > 0; la nueva a es xm.

6. Compare h con el error definido en el paso 2. 6.1.  Si h/2< ε , el proceso ha terminado. 6.2.  Si h /2 ≥ ε , entonces vuelva al paso 3.

Ejemplo 4.4.6

Use el método de bisección para aproximar una raíz real de la ecuación polinomial 2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0 hasta que

xi +1 − xi < ε = 0.01

4.4  Métodos numéricos

Solución Encuentre los valores a y b entre los que exista una raíz de la función polinomial y, en este caso, se aprovechará que este mismo problema se ha resuelto por el método de iteración de punto fijo, lo que permite comenzar con los valores a = −1 y b = 0. Observe que f (a ) = f (−1) = 2 (−1)4 − 3(−1)3 + 2 (−1)2 − 5(−1) − 5 = 7 > 0 f (b) = f (0) = 2 · 0 4 − 3 · 03 + 2 · 02 − 5 · 0 − 5 = −5 < 0

y

de manera que el intervalo de búsqueda de la raíz de la ecuación polinomial es

[a, b] = [−1, 0] a + b −1 + 0 = = −0.5 2 2 El valor de la función en el punto medio es xm =

y su punto medio es

f (xm ) = f (−0.5) = 2 (−0.5)4 − 3(−0.5)3 + 2 (−0.5)2 − 5(−0.5) − 5 = −1.5 < 0 Para definir el nuevo intervalo (1 es mayor que ε = 0.01) se efectúa la operación f (a ) · f (xm ) = f (−1) · f (−0.5) = 7 (−1.5) = −10.5 < 0

[a, b] = [−1, − 0.5]

Entonces,

−0.5 − (−1) = 0.5 > ε 

y así

Análogamente al caso anterior, con objeto de simplificar el procedimiento se recomienda apoyarse en una tabla en la que se podrá observar la evolución del método. Tabla 4.4  Resumen del cálculo i

a

b

f (a)

xm

|b− a|

f (xm) b = −0.5

0.5

a = −0.75

0.25

b = −0.625

0.125

0.8045

a = −0.6875

0.0625

0.3614

a = −0.65625

0.0313

0.3614

0.1495

a = −0.640625

0.0156

−0.6328125 0.1495

0.0459

1

−1

0

−0.5

7

−1.5

2

−1

−0.5

−0.75

7

3

−0.75

−0.5

−0.625

1.7734

−0.0562

4

−0.75

−0.625 −0.6875

1.7734

5

−0.6875

−0.625 −0.65625

0.8045

6

−0.65625

−0.625 −0.640625

7

−0.640625 −0.625

1.7734

0.0078

En la tabla 4.4 se observa que el error aproximado se va reduciendo por mitades, de manera que se requieren siete iteraciones para reducirlo a un valor menor de 1%. El resultado final que se obtiene es x12 = −0.6328125 con un error absoluto aproximado de 0.0078. Ejemplo 4.4.7

Use el método de bisección para aproximar la raíz de la función trascendente f (x ) = x 2 − 5 x − e x

177

178

Unidad 4  Polinomios y teoría de ecuaciones

xi +1 − xi < ε = 0.01

hasta que

f (x)

Solución En la figura 4.6 se ilustra la gráfica de la función trascendente en [−2, 2] , en la que se puede observar que existe una raíz entre –1 y 0, por lo que se define -2

x

2

a = −1 y b = 0 Comprobación f (a ) = f (−1) = (−1)2 − 5(−1) − e (−1) ≈ 5.6321 > 0

Figura 4.6  Gráfica de f (x)

y f (b) = f (0) = 02 − 5 · 0 − e 0 = −1 < 0 de manera que el intervalo de búsqueda de la raíz de la ecuación polinomial es

[−2, 2] .

[a, b] = [−1, 0]

y su punto medio es a + b −1 + 0 = = −0.5 2 2 y el valor de la función en el punto medio calculado es xm =

f (xm ) = f (−0.5) =(−0.5)2 − 5(−0.5) − e (−0.5) ≈ 2.1435 > 0 y para definir el nuevo intervalo se efectúa la operación f (a ) · f (xm ) = f (−1) · f (−0.5) ≈ (5.6321)( 2.1435 ) ≈ 12.0724 > 0

[a, b] = [−0.5, 0]

Entonces,

b − a = − 0.5 − 0 = 0.5 > ε

y así,

Con objeto de simplificar el procedimiento se construye la tabla 4.5. Tabla 4.5  Resumen del cálculo i 1

a −1

b 0

xm −0.5

|b− a|

f (a)

f (xm)

5.6321

2.1435

a = −0.5 a = −0.25

0.25

b = −0.125

0.125

2

−0.5

0

−0.25

2.1435

0.5337

3

−0.25

−0.5

−0.125

0.5337

−0.2419

4

−0.25

−0.125

−0.1875

0.5337

0.1436

5

−0.1875

−0.125

−0.15625

0.1436

−0.0497

6

−0.1875

−0.15625

−0.171875

0.1436

0.0468

7

−0.171875

−0.15625

−0.1640625

0.0468

0.0015

0.5

a = −0.1875

0.0625

b = −0.15625

0.0313

a = −0.171875

0.0156 0.0078

En este ejemplo, el método requiere también de siete iteraciones para reducir el error a menos de 1%, que corresponde con la aproximación de la solución buscada:

x7 = −0.1640625 

Método de Newton-Raphson Este método, iterativo, para la búsqueda de raíces de ecuaciones es uno de los más usados y eficientes. A diferencia del método de bisección, el de Newton-Raphson no se inicia con un intervalo dado, sino que basa su formulación en un proceso como el que se ilustra a continuación.

179

4.4  Métodos numéricos

f (x)

f (x) (xk , f (xk))

xr

xk

xr

Figura 4.7  Gráfica de la k-ésima aproximación

xk +1

xk

Figura 4.8  Gráfica de la (k + 1)-ésima aproxima-

xk.

ción xk+1.

Descripción y visualización gráfica del método Suponga que se tiene la k-ésima aproximación xk a la raíz xr de la función f, lo que se ilustra en la figura 4.7. Al trazar la recta tangente a la curva en el punto ( xk , f (xk ) ), que cruza al eje x en el punto xk+1, se obtiene una aproximación a la raíz xr (figura 4.8). Para obtener el punto xk+1 se calcula la ecuación de la recta tangente, cuya pendiente se sabe que es la derivada de la f: y − f (xk ) = f ′(xk )(x − xk ).

Haciendo y = 0 y despejando x se obtiene x = xk −

f ( xk ) . f ′(xk )

Considerando ahora que x es el valor de la siguiente aproximación a la raíz, es posible expresar xk +1 = x y se obtiene la fórmula iterativa de Newton-Raphson para aproximar la solución de la ecuación f ( xk ) xk +1 = x k − , f ′(xk ) ≠ 0. f ′(xk ) Note que el método de Newton-Raphson no trabaja con intervalos que aseguren la presencia de una raíz de la ecuación y, de hecho, no existe garantía alguna de que el método aproximará a tal raíz. Desde luego, existen ejemplos en los que este método no converge; sin embargo, en los casos donde converge a la raíz lo hace con una rapidez impresionante, por lo cual es uno de los métodos preferidos. Observe que, en el caso de que f ′(xk) = 0, el método no se puede aplicar; de hecho, esto significa geométricamente que la recta tangente es horizontal y, por lo tanto, no interseca al eje x en algún punto o está sobre él, y en este caso, la misma xk es una raíz de f (x) = 0.

Secuencia de cálculo Con el fin de calcular una raíz real de la ecuación f (x) = 0 por medio del método de NewtonRaphson, considere la siguiente secuencia: 1. Obtenga una expresión para la derivada de la función f (x). 2. Suponga un valor inicial de la variable, xk, y defina una magnitud del error

ε > 0.

180

Unidad 4  Polinomios y teoría de ecuaciones 3. Evalúe la función f (x) y su derivada f ′(x) en el punto x = xk . 4. Compare el valor de la función con el error definido en el paso 2. 4.1. Si f (xk ) < ε , la raíz aproximada es xk. 4.2. Si f (xk ) ≥ ε , continúe en el paso 5.

5. Observe el valor de la derivada. 5.1. Si f ′(xk ) = 0, el método no converge en ese punto. Intente otro valor inicial xk. 5.2. Si f ′(xk ) ≠ 0, continúe con el paso 6.

f ( xk )

6. Calcule la siguiente aproximación xk +1 con la relación xk +1 = xk − . ′ 7. Criterio de convergencia: compare el valor de xk +1 con el de xk . f (xk ) 7.1. Si xk +1 − xk ≥ ε, siga al paso 8.

7.2. Si xk +1 − xk < ε, la raíz es xk+1. 8. Asigne al valor supuesto xk el valor calculado xk+1. 9. Vuelva al paso 3.

Ejemplo 4.4.8

Use el método de Newton-Raphson para aproximar una raíz real de la ecuación polinomial 2 x 4 − 3x 3 + 2 x 2 − 5 x − 5 = 0 x0 = 0

iniciando con

xk +1 − xk < ε = 0.01.

y hasta que Solución Dada la función polinomial

f (x ) = 2 x 4 − 3 x 3 + 2 x 2 − 5 x − 5 f ′(x) = 8x 3 − 9x 2 + 4x − 5

su derivada el valor inicial de x (k = 0)

x0 = 0

y el tamaño del error

ε = 0.01. 

Como se indica en la secuencia de cálculo, se deben evaluar la función y su derivada en x0: f (x0 = 0) = 2 (0)4 − 3(0)3 + 2 (0)2 − 5(0) − 5 = −5 f ′(x0 = 0) = 8(0)3 − 9(0)2 + 4(0) − 5 = −5. Como f (0) ≥ ε y f ′(0) ≠ 0, se procede con la operación siguiente. Se obtiene el valor de x1 aplicando la fórmula iterativa de Newton-Raphson x1 = x0 − de donde

f (x0 ) −5 =0− = −1 f ′(x0 ) −5

x1 − x0 = − 1 − 0 = 1 > ε

Entonces el valor calculado de x se toma como el valor supuesto y se regresa al paso 3. f (−1) = 2 (−1)4 − 3(−1)3 + 2 (−1)2 − 5(−1) − 5 = 7 f ′(−1) = 8(−1)3 − 9(−1)2 + 4(−1) − 5 = −26. Nuevamente, como

f (0) ≥ ε y f ′(0) ≠ 0, se procede a obtener el valor de x2 x2 = −1 −

7

(−26)

= −0.7308

en donde x2 − x1 = − 0.7308 − (−1) = 0.2692 > ε . De la misma manera que se hizo en los métodos anteriores con el fin de simplificar el procedimiento, se recomienda construir una tabla en donde se podrá observar la evolución del método para obtener la raíz aproximada de la ecuación.

4.4  Métodos numéricos

Tabla 4.6  Resumen del cálculo k

f (xk)

xk

          f (x ) k xk+1 = xk − f ′(xk)

f ′(xk)

•xk+1 − xk•

0

0

−5

−5

−1

1

1

−1

7

−26

−0.7308

0.2692

2

−0.7308

1.4630

−15.8513

−0.6385

0.0923

3

−0.6385

0.1208

−13.3049

−0.6294

0.0091

En la tabla 4.6 se puede observar que el método de Newton-Raphson converge a la solución de una manera significativamente más rápida que los métodos anteriores (iteración de punto fijo y bisección). El tamaño del error aproximado se reduce al esperado en solamente cuatro iteraciones. El resultado final que se obtiene es x4 = −0.6294, con un error aproximado de 0.0091. Ejemplo 4.4.9

Use el método de Newton-Raphson para aproximar la raíz de la función trascendente f (x) = x 2 − 5 x − e x con

xk +1 − xk < ε = 0.01

Solución Dada la función f (x) = x 2 − 5 x − e x , con derivada f ′(x) = 2 x − 5 − e x. Se inicia el procedimiento con x0 = 0. Se evalúa la función y su derivada en x0: f (0) = (0)2 − 5(0) − e 0 = −1 f ′(0) = 2 (0) − 5 − e 0 = −6 Como f (0) ≥ ε y f ′(0) ≠ 0, se procede a obtener el valor de x1: x1 = 0 −

x1 − x0 = − 0.1667 − 0 = 0.1667 > ε

en donde entonces Como

−1 = −0.1667 −6

f (−0.1667) = (−0.1667)2 − 5(−0.1667) − e −0.1667 = −0.0146 f ′(−0.1667) = 2 (−0.1667) − 5 − e −0.1667 = −6.1798 f (0) ≥ ε y f ′(0) ≠ 0, se procede a obtener el valor de x2: x2 = −0.1667 −

en donde

(−0.0146) = −0.1643 (−6.1798)

x2 − x1 = −0.1667 − (−0.1643) = 0.0024 < ε

En este caso no fue preciso construir una tabla, en virtud de que desde esta segunda iteración el tamaño del error calculado es menor que el propuesto. La aproximación de raíz es x2 = −0.1643, con un error aproximado de 0.0024.

Aplicaciones Raíces cuadradas Use el método de Newton-Raphson para aproximar raíces cuadradas de números reales positivos.

181

182

Unidad 4  Polinomios y teoría de ecuaciones

Solución Sea a > 0. Se requiere calcular un valor x tal que x = a . Entonces, elevando al cuadrado la expresión anterior, x 2 = a, o bien x 2 − a = 0. Se define la función f (x) = x 2 − a con f ′(x) = 2 x. Al sustituir esta información en la fórmula de Newton-Raphson se obtiene xk +1 = xk − y simplificando

xk2 − a 2 xk

1 a  xk +1 =  xk + . 2 xk 

Por ejemplo, para estimar aproximadamente la raíz de 5 (a = 5), proponga, como valor inicial de x, x0 = 2 y aplique la fórmula obtenida 1 5 x1 =  2 +  = 2.25, 2 2 Tabla 4.7  Resumen del cálculo Aproximación a la raíz

Error aproximado

2 2.25

0.25

2.236111111

0.013888888

2.236067978

0.000043133

2.236067977

5.003 × 10−10

lo que arroja un error de tamaño 0.25 > ε. Los resultados que se consiguen aplicando sucesivamente la fórmula obtenida se resumen en la tabla 4.7. De aquí es posible concluir que 5 ≈ 2.236067977. Este resultado es correcto en todos sus dígitos, comparado con el que se obtiene en una calculadora comercial. Esta misma idea puede aplicarse para crear algoritmos que aproximen raíces n-ésimas de números reales positivos.

La ecuación de estado de Van der Waals La ecuación de estado de Van der Waals para un gas es p=

RT a − 2 v−b v

en donde p es la presión, v el volumen molar, T la temperatura, R la constante universal de los gases, y a y b las denominadas constantes de Van der Waals, cuyo valor se obtiene a partir de la temperatura (Tc ) y la presión ( pc ) críticas (para más detalle, revise la última sección de esta unidad) en la siguiente forma: a=

9R 2Tc2 8 pc

y b=

RTc . 3 pc

Ésta es una ecuación que permite predecir, con un menor grado de incertidumbre con respecto a la ecuación del gas ideal, el comportamiento presión-volumen-temperatura (pvT) de los gases y líquidos. Ésta es una ecuación polinomial de grado 3 para el volumen molar, como se puede observar mediante el siguiente desarrollo. Dada la ecuación de Van der Waals p=

RT a − 2 v−b v

multiplicando por (v − b)v 2

p(v − b)v 2 = RT v 2 − a (v − b)

o bien

pv 3 − pbv 2 = RT v 2 − av + ab

y al reordenar

pv 3 − ( pb + RT )v 2 + av − ab = 0

4.4  Métodos numéricos

y finalmente dividiendo entre p, se tiene una ecuación polinomial mónica de grado 3 en el volumen molar. Ejemplo 4.4.10

Considerando el siguiente valor de la constante universal de los gases, l · atm R = 0.08205 mol g · °K calcule, usando el método de iteración de punto fijo, el volumen molar del metanol a temperatura de 97 °C (370 K) y presión de 1 atmósfera, hasta que el error sea menor que 1 × 10−6. Compare la eficiencia de este método realizando el mismo cálculo por el método de NewtonRaphson. Solución El metanol tiene las siguientes propiedades críticas:* Tc = 512.6 K pc = 79.9 atm por lo que los valores de sus constantes de Van der Waals serán

y

1 (0.08205)(512.6) l = 0.175465 . 3 79.9 mol g De esta manera, la ecuación polinomial en el volumen molar para el metanol será b=

v 3 − 30.533965v 2 + 24.906925v − 4.370294 = 0. Para usar el método de iteración de punto fijo se obtiene la siguiente ecuación: 4.370294 vi +1 = 2 = g (vi ) vi − 30.533965vi + 24.906925 y su derivada

g ′(vi ) =

(

−4.370294(2 vi − 30.533965)

vi2

)

− 30.533965vi + 24.906925

2

.

Por otra parte, para asignar un valor inicial del volumen molar en fase vapor es posible recurrir al resultado obtenido vía la ecuación del gas ideal: v0 =

RT (0.08205)(370) l = 30.3585 . = p mol g 1

Con toda la información recabada, ahora se puede construir la tabla sugerida durante el desarrollo del método de iteración de punto fijo para encontrar la raíz de la ecuación polinomial (tabla 4.8). Después de 14 iteraciones, el método de iteración de punto fijo converge a la raíz v14 = 0.253736. Es importante observar que esta estimación no depende del valor supuesto inicialmente; se puede probar también con cero y el resultado que se obtiene con este método es el mismo: v = 0.253736

l . mol g

El valor obtenido, comparado con el volumen molar del metanol calculado a través de la ecuación del gas ideal, es muy pequeño. Esto sugiere que el metanol, bajo las condiciones de temperatura y presión establecidas en el problema, solamente se puede encontrar en fase líquida. * Reid, R.C., Prausnitz, J.M. y Sherwood, T.K., The properties of gases and liquids, 3a. ed., McGraw-Hill Book.

183

184

Unidad 4  Polinomios y teoría de ecuaciones Tabla 4.8  Resumen del cálculo i

vi

vi+1 = g(vi)

g′(vi)

•vi+1 − vi•

0

30.358500

0.223201

–0.34406

30.135299

1

0.223201

0.240899

0.399531

0.017699

2

0.240899

0.248181

0.423546

0.007281

3

0.248181

0.251302

0.434058

0.003122

4

0.251302

0.252665

0.438685

0.001362

5

0.252665

0.253264

0.440728

0.000599

6

0.253264

0.253528

0.441630

0.000264

7

0.253528

0.253645

0.442029

0.000117

8

0.253645

0.253696

0.442206

0.000052

9

0.253696

0.253719

0.442284

0.000023

10

0.253719

0.253729

0.442318

0.000010

11

0.253729

0.253734

0.442334

0.000005

12

0.253734

0.253736

0.442341

0.000002

13

0.253736

0.253736

0.442343

< 1 × 10–6

Para resolver el problema a través del método de Newton-Raphson se requiere de la función polinomial f (v ) = v 3 − 30.533965v 2 + 24.906925v − 4.370294 f ′(v ) = 3v 2 − 61.067930 v + 24.906925

su derivada

y la fórmula de Newton-Raphson

vk +1 = vk −

f (vk ) . f ′(vk )

Posteriormente se procede a calcular la raíz de la ecuación, con el auxilio de la tabla sugerida en el desarrollo del método y suponiendo un valor inicial del volumen molar del metanol de cero (tabla 4.9). Tabla 4.9  Resumen del cálculo k

vk

f (vk)

f ′(vk)

vk+1

•vk+1 − vk•

−4.370294

24.906925

0.175465

0.175465

0

0

1

0.175465

0.934677

14.284004

0.240900

0.065435

2

0.240900

−0.128205

10.369746

0.253264

0.012363

3

0.253264

0.0044555

9.633068

0.253736

0.000473

4

0.253736

−6.7 × 10−6

9.604912

0.253737

0.

Figura 4.9  Raíces del factor de compresibilidad.

Entonces,

Tabla 4.11  Resumen del cálculo f (a)

f (zm)

1

0

0.1

0.05

−0.011862

−0.000511

2

0.05

0.1

0.075

−0.000511

3

0.05

0.075

0.0625

4

0.05

0.0625

5

0.05

6

i

A

b

zm

|b− a| a = 0.05

0.05

0.003444

b = 0.075

0.025

−0.000511

0.001601

b = 0.0625

0.0125

0.05625

−0.000511

0.000579

b = 0.05625

0.00625

0.05625

0.053125

−0.000511

0.000043

b = 0.053125

0.003125

0.05

0.053125

0.0515625

−0.000511

−0.000232

a = 0.0515625

0.0015625

7

0.0515625

0.053125

0.05234375

−0.000232

−0.000094

a = 0.05234375

0.00078125

8

0.05234375

0.053125

0.05273438

−0.000094

−0.000025

a = 0.05273438

0.00039062

9

0.05273438

0.053125

0.05292969

−0.000025

0.000009

b = 0.05292969

0.00019531

10

0.05273438

0.05292969

0.05283204

−0.000025

−0.000008

a = 0.05283204

0.0000977

11

0.05283204

0.05292969

0.05288087

−0.000008

< 1 × 10−6

0.0000488

4.4  Métodos numéricos 4.4  Métodos numéricos

En la iteración 11 de la tabla 4.11 se puede observar que para zm = 0.05288087, la función polinomial cumple con el criterio de error establecido f (zm ) < 1 × 10 −6 , por lo que se puede suponer que el factor de compresibilidad en fase líquida del ciclohexilbenceno es z L = 0.05288087. En la tabla 4.12 se ilustra el proceso de cálculo del factor de compresibilidad en fase vapor, que se encuentra en el intervalo [0.6, 0.7]. Tabla 4.12  Resumen del cálculo i

A

b

zm

|b− a|

f (zm)

f (a)

1

0.6

0.7

0.65

−0.005293

0.001986

b = 0.65

0.05

2

0.6

0.65

0.625

−0.005293

−0.002173

a = 0.625

0.025

3

0.625

0.65

0. 6375

−0.002173

−0.000229

a = 0.6375

0.0125

4

0.6375

0.65

0.64375

−0.000229

0.000844

b = 0.64375

0.00625

5

0.6375

0.64375

0.640625

−0.000229

0.000299

b = 0.640625

0.003125

6

0.6375

0.640625

0.6390625

−0.000229

0.000033

b = 0.6390625

0.0015625

7

0.6375

0.6390625

0.63828125

−0.000229

−0.000099

a = 0.63828125

0.00078125

8

0.63828125

0.6390625

0.63867188

−0.000099

−0.000033

a = 0.63867188

0.00039062

−0.000033

10−6

9

0.63867188

0.6390625

0.63886719

5 000) no se dispone de relaciones matemáticas sencillas que permitan obtener la variación de f con el número de Reynolds; sin embargo, el Instituto de Hidráulica de Estados Unidos y la mayoría de los ingenieros consideran la ecuación de Colebrook  ∈ 1 2.51  = −2 log10  +  f  3.7 D Re f  f =

como la expresión más aceptable para calcular el factor f en ese régimen.

187

188

Unidad 4  Polinomios y teoría de ecuaciones

En el tratamiento de esta ecuación es posible considerar que cuando las tuberías son hidráulicamente lisas, el valor de la proporción cociente de la rugosidad relativa al diámetro de la tubería ∈ D es muy pequeño, por lo que se puede despreciar el primer término de los que están entre corchetes. Esta misma consideración se aplica en el cálculo del factor de fricción para fluidos no newtonianos. De manera análoga, cuando el número de Reynolds es muy elevado, el segundo término entre corchetes es despreciable; en tales casos la viscosidad prácticamente no influye y el factor de fricción depende sólo de la rugosidad relativa de la tubería. Este hecho se refleja en los diagramas de fricción en los que las curvas toman forma horizontal para valores elevados del número de Reynolds. Ejemplo 4.4.12

Usando la ecuación de Colebrook, calcule el factor de fricción en una tubería de fierro galvanizado a partir de la siguiente información: Rugosidad relativa: ∈ = 0.00015 m Diámetro de tubería: D = 0.0508 m (tubería de fierro galvanizado) Número de Reynolds: Re = 2 200 507. hasta que el error ε sea menor que 1 × 10−6.

F(f )

Solución La ecuación de Colebrook se puede escribir en la forma siguiente:  ∈ 1 2.51 + 2 log10  + 3 7 . D f Re f 

f 0.01

0.02

0.03

0.04

0.05

o bien, Figura 4.10  Gráfica de la función F (f ).



F( f ) =

 =0 

 ∈ 1 2.51  + 2 log10  +  . f  3.7 D Re f 

Esta expresión es difícil de tratar algebraicamente (derivar, despejar f ), por lo que, con el fin de resolverla sin mayores complicaciones, se propone usar el método de bisección. Para esto es necesario definir un intervalo del factor de fricción [a, b] tal que F(a) · F(b) < 0 a través de una gráfica de la función F(f ) (figura 4.10). Como se puede observar en la gráfica, la raíz de la función está en el intervalo [0.02, 0.03], en donde F (0.02) = y

F (0.02) =

  0.00015 1 2.51 + 2 log10  +  = 0.883854 > 0 0.02 3.7 (0.0508) 2 200 507 0.02    0.00015 1 2.51 + 2 log10  +  = −0.415307 < 0. 0.03 3.7 (0.0508) 2 200507 0.03 

Entonces, para efectos de simplificar la presentación de resultados y siguiendo la secuencia de cálculo del método de bisección, se elabora la tabla 4.13. En la iteración 11 de la tabla 4.13 se puede observar que para fm = 0.02611267 la diferencia en los límites del intervalo cumple con el criterio de error establecido

b − a < 1 × 10 −6 , por lo que se puede considerar que el factor de fricción correspondiente a los datos del ejemplo es f = 0.02611267.

189

4.4  Métodos numéricos

Tabla 4.13  Resumen del cálculo i

bm

a

fm

F(a)

F(fm)

|b− a|

1

0.02

0.03

0.025

0.883853

0.136424

a = 0.025

0.005000

2

0.025

0.03

0.0275

0.136424

−0.158267

b = 0.0275

0.002500

3

0.025

0.0275

0.02625

0.136424

−0.016185

b = 0.02625

0.001250

4

0.025

0.02625

0.025625

0.136424

0.058723

a = 0.025625

0.000625

5

0.025625

0.02625

0.0259375

0.058723

0.020930

a = 0.0259375

0.000313

6

0.0259375

0.02625

0.02609375

0.020930

0.002289

a = 0.02609375

0.000156

7

0.02609375

0.02625

0.02617188

0.002289

−0.006969

b = 0.02617188

0.000078

8

0.02609375

0.02617188

0.02613282

0.002289

−0.002345

b = 0.02613282

0.000039

9

0.02609375

0.02613282

0.02611328

0.002289

−0.000029

b = 0.02611328

0.000019

10

0.02609375

0.02611328

0.02610352

0.002289

0.001129

a = 0.02610352

0.000010

11

0.02610352

0.02611328

0.0261084

0.001130

0.000550

a = 0.0261084

0.000005

12

0.0261084

0.02611328

0.02611084

0.000550

0.000260

a = 0.02611084

0.000002

13

0.02611084

0.02611328

0.02611206

0.000260

0.000116

a = 0.02611206

0.000001

11

0.02611206

0.02611328

0.02611267

0.000116

0.000043

< 1×10–6

Vaporizador flash Cuando se alimentan F mol / h una corriente con n componentes de gas natural al vaporizador flash (separación en una sola etapa) que se muestra en la figura 4.11, las corrientes de vapor y líquido resultantes se retiran del vaporizador con flujos molares V y L, respectivamente, mientras que las fracciones molares de los componentes en las corrientes de alimentación, vapor y líquido se denominan zj ; yj y xj, para valores de j = 1, 2, …, n. Si la mezcla en el destilador flash se considera en equilibrio líquido-vapor durante una operación en estado estacionario, entonces el sistema se puede caracterizar bajo los siguientes balances de materia: Balance total: F = L + V Balance individual (para el j-ésimo componente): F z j = Lx j + V y j yj Relación de equilibrio líquido-vapor: Kj = xj Aquí, Kj es la constante de equilibrio del j-ésimo componente a las condiciones de temperatura y presión que prevalecen en el tanque. Con estas ecuaciones y a partir del hecho que la suma de las fracciones molares de cualquier mezcla con n componentes debe ser siempre la unidad, es decir, n

n

n

j =1

j =1

j =1

∑ zj = ∑ yj = ∑ xj = 1

se puede construir una función

f = f (V )

que permita resolver el problema de cálculo de la separación flash. Del balance de materia total se obtiene la siguiente expresión para L: L = F −V Al sustituir en el balance individual F z j = (F − V ) x j + V y j

V

Vapor Alimentación F

Líquido

L Figura 4.11  Esquema del vapori-

zador flash.

190

Unidad 4  Polinomios y teoría de ecuaciones

y emplear la relación de equilibrio en la forma yj = K j xj F z j = F x j −V x j +V K j x j F zj xj = V (K j − 1) + F

se obtiene en donde

n

n

∑ zj = ∑ xj

Ahora, partiendo del hecho que

j =1 n

j =1

F zj

n

∑ zj − ∑

se puede escribir

j =1V

j =1 n



al ordenar

=0

V (K j − 1) z j + F z j − F z j V ( K j − 1) + F

j =1 n



o bien,

(K j − 1) + F

V (K j − 1) z j

j =1V

(K j − 1) + F

=0

=0

Finalmente, se obtiene la función que habrá de resolverse: n

f (V ) = ∑

V (K j − 1) z j

j =1V

(K j − 1) + F

.

Ejemplo 4.4.13

La tabla 4.14 muestra un conjunto de datos de prueba relativos al “flasheo” de una corriente de gas natural a 160 libras/pulgada2 absolutas (psia) y 120°F.* Tabla 4.14  Datos de prueba f

Componente

zj

Kj

1

CO2

0.0046

1.650

2

CH4

0.8345

3.090

3

C2H6

0.0381

0.720

4

C3H8

0.0163

0.390

5

i-C4H10

0.0050

0.210

6

n-C4H10

0.0074

0.175

7

C5H12

0.0287

0.093

8

Hexanos

0.0220

0.065

9

Heptanos

0.0434

0.036

 Ejemplo 4.4.14

Suponga que se alimentan 1 000 mol/h de mezcla a un destilador flash. A partir de los valores de F, zj, Kj, y usando el método de Newton-Raphson, encuentre la raíz de la función f (V). Además, calcule los valores correspondientes de L, así como los de las xj y las yj usando las ecuaciones de balance de materia y la relación de equilibrio. Solución Para calcular la raíz de la función (con n = 9) 9

f (V ) = ∑

V (K j − 1) z j

j =1V

(K j − 1) + F

* Carnahan B., Luther H.A. y Wilkes J.O. Applied Numerical Methods, Krieger Publishing Company; Malabar, Florida, 1990.

4.4  Métodos numéricos

a través del método de Newton-Raphson se requiere, además de su derivada, F (K j − 1) z j

9

f ′(V ) = ∑

j =1

la fórmula de Newton-Raphson V j +1 = V j −

(V (K j − 1) + F )

f (V j )

f ′(V j )

2

.

La solución de este problema puede ser más complicada que la de los ejemplos anteriores, en virtud de que tanto la función como su derivada son sumas de nueve términos, es decir, f (V ) = y

f ′(V ) =

V (K1 − 1) z1 V (K2 − 1) z2 V (K9 − 1) z9 + ++ V (K1 − 1) + F V (K2 − 1) + F V (K9 − 1) + F

F (K1 − 1) z1

(V (K1 − 1) + F )

2

+

F (K2 − 1) z2

(V (K2 − 1) + F )

2

++

F (K9 − 1) z9

(V (K9 − 1) + F )2

lo que involucra una cantidad mucho mayor de iteraciones. Sin embargo, es posible proceder a calcular la raíz de la función con el auxilio de la tabla 14.15 y suponiendo un valor inicial del flujo de vapor (V) equivalente a 84% del flujo alimentado, lo que corresponde de manera aproximada con la cantidad de metano (CH4) que está presente inicialmente en la mezcla V0 = 0.84 F = 0.84(1000) = 840 mol/h Esta aproximación inicial se propone considerando que la corriente de vapor acarrea (en el mejor de los casos) solamente al compuesto más ligero de todos los presentes en la mezcla alimentada y, de acuerdo con los datos proporcionados, la constante de equilibrio (que es, de alguna manera, una medida de la volatilidad relativa) del metano ( KCH4 = 3.09 ), es la mayor en todos los compuestos presentes, puesto que duplica aproximadamente a la volatilidad relativa más cercana, la del dióxido de carbono: KCO2 = 1.65 Tabla 4.15  Resumen del cálculo j

Vf

f (Vi)

f ′(Vi)

Vj+1

|Vj+1 − Vj|

0

840

0.120571

−0.001991

900.544689

60.544689

1

900.544689 −0.050965

−0.004003

887.813935

12.730754

2

887.813935 −0.004032

−0.003394

886.626142

1.187793

3

886.626142 −0.000029

−0.003345

886.611726

0.008877

4

−1.6 × 10−9

−0.003344

886.617265

5 × 10−7

886.611726

Como se puede observar, el método de Newton-Raphson converge a una aproximación de la solución con un error significativamente pequeño en solamente cinco iteraciones, arrojando un resultado de V5 = 886.617265 mol h De acuerdo con el balance total, el flujo de líquido que abandona el destilador será L = F −V = 1 000 − 886.617265 = 113.382735 mol h . Las fracciones molares de la corriente líquida se obtienen mediante la expresión de balance individual

y las correspondientes a la fase vapor yj = Kj xj . Los resultados de las fracciones molares para cada compuesto se muestran en la tabla 4.16.

191

192

Unidad 4  Polinomios y teoría de ecuaciones Tabla 4.16  Fracciones molares obtenidas para cada

compuesto en cada fase Compuesto

K

z

x

Y

CO2

1.650

0.0046

0.0029

0.0048

CH4

3.090

0.8345

0.2925

0.9038

C2H6

0.720

0.0381

0.0507

0.0365

C3H8

0.390

0.0163

0.0355

0.0138

i-C4H10

0.210

0.0050

0.0167

0.0035

n-C4H10

0.175

0.0074

0.0276

0.0048

C5H12

0.093

0.0287

0.1466

0.0136

Hexanos

0.065

0.0220

0.1286

0.0084

Heptanos

0.036

0.0434

0.2987

0.0108



Adimensionalización de las ecuaciones de balance El problema de destilación flash multicomponente anterior se puede resolver, de manera análoga, mediante una adimensionalización de las ecuaciones de balance, lo que permitirá acotar la solución al intervalo [0, 1], es decir, dado el problema ilustrado en la figura 4.11, en donde se considera que el destilador flash opera en estado estacionario y que la mezcla está en equilibrio líquidovapor, el sistema se puede caracterizar por las mismas ecuaciones de balance y equilibrio del problema anterior: yj F = L + V    F z j = Lx j + V y j    K j = V xj Ahora se propone la siguiente modificación en las ecuaciones balance de materia: F L +V L V L V = ⇒ 1= + ⇒ = 1− F F F F F F

Vapor

en donde L y V representan las fracciones de líquido y vapor, respectivamente, F F generadas en el destilador con respecto a la cantidad total alimentada. Por otra parte,

Alimentación F

Líquido

L Figura 4.11  Esquema del vapori-

zador flash (repetido).

F L V V V z j = x j + y j ⇒ z j = 1 −  x j + K j x j F F F F  F y haciendo Θ = V (la fracción del flujo alimentado que sale en la corriente del desF tilado), la ecuación que habrá que resolver será n



Θ(K j − 1) z j

j =1 Θ

(K j − 1) + 1

= 0.

Solución Nuevamente, para calcular la raíz de la función 9

f (Θ) = ∑

Θ(K j − 1) z j

j =1 Θ

(K j − 1) + 1

mediante el método de Newton-Raphson se requiere la derivada:

(K j − 1) z j 2 j =1 Θ K − 1 + 1 ( ( j ) ) 9

f ′(Θ) = ∑

4.4  Métodos numéricos

y la fórmula de Newton-Raphson Θ j +1 = Θ j −

f (Θ j )

f ′(Θ j )

.

Como se discutió en el problema anterior, se requieren bastantes operaciones por iteración, pero es posible proceder a calcular la raíz de la función con el apoyo de la tabla 4.17 y suponiendo un valor inicial de la fracción de flujo de vapor (Θ) equivalente a 0.84, que corresponde aproximadamente con la fracción de CH4 presente en la alimentación: Θ0 = 0.84 Tabla 4.17  Resumen del cálculo f ′(Θj)

Θj+1

•Θj+1 − Θj•

0.120571

−1.991436

0.900545

0.060545

−0.050965

−4.003294

0.887814

0.012731

−3.394312

0.886626

0.001188

−3.344498

0.886617

0.000009

−3.344498

0.886617

5 × 10–10

j

Θj

0

0.840000

1

0.900545

2

0.887814

−0.004032

3

0.886626

−0.000030

4

0.886617

−1.6  ×  10–9

f (Θj)

En este caso, el método converge a una raíz en cinco iteraciones con un error del orden 10−10: Θ5 = 0.886617 lo que significa que el flujo de vapor será V = Θ · F = (0.886617)(1000) = 886.617 mol h y, de acuerdo con el balance total, el flujo de líquido que abandona el destilador será L = F − V = 1 000 − 886.617 = 113.383 mol h Las fracciones molares correspondientes a las corrientes líquida y vapor se muestran en la tabla 4.18. Tabla 4.18  Fracciones molares obtenidas para cada

compuesto en cada fase Compuesto CO2

K 1.650

z 0.0046

X 0.0029

y 0.0048

CH4

3.090

0.8345

0.2925

0.9038

C2H6

0.720

0.0381

0.0507

0.0365

C3H8

0.390

0.0163

0.0355

0.0138

i-C4H10

0.210

0.0050

0.0167

0.0035

n-C4H10

0.175

0.0074

0.0276

0.0048

C5H12

0.093

0.0287

0.1466

0.0136

Hexanos Heptanos

0.065 0.036

0.0220 0.0434

0.1286 0.2987

0.0084 0.0108

Estimación de las constantes de la ecuación de estado de Van der Waals La ecuación de estado de Van der Waals fue diseñada, en principio, para poder representar las desviaciones del comportamiento de los gases reales con respecto al ideal; sin embargo, debido a su forma característica se puede observar que es capaz de predecir también el comportamiento de la fase líquida de manera cualitativa. Así, por ejemplo, el comportamiento pvT del bifenilo (C12H10), cuyas propiedades críticas son Tc = 789.00 K, pc = 38.00 atm

193

194

Unidad 4  Polinomios y teoría de ecuaciones

calculado a través de la ecuación de estado de Van der Waals p=

RT a − 2 v−b v

con valores de las constantes R = 0.08205

l · atm l2 · atm l , a = 124.074 , b = 0.56787 , 2 mol g · K mol g mol g

se puede representar a través del diagrama p-v ilustrado en la figura 4.13, cuyas trayectorias son isotermas (líneas a temperatura constante). Como se puede observar en la figura 4.13, la forma característica de la ecuación de estado de Van der Waals refleja un comportamiento muy particular de las trayectorias isotermas. Las líneas calculadas para temperaturas menores a la temperatura crítica (650, 700 y 750 K) presentan un máximo y un míniT = 900 K mo (que no se observa en T = 650 K debido a la escala de la T = 850 K gráfica). En la línea calculada a la temperatura crítica (Tc = 789 K) se puede observar un punto de inflexión, en donde la gráfiT = 789 K ca tiene pendiente cero y las trayectorias calculadas a temperaturas mayores que la crítica (850 y 900 K) no presentan estos T = 750 K puntos extremos. Entonces, los valores de las constantes de la ecuación de estado de Van der Waals se pueden determinar a partir del T = 700 K cumplimiento de las condiciones, donde

p (atm) 30 25 20 15 10 5

T = 650 K

0 0

1

2

3

4

5

∂ p    ∂v 

6

v (l / mol)

∂ p    ∂v T ∂ p  2   ∂v  T



∂  RT RTc 2a a =− + 3 =0 − 2  2 ∂ v  v − b v  ( p ,v ,T ) (vc − b) vc c c c

(4.4.10)

∂  RT 2a  2 RTc 6a + 3  = − 4 =0  − 3 2 ∂ vc  (v − b) v  vc v − b) ( pc ,vc ,Tc ) ( c

(4.4.11)

= ( pc ,vc ,Tc )

2

= ( pc ,vc ,Tc )

=0 pc

que se conoce como punto crítico. Sean Tc , vc y pc la temperatura, volumen y presión en el punto crítico. Entonces,

Figura 4.13  Gráfica de las isotermas para el bifenilo.



Pc

 ∂2 p  =  2   ∂v 

La solución del sistema de ecuaciones simultáneas (4.4.10 y 4.4.11) permite encontrar expresiones para las constantes de la ecuación de estado de Van der Waals en función de las propiedades críticas Tc y pc . De la ecuación (4.4.10) se obtiene

RTc vc3 · 2 (vc − b)2 Al sustituir la ecuación (4.4.12) en la ecuación (4.4.11) resulta a=

2 RTc

(vc − b)3 o bien,

Al reordenar

=

(4.4.12)

6 vc3 RTc · · 4 vc 2 (vc − b)2

2 3 = vc − b vc 1 b = vc  3

(4.4.13)

4.4  Métodos numéricos

bajo la consideración de gas ideal vc = se tiene

RTc pc b=

1 RTc ·  3 pc

(4.4.14)

Para encontrar una expresión de la constante a, se sustituye la ecuación (4.4.13) en la ecuación (4.4.12): RTc v3 vc3 9RTc 9 a= c · = · = RTc vc 2 8 2  2 4vc2 1   vc − vc  3   Al usar nuevamente la ecuación del gas ideal para vc se obtiene: a=



9 R 2 Tc2 · 8 pc

(4.4.15)

Las ecuaciones (4.4.14) y (4.4.15) son las expresiones correspondientes a la estimación de los valores de las constantes de la ecuación de estado de Van der Waals, en función de las propiedades temperatura y presión críticas. Ejercicios 4.2

Funciones polinomiales 1. Use la división sintética y el teorema del residuo en los siguientes ejercicios:

a) Si f(x) = 2x4 − 6x3 + x2 − 3x + 4, encuentre f(1),  f(2),  f(−3) b) Si f(x) = x3 − 13x2 + 8x + 27, encuentre f(−1), f(1), f(2) c) Si f(x) = 2x3− x + 4, encuentre f(−5),  f(4),  f(3) d) Si f(x) = x4 − 2x3 + x2 − 2x + 1, encuentre f(−3),  f(3),  f(−2),  f(1),  f(1),  f(−1) e) Si f(x) = x4 − 3x2 − x + 2, encuentre  f( 1),  f(−1),  f(2)  f(−2),  f(3),  f(−3) y  f(4) 2. Demuestre que (x − a) es un factor de f(x) a) Si a = 3 y f(x) = x4 − 8x3 + 23x2 − 28x + 12 b) Si a = − 2 y f(x) = 6x3 − 30x2 − 7x +10 3 c) Si a = −2 y f(x) = 2x5 + x4 − 12x3 + x2 + 20x −12 d) Si a = − i y f(x) = x4 + 4x3 + 5x2 + 4x + 4 e) Si a = 5 y f(x) = x5 − 2x4 − 10x3 + 16 x2 + 25x − 30 f) Si a = − 21 y f(x) = 4x7 + 8x6 − 15x5 −23x4 + 21x3 + 15x2 − 8x − 4 g) Si a = − 3 y f(x) = x5 + 15x3 − 10x2 − 60x − 72 3. Encuentre todos los ceros del polinomio (las raíces de f(x) = 0), haga una lista de ellas y escriba el polinomio como un producto de factores lineales. a) f(x) = x4 − 8x3 + 23x2 − 28x + 12 b) f(x) = 6x3 − 30x2 − 7x + 10 c) f(x) = 2x5 + x4 − 12x3 + x2 + 20x − 12 d) f(x) = x4 + 4x3 + 5x2 + 4x + 4 e) f(x) = x5 − 2x4 − 10x3 + 16x2 + 25x − 30 f) f(x) = 4x7+ 8x6 − 15x5 − 23x4 + 23x3 + 15x2 − 8x − 4 g) f(x) = 6x8 − 29x7 + 5x6 + 105x5 − 11x4 − 136x3 − 60x2 h) f(x) = x10 − x9 − 17x8 + 27x7 + 81x6 − 183x5 − 43x4 + 289x3 − 94x2 − 132x + 72 i) f(x) = 72x6 + 138x5 + 41x4 − 44x3 − 18x2 + 2x + 1 4 . Si sabe que r es cero (o raíz de f(x) = 0), encuentre el resto de los ceros (o raíces), haga una lista y escriba el polinomio como un producto de factores lineales. a) Si r = 3 − 2i y f(x) = 2x5 − 17x4 + 42x3 + 27x2 − 230x + 104 b) Si r = 2 + 3 y f(x) = x7 − 9x6 + 35x5 − 83x4 + 119x3 − 95x2 + 37x −5

195

196

Unidad 4  Polinomios y teoría de ecuaciones

c) Si r = −2 − i y f(x) = 2x5 + 13x4 + 21x3 − 29x2 − 117x − 90 d) Si r = − 1 + i es raíz doble de f(x) = x10 + 5x9 + 8x8 − 2x7 − 23x6 − 23x5 + 10x4 + 32x3 + 12x2 − 12x − 8 = 0 e) Si r = 1 + 7 y f(x) = 6x6 − 23x5 − 38x4 + 153x3 + 56x2 − 214x + 60 f) Si r = 3 + 5 y f(x) = 2x6 − 19x5 + 51x4 − 27x3 − 41x2 + 46x −12 g) Si r = − 5 + 2 y f(x) = x4 + 8x3 + 13x2 + 54x + 230 5. a) x4 + 7x3 + 12x2 + 13x − 3 = 0 b) x4 + 2x3 − x2 + 2x − 2 = 0 c) x4 + 4x3 + 3x2 + 2x − 1 = 0 d) x4 + 2x3 − 8x2 − 6x − 1 = 0 e) x4 − 7x2 + 2x + 2 = 0 f ) x4 + 6x3 + 8x2 + 8x − 16 = 0 6. a) x3 + 6x2 + 6x − 10 = 0 b) x3 + 3x2 + 9x + 9 = 0 c) x3 + 3x2 + 15x + 1 = 0 d ) x3 + 9x + 6 = 0 e) x3 + 6x2 − 3x − 8 = 0 f ) x3 + 3x2 + 9x + 9 = 0

197



5.2  Anillos, dominios enteros y campos 5.3 Homomorfismos 5.4  Espacios vectoriales •  Dependencia e independencia lineal. Bases y dimensión •  Dimensión 5.5  Producto escalar, norma y métrica en n •  Norma •  Distancia •  Ángulos y ortogonalidad •  Conjuntos y bases ortogonales •  Proyecciones •  Aplicaciones 5.6  Producto vectorial •  Definición •  Analogía con la solución como determinante •  Interpretación geométrica de la norma del producto vectorial •  Algunas propiedades del producto vectorial 5.7  Triple producto escalar •  Definiciones •  Interpretación geométrica 5.8  Rectas y planos •  Las rectas en n •  Una ecuación de la recta que pasa por dos puntos •  Ángulo entre rectas •  Planos en 3 •  Una ecuación del plano que pasa por tres puntos no colineales •  Ecuación normal del plano •  Ángulo entre planos •  Ángulo entre recta y plano 5.9  Transformaciones lineales

lineal

Unidad

5.1  Grupos abelianos (o conmutativos)

Álgebra

5

198

Unidad 5  Álgebra lineal

5.1  Grupos abelianos (o conmutativos) Definición 5.1.1 Definición de operación binaria Sea X un conjunto. Una operación (binaria) en X, f: X × X → X es una función que a cada pareja de elementos de X le asocia un elemento de X. Así, por ejemplo, la suma de números reales es una operación en , lo mismo la multiplicación o la resta. Se acostumbra denotar a las operaciones con diferentes símbolos entre los que destacan, por la frecuencia con que se usan +, ·, *, entre otros, y también se acostumbra representar a la imagen de una pareja (a, b) bajo una operación, como a * b, en vez de la notación usual para funciones. Así, por ejemplo, * ((a, b)) se denota por a * b (o simplemente ab) y +((a, b)) es a + b.

Definición 5.1.2 Definición de grupo abeliano Se dice que un conjunto G con una operación * es un grupo abeliano si la operación en G satisface las cuatro siguientes propiedades: i) ∀ a, b, c ∈ G, (a * b) * c = a * (b * c) ii) ∀a, b ∈ G, a * b = b * a iii) ∃ e ∈ G∋, a * e = e * a = a iv) ∀ a ∈ G, ∃ b ∈ G ∋, a * b = b * a = e

(propiedad asociativa) (propiedad conmutativa) (existencia del neutro) (existencia de inversos)

Cuando no se supone la propiedad conmutativa, se dice simplemente que {G, *} es un grupo. Si {G, *} es un grupo abeliano, la operación suele llamarse “suma” y se denota “+”; a su neutro se le llama cero, que, por supuesto, se representa con su símbolo usual. Cuando la operación se supone conocida, la pareja {G, *) se nombra simplemente como “el grupo G (abeliano, cuando es el caso)”. Se puede probar (ejercicios) que en todo grupo abeliano G son válidas, entre muchas otras, las propiedades siguientes: Para todos los elementos de G: 1. El idéntico es único; es decir, si 0 y 0′ son idénticos de G, entonces 0 = 0′. 2. Para cada a ∈G existe un único inverso (que se denota como “−a”, cuando la operación de G

es la suma). La suma de a con el inverso de b, a + (−b) se simplifica como a − b. Se puede usar la inducción para definir sumas generalizadas de la siguiente manera: 1

∑ ai = a1,   

i =1

n +1

n  ∑ ai =  ∑ ai  + an +1,   además, ∑ ai = 0 i∈∅ i =1  i =1 

y entonces se puede demostrar también que el resultado de una de estas sumas generalizadas es independiente de la forma en que se asocien los sumandos y del orden en que se consideren. Esta última observación es la que se expresa cuando se dice que “el cambio en el orden de los sumandos no altera la suma de ellos”. Es decir, n

∑ ai = a1 + ... + an

i =1

3. a + b = a + c ⇒ b = c (“Es válido cancelar”). 4. La ecuación a + x = b tiene solución única x = b − a.

Los siguientes son ejemplos de grupos: 1. { , +}; {n , +}; {n+}; {p, +}; {(p)*, ·}

5.2  Anillos, dominios enteros y campos

2. {, +}; {*, ·}; {, +}; {*, ·}; {, +}; {*, ·}; {K [X], +}; {K (X), +}; {(K (X))*, ·}

3.

4. 5. 6.

(En general, si K es un campo, {K,+} y {K *, ·} son grupos abelianos.) Se está usando el símbolo * para denotar los conjuntos sin su idéntico. (N* = N − {0} = {1, 2, 3, …}). Sean S un conjunto no vacío y A(S) = { f: S →S; f biyectiva}. Entonces, A(S), es grupo con la composición. Si •S• = n, A(S) se acostumbra denotar como Sn y se llama el grupo simétrico de orden n, cuya cardinalidad es n! Sean S un conjunto no vacío y {G, +} un grupo. Si F = { f · S → G) y se define: (  f + g)(x) = f (x) + g(x), entonces {F, +} es grupo. {Mn × n (K), +}. {A ∈Mn × n (K); det A ≠ 0, ·} = GL(n), ·.

5.2  Anillos, dominios enteros y campos Definición 5.2.1 Definición de anillo Un anillo es una terna {A, +, ·},en donde A es un conjunto, + y · son operaciones binarias en A, que se conocen como suma y producto, tales que {A, +} es un grupo abeliano. El producto “ · ” es una operación que se distribuye por ambos lados sobre la suma “+”; es decir, que para todos: a, b, c ∈ A a · (b + c ) = a · b + a · c ; (a + b) · c = a · c + b · c Cuando · es una operación asociativa, el anillo se llama anillo asociativo. Cuando · es una operación conmutativa, el anillo se denomina anillo conmutativo. Cuando · es una operación con idéntico, el anillo se conoce como anillo con uno.

Definición 5.2.2 Definición de dominio entero Un anillo conmutativo es un dominio entero si y sólo si se cumple cualquiera de las propiedades siguientes (que son equivalentes): a) En el producto (o multiplicación) se pueden cancelar factores diferentes de cero; es decir, a · b = a · c y a ≠ 0 ⇒ b = c. b) Cero no tiene divisores propios; es decir, a · b = 0 ⇒ a = 0 ∨ b = 0. Si la multiplicación tiene idéntico, el anillo se llama dominio entero con uno. La teoría de grupos surgió del estudio de las permutaciones y la teoría de anillos, de la aritmética del conjunto Z de los números enteros. Estas teorías y la de campos están en la base de lo que se conoce como álgebra abstracta (o moderna).

Definición 5.2.3 Definición de campo Un conjunto K con dos operaciones binarias “suma” y “producto” (“+” y “·”) es un campo si {K, +} y {K*, ·} son grupos abelianos para los que además es válida la “ley distributiva”; es decir, ∀a, b, c ∈ K, (a + b) c = ac + bc. Se exige además que el idéntico de {K, +} (idéntico aditivo o “cero”) sea diferente al de {K*, ·} (“cero” distinto de “uno”).

199

200

Unidad 5  Álgebra lineal

n

El producto generalizado ∏ ai se define inductivamente como en el caso de la suma: i =1

n +1

n  ∏ ai =  ∏ ai  an +1 ,   además, ∏ ai = 1 i =1 i =1 i ∈∅  i =1  y se recuerda que en este caso la propiedad conmutativa (generalizada) se expresa diciendo que para la multiplicación: “El cambio en el orden de los factores no altera el producto de ellos”. Entonces, 1

∏ ai = a1,   



n

∏ ai = a1 · a2 ·  · an

i =1

Se apunta aquí que al ser {K*, ·}un grupo abeliano, son válidas en él las propiedades correspondientes. Agregamos las tres propiedades siguientes (que relacionan las dos operaciones de K): 1. ∀a ∈ K,   a · 0 = 0. 2. a(−b) = −ab;   (−a)(−b) = ab (es válida la “regla de los signos”)

n   i =1 

n

3.  ∑ ai  b = ∑ ai b

(es válida la ley distributiva generalizada)

i =1

y resumimos los resultados anteriores diciendo que “las reglas algebraicas que se estudian en secundaria están bien”. Son ejemplos de campos (con las operaciones usuales): 1. , , 

( p ) , p en P ( p1 , p2 ,..., ( p ) = {a + b ( p1 , p2 , ...,

2. 

)

pn , pi números primos, i = 1, …, n, en donde p; a, b ∈ Z} y

) {

pn +1 = a + b pn +1 ; a, b ∈ 

(

p1 ,

p2 , ...,

pn

)}

3. {z ∈; z es cero de algún polinomio no cero, con coeficientes enteros}, que se conoce como el

campo de los números algebraicos.1 4. Z2, Z3, Z5, ..., Zp, p primo positivo.

5.3 Homomorfismos Definición 5.3.1 Definición de homomorfismos Sean { A, +, ·} y { B, ⊕, } dos estructuras en donde +, · son operaciones binarias en A y ⊕,  operaciones binarias en B. Una función f : A → B es un homomorfismo si y sólo si para todos a, b ∈ A : f (a + b) = f (a ) ⊕ f (b) f ( a · b ) = f (a )  f (b) Si ℜ ⊂ A ×  × A y ℑ ⊂ B ×  × B son relaciones n-arias en A y en B, se dice que un homomorfismo f preserva la relación si y sólo si para todos a1, , an ∈ A, (a1, , an ) ∈ ℜ ⇔ ( f (a1 ), , f (an )) ∈ ℑ. La relación binaria más común es la de orden, y en ese caso se dice que el homomorfismo f preserva el orden si y sólo si para todos a, b ∈ A, a ≤ b ⇔ f (a ) ≤ f (b) . Si un homomorfismo f es inyectivo, se llama monomorfismo o inmersión. Si un homomorfismo f es suprayectivo, se llama epimorfismo. Si un homomorfismo f es biyectivo, se llama isomorfismo.

Si E es una extensión de campo de F, un número a ∈ E es algebraico sobre F si es raíz de un polinomio no cero con coeficientes en F. Se dice que un número es algebraico si es un número complejo algebraico sobre los racionales.

1

5.4  Espacios vectoriales

5.4  Espacios vectoriales Definición 5.4.1 Definición de espacios vectoriales Sea {V, ⊕ } un grupo abeliano y {K, +, ·} un campo. V es un espacio vectorial sobre K si existe una operación binaria:  : K × V → V tal que si  ((k, x )) se denota como k x, entonces cumple con: ∀α, β ∈ K, ∀ x, y ∈V, i) α( x ⊕ y ) = α x ⊕ α y ii) (α + β) x = α x ⊕ β x iii) (α β) x = α (β x ) iv) 1 x = x Los elementos de V se llaman vectores y los de K escalares. Se usó el signo ⊕ para distinguirlo de la suma en K, pero en lo sucesivo se usará + para ambas sumas. Cuando K es el campo R de los números reales, se dice que V es un espacio vectorial real, y si K es el de los complejos, V es un espacio vectorial complejo. Cuando se deba mencionar explícitamente el campo K usaremos la notación V / K, y cuando no sea ese el caso, simplemente V. Ejemplo 5.4.1

Si G = {0} con 0 + 0 = 0 y ∀a ∈ K, a · 0 = 0, G es un espacio vectorial sobre cualquier campo K y se llama “el espacio vectorial cero” o “trivial”. Ejemplo 5.4.2

Todo campo K es un espacio vectorial sobre cualquiera de sus subcampos, y en este caso la suma y el producto son las operaciones de K (C es un espacio vectorial complejo, real, racional, ..., según sea el subcampo que se considere como el campo de los escalares). Ejemplo 5.4.3

Sea K un campo, Kn = K × K × ... × K (n factores). Entonces ∀ n ∈ Z+, Kn resulta un espacio vectorial sobre K si se define para –a = (..., a , ...) y –b = (..., b , ...) i i –a = –b ⇔ a = b , i = 1, 2, ..., n i i –a + –b = (..., a + b , ...) i i y si α ∈ K, α –a = (…, α a , …). i

Se puede demostrar que todo espacio vectorial de dimensión finita n (vea la definición más adelante) sobre un campo K es isomorfo a Kn (indistinguible desde el punto de vista de sus propiedades algebraicas), y esa observación justifica que se diga que, “de alguna manera”, los Kn son los espacios vectoriales más importantes entre los de dimensión finita. Ejemplo 5.4.4

Si G = Mm × n (K), G es un espacio vectorial sobre K cuando se define la suma de matrices y la multiplicación por escalares de manera conveniente. Explícitamente, si A = (aij), B = (bij) en G, entonces A = B ⇔ aij = bij para todas i y j A + B = (aij + bij) α ∈K, αA = (αaij).

201

202

Unidad 5  Álgebra lineal

Ejemplo 5.4.5

Si G = K [x], el “anillo de los polinomios en una indeterminada x con coeficientes en un campo K (los polinomios “comunes”), G es un espacio vectorial sobre el campo K, con la suma y la multiplicación por un escalar definidas en la forma usual. Ejemplo 5.4.6

Sea W un espacio vectorial sobre un campo K y S un conjunto no vacío. Se define G = { f  : S → W} el conjunto de las funciones de S en W. Se le da estructura de grupo al definir para f, g ∈ G, ( f + g): S → W como la función que asocia a cada x ∈S, el resultado de sumar (en W) f (x) con g(x), es decir,  (  f + g)(x) = f (x) + g(x), y se define para α ∈K, αf (x) = α(f (x)). Entonces G resulta un espacio vectorial sobre K, que en cierto sentido es el ejemplo más importante de espacios vectoriales (todos los ejemplos anteriores son casos particulares de éste).

Definición 5.4.2 Definición de subespacio Sea V un espacio vectorial sobre un campo K. W ⊂ V es un subespacio de V (notación:   W ≤ V) si y sólo si ∀ α ∈ K, ∀ x, y ∈ W i) 0 ∈ W ii) x + y ∈ W iii) α x ∈ W “W es cerrado bajo sumas y productos escalares y no vacío”. La definición de subespacio suele darse diciendo que un subconjunto W de V es un subespacio de V si W es un espacio vectorial (sobre el mismo campo K) con las “operaciones inducidas en W por las de V”. Se demuestra después que W ⊂ V es un subespacio de V si y sólo si W satisface las anteriores condiciones i), ii) y iii), de manera que ambas definiciones son equivalentes. Se opta por la primera, que tiene la ventaja de evitar la discusión sobre “operaciones inducidas” y que además es la que se usa con más frecuencia para comprobar que un subconjunto de V es un subespacio de V. La condición i), puede cambiarse por: j) W ≠ ∅, que no es la misma que i). Obviamente, i) → ij, pero no al revés; sin embargo, al tomarse junto con ii) y iii) forman conjuntos de proposiciones equivalentes (es decir, de  {i), ii), iii)} se puede demostrar { j), ii), iii)}. Y de { j), ii), iii)} se puede demostrar {i), ii), iii)}).

Definición 5.4.3 Definición de combinación lineal Sea V un espacio vectorial sobre K y β = { xi }i ∈I un subconjunto de vectores de V. x ∈ V es una combinación lineal de β si existen coeficientes α1, α2 , ∈ K tales que, x = ∑ αi xi i ∈I

x es una suma formal en donde todos los coeficientes son iguales a cero, excepto un número finito de ellos (lo que se expresa diciendo que “casi todos los coeficientes son cero”).

 Teorema  5.4.1 Si β = { xi }i ∈I es un subconjunto no vacío de V, (I ≠ ∅), la colección de todas las combinaciones lineales de β es un subespacio de V, que se llama el subespacio de V generado por β, y se denota como [ β ], o bien como Gen β.

[ β ] = { x ∈ V; x es combinación lineal de β}.

5.4  Espacios vectoriales

Demostración i) ∀ i ∈ I, x–i es una combinación lineal de β y, por lo tanto, [β] no es vacío. (Por definición, la combinación lineal vacía es el cero.) ii) La suma de combinaciones lineales de β, así como el producto de cualquiera de ellas por un escalar, son combinaciones lineales.

Es decir, x, y ∈ [β] ⇒ x + y ∈ [β], y además α ∈ K, x ∈ [β] ⇒ α x ∈[β].

Es fácil convencerse de que [β] es la intersección de todos los subespacios de V que contienen a β, y en este sentido se asegura que, con respecto a la contención, [β] es el menor subespacio de V que contiene a β. Esto motivó las definiciones de combinación lineal vacía (sin sumandos) como – – 0 y del espacio generado por el conjunto vacío como{0}.

Dependencia e independencia lineal. Bases y dimensión Definición 5.4.4 Definición de base Una base β es un subconjunto de vectores de V que tiene la propiedad de que cada x ∈ V se puede expresar en forma única como combinación lineal de β. n

n

i =1

i =1

Por “forma única” debe entenderse que si x = ∑ αi xi = ∑ δi xi , entonces αi = δi , ∀i ∈I, aunque, por supuesto, los sumandos pueden aparecer en cualquier orden, y en ese caso quizá sería mejor decir que los coeficientes de cada elemento básico “son los que deben ser únicos”. El que cada x ∈ V sea combinación lineal de β equivale a decir que “β genera a V” o que “β es un conjunto generador de V”. El hecho de que cada combinación lineal de β tenga una expresión única es lo que se conoce como independencia lineal. En realidad, la definición más conocida de “independencia lineal” es la que afirma que β ⊂ V es linealmente independiente si y sólo si cada vez que una combinación lineal de β sea cero, todos los coeficientes tienen que ser necesariamente cero. Las siguientes definiciones son equivalentes a las dos anteriores: • •

β es linealmente independiente si y sólo si ninguno de sus vectores es combinación lineal de los otros. β es linealmente independiente si y sólo si no es linealmente dependiente (en este caso debe precisarse lo que se entiende por “linealmente dependiente”). En resumen, un conjunto β ⊂ V es una base de V si y sólo si

1. es linealmente independiente, y 2. genera a V.

Entre los ejemplos de bases más conocidos se citan los siguientes: Ejemplo 5.4.7 Si eˆi = (0, ..., 0, 1, 0, ..., 0); i = 1, ..., n; { eˆ1, eˆ2 , ..., eˆn } es la base canónica de Rn.

Ejemplo 5.4.8 {l, x, x2, ...} es la base canónica de  [x].

203

204

Unidad 5  Álgebra lineal

Ejemplo 5.4.9  1 0   0 1   0 0   0 0   0 0  ,  0 0  ,  1 0  ,  0 1  es la base canónica del espacio M2 × 2 (R), cuyos elementos son las         matrices cuadradas de 2 × 2 con coeficientes reales.  “Canónico” es un término impreciso que se utiliza para designar a la forma más “natural” o que “proporciona más información a simple vista”, y que en general es “la más usada”. Así, por ejemplo, se habla de las ecuaciones canónicas de las cónicas: ( x − h )2 + ( y − k )2 = r 2 y − k = 4p(x – h)2

Para la circunferencia Para las parábolas verticales

( x − h )2 ( y − k )2 + = r1 a2 b2

Para las elipses “bien orientadas”

±

( x − h )2 ( y − k )2  = r1 a2 b2

Para las hipérbolas “bien orientadas”

Y también se llama “canónico” el orden usual de los números naturales. El hecho de que cada vector x– de un espacio vectorial de dimensión finita n se pueda expresar en forma única como combinación lineal de una base β permite asociar a cada vector de V un vector de n formado con los coeficientes de los elementos de la base. Así, por ejemplo, si x = (5, 2, 3) y β es la base {i , j , k} , entonces x = 5i + 2 j + 3k , y, por lo tanto, su vector de coordenadas es (5, 2, 3). Pero si la base β fuera {(1, 0, 0)(1, 1, 0)(1, 1, 1)} , su vector de coordenadas sería  (3, −1, 3), ya que 3(1, 0, 0) − 1(1, 1, 0) + 3(1, 1, 1) = (5, 2, 3). La función f :V → n que asocia a cada vector su vector de coordenadas, resulta un isomorfismo entre V y n que depende de la base β, de modo que, como ya se dijo, se comprueba que todo espacio vectorial real es esencialmente un n. Se aceptan los siguientes resultados, cuyas demostraciones se pueden encontrar en los libros de álgebra lineal, a los que en estas notas se denominan como dogmas (D), para aclarar que no se incluye su demostración. D 1  Todo espacio vectorial tiene al menos una base. Aquí es necesario aceptar que: • •

∅ es linealmente independiente. La combinación lineal vacía (una suma formal con cero sumandos) es el vector cero y que, por lo tanto, la base de { 0 }es el conjunto vacío.

D 2  Si un conjunto finito β ⊂ V es una base de V, entonces cualquier otra base de V tiene el mismo número de elementos que β.

Dimensión De los dogmas anteriores se sigue que para todo espacio vectorial V, o bien todas sus bases son infinitas, o todas son finitas de la misma cardinalidad. En el primer caso, se dice que “V es  de dimensión infinita”. En el segundo caso hay un número bien definido, el número de elementos de cada una de sus bases, que se conoce como la dimensión de V (dim V). En el ejemplo 5.4.7, dim Rn = n. En el ejemplo 5.4.8, dim R [x] = ∞. En el ejemplo 5.4.9, dim M2 × 2 (R) = 4. En general, dim Mm × n (R) = mn. En otras palabras, si un espacio vectorial V tiene una base finita (con un conjunto finito de vectores), se dice que es de dimensión finita, y si ese no es el caso, es decir, si todas las bases de V tienen una infinidad de vectores (son infinitas), entonces V es de dimensión infinita. En los ejemplos anteriores, Rn y M2 × 2 (R) son de dimensión finita, mientras que R [x] no lo es. D 3  Si γ ⊂ V es un conjunto linealmente independiente, existe β, una base de V, tal que  γ ⊂ β. (Es decir, todo conjunto de vectores linealmente independiente puede completarse a una base.) D 4  Si β genera V, existe un subconjunto γ ⊂ β, que es linealmente independiente y que genera a V (todo conjunto generador de V contiene una base de V).

5.5  Producto escalar, norma y métrica en Rn

Si β = { x 1}, i = 1, ..., n es una base de V, β se puede ordenar con el orden inducido por el orden nn de sus subíndices, β = { x 1..., x n}, y en ese caso a cada vector x = ∑∑ααii xxxii i∈∈ V se le puede asociar i =i =11 el vector (al, ..., an) ∈ Kn, que se llama el vector de coordenadas de x, que obviamente depende de la base β. Así, por ejemplo, si β = { x1, x2 , x3 } es una base de R3 y u = 3 x1 + 2 x2 − 5x3 , el vector de coordenadas de u con respecto a β es (3, 2, −5). La función η: V → Kn, que asocia a cada vector x ∈V su vector de coordenadas con respecto a una base fija β, resulta un isomorfismo de espacios vectoriales (función biyectiva de uno en otro, tal que ∀ α ∈ K, ∀ x , y ∈ V, η( x, y ) = η( x ) + η( y ) y η(α x ) = α η( x ). Este isomorfismo justifica la siguiente afirmación: si la dim V/K es n, entonces V es isomorfo a Kn.

5.5  Producto escalar, norma y métrica en Rn Definición 5.5.1 Definición de producto punto Sea V = Rn el espacio vectorial real de las n-adas. Se define el producto punto de los vectores x = (x1, ... , xn) y y = (y1, ..., yn) como sigue: n x . y = x y + ... + x y = ∑ xi yi ∈ . 1

1

n

n

i =1

Y de esta definición se deriva el siguiente teorema:

 Teorema 5.5.1 ∀ α ∈ K, ∀ x, y , z ∈ Rn, a) b) c) d)

x x x x

· y = y · x ·(y + z )= x · y + x · z · (α y ) = α( x · y ) · x ≥ 0; x · x = 0 ⇔ x = 0

(el producto punto conmuta) (abre sumas) (saca escalares) (está definido en forma positiva)

Las demostraciones (ejercicios) son directas de la definición. Las propiedades b) y c) confieren al producto punto su calidad de “lineal en el segundo factor” (vea transformaciones lineales más adelante), y combinadas con la propiedad conmutativa a) permiten ver que el citado producto también es lineal en el primer factor, lo que se expresa diciendo que el producto punto es “bilineal”. Una función V × V → K con las propiedades a), b) y c) es un producto interior que, cuando tiene adicionalmente la propiedad d), se dice que está “definido en forma positiva”.

Norma

n

n

El hecho de que ∀ x ∈  , x · x = ∑ x12 sea mayor o igual que cero permite definir la norma (euclii =1

diana) de cada vector como sigue:

Definición 5.2.2 Sea x ∈ n. La norma x de x es x = (x · x ) . Está bien definida, ya que todo número real no negativo tiene una raíz cuadrada no negativa. Se dice que la norma es euclidiana porque cuando se usa para construir la geometría en 2 lo que resulta es un modelo de la geometría de Euclides.2 Note que, en particular, si x = (x1, x2 ), 2

La geometría de Euclides es la que se construye a partir de los axiomas de Euclides (aumentados con los que propuso Hilbert), en contraste con las (mal llamadas) geometrías no euclidianas, que niegan el quinto postulado.

205

206

Unidad 5  Álgebra lineal

entonces x = x12 + x22 , es decir, la norma o “tamaño” va de acuerdo con el teorema de Pitágoras. Existen otras normas que no necesariamente se derivan de un producto interior, así como también hay otras geometrías que tienen distintas aplicaciones,3 pero que aquí no se consideran. Algunas propiedades de la norma euclidiana se establecen en el siguiente teorema:

 Teorema 5.5.2 ∀ α ∈ , ∀ x, y ∈ n, a) x ≥ 0; x = 0 ⇔ x = 0 b) αx = α x y, por lo tanto, *) x · y ≤ x y c) x + y ≤ x + y

−x

= x

Se llama norma a toda función real con las propiedades a), b) y c). A un espacio en el que está definida una función de ese tipo se le llama espacio normado. La propiedad *, conocida como la desigualdad Cauchy-Schwarz-Bounyakowski (C-S-B), que es importante, no es necesaria para esta definición.

Demostración La propiedad a) es obvia debido a la definición. En efecto, la raíz cuadrada de todo número no negativo es no negativa y sólo es cero cuando el radicando es cero (la suma de cuadrados es no negativa). Luego, n

∑ xi2 ≥ 0 y

i =1

n

∑ xi2 = 0 ⇔ x1 = ... = xn = 0.

i =1

La propiedad b) se demuestra de la siguiente manera:

αx = ( αx ) · ( αx ) = α 2 ( x · x ) = α x · x = α x .  Recuerde que la raíz cuadrada real de un producto es el producto de sus raíces cuadradas y que la raíz cuadrada del cuadrado de un número real es su valor absoluto. Una demostración de la desigualdad C-S-B es la siguiente: Sean x , y ∈  n . Se define z = x y − y x ∈ n. 0≤ z

2

= ( x y − y x) · ( x y − y x)

(y · y) − x 2 2 = 2 x y −2 x = x

2

y ( y · x ) − y x (x · y ) + y

2

y (x · y ) 

(5.5.1)

Si x = 0 o y = 0, evidentemente x · y ≤ x y , (0 ≤ 0). Suponiendo que ese no es el caso, resulta x y > 0 y, por lo tanto, en la ecuación 5.5.1 se puede cancelar el factor x y , con lo que se obtiene:

0 ≤ x y − x · y , o sea, x · y ≤ x y . 

(5.5.2)

Al repetir el argumento con z = x y + y x se llega a la desigualdad

0 ≤ x y + x · y y ∴ − (x · y ) ≤ x y 

De las ecuaciones (5.5.2) y (5.5.3) 3

(5.5.3)

− x y ≤ (x · y ) ≤ x y .

Einstein dijo que la teoría general de la relatividad no se hubiera podido construir sin la geometría de Minkowski (una geometría no euclidiana).

5.5  Producto escalar, norma y métrica en Rn

de donde,

x·y ≤ x y

Recuerde ∀ a , b ∈ , b ≤ a ⇔ − a ≤ b ≤ a. Con el resultado anterior se demuestra la propiedad c) (conocida como la desigualdad del triángulo, debido a su relación con la interpretación geométrica): x+y



2

= (x + y ) · (x + y ) = x · x + 2 (x · y ) + y · y = x



2

+ 2 (x · y ) + y

2

≤ x

2

+2 x y + y

2

=(x + y

)2

x+y ≤ x + y

de donde

Distancia Definición 5.5.3 La existencia de una norma, , en un espacio V permite definir una función distancia d :  (V × V → ), de la siguiente manera: sean x, y ∈V; entonces, d ( x , y ) = x – y . De la definición anterior se deriva el siguiente teorema, cuya demostración es directa y se deja como ejercicio, y sólo se desarrolla la del inciso c) a manera de ejemplo.

 Teorema  5.5.3 ∀ x , y , z ∈V a) d ( x , y ) ≥ 0; d ( x , y ) = 0 ⇔ x = y b) d ( x , y ) = d ( y , x ) c) d ( x , y ) ≤ d ( x , z ) + d ( z , y )

Demostración de c) d ( x , y ) = x − y = x − z + z − y = (x − z ) + ( z − y ) ≤ x − z + z − y = d ( x , z ) + d ( z , y ) Toda función m: V × V →  con las propiedades anteriores es una métrica, y en ese caso el espacio V se llama espacio métrico. También se apunta que existen métricas, que tampoco se consideran en el texto, que no necesariamente se derivan de una norma y simplemente se agrega como nota cultural, que con cualquier métrica se puede construir una topología y que, por supuesto, también existen topologías (familias de abiertos con ciertas propiedades) que no proceden de métrica alguna. 

Ángulos y ortogonalidad La desigualdad C-S-B, x · y ≤ x

y , asegura que si x ≠ 0 y yy ≠ 0, entonces −1 ≤

x·y ≤1 x y

– y –y como aquel por lo que se puede definir el ángulo formado por los vectores, diferentes de cero, x cuyo coseno es x ·y x y restringido a estar en el intervalo [0, π] (definición que se justifica observando la ley de los cosenos – y –y son ortogonales para el plano que se demuestra en el siguiente párrafo). Entonces se dirá que x – – – si y sólo si x · y = 0, lo que se denota como x ⊥ y (en esta definición ya se incluye al vector 0, que, n por lo tanto, resulta ortogonal a todo vector x ∈  , incluido él mismo).

207

208

Unidad 5  Álgebra lineal

Demostración Ley de los cosenos: c2 = b2 + a2 – 2ab cos θ Sean ABC un triángulo de lados con medidas a, b y c. h perpendicular de A al lado BC M el pie de la perpendicular h θ la medida del ángulo en C x la longitud del segmento CM (por lo tanto, la medida del segmento MB resulta ser a − x). En el triángulo rectángulo ACM, h2 = b2 − x 2 . En el triángulo rectángulo AMB,

A b

c

θ C

M

Al igualar las ecuaciones anteriores y cancelar x2 se obtiene: b2 = c 2 − a 2 + 2 ax, es decir, c 2 = b2 + a 2 − 2 ax, y como x = b cos θ resulta:

B

a-x

x

2

h2 = c 2 − (a − x) = c 2 − x 2 − a 2 + 2 ax.



h

a

c 2 = b2 + a 2 − 2 ab cos θ  que es la ley de los cosenos.

Figura 5.1  Construcción para la ley de

los cosenos.

(5.5.4)

 Considere ahora el segmento dirigido CA como el vector b , de tamaño b, el segmento CB como el vector a , de tamaño a, de donde resulta que el segmento AB es el vector a − b de tamaño c. Entonces,

c 2 = (a − b ) · (a − b ) = a

2

+ b

2

− 2 a · b = a 2 + b2 − 2 a · b

(5.5.5)

De (5.5.4) y (5.5.5) ab cos θ = a · b , o también a b de donde resulta cos θ =

a

b

a ·b . a y

El argumento anterior justifica la definición de ángulo entre vectores en n. – y –y —diferentes de –0— es el ángulo cuyo coseno es El ángulo formado por los vectores x x·y . x y Ejemplo 5.5.1

– = (1, 1, 0) y –y = (1, 1, 1) entonces En 3, si x  (1, 1, 0 ) · (1, 1, 1) θ ( x , y ) = cos −1   (1, 1, 0 ) (1, 1, 1) 

 2  −1  −1  6   = cos    = arc cos   2 3  3  

por lo que θ es, aproximadamente, 35.26° (en radianes, 0.6154). De la definición de ángulo entre vectores, también resulta que x es paralelo a y si y sólo si x·y x y

= ± 1,

lo que sucede cuando uno de ellos es múltiplo del otro y sólo en ese caso. Es decir,

Definición 5.5.4 x y ⇔ ∃α ∈  ∋ αx = y o α y = x .

5.5  Producto escalar, norma y métrica en Rn

Así, por ejemplo, (3, 2, 0, −5) y (6, 4, 0, −10) son paralelos debido a que el segundo es el doble – – del primero. Note que como el vector 0 está incluido en la definición, y, por lo tanto, 0 es paralelo a cualquier vector, no basta una sola de las igualdades anteriores para definir paralelismo.

Conjuntos y bases ortogonales Definición 5.5.5

En un espacio normado, un vector x– es unitario si su tamaño es uno (algunos autores les llaman “versores” y usan la notación xˆ para designarlos). Ejemplo 5.5.2

 1 1 1  En n, cada eˆi = (…,1,…) es unitario y xˆ =  , ,  también.  3 3 3

Definición 5.5.6 Sea β = { x1,..., xn }. β es un conjunto ortogonal si ∀ i , ∀ j , i ≠ j ⇒ xi ⊥ x j , y si además ∀ i , i = 1, ..., n xi = 1, se dice que β es un conjunto ortonormal. Ejemplo 5.5.3

En n, {eˆ1 , ... , eˆn } es un conjunto ortonormal.

  Teorema 5.5.4 Todo conjunto ortonormal finito es linealmente independiente.

Demostración n – , ..., x– } un conjunto ortonormal y 0 = ∑ Sea β = {x a j x j ; entonces, para cada i = 1, ..., n, 1 n

 n  0 = 0 · xi =  ∑ a j x j  · xi = ai (xi · xi ) = ai .  j =1 

j =1

 Se acepta también el teorema que asegura: D 5  Todo espacio vectorial real de dimensión finita (esencialmente un n) tiene bases ortogonales y todo conjunto ortogonal que sea linealmente independiente puede completarse a (forma parte de) una base ortogonal. – Si β = {x–1, ..., x–n} es un conjunto ortogonal, linealmente independiente (y ∴ x–i ≠ 0, i = 1,..., n), entonces x x  β* =  1 , ..., n  x xn   1 es ortonormal, por lo que en el dogma anterior puede sustituirse “ortonormal” por “ortogonal” sin que pierda validez.

Definición 5.5.7 Sea W ≤ V un subespacio de un espacio vectorial real de dimensión finita V. El complemento ortogonal W⊥ de V es: W⊥ = {x ∈ V ; x ⊥ y ∀ y ∈ W} Ejemplo 5.5.4

Si W ={(a, b, 0) ∈ 3}, entonces W⊥ = {(0, 0, c) ∈ 3}.

209

210

Unidad 5  Álgebra lineal

Ejemplo 5.5.5

Si W = {(x, y, z) ∈ 3; 2x + 3y − z = 0}, entonces W ⊥ = {x ∈  3 ; x = t ( 2, 3, − 1) ; t ∈ }. Observación Si W es un subespacio de V generado por β = {x1, ..., xn }, entonces su complemento ortogonal W⊥ es W ⊥ = {x ∈ ; x ⊥ xi , i = 1, ..., r}.

 Teorema  5.5.5 Sea Vk un espacio de dimensión finita n, W un subespacio de V y W⊥ su complemento ortogonal. Entonces W⊥ es un subespacio de V y dim W + dim W⊥ = dim V.

Demostración I. a) 0 es ortogonal a x ∀ x ∈ V, en particular ∀ x ∈ W∴ 0 ∈ W ⊥ . b) Sean x , y ∈ W ⊥ ∴ ∀ u ∈ W, x · u = 0, y · u = 0 ∴ ( x + y ) · u = e.d. x + y ∈ W ⊥ . c) Sea x ∈ W ⊥ , k ∈ K, ∀u ∈ W, x · u = 0, k ( x · u ) = kx · u = 0 ∴ kx ∈ W ⊥ ; entonces W⊥ es un subespacio de V. II. Sea r = dim 𝕎, {x1, ..., xr } base ortonormal de W y x1 , ..., x r , v r +1 , ..., vn base ortonormal tanto xx ∈ ∈W W⊥⊥.. de V. Entonces x ∈ {vr +1,..., vn } resulta ser ortogonal a xxii,,ii == 11,, ..., r, y por lo tanto Entonces [v ] ⊂ W ⊥ ... (1).

{

r

r

i =1

i = r +1

}

Sea x ∈ W ⊥ , x = ∑ ai xi + ∑ b j v j ∴ x ⊥ xi , i = 1, ..., r ∴ xi · x = a i = 0 i = 1, ..., r e.d. r

x = ∑ b j v j ∈ [vi ] ∴ W ⊥ ⊂ [vi ] ...(2) i= 1

de (1) y (2) se obtiene que W⊥ = [vr +1, ..., vn ] y ∴ dim W⊥ = n − r, luego dim W + dim W⊥ = n.

Proyecciones Motivación →

→ u

→ →

u+ v



La suma de dos vectores u y v es una operación que permite obtener un vec→ → tor resultante u + v , que, en caso de que sean ortogonales, su representación gráfica tiene la forma que aparece en la figura 5.2. En la física e ingeniería existen varias aplicaciones en las que se plantea el problema inverso: descomponer un vector dado (resultante) en la suma de los dos vectores ortogonales que lo forman, como se ilustra en el ejemplo 5.5.6. Ejemplo 5.5.6



v

Figura 5.2  Suma de dos vectores.

Considere una locomotora que sube sobre una vía inclinada, como se muestra en la figura 5.3. → La fuerza w , debida a la gravedad, empuja la máquina contra la vía, y también contra su desplazamiento sobre la vía, lo que produce las dos fuerzas → → u y v , que son ortogonales, a las que se denomina las proyecciones de la fuer→ → za w . Así, w es la resultante de la suma de sus proyecciones: →







→ w=u +v

La representación de las fuerzas u y v ayuda a desarrollar el análisis del efecto de la gravedad → sobre la locomotora; por ejemplo, –u representa la fuerza que se requiere para impedir que la → máquina se deslice vía abajo, mientras que v representa la fuerza que soportan sus ruedas.

211

5.5  Producto escalar, norma y métrica en Rn

Proyección de un vector sobre otro vector → → → Dados los vectores w y x diferentes de cero, es posible proyectar el vector w → → → sobre el vector x y sobre otro vector y perpendicular a x , como se muestra en la figura 5.4. → → → → → Como se puede observar, w = u + v , en donde u es la proyección de w → → → → sobre x y v es la proyección de w sobre y .

→ u

Propiedades de la proyección de un vector La proyección de un vector sobre los otros dos vectores perpendiculares entre sí tiene las siguientes propiedades: 1. 2. 3.



→ → u = λ x para algún escalar λ (u es paralelo a x )



→ → → w = u+ v → →

→ v

v ·x =0

Mediante el uso de estas propiedades se puede calcular la proyección de un vector sobre otro en la forma siguiente: De 2 se puede plantear que w x u v x Al aplicar la propiedad distributiva del producto punto con la suma de vectores se obtiene w x

u x

v

→ w →

Figura 5.3  w y sus componentes.



y

x

→ →

Como v · x = 0 (propiedad 3), entonces → → → →

→ →

w · x = u · x+ 0 = u · x





w



Por otra parte, la propiedad 1 establece que u = λ x ; por lo tanto, w · x = (λ x ) · x = λ (x · x)

→ →

→ →

→ →

→ v

Del anterior desarrollo se tiene que w x

w x

x x x → → sobre otro x se puede De esta manera, la proyección de un vector w escribir en la forma u

x

w x x x

w x

x

x

x



u



x



Figura 5.4  Proyecciones ortogonales de w.

donde w x x →



es la componente de w sobre x . La componente de una proyección sobre un vector v es el escalar por el que se requiere multiplicar un vector unitario en la dirección de v para obtener la proyección correspondiente. → La proyección ortogonal ( v ) de w con respecto a x→ resulta

→ → → → → Como w · x = w x cos θ , la componente de la proyección de w sobre x→ se puede escribir en la forma → → · = → cos θ → → → en donde θ es el ángulo entre w yx

Nota Los términos componente y proyección no se utilizan de manera uniforme en la literatura. En algunos libros se definen en forma intercambiada. Le llaman proyección a lo que aquí se definió como componente y viceversa.

212

Unidad 5  Álgebra lineal

La noción de proyección se puede generalizar a n.

Definición 5.5.8









Dados dos vectores u y v en n, la proyección de u sobre v es el vector u

v

v

v

v

u v v v v → → → que es perpendicular a v , se llama la proyección ortogonal de u con respecto a v . El vector

u

Ejemplo 5.5.7

→ → → ˆ calcule la proyección de → u sobre v y la proyección Dados u = 2iˆ − 3 jˆ + 4 kˆ y w = −2iˆ − 3 jˆ + 5 k, → → ortogonal de u con respecto a v .

Solución →



La proyección de u sobre v es u

u v

v v  2 (−2) + (−3)(−3) + 4(5)  =  (−2, − 3, 5) 4 + 9 + 25   25 25 75 125  =   (−2, − 3, 5) =  − , − ,   38   19 38 38 

z





La proyección ortogonal de u con respecto a v (figura 5.5) es →

v



u



→ → u · v→ 25 75 125   v = (2, − 3, 4) −  − , − ,  2 →  v   19 38 38   

→ − Proyv → u = u −

Proy→ u v



u

25 75 125   63 39 2 7  =  2 + , − 3 + , 4 −  = − , − ,   38 38   19 38 38   19

y

Aplicaciones

→ → La aplicación de una fuerza F = 3iˆ + 3 jˆ (con F en newtons) mueve → → un bloque a través de un desplazamiento D = (5, 0) ( D en metros). La figura 5.6 muestra un esquema del proceso. → Determine el trabajo realizado por la fuerza F .

x →

Figura 5.5  Proyección ortogonal de u   →

sobre v .





F

F P



D

P

Q →

Proy→ F



D

Q

θ



F

D

Figura 5.6  Diagrama del desplazamiento de un bloque.



Figura 5.7  Componente horizontal de F .

cos θ

213

5.6  Producto vectorial

Solución



El trabajo realizado por una fuerza constante de magnitud F que mueve un objeto a lo largo de →

una distancia recta δ se calcula mediante la fórmula W = F δ , siempre y cuando la fuerza tenga →

la dirección de la recta de movimiento. Si la fuerza F que mueve un objeto a través de un despla→ → → zamiento D tiene otra dirección, entonces la que realiza el trabajo es la proyección de F sobre D . Así,

F

D

D

→ → F · D → → → W = →  D = F · D  D   

(

)

W = 3, 3 · (5, 0) = 3(5) + 3 (0) = 15 joules. →



En→ la física se acostumbra nombrar a la proyección de F sobre D como la componente vecto→ rial de F en la dirección de D y a su componente como la componente escalar. De esta manera, la solución del mismo problema en el lenguaje de la física sería la que aparece en la figura 5.7. → Como se observa en la figura 5.7, la componente vectorial de la fuerza F en la dirección del → → desplazamiento D es la que realiza el trabajo, y considerando a θ como el ángulo que forman F → → → → y D; entonces, la componente escalar de F en la dirección de D es F cos θ. Así, → escalar de  longitud de D Trabajo =  componente → →  en la dire e cción de D F

(

F

D



W= F →

Por lo tanto,

)



D cos θ

z



W =F · D

5.6  Producto vectorial (1, -1, 2)

Definición

y

El producto vectorial o producto cruz está definido, para un par de vectores u, v ∈ 3, en la forma u × v = (u2v3 − u3v2, u3v1 − u1v3, u1v2 – u2v1) en donde 3

u = u1ê1 + u2ê2 + u3ê3 = ∑ ui eˆi ; i =1

3

(2, 3, 2)

x

v = v1ê1 + v2ê2 + v3ê3 = ∑ vi eˆi

(8, -2, -5)

i =1

Figura 5.8 Representación geométrica de

u × v.

Ejemplo 5.6.1

Si u = 2 eˆ3 + 3 eˆ3 + 2 eˆ3 y v = eˆ31 − eˆ32 + 2 eˆ3, su producto vectorial será el siguiente vector: u × v = (3 . 2 – 2(−1), 2 . 1 − 2 . 2, 2(−1) − 3 . 1) = (8, −2, −5) = 8 eˆi − 2 eˆ2i − 5 eˆ3 y el dibujo de su gráfica en 3 se muestra en la figura 5.8. Por la convención de suma, el producto vectorial se puede escribir en forma más compacta como

3

∑ ui eˆi = ui eˆi ;    

i =1

3

∑ vi eˆi = vi eˆi 

i =1

214

Unidad 5  Álgebra lineal

Analogía con la solución como determinante Observe que, de acuerdo con la definición, el producto vectorial describe un sistema coordenado de mano derecha, como se ilustra en la figura 5.9. Los productos vectoriales entre los vectores unitarios eˆ1i , eˆ2i y eˆ3i resultan: eˆ1i × eˆ2i = eˆ3i = −( eˆ2i × eˆ1i )

z

eˆ2i × eˆ3i = eˆ1i = −( eˆ3i × eˆ2i ) eˆ3i × eˆ1i = eˆ2i = −( eˆ1i × eˆ3i ) eˆ1i × eˆ1i = eˆ2i × eˆ2i = eˆ3i × eˆ3i = 0

ê3 ê1

y

ê2

El producto vectorial de u y v se puede escribir entonces como u × v = (ui eˆi ) × (vj eˆji ) y, utilizando las relaciones entre los vectores eˆ1i , eˆ2i y eˆ3i definidas anteriormente, esta expresión se puede desarrollar para reproducir la definición del producto vectorial u × v = (u2v3 − u3v2) eˆ1i + (u3v1 − u1v3) eˆ2i + (u1v2 − u1v3) eˆ3i

x Figura 5.9  Base canónica de R3.

Nota La repetición de índices se interpreta como suma cuando dos de los subíndices son iguales. Así, por ejemplo, 3

2

uik vi wk = ∑ ∑ uik vi wk i =1 k =1

3

= ∑ (ui1vi w1 + ui 2 vi w2 ) i =1 3

∑ (ui1vi w1 + ui 2 vi w2 )

i =1

Como se puede observar de esta última forma, el producto vectorial se puede escribir también como si fuera un determinante eˆ1 eˆ2 eˆ3 u × v = u1 u2 v1 v2

u3 v3

Entonces, con base en las propiedades de los determinantes, se puede ver que el producto vectorial no conmuta u × v ≠ v × u debido a que el determinante del producto v × u

eˆ1 eˆ2 eˆ3 v × u = v1 v2 v3 u1 u2 u3 presenta un intercambio de renglones con respecto al determinante u × v , por lo que v × u = − (u × v ) Con el objetivo de abreviar la escritura del producto vectorial, es posible introducir el símbolo de permutación ∈ijk, cuya definición establece que 0, si i = j ∨ j = k ∨ k = i ∈ijk=  1, si es una permutación par de 1, 2, 3 – 1, si es una permutación impar de 1, 2, 3 El valor que adopta este símbolo es menos complicado de establecer y usar, mediante el apoyo del esquema de la figura 5.10, en donde, como se puede observar, ∈ijk es +1 cuando la secuencia de los subíndices 1, 2 y 3 describe la dirección de las manecillas del reloj, mientras que ∈ijk es −1 cuando los subíndices 1, 2 y 3 siguen una secuencia contraria a las manecillas del reloj. Por lo tanto, ∈123 = ∈231 = ∈312 = +1 ∈132 = ∈321 = ∈213 = −1 El empleo del símbolo de permutación y sus propiedades permite demostrar que el producto vectorial entre los vectores u y v se puede escribir usando notación indicial, en la siguiente forma:

= (u11v1w1 + u12 v1w2 ) + (u21v2 w1 + u22 v2 w2 ) + (u31v3w1 + u32 v3w2 ) u v w + u v w ( 11 1 1 12 1 2 ) + (u21v2 w1 + u22 v2 w2 ) + (u31v3w1 + u32 v3w2 ) ) + (u21v2 w1 + u22 v2 w2 ) ++ (u31v3w1 + u32 v3w2 )

1 -1

+1

3

2

u × v = ∈ijk uivj eˆk Figura 5.10  Esquema del

signo de las permutaciones.

3

3

3

∈ijk uivj eˆk = ∑ ∑ ∑ ∈ijk ui v j eˆk k =1 i =1 j =1

5.6  Producto vectorial

Asimismo, cuando se asume esta nueva representación del producto vectorial, es posible escribir un determinante en forma compacta. De esta manera, el determinante de la matriz de 3 × 3 con elementos aij será: det (aij) = ∈ijk a1i a2j a3k = ∈ijk ai1 aj2 ak3 det (aij) = ∈111 a11 a21 a31 + ∈112 a11 a21 a32 + ∈113 a11 a21 a33 + ∈121 a11 a22 a31 + ∈122 a11 a22 a32 + ∈123 a11 a22 a33 + ∈131 a11 a23 a31 + ∈132 a11 a23 a32 + ∈133 a11 a23 a33 + ∈211 a12 a21 a31 + ∈212 a12 a21 a32 + ∈213 a12 a21 a33 + ∈221 a12 a22 a31 + ∈222 a12 a22 a32 + ∈223 a12 a22 a33 + ∈231 a12 a23 a31 + ∈232 a12 a23 a32 + ∈233 a12 a23 a33 + ∈311 a13 a21 a31 + ∈312 a13 a21 a32 + ∈313 a13 a21 a33 + ∈321 a13 a22 a31 + ∈322 a13 a22 a32 + ∈323 a13 a22 a33 + ∈331 a13 a23 a31 + ∈332 a13 a23 a32 + ∈333 a13 a23 a33 det (aij) = 0 · a11 a21 a31 + 0 · a11 a21 a32 + 0 · a11 a21 a33 + 0 · a11 a22 a31 + 0 · a11 a22 a32 + 1 · a11 a22 a33 + 0 · a11 a23 a31 + (−1) · a11 a23 a32 + 0 · a11 a23 a33 + 0 · a12 a21 a31 + 0 · a12 a21 a32 + (−1) · a12 a21 a33 + 0 · a12 a22 a31 + 0 · a12 a22 a32 + 0 · a12 a22 a33 + 1 · a12 a23 a31 + 0 · a12 a23 a32 + 0 · a12 a23 a33 + 0 · a13 a21 a31 + 1 · a13 a21 a32 + 0 · a13 a21 a33 + (−1) · a13 a22 a31 + 0 · a13 a22 a32 + 0 · a13 a22 a33 + 0 · a13 a23 a31 + 0 · a13 a23 a32 + 0 · a13 a23 a33

det (aij) = a11 a22 a33 (–)a11 a23 a32 (−)a12 a21 a33 (+)a12 a23 a31 (+)a13 a21 a32 (−)a13 a22 a31 = a11 (a22 a33 – a23 a32) + a12 (a23 a31 – a21 a33) + a13 (a21 a32 – a22 a31)

= a11

a22 a32

a11 a12 a23 a21 a23 a21 a22 − a12 + a13 = a21 a22 a33 a31 a33 a31 a32 a31 a32

a13 a23 a33

En la función determinante del anexo 2, se da otra descripción del desarrollo anterior. Es posible demostrar, y se deja como ejercicio, que la norma del producto vectorial tiene la forma siguiente: || u × v || = || u || || v || sen θ en donde θ es el ángulo que forman u y v . Esta última afirmación permite establecer una forma análoga del producto vectorial que incluye al vector unitario perpendicular al plano formado por u y v , denominado eˆ⊥; u × v = || u || || v || sen θ eˆ⊥ Como se ha establecido previamente, los vectores u , v y eˆ⊥ definen un sistema coordenado de mano derecha.

Interpretación geométrica de la norma del producto vectorial || u × v || = || u || || v || sen θ Sea el par de vectores no colineales y distintos de cero v , u ∈ 3, como se ilustra en la figura 5.11. Si se considera el paralelogramo cuyos lados corresponden con los vectores u y v , entonces su área es AP = base × altura = || v || × h

215

216

Unidad 5  Álgebra lineal

u

θ

pero la altura (h) del paralelogramo corresponde con el cateto opuesto del triángulo rectángulo de la figura, por lo que h = || u || sen θ Al reemplazar se tiene AP = || u || || v || sen θ = || u × v ||

h v

Ejemplo 5.6.2

Figura 5.11  Paralelogramo

formado por u y v .

Encuentre el área del triángulo en 3, cuyos vértices corresponden con los vectores siguientes: u = (1, 2, −1), v = (2, −2, 1) y w = (1, −1, 2) La figura 5.12 muestra la gráfica de los tres puntos, así como dos aristas del triángulo que forman y que corresponden con las diferencias: u − v = (1, 2, −1) – (2, −2, 1) = (−1, 4, −2) y w − v = (1, −1, 2) – (2, −2, 1) = (−1, 1, 1) Entonces eˆ1 eˆ2 eˆ3 ( u − v ) × ( w − v ) = −1 −1

w

4 1

−2 = (6, 3, 3) 1

y el área del paralelogramo sería

v

AP = ||(6, 3, 3)|| = u

Figura 5.12  Vectores que señalan los vértices del triángulo.

54 = 3 6

Entonces el área del triángulo es 3 AT = 6 2

Algunas propiedades del producto vectorial En el siguiente teorema se establecen algunas propiedades adicionales del producto vectorial.

 Teorema  5.6.1 Sean u, v y w vectores en 3 y α ∈  un escalar: i) u · ( u · v ) = v · ( u × v ) = 0 ( u × v es ortogonal tanto a u como a v ) ii) u || v ⇔ u × v = v × u = 0 iii) u × 0 = 0 × u = 0 iv) || u × v ||2 = || u ||2 || v ||2 – ( u · v )2 (identidad de Lagrange) v) u × ( v + w ) = ( u × v ) + ( u × w ) vi) u × (α v ) = (α u ) × v = α( u × v ) Se harán solamente las demostraciones correspondientes a las propiedades i), ii) y v). Las demás se sugieren como ejercicios. i) u · ( u × v ) = (u1, u2, u3) · (u2v3 − u3v2, u3v1 − u1v3, u1v2 − u2v1) = u1(u2v3 – u3v2) + u2(u3v1 − u1v3) + u3(u1v2 – u2v1) = u1u2v3 – u1u3v2 + u2u3v1 – u2u1v3 + u3u1v2 – u3u2v1 = u1u2v3 + u2u3v1 + u3u1v2 – (u3u1v2 + u1u2v3 + u2u3v1) = 0 v · ( u × v ) = (v1, v2, v3) · (u2v3 − u3v2, u3v1 − u1v3, u1v2 − u2v1) = v1(u2v3 – u3v2) + v2(u3v1 − u1v3) + v3(u1v2 – u2v1) = v1u2v3 – v1u3v2 + v2u3v1 – v2u1v3 + v3u1v2 – v3u2v1 = v1u2v3 + v2u3v1 + v3u1v2 – (v3u1v2 + v1u2v3 + v2u3v1) = 0

5.7  Triple producto escalar

ii) u || v ⇒ u = α v eˆ1 eˆ2 u × v = u1 u2 v1 v2

eˆ3 eˆ1 eˆ2 u3 = αv1 αv2 v3 v1 v2

eˆ3 eˆ1 eˆ2 αv3 = α v1 v2 v3 v1 v2

eˆ3 v3 = α ( 0 ) = 0 v3

eˆ1 eˆ2 v × u = v1 v2 u1 u2

eˆ3 eˆ1 eˆ2 v3 = v1 v2 αv1 αv2 u3

eˆ3 eˆ1 eˆ2 v3 = α v1 v2 αv3 v1 v2

eˆ3 v3 = α ( 0 ) = 0 v3

v) u × ( v + w ) = ( u × v ) + ( u × w ) u × (v + w ) =

eˆ1 eˆ2 u1 u2 v1 + w1 v2 + w2

eˆ3 eˆ1 eˆ2 = u1 u2 u3 v3 + w3 v1 v2

eˆ3 u3 v3

eˆ1 eˆ2 + u1 u2 w1 w2

eˆ3 u3 w3

= (u × v ) + (u × w )

5.7  Triple producto escalar Definiciones Sean u, v y w vectores en 3. Se define el triple producto escalar en la forma u1 u2 u · ( v × w ) = v1 v2 w1 w2 o bien

u3 v3 = u1v2w3 + u2v3w1 + u3v1w2 – (u1v3w2 + u2v1w3 + u3v2w1) w3 u · ( v × w ) = || u || || v × w || cos θ,

en donde θ es el ángulo entre los vectores u y ( v × w ). Ejemplo 5.7.1

Calcule el producto triple escalar para los siguientes vectores: u = (2, −2, 1), v = (3, 4, 2) y w = (−1, 1, 2) 2 −2 1 u  ·  ( v × w ) =  3 4 2 = 2 · 4 · 2 + (−2) · 2 · (−1) + 1 · 3 · 1 – (2 · 2 · 1 + (−2) · 3 · 2 + 1 · 4 · (−1)) −1 1 2 = 35

Interpretación geométrica Sean u, v y w tres vectores en 3 que forman paralelogramos correspondientes con los lados de un paralelepípedo, que se ilustra en la figura 5.13. El volumen de todo paralelepípedo equivale al producto del área de su base por su respectiva altura. En el caso del paralelepípedo formado por los vectores u, v y w, el área de la base se puede obtener a partir de || v × w ||, que es el área de la superficie del paralelogramo formado por los vectores v y w.

217

218

Unidad 5  Álgebra lineal

La altura del paralelepípedo (vea la figura 5.13) es equivalente a la norma de la proyección de u sobre v × w. Así, u · (v × w) h = Proy u ×v u = v ×w

u h θ

v

De esta manera, el volumen del paralelepípedo es

w

VP = v × w

u · (v × w) v ×w

= u · (v × w)

que es el triple producto escalar. Ejemplo 5.7.2

Figura 5.13  Paralelepípedo

formado por u, v y w.

El volumen del paralelepípedo formado por los vectores u = (2, −2, 1), v = (3, 4, 2) y w = (−1, 1, 2) VP = u · ( v × w )| = 35.

es

5.8  Rectas y planos Las rectas en n Para definir con toda precisión una recta debe estar claro que basta un punto por el que pase _ (o en el que se apoye) y un vector diferente de cero que la genere. Sea P0 un punto en  n y a un vector distinto de cero. Entonces la recta ℒ, apoyada en P0 y generada por a , es el conjunto de los puntos P ∈  n que satisfacen la ecuación P = P0 + ta para cada t ∈  . Así, a cada valor de t le corresponde un punto en la recta y recíprocamente. Un punto Q está en la recta si y sólo si existe un t0 ∈  tal que Q = P0 + t0 a . Esta recta también se denota como ℒ (P0 ; a ). Ejemplo 5.8.1

Sea ℒ la recta apoyada en (1, 2, 3) y generada por (3, 2, 1). El punto (10, 8, 6) está en ℒ, ya que (10, 8, 6) = (1, 2, 3) + 3(3, 2, 1) mientras que (1, 0, 1) no está en ella, ya que no existe t ∈  tal que (1, 0, 1) = (1, 2, 3) + t (3, 2, 1).  La figura_5.14 representa la recta en 3 que pasa por el punto P0 y está generada por el vector a . Se deja al lector la demostración de los teoremas siguientes.

z P0

 Teorema  5.8.1

a

_ _ Si Q es un punto de la recta ℒ(P0; a, ), entonces ℒ(P0; a ) = ℒ(Q; (a ); es decir, toda recta se puede apoyar en cualquiera de sus puntos.



x

y

Figura 5.14  Recta en 3.

 Teorema  5.8.2

_ _ _ Si b es un vector diferente de cero y paralelo a a, entonces ℒ(p0; a ) = ℒ(P0; b ). Toda recta se puede generar por cualquier vector no cero, paralelo a su generador original.

Corolario 1

La ecuación de la recta no es única.

Una ecuación de la recta que pasa por dos puntos Sean P1 y P2 dos puntos distintos. Para encontrar una ecuación de la recta que pasa por ellos, se debe seleccionar un punto de apoyo y un vector que la genere. En vista de los teoremas anteriores, se puede elegir cualquiera de los puntos como apoyo y tomar el vector P2 − P1 como vector gene-

219

5.8  Rectas y planos

rador, que es distinto de cero, dado que los puntos son diferentes. Entonces, ℒ(P1; P2 – P1) es la ecuación de una recta. Para comprobar que es la que se quiere basta hacer ver que –P1 y P2 están en ella, lo que se consigue tomando para t los valores 0 y 1. Por ejemplo, sean P1 = (1, 2, −1) y P2 = (−2, 3, 1). Entonces una ecuación de la recta que pasa por ellos es ℒ((1, 2, −1); (−3, 1, 2)). Otras serían _ ℒ((–2, 3, 1); (3, –1, –2)),… _ Una ecuación vectorial de la recta ℒ(P ; a ) es ℒ = {P | P = P0 + ta , + t ∈ }. 0 _ Si a = (a1, a2, a3) y P0 = (x0, y0, z0), la ecuación de la recta también puede escribirse en forma paramétrica, como sigue: x = x0 + ta1 y = y0 + ta2, t ∈  z = z0 + ta3 y cuando a1, a2, a3 son diferentes de 0, se puede usar la forma simétrica, que se obtiene despejando el parámetro t en las ecuaciones anteriores e igualando los resultados: x − x0 y − y0 z − z0 a1 = a2 = a3

Ejemplo 5.8.2

_ _ Sea P0 = (1, 2, 3) y a = (3, 2, 1). Entonces, la recta ℒ que pasa por P0 y que está generada por a es: Ecuación vectorial: P = {(x, y, z) = (1, 2, 3) + t(3, 2, 1), t ∈ }

(5.8.1)

Ecuaciones paramétricas: x = 1 + 3t y = 2 + 2t z = 3 + t Forma simétrica:

t ∈ 

(5.8.2)

x−1 y−2 = =z−3 3 2

Ángulo entre rectas Se define el ángulo entre dos rectas, independientemente de que se corten o no, como el que forman los vectores que las generan. Cuando los vectores generadores son ortogonales (o paralelos) se dice que las rectas son ortogonales (o paralelas).

Planos en 3 El mismo razonamiento que se usó para definir la ecuación vectorial de una recta permite asegurar que un plano queda bien determinado si se conoce un punto de apoyo y dos vectores que lo generen (figura 5.15). _ – Así, una ecuación del plano apoyado en P0 y generado por los _ –vectores a y b es P ={P|P = z _ P0–+ ta + sb, s, t ∈ }, que se abrevia como π (P0; a, b ). Para que los vectores a y b generen al_plano se requiere que no sean paralelos. – Un punto P ∈ π (P0 ; a, b ) si y sólo si existen escalares s0 y t0 tales que _ – P = P0+ t0 a + s0b . Siguiendo con las analogías, se expresan los dos teoremas siguientes, cuya demostración también se deja como ejercicio.

 Teorema  5.8.3

_ – _ – _ – Si Q0∈ π(P0; a, b ), entonces π(P0; a, b ) = π (Q0; a, b ). Un plano puede apoyarse en cualquiera de sus puntos.

x

b

a

y

Figura 5.15  Vectores que generan

el plano.

220

Unidad 5  Álgebra lineal

 Teorema  5.8.4

_ – Si u– y v– son vectores no paralelos que están en el plano generado por a y b, entonces _ – π (P0; a, b) = π (P0; –u, –v ). Un plano puede generarse por cualesquiera dos vectores no paralelos que estén en el plano de los generadores originales.

Una ecuación del plano que pasa por tres puntos no colineales Sean P1, P2 y P3 tres puntos no colineales. Para encontrar una ecuación del plano que pasa por ellos se debe seleccionar un punto de apoyo y dos vectores no paralelos que lo generen. En vista de los teoremas anteriores, se puede elegir cualquiera de ellos (por ejemplo, P1), como apoyo y tomar los vectores P2 – P1 y P3 – P1 como generadores. La no colinealidad garantiza que los vectores generadores no son paralelos (vea el ejercicio 5.9.11 del final de la unidad). La ecuación del plano queda π (P1; P2 − P1, P3 − P1 ), o en forma vectorial P = P1 + s (P2 − P1 ) + t (P3 − P1 ), s, t ∈= , y en este caso si t = s = 0 resulta que P1 ∈ π ; si s = 1 y t = 0, P2 ∈ π , y si s = 0 y t = 1, P3 ∈ π. Por ejemplo, sean P1 = (1, 0, − 1), P2 = (3, 1, 2) y P3 = (−4, 4, 1). Tomando P1 como punto de apoyo, los vectores generadores P2 − P1 y P3 − P1 resultan ser (2, 1, 3) y (−5, 4, 2). Entonces una ecuación del plano es π ((1, 0, − 1); (2, 1, 3), (−5, 4, 2)) .

Ecuación normal del plano Otra forma de expresar la ecuación de un plano π requiere de un vector n que sea ortogonal a cualquier recta contenida en π y un punto de apoyo P0 . El vector n se conoce como una normal al plano. Note que en este caso, si P es un punto del plano P − P0 , resulta ortogonal a n y, por lo tanto, n · (P − P0 ) = 0. En particular, si n = (a, b, c ) , P0 = (x0 , y0 , z0 ) (vectores conocidos) y P = (x, y, z ) un vector cualquiera del plano, la ecuación anterior queda ax + by + cz = d en donde d = ax0 + by0 + cz0 = n · P0 . En general, toda ecuación lineal en tres variables representa un plano en 3, cuya normal es el vector formado por sus coeficientes. Por ejemplo, la ecuación x + 2 y + 3z = 0 representa un plano que pasa por el origen —el punto (0, 0, 0) satisface la ecuación— y tiene normal (1, 2, 3). La ecuación 2 x − 3z = 5 representa al plano que pasa por (1, −7, −1) y que tiene por normal al vector (2, 0, −3). Cuando se conocen los vectores que generan al plano, una normal puede obtenerse a partir del producto cruz de ellos. Del ejemplo anterior se obtiene n– = (2, 1, 3) × (−5, 4, 2) = (−10, −19, 13) y d resulta (−10, −19, 13) . (1, 0, −1) = −23. Finalmente, una ecuación del plano es −10 x − 19 y + 13z = −23

n

z

P - P0

Ángulo entre planos

P0 P

y

x Figura 5.16  Representación del plano.

Se define el ángulo entre dos planos como el que forman sus vectores normales. Entonces, si los vectores normales son ortogonales (o paralelos), se dice que los planos son ortogonales (o paralelos).

Ángulo entre recta y plano Se define el ángulo entre una recta y un plano como el complemento del que forman una normal al plano y un vector generador de la recta.

5.9  Transformaciones lineales

5.9  Transformaciones lineales En esta sección se estudian funciones cuyo dominio y codominio son espacios vectoriales sobre el mismo campo y que cumplen dos condiciones: abren sumas y sacan escalares (vea la definición). S a

S( a )

a + b

S( a ) + S( b )

αα · Sv (a S() a )

α· a

S( b)

b {𝕌, 𝕂, + , ·}

{𝕍, 𝕂,

, ·}

Figura 5.17  Esquema de la transformación lineal S.

Definición 5.9.1 Sean U y V espacios vectoriales sobre el campo K. Una función S de U en V se llama una transformación lineal si satisface las dos condiciones siguientes: – + b ) = S(a–) + S(b–) 1. S (a “abre sumas”. – –) 2. S (αa ) = αS(a “saca escalares”. ∀ a, b ∈ U, ∀ α ∈ K Se enfatiza que la suma a + b y la multiplicación de un vector por un escalar α · a se realiza en el espacio U, mientras que S( a ) ⊕ S( b ) y α ≠ S( a ) se realizan en el espacio V. Ejemplo 5.9.1 Sea a un número real y T:  →  con regla de asociación T(x) = ax. Se comprobará que T es una transformación lineal (TL). En efecto, sean x, y ∈  (vectores) y α ∈  (escalar). Al aplicar la definición de T: T(x + y) = a(x + y) = ax + ay = T(x) + T(y)

“abre sumas”.

T(αx) = a(αx) = (aα)x = (αa)x = α(ax) = αT(x)

“saca escalares”.

Ejemplo 5.9.2 Si ahora la regla de asociación fuera T(x) = ax2, ¿T sería una TL? Sean x, y ∈  y α ∈ . Al aplicar la definición T(x + y) = a(x + y)2 = a(x2 + 2xy + y2) = ax2 + a2xy + ay2 = T(x) + 2xy + T(y) ≠ T(x) + T(y) T(αx) = a(αx)2 = a(α2x2) = α2 (ax)2 = α2 T(x) ≠ αT(x). Como no se cumple ninguna de las condiciones, T no es una TL (bastaría con que no se cumpliera cualquiera de ellas). Ejemplo 5.9.3 Sean a y b números reales y T: 2 →  con regla de asociación T(x, y) = ax + by. ¿T es una TL? Sea x = ( x1, x2 ) y y = ( y1 , y2 ) elementos de 2 y α ∈ . Aplicando la definición, T (αx ) = a (αx1 ) + b (αx2 ) = (aα) x1 + (bα) x2 = α (ax1 + bx2 ) = αT (x )

T (x + y ) = T (x1 + y1, x2 + y2 ) = a ( x1 + y1 ) + b( x2 + y2 ) = ax1 + bx2 + ay1 + by2 = T ( x ) + T ( y ) Luego, T es una TL.

221

222

Unidad 5  Álgebra lineal

Ejemplo 5.9.4 Sean a y b números reales y T: 2 →  con regla de asociación T(x, y) = ax + by + 1. ¿T es una TL? Sean x = ( x1 , x2 ) y y = ( y1, y2 ) elementos de 2 y α ∈ . Al aplicar la definición, T ( x + y ) = T ( x1 + y1, x2 + y2 ) = a ( x1 + y1 ) + b( x2 + y2 ) + 1 = ( ax1 + bx2 ) + ( ay1 + by2 ) + 1 T ( x ) + T ( y ) = ( ax1 + bx2 + 1) + ( ay1 + by2 + 1) = ( ax1 + bx2 ) + ( ay1 + by2 ) + 2 ∴ T (x + y ) ≠ T (x ) + T ( y ) T no es una TL. Ejercicios 5.9 1.

2.

Calcule las componentes del vector B {(1, 1), (1, − 1)} y y B 3 = {(1, 0),(1, 2)} .

(4, 6)

con respecto a las bases B 1 = {(1, 0),(0, 1)},  

Calcule las componentes del vector (2, 0, 3) respecto a las bases B a = {(1, 0, 0),(0, 1, 0),(0, 0, 1)} ,

B b = {(2, − 2, 1), (0, 1, − 1),(0, 0, 1)} y B c = {(1, 1, 1), (0, 1, 2), (1, 0, 4)}. 3.

Resuelva lo que se le pide:

1 2  1  a)  Dé tres combinaciones lineales de los vectores   ,   ,   . 3 1 −1 1 1 2 b)  ¿   es una combinación lineal de los vectores  ,   ? 3   1 1

2 −1  1  1 c)  ¿   es una combinación lineal de los vectores  ,  ,   ? 1    2  −1 1  1 1 −2 d )  ¿   es una combinación lineal de los vectores  ,   ? −1 1 −2 4.

Trace los subespacios de 2 generados por los vectores que se indican.

 0 1 0 1 −1  1  −1 −1  1 a)  , b)  , c)  , d)  , e)  , f )  , g)  , h)  , i)  , − 1   0 1 1  1 −1  0 −1 −1  1 −1 1 0 1 1 j )  ,  , k)  ,  , l ) −1,  1.     0 1 0 1

¿Cuáles de los subespacios generados son iguales? 1 0 1 2  −1 0   Gen   , Gen  ,   , Gen 0, 1 , Gen  , 0 0  0 1 0 0    

5.

6.

 0  −1 , Gen  

1   1, 0  

 1  −1 , Gen    0

1   0, 0  

1 0 .   0

¿Cuáles de las siguientes proposiciones son ciertas?  0 1 a)   ∈ Gen  , 3  −1  

1  1 1 −2 1 2     − 1 0 , b) 1 ∈ Gen 1, −2 , c)   ∈ Gen 0,         0  2  

0   1. 1

5.9  Transformaciones lineales

7.

¿Cuáles de los siguientes conjuntos de vectores son linealmente independientes?  1 1 A =  ,   , B = −1 1

8.

 1 −1  ,   , C = −1  1

0 1,   1

0 0 , D =   1

1   1, 1  

0 1,   1

2 1 .   1

Indique los conjuntos que son bases de 2 y aquellos que son bases de 3.  1  1 B =   , B =  , − 1   −1 1   B = 1, 1  

9.

1   1, 1  

0   1 , 1

1  1 1 , B = −1,    

0 0     0 , B = 0, 1 1  

0   1, 1

1 1, 

1 1   2 , B = 1,   1  

0 1     1 , B = 0, 1 1  

0   1, 1

1  1, 1

0 1 ,   1

−1    1 . −1

Dé una ecuación de la recta que pasa por el punto P = (1, −1, 2) y que está generada por el vector (2, 1, 3).

10. Construya una ecuación de la línea que pasa por los puntos P = (1, 0, 1) y Q = (2, 2, 3). 11. Demuestre que si los puntos P1, P2, P3 no son colineales, entonces P2 − P1 y P3 − P1 no son

paralelos.

12. Dé una ecuación del plano que pasa por el punto P = (−1, 1, 1) y que es perpendicular a los

vectores a,= (5, 1, 3) y b , = (−2, 1, 1).

13. Dé una ecuación del plano que pasa por los puntos P = (2, 1, 0), Q = (3, −1, 1) y R = (1, 0, 2). 14. Dé una ecuación del plano que pasa por el punto P = (1, 1, 1), cuya normal es paralela al vector

(1, 2, 3).

(

)

15. Dada la recta ℒ L (1, 1, 2); (2, 1, 1) , exprésela en forma vectorial y en forma paramétrica. 16. Dada una ecuación vectorial para un plano, transfórmela en una normal.

17. Calcule el ángulo entre las líneas ℒ1 = {(1, −1, 2) + α (1, 0, 1), α ∈ } y ℒ2 = {(2, 3, −1) + β(0,

−1, 1), β ∈ }. ¿Cuál es la intersección de las líneas ℒ1 y ℒ2?

18. Calcule el ángulo entre los planos π1 = {(x, y, z) | 2x + y − z = 1} y π2 = {(x, y, z) | x − y − z = 2 }.

19. Calcule la distancia entre los puntos P = (2, 1, 4) y Q = (1, 0, 2).

223

224

Unidad 5  Álgebra lineal 20. Calcule la distancia del punto P = (2, 1, 1) a la línea ℒ que tiene ecuaciones paramétricas 

x = 1 + t, y = 2 − t, z = −1 + 2t.

21. Calcule la distancia entre las líneas ℒ1 = {(1, −1, 2) + α(1, 0, 1), α ∈ } y

ℒ2 = {(2, 3, −1) + β(0, −1, 1), β ∈ }.

22. Calcule la distancia del punto P = (1, 0, 1) al plano x + 3y − z = 4.

23. Calcule la distancia entre los planos x − y + z = 1 y −x + y − z = 4.

24. Para a = (−1, 1, 0), b = (0, 1, 1), calcule la norma de los siguientes vectores: 2 a, a − b, 

a × b .

25. Dé dos vectores ortogonales a los vectores − a y 2 b , que tengan tamaño π, donde a = (−1,

1, 0) y b = (0, 1, 1).

26. Dé todos los vectores ortogonales al vector (1, −1, −2). 27. Calcule el perímetro y el área del triángulo que tiene como vértices los puntos (1, 0, 0), 

(0, 2, 0) y (0, 0, 3). 28. Calcule el volumen del paralelepípedo que tiene como tres de sus aristas los vectores (1, 0, 0), 

(0, 2, 0) y (0, 0, 3). 29. Calcule el volumen de la pirámide que tienen sus vértices en los puntos (0, 0, 0), (3, 0, 0), 

(0, 4, 0) y (1, 1, 1). 30. ¿Qué parejas de los siguientes vectores son ortogonales?

a = (2, 1, 3), b = (1, 1, −2), c = (−1, 1, 0). 31. Calcule el ángulo que forman los vectores a = (1, −1, 1) y b = (−1, 1, 1). 32. Calcule la proyección ortogonal del vector a = (2, 0, 1) sobre el vector b = (0, 2, 1). 33. Calcule la componente ortogonal del vector a = (0, 2, 1) sobre el vector b = (2, 0, 1). 34. Exprese el vector a = (2, 1, 3) como la suma de dos vectores ortogonales, uno de los cuales

sea paralelo al vector b = (1, −1, 1).

35. Investigue cómo se definen los cosenos directores y calcule los que correspondan al vector 

a = (1, −2, 1).

36. Descanse.

Anexo 1 Combinatoria Para analizar los resultados de las encuestas, muestreos, censos, probabilidades o estudios estadísticos teóricos o las prácticas indispensables para la toma adecuada de decisiones es importante contar los elementos de algunos conjuntos, de sus subconjuntos y de las familias de éstos. De esta actividad (determinar la cardinalidad de un conjunto o contar sus elementos) han surgido algunas conjeturas, afirmaciones que no han sido demostradas, y varias proposiciones importantes en la teoría de los números, como el último teorema de Fermat que se demostró más de 300 años después de que fue formulado. Cuando los conjuntos son infinitos, es decir, tienen un número infinito de elementos, la cuenta del número de éstos depende de la manera de contarlos, pero en el caso finito, si no se equivoca el contador, el resultado es independiente del método, observación que ha dado origen a un buen número de aplicaciones importantes en diversas ramas de la matemática, como la teoría de grupos, de anillos, extensiones de campos, y en general en la parte conocida como “álgebra abstracta”, así como en la probabilidad y en la teoría de la medida. En esta sección se analizan algunas técnicas elementales de conteo para los conjuntos finitos; asimismo, se presentan ejemplos y se proponen ejercicios relacionados con el tema. Cuando se describe un conjunto exhibiendo explícitamente a sus elementos, tal exhibición es equivalente a una serie de proposiciones de pertenencia unidas por el conectivo “y” que conmuta y es asociativo. Así, la expresión A = {a, b} dice que a ∈ A y b ∈ A, o equivalentemente que b ∈ A y a ∈ A, es decir, {a, b} = {b, a}. Observe que la proposición a ∈ A ∧ a ∈ A ∧ a ∈ A ∧ b ∈ A ∧ b ∈ A define al mismo conjunto. Es decir, { a, b} = { a, a, a, b, b} = {b, b, , a, a,} . En efecto, un conjunto está determinado por sus elementos y es independiente del orden en el que se diga que tales elementos pertenecen al conjunto y del número de veces que pueda repetirse esta información de pertenencia; es decir, que los elementos de un conjunto no están ordenados. Algunas veces resulta conveniente, o cómodo, denotar a los elementos de un conjunto con la misma letra marcada con diferentes subíndices. Así, por ejemplo, se han mencionado las n-adas ( x1, x2 ,, xn ) y los productos cartesianos generalizados En el primer caso se ha usado la misma letra x para representar las diferentes coordenadas de cada n-ada, distinguiendo unas de otras por el subíndice que se les adjunta, y en este ejemplo el orden natural de los subíndices puede usarse para inducir el correspondiente orden en las coordenadas. Se dice que “xi es anterior a xj” si i es menor que j (por ejemplo, x2 “va antes” que x4 o que x7). En el caso del producto cartesiano generalizado, pudiera suceder que el conjunto I de índices tuviera alguna relación de orden y, en ese caso, éste permite ordenar a los factores de manera análoga a la anterior (xi es anterior a xj si, en el orden de I, i va antes que j). Se llama conjunto parcialmente ordenado (o COPO) a la colección de objetos (conjunto) en la que, además de los objetos mismos, está definida en ellos alguna relación de orden, que cuando es lineal (o total o completa) produce un COPO linealmente ordenado. Estas consideraciones deberán tomarse en cuenta cuando se trate de decidir si dos conjuntos son iguales o no. Del axioma de extensión1 se sigue que A ≠ B si y sólo si existe un elemento en A que no esté en B o viceversa, pero cuando se trata de conjuntos ordenados puede suceder que aun teniendo los mismos elementos, éstos aparezcan en diferente orden, y en ese caso los conjuntos deben considerarse como distintos. Las coordenadas de los puntos del plano son un ejemplo de esto; ( a, b ) ≠ ( b, a ), a menos que a sea igual a b. ¿Cuántos subconjuntos de dos elementos pueden formarse a partir de A = { a, b, c } ? La respuesta es tres: {a, b}, {a, c}, {b, c}. 1

A = B ⇔ ∀ x, x ∈ A ⇔ x ∈ B.

225

226

Anexo 1

¿Cuántos subconjuntos ordenados? En este caso, la respuesta es seis, a saber: (a, b), (b, a), (a, c), (c, a), (b, c), (c, b). Observe el cambio de notación: {a, b} = {b, a} aunque a sea diferente de b, y en este caso, (a, b) ≠ (b, a).

Principio fundamental del conteo (PFC) Suponga que se debe realizar un evento que consta de dos etapas independientes, y que cada una se puede efectuar de m1 y m2 maneras, respectivamente. Entonces la sucesión ordenada de las dos etapas (el evento) tiene m1 m2 distintas maneras de efectuarse. En general, si un evento consta de n etapas independientes, cada una de las cuales puede realizarse de mi, i = 1, …, n, maneras difen rentes, el proceso total puede efectuarse de ∏ mi modos distintos, resultado que puede probarse por inducción sobre el número de etapas. i =1 La situación anterior para el caso de un proceso que consta de dos etapas independientes, una de las cuales se puede realizar de dos formas y la otra de tres, puede ilustrarse, entre otras, de las siguientes maneras: 1. Sean A = {a1, a2} las formas en que puede llevarse a cabo la primera y B = {b1 , b2 , b3 } las de

la segunda. Entonces los seis diferentes eventos pueden representarse por las parejas ordenadas ( a1, b1 ), ( a1, b2 ), ( a1, b3 ), ( a2 , b1 ), ( a2 , b2 ) y ( a2 , b3 ), en donde las coordenadas indican la selección de cada una de las posibilidades. Observe que cada paréntesis puede considerarse también como una función η del conjunto de las etapas E = {E1, E2} en el producto cartesiano A × B de las posibles selecciones. Así, (ai, bj) representa (es) la función ηi j : E → A × B , tal que η(E1 ) = ai , η(E2 ) = b j , que suprimiendo literales dice que, en este caso, para la etapa 1 se escogió la forma i y para la etapa 2 la forma j. Esta observación permite contar el número de distintos eventos por medio de la cuenta de las funciones anteriores. 2. A cada selección de la primera etapa (dos posibilidades) corresponde cualquiera de las tres posibilidades de la segunda (o viceversa), lo que se ilustra con los siguientes diagramas.

a1 a1 a2 a2

b1 b2 b1 b2 b b3 b1 3 b2 b1 b2 b b33

b1 b2 b1 b2 b3 b3

a1 a a1 a1 a22 aa21 a2a 1 aa21 a2

¿Cuántas palabras de tres letras se pueden formar con los elementos del conjunto A = {a, b, c, d, e}? Se llamará palabra a cualquier conjunto ordenado de tres letras, repetidas o no, independientemente del significado que pudieran o no tener en el sentido usual. Así, aac, aba y ccc son ejemplos de palabras para este problema. Note que aab y aba son palabras distintas. Debe ser claro que para encontrar la solución a este problema deben tomarse tres decisiones, y que no importa el orden en el que se tomen: cuál debe ser la primera letra, cuál la segunda y cuál la tercera. En cada caso debe seleccionarse una letra del conjunto A que tiene cinco elementos, luego cada selección puede hacerse de cinco maneras independientes. El PFC asegura que entonces el proceso completo, seleccionar las tres letras, puede hacerse de 5 × 5 × 5 maneras diferentes, y que, por lo tanto, hay 125 posibles palabras de tres letras. Aquí se ha llamado palabra a lo que técnicamente se conoce como una ordenación con repetición de tres elementos, y en este caso el problema puede plantearse preguntando: ¿cuántas ordenaciones con repetición de tres elementos se pueden formar a partir de un conjunto de cinco elementos? En este anexo se denotará la respuesta, que resulta ser 53, con el símbolo OR35, que se lee como ordenaciones con repetición de cinco elementos tomados de tres en tres. En algunos libros se invierte el orden de los índices y se escribe OR53, o se usa también la notación 3OR5 (y aun 5OR3). La discusión del ejemplo anterior debe ser suficiente para convencerse de que, en general, las ordenaciones con repetición de k símbolos tomados de un universo de n deben satisfacer la fórmula ORkn = nk.

Anexo 1

En el caso en que para formar una palabra no se admitan repeticiones, se dirá que se trata de una ordenación, y el número de todas ellas se denotará como Okn. ¿Cuántas ordenaciones se pueden formar con k símbolos a partir de un universo de n? Deben hacerse k selecciones. Para la primera hay n posibilidades. Para la segunda, puesto que no se permiten repeticiones, quedan n − 1 posibilidades. Para la tercera n − 2, y para la k-ésima n! n − k + 1. Luego, O kn = n (n − 1)(n − 2)(n − k + 1), que es igual al número . ¡Convénzase! (n − k )! Para calcular el número de palabras sin repetición (ordenaciones) con k símbolos que pueden formarse con un alfabeto de n letras, considérese el producto de n por el conjunto de sus predecesores inmediatos, hasta completar k factores.

Ejemplo A1.1 3 O10 = 10 · 9 · 8 = 720    3 factores

28! O528 = 28 · 27 · 26 · 25 · 24 = 28 − 5)! ( 5 factores



Permutaciones Las ordenaciones de n elementos formadas a partir de un universo de n, Onn, se conocen como permutaciones de un conjunto con n elementos, y cada una es un caso particular del concepto de permutación de los elementos de un conjunto A que se define a continuación.

Definición A1.1 Sea A un conjunto (finito o infinito). Se llama una permutación de los elementos de A a toda función biyectiva f: A → A. El conjunto de las permutaciones de A se denota como S(A), y si A es finito y consta de n elementos, se usa la notación Sn y se llama el grupo simétrico de orden n, que, como ya se dijo, tiene n! elementos y se puede interpretar como las diferentes formas en que pueden acomodarse ordenadamente los n elementos de A. Esto es, Sn = O nn = n! Cuando cada elemento xi ∈ A se representa simplemente por su índice, Sn resulta ser Sn = { f : {1, 2, , n} → {1, 2, , n}; f esbiyectiva }

Ejemplo A1.2 En el caso n = 3, si A = {a1, a2, a3}, los seis elementos de S3 son las funciones que describen las matrices  a1 a2 a a  1 2

a3   a1 , a3   a2

a2 a3

a3   a1 , a1   a3

a2 a1

a3   a1 a2 , a2   a1 a3

a3   a1 , a2   a3

a2 a2

a3   a1 , a1   a2

a2 a1

a3  a3 

en donde el segundo renglón de cada una indica la imagen de cada elemento del primer renglón, bajo la función particular de que se trate. Así, la matriz  a1 a2 a3  a a a  j k  i dice que la función f que representa es f (a1 ) = ai , f (a2 ) = a j , f (a3 ) = ak , en donde, por supuesto, ai, aj y ak son diferentes entre sí. Ejemplo A1.3 El grupo S3 o grupo de las simetrías del triángulo.

227

228

Anexo 1

Definición A1.2 Se llama simetría de un polígono a toda función isométrica del polígono en el mismo, que manda vértices en vértices y lados en lados. Una isometría es una función que preserva distancias. Es decir, si X es un espacio métrico (tiene una función distancia), una función f : X → X  es una isometría si y sólo si ∀ x, y ∈ X , d (x, y) = d ( f (x), f ( y)).

Definición A1.3 Un espacio X se llama métrico si existe una función distancia η: X × X → R tal que ∀x, y, z ∈ X.

η ( x, y ) ≥ 0 η ( x, y ) = 0 ⇔ x = y 2. η(x, y) = η( y, x) 3. η(x, y) ≤ η(x, z ) + η( z, y) 1.

En este caso, η se llama una métrica y se puede traducir así: η(x, y) es la distancia (en X) de x a y. De acuerdo con las definiciones anteriores, el grupo de las isometrías del triángulo consta de las seis permutaciones de sus vértices v1, v2, v3, que son las que corresponden a las matrices siguientes:

y

v1

 1 2 3 R=  2 3 1

1 2 3 R2 =   3 1 2 

1 2 3  x=  1 3 2 

1 2 3 y=  3 2 1

 1 2 3 z=  2 1 3

en las que se ha utilizado la convención de representar al conjunto de los vértices como el conjunto {1, 2, 3} de sus índices. Si se considera el triángulo equilátero v1 v2 v3 con centro en el origen, vértice v1 sobre el eje de las abscisas y v2 simétrico con v3 respecto al mismo eje (vea la figura A1.1), las permutaciones anteriores pueden verse como operaciones de simetría. Así, I es la transformación idéntica, R es una rotación alrededor del origen con ángulo de 120°, R2 una rotación de 240° (o el resultado de aplicar R dos veces: R 2 = R  R ) y x es la reflexión del triángulo sobre el eje de las abscisas (v1 se queda fijo y v2 cambia con v3). Si el triángulo se refleja sobre la recta Ov2 , v2 se queda fijo y v1 cambia con v3; luego, y es la permutación que produce ese efecto. Finalmente, z es la operación que consiste en reflejar el triángulo sobre la recta Ov3 (figura A1.2).

v2

x

O

1 2 3  I =  1 2 3 

v3

Figura A1.1  Simetrías del triángulo.

y

y I

v2

Figura A1.2  Operación de

simetría del triángulo.

v3

O

v2

v2

x

O

v1

y X

v2

R2

v3

v3

x

y v3

R

v1

v1 O

y

y Y

v1

Z

x

v1 O

v3

x

v3

O

v2

y

v2

x

O

v1

y X

v3

Y

v2

O

Z

v1

v3

x

229

Anexo 1 y

v2

v1 O

x

v2

x

v1

O

x

v3

Figura A1.2  (continuación).

Los resultados de efectuar dos operaciones de manera consecutiva corresponden a los elementos de la tabla A1.3, en la que el lugar (i, j) (renglón i, columna j) es el resultado de aplicar primero la permutación j y después la i. Así, por ejemplo, el lugar Rx es el resultado de componer R con x, es decir, R ° x, que es z. En efecto, 1 2 3   Rx =  1 3 2  2 1 3  

O I R R2 x y z

I I R R2 x y z

R R R2 I y z x

x x z y I R2 R

y y x z R I R2

z z Y X R2 R I

Figura A1.3  Tabla de multiplicar de S3.

La figura A1.3 ilustra la tabla de multiplicar del grupo S3, que, como puede verse, no es abeliano (la tabla no es simétrica con respecto a su diagonal). Así, por ejemplo, xy = R es diferente de yx = R2. Entre todos los grupos no abelianos, S3 es el que tiene el menor número de elementos (su orden, 6, es menor que el de cualquier otro grupo no conmutativo). Además de ésta, S3 tiene otras propiedades algebraicas que hacen importante su estudio para la teoría de grupos del álgebra abstracta (o moderna).

Número de subconjuntos ¿Cuántos subconjuntos de dos letras se pueden formar con el conjunto de las vocales? Se puede tomar cualquiera de las cinco y hacerlas acompañar con cualquiera de las otras cuatro. La primera selección se puede realizar de cinco maneras y la segunda de cuatro. Así se producen las 20 ordenaciones posibles, que son las siguientes: (a, e), (a, i), …, (u, o), cada una de las cuales define al subconjunto de sus componentes. Los subconjuntos así definidos son los siguientes: {a, e}, {a, i}, …, {u, o}. Pero note que en este caso cada subconjunto está representado dos veces: {a, e}, = {e, a}, …, {o, u} = {u, o}, una por cada permutación de sus componentes. Luego, el número de las distintas parejas así formadas consta solamente de 10 elementos, a saber, el número de ordenaciones entre el de permutaciones. Recíprocamente, cada subconjunto de dos elementos produce dos ordenaciones, de manera que para obtener las 20 posibles son suficientes y bastan los 10 subconjuntos de dos letras. Aplicando estos razonamientos al caso general, puede concluirse que el número de subconjuntos con k elementos que se pueden formar a partir de un universo de n símbolos es igual al número de ordenaciones Okn entre el número de permutaciones de estos elementos, que es k! En resumen,

C nk =

R2 R2 I R z x y

n! Onk = k! (n − k )! k!

n En algunos textos (casi todos),   es el símbolo que se usa para representar las combinaciones k de n elementos tomados de k en k.  

Anexo 2 La función determinante Definición A2.1 Sea {Vi}i=1, …, n una familia de espacios vectoriales sobre un campo K de característica diferente de 2 (no todo elemento de K es autoinverso). Una función f: V1 × V2 × … × Vn → K es Vii, ∀ α ∈ K . lineal en el factor i del dominio si ∀ xi , yi ∈ V f (x1, , xi + α yi , , xn ) = f (x1, , xi ,, xn ) + α f (x1, , yi , , xn ) . Es decir, f abre sumas y saca escalares en el i-ésimo factor. f es n-lineal si es lineal en cada uno de los factores de su dominio (  f es lineal en cada i , i = 1,, n ).

Definición A2.2 Sea V1 = V2 = … = Vn = V, f:V × V × …× V → K, n-lineal. f es alternante si f (x–1, …, x–i, …, x–j, …, x–n) = 0 cuando x–i = x–j para algunas i y j (la función f vale cero cuando tiene dos coordenadas iguales en su dominio).

Corolario 1

f es alternante si ∀ i ,∀ j , i, j, ∈{1, ..., n} f (x1, , xi , , x j , , xn ) = − f (x1, , x j , , xi , , xn )

(Al intercambiar un vector por otro, f cambia de signo.) En efecto, considere f (x1, , xi + x j , , xi + x j , , xn ) = 0, ya que tiene dos coordenadas iguales. Entonces, 0 = f (x1, , xi , , xi , , xn ) + f (x1, , x j , , xi , , xn ) + f (x1, , xi , , x j , , xn ) + f (x1, , x j , , x j , , xn )

El primero y el cuarto sumandos son ceros. 0 = f (x1, , xi , , x j , , xn ) + f (x1, , x j , , xi , , xn ) Por lo tanto, f (x1, , xi , , x j , , xn ) = − f (x1, , x j , , xi , , xn )

Corolario 2 Si x–i es paralelo a x–j, entonces f (x–1, …, x–i, …, x–j, …, x–n) = 0. En efecto,

f (x1, , xi , , x j , , xn ) = f (x1, , xi , , kxi , , xn ) = k f (x1, , xi , , xi , , xn ) = 0 230

Anexo 2

231

f (x–1, …, x–i, …, x–j, …, x–n) = f (x–1, …, x–i, + kx–j, …, x–j, …, x–n)

Corolario 3

En efecto, f (x–1, …, x–i, + kx–j, …, x–j, …, x–n) = f (x–1, …, x–i, …, x–j, …, x–n) + kf (x–1, …, x–j, …, x–j, …, x–n) f (x– , …, x– , + kx– , …, x– , …, x– ) = f (x– , …, x– , …, x– , …, x– ) + k(0) 1

i

j

j

n

1

i

j

n

f (x–1, …, x–i, …, x–j, …, x–n) no se altera si a un vector se le suma un múltiplo de algún otro.

Si x–i es combinación lineal de otros, entonces f (x–1, …, x–i, …, x–n) = 0. Su demostración se deja como ejercicio.

Corolario 4

Definición A2.3 Sea Sn = {σ : {1, …, n} → {1, …, n}; σ es biyectiva}. Sn es el conjunto de todas las permutaciones de un conjunto de n elementos representados por sus índices (es decir, {a1, …, an} se denotará por {1, 2, …, n}). Una transposición es una permutación que sólo intercambia un índice por otro; por ejemplo, σ (1, 2, , i , , j , , n) = (1, 2, , j , , i , , n) es una transposición que algunas veces se denota como (i, j). σ ∈ Sn es una permutación par si el número de transposiciones que se requieren para pasar de (σ (1), σ (2), , σ (n)) a (1, 2, , n) es par. Una permutación que no es par se llama impar. 2  n  1 2  n   1 Una permutación σ (1) σ (2)  σ (n)  puede transformarse en   a partir de   1 2  n  diferentes series de transposiciones, pero la paridad en el número de transposiciones requeridas se conserva en todos estos procesos.* Es decir, la paridad de una permutación está bien definida.

 Teorema A2.1

Nota Observe que si tal función existe resulta única, ya que está completamente definida por este teorema.

Sea f :V × V ×  × V → K n-lineal, alternante.   n ¯ factores

n

dim V = n, β = { u1, u2 , , un } base de V. xi = ∑ ai j u j para cada i , i = 1, , n. j =1

n  n  Entonces, f (x1, , xn ) = f  ∑ a1 j u j , , ∑ an j u j  = ∑ (−1)σ a1σ(1) a2 σ(2) an σ(n) f (u1, , un ) j =1  j =1  σ ∈Sn

1 si σ es par en donde (−1)σ =   −1 si σ esimpar

Demostración n

Al desarrollar cada xi = ∑ ai j u j se obtiene: j =1

(

)

f (x1, …, xn ) = f a11 u1 +  + a1n un , …, an1 u1 +  + an n un .

* Herstein,

Topics in algebra.

232

Anexo 2

Se puede ver que al expandir las sumas anteriores, de acuerdo con la alternancia de f, sólo sobreviven n! factores, uno por cada σ ∈Sn , de lo que resulta que n  n  f  ∑ a1 j u j , , ∑ anj u j  = ∑ a1σ(1) a2σ(2)  anσ(n) f uσ(1) , , uσ(n) j =1  j =1  σ ∈Sn

(

)

n  n  f  ∑ a1 j u j , , ∑ an j u j  = ∑ (−1)σ a1σ(1) a2 σ(2) an σ(n) f (u1, , un ) j =1  j =1  σ ∈Sn

El argumento anterior se ilustra para el caso n = 2 de la manera siguiente: Sean

2

x1 = ∑ a1 j u j = a11u1 + a12 u2 j =1 2

x2 = ∑ a2 j u j = a21u1 + a22 u2 j =1

Entonces, 2  2  f (x1, x2 ) = f  ∑ a1 j u j , ∑ a2 j u j  = f (a 11u1 + a12 u2 , a21u1 + a22 u2 ) j =1  j =1 

f (x1, x2 ) = f (a11u1 , a21u1 + a22 u2 ) + f (a12 u2 , a21u1 + a22 u2 ) f (x1, x2 ) = f (a11u1 , a21u1 ) + f (a11u1 , a22 u2 ) + f (a12 u2 , a21u1 ) + f (a12 u2 , a22 u2 )

en donde el primero y el cuarto sumandos son ceros por tener coordenadas paralelas: a11u1 es paralelo a a21u1 y a12 u a11u1 es paralelo a a21u1 y a12 u2 es paralelo a a22 u2 , por lo que f (x1, x2 ) = f (a11 u1, a22 u2 ) + f (a12 u2 , a21 u1 ) f (x1, x2 ) = a11 a22 f (u1, u2 ) + a12 a21 f ( u2 , u1 ) = a11 a22 f (u1, u2 ) − a12 a21 f ( u1, u2 ) f (x1, x2 ) = (a11 a22 − a12 a21 ) f (u1, u2 )

(

)

f (x1, x2 ) = a1σ(1) a2 σ(2) − a1τ(2) a2 τ(1) f (u1, u2 ) en donde σ (1) = 1, σ (2) = 2, τ (1) = 2, τ (2) = 1, es decir, σ es la permutación idéntica y τ es la transposición (1, 2); obviamente, {σ , τ } = S2 .

Corolario 5

Si f :V × × V → K es alternante y β = { u1, u2 , , un } ×V   n ¯ factores

n

es base de V, y además f (u1, , un ) = 1; entonces, si cada xi = ∑ ai j u j , j =1

n  n  f (x1, , xn ) = f  ∑ a1 j u j , , ∑ anj u j  = ∑ (−1)σ a1σ(1) a2σ(2)  anσ(n) j =1  j =1  σ ∈Sn

Definición A2.4 Sea M n × n (K) el conjunto de las matrices n × n con coeficientes en un campo K de característica distinta de 2 y para cada M ∈ M n × n (K), A1, , An sus columnas.

Anexo 2

(

)

Sea D : M n × n (K) → K una función que, vista como D (M ) = f A1,, An , es n-lineal, alternante y tal que, evaluada en la matriz idéntica, es uno. Entonces, como se verá, tal función existe y, en vista del teorema A2.1, es única y se llama la función determinante.

Sobre la existencia de la función determinante La existencia de la función determinante se demostrará construyéndola (inducción sobre n).

Observación En vista de que para toda σ ∈Sn , −1 (−1)σ = (−1)σ (el signo de cada permutación es igual al signo de su permutación inversa), a1σ (1)  anσ (n) = a −1  a −1 , σ (1) 1 σ ( n) n

resulta que si A ∈ M n × n (K), entonces D (A) = D (At ).

Base n = 1

Si A = (a ), se define D (A) = a. Entonces,

1. D es 1-lineal

D (a + kb) = a + kb = D (a ) + kD (b) y 2. D(1) = 1 3. La propiedad de ser alternante se cumple por vacuidad. Por lo tanto, la función determinante existe para las matrices M1 × 1 (K).

Caso particular, n = 2 La conocida manera de definir el determinante de una matriz 2 × 2 es correcta. En efecto, sea a b  A=  . Entonces, c d  0  b  a b  a + 0 0 + b  0 a 0  0 b   a D = D = D + D = D + D       d  c d   c 0 + c d + 0 c d  c d  0 + c d + 0 a 0  a 0 0 b  0 b = D + D + D + D     = ad + 0 + 0 − bc = ad − bc 0 d  c 0 0 d  c 0 a 0 0 b  En efecto, ya que D  = D  =0 c 0 0 d  a 0  1 0 D = (ad ) D    = ad 0 d  0 1 0 b 0 1 1 0 D = bcD  = −bcD     = −bc c 0 1 0 0 1

Paso inductivo Definición A2.5 Para cada A ∈ M n × n (K) se define Ai j ∈ M( n −1) × ( n −1) (K) como la matriz que resulta de suprimir el i-ésimo renglón y la j-ésima columna en A, y su determinante se llama “el menor de aij”, que algunas veces se denota Mij. Suponga definida la función determinante D* : M( n −1) × ( n −1)(K) → K (hipótesis de inducción). Sea A ∈ M n × n (K). Se define, n

D (A) = ∑ (−1)i + j aij Mij j =1

(i fija )

233

234

Anexo 2

Como cada Mij = D*(Aij) es (n − 1)-lineal, alternante y D*(I) = 1, la función D así definida también resulta con las propiedades que se requieren, es decir, es n-lineal, alternante y D(I) = 1 y, por lo tanto, existe y es la única con esas propiedades. El desarrollo anterior se conoce como desarrollo del determinante por menores con respecto al renglón i-ésimo. Es independiente del renglón y, en vista de que D(A) = D(At), también puede calcularse desarrollándolo por menores de cualquier columna. El producto (−1)i+j Mij se conoce como el cofactor de aij y se denota como Cij .

Regla de Cramer Sean Ai, i = 1, …, n, vectores columna de dimensión n. B ∈ Kn, x1, …, xn ∈ K tales que x1A1 + … + xnAn = B. Entonces, ∀ i ,i = 1, , n, xi D (A1, , An ) = D( A1, , B , , An ) i -ésimo lugar

En efecto, D(A1, …, B, …, An) = D(A1, …, ∑xiAi, …, An) = D(A1, …, xiAi, …, An). Los otros términos de la suma son 0, ya que para cada uno de ellos hay dos columnas repetidas. Finalmente, D xi D A1,, An = D A1, , B, , An = Di , y si ∆ = D A1, , An ≠ 0, xi = i . ∆

(

)

(

)

(

)

Corolario 6    Si  a11x1 + a12 x2 +  + a1n xn = k1 a21x1 + a22 x2 +  + a2 n xn = k2  an1x1 + an 2 x2 +  + ann xn = kn aij, ki ∈ K es un sistema de ecuaciones lineales n × n (n ecuaciones, n incógnitas). A = (aij) es la matriz n × n formada por los coeficientes, B es el vector de los términos independientes, y el sistema puede escribirse x1A1 + x2 A2 +  + xn An = B , en donde cada Ai es una columna de A. Entonces, si ∆ = D (A) ≠ 0, la regla de Cramer puede utilizarse para encontrar la solución del sistema. Así, Di ∀i, xi = = ∆ que, como puede verse, tal solución es única. Aunque la regla de Cramer no es práctica (el cálculo de los determinantes no es fácil si n ≥ 4), tiene una consecuencia teórica importante. Si el sistema es homogéneo y, por lo tanto, B es el vector cero, cada Di resulta cero y entonces, si D (A) ≠ 0 , su única solución es x1 = x2 =  = xn = 0. Existen problemas en los que se requiere encontrar soluciones no triviales (distintas de x = 0 ) para ecuaciones de la forma Ax = kx , en donde A ∈ M n × n ( K), x = (x1, , xn ) ∈ K n , k ∈ K . Este problema es equivalente al de encontrar soluciones no triviales para la ecuación (A − kI ) x = 0 , que se puede ver como un sistema homogéneo de ecuaciones lineales n × n de matriz (A − kI ) . Luego, si se necesitan soluciones distintas a x = 0, D (A − kI ) debe ser necesariamente cero. Es decir,  a11 − k a12 a1n a21 a22 − k  a2 n =0     ann − k an1 an 2 que, como puede verse, es una ecuación de orden n en la variable k. Esta ecuación se llama la ecuación característica de A. Los valores de k que la resuelven se conocen como valores propios de A (eigen-valores), y los vectores x ≠ 0 que corresponden a cada valor propio son los vectores

Anexo 2

propios (eigen-vectores), de A, correspondientes a k. Si x es un vector propio correspondiente al valor propio k, cualquiera de sus múltiplos también lo es. En efecto, si Ax = kx , entonces, para cualquier escalar λ ≠ 0, λ Ax = A(λx ) = λ kx = k (λx ). Ejemplo A2.1 Cálculo de valores y vectores propios para una matriz cuadrada. 1 3  3 1 3 3 − k     1− k 1  Sea A =  1 1 1  ∴ A − I k =  1 3 1 5  3 1 5 − k     Entonces la ecuación característica A − kI = 0 es 3− k 1 3 1 1− k 1 = 0, 3 1 5−k

− k 3 + 9 k 2 − 12 k + 4 = 0. Una de sus raíces es k = 1.

Entonces, si k = 1, el sistema (A − kI ) x = 0 resulta 2x x 3x

+

y

+

y

+ + +

3z z 4z

= = =

0 0 0



x = −z y = −z z = z

una de cuyas soluciones, el vector propio correspondiente al valor propio k = 1, es (1, 1, −1). En efecto,

3 1 3

1 1 1

3 1 5

1 1 −1 1 1 −1

 1  3 1 3   1       En este ejemplo,  1 1 1   1 = (1) 1 .  −1  3 1 5   −1       Ejemplo A2.2 1  0 1 1  −k 1     Sea A =  1 0 1  ∴ A − I k =  1 − k 1  1 1 0  1 1 − k     A − kI = 0 es 1 −k 1 1 − k 1 = −(k − 2)(k + 1)2 = 0. Por lo tanto, los valores propios son 2 y −1. 1 1 −k Un vector propio correspondiente al valor propio k = 2 es (1, 1, 1). En efecto,

0 1 1

1 0 1

1 1 0

1 1 1 2 2 2

1  0 1 1  1       1 0 1 1 = 2 ( ) 1     1  1 1 0  1      

235

Anexo 3 Teoremas sobre funciones Sean f : A → B y g : B → C. Sean I el conjunto de las funciones inyectivas, S el de las suprayectivas y B el de las biyectivas; 1A es la función identidad en A y 1B la identidad en B. f , g ∈ I ⇒ g  f ∈ I; g  f ∈ I ⇒ f ∈ I f , g ∈ S ⇒ g  f ∈ S; g  f ∈ S ⇒ g ∈ S f ∈ I ⇒ ∃ h : B → A; h  f = 1A f ∈ S ⇒ ∃ h : B → A; f  h = 1B f  g = f h ∧ f ∈I ⇒ g = h

T.1 T.2 T.3 T.4 T.5 T.6

g f = h f ∧ f ∈S ⇒ g = h f ∈ B ⇔ ∃ h : B → A; h  f = 1A ; f  h = 1B

T.7

(h = f −1,

h −1 = f

)

Demostraciones de los teoremas   Teorema A3.1 f

g

Sean A → B → C funciones. Si f, g ∈II, entonces g  f también, y si g  f ∈ I , entonces f ∈ I g no necesariamente.

Demostración 1. Sean a, b ∈ A ∋ g  f ( a ) = g  f ( b )

Por demostrar a = b. g  f ( a ) = g  f ( b ), es decir, g ( f (a )) = g ( f (b)); por lo tanto, f (a ) = f (b) (ya que g es inyectiva). Finalmente, a = b (  f también es inyectiva). 2. Sea g  f ∈ I Por demostrar f ∈ I Sean a, b ∈ A; f ( a ) = f ( b ) ∴ g ( f ( a )) = g ( f ( b )) e.d. g  f (a ) = g  f (b) ∴ a = b ( g  f es inyectiva).

  Teorema A3.2 f

g

Sean A → B → C funciones. Si f, g ∈ S, entonces g  f también, y si g  f ∈ S , entonces g ∈ S, f no necesariamente.

Demostración 1. Sean f, g como antes y c ∈ C .

Por demostrar ∃a ∈ A ∋ g  f (a ) = c c ∈ C ⇒ ∃b ∈ B ∋ g (b) = c (ya que g es suprayectiva). 236

b ∈ B ⇒ ∃a ∈ A ∋ f (a ) = b (ya que f también es suprayectiva) ∴ g  f (a ) = g (b) = c

237

Anexo 3

Es decir, g  f (a ) = c. 2. Sea g  f ∈ S y c ∈ C.

Por demostrar ∃b ∈ B ∋ g (b) = c g  f ∈ S ⇒ ∃a ∈ A ∋ g  f (a) = c

g  f (a) = g ( f (a))

bautizo: f (a ) = b, b es el elemento cuya existencia se tenía que demostrar.

f

g

Corolario 1   Sean A → B → C funciones. Si f, g son biyectivas, entonces g  f también, y si g  f es biyectiva, entonces f es inyectiva y g suprayectiva.

La figura A3.1 representa tres conjuntos (A, B, C ) y dos funciones:   (f : A → B y g: B → C), en donde A = {a}, B = {b1, b2} y C = {c}. Note que 1.  g  f es inyectiva. f es inyectiva pero g no. 2.  g  f suprayectiva. g es suprayectiva pero f no. 3.  g  f biyectiva. f es inyectiva y g es suprayectiva.   Teorema A3.3

b2 f a g º f (a) = c

g b1

Figura A3.1  Composición de funciones.

Sea f : A → B, f ∈ I. Entonces ∃g : B → A ∋ g  f = 1A. (Las funciones inyectivas tienen inverso izquierdo.)

Demostración Sea a0 ∈ A. Se define para b ∈ A: o tal que f (a ) = b. g (b) = a a, si b ∈ f (A), y a ∈ A es el único elemento  g (b) =  a , si b ∉ f ( A)  0 Entonces, ∀a ∈ A, g  f (a ) = a, es decir, g  f = 1A. 

  Teorema A3.4 Sea f : A → B, f ∈ S. Entonces ∃g : B → A ∋ f  g = 1B. (Las funciones suprayectivas tienen inverso derecho).

Demostración Puesto que g es suprayectiva, para cada b ∈ A, f −1 (b) ≠ ∅ . Se selecciona a tal que a ∈f−1(b) (axioma de selección) y se define g(b) = a. Entonces ∀b ∈ A, f  g (b) = f (a ) = b . Atención: a ∈ f −1 (b) si y sólo si f (a) = b.

En el diagrama de la figura A3.2 se muestra una función f que tiene inverso izquierdo que no es derecho y otra función g que tiene inverso derecho que no es izquierdo, en donde A = {a}, B = {b1, b2}.

c

238

Anexo 3

b2

b2 g

f a

b1

f a

b1

Figura A3.2  Composición de funciones.

Note que g  f = 1A, pero que f  g ≠ 1B. Por ejemplo, sean A = N el conjunto de los números naturales. B = Q #  el conjunto de los números racionales no negativos. i # N →Q la inmersión i(n) = n. # [] Q → N la función mayor entero [q] = k, ∀ q ∈ Q # si k ≤ q < k + 1. Entonces la cadena i i [] N → Q#  →N → Q#

muestra que [ ]  i es la identidad en N, pero i  [ ] no es la identidad en Q # . Es decir, i es inverso derecho pero no izquierdo, y [ ] es inverso izquierdo pero no derecho.   Teorema A3.5 Sean h, g : A → B, f : B → C , f  h = f  g y f  inyectiva. Entonces, h = g. (Las funciones inyectivas se pueden cancelar por la izquierda.)

Demostración En efecto, sea a ∈ A. Por demostrar: h(a) = g(a). Como f  h = f  g, f  h (a) = f  g (a) ∴ f (h (a)) = f (g (a)) ∴ h (b) = g (a), ya que f es inyectiva.

  Teorema A3.6 Sean h, g : B → C , f : A → B ∋ h  f = g  f y f suprayectiva. Entonces, h = g. (Las funciones suprayectivas se pueden cancelar por la derecha.) Sea b ∈ B. Se debe demostrar h(b) = g(b).

Demostración Como g es suprayectiva, ∃ a ∈ A ∋ g (a ) = b, y puesto que h  f = g  f , h  f (a ) = g  f (a ) , es decir, h (b) = g (b).

Corolario 2  Las funciones biyectivas se pueden cancelar por la derecha y por la izquierda.   Teorema A3.7 Sea f : A → B biyectiva si y sólo si f tiene inversa (es decir, si y sólo si existe una función g : B → A tal que g  f = 1A y f  g = 1B ).

Demostración ⇒ Como f es biyectiva, es inyectiva y suprayectiva; por lo tanto, ∃h, g : B → A ∋ g  f = 1A ∧ f  h = 1B .

Anexo 3

Se demostrará que h = g, usando la asociatividad para la composición de funciones. En este caso, g  ( f  h) = ( g  f )  h . Entonces, ya que g  ( f  h) = g  1B = g y ( g  f )  h = 1A  h = h , resulta g = h, y, por lo tanto, g = h = f −1 . Note que g  1B (b) = g (1B (b)) = g (b) ∴ g  1B = g; análogamente, ⇐

1A  h (b) = 1A (h (b)) = h (b) Se supone ∃ f −1: B → A ∴ f −1  f = 1A ∴ f ∈ I ∴ f es biyectiva.

f  f −1 = 1A ∴ f ∈ S

(T.1) (T.2)



Funciones inducidas por una función Sea f : A → B una función. Entonces  f  induce dos funciones (que por abuso de notación se conocen como f y f −1). f :℘(A) →℘(B ), f −1 : ℘(B ) →℘(A) definidas: ∀ E ⊂ A, f (E ) = { f (x) ∈ B; x ∈ E} ∀ F ⊂ B, f −1 (F ) = {x ∈ A; f (x) ∈ F } Note que las funciones que se estudian en esta sección son las mismas que se usaron en la demostración del teorema A3.4.   Teorema A3.8 Sea f : A → B una función y f −1 : ℘(B ) →℘(A). Entonces ∀ E1, E2 ∈℘(B ), es decir, E1 y E2 ⊂ B: i) f −1 (E1 ∪ E2 ) = f −1 (E1 ) ∪ f −1 (E2 ) ii) f −1 (E1 ∩ E2 ) = f −1 (E1 ) ∩ f −1 (E2 ) C iii) f −1 E C =  f −1 (E )

( )

Demostración i) x ∈ f −1 (E1 ∪ E2 ) ⇔ f (x) ∈ E1 ∪ E2 ⇔ f (x) ∈ E1 o f (x) ∈ E2 ⇔ x ∈ f −1 (E1 ) o x ∈ f −1 (E2 ) ⇔ x ∈ f −1 ( E1 ) ∪ f −1 (E2 )

ii) x ∈ f −1 (E1 ∩ E2 ) ⇔ f (x) ∈ E1 ∩ E2 ⇔ f (x) ∈ E1 y f (x) ∈ E2 ⇔ x ∈ f −1 (E1 ) y x ∈ f −1 ( E2 ) ⇔ x ∈ f −1 ( E1 ) ∩ f −1 ( E2 )

( )

iii) x ∈ f −1 E C ⇔ f (x) ∈ E C ⇔ x ∉ f −1 ( E ) ⇔ x ∈  f −1 ( E )

C

El teorema anterior demuestra que la función inversa se comporta “bien” en relación con la unión, la intersección y el complemento, mientras que la función directa no, lo que se ilustra con el siguiente contraejemplo. Sea f : C → R definida como f (z ) = z . Es decir, si z = a + bi = (a, b), z = a 2 + b2 . A = {(0, b); b ∈ R} y B = {(a, 0); a ∈ R}. Entonces, f (A) = f (B ) ∈ R + ∪ {0} A ∩ B = {(0, 0)}, por lo tanto, f (A ∩ B ) = {0} ≠ f (A) ∩ f (B).

239

Anexo 4 Relaciones Entre las ideas intuitivas que se tienen con referencia a los conjuntos está la de relación. Por ejemplo, entre el de los hombres está la de ser hermano de, que cumplen Caín y Abel, que relaciona a Rómulo y Remo, y en general a cualquier persona con su hermano. En su Teoría intuitiva de los conjuntos, Halmos ejemplifica una situación semejante (formalizar una relación entre los elementos de dos conjuntos) hablando de algo como el matrimonio entre hombres y mujeres, en donde dice que si el señor h estuviera casado con la señora m, la pareja ordenada (h, m) podría describir esta situación, y que si se considera el conjunto de todas las parejas (hombre, mujer) que están casados, tal conjunto definiría completa, precisamente, la relación matrimonio, en este contexto, aun cuando se ignore lo que significa estar casado. Esto suena bien, porque la teoría de conjuntos desarrollada en este libro se conoce razonablemente, y en cambio la relación matrimonio no está formalizada, porque después de todo, ¿qué significa estar casado? Para algunos consiste en firmar un acta; para otros, recibir la bendición de algún ministro religioso; para los gitanos, romper una olla; para otros, vivir juntos; para los antiguos romanos, comer un pastel de trigo frente a testigos; y aunque frecuentemente se dice que el matrimonio es como el demonio, el concepto demonio tampoco está formalizado. Asimismo, algunos autores, ante la dificultad de precisar lo que es el color rojo, que se supone bien conocido, sugieren que se llame rojo al conjunto de todas las cosas de ese color con la intención de transformar un concepto no formalizado en un conjunto. Así, se diría que un objeto es rojo si pertenece a ese conjunto y sólo en ese caso. Entre los elementos de dos conjuntos A y B es común encontrar cierta liga que se quisiera formalizar. Por ejemplo, suponga que A y B son conjuntos de números y que se cuenta con una caja negra η, tal que cada vez que entra en ella un elemento a de A, lo transforma en otro b de B, y que se ha realizado el experimento de meter en η un conjunto de elementos de A (una o varias veces cada número) y se anota en una tabla la salida que corresponde a cada entrada. Resulta claro que la colección de todas las parejas entrada-salida de la tabla describe completamente el experimento, aunque quizá se desconocieran las reglas, que pudieran ser totalmente aleatorias, con las que la caja transformó un elemento en otro. Siguiendo esta línea de ideas se puede definir una relación ℜ entre los elementos de un conjunto A con los de otro B, como la colección de todas las parejas ordenadas (a, b) tales que a es un elemento de A que tiene la relación ℜ con el elemento b de B. Así, la relación caracteriza al conjunto de parejas y esto permite asociar una idea intuitiva (vaga) con un objeto bien definido de la teoría de conjuntos. Cuando se procede de esta manera, cada relación no es otra cosa que un subconjunto del producto A × B.

Definición A4.1 Una relación binaria ℜ de A en B es un subconjunto del producto cartesiano A × B, es decir, ℜ ⊂ A × B . Si (a, b) está en ℜ, se dice que a está en la relación ℜ con b (o que ℜ está relacionada con b), y se denota a ℜ / b. Si no es así, (a, b) ∉ ℜ es porque a no está ℜ relacionada con b, y la notación usual para este caso es aℜb. A partir de la precedente surgen, de manera natural, las tres definiciones siguientes: 1. Si ℜ ⊂ A × B en una relación de A en B, el conjunto de todos los primeros miembros de los

elementos de ℜ se llama el dominio de la relación.

2. La colección de todas las segundas coordenadas (los segundos miembros de las parejas de ℜ)

240

es el rango o codominio de ℜ.

Anexo 4

3. La colección de todas las parejas, en orden inverso, es la relación inversa de ℜ.

Explícitamente, sea ℜ ⊂ A × B una relación de A en B. Entonces,

i) el dominio de ℜ, Dℜ = {a ∈ A; (a, b) ∈ ℜ} . ii) el codominio de ℜ, Rangoℜ = {b ∈ B; (a, b) ∈ ℜ} . iii) la relación inversa de ℜ, ℜ−1 = {(b, a ) ∈ B × A; (a, b) ∈ ℜ} . Es importante considerar el caso particular en que A es igual a B. Se dice que ℜ ⊂ A × A es una relación en A; por ejemplo, ser menor que, ser igual a o ser mayor que son relaciones en cualquier conjunto ordenado. Entre las propiedades importantes que puede tener una relación ℜ en A se definen las siguientes.

Definición A4.2 Sea ℜ ⊂ A × A una relación en A. i) ℜ es reflexiva si y sólo si ∀ a ∈ A, a ℜa; (a, a ) ∈ ℜ. ii) ℜ es simétrica si y sólo si ∀ a, b ∈ A, a ℜb ⇒ b ℜa . iii) ℜ es antisimétrica si y sólo si ∀ a, b ∈ A, a ℜb ∧ b ℜa ⇒ a = b. iv) ℜ es transitiva si y sólo si ∀ a, b, c ∈ A, a ℜb ∧ b ℜc ⇒ a ℜc. v) ℜ obedece la ley de tricotomía si y sólo si ∀ a, b ∈ A, a ℜb, a = b o b ℜa , pero sólo una de ellas.

Relaciones de orden Se dice que ℜ es de orden parcial si y sólo si es reflexiva, antisimétrica y transitiva, y si además obedece a la ley de tricotomía (cualesquiera dos elementos de A se pueden comparar), el orden se llama total, lineal o completo. Los conjuntos en los que está definida una relación de orden se llaman conjuntos parcialmente ordenados o COPOS. Cuando la relación de orden es lineal se dice que A está totalmente (o linealmente o completamente) ordenado por la relación, o bien que la relación ℜ es un orden lineal para A. La más importante de las relaciones de orden parcial es la de contención entre conjuntos. A está relacionada con B si y sólo si A ⊂ B , y entre los ejemplos más conocidos de relaciones de orden lineal está la relación menor o igual para los naturales, los enteros, los racionales o los reales. De las relaciones de orden se derivan las relaciones siguientes: Sea {A, ≤} un conjunto parcialmente ordenado y B ⊂ A. i) x ∈ B es el elemento mayor de B si y sólo si ∀ b ∈ B, b ≤ x (obviamente, si B tiene elemento mayor, este es único). ii) y ∈ B es el elemento menor de B si y sólo si ∀ b ∈ B, y ≤ b (que también es único). iii) z ∈ B es un elemento máximo de B si no hay en B ningún elemento mayor que z, es decir, ∀ b ∈ B, z ≤ b ⇒ z = b. Cuando B tiene elemento mayor, este es el único máximo; pero en general, puede haber varios elementos máximos en un conjunto (vea el ejemplo A.4.2). iv) w ∈ B es un elemento mínimo de B si no hay en B ningún elemento menor que w, es decir, ∀ b ∈ B, b ≤ w ⇒ b = w . Como en el caso anterior, si B tiene elemento menor, este es el único mínimo, pero si B no tiene elemento menor, puede haber en él más de un mínimo. v) c ∈ A es una cota superior de B si ∀ b ∈ B, b ≤ c. Si c es una cota superior de B, cualquier d ≥ c también es cota superior. Cuando una cota superior es la menor de todas, se llama el supremo de B. vi) g ∈ A es una cota inferior de B si y sólo si ∀ b ∈ B, g ≤ b. Cuando existe una cota inferior mayor a todas las demás, se llama el ínfimo de B. Note que cuando el supremo y el ínfimo de B existen, son únicos. vii) Un subconjunto C de A es una cadena, si con el orden de A restringido a C, C resulta totalmente ordenado.

241

242

Anexo 4

La relación divide a Sea A = N el conjunto de los números naturales. Se define ∀ n, m ∈ N, n ℜm, si n divide a m; es decir, n ℜm si y sólo si existe k ∈ N tal que k n = m. La notación usual para esta relación es n m, que dice que n está relacionado con m si y sólo si n es un divisor de m o, equivalentemente, que m es un múltiplo de n. Así, 2 8, ya que existe 4 ∈ N y 4 · 2 = 8. 2 3 , ya que ∀ n ∈ N, 2 n ≠ 3 Observe que ∀ n ∈ N, n 0, ya que 0 ∈ N y 0 n = 0, en particular 0 0. Note que no se trata de una división, sino de la definición de una relación en N.   Teorema A4.1 La relación ℜ es de orden parcial.

En efecto, ∀ n, m, k ∈ N, se cumple que: i) n n (existe 1∈ N y 1 · n = n ) ii) n m ∧ m n ⇒ n = m . En efecto, n m ⇒ ∃ k ∈ N∋ k n = m y m n ⇒ ∃l ∈ N∋ l m = n. Al combinar estas ecuaciones resulta que kln = n. Entonces, si n = 0, m = k n = k 0 = 0, y por lo tanto, n = m. Si n ≠ 0, se puede cancelar de la igualdad kl n = n, entonces kl = 1, lo que en N implica que k = l = 1 y, por lo tanto, n = m. iii) n m ∧ m l ⇒ n l. En efecto,

n m ⇒ ∃ k ∈ N∋ k n = m m l ⇒ ∃ j ∈ N∋ j m = l , por lo tanto, ( j k ) n = l , es decir, n l. A continuación se ilustra la relación divide a con dos ejemplos interesantes.

Ejemplo A4.1 Considere el conjunto B = {0, 1, 2, , 20} ⊂ N. Entonces, con la relación anterior divide a: i) 0 es el elemento mayor de B (0 es múltiplo de cualquier elemento de B. Recuerde que todo número natural divide a cero, es decir, ∀n ∈ N, n 0). ii) 1 es el elemento menor de B (1 divide a cualquier elemento de B).

Ejemplo A4.2 Sea C = {2, 3, 4,, 20} ⊂ N con la misma relación. Entonces C no tiene elemento mayor (ningún elemento de C es múltiplo de todos) ni elemento menor (ninguno de ellos divide a todos). Los números 2, 3, 5, 7, 11, 13, 17, 19 son mínimos (no tienen divisores en C). Los números 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 son máximos (no tienen múltiplos en C). D = {1, 2, 4, 16, 0} es una cadena en B. E = {3, 9}, {5}... son cadenas tanto en B como en C. 0 es el supremo de B y es su única cota superior.

Anexo 4

1 es el ínfimo de B y de C (y es su única cota inferior). 20! es una cota superior de C, pero no es el supremo. El supremo de C es mínimo común múltiplo de sus elementos, a saber: 2 4 × 32 × 5 × 7 × 11 × 13 × 17 × 19 = 232 792 560. Ejercicio A4.1

Sea F = { f : D f ⊂ R → R}. Se define

f ≤ g si y sólo si D f ⊂ Dg y g (x) = f (x) ∀ x ∈ D f

Demuestre que ≤ es una relación de orden. ¿Es lineal?

Relaciones de equivalencia Sea ℜ ⊂ A × A una relación. Se dice que ℜ es una relación de equivalencia en A si y sólo si ∀ a, b, c ∈ A : i) (a, a ) ∈ ℜ (a ℜa ). Propiedad reflexiva. ii) (a, b) ∈ ℜ ⇒ (b, a ) ∈ ℜ (a ℜ b ⇒ b ℜa ). Propiedad simétrica. iii) (a, b) ∧ (b, c ) ∈ ℜ ⇒ (a, c ) ∈ ℜ (a ℜb ∧ b ℜc ⇒ a ℜc ). Propiedad transitiva. Ejemplo A4.3 Para todo conjunto A, la relación de igualdad es de equivalencia. En efecto, las propiedades básicas de esta relación garantizan que ∀ a, b, c ∈ A : a=a a=b ⇒ b=a a=b ∧ b=c ⇒ a=c Ejemplo A4.4 A es un conjunto de triángulos en el plano. Para T1 y T2 , elementos de A se define T1 ≈ T2 si y sólo si son semejantes; es decir, tienen sus ángulos relacionados, congruentes entre sí (de igual medida). Ejemplo A4.5 Sea A = N × N . Se define

(a, b) ≈ (c, d ) si y sólo si

a + d = b + c.

Ejemplo A4.6 Sea B = Z × Z* ; Z* = Z − {0} . Se define

(a, b) ≈ (c, d ) si y sólo si

ad = bc.

Ejemplo A4.7 Sea A = Z (los enteros) y m un número entero positivo. Se define a ≡ b (mod m ) si y sólo si m (a − b) (ambos dejan igual residuo al dividirse entre m).

243

244

Anexo 4

Ejemplo A4.8 Sea A = N. Se define n ≈ m si y sólo si en la escritura usual ambos terminan con el mismo dígito.

Relaciones de equivalencia y particiones Las particiones de un conjunto surgen del deseo de formalizar lo que sería una clasificación (perfecta) de sus elementos. Es una asignación de éstos en diferentes cajones (subconjuntos de A), de manera que ningún cajón quede vacío y que para cada elemento del conjunto exista un único cajón al que pertenece. Con este objeto se da la siguiente definición.

Definición A4.3

Sea A un conjunto. Una familia {Ai }i ∈I de subconjuntos de A es una partición de A si y sólo si 1. Ai ≠ ∅ ∀ i ∈ I (cada Ai es no vacío). 2.  Ai = A (la unión de la familia es todo A). i ∈I

3. Ai ≠ Aj ⇒ Ai ∩ Aj = ∅ 4. Ai ∩ Aj ≠ ∅ ⇒ Ai = Aj

o por contrapuesta. (los elementos de la familia son ajenos 2 a 2).

Una aplicación importante de las relaciones de equivalencia tiene que ver con su conexión con las particiones, lo que está contemplado en el siguiente teorema.   Teorema A4.2 Toda relación de equivalencia en un conjunto permite definir una partición de éste y, recíprocamente, toda partición permite definir una relación de equivalencia.

Demostración ⇐ Sea {Ai }i ∈I una partición de A. Se define para a, b ∈ A. a ℜb si y sólo si existe algún Ai en la familia, tal que tanto a como b estén en él. Entonces 1. ∀ a ∈ A, A =  Ai implica que existe algún Ai tal que a está en él. Evidentemente, a está i ∈I

en el mismo conjunto Ai que él mismo, es decir, ∀ a ∈ A, a ℜa . 2. a ℜb quiere decir que a y b están en el mismo Ai de la familia, luego b y a están en él (a ℜb ⇒ bℜa). 3. Finalmente, a ℜb ∴ ∃i ∈ I∋ a, b ∈ Ai , b ℜc dice que b y c están en algún Aj ∴ b ∈ Ai ∩ Aj . Luego Ai = Aj, por lo que a y c están en el mismo conjunto, es decir, a ℜc (a ℜb ∧ b ℜc ⇒ a ℜc ). Dado que ℜ satisface las propiedades reflexiva, simétrica y transitiva, resulta de equivalencia y es la relación inducida por la partición {Ai }i∈I . ⇒ Sea A un conjunto y ℜ ⊂ A × A una relación de equivalencia. Se define para cada a ∈ A, Aa = {b ∈ A; a ℜb} . Entonces {Aa }a ∈A es una partición de A (la inducida por ℜ ). En efecto, 1. ∀ a, a ℜa ( ℜ es reflexiva) ∴ a ∈ Aa . Luego, Aa ≠ ∅.

Anexo 4

2. Por la misma razón, si a ∈ A, a ∈  Aa ∴ A ⊂  Aa . Obviamente,  Aa ⊂ A, ya que a ∈A

cada Aa es subconjunto de A ∴ A =  Aa .

a ∈A

a ∈A

a ∈A

3. Suponga que Aa ∩ Ab ≠ ∅. P.D. Aa = Ab .

Sea c ∈ Aa ∩ Ab ∴ a ℜc (y c ℜa ). También b ℜc y c ℜb. Luego de a ℜc y c ℜb, a ℜb (y b ℜa ). Ahora, sea x ∈ Aa ∴ a ℜx, y como b ℜa, resulta b ℜx, es decir, x ∈ Ab ∴ Aa ⊂ Ab . Análogamente se prueba que Ab ⊂ Aa y, por lo tanto, Aa = Ab . Cuando se construye una partición a partir de una relación de equivalencia en A, los elementos de la partición (los subconjuntos Ai , i ∈ I ) forman a su vez un conjunto que se conoce como el conjunto cociente, módulo la relación, y si esta última es ℜ, el mencionado conjunto se denota A / ℜ. A los elementos de este conjunto se les llama también clases de equivalencia y cada uno de sus elementos es un representante de su clase.

Tres ejemplos importantes

{(a, b); a, b ∈ N} . Se establece en Z (a, b) ≈ (c, d ) si y sólo si a + d = b + c. Se puede ver que la relación así definida es de equivalencia y el conjunto cociente se define como Z, el conjunto de los enteros. Por ejemplo, el 2 ∈ Z es {(2, 0), (3, 1), , (n + 2, n), } . Cada pareja es un representante del 2.

1. Sea  = N × N =

*

2. Sea Q = Z × Z (Z* es el conjunto de los enteros Z, menos el cero).

Se define en Q, (a, b) ≈ (c, d ) si y sólo si ad = bc que resulta de equivalencia. El conjunto Q de los números racionales es el conjunto cociente Q/ ≈. Por ejemplo, 1 = 1, 2 , 2, 4 , 3, 6 , , n, 2 n ,  ) } {( ) ( ) ( ) ( 2 − 1 = {(−1, 2), (−2, 4), (−3, 6), , (− n, 2 n), } 2 y cada pareja es un representante de su clase.

3. Sean Z el conjunto de los enteros y m un entero positivo. Se define a ≡ b ( m ) si y sólo si m (a − b)

(condición que es equivalente a pedir que a y b dejen igual residuo al dividirse entre m). La congruencia módulo m resulta también una relación de equivalencia en Z. Las clases de equivalencia (elementos del conjunto cociente) se llaman clases residuales módulo m. Por ejemplo, si m = 3, Z/ ≡ = {0, 1, 2} , que son los residuos positivos que resultan al dividir un entero entre tres, entonces

0 = {, − 6, − 3, 0, 3, 6, , 3n, }

(Residuo cero)



1 = {, − 5, − 2, 1, 4, 7, , 3n + 1, }

(Residuo uno)



2 = {, − 4, − 1, 2, 5, 8, , 3n + 2, }

(Residuo dos)

Una representación de relaciones Considere el rectángulo ABCD en el que los puntos del segmento AB representan a los elementos de un conjunto X y los del segmento AD al conjunto Y. Entonces el rectángulo es una manera de representar al producto cartesiano X × Y. Si, por ejemplo, el punto P tiene coordenadas a y b en el rectángulo, P es la representación de la pareja (a, b) del producto cartesiano. En este contexto, una relación ℜ de X en Y, ℜ ⊂ X × Y , corresponde al subconjunto del rectángulo que incluye las coordenadas de toda pareja ℜ relacionada. Cuando ℜ es una relación en A, (ℜ ⊂ A × A), el rectángulo al que se refiere el párrafo anterior es un cuadrado, y en él la propiedad reflexiva de una relación ℜ corresponde a la condición de que el subconjunto que la representa contenga a la diagonal AC. La propiedad simétrica de

245

246

Anexo 4

ℜ, ((a, b) ∈ ℜ ⇒ (b, a ) ∈ ℜ), dice que la gráfica debe ser simétrica con respecto a la antes referida diagonal. Con la convención anterior, la relación de equivalencia más pequeña en el sentido de la contención es la igualdad, ya que la diagonal tiene que estar contenida en el dibujo de cada gráfica de una relación de equivalencia. (∀ a ∈ A, (a, a ) ∈ ℜ), mientras que la mayor de todas las antes mencionadas relaciones es la relación total A × A .

Ejercicio A4.2

Demuestre que todas las relaciones definidas en los ejemplos son de equivalencia y encuentre la partición que cada una de ellas induce.

Anexo 5 Transformaciones lineales Sean U y V espacios vectoriales sobre el mismo campo. La colección de todas las transformaciones lineales de U en V se denota L (U, V). Cuando U = V, L (U, V) se abrevia L (U).   Teorema A5.1

L (U, V) es un espacio vectorial sobre el campo K, con las operaciones de suma y multiplicación por un escalar definidas como 1. (S + T )(u ) = S (u ) + T (u )

y 2.

(αS )(u ) = αS (u ) T ∈ L (U, V ), ∀α ∈ K, ∀u ∈ U Demostración

1.

{L (U, V), +} (es decir, L (U, V) con la suma) es un grupo abeliano. La suma es asociativa: ∀u ∈ U ,

[(S + T ) + U ] (u ) = (S + T )(u ) + U (u )

= (S (u ) + T (u )) + U (u )



= S (u ) + (T (u ) + U (u ))



= S (u ) + (T + U )(u )



= [S + (T + U )](u )

∴ (S + T ) + U = S + (T + U ) . Existe el neutro: O (u ) = 0 ∀ u ∈ U,

[S + O](u ) = S (u ) + O (u ) = S (u ) + O (u ) = S (u ) + 0

= S(u ) ∴ S + O = S.

Cada elemento S tiene su inverso aditivo −S definido S (−u ) = −S (u ) ∀ u ∈ U,

[S + (−S )](u ) = S ( u ) − S ( u ) =0 = O (u ) ∴ S + (−S ) = O . 247

248

Anexo 5

La suma conmuta:

∀ u ∈ U,

[S + T ](u ) = S ( u ) + T ( u )

= T (u ) + S(u )



= [T + S ](u ) ∴

S + T = T + S.

2. La multiplicación por escalares cumple con las propiedades:

[(αβ )S](u ) = (αβ )S (u )

= S ((αβ ) u )



= S (α (β u ))



= αS (β u )



= α (βS (u ))



= [α (βS )](u ) ∴

(αβ )S = α (βS ) .

[(α + β )S](u ) = (α + β )S (u )

= S ((α + β ) u )



= S (αu + β u )



= S (αu ) + S (β u )



= αS (u ) + βS (u )



= (αS )(u ) + (βS )(u )



= [αS + βS ](u )

∴ (α + β )S = αS + βS.

[α (S + T )](u ) = α (S + T )(u )

= α (S (u ) + T (u ))



= α (S (u )) + α (T (u ))



= (αS )(u ) + (αT )(u )



= (αS + αT )(u )

∴ α (S + T ) = αS + αT .

[1S](u ) = 1S (u ) = S (u )



1S = S.

Anexo 5

A continuación se presenta una demostración de que la multiplicación por un escalar de transformaciones lineales es lineal y la suma también.

[αS](β u ) = α (S (β u ))

= α (βS (u ))



= (αβ )(S (u ))



= ( β , α ) (S (u))



= β (α (S (u )))



= β ([αS ](u ))   (saca escalares)

[αS](u + v ) = α (S (u + v ))

= α (S (u ) + S (v ))



= α (S (u )) + α (S (v ))



= [αS ](u ) + [αS ](v )   (abre sumas)

[S + T ](u + v ) = S (u + v ) + T (u + v )

= S (u ) + S (v ) + T (u ) + T (v )



= S (u ) + T (u ) + S (v ) + T (v )



= [S + T ](u ) + [S + T ](v ) (abre sumas)

[S + T ](αu ) = S (αu ) + T (αu )

= αS (u ) + αT (u )



= α (S (u ) + T (u ))



= α ([S + T ](u )) (saca escalares)

Núcleo o kernel e imagen de una transformación lineal Definición A5.1 Sea T ∈ L (U, V). Ker (T ) = {u ∈ U : T (u ) = 0} se llama el núcleo o kernel de T;

T (U) = {T (u ) ∈ V : u ∈ U} se llama la imagen de T.   Teorema A5.2 Sea T ∈ L (U, V). Entonces, 1. 2. 3. 4.

T ( 0w ) = 0v T (−u ) = −T (u ) Ker w (T ) es un subespacio de U. T (U) es un subespacio de V.

249

250

Anexo 5

Demostración

()

(

)

()

()

1. T 0 = T 0 + 0 = T 0 + T 0

0 + T (0) = T (0) + T ( 0 )

Al cancelar, 0 = T ( 0).

()

2. 0 = T 0 = T (u − u ) = T (u + ( − u )) = T (u ) + T (− u )

∴ T (−u ) = −T (u ).

3. T (u ) = 0 ∴ 0 ∈ Ker (T)

Sean u , v ∈ Ker (T ); por lo tanto, T (u ) = 0 y T (v ) = 0 T (u + v ) = T (u ) + T (v ) = 0 + 0 = 0 ∴ (u + v ) ∈ Ker (T ).

Sea α ∈ K T (αu ) = αT (u ) = α 0 = 0 ∴ αu ∈ Ker (T ).

()

4. T 0 = 0 ∴ 0 ∈ T (U) .

 ean v1, v2 ∈ T (U); por lo tanto, existen u1, u2 ∈ U tales que T (u1 ) = v1 y T (u2 ) = v2 . S Entonces T (u1 + u2 ) = v1 + v2 en T (U).

Sea α ∈ K . Entonces αu ∈ K , y, por lo tanto, T (αu ) = αv ∈ T (U). Lema A5.1 Sean T ∈ L (U, V) y U de dimensión finita n,

{v1, , vn} ⊂ T (U), {x1, , xn} ∋ T (xi ) = vi , i = 1,..., n . Entonces, {v1, , vn } linealmente independiente implica {x1, , xn } linealmente independiente. Demostración

n  n  n Sea 0 = ∑ ai xi . Entonces T ( 0) = 0 = T  ∑ ai xi  = ∑ ai vi ; por lo tanto, cada ai = 0. i =1  i =1  i =1

Corolario 1

dim T (U) ≤ dim U = n .

  Teorema A5.3 n = dim Ker (T ) + dim T (U). Sean {x1,  , xr } base de Ker (T ), {y1, , ys } base de T (U), {u1,  , us } ⊂ U, T (ui ) = yi . Entonces β = {x1,  , xr , u1,  , us } es una base de U (∴ n = r + s) . Note que todos los elementos de β son distintos. ¿Por qué? 1. β genera U. En efecto, sea x ∈U. s s  s  T (x ) ∈ T (U ) ∴ T (x ) = ∑ b j y j = ∑ b j T (u j ) = T  ∑ b j u j  j =1 j =1  j =1  s  s    ∴ 0 = T (x ) − T  ∑ b j u j  = T  x − ∑ b j u j  j =1  j =1   

Anexo 5

s   s r ∴ x − ∑ b j u j  ∈ Ker T y ∴ es una combinación lineal de β, es decir, x − ∑ b j u j = ∑ αi xi , j =1 i =1 j =1   r

s

i =1

j =1

de donde x = ∑ αi xi + ∑ b j u j . r

s

i =1

j =1

2. β es linealmente independiente. Sea 0 = ∑ α i xi + ∑ b j u j .

Por demostrar

αi = 0 ∀ i , b j = 0 ∀ j

 s  s  s   r  T ( 0) = 0 = T  ∑ αi xi  + T  ∑ b j u j  = T  ∑ b j u j  = ∑ b j y j ∴ cada b j = 0 y  i =1   j =1  j =1  j =1  r

s

r

i =1

j =1

i =1

∴ ∑ αi xi + ∑ b j u j = ∑ αi xi y ∴ cada αi es α i = 0.

Definición A5.2 Se dice que los espacios vectoriales U y V son isomorfos, lo cual se denota por U ≅ V, si existe un isomorfismo entre ellos.   Teorema A5.4 Si U es un espacio vectorial de dimensión n sobre el campo K, entonces U ≅ Kn. La demostración se hace de la siguiente manera: 1. Se define una función T de U en Kn. 2. Se demuestra que T es lineal y biyectiva.

Demostración Sea β = {u1, … , un } una base de U. Por lo tanto, para cada x ∈ U existe una única colección de coeficientes ai tales que u = a1u1 +  + an un ∈ U. Se define, T: U → Kn T(u– ) = (a1, ..., an). T es lineal. En efecto, sean u = a1u1 +  + an un y v = b1u1 +  + bn un , α ∈ K T (u + αv ) = (a1 + αb1, , an + αbn ) = (a1, , an ) + (αb1, , αbn ) = T (u ) + αT (v ). La demostración de que es biyectiva es inmediata debido a que tiene inversa. En efecto, si S (a1, , an ) , se define como a1u1 +  + an un = u ∴ S es T −1. Note que el isomorfismo T depende de la base y que para cada base de U existe un isomorfismo diferente.

  Teorema A5.5 Sea T ∈ L (U, V) un isomorfismo (por lo tanto, tiene inversa); entonces, T −1 es una transformación lineal. 

Demostración Sean m, n ∈ V y u, v ∈ U tales que T (u ) = m, T (v ) = n, entonces, T −1 (m + n) = T −1 (T (u) + T (v )) = T −1 (T (u + v )) = u + v = T −1 (m) + T −1 (n). Sea α ∈K. T −1 (αm) = T −1 (αT (u )) = T −1 (T (αu )) = αu = αT −1 (m). 

251

252

Anexo 5

  Teorema A5.6 Sea T ∈ L (U, V) y dim U = dim V. Entonces las proposiciones siguientes son equivalentes: 1. 2. 3. 4.

T es un isomorfismo. Si {u1,  , un } es una base de U, entonces {T (u1 ),  , T ( un )} es una base de V. Si T (u ) = 0, entonces u = 0. T −1 es lineal, T −1  T = I U y T  T −1 = I V, donde I U e I V son las identidades en U y en V, respectivamente.

La demostración se deja como ejercicio.   Teorema A5.7 Sean U y V espacios vectoriales sobre el mismo campo, {u1,  , un } una base de U y {v1,  , vn } un conjunto de vectores de V, no necesariamente distintos. Entonces ∃! T ∈ L (U, V) ∋ ∀i ∈ {1, 2, , n}, T (ui ) = vi . ∃! T ∈ L (U, V) ∋ ∀i ∈ {1, 2,  , n}, T (ui ) = vi .

Demostración Sea u = α1u1 +  + α n un ∈ U. Se define T (u ) = α1v1 +  + α n vn , entonces

(

)

T (ui ) = T 0 u1 +  + 0 ui − 1 + 1ui + 0 ui +1 +  + 0 un = 0v1 +  + 0vi −1 + 1vi + 0vi +1 +  + 0vn = vi , es decir, T (ui ) = vi , ∀i ∈ {1, 2,  , n}

T es lineal. En efecto, sean u = a1u1 +  + an un, v = b1u1 +  + bn un ∈U, T (u– + –v ) = (a1 + b1) v–1 + ... + (an + bn) v–n . Al desarrollar y arreglar términos:

(a1v1 +  + an vn ) +(b1v1 +  + bn vn ) = T (u ) + T (v ) T (αu ) = (αa1 )v1 +  + (αan )vn = α (a1v1 ) +  + α (an vn ) = α (T (u )). 

Unicidad  Para probar la unicidad de la función T, se supone que existe S ∈ L (U, V), tal que ∀ i ∈ I , S (ui ) = vi , entonces ∀ u ∈ U, T (u ) = T (a1u1 +  + an un ) = a1v1 +  + an vn = = a1S (u1 ) +  + anS (un ) = S (a1u1 +  + an un ) = S (u ) ∴ T = S.

Matriz asociada a una transformación lineal   Teorema A5.8 Sean T ∈ L (U, V), U y V espacios vectoriales sobre el campo K, BU = (u1,  , un ) y BV = (v1,  , vm ) bases ordenadas de U y V, respectivamente. Sean f : U → R n y g : U → R m los isomorfismos asociados a las bases BU y BV. Entonces ∃! A ∈ M m × n (K) tal que g ° T = A ° f. Es decir que A hace conmutativo el siguiente diagrama: T

m

Anexo 5

Demostración Sean u ∈ U, v ∈ V y T (u ) = v  x1    u = x1u1 +  + xn un = [u1 … un ]    xn   y1    v = y1v1 +  + yn vn = [v1 … vn ]     yn   A1 j    u j = A1 j v1 +  + Am j vn = [v1 … vm ]    A   mj T (u ) = T (x1u1 +  + xn un ) = x1T (u1 ) +  + xnT (un )  A1n   x1   A11   x1            T (u ) = T (u1 ) T (un )    = [v1 … vm ]    [v1 … vm ]       A  x  A  xn    m n   n   m1    A11 A1n   x1   y1       T (u ) = [v1 … vm ]         = v = [v1 … vm ]    A    yn   m1 Am n  xn  A1n   x1   y1   A11         =         , es decir, y = Ax  yn  Am1 Am n  xn     A11 A1n         es la matriz asociada a T, con respecto a las bases BU y BV , denotada por A   m1 Am n 

(T )

BV BU

 A11 A1n    =     A   m1 Amn 

Unicidad  Partiendo de las bases BU y BV, la matriz asociada a la transformación resulta única, dado que es lineal y tiene definidas las imágenes de los elementos básicos.

Definición A5.3 Sean U, V y W espacios vectoriales sobre el campo K. Si S ∈ L (U, V) y T ∈ L (V, W), entonces se puede formar la composición T  S : U → W de la manera usual, es decir, [T  S](u ) = T (S (u )) .

253

254

Anexo 5

  Teorema A5.9 T  S ∈ L (U, W). 

Demostración

[T  S](u + v ) = T (S (u + v )) = T (S (u ) + S (v )) = T (S (u )) + T (S (v )) = [T  S ](u ) + [T  S ](v ) [T  S](αu ) = T (S (αu )) = T (αS (u )) = αT (S (u )) = α[T  S](u ).   Teorema A5.10 Sean S ∈ L (U, V) , T ∈ L (V , W) ; U, V y W espacios vectoriales sobre el campo K; BU = (u1, , un ), BV = (v1, , v p ), BW = (w1, , wm ) bases ordenadas de U, V y W, respectivamente, f : U → R n , g : V → R p y h : W → R m los isomorfismos asociados a las bases BU , BV y BW .  Entonces ∃! A ∈ M p × n (K) y −∃! B ∈ M m × p (K), tales que hacen conmutativo el siguiente diagrama:

En particular, h  (T  S ) = B  (A  f ). Sean u ∈ U, S (u ) = v ∈ V y T (v ) = w ∈ W  x1    u = x1u1 +  + xn un = [u1 … un ]    xn   y1    v = y1v1 +  + y pv p = v1 … v p     y p     z1    w = y1w1 +  + ym wm = [w1 … wm ]    zm 

 A1 j    S (u j ) = A1 j v1 +  + Ap j v p = v1 … v p     A   pj  B1k    T (vk ) = B1k w1 +  + Bm k wm = [w1 … wm ]    B   mk 

 z1   B11  B1 p   A11  A1n   x1                  =   zm  Bm1  Bm p  Ap1  Apn  xn     C  C  11 B11  B1 p   A11  A1n  1n                    es la matriz asociada a T  S.   C m1  C mn  Bm1  Bm p  Ap1  Apn    

¡Observe que la matriz asociada a una composición de transformaciones lineales es el producto de las matrices asociadas a cada una de ellas!

Respuestas a los ejercicios Unidad 1  Lógica y conjuntos

Recuerde que por la ley de De Morgan ¬ (P ∧ ¬Q) ≡ (¬P ∨ Q)

1.1  Lógica matemática

Por reducción al absurdo se tiene ¬(P → Q), (P → Q) ⊢– 1. P → Q Hipótesis

Ejercicios 1.1.1 Demuestre (P → Q) ≡ (¬Q → ¬P)

Que de acuerdo con el primer ejercicio (¬P ∨ Q) ≡ (P → Q)

2. ¬ (P → Q) Hipótesis 3.

(P ∧ ¬Q) ∧ ¬(P → Q)



⇒ (P → Q), ¬Q ⊢– (¬Q → ¬P)

⇐ Se debe demostrar que (P ∧ ¬Q)

1. P Hipótesis

2. P → Q Hipótesis

2. P → Q Hipótesis

3. Q MP(1, 2) 4. ¬Q Hipótesis

(P → Q), ¬Q ⊢– ¬P Por teorema de la deducción [(P → Q),¬Q, P] ⊢– Por teorema de reducción al absurdo

MP(1, 2) 3. Q ¬Q Hipótesis 4. 5. Q ∧ ¬Q (3, 4) ⇐ (¬Q → ¬P ) ⊢– (P → Q) La demostración es análoga. Demuestre (P → Q) ≡ (¬P ∨ Q) ⇒ Se debe demostrar que (P → Q) ⊢– (¬P ∨ Q) (1)

5. Q ∧ ¬Q

a) Sí b) No c) Sí

Por reducción al absurdo (1) se cambia por (P→Q), P, ¬Q ⊢– 1. P Hipótesis

f ) No

5. Q ∧ ¬Q (3, 4)

⇐ Se debe demostrar que (¬P ∨ Q) ⊢– (P → Q) Por teorema de la deducción (¬P ∨ Q), P ⊢– Q Por reducción al absurdo (¬P ∨ Q), P, ¬Q ⊢– 1. (¬P ∨ Q) Hipótesis

(3, 4)

Ejercicios 1.1.2

d ) Sí

3. Q MP(1, 2) ¬Q Hipótesis 4.

⊢– ¬ (P → Q)

Por reducción al absurdo (P ∧ ¬Q), (P → Q) ⊢– 1. P Hipótesis

Recuerde que por ley de De Morgan ¬ (¬P ∨ Q) ≡ (P ∧ ¬Q)

2. P → Q Hipótesis

(1, 2)

e) No g) Sí h) Sí Ejercicios 1.1.3 a) P ∧ Q b) P ∨ Q c) P ↔ Q d ) P ∨ Q

2. P

Hipótesis

Ejercicios 1.1.4

3. Q 4. ¬Q

Disy (1, 2)

a) ¬O

Hipótesis

b) P → Q

5. Q ∧ ¬Q (3, 4) Demuestre ¬ (P → Q) ≡ (P ∧ ¬Q)

c) P

⇒ Se debe demostrar que ¬ (P → Q) ⊢– (P ∧ ¬Q)

e) P → Q

d ) P → Q f ) P ∧ Q ∨ Z

255

256

Respuestas a los ejercicios

Ejercicios 1.1.5 c) Si el que a sea menor o igual que b implica que b es menor que c, entonces a es mayor o igual que c. d ) a es menor que c y c es igual a d, si y sólo si, b es menor que c y a es mayor o igual que b, entonces a es menor que c.

a) Si a es menor que b, o b es mayor o igual que c, entonces a es menor que c. b) Si no es cierto que a es menor que b o es falso que a es menor o igual que b, y b es menor que c, entonces a es menor que c. Ejercicios 1.1.6 a) A



(B



A)

0

1

0

1

0

0

1

1

0

0

1

1

0

1

1

1

1

1

1

1

(A



B)



[(A



(B



C))



(A



C)]

0

1

0

1

0

1

0

1

0

1

0

1

0

b)

0

1

0

1

0

1

0

1

1

1

0

1

1

0

1

1

1

0

1

1

0

0

1

0

1

0

0

1

1

1

0

1

1

1

1

1

0

1

1

1

0

0

1

1

1

0

1

0

0

1

0

0

1

0

0

1

1

1

0

1

1

1

1

1

1

1

1

1

1

1

0

1

0

0

1

1

0

0

1

1

1

1

1

1

1

1

1

1

1

1

1

A



(B



(A



B))

B)



C)]

c) 0

1

0

1

0

0

0

0

1

1

0

0

0

1

1

1

0

1

1

0

0

1

1

1

1

1

1

1

(A



B)



A

d ) ∧

(A



B)

B

0

0

0

1

0

0

0

0

1

0

0

0

1

1

0

0

0

1

1

1

1

0

0

1

1

1

0

0

1

0

1

1

1

1

1

1

1

1

1

1

(A



C)



[(B

e) →

C)



((A



0

1

0

1

0

1

0

1

0

0

0

1

0

0

1

1

1

0

1

1

1

0

0

0

1

1

0

1

0

1

1

0

0

1

0

1

1

1

0

0

1

1

1

1

1

1

1

0

1

1

1

1

1

0

0

1

0

1

0

0

1

1

0

0

0

1

1

1

1

0

1

1

1

1

1

0

1

1

1

0

0

1

1

0

0

1

1

1

1

0

0

1

1

1

1

1

1

1

1

1

1

1

1

1

Respuestas a los ejercicios

257

f ) A



(A



B)



B



(A

B)

0

1

0

0

0

0

1

0

0

0

0

1

0

1

1

1

1

0

1

1

1

1

1

1

0

0

1

1

1

0

1

1

1

1

1

1

1

1

1

1

(A



B)



[(A

g) →

¬B)



¬A]

0

1

0

1

0

1

1

1

1

0

1

1

1

0

1

0

1

1

1

0

0

1

1

1

1

0

0

1

1

1

1

1

0

0

1

0



¬A)



A

0

1

1

0

1

0

1

1

h)

Ejercicios 1.1.7 a) Verdadera b) Verdadera c) Verdadera d ) Verdadera e) Verdadera Ejercicios 1.1.8 a) No válido b) No válido c) Válido d ) Válido e) Válido Ejercicios 1.1.9 a) 1. S ∧ Q H1 2. S ∧ Q → S TB4 3. S MP(1, 2) b) 1. 2. 3. 4. 5. 6. 7.

F ∨ S H3 ¬ S H4 F Disy(1, 2) ¬H ∨ ¬F Equiv H2 ¬H Disy(4, 3) Q ∨ H Equiv H1 Q Disy(6, 5)

c) 1. 2. 3. 4. 5. 6. d ) 1. 2. 3. 4. 5. 6. 7.

F ∨ (G ∨¬D) Equiv H1 ¬F H3 G ∨¬D Disy(1, 2) D → G Equiv 3 E → D Equiv H2 E → G SIL(5, 4) ¬(D ∧ O) ∨ Z H3 ¬Z H4 ¬(D ∧ O) ≡ ¬D ∨ ¬O Disy(1, 2) D → ¬O Equiv 3 M → ¬O SIL(H2, 4) O → ¬M Contrap 5 L → ¬M SIL(H1, 6)

Ejercicios 1.1.10 a) Falso, contraejemplo x = −2 ya que 4 ≠ −2; negación: ∃x ∈  ∋ x 2 ≠ x b) Cierto, x = 0, 2(0) = 0; negación: ∀x ∈ , 2 x ≠ x c) Falso, contraejemplo x = −3, •−3• ≠ −3; negación: ∃ x ∈ ∋ x ≠ x d) Falso, no implica que es 2, pues puede ser −2; negación: ∃ x ∈  ∋ x 2 = 4 ∧ x ≠2 e)  Cierto, cada número tiene su inverso aditivo; negación: ∃ x ∈,∀y ∈ ∋ x + y = 0 f) Falso, no existe un número que pueda fungir como el inverso aditivo de todos los números reales, cada número tiene su inverso aditivo; negación: ∃ x ∈,∀y ∈ ∋ x + y = 0 g) Cierto, y = −2, funciona con todos los valores para x en la proposición x + y ≤ −1

258

Respuestas a los ejercicios

1.7 Algunas demostraciones en la teoría de conjuntos Ejercicio 1.7.1

1. No, (a, a) es un punto en el plano y {{a}} es el conjunto que consta del conjunto que consta sólo de la a. Ejercicio 1.7.2



es decir, (A × B ) ∪ (A × C ) ⊂ A × (B ∪ C ) (2)



de (1) y (2)



A × (B ∪ C ) = ( A × B ) ∪ ( A × C )

Ejercicio 1.7.4 a ∈ A ∧ a ∈ C

(a, b) ∈ (A × B) ∩ (C × D) ⇔ b ∈ B ∧ b ∈ D ⇔ (a, b) ∈ (A × D) ∩ (C × B)

a ∈ A ∧ a ∈ C



(a, b) ∈ (A × B) ∩ (C × D) ⇔ b ∈ B ∧ b ∈ D ⇔ (a, b) ∈ (A × D) ∩ (C × B)

3 1 x= ; y= ; 4 4

2 4 x= ; y= 5 5



Ejercicio 1.7.5

Ejercicio 1.7.3

Si A ∩ B ≠ ∅, entonces ∀A ∈ (A ∩ B ), (a, a ) ∈ A × B

i) A ⊂ X ∧ B ⊂ Y ⇔ ( A × B) ⊂ (X × Y )

Ejercicio 1.7.6



a)

⇒ sea (a, b) ∈ A × B ∴ a ∈ A, b ∈ B ∴ a ∈ X , b ∈Y



∴ (a, b) ∈ X ×Y ∴ (A × B) ⊂ (X ×Y )



⇐ sea a ∈ A, b ∈ B ∴ (a, b) ∈ A × B ∴ (a, b) ∈ X ×Y



∴ a ∈ X , b ∈Y ∴ A ⊂ X , B ⊂ Y

B

A∪B

(A ∪ B)C

=

AC

BC

AC ∩ BC

a

b

a∨b

¬(a ∨ b)



¬a

¬b

¬a ∧ ¬b

0

0

0

1

1

1

1

1

0

1

1

0

1

1

0

0

1

0

1

0

1

0

1

0

1

1

1

0

1

0

0

0

A

B

A∩B

(A ∩ B)C

=

AC

BC

AC ∪ BC

a

b

a∧b

¬(a ∧ b)



¬a

¬b

¬a ∨ ¬b

0

0

0

1

1

1

1

1

1

0

1

1

1

0

1

b)

iii) Sea A ≠ B ∧ A × B = ∅ ∴ ∃a ∈ A − B ∧ b ∈ B

A

∴ (a, b) ∈ A × B pero ∴ (a, b) ∉ B × A ∴ A × B ≠ B × A

v) Sea (a, b) ∈ A × (B ∪ C ) ∴ a ∈ A, b ∈ B ∨ b ∈ C

∴ (a, b) ∈ A × B ∨ (a, b) ∈ A × C , es decir, (a, b) ∈ A × (B ∪ C )

0 1

0

0

1

1

0

1

1



∴ A × (B ∪ C ) ⊂ (A × B) ∪ (A × C ) (1)

1

1

1

0

1

0

0

0

Sea (a, b) ∈ (A × B) ∪ (A × C )

c)

( A − B ) − C = A − (B ∪ C )





que es equivalente a A ∩ BC ∩ C C = A ∩ (B ∪ C )C



(vea cuadro R.1).



∴ (a , b) ∈ A × B ∨ (a , b) ∈ A × C ∴ b ∈ B ∨ b ∈ C ∴ (a , b) ∈ A × (B ∪ C )

(

)

Cuadro R.1 A

B

C

BC

CC

A ∩ BC

(A ∩ B)C ∩ CC

=

B∪C

(B ∪ C)C

A ∩ (B ∪ C)C

a

b

c

¬b

¬c

(a ∧ ¬ b)

(a ∧ ¬ b) ∧ ¬ c



b∨c

¬(b ∨ c)

a ∧ (¬b ∨ c)

0

0

0

1

1

0

0

1

0

1

0

0

0

1

1

0

0

0

1

1

0

0

0

1

0

0

1

0

0

1

1

0

0

0

1

1

0

0

0

0

1

1

0

0

1

0

0

1

1

1

0

1

0

1

1

1

0

1

1

0

1

1

1

1

0

0

1

1

0

0

1

0

0

1

1

0

0

1

1

1

0

0

0

0

1

1

0

0

Respuestas a los ejercicios

d)

259

(A ⊂ B) ⇒ ([A ∩ (B ∩ C )] = [(A ∩ B) ∩ C ])

que es equivalente a (A → B) ⇒ ([A ∩ (B ∩ C )] ⇔ [( A ∩ B) ∩ C ]) C

A→B



B∩C

A ∩ (B ∩ C)

=

A∩B

(A ∩ B) ∩ C

b

c

a→b



b∧c

a ∧ ( b ∧ c)



a∧b

(a ∧ b) ∧ c

0 0 1 1 0 0 1 1

0 1 0 1 0 1 0 1

1 1 1 1 0 0 1 1

1 1 1 1 1 1 1 1

0 0 0 1 0 0 0 1

0 0 0 0 0 0 0 1

1 1 1 1 1 1 1 1

0 0 0 0 0 0 1 1

0 0 0 0 0 0 0 1

A

B

a 0 0 0 0 1 1 1 1

1.8  El concepto de función

Son cadenas {{a}}, {{b}}, {{c}}, {{a, b}}, {{c, d}}, {{d, e, f }} {{a}, {a, b}}, {{b}, {a, b}}, {{b}, {b, c}}, {{c}, {b, c}}

Ejercicio 1.8.1

Ejercicio 1.8.6

5 utilizaron camión y tren; 40 utilizaron camión o tren. Ejercicio 1.8.2 169 llevan cálculo y física; 149 llevan cálculo y física, pero no álgebra. Ejercicio 1.8.3 Una partición puede ser {P, Q}, en donde P = {a, b} y Q = {c, d}, en ese caso la relación ℜ de equivalencia que induce es: ℜ = {(a, a), (a, b), (b, a), (b, b), (c, c), (c, d), (d, c), (d, d)}. Otra podría ser {P, Q, R, S} en donde. P = {a}, Q = {b}, R = {c}, S = {d}. La relación ℜ inducida es: ℜ = {(a, a), (b, b), (c, c), (d, d)}. Ejercicio 1.8.4 n ≡ m, si y sólo si m − n es múltiplo de 5. 1. n ≡ n

 1   2  f  = (1, 0), 2,  , 3,   4   9  g  f − g = {(1, − 1), (2, − 3), (3, − 7)} f  g = {(1, 0), (2, 3)} f + g = {(1, 1), (2, 5), (3, 11)}

0 es múltiplo de 5

2. Si n ≡ m(5) es decir, ∃ x ∈ Z ∋ m − n = (x)(5); (−x)(5) = n − m , y ∴ m ≡ n(5)

f ⋅ g = {(1, 0), (2, 4), (3, 18)} g  f = {(1, 0), (2, 1), (3, 4), (4, 9)} Ejercicio 1.8.7 f  g = x + 1, x ≥ 0 ;

g  f = x2 + 1

Ejercicio 1.8.8

h(x) = x 4 + x 2 − 2

Unidad 2 Sistema de ecuaciones lineales, matrices y determinantes 2.1  Sistemas de ecuaciones lineales

3. Sean, n ≡ m(5), m ≡ k(5) ∃ x, y ∈ Z ∋ m − n = (x) (5); k − m = ( y) (5), Ejercicios 2.1.1  k − m = (y)(5), por lo que sumando miembro a miembro resulta k − n = (x + y)(5), es decir, n ≡ k(5). 1. i) Coeficientes 0, −2, 0; término constante b = 6;  La partición que resulta es 0, 1, 2, 3, 4 en donde; ii) variable delantera y, variables libres x, z 0 = 5n, n ∈  1 = 5n + 1, n ∈  , …, 4 = 5n + 4, n ∈  , iii) Solución general o también: {{5n}, {5n + 1}, {5n + 2}, {5n + 3}, {5n + 4}} n ∈ Z  x  1 0  0 X =  y  = r  0  + s  0  +  −3  , r ∈ℝ         Ejercicio 1.8.5  z  0 1  0 i) No existe ningún elemento de A que contenga a todos. Lue    go no hay “mayor”. x  0 ii) No existe ningún elemento de A que esté contenido en Solución particular, r = s = 0;  y  =  −3  y     todos. Luego no hay “menor”.  z   0 iii) Los elementos que no están contenidos en ningún otro son  x   1  {a, b}, {b, c}, {d, e, f } que por lo tanto son “máximos”. r = s = 1  y  =  −3  iv) Los elementos que no contienen a ningún otro son {a}, {b},      z   1  {c}, {d, e, f } que por lo tanto son “mínimos”.

{

}

{

{ }

{

}

}

260

Respuestas a los ejercicios

2. i) Coeficientes 3, 0, 0; término constante b = −6; ii) variable delantera x; variables libres y, z

Ejercicios 2.2.1

iii) Solución general

 x   0   0   −2          X = y = r 1 + s 0 + 0 , r , s ∈           z  0 1  0

3x − 5 y = −9 4w + 3x − z = 11 − w − x + 3 y − z = 18 − y − z = −5 8t + w



 x   −2    Solución particular r = 2, s = 0  y  =  2  y      z   0  x   −2 r = s = −1  y  =  −1     z   −1

2.2 Matrices

   

3. i) Coeficientes −2, 7, 0; término constante b = 0;

  a)   

0 0 3 −5 0 0 4 3 0 −1 0 −1 −1 3 −1 8 1 0 −1 −1

    

  c)   

0 0 3 −5 0 0 4 3 0 −1 0 −1 −1 3 −1 8 1 0 −1 −1

−9 11 18 −5

ii) variable delantera x, variables libres y, z iii) Solución general



 x   −7 Solución particular r = s = 2  y  =  2     z   2  x r=s=0  y   z

  0  = 0     0

 y  

   

b)

  e)   

0 0 3 −5 0 0 4 3 0 −1 0 −1 −1 3 −1 8 1 0 −1 −1

  f) t   

0 0 0 8

     + w    

0 4 −1 1

     + x    

     3 3 −1 0

      

t w x y z

   −9   11  =  18     −5 

     +y    

−5 0 3 −1

Ejercicios 2.2.2  π    2 = π a) 2 x  x  − 2  y =  = x ; = −2 3y    3 4z = e z  e   4 − 2c + d = 2 b) a b + 3c − 2 d = 4

iii) Solución general

   

 y  

c)

Ejercicios 2.1.2. 9 2

ii) a) s ∈

b) s =

9 2

b) No existe

  0   −9   −1   11  +z   =   −1   18    −1   −5



5. No es una ecuación lineal

i) a) s ≠

    

t, w, x, y, z ∈ ℝ

ii) variable delantera x, variables libres y, z

 x 5 r = s = 1,  y  =  1     z   1

    

0 0 0 0

4. i) Coeficientes 1, 0, 1; término constante b = 6;

 x   3 Solución particular r = 2  y  =  2   s = 3   z   3

−9 11 18 −5

    

3x −5 y = 4w +3x −z = −w − x +3 y − z = 8t +w − y −z =

d)

  b=  



       





3a

− c + 5d

= 4

2b − 2c − 3d = 9      1   −5   4  a    3   3   3     x =  b  = r  1  + s  3  +  9  , r, s ∈ c     2  2 d   1   0   0    0        1  0    

   ; t, w,x, y, z ∈=  

261

Respuestas a los ejercicios

7 a + 4b

d)

c



3d



e)

−e

+3 f

= 3

− 2e

+8 f

=

+ 4e − 7 f



= 2

 1   −3   3   −4   a     7   7  7    7        b   1   0   0  0  c     2   −8   1  x =   = r  0  + s   + t   +   , r, s, t ∈   d   0   −4   7   2   e     3   3  3    0   1   0   0   f   0           0   1  0

a + 4b

− 3d

+f

= 2

c + 2d

−f

=

e −2 f



1

   x =    

a b c d e f

1

= 8

  −4   3   −1   2    1   0   0   0            = r  0  + s  −2  + t  1  +  7  ,r,s,t,u ∈=   0   1   0   0    0   0   2   8             0   0   1   0 

3x + 2 y + 3z =



+ y

− z = −3

2x

− y

+ z =

8



   

− y

− z = −3

2x

+ y

+ z =

0 1 0 1

d)

3x

3y

+ z =

−9

+ y

=

−8

3x + 7 y + 2 z = −26



 −1 0 3 1 − 9  1 0 9    3 1 0 − 8 ≈  1   0 1 3  3 7 2 −26   0 0 0

 x Solución: x =  y

 −1   −5  r    3 3 + , r ∈ =ℝ 9    3  9  0

 1 −3 2 17   1 0 0 55  2 −3 0 14  ≈  0 1 0 32     3 −7 2 −1   0 0 1 29

  55  =  32    29 z

  

Ejercicios 2.3.1

7

  4  =  −1    0 z

x − 3 y + 2 z = 17 2 x − 3 y = 14 3x − 7 y + 2 z = −1

−5  3  − 3   0

2.3  Balanceo de reacciones químicas

 2 3 6 5   1 0 0 4   −1 −1 −1 −3  ≈  0 1 0 −1      1 1 7   0 0 1 0   2

 x Solución: x =  y

1 0 0 1

Aplicaciones de los sistemas de ecuaciones

5

−x

1 1 1 0

1  2 1  1 0 0 2 1 0 1 0  2 1 0 0 1  2

0 0 0

1  w   21      Solución: x =  x  =  2  1  y   2  z 1   2

e)

 3 2 3 19   1 0 0 5   −1 1 −1 −3  ≈  0 1 0 2       2 −1 1 8   0 1 0 0 

2x + 3 y + 6z =

0  0  1 0 

 1  1  1  0 ≈ 1  0 1   0 

x Solución: x =  y  =   z

19

−x

 x   5 Solución: x =  y  =  2     z   0

b)



r, s, t, u ∈ ℝ

Ejercicios 2.2.3

a)

c)

y+w =1 y+ z =1 x+ y =1 w+ z =1

  

a) a P2 I 4 + b P4 + c H 2 O → d PH 4 I + e H 3 PO4

  Solución: x =   

a b c d e

  10    13   = r  128  , r ∈ ℝ   40     32 

b) a KOH + b H 2SO 4 + c H 2 O → d KHSO 4

   

262

Respuestas a los ejercicios

i) a CaC2 O 4 + b KMnO 4 + c H 2SO 4 → d CaSO 4 + e MnSO 4 + f K 2SO 4 + g CO 2 + h H 2 O a  1     a CaC 4 + f K 2SO 4 + g CO 2 + h H 2 O b 2 O 4 + b KMnO 1 4 + c H 2SO 4 → d CaSO 4 + e MnSO Solución: x =   = r    ,, r ∈ ℝ  c  −1   a   5  d   1      b   2   c   8  Nota: El signo negativo del tercer coeficiente indica que el  d    agua es un producto, no un reactivo. = r  5   ,, rr ∈ Solución: x =  ∈=ℝ  2 c) a FeI 2 + b HIO3 + c HCl → d FeCl3 + e I 2 + f H 2 O  e     f   1  a   10   g   10     b   6   8  h      Solución: x =  c  = r 30  ,, rr ∈ ∈=ℝ  10  d j ) a CuSCN + b KIO3 + c HCl + d O2 → e CuSO 4 + f ICN + g KCl + h H 2O  e   13   +b KIO a CuSCN + g KCl + h H 2O  18 3 + c HCl + d O2 → e CuSO4 + f ICN  f  d ) a Na 2 Cr2 O7 + b NaI + c HCl → d CrCl3 + e I 2 + f H 2 O + g NaCl

   Solución: x =     

  1   6    14   = r 2  , r ∈ ℝ   3      7   8  g 

a b c d e f

e) a HCl + b KMnO 4 → c Cl2 + d KCl + e MnCl2 + f H 2 O





a PbCrO 4 + b KI + c HCl → d PbCl2 + e CrI 3 + f KCl + g I 2 + h H 2 O  a   16   b   2      5  Solución: x =  c  = r ,, rr ∈=ℝ    d 2  e   2         f  8 Solución: x = 

  Solución: x =  

a b c d

  1  = r  1  ,, r ∈=ℝ   1    2

g) a FeS + bO 2 → c Fe 2 O3 + d SO 2

  Solución: x =  

a b c d

 4    = r  7   ,, rr ∈=ℝ  2      4

h) a K 2 Cr2 O7 + b H 2 O + cS → d SO 2 + e KOH + f Cr2 O3



   Solución: x =    

a b c d e f

  2    2    3  = r  3  ,, rr ∈=ℝ   4      2

  4    4    4      = r  3   ,, r ∈=ℝ   4    4  g   4    2  h 

a b c d e f

k) a PbCrO 4 + b KI + c HCl → d PbCl2 + e CrI 3 + f KCl + g I 2 + h H 2 O

  2    12    16      = r  2  ,, rr ∈=ℝ    2     12   g   3    8  h 

f ) a CaF2 + b H 2SO 4 → c CaSO 4 + d HF



    Solución: x =     

l)

a b c d e f

a Cl2 + b KOH → c KCl + d KClO3 + e H 2O

  Solución: x =   

a b c d e

  3   6   = r  5  ,, rr ∈=ℝ   1    3

m) a Ba (OH )2 + b HCl + c H 2 O → d BaCl2

 Solución: x =   

a b c d

 1   = r  2   ,, rr ∈∈=ℝ  −2      1 

Nota: El signo negativo del tercer coeficiente indica que el agua es un reactivo, no un producto.

Respuestas a los ejercicios

263

Se+obtiene desigualdad −4r + 12 s > 0 , es decir 3s > r, que se f K 2SOla n) a K 2 Cr2 O7 + bCH 3CH 2 OH + c H 2SO 4 → d Cr2 (SO 4 )3 + eCH 3COOH 4 + g H 2O resuelve, en un caso particular, si + c H 2SO 4 → d Cr2 (SO 4 )3 + eCH 3COOH + f K 2SO 4 + g H 2 O r = s = 40 t) a NaBrO + b H 2 O 2 → c NaBr + d O 2 + e H 2 O  1  a   3  b   a   2   −1   4   c   b   0   1        Solución: x =  d  = r  1  ,,rr∈∈=ℝ Solución: x = c = r 2 + s −1 , r, s ∈ ℝ  3  e             d   1  0   e   0   1  1  f         7   g  o) a KClO3 + b HCl → c KCl + d H 2 O + eCl2 + f ClO 2

 a  b   Solución: x =  c  = d  e   f

 1  5  6 6 r  1 s  5    + 6   , r, s ∈ ℝ 3  3  3  3  0      0 6

p) a C + bO 2 → c CO + d CO 2

 a   Solución: x = b =    c  d 

2

 1

 2  0

 0   1

r  1   + s 1 , r, s ∈ ℝ   2 

Se obtiene la desigualdad 2 r − s > 0 , es decir 2r > s, que se resuelve, en un caso particular, si r=s=1

u) a Cu + b HNO3 → c Cu (NO3 )2 + d NO 2 + e NO + f H 2 O

 a  b   Solución: x =  c  = d  e   f

Se obtiene la desigualdad −2 r + s > 0 , es decir s > 2r, que se resuelve, en un caso particular, si s = 6 y r = 2 v) a CH 3CH 2 CH 3 + bO 2 → c C + d CO 2 + eCO + f H 2 O

q) a C2 H 4 + b HCl → c C2 H 6 + d C 5 H 5Cl + eC2 H 4 Cl

Vea el ejercicio r.

 a  b  Solución: x =   =  c d  e  

Ejercicios 2.3.2

 11   3  2   2 r   + s   , r, s ∈ ℝ 2  6  2  1  2   0  0   2    

r) a C3H 8 + bO 2 → c H 2 O + d C + eCO + f CO 2 Solución:



 a    b   x =  c = d  e   f

 1 2  1       2 7  5 r  4 s  8 t  4 + + , r, s, t ∈ ℝ 3  3 6  0  3  0        0 6 0        0 0  3

 1  1  0 4 r  s  1 + 1 , r, s ∈ ℝ 2  2   −4   2   2 0      0 2

Análisis dimensional    a) Solución:     

x1  −2 −1      x2  − 1 α1 α2   −1  x3 = α1 −2 + α 2 −1 ,  F   µ  = π       L2 ρv 2   ρvL  x4   1  0  0 1 x5      

Si α1 = 0 y α2 = 1 se obtiene el número adimensional de Euler F π1 = Eu = 2 2 . L ρv Si α1 = 0 y α2 = 0 se obtiene el inverso del número adimensional 1 µ = ∴  Eu = φ (Re) de Reynolds π 2 = Re ρvl

s) a As2S5 + b HNO3 → c H 3AsO 4 + d H 2SO 4 + e H 2 O + f NO + g NO 2b) Solución: −2  0  0  1  x1  d H 2SO 4 + e H 2 O + f NO         + g NO 2 x2   0 −1  1 −1         1  x 1 0 0 −  3  a  3  1 x  = α  1 + α  0 + α  0 + α  0  ,  b  40   40  1  2  3  4   4  0  0  0  1       x5   c r  6 s  2            x6  0 0 1 Solución: x = d = 40 15 + 40 5 , r, s ∈ ℝ    0              −1    x7   e  −4   12   0  0  0         α1 α  ∆P   l α2  ε α3  vdρ  4  f   40   0   2        =π  g  0  40  v ρ  d  d   µ 

264

Respuestas a los ejercicios

c) Solución:

x1  −1  1 −1 x   1  0  3  2       x3   0 −1 −1 f) Solución:   = α1   + α 2   + α 3   x 1 0  4      0 x5   0  1  0         x6   0  0  1

x1  −1  0  1     −  −  x2   0  1  1 x3   1  1  0        , = + + x − 1 0 α α α 1  2  3  0  4 x  −1  0  0  5       x6   0  1  0 x   0  0  1  7      

 Lkc   D  AB

Dvρ , número de Reynolds µ

π1 = Re =

µC p

π 2 = Pr =

k

, número de Prandtl

 x1   0 x   1  2    x3   − 1 x4   0 x    d) Solución:  5  = α1  0 + α 2 x6   1 x7   0 x    8  0 x9   0     α1

π1 = Pr =

 L3 gρ 2   µ 2 

α2

(β ∆T )α3 

0   3 0   −2      0   0 0   1      0  + α 3 1  + α 4 0   0 0   2     1   0 0   0    

Lh  α 4  =π k

3 2 , π 2 = L gρ , π 3 = β∆T, π 4 = Nu = Lh 2 k k µ

β gρ 2 L3 ∆T número de Grashof µ2

x1  −1 −1 −1 x   0  0 −1  2       x3   1  1  0 e) Solución:   = α1   + α 2   + α 3   x 1 0  4      0 x5   0  1  0         x6   0  0  1

 Dkc   D  AB

α1

 Dv   D  AB

α2

 µ   D ρ  AB

α3



 1  0    − 1  0    0  0  0    0  1  

α2

 L3 g∆ρ A   D µ   AB 

α3



Lkc 1 DAB ρ L3 g∆ρ A π2 = = π3 = µ DAB µ Sc DAB

π 2 · π 3 = GrAB =

µC p

π 2π 3 = Gr =

 DAB ρ   µ 

π1 = NuAB =

Dh π 3 = Nu = , número de Stanton k

 µC p   k 

α1

DAB ρ L3 g∆ρ A µ DAB µ

Unidad 3  Sistemas numéricos 3.1  El sistema de números reales Ejercicios 3.1.5

{

}

35 ; cotas inferiores: 8 {x ∈; x ≤ −4} ; supremo: 35 ; ínfimo: −4. 8

a)  Cotas superiores: x ∈; x ≥

b)  Cotas superiores: {x ∈; x ≥ 2} ; cotas inferiores: {x ∈; x ≤ −2} ; supremo: 2; ínfimo: −2. c) Cotas superiores: {x ∈; x ≥ 4} ; cotas inferiores: no tiene; supremo: 4; ínfimo no tiene. d) Cotas superiores: {x ∈; x ≥ 1} ; cotas inferiores: {x ∈; x ≤ 0} ; supremo: 1; ínfimo: 0.

3.2  Números complejos Ejercicios 3.2.1  1. 18 − 12i  2. −32i  3. −15 −

28 i 3

Ejercicios 3.2.2  1. 12 + 4i  2. − 4 + 5i  3. 14 − 3i

 4. 7 + 2i Dv Dkc π µ D Dvρ  5. − 1 − 3i Dv π1 = Nu = , π2 = , π 3 = Sc = , 2 = Re = AB = µ µ  6. −4 2 + 2 3i DAB DAB DAB ρ π 3 DAB ρ  7. 11 − 3i Dv  8. 2 − 9i π µ D Dvρ , π 3 = Sc = , 2 = Re = AB =  9. − 12 + 9i µ µ DAB ρ π 3 10. 4 − 4 3i DAB ρ

265

Respuestas a los ejercicios

Ejercicios 3.2.3

Ejercicios 3.2.5

Exprese en la forma a + bi el resultado de las siguientes operaciones:

a) w1 =

3 1 − i ; 2 2

w2 = −

3 1 + i 2 2

b) w1 =

1 3 − i; 2 2

w2 = −

1 3 + i 2 2

a) 87 − 26i b) 22 + 26i c) 32 + 22i d) 1 − 31i e) 7 + 22i f) 11 − 16i g) −140 − 43 6i h) − 59 + 17i i) 21 − 20i j) −198 − 10i 60 59 k) − i 97 97 14 8 − i l) 13 13 7 1 m) − + i 10 10 1 n) 2 ñ)

w2 = −1 − i

d) w1 = 4i;

w2 = −4i

e) w1 = 1 − i;

w2 = −1 + i

f) w1 = 2i;

w2 = −2i

g) w1 = 5 − i;

w2 = −5 + i

h) w1 = 3 + i ;

w2 = − 3 − i

i) w1 = 2 − 2i ;

w2 = −2 + 2i

j) w1 = 3 − 2i ;

w2 = −3 + 2i

k) w1 = 2 − i ;

w2 = −2 + i

l) w1 = 2 + i;

w2 = −2 − i

m) w1 = 1 + 2i;

w2 = −1 − 2i

n) w1 = 1 − 2i;

w2 = −1 + 2i

ñ) w1 =

8 10 15 + i 17 17

o) − 1 + 5 15 i 47 47 24 36 p) − i 13 13

5 1 5 1 2i 2+ 2 i ;  w2 = − 2 − 2 2 2 2

o) w1 = 4 + i;

w2 = −4 − i

p) w1 = 3 + 7i;

w2 = −3 − 7i

Ejercicios 3.2.6

61 45 + i 34 34 1 5 r) + i 2 8 s) ¡Ahhh! 554 297 t) + i 145 145 115 10 + i u) 533 533 31 38 − i v) 37 37 q) −

a) z1 = 2 + i;

z2 = 1 − i

b) z1 = 3 + 2i;

z2 = −3

c) z1 = 2 + i;

z2 = 1 + 2i

1 1 d) z1 = − i ; 2 2

z2 = −2

(

(

)

)

e) z1 = 1 + 2 i ; z2 = 1 − 2 i f)

Ejercicios 3.2.4

x1 =

2 3 2 3 2 i ; x2 = 2i − + 10 10 10 10

g) z1 = 3 + 2i ;

z1 = 1 − i

h) z1 = 4 − 2i;

z2 = 1 − i

i) z1 = 1 + 2i;

z2 = −3 + i

entonces la ecuación z6 + z3 + 1 = 0, se transforj) Haga ξ = 2 ma en ξ + ξ + 1 = 0 z3,

a)

(a, b) = (a, a − 2);

b)

(a , b) =

(a , ±

c) w1 = 1 + i;

a∈

)

7 − 6a − a ; a ∈ [−7, 1] 2



1 3 1 3 ξ1 = z 3 = − + i ; ξ2 = z 3 = − − i 2 2 2 2

c) z = 3 + 5i

Ejercicios 3.2.7

5 7  d) z = ( 2 − 2 i ) +  − i  w 2 2 

a) z =

1 1 (37 − 39i ), w = − 15 (8 + 14i ) 15

e) Este problema no tiene solución; es decir, no existe z ∈ ℂ,

b) z =

3 47 1 − 3i , w = + i 10 15 3

(

)

tal que: z z − 3 z + z = i f)

1 z=2− i 2

c)

z=

1 (20 + 9i ), 13

w=−

1 (8 + i ) 13

266

Respuestas a los ejercicios

d) z = 1 + i,

w=1−i

d) 256 cis 160º

e) z1 = 1 + 2i ,  z2 = 3 − i ,  z3 = 2 + 3i

e) 32 cis 270º

 z1   −1   4   1   1      z2  = 3  2  +  −3  i +  −2  z3   0   0   1  

f) 512 cis 180º

f)

 z  3 

g) 43 264 cis 134.8º h) 4 096 cis 0º 1 cis 296° 625 j) 2 041 cis 160º i)

Ejercicios 3.2.8 a) (−3, −3) b)

k) cis 60º

( )

l) cis 60º 1 cis 60° m) 1 024

3,1

c) (0, 3) d) (0, −2)

n) 64 cis 180º

e) (1, 1) Ejercicios 3.2.13

f)

(−2, 2 3)

Obtenga las raíces que se indican.

g)

(1, − 3)

a) 2 cis 24°; 2 cis 144°; 2 cis 264° b) 6 cis 9°; 6 cis 129°; 6 cis 249°

Ejercicios 3.2.9

2 cis 150°;

c)

a) 7 2 (cos 45° + i sen 45°)

d)

b) 2 (cos 330° + i sen 330°)

3

2 cis 100°; 2 cis 120°;

e)

c) 5 2 (cos 135° + i sen 135°)

f)

d) 2 (cos 300° + i sen 300°)

2 cis 330° 3

2 cis 220°;

3

2 cis 340°

2 cis 300°

cis 0° = 1; cis 120°; cis 240°

g) 2 cis 0° = 2; 2 cis 120°; 2 cis 240°

e) 2 5 (cos 26.6° + i sen 26.6°)

h)

cis 60°; cis 180°= − 1; cis 300°

f) 12 (cos 240° + i sen 240°)

i)

cis 30°; cis 150°; cis 270°= − i

g) 4(cos 180° + i sen 180°)

j)

3

h) 8(cos 270° + i sen 270°)

k) 2 4 2 cis 33.75°; 2 4 2 cis 123.75°; 2 4 2 cis 213.75°; 2 4 2 cis 303.75°

Ejercicios 3.2.10

l)

b) −117 + 44i

m) 3 cis 45°;

3 cis 105°;

3 cis 165°;

Ejercicios 3.2.11 a) 10 cis 100º 10 512 cis 27°; b) 48 cis 42º c) 60 cis 60º

5 cis 137.7°;

3

5 cis 257.7°

10

512 cis 99°;

10

512 cis 171°;

10

cis 0° = 1; cis 72°; cis 144°; cis 216°; cis 288° 3 cis 45°;

3 cis 225 °; n)

512 cis 243 °;

3 cis 105°;

3 cis 285°;

3 cis 345°

10

512 cis 27°;

10

10

512 cis 315°

512 cis 99°;

Definiciones: tan z =

e) 84 2 cis 75° f) 24 cis 150º

cot z =

Ejercicios 3.2.12 a) 64 cis 36º cot z =

3 cis 165°;

10

3 cis 225°;

512 cis 171°;

10

3 cis 285°;

512 cis 243°;

10

3 cis 345°

512 cis 315°

Ejercicios 3.2.14

d) 8 2 cis 105°

b) 81 cis 72º c) 27 cis 150º

3

2 4 2 cis 33.75°; 2 4 2 cis 123.75°; 2 4 2 cis 213.75 °; 2 4 2 cis 303.75°

a) 16 c) −119 + 120i

5 cis 17.7°;

(

)

sen z e zi − e − zi = zi ; cos z e + e − zi i

(

(

)

)

e zi + e − zi i cos z 2 1 2i 1 = zi ; sec z = = ; csc z = = sen z e zi − e − sen z cos z e zi + e − zi e + e − zi

e zi + e − zi i cos z 2 1 2i 1 = zi ; sec z = = = ; csc z = sen z cos z e zi + e − zi sen z e zi − e − zi e + e − zi

267

Respuestas a los ejercicios

(

) (

2 1. − e zi − e − zi + e zi + e − zi 2 tan z + 1 = 2 e zi + e − zi

2. cot 2 z + 1 =

(

(

zi

− e +e

)

) + (e

− zi 2

zi

−e

)

2

=

(e

)

4 zi

+e

= sec 2 z

)

− zi 2

{

c) Raíces: 1, 1, − 2, − 2,

}

3 ; f ( x ) = (x − 1)2 (x + 2)2 (2 x − 3) 2

2 2 d) Raíces: {i , − i , − 2, − 2}; f ( x ) = (x − 1) (x + 2) (2 x − 3)

− zi 2

{ )(

}

(

)(

−4 e) Raíces: 1, − 2, 3, 5 , − 5 ; f (x) = (x − 1) (x + 2)(x − 3) x − 5 x + 5 = = csc 2 z − zi 2 zi e 1− , −e 2, 3, 5 , − 5 ;e f (+xe) = (x − 1) (x + 2)(x − 3) x − 5 x + 5

({ zi

)

− zi 2

}(

)

(

2 2 1  1   1  2 2     3. sen2i =  e − e  = e + e − 2 ; cos2i =  e + e  = − 2 2 i 4    

)

)

1 2 1 1 1 e2 + e2 + 2 f) Raíces: 1, 1, 1, − 2, − 2, − , − ; f (x) = (x − 1)3 (x + 2)2  x +  2 2 2  4 2 5 2  5  2 2 2 g) Raíces: 0, 0, − 1, − 1, 2, 3, − , ; f (x) = x (x + 1) (x − 2)(x − 3) x +   x −  1  1  3 2 3 2   2 2 − 2 ; cos2i =  e + e  = e2 + e2 + 2 , por lo tanto: sen2 i + cos 2 5i = 1 2  5  2   2 0, 0, − 1, − 1, 2, 3, − , ; f (x) = x (x + 1) (x − 2)(x − 3) x +   x −  4 4  2  3 2 zi2 −2 zi 3  2  1+ cos 2z 1+ cos 2z 2 + e 2 zi + e −2 zi +2 e +e 2 2 = ; cos z = , por por lo tanto : cos z = {1, 1, 1, − 1, − 1, 2, 2, 2, − 3, − 3}; f (x) = (x − 1)3 (x + 1)2 (x − 2)3 (x + 3)2 4. h) Raíces: 2 4 4 2 1, 1, 1, − 1, − 1, 2, 2, 2, − 3, − 3}; f (x) = (x − 1)3 (x + 1)2 (x − 2)3 (x + 3)2 { 1+ cos 2z e 2 zi + e −2 zi + 2 2 , por tanto: lo tanto : cos2 z = z= i) Raíces: 4 2

{

5. sen2 z = −

e

2 zi

{ {

}

−2 zi

+e 4

−2

=

(

2 − e 2 zi + e −2 zi 4

) = 1 − cos 2z



2

Unidad 4 Polinomios y teoría de ecuaciones

}

{

}

}

2 1  1 1  1 1 1 1 2 −1, − 1 − , − , , ; f (x) = (x + 1) x +  x −  x −   2  4 3 3 2 4 3 

Ejercicio 4.2.4

{

}

raíces: 3 − 2i , 3 + 2i , − 2, 4, 1 ; 2

a) Si r = 3 − 2i es raíz;

1  f (x) = (x − 3 + 2i )(x − 3 − 2i )(x + 2 )(x − 4) x −   2

4.2  Funciones polinomiales

b) Si r = 2 + 3 es raíz;   raíces: {2 + 3 , 2 − 3, 1, 1, 1, 1 + 2i , 1 − 2i};

Ejercicios 4.2.1

(

a) f(1) = −2;  f(2) = −14;  f(−3) = −346 b) f(−1) = 5;  f(1) = 23;  f(2) = −1 c) f(−5) = −241;  f(4) = 128;  f(3) = 82

)(

)

f (x) = x − 2 − 3 x − 2 + 3 (x − 1)3 (x − 1 − 2i )(x − 1 + 2i ) c) Si r = − 2 − i es raíz;

{

raíces: −2 − i , − 2 + i , − 3, 2, −

3  f (x) = (x + 2 + i )(x + 2 − i )(x + 3)(x − 2) x +   2

d) f(−3) = 151;  f(3) = 31;  f(−2) = 41;  f(1) = −1; f(−1) = 7



e) f (1) = −1;  f(−1) = 1;  f(2) = 4;  f(−2) = 8;  f(−3) = 53;  f(−3) = 59; f(4) = 206

d) Si r = −1 + i es raíz doble;

Ejercicios 4.2.2

raíces: {−1 + i , − 1 + i , − 1 − i , − 1 − i , 1, 1, 1, − 1, − 1, − 2} ;

a) f(3) = 0



 2 b) f  −  = 0  3 c) f(−2) = 0 e) f



( 5) = 0

g) f(−3) = 0

Ejercicios 4.2.3 2 a) Raíces: {1, 2, 2, 3}; f ( x ) = (x − 1)(x − 2) (x − 3)

{

(

)(

}

1 2 , − , 5 ; f ( x ) = (2 x − 1)(3x + 2)(x − 5) 2 3

{

}

5 1 raíces: 1 + 7 , 1 − 7 , 1, − 2, , ; 2 3

)

5  1  f (x) = x − 1 − 7 x − 1 + 7 (x − 1)(x + 2) x −   x −   2  3

f) Si r = 3 + 5 es raíz;

 1 f) f  −  = 0  2

b) Raíces:

f (x) = (x + 1 − i )2 (x + 1 + i )2 (x − 1)3 (x + 1)2 (x + 2)

e) Si r = 1 + 7 es raíz;

d) f(−i) = 0

}

3 ; 2

(

)(

{

raíces: 3 + 5 , 3 − 5 , 1,−1, 3,

}

1 ; 2

)

1  f (x) = x − 3 − 5 x − 3 + 5 (x − 1)(x + 1)(x − 3) x −   2

{

}

g) Si r = −5 + 2 es raíz; raíces: −5 + 2 , − 5 − 2 , 1 + 3i , 1 − 3i ;

(

)(

)

f (x) = x + 5 − 2 x + 5 + 2 (x − 1 − 3i )(x − 1 + 3i )

268

Respuestas a los ejercicios

Ejercicios 4.2.5

Ejercicio 5.9.3

 5 29 5 29  ,− + a) −1 − 2 i , − 1 + 2 i , − −  2 2 2 2  

a)

b)

{−i, i, − 1 −

}

3 ,− 1 + 3

 3 13 3 13 1 3 1 3  ,− + ,− − i, − + i c) − − 2 2 2 2 2 2 2   2 d) e f )

{−2 − 3 , − 2 + 3 , 1 − 2 , 1 + 2} {−1 − 3 , − 1 + 3, 1 − 2 , 1 + 2} {−2 − 2 2 , − 2 + 2 2 , − 1 − 3 i, − 1 +

}

3i



 1   2   1   8  2 =   + 1  + 3  3   1   −1   3 



 1   3   1   2  1 =   + 0  + 2 3 1  −1   1     



 1   2   1   4  −1  =  + 1  + 3  3   1   −1   −5 

b)

Ejercicios 4.2.6  Ecuaciones de 3° grado a) b) c) d) e) f )

{3 4 + 3 2 − 2, 3 4 ω + 3 2 ω2 − 2, 3 4 ω2 + 3 2 ω − 2} {3 2 − 3 4 − 1, 3 2 ω − 3 4 ω2 − 1, 3 2 ω2 − 3 4 ω − 1} {2 3 2 − 2 3 4 − 1, 2 3 2 ω − 2 3 4 ω2 − 1, 2 3 2 ω2 − 2 3 4 ω − 1} {3 3 − 3 9, 3 3 ω − 3 9 ω2 , 3 3 ω2 − 3 9 ω} {3 25 + 3 5 + 2, 3 25 ω + 3 5 ω2 + 2, 3 25 ω2 + 3 5 ω + 2} {3 2 − 3 4 − 1, 3 2 ω − 3 4 ω2 − 1, 3 2 ω2 − 3 4 ω − 1}



 1   2   α + 2β α + β =  1   1   α + β

  1  =    3 

α + 2β = 1

α +β =3



 1 12 12 12 1p1 1 1 21 2 12 1 11p10 10 0 5 5 5   1 11 11 31 33 0 0− 10− 1 −21 2 20 01 01 −12−2 −2 

El sistema tiene solución ∴ vectores

 1 1 ,  2   1 1   1 

 1  sí es una combinación de los  3 

c) Sí, ya que el sistema tiene solución.

Unidad 5  Álgebra lineal



1 2   −1 1 lineales 5.9  Transformaciones   2 −1

1

1 −1 −1 0 1 3

1

Ejercicio 5.9.1

− 2 5

 −1 −1 1 1 1 1 2 2 p 1 1−1 −1−1 −1 −2 −2  1p 10 02 2 3 3   2 2−1 −1 1 1 1 1 0 0 1 1 3 3 5 5  0 01 13 3 5 5   1 0 2  0 1 3

3 5

 

d) No

4 4(1, 0) + 6(0, 1) = (4, 6) por lo tanto (4, 6) B =   1 6



5(1, 1) − 1(1, − 1) = (4, 6) por lo tanto (4, 6) B =  5 2 −1 1   1(1, 0) + 3(1, 2) = (4, 6) ( 4, 6 ) B =   3  3

1 1−2 −2 1  1p1  1−2 −2 1 1  1 1−2 −2 −1 −1 0  0 0 0 −2 −2 

Ejercicio 5.9.4 y

y

Ejercicio 5.9.2

x

x

2 (1, 0, 0) + 0 (0, 1, 0) + 3(0, 0, 1) = (2, 0, 3)(2, 0, 3) B

a

2   = 0   3

 1   1(2, − 2, 1) + 2 (0, 1, − 1) + 4(0, 0, 1) = (2, 0, 3)(2, 0, 3) B = 2 b   4 1(1, 1, 1) − 1(0, 1, 2) + 1(1, 0, 4) = (2, 0, 3)(2, 0, 3) B

c

 1 = −1    1



a)

c) 

y

y

x

b)

x



d) 

269

Respuestas a los ejercicios

y

Ejercicio 5.9.9

y

x

x



e)

Ejercicio 5.9.10

i) 

y

 x   1   2   y  =  −1  + t  1  , t ∈=ℝ        z   2   3 

 x   2  y  = 2    z   3

y

  1   + t  2  , t ∈=ℝ o      2 

 x   1  y  = 0    z   1

  −1   + t  −2  , t ∈=ℝ      −2 

(la ecuación de la recta no es única)

x

x

Ejercicio 5.9.11

f)

Usando la contrapuesta: si los vectores P2 − P1 y P3 − P1 son paralelos, entonces P1, P2 y P3 son colineales. P3 − P1 = α (P2 − P1 ), P3 = P1 + α (P2 − P1 ) ∴ P3 está en la línea que pasa por P1 y P2

j) 

y

y

x

x



g)

P = (x, y, z ) = (−1, 1, 1) + α (5, 1, 3) + β (−2, 1, 1), α, β ∈ ℝ Ejercicio 5.9.13

k) 

y

Ejercicio 5.9.12

P = (2, 1, 0) + α (1, − 2, 1) + β (−1, − 1, 2), α, β ∈ ℝ

y

Ejercicio 5.9.14 x

x

x + 2y + 3z = 6 Ejercicio 5.9.15



h)

l) 

P = (1, 1, 2) + t (2, 1, 1) x = 1 + 2t y = 1+ t z = 2+t

Ejercicio 5.9.5

 2   −1 1  Gen   = Gen   ,   (Eje x)  0   0  0 



 1   0    1   1       Gen  0  ,  1   = Gen  1  ,  −1   (Plano xy)         0  0   0  0  

Ejercicio 5.9.16

( P − P0 ) ·

(a × b ) = 0

Ejercicio 5.9.17

Ejercicio 5.9.6

 1 θ = arccos   = 60°  2

a) Cierta

L1 ∩ L2 = { } = ∅

b) Falsa

Ejercicio 5.9.18

c) Falsa

 2  θ = arccos   ≈ 61.87 º  6 3

Ejercicio 5.9.7 A, C

Ejercicio 5.9.19

Ejercicio 5.9.8

 1    ,  −1 

    1  ;  1 ,     1   1      1  

0  0 1,  0   1  1

     ;      

0  0  1   0 ,  1 ,  1        1 1 1 

d (P , Q) =

(−1,− 1,− 2)

Ejercicio 5.9.20 d(P, ℒ) = 0

= 6

270

Respuestas a los ejercicios

Ejercicio 5.9.21

Ejercicio 5.9.29

d(ℒ1, ℒ2) = 0

2

Ejercicio 5.9.22 d (P, π ) =

4 11

Ejercicio 5.9.23 d (π1, π 2 ) =

5 3

Ejercicio 5.9.30 b, c Ejercicio 5.9.31 ≈ 109.47° Ejercicio 5.9.32

Ejercicio 5.9.24

 0, 2 , 1     5 5

2 2; 2;

Ejercicio 5.9.33

3

Ejercicio 5.9.25

π   π π π   π π ,− ,−   , ; −  , 3 3  3 3 3  3 Ejercicio 5.9.26

{(x, y, z); x − y − 2 z = 0} Ejercicio 5.9.27 7 5 + 10 + 13 ; 2 Ejercicio 5.9.28 6

5 5 Ejercicio 5.9.34  4 , − 4 , 4  +  2 , 7 , 5  = 2, 1, 3 )     ( 3 3 3 3 3 3 Ejercicio 5.9.35 cos α =

6 6 6 ; cos β = − ; cos γ = 6 3 6

Ejercicio 5.9.36 ¡Aaah!

Índice analítico La n después de un número de página indica que la referencia se encuentra en las notas.

A Absurdos, 6 Adimensionalización de las ecuaciones de balance, 192 Álgebra abstracta, 199 de funciones, 33 moderna, 199 Algoritmo, 173 de Euclides, 164 de la división, 139, 161 sintética, 143 Análisis dimensional, 71 Ángulo entre dos planos, 220 dos rectas, 219 una recta y un plano, 220 vectores, 208 Ángulo formado por vectores, 207, 208 Ángulos agudos, 12 Anillo, 137n, 199 asociativo, 199 con uno, 199 conmutativo, 137n con uno, 137, 160 de los enteros gaussianos, 162 de los polinomios, 162 definición de, 199 euclidiano de los enteros, 162 Anillos euclidianos, 162 Aproximación de la solución, grado de, 168 Argumento(s), 8 concepto de, 8 definición de, 8 no válido,8 principal, 128 válido, 8 Aritmética del conjunto Z de los números enteros, 199 Arreglo rectangular de elementos, 37 Automorfismo de campos, 149 Automorfismos, 115 Axioma de completez, 100, 101 especificación, 22, 23, 24 existencia de conjuntos, 22 extensión de conjuntos, 22 las parejas de conjuntos, 24 las partes, 25 las uniones de conjuntos, 24 Axiomas, 2, 162 de campo, 86 de Euclides, 205n de orden, 95 equivalentes, 162

B Balanceo de reacciones químicas, 56 una reacción química general, 58 Base β, 203 Base, definición de, 203 C Calculadora humana, 168 Cálculo de la raíz real de una ecuación, 173 de las raíces de una ecuación, 170 de predicados, 2, 19 de una raíz real por el método de bisección, 176 de una raíz real por el método de NewtonRaphson, 179 Cálculo numérico errores asociados a todo, 168 origen de los errores asociados al, 168 Cálculo proposicional, 2, 15 ampliado, 19 conceptos del, 2 elementos del, 2 relaciones primitivas del, 2 Cálculos aritméticos que no pueden realizarse con precisión ilimitada, 169 numéricos, 7 resultados de, 7 Cambio de coordenadas polares a rectangulares en un complejo, 128 coordenadas rectangulares a polares en un complejo, 128 Campo algebraicamente cerrado, 154 concepto de, 86 de los escalares, 201 de los números complejos, 154 definición de, 199 K de los números complejos, 201 ordenado completo, 102 R de los números reales, 201 Cancelación de factores iguales, ley de, 160 para la adición, ley de, 89 Canónico, 204 Características de la suma booleana, 29 del conjunto de los números reales, 110 del producto booleano, 29 Cardinalidad de un conjunto, 25 Categoría de dominio entero, 160 Cero es constructible, 105 Circunferencia, 204 Clase positiva, 138 Clasificación de las funciones, 32

Cocientes de polinomios, 166 Coeficiente de fricción, 187 Coeficientes, 136 estequiométricos, 56 Cofactor(es) de la matriz triangular, desarrollo por, 83 definición del, 82 desarrollo por, 82 Colección de conjuntos, 24 elementos, 20 índices, 24 Combinación lineal de β, 202 de polinomios, 164 definición de, 202 vacía, 203, 204 Complejos, suma de dos, 124 Complemento, 25 de un conjunto, 21 con respecto a otro, 25 Componente, 211 de una proyección sobre un vector, 211 escalar, 213 de la fuerza, 213 vectorial, 213 de la fuerza, 213 Componentes básicos de la lógica matemática, 2 Común denominador, 94 Concepto de argumentos, 8 campo, 86 conjugación, 114 conjunto, 20 demostración, 7 error, 168 grado, 136 método numérico, 168 norma, 116, 206 Conceptos definidos, 2n del cálculo proposicional, 2 primitivos, 2n, 22 de la teoría, 2 Conclusión, la, 8 Condición que define al conjunto solución, 40 Condiciones del subespacio, 202 Conectivos del lenguaje, 2 lógicos, 2, 3 binarios, 3 Conjugación, 114 concepto de, 114 es autoinversa, 115 es biyectiva, 115 Conjugado de la suma, 114, 149

271

272

Índice analítico

un número complejo, 112 un producto, 114, 149 Conjugado del conjugado Z, 149 Conjunto, 22 cardinalidad de un, 25 complemento de un, 21 concepto de, 20 de conjuntos, 22 de enteros positivos, 98 de fórmulas, 8 de los cuaternios reales, 154n de los enteros, 137n de números racionales, 142 de puntos del plano, 26 de todos los números racionales, 99 ínfimo del, 101 no vacío, 95 ortogonal, 209 definición de, 209 ortonormal, 209 finito, 209 potencia, 22, 25 solución, 40, 54 condición que define al, 40 universal, 23 vacío, 23 espacio generado por el, 203 Conjunto de los números reales, 95 aumentados, 106 negativos, 95 positivos, 95 Conjuntos contención de, 23 definición de, 209 diferencia de, 21 familia de, 24 formas de expresar los, 21 iguales, 21 intersección de, 21 unión de, 21 universales, 24 Consecuencias de la determinante, 81 Constantes de Van der Waals, 182 Construcción geométrica de un punto, 104 Contención, 23 de conjuntos, 22 definición de, 21 Contradominio, 136 de la función, 32 Convergencia del método de iteración de punto fijo, 172 Coordenada(s), 106 polares, 122 Correspondencia biunívoca, 26 uno a uno, 103 Cota inferior, 101 superior, 101 Cuadratura del círculo, 105 Cuantificador existencial, 19 universal, 19 Cuantificadores, 19 Cuaternios reales, conjunto de los, 154n D Decimal que no termina, 103 termina, 103

Decimales infinitos no periódicos, 103 Deducción de una fórmula, 11 Definición de ángulo entre dos rectas, 219 ángulo entre vectores, 208 anillo, 199 argumento, 8 base, 203 campo, 199 combinación lineal, 202 conjunto ortogonal, 209 conjuntos, 209 contención, 21 distancia, 207 divisor, 98 dominio entero, 199 ecuación lineal, 47 espacios vectoriales, 201 factor, 98 grupo abeliano, 198 homomorfismos, 200 igualdad de matrices, 42 independencia lineal, 203 matriz, 41 mayor que, 95 menor que, 95 norma, 205 número primo, 98 operación binaria, 198 permutación, 214 producto cartesiano, 27 producto de matrices, 38 producto punto, 205 recta, 218 subespacio, 209 teoría axiomática, 16 transpuesta de una matriz, 43 triple producto escalar, 217 valor absoluto, 99 Definición del cofactor, 82 rango de una matriz, 47 Delantero, 46 Demostración concepto de, 7 de proposiciones en la teoría de conjuntos, 31 Denominador, 93 Denotación de la determinante, 80 de la recta, 218 de la suma, 198 del conjunto vacío, 21 del sistema de los números reales, 86 Desarrollo por cofactores, 82 de la matriz triangular, 83 Descripción del método de Newton-Raphson, 178 Desigualdad Cauchy-Schwarz-Bounyakowski, 206 del triángulo, 207 Determinación de las raíces de una ecuación, 170 Determinante alternante, 80 cero de una matriz, 81 consecuencias de la, 81 de la matriz, 39, 80 de la submatriz, 82 denotación de la, 80

Diagrama Venn-Euler, 28 Dibujo de la gráfica de la función, 32 Diferencia, 25 de conjuntos, 21 Diferencias finitas, 169 Dimensión de V, 204 del espacio generado por las columnas, 47 del espacio generado por los renglones, 47 finita, 204 infinita de V, 204 Dimensiones básicas, 71 Dirección negativa, 106 positiva, 106 Distancia, definición de, 207 Disyunción, 11 Dividendo, 93 División de dos complejos, 124 sintética, 143, 146 algoritmo de la, 143 Divisor, 93 definición de, 98 Doble condición que da la igualdad, 22 negación, 4, 11 Dogmas en el espacio vectorial, 204 Dominio de la función, 32 de la variable independiente, 175 Dominio entero, 137n, 138, 160 con uno, 199 definición de, 199 Dos sistemas de ecuaciones lineales, 50 Duplicación del cubo, 105 E Ecuación algebraica, 56 cálculo de la raíz real de una, 173 consistente, 40 de 2º grado, 155 de Colebrook, 187, 188 de estado de Van der Waals, 182, 193 de la recta que pasa por dos puntos, 218 del gas ideal, 182 del plano, 220 que pasa por tres puntos, 220 equivalente, 120 general de primer grado, 155 general de segundo grado, 117 fórmula para resolver la, 117 inconsistente, 40 normal de un plano, 220 química, 56 balanceada, 56 polinomial, 155 raíz de, 141 vectorial, 219 de la recta, 219 Ecuación de una recta forma paramétrica de la, 219 forma simétrica de la, 219 Ecuación lineal con coeficientes reales, 36 definición de, 47 homogénea, 47 no homogénea, 47

Índice analítico Ecuaciones canónicas de las cónicas, 204 con coeficientes enteros, 36 de balance, adimensionalización de las, 192 de cuarto grado, 155, 157 de tercer grado, 155 diofantinas, 36 lineales, 36 paramétricas, 219 polinomiales de grado, 155 Eje imaginario, 122 real, 122 Ejemplos de grupos, 198 Elemento, 22 principal, 46 Elementos arreglo rectangular de, 37 de la matriz del sistema, 39 del cálculo proposicional, 2 idénticos, 86 inversos, 87 Eliminación gaussiana, 52 Elipses, 204 Enteros anillo euclidiano de los, 162 conjunto de los, 137n gaussianos, 162 invertibles, 99 positivos, conjunto de, 98 Epimorfismo, 200 Equivalencia de dos sistemas de ecuaciones lineales, 50 Equivocaciones en la realización de las operaciones, 169 Error absoluto, 169, 173 aproximado, 174 causado por algún tipo de aproximación, 169 computacional, 169 concepto de, 168 de redondeo, 169 por truncamiento, 169 relativo, 169 Errores asociados al cálculo numérico, 168 origen de los, 168 Escalar, 37 Escalares, 201 campo de los, 201 Espacio generado por el conjunto vacío, 203 métrico, 207 normado, 206 Espacio vectorial, 201 cero, 201 complejo, 201 de dimensión finita, 201, 204 de dimensión infinita, 204 definición de, 201 dogmas en el, 204 real, 201 trivial, 201 Esquema del signo de las permutaciones, 214 Esquemas de las tautologías básicas, 6 Existencia de conjuntos, axioma de, 22 de inversos, 198 del cociente y del residuo, 139 del neutro, 198

Expresión periódica infinita, 103 Extensión de conjuntos, axioma de, 22 F Factor de compresibilidad, 185 de fricción, 187 energético, 56 Factores en la formulación del problema, 168 en la obtención de los datos, 169 no triviales, 98 triviales, 98 Factorización del polinomio, 157 prima, 99 Familia de conjuntos, 24 intersección de la, 25 unión de la, 24 Familias de abiertos, 207 Forma característica de la ecuación de estado de Van der Waals, 194 matricial de un sistema de ecuaciones, 38 única, 203 paramétrica de la ecuación de una recta, 219 simétrica, 219 de la ecuación de una recta, 219 Formas de expresar los conjuntos, 21 Fórmula de Newton-Raphson, 184 deducción de una, 11 del chicharronero, 155, 157 para resolver la ecuación general de segundo grado, 117 Formulación del problema, factores en la, 168 Fórmulas de Cardan, 155 Fuentes principales del error, 169 Función, 26, 32 biyectiva, 32 compuesta, 32 continua, 175 contradominio de la, 32 determinante, 215 distancia, 207 euclidiana, 162 inversa, 32 de la exponencial, 131 inyectiva, 114 kernel de una, 158 logaritmo natural, 131 norma, 116 real, 32 de variable real, 32 suprayectiva, 32 valor absoluto, 160 Funciones clasificación de las, 32 inyectivas, 32 polinomiales, 136, 140 racionales, 166 reales, 33 de variable real, 33 trigonométricas, propiedades de, 132 G Geometría de Euclides, 205, 205n Minkowski, 206n

Geometrías no euclidianas, 205 Grado, 162 concepto de, 136 de aproximación de la solución, 168 de un polinomio, 137 Grados de libertad, 51 Gráfica, 106 de la función, 32 del método de Newton-Raphson, 178 Grupo, 198 adimensional, 76 conmutativo, 160 G, 198 simétrico de orden n, 199 Grupo abeliano, 105, 137n, 160, 198, 199 definición de, 198 G, 198 Grupos adimensionales básicos, 75 H Hipérbolas, 204 Hipótesis, 8 Homomorfismo, 200 biyectivo, 200 de anillos, 141 definición de, 200 inyectivo, 200 suprayectivo, 200 I Idéntico aditivo, 87 multiplicativo, 87 i-ésimo renglón de una matriz, 45 Igualdad de matrices, definición de, 42 de polinomios, 141 doble condición que da la, 22 entre funciones polinomiales, 141 entre polinomios, 141 Implicación transitiva, 11 Incógnita, 136 Inconsistencia simple, 14n Independencia lineal, 203 definición de, 203 Indeterminada, 136 Ínfimo del conjunto, 101 Infinitésimo positivo, 102 Inmersión, 99, 137, 200 de una estructura en otra, 114 Intersección de conjuntos, 21 la familia de conjuntos, 25 Intervalo abierto, 106 cerrado, 106, 175 semiabierto, 106 Inverso aditivo, 87, 90 de todo número constructible, 105 multiplicativo, 87, 90 de un número complejo, 114 Isomorfismo, 200, 204 de espacios vectoriales, 205 Isotermas, 194 J Jerarquía de operaciones, 87

273

274

Índice analítico

K Kernel de una función, 158 L Ley de cancelación de factores iguales, 160 conservación de la materia, 58 la cancelación para la adición, 89 Lavoisier de conservación de la materia, 56 los cosenos, 208 tricotomía, 95 Ley del reemplazo, 10n Leyes asociativas, 86 conmutativas, 86 distributivas, 86 Leyes de De Morgan, 18 los signos, 97 Línea coordenada, 106 Logaritmo complejo, 131 Lógica binaria, 2 de la vida, 2 proposicional, 10 reglas válidas de inferencia de la, 10 Lógica matemática, 2 componentes básicos de la, 2 objetivos centrales de la, 2 razonamientos válidos de la, 2 M Matemática aplicada, 168 Matrices, 37 equivalentes por renglones, 46 iguales, 42 Matriz antisimétrica, 44 aumentada, 38, 49 cero, 53 cuadrada, 42 valor del determinante de una, 82 de coeficientes, 38, 49 definición de, 41 definición del rango de una, 47 del sistema, 38 elementos de la, 39 determinante cero de una, 81 determinante de la, 39, 80 diagonal, 42 simétrica, 43 Matriz escalonada bien bonito, 53 por renglones, 45 reducida, 46, 53 Matriz triangular desarrollo por cofactores de la, 83 inferior, 43 superior, 42, 83 Máximo común divisor, 164 Mayor cota inferior, 101 Menor cota superior, 101 entero positivo, 98 ij, 82 Método axiomático-deductivo, 2 corto, 61 de bisección, 175 de Buckingham, 72

de completar cuadrados, 155 de Ferrari, 155 de Gauss, 52 de Gauss-Jordan, 53, 57 de inducción matemática, 87 de iteración de punto fijo, 171, 173 convergencia del, 172 de la división, 142 sintética, 105 de las fracciones parciales, 141 de Newton-Raphson, 169, 178, 190 para aproximar raíces cuadradas, 181 de Rayleigh, 72 directo para determinar la validez de un argumento, 8 general para resolver ecuaciones de cuarto grado, 157 indirecto para determinar la validez de un argumento, 8 numérico, concepto de, 168 Métodos analíticos clásicos, 168 numéricos, 168 para el cálculo de las raíces de una ecuación, 171 para determinar la validez de un argumento, 8 Métrica, 207 Modelo de la geometría de Euclides, 205 Modelos de aproximaciones sucesivas, 171 Modus ponendo ponens, 10 Modus ponens, 10, 11 Modus tollendo ponens. Véase Regla de disyunción Monomorfismo, 200 de anillos, 138 Multiplicación asociativa, 137 conmutativa, 137 de dos complejos, 124 de matrices, 37, 45 de polinomios, 136 de un renglón por un escalar distinto de cero, 46 de una matriz por un escalar, 44 Múltiplo, 98 N Negación de una tautología, 6 Negativo de un número, 87 Neutro de la suma, 198 Norma concepto de, 116, 206 de un número complejo, 116 definición de, 205 Norma euclidiana, 205 propiedades de la, 206 teorema de la, 206 Notación del determinante, 39 indicial, 214 Numerador, 93 Número constructible, inverso aditivo de todo, 105 de parámetros de la solución, 51. Véase también Grados de libertad de Reynolds Re, 187 imaginario, 110 irreducible, 98 negativo de un, 87

primo, 98 definición de, 98 racional, 99 Número(s) complejo(s), 110, 136, 148 campo de los, 154 campo K de los, 201 conjugado de un, 112 inverso multiplicativo de un, 114 parte imaginaria de un, 114 parte real de un, 114 representación geométrica de los, 124 Números constructibles, 105 enteros, aritmética del conjunto Z de los, 199 inconstructibles, 105 irracionales, 99, 104 racionales, conjunto de, 142 Números reales, 136 aumentados, conjunto de los, 106 campo R de los, 201 características del conjunto de los, 110 denotación del sistema de los, 86 negativos, conjunto de los, 95 positivos, conjunto de los, 95 O Objetivos centrales de la lógica matemática, 2 Objeto del cálculo de las raíces de una ecuación, 170 proposicional, 15 Objetos primitivos, 86 Operación binaria, 198 definición de, 198 de división en los números reales, 93 de sustracción en los números reales, 92 Operaciones conjuntistas, 24 de las matrices, 37 elementales en los renglones de una matriz, 46 jerarquía de, 87 racionales, 155 Operaciones binarias, 137 en A, 200 en B, 200 Orden canónico en el conjunto de los números reales, 110 de los índices, 27 inducido, 27 usual de los números naturales, 204 Origen, 103 de los errores asociados al cálculo numérico, 168 P Padre del álgebra, 36 Parábolas verticales, 204 Paralelepípedo, 217 Paralelismo, 209 Paralelogramo, 215 Pareja ordenada, 25 Parejas de conjuntos, axioma de las, 24 proposiciones equivalentes, 6 Parte imaginaria de un número complejo, 114 real de un número complejo, 114

Índice analítico Permutación, 214 definición de, 214 Permutaciones, 199 esquema del signo de las, 214 Pertenencia, 23 Pivote, 46 Plano(s) cartesiano, 26 ortogonales, 220 Polinomio cero, 137 constante, 141 degradado, 137 factorización del, 157 grado de un, 137 mónico, 142, 155 Polinomios, 136 anillo de los, 162 cocientes de, 166 combinación lineal de, 164 con coeficientes enteros, 142 de grado cero, 137, 166 mónicos, 157n monificados, 157n reales irreducibles, 141 Postulados de una teoría, 2n Premisas, 8 Primera coordenada, 26 Primos relativos, 164 Principio de sustitución, 87 del buen orden, 161, 162 Problemas clásicos de la geometría, 105 Procedimiento de búsqueda de una raíz real de la ecuación, 175 para dividir un polinomio, 145 Procesos deductivos simples, 12 Producto, 199 booleano, 28 características del, 29 conjugado de un, 114, 149 cruz, 213 de factores irreducibles, 141 de matrices, 38, 45 definición de, 38 generalizado, 200 interior, 205 definido en forma positiva, 205 Producto cartesiano, 22 de conjuntos, 26 definición de, 27 Producto punto, 205 bilineal, 205 de vectores, 38 definición de, 205 propiedad distributiva del, 211 teorema del, 205 Producto vectorial, 213 propiedades adicionales del, 216 teorema de las propiedades adicionales del, 216 Productos notables, 10 Propiedad arquimediana de los números reales, 102 asociativa de la multiplicación, 198 conmutativa de la multiplicación, 198 de cerradura bajo sumas y productos, 95 distributiva del producto punto, 211

Propiedades adicionales del producto vectorial, 216 teorema de las, 216 algebraicas de los polinomios, 141 básicas de la exponencial, 128 de campo, 86 de funciones trigonométricas, 132 de la adición, 86 de la conjugación, 114 de la determinante, 80 de la división, 94 de la multiplicación, 86 de la norma euclidiana, 206 de la proyección de un vector sobre otro vector, 211 de la suma de números enteros, 159 de las funciones polinomiales, 141 de las raíces complejas, 148 de los determinantes, 214 de orden, 95 del campo, 200 del grupo abeliano G, 198 del símbolo de permutación, 214 del símbolo ⊢–, 15 esenciales de la implicación, 11 Propiedades del producto cartesiano, 27 de los números enteros, 159 del producto punto, 205 Proposición, 3 abierta, 23 completa, 4 simple, 3 Proposiciones, 2 ciertas por vacuidad, 4 compuestas, 3 equivalentes, 6 parejas de, 6 falsas, 2 iguales, 2 que siempre son falsas, 6 simbolismo matemático de las, 3 verdaderas, 2 Proposiciones simples, 2 diferentes, 2 no especificadas, 2 Proyección, 211 de un vector sobre otro vector, 211 ortogonal de un vector sobre otro, 212 Proyecciones, 210 de la fuerza, 210 Punto(s) construcción geométrica de un, 104 crítico, 194 del plano, conjunto de, 26 fijo, convergencia del método de iteración de, 172 medio del intervalo como valor de la raíz, 175 R Raíces complejas, propiedades de las, 148 de igual multiplicidad, 149 de la ecuación, 171 de las ecuaciones polinomiales por medio de fórmulas, 142 de multiplicidad, 142 positivas, 151

275

racionales, 153 de una ecuación algebraica, 170 simples, 142 Raíces de una ecuación cálculo de las, 170 determinación de las, 170 Raíz de ecuación polinomial, 141 n-ésima de un número, 102 racional de la ecuación de coeficientes enteros, 170 “surd”, 149 Raíz cuadrada del discriminante, 155 no negativa, 205 Raíz real de una ecuación, cálculo de la, 173 Rango de la función, 32 la matriz aumentada, 50 la matriz del sistema, 50 una matriz, 47 definición del, 47 Razonamiento por medio de argumentos, 8 Razonamientos válidos de la lógica matemática, 2 Reacción de combustión, 55 química, 55 Recíproco de un número, 87 Recta, 218 denotación de la, 218 teoremas de la, 218 Rectas ortogonales, 219 paralelas, 219 Reducción al absurdo (RAA), 23, 90 regla de, 10 teorema de, 12, 13, 14 Reflexión de los puntos del plano, 148 Regla de Cramer, 112 disyunción, 10 formación del conjunto, 21 los signos, 92, 200 reducción al absurdo, 10 Sarrus, 84 Regla del silogismo hipotético, 10 Reglas derivadas, 11 válidas de inferencia, 10, 11 de la lógica proposicional, 10 Relación de orden lineal, 95 de un conjunto en otro, 26 primitiva, 22 Relaciones definidas, 2n en la matemática, 26 primitivas, 2n del cálculo proposicional, 2 Renglones no cero de una matriz, 47 Repetición de índices, 214 Representación axiomática de las propiedades de los números reales, 103 de cortaduras de Dedekind de las propiedades de los números reales, 103 de una matriz, 37 geométrica de los números complejos, 124

276

Índice analítico

gráfica del conjunto de todas las parejas de números reales, 26 Representaciones de los números reales, 102 decimales de números reales, 103 Residuo parcial, 143 Resultados de cálculos numéricos, 7 Resultante, 210 Rugosidad relativa, 187 S Segmento lineal de longitud unitaria, 103 Segunda coordenada, 26 Segundo dividendo, 143 Signo de agrupación, 5 Silogismo hipotético (SH), 11 regla del, 10 Simbolismo matemático de las proposiciones, 3 Símbolo de infinito, 106 permutación, 214 Símbolos de las unidades de medida, 71 Simplificación de la hipótesis, 12 Sistema coordenado de mano derecha, 214 de coordenadas, 106 de dos ecuaciones, 38 con coeficientes reales, 38 de ecuaciones, forma matricial de un, 38 de los números reales, 86 denotación del, 86 Sistema de ecuaciones lineales, 47 homogéneo, 48 no homogéneo, 48 Sistema Internacional de Unidades, 71 Sistemas de ecuaciones, 36 Solución cero de un sistema de ecuaciones, 48 del sistema de ecuaciones lineales, 49 escrita en forma vectorial paramétrica, 54 expresada en forma paramétrica, 54 general de la ecuación, 36 particular, 36 trivial de un sistema de ecuaciones, 48 vectorial, 67 Soluciones particulares, 54 Subespacio condiciones del, 202 de un espacio vectorial real de dimensión finita, 209 de V, 212 generado por β, 202 definición de, 209 teorema de, 210 Submatriz, determinante de la, 82 Sucesión, 136 casi nula, 136 Suma, 198 asociativa, 12, 136 booleana, 28 características de la, 29 conjugado de la, 114, 149 conmutativa, 136 de constructibles, 105 de dos complejos, 124 de dos vectores, 210 de imágenes, 136 de los dos vectores ortogonales, 210 de matrices, 44

de polinomios, 136 denotación de la, 198 formal, 202 Sumas de polinomios, 139 de distinto grado, 136 formales, 136, 139 Supremo del conjunto, 101 Sustitución de un proceso infinito por una aproximación finita, 169 hacia atrás, 53 T Tabla de pertenencia de los elementos de los conjuntos, 28 verdad del conectivo no, 3 Tablas de verdad, 2, 3, 31 básicas, 4 de los conectivos lógicos, 18 iguales, 6 Tautología(s), 6, 8 básicas, 11 esquemas de las, 6 compuesta con tres fórmulas, 18 Teorema de Bolzano, 170 de De Moivre, 125, 126 de Dedekind, 100 de distancia, 207 de la combinación lineal,202 de la deducción, 12, 13 de la norma euclidiana, 206 de la suma de polinomios,137 de Pitágoras, 7, 12, 206 de reducción al absurdo, 12, 13, 14 de subespacio, 210 del algoritmo de la división, 139 del anillo conmutativo, 138 del factor, 142 del producto punto, 205 del residuo, 141, 142 del valor intermedio (TVI), 175 del valor medio para derivadas, 172 fundamental de la aritmética (TFA), 166, 99 aplicado a los polinomios, 166 fundamental del álgebra, 117, 154 Teorema de las propiedades adicionales del producto vectorial, 216 de las raíces complejas, 149 Teoremas, 2 básicos de la teoría de ecuaciones, 141 básicos de los números reales, 89 de la geometría, 7 de la recta, 218 de las tablas de verdad de los conectivos lógicos, 18 de los vectores que generan un plano, 219 del álgebra, 7 Teoría de anillos, 199 de campos, 199 de conjuntos, 7, 31 de ecuaciones, 141 de Galois, 155 de grupos, 199 de la función determinante, 80n de los sistemas de ecuaciones lineales, 72

de números, 162 general de la química, 58 Teoría axiomática con negación, 14n definición de, 16 intuitiva, 15 Teorías axiomáticas, 10 científicas, 2 humanísticas, 2 Tipos de anillo, 199 matrices, 42 mediciones, 71 Topología, 207 Transformaciones lineales, 205, 221 Transpuesta de una matriz, definición de, 43 Trayectorias isotermas, 194 Triángulo rectángulo, 12 Trinomio cuadrado perfecto, 155, 159 Triple producto escalar, 217 definición de, 217 Trisección del ángulo, 105 U Unicidad del cociente y del residuo, 139 Único inverso, 198 Unidad de medida, 71 en el Sistema Internacional de Unidades, 71 Unidades derivadas, 71 Unión de conjuntos, 21 la familia de conjuntos, 24 Utilización de métodos matemáticos para obtener soluciones, 71 V Validez de los teoremas, 13 Valor absoluto, 162 definición de, 99 de verdad de una proposición compuesta, 4 del determinante de una matriz cuadrada, 82 del error, 173 Valores de verdad, 2 de las proposiciones compuestas, 3 Vaporizador flash, 189 Variable, 136 delantera, 40 independiente, dominio de la, 175 libre asociada, 53 real, 32 Variables, 2 libres, 40 proposicionales, 2 Vector componente de una proyección sobre un, 211 de coordenadas, 205 sobre otro vector, proyección de un, 211 Vectores, 201 ángulo formado por, 207, 208 no paralelos, 220 producto punto de, 38 que generan un plano, teorema de los, 219 Versores, 209 Volumen del paralelepípedo, 218