Saltar al contenido principal
LibreTexts Español

6.1: El Producto Dot

  • Page ID
    115717
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    En esta sección, introducimos una operación algebraica simple, conocida como el producto punto, que nos ayuda a medir la longitud de los vectores y el ángulo formado por un par de vectores. Para vectores bidimensionales\(\mathbf v\) y\(\mathbf w\text{,}\) su producto punto\(\mathbf v\cdot\mathbf w\) es el escalar definido para ser

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf w =\ twovec {v_1} {v_2}\ cdot\ twovec {w_1} {w_2} = v_1w_1 + v_2w_2\ texto {.} \ end {ecuación*}

    Por ejemplo,

    \ begin {ecuación*}\ twovec {2} {-3}\ cdot\ twovec {4} {1} = 2\ cdot 4 + (-3)\ cdot 1 = 5. \ end {ecuación*}

    Vista previa Actividad 6.1.1.

    1. Calcular el producto punto
      \ begin {ecuación*}\ twovec {3} {4}\ cdot\ twovec {2} {-2}\ texto {.} \ end {ecuación*}
    2. Esboce el vector\(\mathbf v=\twovec{3}{4}\) a continuación. Luego usa el teorema de Pitágoras para encontrar la longitud de\(\mathbf v\text{.}\)
    Figura 6.1.1. Esboza el vector\(\mathbf v\) y encuentra su longitud.
  • Calcular el producto punto\(\mathbf v\cdot\mathbf v\text{.}\) ¿Cómo se relaciona el producto punto con la longitud de\(\mathbf v\text{?}\)
  • Recuerde que la matriz\(\mattwo0{-1}10\) representa la transformación matricial que gira vectores en sentido antihorario\(90^\circ\text{.}\) al Empezar con el vector\(\mathbf v = \twovec34\text{,}\) encuentra\(\mathbf w\text{,}\) el resultado de rotar\(\mathbf v\) por\(90^\circ\text{,}\) y bosquejarlo arriba.
  • Qué es el producto punto\(\mathbf v\cdot\mathbf w\text{?}\)
  • Supongamos que\(\mathbf v=\twovec ab\text{.}\) Encuentra el vector\(\mathbf w\) que resulta de rotar\(\mathbf v\) por\(90^\circ\) y encuentra el producto punto\(\mathbf v\cdot\mathbf w\text{.}\)
  • Supongamos que\(\mathbf v\) y\(\mathbf w\) son dos vectores perpendiculares. ¿Cuál crees que\(\mathbf v\cdot\mathbf w\) es su producto dot?
  • La geometría del producto de punto

    El producto punto se define, más generalmente, para cualquier vector\(m\) bidimensional:

    \ begin {ecuation*}\ mathbf v\ cdot\ mathbf w =\ left [\ begin {array} {c} v_1\\ v_2\\\ vdots\\ vdots\\ v_m\\ end {array}\ derecha]\ cdot\ left [\ begin {array} {c} w_1\\ w_2\\ vdots\\ w_m\\ end {array}\ derecha] = v_1w_1 + v_2w_2 +\ ldots + v_mw_m\ texto {.} \ end {ecuación*}

    Lo importante a recordar es que el producto dot producirá un escalar. En otras palabras, los dos vectores se combinan de tal manera que se crea un número y, como veremos, este número transmite información geométrica importante.

    Ejemplo 6.1.2

    Calculamos el producto punto entre dos vectores de cuatro dimensiones como

    \ begin {ecuación*}\ left [\ begin {array} {c} 2\\ 0\\ -3\\ 1\\\ end {array}\ right]\ cdot\ left [\ begin {array} {c} -1\\ 3\\ 1\\ 2\\ end {array}\ right] = 2 (-1) + 0 (3) + (-3) (1) + 1 (2) = -3\ texto {.} \ end {ecuación*}

    Propiedades de los productos dot.

    Al igual que con la multiplicación ordinaria, el producto punto goza de algunas propiedades algebraicas familiares, como la conmutatividad y la distributividad. Más específicamente, no importa en qué orden calculemos el producto punto de dos vectores:

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf w =\ mathbf w\ cdot\ mathbf v\ texto {.} \ end {ecuación*}

    Si\(s\) es un escalar, tenemos

    \ begin {ecuación*} (s\ mathbf v)\ cdot\ mathbf w = s (\ mathbf v\ cdot\ mathbf w)\ texto {.} \ end {ecuación*}

    También podemos distribuir el producto punto a través de combinaciones lineales:

    \ begin {ecuación*} (c_1\ mathbf v_1+c_2\ mathbf v_2)\ cdot\ mathbf w = c_1\ mathbf v_1\ cdot\ mathbf w + c_2\ mathbf v_2\ cdot\ mathbf w\ text {.} \ end {ecuación*}
    Ejemplo 6.1.3

    Supongamos que\(\mathbf v_1\cdot\mathbf w = 4\) y\(\mathbf v_2\cdot\mathbf w = -7\text{.}\) Entonces

    \ begin {ecuación*}\ begin {alineado} (2\ mathbf v_1)\ cdot\ mathbf w & {} = {} 2 (\ mathbf v_1\ cdot\ mathbf w) = 2 (4) = 8\\ (-3\ mathbf v_1+ 2\ mathbf v_2)\ cdot\ mathbf w & {} = {} -3 (\ mathbf v_1\ cdot\ mathbf w) + 2 (\ mathbf v_2\ cdot\ mathbf w) = -3 (4) +2 (-7) = -26\ texto {.} \ end {alineado}\ end {ecuación*}

    La propiedad más importante del producto punto, y la verdadera razón de nuestro interés en él, es que nos da información geométrica sobre los vectores y su relación entre sí. Primero pensemos en la longitud de un vector observando el vector\(\mathbf v = \twovec32\) como se muestra en la Figura 6.1.4

    Figura 6.1.4. El vector\(\mathbf v\text{.}\)

    Podemos encontrar la longitud de este vector usando el teorema de Pitágoras ya que el vector forma la hiptonusa de un triángulo rectángulo que tiene una pata horizontal de longitud 3 y una pata vertical de longitud 2. La longitud de la\(\mathbf v\text{,}\) cual denotamos como\(\len{\mathbf v}\text{,}\) es por lo tanto\(\len{\mathbf v} = \sqrt{3^2 + 2^2} = \sqrt{13}\text{.}\) Ahora note que el producto de punto de\(\mathbf v\) consigo mismo es

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf v = 3 (3) + 2 (2) = 13 =\ len {\ mathbf v} ^2\ text {.} \ end {ecuación*}

    Esto es cierto en general; es decir, tenemos

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf v =\ len {\ mathbf v} ^2\ texto {.} \ end {ecuación*}

    Más que eso, el producto puntual de dos vectores registra información sobre el ángulo entre ellos. Considere la Figura 6.1.5.

    Figura 6.1.5. El producto de punto\(\mathbf v\cdot\mathbf w\) mide el ángulo\(\theta\text{.}\)

    Para ver esto, vamos a aplicar la Ley de Cosinos, que dice que

    \ begin {ecuación*}\ begin {alineado}\ len {\ mathbf w-\ mathbf v} ^2 & =\ len {\ mathbf v} ^2 +\ len {\ mathbf w} ^2 - 2\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\ (\ mathbf w-\ mathbf v)\ cdot (\ mathbf w-\ mathbf v) & =\ mathbf v\ cdot\ mathbf v +\ mathbf w\ cdot\ mathbf w - 2\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\\\ mathbf w\ cdot\ mathbf w +\ mathbf v\ cdot\ mathbf v- 2\ mathbf v\ cdot\ mathbf w & =\ mathbf v\ cdot\ mathbf v +\ mathbf v +\ mathbf w\ cdot\ mathbf w - 2\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\ -2\ mathbf v\ cdot\ cdot mathbf w & = -2\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\\\ mathbf v\ cdot\ mathbf w & =\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\\ final {alineado}\ final {ecuación*}

    El resultado de este razonamiento es que

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf w =\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\ text {.} \ end {ecuación*}

    Para resumir:

    Propiedades geométricas del producto punto.

    El producto dot nos da la siguiente información geométrica:

    \ begin {ecuación*}\ begin {alineado}\ mathbf v\ cdot\ mathbf v& =\ len {\ mathbf v} ^2\\\ mathbf v\ cdot\ mathbf w& =\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\\ end {alineado}\ end {ecuación*}

    donde\(\theta\) esta el angulo entre\(\mathbf v\) y\(\mathbf w\text{.}\)

    Actividad 6.1.2.

    1. Esbozar los vectores\(\mathbf v=\twovec32\) y\(\mathbf w=\twovec{-1}3\) usar la Figura 6.1.6.
      Figura 6.1.6. Esboza los vectores\(\mathbf v\) y\(\mathbf w\) aquí.
    2. Encuentra las longitudes\(\len{\mathbf v}\) y\(\len{\mathbf w}\) usando el producto punto.
    3. Encuentra el producto de punto\(\mathbf v\cdot\mathbf w\) y úsalo para encontrar el ángulo entre\(\mathbf v\) y\(\mathbf w\text{.}\)
    4. Considera el vector\(\mathbf x = \twovec{-2}{3}\text{.}\) Inclúyalo en tu boceto en la Figura 6.1.6 y encuentra el ángulo entre\(\mathbf v\) y\(\mathbf x\text{.}\)
    5. Si dos vectores son perpendiculares, ¿qué puedes decir de su producto punto? Explica tu forma de pensar.
    6. Para qué valor de\(k\) es el vector\(\twovec6k\) perpendicular a\(\mathbf w\text{?}\)
    7. Sage se puede utilizar para encontrar longitudes de vectores y sus productos de punto. Por ejemplo, si v y w son vectores, entonces v.norm () da la longitud de v y v * w da\(\mathbf v\cdot\mathbf w\text{.}\)

      Supongamos que

      \ begin {ecuación*}\ mathbf v=\ fourvec203 {-2},\ hspace {24pt}\ mathbf w=\ fourvec1 {-3} 41\ text {.} \ end {ecuación*}

      Usa la celda Sage a continuación para encontrar\(\len{\mathbf v}\text{,}\)\(\len{\mathbf w}\text{,}\)\(\mathbf v\cdot\mathbf w\text{,}\) y el ángulo entre\(\mathbf v\) y\(\mathbf w\text{.}\) Puedes usar arccos para encontrar la medida del ángulo expresada en radianes.

    A medida que avancemos, será importante que reconozcamos cuándo los vectores son perpendiculares entre sí. Por ejemplo, cuando los vectores\(\mathbf v\) y\(\mathbf w\) son perpendiculares, el ángulo entre ellos\(\theta=90^\circ\) y tenemos

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf w=\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta =\ len {\ mathbf v}\ len {\ mathbf w}\ cos90^\ circ = 0\ text {.} \ end {ecuación*}

    Por lo tanto, el producto punto entre vectores perpendiculares debe ser cero. Esto lleva a la siguiente definición.

    Definición 6.1.7
    Decimos que los vectores\(\mathbf v\) y\(\mathbf w\) son ortogonales si\(\mathbf v\cdot\mathbf w=0\text{.}\)

    En términos prácticos, dos vectores perpendiculares son ortogonales. Sin embargo, el concepto de ortogonalidad es algo más general porque permite que uno o ambos vectores sean el vector cero\(\zerovec\text{.}\)

    Ya hemos visto que el producto punto nos da información geométrica sobre vectores. También proporciona una manera de comparar vectores. Por ejemplo, consideremos los vectores\(\mathbf u\text{,}\)\(\mathbf v\text{,}\) y\(\mathbf w\text{,}\) se muestran en la Figura 6.1.8. Los vectores\(\mathbf v\) y\(\mathbf w\) parecen algo similares como las direcciones que definen son casi las mismas. Por comparación,\(\mathbf u\) parece bastante diferente a ambos\(\mathbf v\) y\(\mathbf w\text{.}\) mediremos la similitud de los vectores encontrando el ángulo entre ellos; cuanto menor sea el ángulo, más similares serán los vectores.

    Figura 6.1.8. ¿Cuáles de los vectores son más similares?

    Actividad 6.1.3.

    Esta actividad explora dos usos adicionales del producto punto comenzando con la similitud de los vectores.

    1. Nuestra primera tarea es evaluar la similitud entre varios artículos de Wikipedia formando vectores a partir de cada uno de los cinco artículos. En particular, se puede descargar el texto de un artículo de Wikipedia, eliminar palabras comunes, como “el” y “entonces”, contar el número de veces que aparecen las palabras restantes en el artículo y representar estos recuentos en un vector.

      Por ejemplo, evalúe la siguiente celda que carga en algunos comandos especiales junto con los vectores construidos a partir de los artículos de Wikipedia sobre el Día de los Veteranos, el Día de los Caídos, el Día del Trabajo, los Premios Globo de Oro y el Super Bowl Para cada uno de los cinco artículos, verá una lista del número de veces que aparecen 10 palabras en estos artículos. Por ejemplo, la palabra “acto” aparece 3 veces en el artículo del Día del Veterano y 0 veces en el artículo del Día del Trabajo.

      Para cada uno de los cinco artículos, obtenemos vectores 604-dimensionales, que se denominan veteranos, memorial, laboral, dorado y súper.
      1. Supongamos que dos artículos no tienen palabras en común. ¿Cuál es el valor del producto punto entre sus vectores correspondientes? ¿Qué dice esto sobre el ángulo entre estos vectores?
      2. Supongamos que hay dos artículos sobre el mismo tema, sin embargo, un artículo es dos veces es largo. ¿Qué relación aproximada esperarías mantener entre los dos vectores? ¿Qué dice esto sobre el ángulo entre ellos?
      3. Usa la celda de Sage a continuación para encontrar el ángulo entre los veteranos del vector y los otros cuatro vectores. Para expresar el ángulo en grados, utilice el comando degrees (x), que da el número de grados en x radianes.
      4. Compara los cuatro ángulos que has encontrado y discute lo que significan sobre la similitud entre el artículo del Día de los Veteranos y los otros cuatro. ¿Tu resultado refleja la naturaleza de estos cinco eventos?
    2. A menudo se utilizan vectores para representar cómo cambia una cantidad con el tiempo. Por ejemplo, el vector\(\mathbf s=\fourvec{78.3}{81.2}{82.1}{79.0}\) podría representar el valor de las acciones de una compañía en cuatro días consecutivos. Cuando se interpreta de esta manera, llamamos a un vector una serie de tiempo. Evaluar la celda de Sage a continuación para ver una representación de dos series de tiempo\(\mathbf s_1\text{,}\)\(\mathbf s_2\text{,}\) en azul, y en naranja, que imaginamos representan el valor de dos acciones durante un periodo de tiempo. (Esta celda se basa en algunos datos cargados por la primera celda en esta actividad).
      A pesar de que una acción tiene un valor mayor que la otra, las dos parecen estar relacionadas ya que parecen subir y bajar de formas más o menos similares. A menudo decimos que están correlacionados, y nos gustaría medir el grado en que se correlacionan.
      1. Para comparar las formas en que suben y bajan, primero degradaremos las series de tiempo; es decir, para cada serie temporal, restaremos su valor promedio para obtener una nueva serie temporal. Hay un comando demean (s) que devuelve la serie de tiempo demeaned de s. Utilice la celda de Sage a continuación para degradar la serie\(\mathbf s_1\) y\(\mathbf s_2\) y trazar.
      2. Si las series degradadas son\(\tilde{\mathbf s}_1\) y\(\tilde{\mathbf s}_2\text{,}\) entonces la correlación entre\(\mathbf s_1\) y\(\mathbf s_2\) se define para ser
        \ begin {ecuación*}\ corr (\ mathbf s_1,\ mathbf s_2) =\ frac {\ tilde {\ mathbf s} _1\ cdot\ tilde {\ mathbf s} _2} {\ len {\ tilde {\ mathbf s} _1}\ len {\ tilde {\ mathbf s} _2}}. \ end {ecuación*}

        Dada la interpretación geométrica del producto punto, la correlación es igual al coseno del agle entre las series de tiempo degradadas, y por lo tanto\(\corr(\mathbf s_1,\mathbf s_2)\) está entre -1 y 1.

        Encuentra la correlación entre\(\mathbf s_1\) y\(\mathbf s_2\text{.}\)

      3. Supongamos que dos series temporales son tales que sus series temporales degradadas son múltiplos escalares entre sí, como en la Figura 6.1.9
        Figura 6.1.9. A la izquierda, las series temporales degradadas son múltiplos escalares positivos entre sí. A la derecha, son múltiplos escalares negativos.

        Supongamos que tenemos series de tiempo\(\mathbf t_1\) y\(\mathbf t_2\) cuyas series de tiempo degradadas\(\tilde{\mathbf t}_1\) y\(\tilde{\mathbf t}_2\) son múltiplos escalares positivos entre sí. ¿Cuál es el ángulo entre los vectores degradados? Qué dice esto sobre la correlación\(\corr(\mathbf t_1, \mathbf t_2)\text{?}\)

      4. Supongamos que las series de tiempo demeanadas\(\tilde{\mathbf t}_1\) y\(\tilde{\mathbf t}_2\) son múltiplos escalares negativos entre sí, ¿cuál es el ángulo entre los vectores degradados? Qué dice esto sobre la correlación\(\corr(\mathbf t_1, \mathbf t_2)\text{?}\)
      5. Utilice la celda de Sage a continuación para trazar las series de tiempo\(\mathbf s_1\)\(\mathbf s_3\) y encontrar su correlación.
      6. Utilice la celda de Sage a continuación para trazar las series de tiempo\(\mathbf s_1\)\(\mathbf s_4\) y encontrar su correlación.

    \(k\)-significa agrupación

    Un problema típico en la ciencia de datos es encontrar algunos patrones subyacentes en un conjunto de datos. Supongamos, por ejemplo, que tenemos el conjunto de 177 puntos de datos trazados en la Figura 6.1.10. Observe que los puntos no están dispersos por ahí al azar; en cambio, parecen formar cúmulos. Nuestro objetivo aquí es desarrollar una estrategia para detectar los clusters.

    Figura 6.1.10. Un conjunto de 177 puntos de datos.

    Para ver cómo esto podría ser útil, supongamos que tenemos datos médicos que describen a un grupo de pacientes, algunos de los cuales han sido diagnosticados con un padecimiento específico, como la diabetes. Quizás tenemos un registro de edad, peso, azúcar en la sangre, colestrol y otros atributos para cada paciente. Podría ser que los puntos de datos para el grupo diagnosticado con el padecimiento formen un cluster que es algo distinto del resto de los datos. Supongamos que somos capaces de identificar ese cluster y que luego se nos presenta un nuevo paciente que no ha sido probado para el padecimiento. Si los atributos de ese paciente los colocan en ese clúster, podríamos identificarlos como en riesgo de padecer la afección y priorizarlos para los exámenes adecuados.

    Si hay muchos atributos para cada paciente, los datos pueden ser de alta dimensión y no se visualizan fácilmente. Por lo tanto, nos gustaría desarrollar un algoritmo que separe los puntos de datos en clusters sin intervención humana. Llamamos al resultado un clustering.

    La siguiente actividad introduce una técnica, llamada\(k\) -means clustering, que nos ayuda a encontrar clusterings. Para ello, veremos los puntos de datos como vectores de manera que la distancia entre dos puntos de datos sea igual a la longitud del vector que los une.

    Actividad 6.1.4.

    Para comenzar, identificamos el centroide, o el promedio, de un conjunto de vectores\(\mathbf v_1, \mathbf v_2, \ldots,\mathbf v_n\) como

    \ begin {ecuación*}\ frac1n\ left (\ mathbf v_1+\ mathbf v_2+\ ldots+\ mathbf v_n\ right). \ end {ecuación*}
    1. Encuentra el centroide de los vectores
      \ begin {ecuación*}\ mathbf v_1=\ twovec11,\ mathbf v_2=\ twovec41,\ mathbf v_3=\ twovec44. \ end {ecuación*}

      y esbozar los vectores y el centroide utilizando la Figura 6.1.11. Es posible que desee simplemente trazar los puntos representados por las puntas de los vectores en lugar de dibujar los propios vectores.

      Figura 6.1.11. Los vectores\(\mathbf v_1\text{,}\)\(\mathbf v_2\text{,}\)\(\mathbf v_3\) y su centroide.

      Observe que el centroide se encuentra en el centro de los puntos definidos por los vectores.

    2. Ahora vamos a ilustrar un algoritmo que forma clusterings. Para comenzar, considere los siguientes puntos, representados como vectores,
      \ begin {ecuación*}\ mathbf v_1=\ twovec {-2} {1},\ mathbf v_2=\ twovec11,\ mathbf v_3=\ twovec12,\ mathbf v_4=\ twovec32,\ end {ecuación*}

      que se muestran en la Figura 6.1.12.

      Figura 6.1.12. Agruparemos este conjunto de cuatro puntos en dos cúmulos.

      Supongamos que nos gustaría agrupar estos puntos en\(k=2\) clusters. (Más adelante, veremos cómo elegir un valor apropiado para\(k\text{,}\) el número de clústeres). Comenzamos eligiendo dos puntos\(c_1\) y\(c_2\) al azar y declarándolos como los “centros” 'de los dos cúmulos.

      Por ejemplo, supongamos que elegimos aleatoriamente\(c_1=\mathbf v_2\) y\(c_2=\mathbf v_3\) como el centro de dos clusters. El clúster centrado en\(c_1=\mathbf v_2\) será el conjunto de puntos que están más cerca que\(c_2=\mathbf v_3\text{.}\) Determinar cuál de los cuatro puntos de datos se encuentran en este clúster, que denotamos por\(C_1\text{,}\) y los rodeamos en la Figura 6.1.12.\(c_1=\mathbf v_2\)

    3. El segundo clúster consistirá en los puntos de datos que están más cerca de\(c_1=\mathbf v_2\text{.}\) Determinar cuál de los cuatro puntos se encuentran en este clúster, que denotamos por\(C_2\text{,}\) y los rodeamos en la Figura 6.1.12.\(c_2=\mathbf v_3\)
    4. Ahora tenemos un clustering con dos clusters, pero intentaremos mejorarlo de la siguiente manera. Primero, encontrar los centroides de los dos cúmulos; es decir, redefinir\(c_1\) para ser el centroide de cluster\(C_1\) y\(c_2\) para ser el centroide de\(C_2\text{.}\) Encuentra esos centroides e indicarlos en la Figura 6.1.13
      Figura 6.1.13. Indicar los nuevos centroides y clústeres.

      Ahora actualice el clúster\(C_1\) para que sea el conjunto de puntos más cercano\(c_1\) que\(c_2\text{.}\) Actualizar el clúster de\(C_2\) manera similar e indicar los clústeres en la Figura 6.1.13.

    5. Realicemos de nuevo este último paso. Es decir, actualice los centroides\(c_1\) y\(c_2\) desde los nuevos clústeres y luego actualice los clústeres\(C_1\) e\(C_2\text{.}\) Indique sus centroides y clústeres en la Figura 6.1.14
      Figura 6.1.14. Indicar los nuevos centroides y clústeres.

      Observe que este último paso produce el mismo conjunto de clústeres por lo que no tiene sentido repetirlo. Declaramos que este es nuestro agrupamiento final.

    Esta actividad demuestra nuestro algoritmo para encontrar un clustering. Primero elegimos un valor\(k\) y buscamos romper los puntos de datos en\(k\) clústeres. El algoritmo procede de la siguiente manera:

    • Elija\(k\) puntos\(c_1, c_2, \ldots, c_k\) al azar de nuestro conjunto de datos.
    • Construya el clúster\(C_1\) como el conjunto de puntos de datos más cercanos\(c_1\text{,}\)\(C_2\) como el conjunto de puntos de datos más cercanos\(c_2\text{,}\) y así sucesivamente.
    • Repita lo siguiente hasta que los clústeres ya no cambien:
      • Encuentra los centroides\(c_1, c_2,\ldots,c_k\) de los clústeres actuales.
      • Actualizar los clústeres\(C_1,C_2,\ldots,C_k\text{.}\)

    Los clusterings que encontramos dependen de la elección aleatoria inicial de puntos\(c_1, c_2,\ldots, c_k\text{.}\) Por ejemplo, en la actividad anterior, llegamos, con la elección inicial\(c_1= \mathbf v_2\) y\(c_2=\mathbf v_3\text{,}\) en el clustering:

    \ begin {ecuación*}\ begin {array} {rcl} C_1 & {} = {} &\ {\ mathbf v_1\}\\ C_2 & {} = {} &\ {\ mathbf v_2,\ mathbf v_3,\ mathbf v_4\}. \ end {array}\ end {ecuación*}

    Si en cambio elegimos los puntos iniciales para ser\(c_1 = \mathbf v_3\) y finalmente\(c_2=\mathbf v_4\text{,}\) encontramos el clustering:

    \ begin {ecuación*}\ begin {array} {rcl} C_1 & {} = {} &\ {\ mathbf v_1,\ mathbf v_2,\ mathbf v_3\}\\ C_2 & {} = {} &\ {\ mathbf v_4\}. \ end {array}\ end {ecuación*}

    ¿Hay alguna manera de determinar qué clustering es el mejor de los dos? Parece que una mejor agrupación será aquella para la que los puntos en un clúster estén, en promedio, más cerca del centroide de su clúster. Si tenemos un clustering, por lo tanto definimos una función, llamada el objetivo, que mide el promedio del cuadrado de la distancia desde cada punto hasta el centroide del cluster al que pertenece ese punto. Una agrupación con un objetivo más pequeño tendrá clústeres más estrechamente centrados alrededor de sus centroides, lo que debería resultar en una mejor agrupación.

    Por ejemplo, cuando obtenemos el clustering:

    \ begin {ecuación*}\ begin {array} {rcl} C_1 & {} = {} &\ {\ mathbf v_1,\ mathbf v_2,\ mathbf v_3\}\\ C_2 & {} = {} &\ {\ mathbf v_4\}. \ end {array}\ end {ecuación*}

    con centroides\(c_1=\twovec{0}{4/3}\) y\(c_2=\mathbf v_4=\twovec32\text{,}\) encontramos el objetivo de ser

    \ begin {ecuación*}\ frac14\ izquierda (\ len {\ mathbf v_1-c_1} ^2 +\ len {\ mathbf v_2-c_1} ^2 +\ len {\ mathbf v_3-c_1} ^2 +\ len {\ mathbf v_4-c_2} ^2\ right) =\ frac 53. \ end {ecuación*}

    Actividad 6.1.5.

    Ahora usaremos el objetivo para comparar clústeres y elegir un valor apropiado de\(k\text{.}\)

    1. En la actividad anterior, una elección inicial de\(c_1\) y\(c_2\) condujo a la agrupación:
      \ begin {ecuación*}\ begin {array} {rcl} C_1 & {} = {} &\ {\ mathbf v_1\}\\ C_2 & {} = {} &\ {\ mathbf v_2,\ mathbf v_3,\ mathbf v_4\}\ end {array}\ end {equation*}

      con centroides\(c_1=\mathbf v_1\) y\(c_2=\twovec{5/3}{5/3}\text{.}\) Encuentra el objetivo de esta agrupación.

    2. Ahora hemos visto dos conglomerados y calculado sus objetivos. Recordemos que nuestro conjunto de datos se muestra en la Figura 6.1.12. ¿Cuál de los dos racimos se siente como el mejor ajuste? ¿Cómo se refleja este ajuste en los valores de los objetivos?
    3. Al evaluar la siguiente celda se cargará y mostrará un conjunto de datos que consta de 177 puntos de datos. Este conjunto de datos tiene los datos de nombre.
      Dada esta gráfica de los datos, ¿qué parecería un número razonable de clusters?
    4. En la siguiente celda, puede elegir un valor de\(k\) y luego ejecutar el algoritmo para determinar y mostrar una agrupación y su objetivo. Si ejecuta el algoritmo varias veces con el mismo valor de\(k\text{,}\) usted probablemente verá diferentes clusterings teniendo diferentes objetivos. Esto es natural ya que nuestro algoritmo comienza haciendo una elección aleatoria de puntos\(c_1,c_2,\ldots,c_k\text{,}\) y una elección diferente puede conducir a diferentes agrupamientos. Elija un valor de\(k\) y ejecute el algoritmo varias veces. Observe que los clusterings que tienen objetivos más bajos parecen encajar mejor los datos. Repita este experimento con algunos valores diferentes de\(k\text{.}\)
    5. Para un valor dado de\(k\text{,}\) nuestra estrategia es ejecutar el algoritmo varias veces y elegir el clustering con el objetivo más pequeño. Después de elegir un valor de\(k\text{,}\) la siguiente celda se ejecutará el algoritmo 10 veces y se mostrará el clustering teniendo el objetivo más pequeño.

      Para cada valor de\(k\) entre 2 y 9, encuentre el agrupamiento que tenga el objetivo más pequeño y grafique sus hallazgos en la Figura 6.1.15.

      Figura 6.1.15. Construir una parcela del objetivo mínimo ya que depende de la elección de\(k\text{.}\)

      Esta parcela se denomina parcela de codo debido a su forma. Observe cómo el objetivo disminuye bruscamente cuando\(k\) es pequeño, pero luego se aplana. Esto lleva a una ubicación, llamada codo, donde el objetivo pasa de ser bruscamente decreciente a relativamente plano. Esto significa que aumentar\(k\) más allá del codo no disminuye significativamente el objetivo, lo que hace que el codo sea una buena opción para\(k\text{.}\)

      ¿Dónde ocurre el codo en tu parcela de arriba? ¿Cómo se compara esto con el mejor valor de lo\(k\) que estimaste simplemente mirando los datos en el ítem c.

    Por supuesto, podríamos aumentar\(k\) hasta que cada punto de datos sea su propio clúster. Sin embargo, esto derrota el punto de la técnica, que es agrupar puntos de datos cercanos con la esperanza de que compartan características comunes, proporcionando así una visión de la estructura de los datos.

    Ahora hemos visto cómo nuestro algoritmo y el objetivo identifican un valor razonable para\(k\text{,}\) el número de los clusters, y producen un buen clustering teniendo\(k\) clusters. Tenga en cuenta que no pretendemos haber encontrado el mejor agrupamiento, ya que la verdadera prueba de cualquier agrupación será en cómo nos ayuda a comprender el conjunto de datos y nos ayuda a hacer predicciones para cualquier dato nuevo que podamos encontrar.

    Resumen

    Esta sección introdujo el producto punto y la capacidad de investigar las relaciones geométricas entre vectores.

    • El punto producto de dos vectores\(\mathbf v\) y\(\mathbf w\) satisface estas propiedades:
      \ begin {ecuación*}\ begin {array} {rcl}\ mathbf v\ cdot\ mathbf v & {} = {} &\ len {\ mathbf v} ^2\\\ mathbf v\ cdot\ mathbf w & {} = {} &\ len {\ mathbf v}\ len {\ mathbf w}\ cos\ theta\\ end {array}\ end {ecuación*}

      donde\(\theta\) esta el angulo entre\(\mathbf v\) y\(\mathbf w\text{.}\)

    • Los vectores\(\mathbf v\) y\(\mathbf w\) son ortogonales cuando\(\mathbf v\cdot\mathbf w= 0\text{.}\)
    • Se exploraron algunas aplicaciones del producto punto a la similitud de vectores, correlación de series de tiempo y\(k\) agrupamiento de medias.

    Ejercicios 6.1.4Ejercicios

    1

    Considerar los vectores

    \ begin {ecuación*}\ mathbf v=\ fourvec203 {-2},\ hspace {24pt}\ mathbf w=\ fourvec1 {-3} 41. \ end {ecuación*}
    1. Encuentra las longitudes de los vectores,\(\len{\mathbf v}\) y\(\len{\mathbf w}\text{.}\)
    2. Encuentra el producto de punto\(\mathbf v\cdot\mathbf w\) y úsalo para encontrar el ángulo\(\theta\) entre\(\mathbf v\) y\(\mathbf w\text{.}\)
    2

    Considera los tres vectores

    \ begin {ecuación*}\ mathbf u =\ tresvec1 {-2} 2,\ hespacio {24pt}\ mathbf v =\ tresvec111,\ hespacio {24pt}\ mathbf w =\ tresvec02 {-1}. \ end {ecuación*}
    1. Encuentra los productos punto\(\mathbf u\cdot\mathbf u\text{,}\)\(\mathbf u\cdot\mathbf v\text{,}\) y\(\mathbf u\cdot\mathbf w\text{.}\)
    2. Usa los productos punto que acabas de encontrar para evaluar:
      1. \(\len{\mathbf u}\text{.}\)
      2. \((-5\mathbf u)\cdot\mathbf v\text{.}\)
      3. \(\mathbf u\cdot(-3\mathbf v+2\mathbf w)\text{.}\)
      4. \(\len{\frac1{\len{\mathbf u}} \mathbf u}\text{.}\)
    3. Para qué valor de\(k\) es\(\mathbf u\) ortogonal a\(k\mathbf v+5\mathbf w\text{?}\)
    3

    Supongamos que\(\mathbf v\) y\(\mathbf w\) son vectores donde

    \ begin {ecuación*}\ mathbf v\ cdot\ mathbf v = 4,\ hspace {24pt}\ mathbf w\ cdot\ mathbf w = 20,\ hspace {24pt}\ mathbf v\ cdot\ mathbf w=8. \ end {ecuación*}
    1. ¿Qué es\(\len{\mathbf v}\text{?}\)
    2. ¿Cuál es el ángulo entre\(\mathbf v\) y\(\mathbf w\text{?}\)
    3. Supongamos que\(t\) es un escalar. Encuentra el valor de\(t\) para el cual\(\mathbf v\) es ortogonal a\(\mathbf w+t\mathbf v\text{?}\)
    4

    Supongamos que\(\mathbf v=3\mathbf w\text{.}\)

    1. ¿Cuál es la relación entre\(\mathbf v\cdot\mathbf v\) y\(\mathbf w\cdot\mathbf w\text{?}\)
    2. ¿Cuál es la relación entre\(\len{\mathbf v}\) y\(\len{\mathbf w}\text{?}\)
    3. Si\(\mathbf v=s\mathbf w\) para algún escalar\(s\text{,}\) cuál es la relación entre\(\mathbf v\cdot\mathbf v\) y\(\mathbf w\cdot\mathbf w\text{?}\) Cuál es la relación entre\(\len{\mathbf v}\) y\(\len{\mathbf w}\text{?}\)
    4. Supongamos que\(\mathbf v=\threevec{3}{-2}2\text{.}\) Encuentra un escalar\(s\) para que\(s\mathbf v\) tenga longitud 1.
    5

    Dados vectores\(\mathbf v\) y\(\mathbf w\text{,}\) explicar por qué

    \ begin {ecuación*}\ len {\ mathbf v+\ mathbf w} ^2 +\ len {\ mathbf v-\ mathbf w} ^2 = 2\ len {\ mathbf v} ^2 + 2\ len {\ mathbf w} ^2. \ end {ecuación*}

    Esbozar dos vectores\(\mathbf v\)\(\mathbf w\) y explicar por qué este hecho se llama la ley del paralelogam.

    6

    Considerar los vectores

    \ begin {ecuación*}\ mathbf v_1=\ tresvec204,\ hspace {24pt}\ mathbf v_2=\ threevec {-1} 2 {-4}. \ end {ecuación*}

    y un vector general\(\mathbf x=\threevec xyz\text{.}\)

    1. Escribe una ecuación en términos de\(x\text{,}\)\(y\text{,}\) y\(z\) que describa todos los vectores\(\mathbf x\) ortogonales a\(\mathbf v_1\text{.}\)
    2. Escribir un sistema lineal que describa todos los vectores\(\mathbf x\) ortogonales a ambos\(\mathbf v_1\) y\(\mathbf v_2\text{.}\)
    3. Escriba el conjunto de soluciones a este sistema lineal en forma paramétrica. ¿Qué tipo de objeto geométrico representa este conjunto de soluciones? Indicar con un boceto aproximado por qué esto tiene sentido.
    4. Dar una descripción paramétrica de todos los vectores ortogonales a\(\mathbf v_1\text{.}\) ¿Qué tipo de objeto geométrico representa esto? Indicar con un boceto aproximado por qué esto tiene sentido.
    7

    Explique sus respuestas a estas preguntas.

    1. Supongamos que\(\mathbf v\) es ortogonal a ambos\(\mathbf w_1\) y\(\mathbf w_2\text{.}\) puede garantizar que también\(\mathbf v\) es ortogonal a cualquier combinación lineal\(c_1\mathbf w_1+c_2\mathbf w_2\text{?}\)
    2. Supongamos que\(\mathbf v\) es ortogonal a sí mismo. ¿Qué puedes decir sobre\(\mathbf v\text{?}\)
    8

    Supongamos que\(\mathbf v_1\text{,}\)\(\mathbf v_2\text{,}\) y\(\mathbf v_3\) formar una base para\(\mathbb R^3\) y que cada vector es ortogonal a los otros dos. Supongamos también que\(\mathbf v\) es otro vector en\(\mathbb R^3\text{.}\)

    1. Explicar por qué\(\mathbf v=c_1\mathbf v_1+c_2\mathbf v_2+c_3\mathbf v_3\) para algunos escalares\(c_1\text{,}\)\(c_2\text{,}\) y\(c_3\text{.}\)
    2. Comenzando con la expresión
      \ begin {ecuación*}\ mathbf v\ cdot\ mathbf v_1 = (c_1\ mathbf v_1+c_2\ mathbf v_2+c_3\ mathbf v_3)\ cdot\ mathbf v_1,\ end {ecuación*}

      aplicar la propiedad distributiva de los productos punto para explicar por qué

      \ begin {ecuación*} c_1=\ frac {\ mathbf v\ cdot\ mathbf v_1} {\ mathbf v_1\ cdot\ mathbf v_1}. \ end {ecuación*}

      Encuentra expresiones similares para\(c_2\) y\(c_3\text{.}\)

    3. Verifica que
      \ begin {ecuación*}\ mathbf v_1=\ tresvec121,\ hspace {24pt}\ mathbf v_2=\ threevec1 {-1} 1,\ hspace {24pt}\ mathbf v_3=\ threevec10 {-1}\ end {ecuación*}

      forman una base para\(\mathbb R^3\) y que cada vector es ortogonal a los otros dos. Usa lo que has descubierto en este problema para escribir el vector\(\mathbf v=\threevec35{-1}\) como una combinación lineal de\(\mathbf v_1\text{,}\)\(\mathbf v_2\text{,}\) y\(\mathbf v_3\text{.}\)

    9

    Supongamos que\(\mathbf v_1\text{,}\)\(\mathbf v_2\text{,}\) y\(\mathbf v_3\) son tres vectores distintos de cero que son ortogonales por pares; es decir, cada vector es ortogonal a los otros dos.

    1. Explicar por qué\(\mathbf v_3\) no puede ser una combinación lineal de\(\mathbf v_1\) y\(\mathbf v_2\text{.}\)
    2. Explique por qué este conjunto de tres vectores es linealmente independiente.
    10

    En el siguiente capítulo, consideraremos ciertas\(n\times n\) matrices\(A\) y definiremos una función

    \ begin {ecuación*} q (\ mathbf x) =\ mathbf x\ cdot (A\ mathbf x),\ end {ecuación*}

    donde\(\mathbf x\) es un vector en\(\mathbb R^n\text{.}\)

    1. Supongamos que\(A=\begin{bmatrix} 1 & 2 \\ 2 & 1 \\ \end{bmatrix}\) y\(\mathbf x=\twovec21\text{.}\) Evaluar\(q(\mathbf x) = \mathbf x\cdot(A\mathbf x)\text{.}\)
    2. Para un vector general\(\mathbf x=\twovec xy\text{,}\) evaluar\(q(\mathbf x) = \mathbf x\cdot(A\mathbf x)\) como una expresión que implica\(x\) y\(y\text{.}\)
    3. Supongamos que\(\mathbf v\) es un vector propio de una matriz\(A\) con valor propio asociado\(\lambda\) y que\(\mathbf v\) tiene longitud 1. Cuál es el valor de la función\(q(\mathbf x)\text{?}\)
    11

    De vuelta en la Sección 1.1, vimos que las ecuaciones de la forma\(Ax+By = C\) representan líneas en el plano. En esta exericse, veremos cómo esta expresión surge geométricamente.

    Figura 6.1.16. Una línea, un punto\(\mathbf p\) en la línea y un vector\(\mathbf n\) perpendicular a la línea.
    1. Encuentra la pendiente y la intercepción vertical de la línea que se muestra en la Figura 6.1.16. Luego escribe una ecuación para la línea en el formulario\(y=mx+b\text{.}\)
    2. Supongamos que\(\mathbf p\) es un punto en la línea, que\(\mathbf n\) es un vector perpendicular a la línea, y ese\(\mathbf x=\twovec xy\) es un punto general en la línea. Dibuje el vector\(\mathbf x-\mathbf p\) y describa el ángulo entre este vector y el vector\(\mathbf n\text{.}\)
    3. Cuál es el valor del producto punto\(\mathbf n\cdot(\mathbf x - \mathbf p)\text{?}\)
    4. Explicar por qué la ecuación de la línea se puede escribir en la forma\(\mathbf n\cdot\mathbf x = \mathbf n\cdot\mathbf p\text{.}\)
    5. Identifique los vectores\(\mathbf p\) y\(\mathbf n\) para la línea ilustrada en la Figura 6.1.16 y utilícelos para escribir la ecuación de la línea en términos de\(x\) y\(y\text{.}\) Verifique que esta expresión sea algebraicamente equivalente a la ecuación\(y=mx+b\) que encontró anteriormente para esta línea.
    6. Explicar por qué cualquier línea en el plano puede ser descrita por una ecuación que tiene la forma\(Ax+By = C\text{.}\) Cuál es la significación del vector\(\twovec AB\text{?}\)

    This page titled 6.1: El Producto Dot is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by David Austin via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.