SlideShare una empresa de Scribd logo
1 de 24
Descargar para leer sin conexión
Técnicas de
Agrupamiento
Medidas de semejanza.
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
! Los elementos del mismo grupo sean lo más parecido
posible.
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
! Los elementos del mismo grupo sean lo más parecido
posible.
! Los elementos de grupos diferentes sean lo más
diferente posible.
Agrupamiento
! Las técnicas de agrupamiento buscan crear
colecciones de datos con base en una medida de
semejanza.
! A través de una medida de semejanza son
comparados los elementos de todo el conjunto.
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
! Esta medida de semejanza está basada
comúnmente en una función de distancia,
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
! Esta medida de semejanza está basada
comúnmente en una función de distancia,
! euclidiana,
! Manhatan,
! Minkowski,
! Coseno,
! etc.
Medidas de Semejanza
! Los grupos formados con base en estas medidas,
son de tal forma que dos datos en el mismo grupo
tiene un valor de distancia mínima, mientras que
dos datos de grupos diferentes presentan un valor
de distancia máximo, esta distancia se denomina
distancia del grupo.
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Grupo1 Grupo2
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Grupo1 Grupo2
Distancia muy grande
entre puntos del
conjunto
Distancia
pequeña entre
puntos del
conjunto.
Medidas de Semejanza
Distancia Euclidiana
! Considerada como la métrica estándar para
problemas geométricos.
Medidas de Semejanza
Distancia Euclidiana
! Considerada como la métrica estándar para
problemas geométricos.
! La distancia euclidiana no es más que la raíz
cuadrada de la diferencia entre las coordenadas de
un par de objetos.
DXY = Xik − Xjk
( )
2
k=1
m
∑
Medidas de Semejanza
Distancia Coseno
! Determina la semejanza entre dos vectores
n-dimensionales a través del ángulo que se
forma entre ellos.
cosθ =
A⋅ B
A B
Medidas de Semejanza
Distancia Coseno
! Determina la semejanza entre dos vectores
n-dimensionales a través del ángulo que se
forma entre ellos.
! Esta medida va de [0, π], así que:
! Un valor de π significa que son opuestos.
! Un valor de π/2 significa independientes.
! Un valor de 0 significa iguales.
cosθ =
A⋅ B
A B
Medidas de Semejanza
Distancia Manhatan
! Es la distancia entre dos pares de puntos a lo largo
de ejes perpendiculares.
DXY = Xik − Xjk + Yik −Yjk
Medidas de Semejanza
Distancia Manhatan
! Es la distancia entre dos pares de puntos a lo largo
de ejes perpendiculares.
DXY = Xik − Xjk + Yik −Yjk
*Imagen tomada de internet
Figura 1*
Medidas de Semejanza
Distancia Jaccard
! La distancia Jaccard mide la semejanza de dos
conjuntos de datos y se calcula de la siguiente
forma:
J(A, B) =
A∩B
A∪B
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
J(A, B) =
A∩B
A∪B
= ?
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
A∪B =
A∩B =
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
J(A, B) =
A∩B
A∪B
=
2
7
= 0.286
A∪B =
A∩B =
Medidas de Semejanza
Distancia Minkowski
! La distancia de Minkowski es una métrica
generalizada de distancia euclidiana y distancia de
Manhattan.
DXY = Xik − Xjk
1
p
k=1
d
∑
⎛
⎝
⎜
⎞
⎠
⎟
p
Medidas de Semejanza
Distancia Minkowski
! La distancia de Minkowski es una métrica
generalizada de distancia euclidiana y distancia de
Manhattan.
! Si p=1 tenemos la distancia Manhatan.
! Si p=2 tenemos la distancia Euclidiana.
DXY = Xik − Xjk
p
k=1
d
∑
( )
1
p

Más contenido relacionado

Más de Carlos Paredes

descriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxdescriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxCarlos Paredes
 
Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfCarlos Paredes
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfCarlos Paredes
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencionCarlos Paredes
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloCarlos Paredes
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosCarlos Paredes
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdfCarlos Paredes
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxCarlos Paredes
 

Más de Carlos Paredes (13)

descriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxdescriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptx
 
Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdf
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencion
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencillo
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismos
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdf
 
Squim .pdf
Squim .pdfSquim .pdf
Squim .pdf
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptx
 
MAS1.pdf
MAS1.pdfMAS1.pdf
MAS1.pdf
 
Modulo IV CV.pptx
Modulo IV CV.pptxModulo IV CV.pptx
Modulo IV CV.pptx
 
Examen.docx
Examen.docxExamen.docx
Examen.docx
 
Servidores.pptx
Servidores.pptxServidores.pptx
Servidores.pptx
 

Último

osciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdfosciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdfIvanRetambay
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaAlexanderimanolLencr
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptMarianoSanchez70
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdfvictoralejandroayala2
 
Ingeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedicaIngeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedicaANACENIMENDEZ1
 
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOPERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOFritz Rebaza Latoche
 
Obras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónObras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónXimenaFallaLecca1
 
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023RonaldoPaucarMontes
 
clasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesclasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesMIGUELANGEL2658
 
Quimica Raymond Chang 12va Edicion___pdf
Quimica Raymond Chang 12va Edicion___pdfQuimica Raymond Chang 12va Edicion___pdf
Quimica Raymond Chang 12va Edicion___pdfs7yl3dr4g0n01
 
Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfedsonzav8
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdfCristhianZetaNima
 
TERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOL
TERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOLTERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOL
TERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOLdanilojaviersantiago
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfbcondort
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptxBRAYANJOSEPTSANJINEZ
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfXimenaFallaLecca1
 
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxProcesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxJuanPablo452634
 

Último (20)

osciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdfosciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdf
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiología
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdf
 
Ingeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedicaIngeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedica
 
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOPERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
 
Obras paralizadas en el sector construcción
Obras paralizadas en el sector construcciónObras paralizadas en el sector construcción
Obras paralizadas en el sector construcción
 
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
 
clasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesclasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias locales
 
Quimica Raymond Chang 12va Edicion___pdf
Quimica Raymond Chang 12va Edicion___pdfQuimica Raymond Chang 12va Edicion___pdf
Quimica Raymond Chang 12va Edicion___pdf
 
Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdf
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
 
TERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOL
TERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOLTERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOL
TERMODINAMICA YUNUS SEPTIMA EDICION, ESPAÑOL
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
 
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxProcesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
 

tecnicas_agrupamiento de datos para analisis

  • 2. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que
  • 3. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que ! Los elementos del mismo grupo sean lo más parecido posible.
  • 4. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que ! Los elementos del mismo grupo sean lo más parecido posible. ! Los elementos de grupos diferentes sean lo más diferente posible.
  • 5. Agrupamiento ! Las técnicas de agrupamiento buscan crear colecciones de datos con base en una medida de semejanza. ! A través de una medida de semejanza son comparados los elementos de todo el conjunto.
  • 6. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto.
  • 7. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto. ! Esta medida de semejanza está basada comúnmente en una función de distancia,
  • 8. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto. ! Esta medida de semejanza está basada comúnmente en una función de distancia, ! euclidiana, ! Manhatan, ! Minkowski, ! Coseno, ! etc.
  • 9. Medidas de Semejanza ! Los grupos formados con base en estas medidas, son de tal forma que dos datos en el mismo grupo tiene un valor de distancia mínima, mientras que dos datos de grupos diferentes presentan un valor de distancia máximo, esta distancia se denomina distancia del grupo.
  • 10. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos.
  • 11. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos. Grupo1 Grupo2
  • 12. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos. Grupo1 Grupo2 Distancia muy grande entre puntos del conjunto Distancia pequeña entre puntos del conjunto.
  • 13. Medidas de Semejanza Distancia Euclidiana ! Considerada como la métrica estándar para problemas geométricos.
  • 14. Medidas de Semejanza Distancia Euclidiana ! Considerada como la métrica estándar para problemas geométricos. ! La distancia euclidiana no es más que la raíz cuadrada de la diferencia entre las coordenadas de un par de objetos. DXY = Xik − Xjk ( ) 2 k=1 m ∑
  • 15. Medidas de Semejanza Distancia Coseno ! Determina la semejanza entre dos vectores n-dimensionales a través del ángulo que se forma entre ellos. cosθ = A⋅ B A B
  • 16. Medidas de Semejanza Distancia Coseno ! Determina la semejanza entre dos vectores n-dimensionales a través del ángulo que se forma entre ellos. ! Esta medida va de [0, π], así que: ! Un valor de π significa que son opuestos. ! Un valor de π/2 significa independientes. ! Un valor de 0 significa iguales. cosθ = A⋅ B A B
  • 17. Medidas de Semejanza Distancia Manhatan ! Es la distancia entre dos pares de puntos a lo largo de ejes perpendiculares. DXY = Xik − Xjk + Yik −Yjk
  • 18. Medidas de Semejanza Distancia Manhatan ! Es la distancia entre dos pares de puntos a lo largo de ejes perpendiculares. DXY = Xik − Xjk + Yik −Yjk *Imagen tomada de internet Figura 1*
  • 19. Medidas de Semejanza Distancia Jaccard ! La distancia Jaccard mide la semejanza de dos conjuntos de datos y se calcula de la siguiente forma: J(A, B) = A∩B A∪B
  • 20. Medidas de Semejanza Distancia Jaccard ! Ejemplo: J(A, B) = A∩B A∪B = ?
  • 21. Medidas de Semejanza Distancia Jaccard ! Ejemplo: A∪B = A∩B =
  • 22. Medidas de Semejanza Distancia Jaccard ! Ejemplo: J(A, B) = A∩B A∪B = 2 7 = 0.286 A∪B = A∩B =
  • 23. Medidas de Semejanza Distancia Minkowski ! La distancia de Minkowski es una métrica generalizada de distancia euclidiana y distancia de Manhattan. DXY = Xik − Xjk 1 p k=1 d ∑ ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ p
  • 24. Medidas de Semejanza Distancia Minkowski ! La distancia de Minkowski es una métrica generalizada de distancia euclidiana y distancia de Manhattan. ! Si p=1 tenemos la distancia Manhatan. ! Si p=2 tenemos la distancia Euclidiana. DXY = Xik − Xjk p k=1 d ∑ ( ) 1 p