SlideShare una empresa de Scribd logo
1 de 37
Krystian Mikolajczyk and Cordelia Schmid
Dept. of Engineering Science INRIA Rh.one-Alpes
University of Oxford 655, av. de l'Europe
Oxford, OX1 3PJ 38330 Montbonnot
United Kingdom France
km@robots.ox.ac.uk, schmid@inrialpes.fr
Materia: Visión de alto nivel
Dr. Luis Enrique Sucar S.
Alumnos: Meléndez Teodoro Augusto
Ruíz Díaz Ma. Antonia
Page  2
Resumen
Calcular regiones locales de interés.
No es claro que descriptores son los más apropiados y como es que su desempeño
depende del detector de las regiones de interés.
Los descriptores deben de ser distintivos y al mismo tiempo robustos a los cambios en
las condiciones de visión.
Criterio de evaluación: recuerdo con respecto a la precisión.
Page  3
• Descriptores Evaluados:
• SIFT (Scale-Invariant Feature Transform).
• Ubicacion del gradiente y histograma de orientacion (GLOH).
• Contexto de forma.
• PCA-SIFT.
• Imágenes pin.
• Filtros Dirigidos.
• Invariantes Diferenciales.
• Filtros complejos.
• Momentos invariantes.
• Cross-correlation de valores de los pixeles.
Page  4
Introducción
Los descriptores locales fotométricos son distintivos, robustos a la oclusión y no
requieren de segmentación.
La idea es detectar regiones de imágenes covariantes a una clase de
transformaciones, para después calcular descriptores invariantes.
Page  5
 Dado el detector de regiones invariantes, solo nos falta responder a las siguientes
preguntas:
 ¿Cuál es el descriptor más apropiado para caracterizar las regiones?
 ¿La elección del descriptor depende del detector de regiones?
Page  6
Condiciones de la Evaluación
Los descriptores utilizados trabajan sobre imágenes en escala de grises.
La evaluación de los descriptores esta realizada en el contexto del matching y
reconocimiento de una misma escena o un objeto observado bajo diferentes condiciones
visuales.
El criterio de evaluación es recuerdo-precisión, numero de coincidencias correctas e
incorrectas entre dos imágenes.
ROC (Características de Operación del Receptor) para recuperación de imágenes desde
BD.
Page  7
 Descriptores Locales en el Contexto de Reconocimiento y Emparejamiento
 Carneiro y Jepson, utilizan ROC para evaluar el desempeño de los descriptores
locales. Los puntos de interes son detectados utilizando el detector Harris y las
transformaciones de las imagenes son generadas artificialmente.
 Ke y Sukthankar proponen un descriptor similar a SIFT. Aplica Análisis de
Componentes Principales (PCA) al gradiente de la imagen normalizada y se
comporta mejor que el descriptor SIFT para datos generado artificialmente.
Page  8
 Descriptores Locales en el Contexto de Clasificacion de Texturas
 Randen y Husoy compara los fltros mascaras Laws, filtros de Gabor,
transformaciones wavelet, DCT, eigenfiltros, predictores lineales y filtros optimizados
de respuesta a impulsos finitos. Ningún enfoque se identificó como el mejor. Los
filtros de Gabor fueron en muchos casos superados por los otros filtros.
Page  9
 Varma y Zisserman mostraron MRF se comporto mejor que los filtros Gaussianos.
 Lazebnik et al., proponen un nuevo descriptor invariante llamado “spin image” y lo
comparan con los filtros de Gabor. Muestran que las regiones basadas en “spin
image” mejoran los filtros de Gabor basados en puntos.
Page  10
Descriptores
Descriptores basados en distribuciones.
Utilizan el histograma para representar diferentes características de apariencia o
forma. Un descriptor simple es la distribución de las intensidades del pixel
representados por un histograma.
Johnson y Hebert introdujeron una representación mas expresiva para reconocimiento
de objetos 3D. Su representación es un histograma de las posiciones relativas en la
vecindad de un punto de interés en 3D.
Page  11
 Zabih y Woodfill desarrollaron un enfoque robusto a cambios de iluminación. Depende
de los histogramas de orden y las relaciones reciprocas entre las intensidades del
pixel las cuales son más robustas que las intensidades puras de los pixeles. Las
relaciones binarias entre las intensidades de los pixeles de varios pixeles vecinos son
codificados por cadenas binarias y una distribución de todas las posibles
combinaciones es representada por histogramas. Adecuado para representación de
texturas pero se requieren de un gran numero de dimensiones para representar al
descriptor.
Page  12
 Lowe propone una “transformación de características invariante a la escala”(Scala
Invariant Feature Transform SIFT), que combina un detector de regiones invariante a
la escala y un descriptor basado en la distribución del gradiente en las regiones
detectadas.
 El descriptor es representado por un histograma 3D de orientación y ubicación del
gradiente.
Page  13
 Técnicas de Frecuencias Espaciales.
 La transformada de Fourier descompone el contenido de una imagen en sus
funciones básicas.
 Es difícil adaptarlo a un enfoque local.
 La transformada de Gabor soluciona este problema, pero se requieren un gran
numero de filtros de Gabor para capturar cambios pequeños en la frecuencia y la
orientación.
Page  14
Detectores de Regiones
Los detectores proveen las regiones que son usadas para calcular los descriptores.
Se usaron 5 detectores:
–Puntos Harris.
–Regiones Harris-Laplace.
–Regiones Hessian-Laplace .
–Regiones Harris Afines.
–Regiones Hessian Afines.
Page  15
Descriptores
SIFT.
Son calculados para normalizar imágenes.
Un descriptor es un histograma 3D de ubicación del gradiente y orientación, la
ubicación es cuantizada en un grid de ubicación de 4x4 y el ángulo del gradiente es
cuantizado en 8 direcciones.
Ubicación del gradiente y histograma de orientación (GLOH).
 Es una extensión de SIFT, cambia la posición del grid y usa PCA para reducir el
tamaño. Fue diseñado para incrementar su robustez y su singularidad.
Page  16
Contexto de forma.
 Es similar al descriptor SIFT, pero esta basado para bordes. Es un histograma 3D de
puntos de ubicación y orientación del borde. Los bordes son extraídos por el detector
Canny.
 Para extraer el contexto de la forma en un punto P, se encuentran todos los vectores
de P para todos lo spuntos del borde.
Page  17
PCA-SIFT.
 Es un vector del gradiente de la imagen en direcciones en x y en y calculadas dentro
de la imagen de soporte.
Spin Image
 Se divide la región normalizada en anillos y se calcula el histograma de intensidad
para cada anillo.
 La concatenación de esos histogramas se llama imagen spin y es el descriptor de la
región.
Page  18
Steerable Filters e Invariantes Diferenciales
 Usan derivadas, y el cambio de orientación de estas derivadas dan resultados
equivalentes a un derivado local sobre imágenes rotadas.
Filtros Complejos
 Usa derivadas y originalmente fue usado para generar kernels.
 Estos kernels son calculados para unidades de discos de radio 1.
Page  19
 Momentos Invariantes
 Son calculados al derivar la imagen con:
Cross-correlation
• La región es suavizada y probadas uniformemente.
• La similitud entre dos descriptores es medida con cross-correlation.
Page  20
Evaluación
(a)(b) Rotación
(c)(d) Zoom+Rotación
(e)(f) Cambio de
perspectiva
(g)(h) Imagen borrosa
(i) Compresión JPEG
(j) Cambio de iluminación
Page  21
Evaluación
 Criterio de evaluación: Está basado en el número de “matches” correctos y el número de
“matches” falsos obtenidos por un par de imágenes.
 Dos regiones A y B se emparejan si la distancia d entre sus descriptores DA y DB está por
debajo de un umbral t.
 El recuerdo es el número de regiones correctamente emparejadas con respecto al número
de regiones que corresponden entre dos imágenes de la misma escena.
 El número de matches incorrectos, relativo al número total de matches, es representado por
1-presición.
Page  22
Resultados
 El desempeño es comparado por transformaciones afines, cambios de escala, rotaciones,
borrosidad, compresión JPEG y cambios de iluminación.
 En el caso de transformaciones afines, se examinaron diferentes estrategias de “matching”,
la influencia del error de traslape y la dimensión del descriptor.
Page  23
Resultados
 A) Transformaciones afines: Se evalúa el desempeño, cuando hay cambios de perspectiva de
aproximadamente 50°.
Esto introduce una transformación de perspectiva la cual puede ser aproximada por una transformación
afín. Ésta es la transformación más importante evaluada en el artículo.
1. Se examinan diferentes estrategias de “matching”
2. Se investiga la influencia del error de traslape en los resultados del “matching”.
3. Se evalúa el desempeño de diferentes descriptores en diferentes dimensiones.
4. Se compara el desempeño del descriptor para diferentes detectores de regiones y tipos de escenas.
Page  24
Resultados
1.Estrategias de “matching”: La definición de un match depende de la estrategia de
matching . Se comparan tres de ellas.
1. En el caso del matching basado en un umbral, dos regiones son emparejadas si la
distancia entre sus descriptores está por debajo de un umbral.
Un descriptor puede tener muchos matching y todos ellos pueden ser correctos.
2. El el caso de matching basado en vecinos más cercanos, dos regiones A y B son
emparejadas, si el descriptor DB es el vecino más cercano a DA y si la distancia entre éstos
está debajo de un umbral. En este caso un descriptor, tiene únicamente un match.
3. La tercer estrategia es parecida a la de vecinos más cercanos, excepto que el umbral es
aplicado la distancia entre el radio del primer y el segundo vecino más cercano. Entonces
las regiones son emparejadas si || DA – DB ||/|| DA - DC||<t, donde DB es el primero y DC es el
segundo vecino más cercano a DA
Page  25
Resultados
Page  26
Resultados
2. Regiones traslapadas: Se investiga la influencia del error de traslape en el desempeño
del descriptor.
Page  27
Resultados
3. Dimensionalidad: Los descriptores basados en derivadas y los filtros complejos pueden
ser computados en orden arbitrario.
Page  28
Resultados
4. Tipos de región y escenas: En esta sección se evalúa el desempeño del descriptor para
diferentes detectores de regiones afines y diferentes tipos de escenas.
Page  29
Resultados
 B) Cambios de escala: En esta sección se evalúan los descriptores para combinar la
rotación de imágenes y el cambio de escala. Los cambios de escala van de 2-2.5 y la
rotación de las imágenes de 30°-45°.
Page  30
Resultados
 C) Rotación de la imagen: Para evaluar el desempeño de la rotación de la imagen, se
usaron imágenes con un ángulo de rotación en un rango de 30-45°. Esto representa el caso
con más dificultad.
Page  31
Resultados
 D) Imagen borrosa: En esta sección el desempeño es medido para imágenes con una
cantidad significativa de borrosidad. La borrosidad fue introducida cambiando el enfoque de
la cámara.
Page  32
Resultados
 E) Compresión JPEG: Se evalúa la influencia de la compresión JPEG para una escena
estructurada. La calidad de la imagen transformada es el 5% de la referencia 1. Se
presentan los resultados para regiones detectadas con Hessian-Affine.
 El desempeño del descriptor es mejor que en el caso de borrosidad, pero peor que en caso
de rotación y cambio de escala de escenas estructuras.
 Todos los descriptores son afectados por JPEG.
 PCA-SIFT obtienen el mejor resultado para un bajo falso positivo, y SIFT para un falso
positivo por encima de 0.2. Los resultados para GLOH están entre esos dos descriptores.
Page  33
Resultados
Page  34
Resultados
 F) Cambios de iluminación: Éstos cambios se llevaron a cabo mediante configuraciones
de la cámara. Los descriptores son computados para regiones Hessian-Affine.
Page  35
Resultados
 G) Ejemplo de “matching”: Se ilustra un ejemplo de imágenes con un cambio de
perspectiva de mas de 50°.
Page  36
Resultados
Page  37
Conclusiones
 Se presentó una evaluación experimental de descriptores de regiones de interés, en
presencia de transformaciones geométricas y fotométricas.
 El objetivo fue comparar descriptores para extraer regiones con una técnica de detección de
escala, recientemente propuesta y una afin-invariante.
 La evaluación fue diseñada para “matching” y reconocimiento de el mismo objeto o escena.
 En la mayoría de las pruebas, GLOTH obtiene los mejores resultados, seguido por SIFT.

Más contenido relacionado

Similar a descriptores en identificacion de ellos.pptx

MODELOS DIGITALES DE ELEVACIÓN-pptx
MODELOS DIGITALES DE ELEVACIÓN-pptxMODELOS DIGITALES DE ELEVACIÓN-pptx
MODELOS DIGITALES DE ELEVACIÓN-pptxMaraFernandaSurez3
 
Introducción al análisis geoestadístico con geostatistical analyst
Introducción al análisis geoestadístico con geostatistical analystIntroducción al análisis geoestadístico con geostatistical analyst
Introducción al análisis geoestadístico con geostatistical analystAlberca Ambar
 
Cómo funciona kriging—ayuda arc gis desktop
Cómo funciona kriging—ayuda   arc gis desktopCómo funciona kriging—ayuda   arc gis desktop
Cómo funciona kriging—ayuda arc gis desktopLibélula
 
Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...
Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...
Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...LTDH2013
 
Aet17 04 realce de imagenes - filtrado espacial
Aet17 04 realce de imagenes - filtrado espacialAet17 04 realce de imagenes - filtrado espacial
Aet17 04 realce de imagenes - filtrado espacialc09271
 
08estimacion_e_interpolacion.pdf
08estimacion_e_interpolacion.pdf08estimacion_e_interpolacion.pdf
08estimacion_e_interpolacion.pdfJuan Estevez
 
2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.pptssuserd9e9ec1
 
Campos Escalares y Vectoriales
Campos Escalares y VectorialesCampos Escalares y Vectoriales
Campos Escalares y VectorialesYuri Milachay
 
Contenidos convocatoria de quinto
Contenidos convocatoria de quintoContenidos convocatoria de quinto
Contenidos convocatoria de quintosilene_1
 
Sistema de localización visual por color (M. Dominguez Duran)
Sistema de localización visual por color (M. Dominguez Duran)Sistema de localización visual por color (M. Dominguez Duran)
Sistema de localización visual por color (M. Dominguez Duran)Cristina Urdiales
 
Estandares y expectativas undecimo grado
Estandares y expectativas undecimo gradoEstandares y expectativas undecimo grado
Estandares y expectativas undecimo gradoJuan Serrano
 
Estandares y expectativas undecimo grado
Estandares y expectativas undecimo gradoEstandares y expectativas undecimo grado
Estandares y expectativas undecimo gradoJuan Serrano
 

Similar a descriptores en identificacion de ellos.pptx (20)

Pdi03
Pdi03Pdi03
Pdi03
 
Matematicas bachillerato 2017_0
Matematicas bachillerato 2017_0Matematicas bachillerato 2017_0
Matematicas bachillerato 2017_0
 
MODELOS DIGITALES DE ELEVACIÓN-pptx
MODELOS DIGITALES DE ELEVACIÓN-pptxMODELOS DIGITALES DE ELEVACIÓN-pptx
MODELOS DIGITALES DE ELEVACIÓN-pptx
 
Introducción al análisis geoestadístico con geostatistical analyst
Introducción al análisis geoestadístico con geostatistical analystIntroducción al análisis geoestadístico con geostatistical analyst
Introducción al análisis geoestadístico con geostatistical analyst
 
Derivada direccional
Derivada direccionalDerivada direccional
Derivada direccional
 
Cómo funciona kriging—ayuda arc gis desktop
Cómo funciona kriging—ayuda   arc gis desktopCómo funciona kriging—ayuda   arc gis desktop
Cómo funciona kriging—ayuda arc gis desktop
 
Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...
Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...
Sesión técnica, sala ATASTA, Ventajas de la segmentación dinámica en los mode...
 
Tds
TdsTds
Tds
 
filtros iir
filtros iir filtros iir
filtros iir
 
Aet17 04 realce de imagenes - filtrado espacial
Aet17 04 realce de imagenes - filtrado espacialAet17 04 realce de imagenes - filtrado espacial
Aet17 04 realce de imagenes - filtrado espacial
 
08estimacion_e_interpolacion.pdf
08estimacion_e_interpolacion.pdf08estimacion_e_interpolacion.pdf
08estimacion_e_interpolacion.pdf
 
Segmentacion imagenes
Segmentacion imagenesSegmentacion imagenes
Segmentacion imagenes
 
2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt
 
Campos Escalares y Vectoriales
Campos Escalares y VectorialesCampos Escalares y Vectoriales
Campos Escalares y Vectoriales
 
Contenidos convocatoria de quinto
Contenidos convocatoria de quintoContenidos convocatoria de quinto
Contenidos convocatoria de quinto
 
SAR Desastres Parte 2.pdf
SAR Desastres Parte 2.pdfSAR Desastres Parte 2.pdf
SAR Desastres Parte 2.pdf
 
Lgr manuel millan
Lgr manuel millanLgr manuel millan
Lgr manuel millan
 
Sistema de localización visual por color (M. Dominguez Duran)
Sistema de localización visual por color (M. Dominguez Duran)Sistema de localización visual por color (M. Dominguez Duran)
Sistema de localización visual por color (M. Dominguez Duran)
 
Estandares y expectativas undecimo grado
Estandares y expectativas undecimo gradoEstandares y expectativas undecimo grado
Estandares y expectativas undecimo grado
 
Estandares y expectativas undecimo grado
Estandares y expectativas undecimo gradoEstandares y expectativas undecimo grado
Estandares y expectativas undecimo grado
 

Más de Carlos Paredes

Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfCarlos Paredes
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfCarlos Paredes
 
tecnicas_agrupamiento de datos para analisis
tecnicas_agrupamiento de datos para analisistecnicas_agrupamiento de datos para analisis
tecnicas_agrupamiento de datos para analisisCarlos Paredes
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencionCarlos Paredes
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloCarlos Paredes
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosCarlos Paredes
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdfCarlos Paredes
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxCarlos Paredes
 

Más de Carlos Paredes (13)

Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdf
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
 
tecnicas_agrupamiento de datos para analisis
tecnicas_agrupamiento de datos para analisistecnicas_agrupamiento de datos para analisis
tecnicas_agrupamiento de datos para analisis
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencion
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencillo
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismos
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdf
 
Squim .pdf
Squim .pdfSquim .pdf
Squim .pdf
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptx
 
MAS1.pdf
MAS1.pdfMAS1.pdf
MAS1.pdf
 
Modulo IV CV.pptx
Modulo IV CV.pptxModulo IV CV.pptx
Modulo IV CV.pptx
 
Examen.docx
Examen.docxExamen.docx
Examen.docx
 
Servidores.pptx
Servidores.pptxServidores.pptx
Servidores.pptx
 

descriptores en identificacion de ellos.pptx

  • 1. Krystian Mikolajczyk and Cordelia Schmid Dept. of Engineering Science INRIA Rh.one-Alpes University of Oxford 655, av. de l'Europe Oxford, OX1 3PJ 38330 Montbonnot United Kingdom France km@robots.ox.ac.uk, schmid@inrialpes.fr Materia: Visión de alto nivel Dr. Luis Enrique Sucar S. Alumnos: Meléndez Teodoro Augusto Ruíz Díaz Ma. Antonia
  • 2. Page  2 Resumen Calcular regiones locales de interés. No es claro que descriptores son los más apropiados y como es que su desempeño depende del detector de las regiones de interés. Los descriptores deben de ser distintivos y al mismo tiempo robustos a los cambios en las condiciones de visión. Criterio de evaluación: recuerdo con respecto a la precisión.
  • 3. Page  3 • Descriptores Evaluados: • SIFT (Scale-Invariant Feature Transform). • Ubicacion del gradiente y histograma de orientacion (GLOH). • Contexto de forma. • PCA-SIFT. • Imágenes pin. • Filtros Dirigidos. • Invariantes Diferenciales. • Filtros complejos. • Momentos invariantes. • Cross-correlation de valores de los pixeles.
  • 4. Page  4 Introducción Los descriptores locales fotométricos son distintivos, robustos a la oclusión y no requieren de segmentación. La idea es detectar regiones de imágenes covariantes a una clase de transformaciones, para después calcular descriptores invariantes.
  • 5. Page  5  Dado el detector de regiones invariantes, solo nos falta responder a las siguientes preguntas:  ¿Cuál es el descriptor más apropiado para caracterizar las regiones?  ¿La elección del descriptor depende del detector de regiones?
  • 6. Page  6 Condiciones de la Evaluación Los descriptores utilizados trabajan sobre imágenes en escala de grises. La evaluación de los descriptores esta realizada en el contexto del matching y reconocimiento de una misma escena o un objeto observado bajo diferentes condiciones visuales. El criterio de evaluación es recuerdo-precisión, numero de coincidencias correctas e incorrectas entre dos imágenes. ROC (Características de Operación del Receptor) para recuperación de imágenes desde BD.
  • 7. Page  7  Descriptores Locales en el Contexto de Reconocimiento y Emparejamiento  Carneiro y Jepson, utilizan ROC para evaluar el desempeño de los descriptores locales. Los puntos de interes son detectados utilizando el detector Harris y las transformaciones de las imagenes son generadas artificialmente.  Ke y Sukthankar proponen un descriptor similar a SIFT. Aplica Análisis de Componentes Principales (PCA) al gradiente de la imagen normalizada y se comporta mejor que el descriptor SIFT para datos generado artificialmente.
  • 8. Page  8  Descriptores Locales en el Contexto de Clasificacion de Texturas  Randen y Husoy compara los fltros mascaras Laws, filtros de Gabor, transformaciones wavelet, DCT, eigenfiltros, predictores lineales y filtros optimizados de respuesta a impulsos finitos. Ningún enfoque se identificó como el mejor. Los filtros de Gabor fueron en muchos casos superados por los otros filtros.
  • 9. Page  9  Varma y Zisserman mostraron MRF se comporto mejor que los filtros Gaussianos.  Lazebnik et al., proponen un nuevo descriptor invariante llamado “spin image” y lo comparan con los filtros de Gabor. Muestran que las regiones basadas en “spin image” mejoran los filtros de Gabor basados en puntos.
  • 10. Page  10 Descriptores Descriptores basados en distribuciones. Utilizan el histograma para representar diferentes características de apariencia o forma. Un descriptor simple es la distribución de las intensidades del pixel representados por un histograma. Johnson y Hebert introdujeron una representación mas expresiva para reconocimiento de objetos 3D. Su representación es un histograma de las posiciones relativas en la vecindad de un punto de interés en 3D.
  • 11. Page  11  Zabih y Woodfill desarrollaron un enfoque robusto a cambios de iluminación. Depende de los histogramas de orden y las relaciones reciprocas entre las intensidades del pixel las cuales son más robustas que las intensidades puras de los pixeles. Las relaciones binarias entre las intensidades de los pixeles de varios pixeles vecinos son codificados por cadenas binarias y una distribución de todas las posibles combinaciones es representada por histogramas. Adecuado para representación de texturas pero se requieren de un gran numero de dimensiones para representar al descriptor.
  • 12. Page  12  Lowe propone una “transformación de características invariante a la escala”(Scala Invariant Feature Transform SIFT), que combina un detector de regiones invariante a la escala y un descriptor basado en la distribución del gradiente en las regiones detectadas.  El descriptor es representado por un histograma 3D de orientación y ubicación del gradiente.
  • 13. Page  13  Técnicas de Frecuencias Espaciales.  La transformada de Fourier descompone el contenido de una imagen en sus funciones básicas.  Es difícil adaptarlo a un enfoque local.  La transformada de Gabor soluciona este problema, pero se requieren un gran numero de filtros de Gabor para capturar cambios pequeños en la frecuencia y la orientación.
  • 14. Page  14 Detectores de Regiones Los detectores proveen las regiones que son usadas para calcular los descriptores. Se usaron 5 detectores: –Puntos Harris. –Regiones Harris-Laplace. –Regiones Hessian-Laplace . –Regiones Harris Afines. –Regiones Hessian Afines.
  • 15. Page  15 Descriptores SIFT. Son calculados para normalizar imágenes. Un descriptor es un histograma 3D de ubicación del gradiente y orientación, la ubicación es cuantizada en un grid de ubicación de 4x4 y el ángulo del gradiente es cuantizado en 8 direcciones. Ubicación del gradiente y histograma de orientación (GLOH).  Es una extensión de SIFT, cambia la posición del grid y usa PCA para reducir el tamaño. Fue diseñado para incrementar su robustez y su singularidad.
  • 16. Page  16 Contexto de forma.  Es similar al descriptor SIFT, pero esta basado para bordes. Es un histograma 3D de puntos de ubicación y orientación del borde. Los bordes son extraídos por el detector Canny.  Para extraer el contexto de la forma en un punto P, se encuentran todos los vectores de P para todos lo spuntos del borde.
  • 17. Page  17 PCA-SIFT.  Es un vector del gradiente de la imagen en direcciones en x y en y calculadas dentro de la imagen de soporte. Spin Image  Se divide la región normalizada en anillos y se calcula el histograma de intensidad para cada anillo.  La concatenación de esos histogramas se llama imagen spin y es el descriptor de la región.
  • 18. Page  18 Steerable Filters e Invariantes Diferenciales  Usan derivadas, y el cambio de orientación de estas derivadas dan resultados equivalentes a un derivado local sobre imágenes rotadas. Filtros Complejos  Usa derivadas y originalmente fue usado para generar kernels.  Estos kernels son calculados para unidades de discos de radio 1.
  • 19. Page  19  Momentos Invariantes  Son calculados al derivar la imagen con: Cross-correlation • La región es suavizada y probadas uniformemente. • La similitud entre dos descriptores es medida con cross-correlation.
  • 20. Page  20 Evaluación (a)(b) Rotación (c)(d) Zoom+Rotación (e)(f) Cambio de perspectiva (g)(h) Imagen borrosa (i) Compresión JPEG (j) Cambio de iluminación
  • 21. Page  21 Evaluación  Criterio de evaluación: Está basado en el número de “matches” correctos y el número de “matches” falsos obtenidos por un par de imágenes.  Dos regiones A y B se emparejan si la distancia d entre sus descriptores DA y DB está por debajo de un umbral t.  El recuerdo es el número de regiones correctamente emparejadas con respecto al número de regiones que corresponden entre dos imágenes de la misma escena.  El número de matches incorrectos, relativo al número total de matches, es representado por 1-presición.
  • 22. Page  22 Resultados  El desempeño es comparado por transformaciones afines, cambios de escala, rotaciones, borrosidad, compresión JPEG y cambios de iluminación.  En el caso de transformaciones afines, se examinaron diferentes estrategias de “matching”, la influencia del error de traslape y la dimensión del descriptor.
  • 23. Page  23 Resultados  A) Transformaciones afines: Se evalúa el desempeño, cuando hay cambios de perspectiva de aproximadamente 50°. Esto introduce una transformación de perspectiva la cual puede ser aproximada por una transformación afín. Ésta es la transformación más importante evaluada en el artículo. 1. Se examinan diferentes estrategias de “matching” 2. Se investiga la influencia del error de traslape en los resultados del “matching”. 3. Se evalúa el desempeño de diferentes descriptores en diferentes dimensiones. 4. Se compara el desempeño del descriptor para diferentes detectores de regiones y tipos de escenas.
  • 24. Page  24 Resultados 1.Estrategias de “matching”: La definición de un match depende de la estrategia de matching . Se comparan tres de ellas. 1. En el caso del matching basado en un umbral, dos regiones son emparejadas si la distancia entre sus descriptores está por debajo de un umbral. Un descriptor puede tener muchos matching y todos ellos pueden ser correctos. 2. El el caso de matching basado en vecinos más cercanos, dos regiones A y B son emparejadas, si el descriptor DB es el vecino más cercano a DA y si la distancia entre éstos está debajo de un umbral. En este caso un descriptor, tiene únicamente un match. 3. La tercer estrategia es parecida a la de vecinos más cercanos, excepto que el umbral es aplicado la distancia entre el radio del primer y el segundo vecino más cercano. Entonces las regiones son emparejadas si || DA – DB ||/|| DA - DC||<t, donde DB es el primero y DC es el segundo vecino más cercano a DA
  • 26. Page  26 Resultados 2. Regiones traslapadas: Se investiga la influencia del error de traslape en el desempeño del descriptor.
  • 27. Page  27 Resultados 3. Dimensionalidad: Los descriptores basados en derivadas y los filtros complejos pueden ser computados en orden arbitrario.
  • 28. Page  28 Resultados 4. Tipos de región y escenas: En esta sección se evalúa el desempeño del descriptor para diferentes detectores de regiones afines y diferentes tipos de escenas.
  • 29. Page  29 Resultados  B) Cambios de escala: En esta sección se evalúan los descriptores para combinar la rotación de imágenes y el cambio de escala. Los cambios de escala van de 2-2.5 y la rotación de las imágenes de 30°-45°.
  • 30. Page  30 Resultados  C) Rotación de la imagen: Para evaluar el desempeño de la rotación de la imagen, se usaron imágenes con un ángulo de rotación en un rango de 30-45°. Esto representa el caso con más dificultad.
  • 31. Page  31 Resultados  D) Imagen borrosa: En esta sección el desempeño es medido para imágenes con una cantidad significativa de borrosidad. La borrosidad fue introducida cambiando el enfoque de la cámara.
  • 32. Page  32 Resultados  E) Compresión JPEG: Se evalúa la influencia de la compresión JPEG para una escena estructurada. La calidad de la imagen transformada es el 5% de la referencia 1. Se presentan los resultados para regiones detectadas con Hessian-Affine.  El desempeño del descriptor es mejor que en el caso de borrosidad, pero peor que en caso de rotación y cambio de escala de escenas estructuras.  Todos los descriptores son afectados por JPEG.  PCA-SIFT obtienen el mejor resultado para un bajo falso positivo, y SIFT para un falso positivo por encima de 0.2. Los resultados para GLOH están entre esos dos descriptores.
  • 34. Page  34 Resultados  F) Cambios de iluminación: Éstos cambios se llevaron a cabo mediante configuraciones de la cámara. Los descriptores son computados para regiones Hessian-Affine.
  • 35. Page  35 Resultados  G) Ejemplo de “matching”: Se ilustra un ejemplo de imágenes con un cambio de perspectiva de mas de 50°.
  • 37. Page  37 Conclusiones  Se presentó una evaluación experimental de descriptores de regiones de interés, en presencia de transformaciones geométricas y fotométricas.  El objetivo fue comparar descriptores para extraer regiones con una técnica de detección de escala, recientemente propuesta y una afin-invariante.  La evaluación fue diseñada para “matching” y reconocimiento de el mismo objeto o escena.  En la mayoría de las pruebas, GLOTH obtiene los mejores resultados, seguido por SIFT.