/ jueves 11 de noviembre de 2021

UG TU CONECTE CON LA CIENCIA

LO QUE DICEN LAS IMÁGENES


Dra. Dora Luz Almanza Ojeda

Departamento de Ingeniería Electrónica; División de Ingenierías

Campus Irapuato/Salamanca, Universidad de Guanajuato



Seguramente has escuchado la frase: “una imagen dice más que mil palabras”. Esta frase poética y filosófica, nos invita a despertar nuestra percepción humana para interpretar una pintura, un mural o fotografía. Pero ¿puede una máquina interpretar el contenido de una imagen para saber lo que dice?

Toda investigación científica requiere datos. Normalmente, cuando pensamos en datos, nos imaginamos solo bloques de números o texto. Sin embargo, en aplicaciones tecnológicas, las imágenes son otro tipo de dato que proporciona mucha más información. De forma general, una imagen digital es una representación de lo captura una cámara a través de un sensor fotosensible.

Actualmente, millones de imágenes son generadas alrededor del mundo diariamente, lo cual permite construir grandes colecciones de imágenes que sirven como bases de prueba en el diseño e implementación de sistemas inteligentes.

La visión por computadora es un área enfocada al procesamiento y análisis del contenido de imágenes. El análisis de una imagen comienza con la detección de colores, bordes, esquinas y otras características básicas. La detección de formas básicas permite experimentar con técnicas de aprendizaje de máquina (o por su nombre en inglés Machine Learning), para identificar objetos más complejos, naturales o artificiales. Esencialmente, una imagen contiene la misma información que un humano puede distinguir a través de sus ojos.

Por ello, las estrategias de visión por computadora se basan en cómo el cerebro humano extrae y analiza la información visual para formar una representación del escenario. Y no solo la visión humana inspira las técnicas de visión por computadora, también la representación que logran algunos animales con vista periférica ha permitido el desarrollo de nuevas cámaras y accesorios para el análisis de contenido en imágenes.

Una imagen con alta resolución facilita el desarrollo de algoritmos para identificar el entorno a través de una computadora. Detección de movimiento, reconocimiento de rostros, generación de mapas para rutas navegables en robots o vehículos inteligentes son solo algunas de las aplicaciones que más han popularizado a la visión por computadora y sus estrategias basadas en aprendizaje máquina.

En el sector industrial, la mayoría de los procesos de inspección de calidad o reconocimiento de patrones son realizados a través de visión por computadora y del aprendizaje de máquina. Entre las ventajas que aportan al sector, es que no requieren gran capacidad de recursos de cómputo, muestran bajo tiempo de procesamiento y la implementación es rápida y compatible para diferentes sistemas operativos.

Por otra parte, el aumento en el poder de cómputo ha permitido analizar y reconocer el contenido de una gran cantidad de imágenes, dando paso a nuevas técnicas conocidas como aprendizaje profundo (Deep learning por sus siglas en inglés). Recientemente, las aplicaciones para la detección y reconocimiento de objetos desde imágenes en un ambiente urbano son accesibles para los usuarios de dispositivos móviles o como apoyo en conducción desde vehículos inteligentes.

Las técnicas basadas en Deep learning son capaces de generar modelos entrenados con millones de imágenes para extraer sus características más representativas. Estos grandes modelos se basan en redes neuronales artificiales. Las redes neuronales artificiales son representaciones computacionales del comportamiento del cerebro humano a nivel de las neuronas. Las redes artificiales son capaces de reconocer en una imagen nueva, cualquiera de los objetos con los que fue entrenado. El número de categorías que puede identificar un clasificador basado en aprendizaje profundo es mucho mayor que cuando se utilizan técnicas de aprendizaje máquina y sin lugar a dudas ese número seguirá creciendo.

Hoy en día el aprendizaje profundo combina técnicas de inteligencia artificial para el procesamiento de una gran cantidad de imágenes. Los resultados muestran alta exactitud y marcan una tendencia hacia una nueva generación de sistemas inteligentes. En estos sistemas, no solo se identifica el contenido en las imágenes, sino que es posible interpretar el escenario y reaccionar activamente. El auge del aprendizaje profundo ha llegado al sector industrial con cautela, ya que la implementación de estas técnicas no es directa ni compatible con muchos de los equipos o sistemas actuales, aunque seguramente veremos su incorporación total a corto plazo.

Sin duda, uno de los primeros pasos en el desarrollo de sistemas inteligentes ha sido que una máquina interprete lo que dice una imagen. La evolución de estos sistemas continua hacia la toma de decisiones basadas en las diferentes interpretaciones de las imágenes. Sin embargo, es un avance que aún debe ser supervisado por un humano, mientras llegamos a una total interacción-hombre máquina en nuestras vidas cotidianas.

Cualquier comentario sobre este artículo, favor de dirigirlo a eugreka@ugto.mx. Para consulta de más artículos www.ugto.mx/eugreka




LO QUE DICEN LAS IMÁGENES


Dra. Dora Luz Almanza Ojeda

Departamento de Ingeniería Electrónica; División de Ingenierías

Campus Irapuato/Salamanca, Universidad de Guanajuato



Seguramente has escuchado la frase: “una imagen dice más que mil palabras”. Esta frase poética y filosófica, nos invita a despertar nuestra percepción humana para interpretar una pintura, un mural o fotografía. Pero ¿puede una máquina interpretar el contenido de una imagen para saber lo que dice?

Toda investigación científica requiere datos. Normalmente, cuando pensamos en datos, nos imaginamos solo bloques de números o texto. Sin embargo, en aplicaciones tecnológicas, las imágenes son otro tipo de dato que proporciona mucha más información. De forma general, una imagen digital es una representación de lo captura una cámara a través de un sensor fotosensible.

Actualmente, millones de imágenes son generadas alrededor del mundo diariamente, lo cual permite construir grandes colecciones de imágenes que sirven como bases de prueba en el diseño e implementación de sistemas inteligentes.

La visión por computadora es un área enfocada al procesamiento y análisis del contenido de imágenes. El análisis de una imagen comienza con la detección de colores, bordes, esquinas y otras características básicas. La detección de formas básicas permite experimentar con técnicas de aprendizaje de máquina (o por su nombre en inglés Machine Learning), para identificar objetos más complejos, naturales o artificiales. Esencialmente, una imagen contiene la misma información que un humano puede distinguir a través de sus ojos.

Por ello, las estrategias de visión por computadora se basan en cómo el cerebro humano extrae y analiza la información visual para formar una representación del escenario. Y no solo la visión humana inspira las técnicas de visión por computadora, también la representación que logran algunos animales con vista periférica ha permitido el desarrollo de nuevas cámaras y accesorios para el análisis de contenido en imágenes.

Una imagen con alta resolución facilita el desarrollo de algoritmos para identificar el entorno a través de una computadora. Detección de movimiento, reconocimiento de rostros, generación de mapas para rutas navegables en robots o vehículos inteligentes son solo algunas de las aplicaciones que más han popularizado a la visión por computadora y sus estrategias basadas en aprendizaje máquina.

En el sector industrial, la mayoría de los procesos de inspección de calidad o reconocimiento de patrones son realizados a través de visión por computadora y del aprendizaje de máquina. Entre las ventajas que aportan al sector, es que no requieren gran capacidad de recursos de cómputo, muestran bajo tiempo de procesamiento y la implementación es rápida y compatible para diferentes sistemas operativos.

Por otra parte, el aumento en el poder de cómputo ha permitido analizar y reconocer el contenido de una gran cantidad de imágenes, dando paso a nuevas técnicas conocidas como aprendizaje profundo (Deep learning por sus siglas en inglés). Recientemente, las aplicaciones para la detección y reconocimiento de objetos desde imágenes en un ambiente urbano son accesibles para los usuarios de dispositivos móviles o como apoyo en conducción desde vehículos inteligentes.

Las técnicas basadas en Deep learning son capaces de generar modelos entrenados con millones de imágenes para extraer sus características más representativas. Estos grandes modelos se basan en redes neuronales artificiales. Las redes neuronales artificiales son representaciones computacionales del comportamiento del cerebro humano a nivel de las neuronas. Las redes artificiales son capaces de reconocer en una imagen nueva, cualquiera de los objetos con los que fue entrenado. El número de categorías que puede identificar un clasificador basado en aprendizaje profundo es mucho mayor que cuando se utilizan técnicas de aprendizaje máquina y sin lugar a dudas ese número seguirá creciendo.

Hoy en día el aprendizaje profundo combina técnicas de inteligencia artificial para el procesamiento de una gran cantidad de imágenes. Los resultados muestran alta exactitud y marcan una tendencia hacia una nueva generación de sistemas inteligentes. En estos sistemas, no solo se identifica el contenido en las imágenes, sino que es posible interpretar el escenario y reaccionar activamente. El auge del aprendizaje profundo ha llegado al sector industrial con cautela, ya que la implementación de estas técnicas no es directa ni compatible con muchos de los equipos o sistemas actuales, aunque seguramente veremos su incorporación total a corto plazo.

Sin duda, uno de los primeros pasos en el desarrollo de sistemas inteligentes ha sido que una máquina interprete lo que dice una imagen. La evolución de estos sistemas continua hacia la toma de decisiones basadas en las diferentes interpretaciones de las imágenes. Sin embargo, es un avance que aún debe ser supervisado por un humano, mientras llegamos a una total interacción-hombre máquina en nuestras vidas cotidianas.

Cualquier comentario sobre este artículo, favor de dirigirlo a eugreka@ugto.mx. Para consulta de más artículos www.ugto.mx/eugreka