.

author photo
.....
.
El software desarrollado en la Universidad de Bonn puede predecir con precisión las acciones futuras.
Los científicos han desarrollado un software que puede mirar hacia el futuro: el programa aprende la secuencia típica de acciones, como cocinar, a partir de secuencias de video. Entonces puede predecir en situaciones, En base a este conocimiento, puede predecir con precisión en situaciones nuevas qué hará el chef en ese momento. Los investigadores presentarán sus hallazgos en la Conferencia más grande del mundo sobre Visión por Computadora y Reconocimiento de Patrones, que se realizará del 19 al 21 de junio en Salt Lake City, EE. UU.
El programa de computadora que ve cinco minutos en el futuro
El programa de computadora que ve cinco minutos en el futuro
El mayordomo perfecto, tiene una habilidad especial: siente los deseos de su empleador incluso antes de haber sido pronunciados. El grupo de trabajo del Prof. Dr. Jürgen Gall quiere enseñar a las computadoras algo similar: "Queremos predecir el momento y la duración de las actividades: minutos o incluso horas antes de que sucedan", explica.

Un robot de cocina, por ejemplo, podría pasar los ingredientes tan pronto como se necesiten, precalentar el horno a tiempo y, mientras tanto, advertir al chef si está a punto de olvidar un paso de preparación. Mientras tanto, la aspiradora automática sabe que no tiene nada que hacer en la cocina en ese momento y, en su lugar, se ocupa de la sala de estar.

Los humanos somos muy buenos para anticipar las acciones de los demás. Para las computadoras, sin embargo, esta disciplina todavía está en su infancia. Los investigadores del Instituto de Ciencias de la Computación de la Universidad de Bonn ahora pueden anunciar un primer éxito: han desarrollado un software de autoaprendizaje que puede estimar el tiempo y la duración de las actividades futuras con una precisión asombrosa durante períodos de varios minutos.

Datos de entrenamiento: cuatro horas de videos de ensaladas

Los datos de entrenamiento utilizados por los científicos incluyeron 40 videos en los que los artistas preparan diferentes ensaladas. Cada una de las grabaciones tenía alrededor de 6 minutos de duración y contenía un promedio de 20 acciones diferentes. Los videos también contenían detalles precisos de a qué hora comenzó la acción y cuánto tiempo tomó.

La computadora "miró" estos videos de ensalada por un total de alrededor de cuatro horas. De esta forma, el algoritmo aprendió qué acciones típicamente se suceden durante esta tarea y cuánto duran. Cada chef tiene su propio enfoque. Además, la secuencia puede variar según la receta.

"Luego probamos el éxito del proceso de aprendizaje", explica Gall. "Por esto enfrentamos el software con videos que no había visto antes". También mostraron la preparación de una ensalada. Para la prueba, se le dijo a la computadora lo que se muestra en el primer 20 o 30 por ciento de uno de los videos nuevos. Sobre esta base, tuvo que predecir lo que sucedería durante el resto de la película.

Eso funcionó increíblemente bien. Gall: "La precisión era superior al 40 por ciento en períodos de pronóstico cortos, pero luego disminuyó cuanto más el algoritmo tenía que mirar hacia el futuro". Para las actividades que duraron más de tres minutos en el futuro, la computadora todavía estaba en lo cierto en el 15 por ciento de los casos. Sin embargo, el pronóstico solo se consideró correcto si tanto la actividad como el momento se predijeron correctamente.

Gall y sus colegas quieren que el estudio se entienda solo como un primer paso en el nuevo campo de predicción de la actividad. Especialmente porque el algoritmo funciona notablemente peor si tiene que reconocer por sí mismo lo que sucede en la primera parte del video, en lugar de que se lo digan. Debido a que este análisis nunca es 100 por ciento correcto, Gall habla de datos "ruidosos". "Nuestro proceso funciona con eso", dice. "Pero lamentablemente tampoco está cerca".

Siguiente artículo Siguiente Post
Artículo anterior Post anterior