El sistema autónomo mejora el muestreo ambiental en el mar

El sistema autónomo mejora el muestreo ambiental en el mar

diciembre 21, 2019 Desactivado Por Carolcfr

Un sistema robótico autónomo inventado por investigadores del MIT y la Institución Oceanográfica Woods Hole (WHOI) olfatea eficientemente los puntos de muestreo más interesantes científicamente, pero difíciles de encontrar, en aguas vastas e inexploradas.

Los científicos ambientales a menudo están interesados ​​en recolectar muestras en los lugares más interesantes, o «máximos», en un entorno. Un ejemplo podría ser una fuente de fugas de productos químicos, donde la concentración es la más alta y en su mayor parte intacta por factores externos. Pero un máximo puede ser cualquier valor cuantificable que los investigadores quieran medir, como la profundidad del agua o partes del arrecife de coral más expuestos al aire.

Los esfuerzos para desplegar robots de búsqueda máxima sufren problemas de eficiencia y precisión. Comúnmente, los robots se mueven de un lado a otro como cortadoras de césped para cubrir un área, que consume mucho tiempo y recoge muchas muestras sin interés. Algunos robots detectan y siguen rastros de alta concentración hasta su fuente de fuga. Pero pueden ser engañados. Por ejemplo, los químicos pueden quedar atrapados y acumularse en grietas lejos de una fuente. Los robots pueden identificar esos puntos de alta concentración como la fuente pero no estar cerca.

 

PLUMES

En un documento presentado en la Conferencia Internacional sobre Robots y Sistemas Inteligentes (IROS), los investigadores describen «PLUMES», un sistema que permite a los robots móviles autónomos concentrarse en un máximo mucho más rápido y más eficientemente. PLUMES aprovecha las técnicas probabilísticas para predecir qué caminos es probable que conduzcan al máximo, mientras navega por medio de obstáculos, corrientes cambiantes y otras variables. A medida que recolecta muestras, sopesa lo que aprendió para determinar si continuar por un camino prometedor o buscar lo desconocido, lo que puede albergar muestras más valiosas.

Es importante destacar que PLUMES llega a su destino sin quedar atrapado en esos puntos difíciles de alta concentración. «Eso es importante, porque es fácil pensar que has encontrado oro, pero realmente has encontrado oro de tontos«, dice la coautora Victoria Preston, estudiante de doctorado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y en el Programa conjunto MIT-WHOI.

Los investigadores construyeron un bote robótico impulsado por PLUMES que detectó con éxito la cabeza de coral más expuesta en el arrecife Bellairs Fringing Reef en Barbados, lo que significa que estaba ubicado en el lugar menos profundo, lo que es útil para estudiar cómo la exposición al sol impacta a los organismos coralinos. En 100 pruebas simuladas en diversos entornos submarinos, un robot virtual PLUMES también recolectó de forma consistente de siete a ocho veces más muestras de máximos que los métodos de cobertura tradicionales en los períodos de tiempo asignados.

«PLUMES realiza la cantidad mínima de exploración necesaria para encontrar el máximo y luego se concentra rápidamente en recolectar muestras valiosas allí«, dice la coautora Genevieve Flaspohler, estudiante de doctorado y en CSAIL y el Programa Conjunto MIT-WHOI.

Junto a Preston y Flaspohler en la investigación están: Anna P.M. Michel y Yogesh Girdhar, ambos científicos del Departamento de Física e Ingeniería Oceánica Aplicada de la WHOI; y Nicholas Roy, profesor en CSAIL y en el Departamento de Aeronáutica y Astronáutica.

 

Navegando en una compensación explotar-explorar

Una idea clave de PLUMES fue el uso de técnicas desde la probabilidad hasta la razón sobre cómo navegar la compensación notoriamente compleja entre explotar lo aprendido sobre el medio ambiente y explorar áreas desconocidas que pueden ser más valiosas.

«El mayor desafío en la búsqueda máxima es permitir que el robot equilibre la explotación de la información de lugares donde ya sabe que tiene altas concentraciones y la exploración de lugares de los que no sabe mucho«, dice Flaspohler. «Si el robot explora demasiado, no recogerá suficientes muestras valiosas al máximo. Si no explora lo suficiente, puede perder el máximo por completo«.

Caído en un nuevo entorno, un robot impulsado por PLUMES utiliza un modelo estadístico probabilístico llamado proceso gaussiano para hacer predicciones sobre variables ambientales, como las concentraciones químicas, y estimar las incertidumbres de detección. PLUMES luego genera una distribución de posibles rutas que el robot puede tomar, y utiliza los valores estimados y las incertidumbres para clasificar cada ruta según cuán bien le permita al robot explorar y explotar.

Al principio, PLUMES elegirá caminos que exploren aleatoriamente el entorno. Sin embargo, cada muestra proporciona nueva información sobre los valores objetivo en el entorno circundante, como los puntos con las concentraciones más altas de productos químicos o las profundidades más bajas. El modelo de proceso gaussiano explota esos datos para reducir las posibles rutas que el robot puede seguir desde su posición dada para tomar muestras de ubicaciones con un valor aún mayor. PLUMES utiliza una función objetivo novedosa, comúnmente utilizada en el aprendizaje automático para maximizar una recompensa, para determinar si el robot debe explotar el conocimiento pasado o explorar la nueva área.

 

Caminos «predecibles»

La decisión de dónde recolectar la siguiente muestra se basa en la capacidad del sistema de «predecir» todas las acciones futuras posibles desde su ubicación actual. Para hacerlo, aprovecha una versión modificada de Monte Carlo Tree Search (MCTS), una técnica de planificación de rutas popularizada para impulsar sistemas de inteligencia artificial que dominan juegos complejos, como Go y Chess.

MCTS utiliza un árbol de decisión, un mapa de nodos y líneas conectados, para simular un camino o secuencia de movimientos necesarios para alcanzar una acción ganadora final. Pero en los juegos, el espacio para posibles caminos es finito. En entornos desconocidos, con dinámicas cambiantes en tiempo real, el espacio es efectivamente infinito, lo que hace que la planificación sea extremadamente difícil. Los investigadores diseñaron el «MCTS de observación continua», que aprovecha el proceso gaussiano y la función objetivo novedosa para buscar en este espacio difícil de manejar posibles caminos reales.

La raíz de este árbol de decisión de MCTS comienza con un nodo de «creencia», que es el siguiente paso inmediato que puede tomar el robot. Este nodo contiene el historial completo de las acciones y observaciones del robot hasta ese momento. Luego, el sistema expande el árbol desde la raíz hacia nuevas líneas y nodos, mirando varios pasos de acciones futuras que conducen a áreas exploradas e inexploradas.

Luego, el sistema simula lo que sucedería si tomara una muestra de cada uno de esos nodos recién generados, en función de algunos patrones que ha aprendido de las observaciones anteriores. Dependiendo del valor del nodo simulado final, toda la ruta recibe una puntuación de recompensa, con valores más altos que equivalen a acciones más prometedoras. Los puntajes de recompensa de todas las rutas se retrotraen al nodo raíz. El robot selecciona la ruta de mayor puntaje, da un paso y recolecta una muestra real. Luego, utiliza los datos reales para actualizar su modelo de proceso gaussiano y repite el proceso de «predicción».

«Mientras el sistema continúe prediciendo que puede haber un valor más alto en partes invisibles del mundo, debe seguir explorando«, dice Flaspohler. «Cuando finalmente converge en un lugar que estima que es el máximo, porque no puede predecir un valor más alto en el camino, entonces deja de explorar«.

Ahora, los investigadores están colaborando con científicos de WHOI para usar robots alimentados por PLUMES para localizar plumas químicas en sitios volcánicos y estudiar las liberaciones de metano en los estuarios costeros en fusión en el Ártico. Los científicos están interesados ​​en la fuente de gases químicos liberados a la atmósfera, pero estos sitios de prueba pueden abarcar cientos de millas cuadradas.

 

«Pueden usar PLUMES para pasar menos tiempo explorando esa enorme área y realmente concentrarse en recolectar muestras científicamente valiosas«, dice Preston.