mayo 19, 2024

Microsoft anunció que está investigando cómo el interacciones humano-robotutilizando la tecnología de inteligencia artificial ChatGPT en estas máquinas.

Desarrollado por OpenAI, ChatGPT tiene la capacidad de generar y vincular ideas, así como recordar conversaciones.

En el último mes, la compañía ha ido integrando esta tecnología en sus diferentes servicios, comenzando con Azure OpenAI Service a mediados de enero, llevándolo posteriormente a su buscador Bing y su navegador Edge.

Su última iteración se ha materializado en la vista previa del nuevo Bing impulsado por IA en aplicaciones móviles y su navegador Edge, así como la versión del motor de búsqueda para Skype.

Ahora, el fabricante tecnológico ha anunciado que está probando esta tecnología en robots, para «hacer posibles las interacciones naturales» con los humanos y ha explicado qué espera de esta integración..

«Nuestro objetivo con esta investigación es ver si ChatGPT puede pensar más allá del texto y razonar sobre el mundo físico para ayudar con las tareas de robótica», dijo Microsoft en un comunicado, y agregó que busca «ayudar a las personas a interactuar con los robots más fácilmente, sin la necesitan aprender lenguajes de programación complejos o detalles sobre sistemas robóticos».

Microsoft dijo que el objetivo de la investigación es ver si ChatGPT puede pensar más allá del texto.

En este sentido, ha establecido como reto enseñar a este chatbot a resolver problemas teniendo en cuenta factores como el contexto del entorno operativo y la forma en que “las acciones físicas pueden cambiar el estado del mundo”.

La compañía señala que este producto OpenAI tiene capacidades para realizar tareas por sí solo, pero que ha desarrollado un conjunto de principios de diseño que se pueden usar para guiar los modelos de lenguaje hacia la resolución de tareas de robótica.

Por otro lado, ha indicado que ChatGPT puede «desbloquear un nuevo paradigma de la robótica«, en el que suele haber procesos lentos, costosos e ineficientes de reescritura del código de comportamiento del robot.

De esta forma, este chatbot tiene la capacidad de brindar retroalimentación de alto nivel al llamado modelo de lenguaje grande (LLM), mientras monitorea el desempeño del robot y genera código para diferentes escenarios. de robótica

“Lo que sucede a nuestro alrededor es real e irreal a la vez”: cosas del día a día que nos costará distinguir si tienen una IA detrás

Cómo funciona el modelo de Microsoft que incluye ChatGPT

Para impulsar el LLM, Microsoft creó una serie de principios de diseño destinados a escribir instrucciones para tareas de robótica. Para ello, definió un conjunto de interfaces de programación de aplicaciones (API) robóticas.

Una vez escrito el mensaje de texto para que ChatGPT lo interprete, el cual describe el objetivo de la tarea que debe realizar la máquina, indica explícitamente qué debe hacer, qué no debe hacer o cómo debe formular el chatbot sus respuestas. .

El desarrollador o ingeniero espera la respuesta o salida del código ChatGPT utilizando un simulador y, si es necesario, utiliza lenguaje natural para evaluar la IA sobre la calidad y seguridad de sus respuestas.

Una vez que el modelo ha respondido de la forma deseada y la solución es viable, se implementa en el robot el código final del chat de inteligencia artificial.

Los desarrolladores también optaron por dar a estos robots objetivos como encontrar objetos.

La compañía de tecnología compartió una serie de experimentos para mostrar a qué acciones pueden responder los robots utilizando el modelo desarrollado por OpenAI.

Primero, aprendió los pasos a seguir para controlar un dron real y fue capaz de escribir estructuras de código complejas, como un patrón en zigzag para visualizar los estantes de una librería.

ChatGPT también se usó con el simulador Microsoft AirSim, un escenario en el que el modelo podía «analizar la intención del usuario» y señales detalladas para controlar un dron con precisión.

Bing incluso ha tenido una crisis existencial en una conversación con un usuario.

Este lenguaje incluso fue probado en un escenario de manipulación con un brazo robótico. Después de analizar las pautas, ChatGPT pudo vincular una serie de habilidades aprendidas para, entre otras actividades, apilar bloques de madera.

Los desarrolladores también optaron por dar a estos robots objetivos como encontrar objetos, usando funciones de detección. También realizó experimentos adicionales para probar si el chatbot puede decidir hacia dónde dirigir la máquina en función de lo que estaba buscando.