banner

Blog

Jun 14, 2023

Cómo automático

ACTUALIZADO 19:55 EDT / 06 DE JUNIO DE 2023

por Kyt Dotson

Los chatbots de inteligencia artificial, como ChatGPT de OpenAI LP, han alcanzado un punto álgido de popularidad recientemente, no solo por su capacidad para mantener conversaciones similares a las humanas, sino porque pueden realizar tareas de conocimiento como investigación, búsquedas y generación de contenido.

Ahora hay un nuevo competidor que arrasa en las redes sociales que amplía las capacidades de la oferta de OpenAI al automatizar aún más sus capacidades: Auto-GPT. Es parte de una nueva clase de herramientas de IA llamadas "agentes de IA autónomos" que aprovechan el poder de GPT-3.5 y GPT-4, las tecnologías de IA generativa detrás de ChatGPT, para abordar una tarea, construir sobre su propio conocimiento y conectar aplicaciones y servicios para automatizar tareas y realizar acciones en nombre de los usuarios.

ChatGPT puede parecer mágico para los usuarios por su capacidad para responder preguntas y producir contenido basado en indicaciones del usuario, como resumir documentos grandes o generar poemas e historias o escribir código de computadora. Sin embargo, está limitado en lo que puede hacer porque solo es capaz de realizar una tarea a la vez. Durante una sesión con ChatGPT, un usuario puede solicitar a la IA una sola pregunta a la vez y refinar esas indicaciones o preguntas puede ser un viaje lento y tedioso.

Auto-GPT, creado por el desarrollador de juegos Toran Bruce Richards, elimina estas limitaciones al permitir que los usuarios le den a la IA un objetivo y un conjunto de metas a cumplir. Luego genera un bot que actúa como lo haría una persona, utilizando el modelo GPT de OpenAI para realizar indicaciones de IA a fin de acercarse a ese objetivo. En el camino, aprende a refinar sus indicaciones y preguntas para obtener mejores resultados con cada iteración.

También tiene conectividad a Internet para recopilar información adicional de las búsquedas. Además, tiene memoria a corto y largo plazo a través de conexiones a bases de datos para que pueda realizar un seguimiento de las subtareas. Y utiliza GPT-4 para producir contenido como texto o código cuando sea necesario. Auto-GPT también es capaz de desafiarse a sí mismo cuando una tarea está incompleta y de llenar los vacíos cambiando sus propias indicaciones para obtener mejores resultados.

Según Richards, aunque los chatbots de IA actuales son extremadamente poderosos, su incapacidad para refinar sus propias indicaciones sobre la marcha y automatizar tareas es un cuello de botella. "Esta inspiración me llevó a desarrollar Auto-GPT, que puede aplicar el razonamiento de GPT-4 a problemas más amplios y complejos que requieren una planificación a largo plazo y varios pasos", dijo a Vice.

Auto-GPT está disponible como código abierto en GitHub. Requiere una clave de interfaz de programación de aplicaciones de OpenAI para acceder a GPT-4. Y para usarlo, las personas deberán instalar Python y un entorno de desarrollo como Docker o VS Code con una extensión Dev Container. Como resultado, puede ser necesario un poco de conocimiento técnico para ponerse en marcha, aunque existe una extensa documentación de configuración.

En una interfaz de texto, Auto-GPT le pide al usuario que le dé a la IA un nombre, una función, un objetivo y hasta cinco metas que debe alcanzar. Cada uno de estos define cómo los agentes de IA abordarán la acción que el usuario desea y cómo entregará el producto final.

Primero, el usuario establece un nombre para la IA, como "RestaurantMappingApp-GPT", y luego establece una función, como "Desarrollar una aplicación web que proporcione mapas interactivos para los restaurantes cercanos". Luego, el usuario puede establecer una serie de objetivos, como "Escribir un back-end en Python" y "Programar un front-end en HTML", u "Ofrecer enlaces a menús si están disponibles" y "Enlace a aplicaciones de entrega".

Una vez que el usuario presiona Intro, Auto-GPT comenzará a lanzar agentes, que generarán indicaciones para GPT-4, luego abordarán el rol original y cada uno de los diferentes objetivos. Finalmente, comenzará a refinar y repetir a través de las diferentes indicaciones que le permitirán conectarse a Google Maps usando Python o JavaScript.

Lo hace dividiendo el trabajo general en tareas más pequeñas para trabajar en cada una, y utiliza un bot de IA de monitoreo principal que actúa como un "administrador" para asegurarse de que se coordinen. Este mensaje en particular le pide al bot que cree una aplicación algo compleja que podría salir mal si no realiza un seguimiento de una cantidad de partes móviles diferentes, por lo que podría tomar una gran cantidad de pasos para llegar allí.

Con cada paso, cada instancia de IA "narrará" lo que está haciendo e incluso se criticará a sí misma para refinar sus indicaciones según su enfoque hacia el objetivo dado. Una vez que alcanza un objetivo en particular, cada instancia finalizará su proceso y devolverá su respuesta a la tarea de gestión principal.

Tratar de obtener ChatGPT o incluso el GPT-4 basado en suscripción más avanzado para hacer esto sin supervisión requeriría una gran cantidad de pasos manuales que tendría que ser atendidos por un ser humano. Auto-GPT los hace solo.

Las capacidades de Auto-GPT son beneficiosas para los desarrolladores neófitos que buscan avanzar en el juego, dijo a SiliconANGLE Brandon Jung, vicepresidente de ecosistema del proveedor de herramientas de finalización de código AI Tabnine Ltd.

"Un beneficio es que es una buena introducción para aquellos que son nuevos en la codificación y permite la creación rápida de prototipos", dijo Jung. "Para los casos de uso que no requieren exactitud o tienen problemas de seguridad, podría acelerar el proceso de creación sin tener que ser parte de un sistema más amplio que incluye un experto para su revisión".

Ser capaz de crear aplicaciones rápidamente, incluido todo el código a la vez, a partir de una serie simple de indicaciones de texto traería muchas plantillas nuevas para el código a las manos de los desarrolladores. Esencialmente brindándoles soluciones rápidas y bases sobre las cuales construir. Sin embargo, primero tendrían que pasar por una revisión exhaustiva antes de ponerse en producción.

Ese es solo un ejemplo de las capacidades de Auto-GPT. Con sus capacidades, tiene posibilidades de gran alcance que actualmente están siendo exploradas por desarrolladores, gerentes de proyectos, investigadores de IA y cualquier otra persona que pueda descargar su código fuente.

"Existen numerosos ejemplos de personas que utilizan Auto-GPT para realizar estudios de mercado, crear planes comerciales, crear aplicaciones, automatizar tareas complejas en pos de un objetivo, como planificar una comida, identificar recetas y pedir todos los ingredientes, e incluso ejecutar transacciones. en nombre del usuario", dijo a SiliconANGLE Sheldon Monteiro, director de productos de la firma de transformación de negocios digitales Publicis Sapient.

Con su capacidad para buscar en Internet, Auto-GPT puede encargarse de una investigación de mercado rápida como "Encuéntreme cinco teclados para juegos por menos de $200 y enumere sus ventajas y desventajas". Con su capacidad para dividir una tarea en múltiples subtareas, la IA autónoma podría buscar rápidamente múltiples sitios de revisión, producir un informe de investigación de mercado y regresar con una lista de teclados para juegos que se encuentran por debajo de esa cantidad y proporcionar sus precios, así como información sobre ellos.

Un usuario de Twitter llamado MOE creó un bot Auto-GPT llamado "Isabella" que puede analizar de forma autónoma los datos del mercado y subcontratar a otras IA. Lo hace mediante el uso del marco Lang-chain de AI para recopilar datos de forma autónoma y realizar análisis de sentimiento en diferentes mercados.

autogpt estaba tratando de crear una aplicación para mí, reconoció que no tengo Node, busqué en Google cómo instalar Node, encontré un artículo de stackoverflow con enlace, lo descargué, lo extraje y luego generó el servidor para mí.

¿Mi contribución? Observé. pic.twitter.com/2QthbTzTGP

— Varun Mayya (@VarunMayya) 6 de abril de 2023

Debido a que Auto-GPT tiene acceso a Internet y puede tomar medidas en nombre del usuario, también puede instalar aplicaciones. En el caso del usuario de Twitter Varun Mayya, quien le pidió al bot que creara un software, descubrió que no tenía instalado Node.js, un entorno que permite que JavaScript se ejecute localmente en lugar de en un navegador web. Como resultado, buscó en Internet, descubrió un tutorial de StackOverflow y lo instaló para que pudiera continuar con la creación de la aplicación.

Auto-GPT no es la única IA de agente autónomo disponible actualmente. Otro que se ha puesto de moda es BabyAGI, que fue creado por Yohei Nakajima, un capitalista de riesgo e investigador de inteligencia artificial. AGI se refiere a "inteligencia general artificial", un tipo hipotético de IA que tendría la capacidad de realizar cualquier tarea intelectual, pero ninguna IA existente se le acerca. BabyAGI es un sistema de gestión de tareas basado en Python que utiliza la API de OpenAI, como Auto-GPT, que prioriza y crea nuevas tareas hacia un objetivo.

También están AgentGPT y GodMode, que son mucho más fáciles de usar porque usan una interfaz web en lugar de necesitar una instalación en una computadora, por lo que se puede acceder a ellos como un servicio. Estos servicios reducen la barrera de entrada haciéndolo simple para los usuarios porque no requieren ningún conocimiento técnico para usarlos y realizarán tareas similares a Auto-GPT, como generar código, responder preguntas e investigar. Sin embargo, no pueden escribir documentos en la computadora ni instalar software.

Sin embargo, estas herramientas tienen inconvenientes, advirtió Monteiro. Los ejemplos en Internet están seleccionados y pintan la tecnología con una luz brillante. A pesar de todos los éxitos, hay muchos problemas que pueden ocurrir al usarlo.

"Puede atascarse en bucles de tareas y confundirse", dijo Monteiro. "Y esos bucles de tareas pueden volverse bastante costosos, muy rápidos con los costos de las llamadas a la API de GPT-4. Incluso cuando funciona según lo previsto, puede requerir una secuencia bastante larga de pasos de razonamiento, cada uno de los cuales consume el costoso GPT-4 fichas".

Acceder a GPT-4 puede costar dinero que varía según la cantidad de tokens que se utilicen. Los tokens se basan en palabras o partes de frases enviadas a través del chatbot. Los cargos van desde tres centavos por 1000 tokens para solicitudes hasta seis centavos por 1000 tokens para resultados. Eso significa que usar Auto-GPT para ejecutar un proyecto complejo o quedarse atascado en un bucle desatendido podría terminar costando unos pocos dólares.

Al mismo tiempo, GPT-4 puede ser propenso a errores, conocidos como "alucinaciones", lo que podría significar problemas durante el proceso. Podría generar acciones totalmente incorrectas o erróneas o, peor aún, producir un código inseguro o desastrosamente malo cuando se le pida que cree una aplicación.

"[Auto-GPT] tiene la capacidad de ejecutarse en la salida anterior, incluso si algo sale mal, continúa", dijo Bern Elliot, un distinguido vicepresidente analista de Gartner. "Necesita controles estrictos para evitar que se salga de los rieles y siga funcionando. Espero que el uso indebido sin las barandillas adecuadas cause algunos resultados inesperados y no deseados".

El lado del desarrollo de software podría ser igualmente problemático. Incluso si Auto-GPT no comete un error que provoque que produzca un código roto, lo que provocaría que el software simplemente fallara, podría crear una aplicación plagada de problemas de seguridad.

"Auto-GPT no es parte de un ciclo de vida completo de desarrollo de software (pruebas, seguridad, etc.) ni está integrado en un IDE", dijo Jung, advirtiendo sobre los posibles problemas que podrían surgir del mal uso de la herramienta. "Resumir la complejidad está bien si se está construyendo sobre una base sólida. Sin embargo, estas herramientas, por definición, no están creando un código sólido y fomentan que el código malo e inseguro se introduzca en la producción".

Herramientas como Auto-GPT, BabyAGI, AgentGPT y GodMode aún son experimentales, pero existen implicaciones más amplias sobre cómo podrían usarse para reemplazar tareas rutinarias como la planificación de vacaciones o las compras, explicó Monteiro.

En este momento, Microsoft incluso ha desarrollado ejemplos simples de un complemento para Bing Chat. Permite a los usuarios pedirle que les ofrezca sugerencias para la cena que tendrán su IA, que funciona con GPT-4, desplegará una lista de ingredientes y luego iniciará Instacart para tenerlos preparados para la entrega. Aunque este es un paso en la dirección de la automatización, los bots como Auto-GPT se están acercando a un futuro potencial de comportamientos completamente autónomos.

Un usuario podría solicitar Auto-GPT para buscar en las tiendas locales, preparar listas de ingredientes, comparar precios y calidad, configurar un carrito de compras e incluso completar pedidos de forma autónoma. En este punto experimental, es posible que muchos usuarios no estén dispuestos a permitir que el bot use su tarjeta de crédito y entregue los pedidos por sí solo, por temor a que se vuelva loco y les envíe varios cientos de racimos de albahaca.

Un futuro similar en el que una IA haga esto para los agentes de viajes que usan Auto-GPT puede no estar muy lejos. "Déle sus parámetros (playa, viaje máximo de cuatro horas, clase de hotel) y su presupuesto, y felizmente hará toda la navegación web por usted, comparando opciones en busca de su objetivo", dijo Monteiro. "Cuando termine, le presentará sus hallazgos y también podrá ver cómo llegó allí".

A medida que estas herramientas comienzan a madurar, tienen una posibilidad real de proporcionar una forma para que las personas automaticen las tareas mundanas paso a paso que suceden en Internet. Eso podría tener algunas implicaciones interesantes, especialmente en el comercio electrónico.

"¿Cómo se adaptarán las empresas cuando estos agentes naveguen por los sitios y eliminen su producto de la consideración establecida antes de que un humano vea la marca?" dijo Monteiro. "Desde el punto de vista del comercio electrónico, si las personas comienzan a usar las herramientas Auto-GPT para comprar bienes y servicios en línea, los minoristas tendrán que adaptar la experiencia de sus clientes".

GRACIAS

Cómo Auto-GPT revolucionará los chatbots de IA tal como los conocemos

La estrategia de nube 'Starlink' de Oracle se vuelve interesante

Las acciones de Couchbase caen por una pérdida más amplia y una guía suave

El poder de las supernubes: el análisis de TheCUBE de la visión de Cisco para un futuro más simple y seguro

CrowdStrike agrega más funciones de ciberseguridad para proteger los entornos en la nube

Cisco simplifica su cartera de productos con la nueva plataforma Cisco Networking Cloud

Cómo Auto-GPT revolucionará los chatbots de IA tal como los conocemos

AI-POR KYT DOTSON. HACE 1 MINUTO

La estrategia de nube 'Starlink' de Oracle se vuelve interesante

BIG DATA - POR AUTOR INVITADO . HACE 3 MINUTOS

Las acciones de Couchbase caen por una pérdida más amplia y una guía suave

GRANDES DATOS - POR MIKE WHEATLEY . HACE 24 MINUTOS

El poder de las supernubes: el análisis de TheCUBE de la visión de Cisco para un futuro más simple y seguro

AI-POR CHAD WILSON. HACE 2 HORAS

CrowdStrike agrega más funciones de ciberseguridad para proteger los entornos en la nube

SEGURIDAD - POR MARIA DEUTSCHER . HACE 3 HORAS

Cisco simplifica su cartera de productos con la nueva plataforma Cisco Networking Cloud

NUBE - POR MARIA DEUTSCHER . HACE 4 HORAS

"TheCUBE es un socio importante para la industria. Ustedes realmente son parte de nuestros eventos y realmente apreciamos que hayan venido y sé que la gente también aprecia el contenido que crean" – Andy Jassy GRACIAS
COMPARTIR