¿Vamos a pasar a un mundo de pagos autenticados por agentes?
Ese parece ser el tema de actualidad, ya que las empresas con agentes siguen prometiendo un mundo de integraciones, donde la IA se encarga de tomar decisiones financieras en nombre de los usuarios. ¿Quiere ganar recompensas por una compra? Deje que su agente decida el mejor método de pago. ¿Necesita cancelar o cambiar una suscripción? Su agente puede hacerlo por usted. ¿Olvida el pago de una factura? Su agente lo detectará y se asegurará de que esté al día.
Pero con los nuevos métodos de pago surgen nuevos vectores de fraude y no está claro dónde recaerá la responsabilidad por las transacciones en disputa. Si no tenía intención de pagar algo, ¿es esa responsabilidad del agente, del comerciante, de su banco o suya? ¿Puede alguien engañar a su agente para que realice compras fraudulentas y, si lo hace, quién es responsable?
También hay preguntas de autorización que responder: ¿Cómo pueden los agentes intervenir en los flujos de autenticación fraudulentos como la verificación de vida, la autenticación de dos factores del dispositivo, la entrada del número PIN, etc.? Y si pueden hacerlo fácilmente, ¿cómo pueden los proveedores de pagos mejorar rápidamente sus flujos de autenticación para evitar el spam de pagos de IA? (Por cierto, una de nuestras inversiones más recientes del fondo, BKey, busca evitar precisamente eso).
Una variable adicional: la creciente aceptación de los pagos con criptomonedas y monedas estables puede crear nuevas oportunidades para la IA. Si los pagos se vuelven más programables, será más fácil para los agentes traducir sus gustos y preferencias en acciones, realizando tareas complejas como dividir facturas o negociar los términos de un préstamo para usted. Y solo estamos pensando en los pagos de los consumidores en este momento; los pagos corporativos son otra cosa.
Después del auge de la IA generativa, la inteligencia artificial está al borde de otra transformación significativa con el advenimiento de la IA agéntica. Este cambio está impulsado por la evolución de los modelos de lenguaje grandes (LLM) en entidades activas de toma de decisiones. Estos modelos ya no se limitan a generar texto similar al humano; están adquiriendo la capacidad de razonar, planificar, usar herramientas y ejecutar tareas complejas de forma autónoma. Esta evolución trae consigo una nueva era en la tecnología de IA, que redefine la forma en que interactuamos con ella y la utilizamos en diversas industrias. En este artículo, exploraremos cómo los LLM están dando forma al futuro de los agentes autónomos y las posibilidades que se avecinan.
El auge de la IA agente: ¿qué es?
La IA agéntica se refiere a sistemas o agentes que pueden realizar tareas de forma independiente, tomar decisiones y adaptarse a situaciones cambiantes. Estos agentes poseen un nivel de agencia, lo que significa que pueden actuar de forma independiente en función de objetivos, instrucciones o comentarios, todo ello sin una guía humana constante.
A diferencia de los sistemas de IA convencionales limitados a tareas fijas, la IA agéntica es dinámica. Aprende de las interacciones y mejora su comportamiento con el tiempo. Una característica esencial de la IA agéntica es su capacidad para dividir las tareas en pasos más pequeños, analizar diferentes soluciones y tomar decisiones en función de varios factores.
Por ejemplo, un agente de IA que esté planeando unas vacaciones podría evaluar el clima, el presupuesto y las preferencias del usuario para recomendar las mejores opciones de viaje. Puede consultar herramientas externas, ajustar sugerencias en función de los comentarios y refinar sus recomendaciones con el tiempo. Las aplicaciones de la IA agéntica abarcan desde asistentes virtuales que gestionan tareas complejas hasta robots industriales que se adaptan a nuevas condiciones de producción.
La evolución de los modelos de lenguaje a los agentes
Los LLM tradicionales son herramientas poderosas para procesar y generar texto, pero funcionan principalmente como sistemas avanzados de reconocimiento de patrones. Los avances recientes han transformado estos modelos, equipándolos con capacidades que van más allá de la simple generación de texto. Ahora se destacan en el razonamiento avanzado y el uso práctico de herramientas.
Estos modelos pueden formular y ejecutar planes de varios pasos, aprender de experiencias pasadas y tomar decisiones basadas en el contexto mientras interactúan con herramientas externas y API. Con la incorporación de la memoria a largo plazo, pueden retener el contexto durante períodos prolongados, lo que hace que sus respuestas sean más adaptativas y significativas.
En conjunto, estas capacidades han abierto nuevas posibilidades en la automatización de tareas, la toma de decisiones y las interacciones personalizadas con los usuarios, lo que desencadena una nueva era de agentes autónomos.
El papel de los LLM en la IA agenética
La IA agenética se basa en varios componentes centrales que facilitan la interacción, la autonomía, la toma de decisiones y la adaptabilidad. Esta sección explora cómo los LLM están impulsando la próxima generación de agentes autónomos.
LLM para comprender instrucciones complejas
Para la IA agenética, la capacidad de comprender instrucciones complejas es crucial. Los sistemas de IA tradicionales a menudo requieren comandos precisos y entradas estructuradas, lo que limita la interacción del usuario. Sin embargo, los LLM permiten a los usuarios comunicarse en lenguaje natural. Por ejemplo, un usuario puede decir: "Reserva un vuelo a Nueva York y organiza alojamiento cerca de Central Park". Los LLM captan esta solicitud interpretando la ubicación, las preferencias y los matices logísticos. La IA puede entonces llevar a cabo cada tarea (desde reservar vuelos hasta seleccionar hoteles y organizar billetes) con una mínima supervisión humana.
Los LLM como marcos de planificación y razonamiento
Una característica clave de la IA con agentes es su capacidad de dividir tareas complejas en pasos más pequeños y manejables. Este enfoque sistemático es vital para resolver problemas más significativos de manera eficaz. Los LLM han desarrollado capacidades de planificación y razonamiento que permiten a los agentes realizar tareas de varios pasos, de manera similar a como lo hacemos cuando resolvemos problemas matemáticos. Piense en estas capacidades como el "proceso de pensamiento" de los agentes de IA.
Han surgido técnicas como el razonamiento en cadena de pensamiento (CoT) para ayudar a los LLM a lograr estas tareas. Por ejemplo, considere un agente de IA que ayuda a una familia a ahorrar dinero en comestibles. CoT permite a los LLM abordar esta tarea de manera secuencial, siguiendo estos pasos:
Evalúe el gasto actual de la familia en comestibles.
Identifique las compras frecuentes.
Investigue las ofertas y los descuentos.
Explore tiendas alternativas.
Sugiera la planificación de las comidas.
Evalúe las opciones de compra al por mayor.
Este método estructurado permite que la IA procese la información de manera sistemática, como lo haría un asesor financiero para administrar un presupuesto. Esta adaptabilidad hace que la IA con agentes sea adecuada para diversas aplicaciones, desde las finanzas personales hasta la gestión de proyectos. Más allá de la planificación secuencial, los enfoques más sofisticados mejoran aún más las capacidades de razonamiento y planificación de los LLM, lo que les permite abordar escenarios aún más complejos.
LLM para mejorar la interacción con herramientas
Un avance significativo en la IA con agentes es la capacidad de los LLM de interactuar con herramientas externas y API. Esta capacidad permite a los agentes de IA realizar tareas como ejecutar código e interpretar resultados, interactuar con bases de datos, interactuar con servicios web y administrar flujos de trabajo digitales. Al incorporar estas capacidades, los LLM han evolucionado de ser procesadores pasivos del lenguaje a convertirse en agentes activos en aplicaciones prácticas del mundo real.
Imagine un agente de IA que pueda consultar bases de datos, ejecutar código o administrar el inventario mediante la interacción con los sistemas de la empresa. En un entorno minorista, este agente podría automatizar de forma autónoma el procesamiento de pedidos, analizar la demanda de productos y ajustar los cronogramas de reposición. Este tipo de integración amplía la funcionalidad de la IA con agentes, lo que permite a los LLM interactuar con el mundo físico y digital sin problemas.
LLM para la gestión de la memoria y el contexto
La gestión eficaz de la memoria es vital para la IA de tipo agente, ya que permite a los LLM retener y hacer referencia a la información durante interacciones a largo plazo. Sin memoria, los agentes de IA tienen dificultades para realizar tareas continuas. Les resulta difícil mantener diálogos coherentes y ejecutar acciones de varios pasos de forma fiable.
Para abordar este desafío, los LLM utilizan diferentes tipos de sistemas de memoria. La memoria episódica ayuda a los agentes a recordar interacciones pasadas específicas, lo que contribuye a la retención del contexto. La memoria semántica almacena el conocimiento general, lo que mejora el razonamiento de la IA y la aplicación de la información aprendida en diversas tareas. La memoria de trabajo permite a los LLM centrarse en las tareas actuales, lo que garantiza que puedan gestionar procesos de varios pasos sin perder de vista su objetivo general.
Estas capacidades de memoria permiten a la IA de tipo agente gestionar tareas que requieren un contexto continuo. Pueden adaptarse a las preferencias del usuario y refinar los resultados en función de las interacciones pasadas. Por ejemplo, un entrenador de salud de IA puede realizar un seguimiento del progreso físico de un usuario y proporcionar recomendaciones cambiantes en función de los datos de entrenamiento recientes.
Cómo los avances en los LLM potenciarán a los agentes autónomos
A medida que los LLM sigan avanzando con la interacción, el razonamiento, la planificación y el uso de herramientas, la IA agéntica será cada vez más capaz de gestionar de forma autónoma tareas complejas, adaptarse a entornos dinámicos y colaborar de forma eficaz con los seres humanos en diversos dominios. Algunas de las formas en que los agentes de IA prosperarán con las capacidades avanzadas de los LLM son:
Expansión hacia la interacción multimodal
Con las crecientes capacidades multimodales de los LLM, la IA agéntica interactuará con más que solo texto en el futuro. Los LLM ahora pueden incorporar datos de varias fuentes, incluidas imágenes, videos, audio y entradas sensoriales. Esto permite a los agentes interactuar de forma más natural con diferentes entornos. Como resultado, los agentes de IA podrán navegar por escenarios complejos, como la gestión de vehículos autónomos o la respuesta a situaciones dinámicas en la atención médica.
Capacidades de razonamiento mejoradas
A medida que los LLM mejoren sus capacidades de razonamiento, la IA agéntica prosperará al tomar decisiones informadas en entornos inciertos y ricos en datos. Evaluará múltiples factores y gestionará las ambigüedades de forma eficaz. Esta capacidad es esencial en el ámbito financiero y de diagnóstico, donde las decisiones complejas basadas en datos son fundamentales. A medida que los estudiantes de LLM se vuelven más sofisticados, sus habilidades de razonamiento fomentarán la toma de decisiones reflexiva y consciente del contexto en diversas aplicaciones.
Inteligencia artificial especializada en agentes para la industria
A medida que los LLM avancen en el procesamiento de datos y el uso de herramientas, veremos agentes especializados diseñados para industrias específicas, incluidas las finanzas, la atención médica, la fabricación y la logística. Estos agentes se encargarán de tareas complejas, como la gestión de carteras financieras, el seguimiento de pacientes en tiempo real, el ajuste preciso de los procesos de fabricación y la predicción de las necesidades de la cadena de suministro. Cada industria se beneficiará de la capacidad de la IA de agentes para analizar datos, tomar decisiones informadas y adaptarse a la nueva información de forma autónoma.
Sistemas multiagente
El progreso de los LLM mejorará significativamente los sistemas multiagente en la IA de agentes. Estos sistemas estarán compuestos por agentes especializados que colaborarán para abordar tareas complejas de forma eficaz. Con las capacidades avanzadas de los LLM, cada agente puede centrarse en aspectos específicos mientras comparte información sin problemas. Este trabajo en equipo conducirá a una resolución de problemas más eficiente y precisa, ya que los agentes gestionan simultáneamente diferentes partes de una tarea. Por ejemplo, un agente puede controlar los signos vitales en la atención médica mientras otro analiza los registros médicos. Esta sinergia creará un sistema de atención al paciente cohesivo y receptivo, que en última instancia mejorará los resultados y la eficiencia en varios dominios.
Presentamos SocialCashier
SocialCashier® es un motor transaccional de punto de venta diseñado para ayudar a las empresas a simplificar los cobros de pagos remotos y las transacciones de remesas globales a través de WhatsApp
Empodera a tus clientes
Empodera a tus clientes para que realicen pagos o envíen dinero al exterior a través de WhatsApp, la misma aplicación que ya usan para comunicarse a diario.
Reimagina tu marca
Integra y ofrece nuestra plataforma SocialCashier® bajo tu propia marca, asegurando la propiedad total de la relación con el cliente, al mismo tiempo que impulsas el valor de tu marca.
Mejora tu experiencia de cliente con SocialCashier
SocialCashier® es una plataforma de marca blanca flexible y altamente personalizable que se conecta directamente a tu sistema central a través de API, diseñada para adaptarse a las necesidades específicas de tu negocio y ajustarse a medida que esas necesidades evolucionan Mujer usando VoicePay en WhatsApp para realizar un pago seguro con un comando de voz.
Presentamos VoicePay
VoicePay® es una herramienta de reconocimiento de identidad totalmente inmersiva integrada en la plataforma de SocialCashier. Una vez registrados, los clientes pueden realizar pagos o enviar remesas con un simple comando de voz, como “Apruebo este pago con los números 7, 3, 8, 5”.
Conclusión
Los modelos de lenguaje grandes evolucionan rápidamente desde simples procesadores de texto hasta sofisticados sistemas de agentes capaces de actuar de forma autónoma. El futuro de la IA de agentes, impulsada por los LLM, tiene un enorme potencial para transformar las industrias, mejorar la productividad humana e introducir nuevas eficiencias en la vida diaria. A medida que estos sistemas maduren, prometen un mundo en el que la IA no sea solo una herramienta sino un socio colaborador, que nos ayude a navegar por las complejidades con un nuevo nivel de autonomía e inteligencia.
Comments