¿Recuerdan cuando el software no estaba conectado a Internet? No lo creo. En unos pocos años, esto también será cierto para el software que no viene con un asistente de copiloto inteligente, según Kevin Scott, director de tecnología de Microsoft.

Un copiloto es una aplicación que usa IA moderna y modelos de lenguaje grande para ayudarlo con una tarea cognitiva compleja, desde escribir un discurso de ventas o ponerse al día con una reunión perdida hasta generar imágenes para una presentación o planear una cena temática.

Microsoft introdujo el concepto de Copiloto hace aproximadamente 2 años con GitHub Copilot, un programador de pares de IA que ayuda a los desarrolladores con la escritura de código. Este año, Microsoft lanzó experiencias de copiloto a través de sus productos y servicios principales, desde el chat con IA en Bing que está cambiando la forma en que la gente busca en Internet a Microsoft 365 Copilot, GitHub Copilot X, Dynamics 365 Copilot, Copiloto en Microsoft Viva y Microsoft Security Copilot.

En la conferencia anual de desarrolladores Microsoft Build, la compañía anunció que ha ampliado este ecosistema de Microsoft Copilots para incluir Copilot en Power BI y Copilot en Power Pages en vista previa, Copilot en Microsoft Fabric, disponible en vista previa pronto, y Windows Copilot, que comenzará a estar disponible para una vista previa en junio. La compañía también introdujo nuevas características que ayudarán a los desarrolladores a construir sus propios copilotos y aplicaciones de IA de próxima generación. Esto incluye nuevas herramientas llamadas plugins que hacen que los copilots sean más útiles al permitirles interactuar con otro software y servicios.

«Usted puede mirar a Bing Chat y pensar que esto es algo súper mágico complicado, pero Microsoft está dando a los desarrolladores todo lo que necesitan para empezar a ir a construir un copiloto de su propia,» dijo Scott. «Creo que en los próximos años, esto se convertirá en una expectativa de cómo funciona todo el software».

Expandiendo el ecosistema de plugins

OpenAI introdujo plugins ChatGPT en marzo. Microsoft anunció plugins para Bing a principios de este mes. Esa tecnología permite que ChatGPT y Bing Chat te ayuden a encontrar y reservar una reserva de restaurante usando un plugin OpenTable, por ejemplo.

Actualmente, Microsoft está adoptando el mismo estándar de plugin abierto que OpenAI introdujo para ChatGPT, permitiendo la interoperabilidad a través de ChatGPT y la amplitud de las ofertas de copilotos de Microsoft. Eso significa que los desarrolladores ahora pueden usar una plataforma para crear plugins que funcionen tanto en superficies de negocios como de consumidores, incluyendo ChatGPT, Bing, Dynamics 365 Copilot, Microsoft 365 Copilot y Windows Copilot. Microsoft también anunció que está trayendo Bing a ChatGPT como la experiencia de búsqueda por defecto.

Como parte de esta plataforma de plugin compartido, Bing está añadiendo a su soporte para plugins. Además de los previamente anunciados para OpenTable y Wolfram Alpha, también tendrá expedía, Instacart, Kayak, Klarna, Redfin, TripAdvisor y Zillow entre muchos otros en el ecosistema de Bing.

Además, los desarrolladores ahora podrán extender Microsoft 365 Copilot con plugins. Los plugins para Microsoft 365 incluyen ChatGPT y plugins de Bing, así como extensiones de mensajes de Teams y conectores de Power Platform – permitiendo a los desarrolladores aprovechar sus inversiones existentes. Y los desarrolladores podrán crear fácilmente nuevos plugins con el Microsoft Teams Toolkit para Visual Studio Code y Visual Studio.

¿Cómo funcionan los plugins?

En Build, la compañía mostró un marco de desarrollo de IA que ayuda a los desarrolladores a construir su propio copiloto. Esta pila incluye soporte para plugins que aumentan las capacidades de los sistemas de IA al permitirles recuperar información en tiempo real, incorporar datos de empresas u otros negocios, realizar nuevos tipos de cálculos y tomar medidas de forma segura en nombre del usuario.

En principio, piense en plugins como un puente. Esto podría ser un puente entre un modelo de lenguaje grande que fue entrenado en datos públicos de Internet y todos los datos que una empresa puede mantener en privado sobre sus beneficios. El plugin es el puente que da acceso al copiloto a esos archivos cuando responde a una pregunta de un empleado de la empresa.

Del mismo modo, un plugin podría servir como un puente entre un modelo de idioma grande y un sitio web o sistema de back-end que una empresa utiliza para reservar viajes de negocios, permitiendo al copiloto hacer arreglos para el viaje de un vendedor a San Francisco que estén en línea con la política de viajes de la compañía.

«Un plugin se trata de cómo usted, el desarrollador de copilotos, dar a su copiloto o un sistema de IA la capacidad de tener capacidades que no se manifiesta en este momento y para conectarlo a los datos y conectarlo a los sistemas que usted está construyendo,» comenta Scott. «Creo que va a haber un ecosistema increíblemente rico de plugins».

Los desarrolladores también podrán crear, probar e implementar sus propios plugins de varias maneras – para eventualmente implementarlos con Microsoft Copilots y aumentar las capacidades de sus propias aplicaciones construidas con tecnología de IA generativa.

«Ese es un patrón de cómo se cargaría información en el modelo», dijo John Montgomery, vicepresidente corporativo de Microsoft de gestión de programas para la plataforma de IA. «Y ahí es donde entran los plugins. Lo que hace un plugin es que dice ‘Hey, queremos hacer que el patrón reutilizable y establecer algunos límites acerca de cómo se utiliza’ «.

Montgomery señaló que la adición de plugins también acelerará aún más el ritmo de las aplicaciones innovadoras que los clientes de Microsoft ya están construyendo con Azure OpenAI Service, que proporciona acceso a los modelos de IA generativa de OpenAI, incluyendo GPT-OpenAI4 y actualmente atiende a más de 4.500 empresas.

«Lo que vamos a ver en Build es nuestro mejor pensamiento actual sobre las prácticas arquitectónicas, las herramientas que necesita, y los patrones de aplicaciones y diseños de experiencia de usuario que desea poner alrededor de estas nuevas aplicaciones de copiloto», dijo en una entrevista antes de la conferencia.

Nuevas herramientas para construir tu propio copiloto

Si bien Microsoft ha implementado la tecnología de IA generativa en los productos y servicios de la compañía, los desarrolladores finalmente construirán la mayoría de los copilotos del mundo, según Scott.

«Entenderán una cosa en particular que ellos o sus usuarios están tratando de lograr, y utilizarán este patrón de desarrollo de software de IA para ir a construir esas cosas para esos usuarios», dijo.

El desarrollo de copilotos comienza como cualquier proyecto de software: como una idea. Lo que es diferente es el reino de las posibilidades que esta plataforma de desarrollo de IA permite , dijo Scott.

Compara esto con las nuevas experiencias y servicios que aparecieron con la llegada de los teléfonos inteligentes. Muchas cosas que eran imposibles de imaginar se hicieron posibles. Algunas eran fáciles de desarrollar, como aplicaciones para juegos familiares y casuales. Otros fueron duros y aprovecharon todas las capacidades de la plataforma de teléfonos inteligentes para crear nuevos tipos de experiencias, incluidos los servicios que interrumpieron las industrias de alquiler de taxis y vacaciones.

Con una idea sólida para una aplicación en la mano, los desarrolladores pueden ir sobre convertirlo en una realidad, dijo. El proceso comienza con la selección de un modelo de IA generativa como GPT-4, que está disponible a través de Azure OpenAI Service. El siguiente paso es darle al copiloto un meta-aviso, que es una descripción básica del papel del copiloto y cómo debe operar. Además, el copiloto necesita memoria para realizar un seguimiento de una conversación con un usuario y responder con el contexto y la conciencia adecuados. Finalmente, el copiloto necesita la capacidad de acceder a los datos y otros servicios, que los plugins pueden proporcionar.

Los desarrolladores pueden usar herramientas como el kit de desarrollo de software del Kernel Semántico que Microsoft lanzó al código abierto en marzo para integrar modelos de lenguaje grandes con lenguajes de programación convencionales. El kit incluye herramientas de memoria y orquestación y soporte para plugins, lo que acelera el desarrollo de copilotos, según Montgomery.

En Build, Microsoft introdujo nuevas herramientas para simplificar el desarrollo de copilotos. Por ejemplo, con el nuevo Azure AI Studio, los desarrolladores ahora pueden conectar más fácilmente modelos de IA conversacional en sus datos privados. Con una nueva capacidad llamada Azure OpenAI Service en sus datos, los desarrolladores pueden descubrir información específica de la organización a partir de datos, texto e imágenes utilizando interfaces de aplicación basadas en el lenguaje natural. Para ampliar aún más las capacidades de los modelos de idiomas grandes, Microsoft también anunció el soporte para plugins con Azure OpenAI Service. Azure AI ahora también es compatible con Azure Machine Learning prompt flow, una sofisticada herramienta de ingeniería rápida, señaló Montgomery.

«Hemos construido un montón de estos copilotos. Hemos analizado un montón de arquitecturas diferentes para ver cómo se carga otra información, cómo se crea contenido reproducible, cómo se alimenta al modelo con las cosas correctas para que dé las respuestas correctas», dijo. «Construir va a ser una celebración de todas las cosas que hemos aprendido, las herramientas que hemos creado y llevar eso al mundo».

Actualizaciones de responsabilidad IA

Es importante destacar que los desarrolladores también deben asegurarse de que el copiloto devuelva los resultados deseados y evite las salidas que sean sesgadas, sexistas, racistas, odiosas, violentas o que provoquen autolesiones, señaló Sarah Bird, un gestor de productos del grupo de socios de Microsoft que lidera la IA responsable para las tecnologías fundamentales.

Hoy en Build, Microsoft anunció que Azure AI Content Safety está en una vista previa. Este nuevo servicio de IA de Azure ayuda a los desarrolladores a crear entornos y comunidades en línea más seguros con modelos diseñados para detectar contenido inapropiado en imágenes y texto. Los modelos asignan una puntuación de gravedad al contenido marcado, indicando a los moderadores humanos qué contenido requiere una acción urgente.

«Es el sistema de seguridad que alimenta al GitHub Copilot, es parte del sistema de seguridad que alimenta al nuevo Bing. Ahora lo estamos lanzando como un producto que los clientes de terceros pueden usar», dijo Bird.

Azure AI Content Safety está integrado en Azure OpenAI Service, proporcionando a los clientes de IA generativa un acceso sin problemas a él. El servicio también se puede aplicar a sistemas que no son AI, como comunidades en línea y plataformas de juegos, y los filtros se pueden ajustar para el contexto. Por ejemplo, la frase «correr sobre la colina y atacar» utilizada en un juego sería considerada un nivel medio de violencia y bloqueada si el sistema de juego estaba configurado para bloquear contenido de gravedad media. Un ajuste para aceptar niveles medios de violencia permitiría al modelo tolerar la frase, explicó Bird.

Además, Microsoft anunció nuevas capacidades de procedencia de medios que llegarán a Microsoft Designer y Bing Image Creator que permitirán a los usuarios verificar si una imagen o un video fue generado por IA. La tecnología utiliza métodos criptográficos para marcar y firmar contenido generado por IA con metadatos sobre su origen.

Una nueva plataforma de desarrollo

Hace unos cuatro años, Scott y sus colegas plantearon la hipótesis de que los sistemas de IA generativa basados en grandes modelos de lenguaje se convertirían en plataformas. Permitirían a los desarrolladores construir nuevas aplicaciones y servicios con relativamente poco esfuerzo en comparación con formas más clásicas de aprendizaje automático que requieren obtener datos, elegir un modelo, entrenarlo, probarlo, implementarlo, etc.

«El punto donde estamos hoy es simplemente fantástico. Puedes tomar un modelo de lenguaje grande como GPT-4 y empezar a usarlo para crear aplicaciones», dijo Scott. «Hemos establecido esta nueva plataforma de aplicación llamada copiloto».

Microsoft cree copiloto representa tanto un nuevo paradigma en el software impulsado por la IA y un profundo cambio en la forma de software se construye – de imaginar nuevos escenarios de productos, a la experiencia del usuario, la arquitectura, los servicios que utiliza, y cómo pensar en la seguridad y la seguridad. El ecosistema de Microsoft, agregó Scott, es el lugar para que los desarrolladores construyan copilotos de extremo a extremo.

«Tenemos todo lo que necesitas en Azure para hacer un copiloto», dijo. «Y esas cosas funcionan muy bien juntas, por lo que probar tu idea e iterar rápidamente será más fácil de hacer en la parte superior de Azure que de cualquier otra manera».