La resolución de referencias (Reference Resolution) es crucial para las empresas, ya que les permite entender y gestionar eficazmente diferentes contextos. Por ejemplo, consideremos un sistema de atención al cliente en línea. Aquí, el contexto incluiría tanto las interacciones anteriores con el cliente como la información relevante que aparece en la pantalla del agente, como historiales de compras o detalles de productos. Aunque los modelos de lenguaje basados en inteligencia artificial son muy poderosos, su aplicación en la resolución de referencias específicas de la empresa aún no se ha aprovechado plenamente.

Este artículo demuestra cómo estos modelos pueden ser utilizados para crear sistemas altamente efectivos para resolver referencias de manera automatizada. Por ejemplo, el sistema podría interpretar la pregunta de un cliente sobre un producto específico y proporcionar la información relevante sobre ese artículo, incluso si la pregunta es vaga o se refiere a elementos visuales en la pantalla. Nuestro enfoque muestra mejoras significativas sobre los sistemas existentes, incluso superando a modelos avanzados como GPT-4. Esto sugiere un gran potencial para mejorar la eficiencia y la precisión en la gestión de información en entornos empresariales.

Apple acaba de publicar un paper al respecto:

https://arxiv.org/pdf/2403.20329.pdf