El laboratorio de IA aplicada, Cognition, ha presentado su última creación: Devin. Devin es descrito como un incansable y hábil compañero de equipo, igualmente dispuesto a construir en conjunto ó completar tareas de forma independiente para que sean revisadas.
Con Devin, los ingenieros pueden concentrarse en problemas más interesantes, y los equipos de ingeniería pueden aspirar a metas más ambiciosas.
Las Capacidades de Devin
Con los avances en razonamiento y planificación a largo plazo, Devin puede planificar y ejecutar tareas de ingeniería complejas que requieren miles de decisiones. Devin puede recordar el contexto relevante en cada paso, aprender con el tiempo y corregir errores.
También se ha dotado a Devin con herramientas comunes para desarrolladores, incluyendo terminal, el editor de código y el navegador, dentro de un entorno informático aislado, todo lo que un humano necesitaría para hacer su trabajo.
Finalmente, se le ha dado a Devin la capacidad de colaborar activamente con el usuario. Devin informa sobre su progreso en tiempo real, acepta retroalimentación y trabaja junto a un equipo en las decisiones de diseño según sea necesario.
Aquí hay una muestra de lo que Devin puede hacer:
- Aprender a usar tecnologías desconocidas.- Construir y desplegar aplicaciones de principio a fin.
- Encontrar y corregir errores en bases de código.
- Entrenar y afinar sus propios modelos de IA.
El Rendimiento de Devin
Devin ha sido evaluado en SWE-bench, un benchmark desafiante que pide a los agentes resolver problemas reales encontrados en proyectos de código abierto como Django y scikit-learn.
Devin resuelve correctamente el 13.86% de los problemas de extremo a extremo, superando ampliamente al mejor modelo anterior de 1.96%. Incluso cuando se le dan los archivos exactos para editar, dichos modelos anteriores solo pueden resolver el 4.80% de los problemas.
Acerca de Cognition
Cognition es un laboratorio de IA aplicada enfocado en el razonamiento. Al resolver ello, podemos desbloquear nuevas posibilidades en una amplia gama de disciplinas; el código es solo el comienzo. Queremos ayudar a personas de todo el mundo a convertir sus ideas en realidad.
Cognition cuenta con financiamiento sólido, incluida una Serie A de $21 millones liderada por Founders Fund. Y el apoyo de líderes de la industria, incluidos Patrick y John Collison, Elad Gil, Sarah Guo, Chris Re, Eric Glyman, Karim Atiyeh, Erik Bernhardsson, Tony Xu, Fred Ehrsam y muchos más.
0 Comentarios