Pantera y Franklin se unen a la Iniciativa de Pruebas de Agentes de IA de Sentient Arena
Resumen
Pantera Capital y la unidad de activos digitales de Franklin Templeton se han unido a la cohorte inicial de Arena, un nuevo entorno de prueba de Sentient Labs diseñado para evaluar agentes de IA mediante un benchmarking de estilo de producción en lugar de pruebas de modelos estáticos. Arena somete a los agentes a tareas estandarizadas modeladas en condiciones empresariales, como el manejo de documentos largos y fuentes contradictorias, para evaluar el "razonamiento listo para producción" en tareas como análisis y cumplimiento. La plataforma rastrea categorías de fallos como la alucinación y las lagunas de razonamiento, y planea publicar métricas de rendimiento comparativas a través de una tabla de clasificación pública. Esta iniciativa surge mientras las empresas aceleran el despliegue de IA, con un 85% de los líderes encuestados que aspiran a convertirse en "empresas agenticas" en tres años, en medio de una creciente experimentación con sistemas de IA que poseen mayor autonomía económica.
(Fuente:Cointelegraph)