Ranking modelos de lenguaje

El Chatbot Arena Leaderboard es un ranking competitivo que evalúa y compara el rendimiento de diferentes modelos de lenguaje grandes (LLMs) mediante un sistema de puntuación basado en el método Elo, similar al utilizado en ajedrez y otros juegos competitivos.

¿Cómo funciona?

  • Usuarios votan: La gente chatea con dos modelos de lenguaje sin saber cuál es cuál y elige cuál responde mejor.

  • Puntuación Elo: Cada modelo de lenguaje gana o pierde puntos según si gana o pierde en estos "duelos".

  • Ranking actualizado: Los modelos de lenguaje con más votos positivos suben en la tabla.

¿Por qué unos son mejores que otros?

  • Respuestas más útiles: Algunos entienden mejor las preguntas y dan respuestas más claras.

  • Más conocimiento: Algunos saben más temas (ciencia, tecnología, cultura, etc.).

  • Más naturales: Suenan más como humanos y menos como robots.

  • Más rápidos: Responden en menos tiempo sin perder calidad.

A continuación está el ranking actualizado con los últimos resultados, pulsa en la pestaña "🏆 Leaderboard":