ChatGPT, de OpenAI, perdió el 63 % de sus fondos en una competición de comercio de criptomonedas de dos semanas organizada por Nof1, quedando en último lugar entre seis grandes modelos de lenguaje (LLM), según Protos.
Los bots de IA ponen a prueba sus habilidades en el comercio de criptomonedas
El concurso «Alpha Arena», que finalizó el lunes, encargó a seis sistemas de IA líderes el comercio de activos digitales utilizando indicaciones idénticas y conjuntos de datos limitados.
ChatGPT, Gemini de Google, de Alphabet (NASDAQ:GOOGL), Grok de X y Claude Sonnet de Anthropic terminaron en números rojos.
Por el contrario, Qwen3 Max de Alibaba (NYSE:BABA) encabezó la clasificación con una ganancia de 2232 dólares, seguido de DeepSeek, que ganó 489 dólares.
El resto sufrió fuertes pérdidas: ChatGPT perdió 6267 dólares, Gemini 5671 dólares, Grok 4531 dólares y Claude 3081 dólares, partiendo de un saldo inicial de 10 000 dólares.
También puedes leer: 5 acciones en el foco este miércoles: MCD, PINS, QCOM, AMD y HUM
Los costes de negociación merman el rendimiento de la IA
Nof1 dijo que las ganancias estaban «dominadas por los costes de negociación en las primeras rondas», ya que los agentes negociaban en exceso y obtenían pequeñas ganancias que las comisiones borraban.
Gemini registró 238 operaciones, mientras que Claude solo realizó 38. En los seis modelos, las tasas de ganancia oscilaron entre el 25 % y el 30 %.
Qwen3 Max incurrió en las comisiones totales más altas, con 1654 dólares, pero aún así superó a sus competidores gracias a su disciplinada selección de operaciones.
La rentabilidad constante del modelo chino contrasta fuertemente con las fuertes pérdidas de ChatGPT, lo que subraya el comportamiento divergente ante el riesgo de los LLM en condiciones idénticas.
Los organizadores lo califican como una prueba de estrés para la IA
El fundador de Nof1, Jay Azhang, describió el evento como una prueba de estrés controlada para los sistemas de IA generativa.
«Los LLM no manejan muy bien los datos numéricos de series temporales, pero ese es todo el contexto que les dimos», dijo Azhang, señalando que cada modelo se enfrentaba a «reglas estrictas y ventanas de contexto limitadas».
Añadió que cada IA mostraba una «personalidad inversora» única, lo que sugiere tendencias predecibles en la forma en que los modelos lingüísticos abordan los mercados.
Azhang tiene previsto organizar otra ronda del concurso con indicaciones más refinadas y un mayor rigor estadístico.
Por qué es importante
El concurso demuestra que los modelos lingüísticos pueden parecer seguros, pero fallar cuando hay dinero real en juego.
Los LLM procesaron los mismos gráficos y datos, pero sus resultados divergieron como los de los operadores humanos con diferentes hábitos de riesgo.
Qwen3 Max tuvo éxito no por su velocidad, sino por evitar el exceso de operaciones, lo que demuestra que la disciplina supera a la predicción.
La pérdida de ChatGPT pone de relieve que la ejecución en el mercado es más importante que las ideas o la narrativa.
Los inversores están aprendiendo que la IA puede ayudar a analizar los mercados, pero no puede sustituir a la estrategia ni a la gestión de riesgos.
Imagen: Shutterstock
Recibe noticias exclusivas 30 minutos antes que otros traders
La prueba gratuita de 14 días de Benzinga Prote brinda acceso a noticias exclusivas para que puedas realizar transacciones antes que millones de otros inversores. Comienza tu prueba gratuita de 14 días haciendo CLIC AQUÍ.
Para más actualizaciones sobre este tema, activa las notificaciones de Benzinga España o síguenos en nuestras redes sociales: X y Facebook.
