Elon, deja de intentar hacer que Grok suceda.

Hay una dura verdad sobre Grok, el chatbot de «búsqueda de la verdad» de Elon Musk: no es muy bueno y no mucha gente lo usa. Esta es la nueva comida para llevar Reuters un informeque encontró que Grok apenas aparece en los registros federales sobre cómo el gobierno de EE. UU. utilizó la inteligencia artificial el año pasado. Esa no es la única señal de que el chatbot de xAI está en problemas, incluso cuando Musk lo sitúa en el centro de lo que podría ser la IPO más grande de la historia.

Reuters Revisó más de 400 ejemplos de uso gubernamental de IA en los que se nombraron proveedores específicos. Descubrió que Grok o xAI aparecían en sólo tres, cada uno para usos básicos como redacción de documentos o gestión de redes sociales, y siempre junto a competidores como Microsoft y OpenAI. En comparación, los modelos de OpenAI aparecieron en más de 230 ejemplos, mientras que Google y Anthropic aparecieron cada uno docenas de veces.

Un patrón similar surgió en otra base de datos de proyectos gubernamentales de IA más ambiciosos con un número menor de usuarios. Grock ha aparecido sólo tres veces: dos para tareas administrativas de rutina en la Comisión de Asistencia Electoral y una vez como piloto del DOE en el Laboratorio Nacional Lawrence Livermore para resúmenes de documentos e investigaciones generales. Reuters Encontré 140 entradas que incluían Microsoft y OpenAI, mientras que mi breve revisión encontró al menos 10 entradas para Anthropic y una docena para Gemini de Google.

Las listas son una medida incompleta y desigual de la acreditación gubernamental. Se enumeran muchos ejemplos sin un proveedor específico y está claro que no existe una definición universal de lo que se considera inteligencia artificial. Los datos tampoco incluyen las agencias de inteligencia ni el Pentágono, donde xAI recibió un contrato de 200 millones de dólares el año pasado y recientemente se le permitió operar en redes clasificadas después de que Anthropic fuera incluido en la lista negra.

Sin embargo, las cosas no pintan bien para Grok. Aparece con mucha menos frecuencia que sus competidores, y cuando lo hace, es principalmente para trabajos administrativos básicos, algo inadecuado para el modelo de frontera global del que Musk ha pasado años alardeando.

«No es el mejor modelo que existe».

Las personas con las que hablaron Reuters La explicación, sugirió, es simple: Grok no es tan bueno como sus competidores. «No es el mejor modelo que existe», dijo una fuente anónima del Pentágono, añadiendo que los empleados tienden a preferir Gemini o Claude. Las tablas de clasificación públicas clasifican los modelos de IA Dale peso a esta opinión. Anthropic, Google y OpenAI dominan los primeros puestos, mientras que Grok rara vez se sitúa entre los 10 primeros fuera de la categoría ocasional de fotos o vídeos.

Esto es vergonzoso para Musk, y más aún para SpaceX, que se enfrentó a la IA a principios de este año. IPO para el proyecto de misiles Depósito Esto demuestra que la compañía ha puesto a la IA, y específicamente a Grok, en el centro de su discurso para inversionistas. SpaceX afirma haber identificado “el mercado agregado viable más grande de la historia de la humanidad”: una asombrosa oportunidad de 28,5 billones de dólares, aunque, desafortunadamente, no ofrece un cronograma para llegar allí. En la práctica, toda esta propuesta de valor proviene de la IA, especialmente la IA empresarial, no de cohetes ni satélites.

Reuters Señala que el desempeño de su cachorro en las agencias gubernamentales también puede indicar qué tan exitoso será en otros lugares de trabajo. Como parte de una campaña xAI para clientes empresariales, Musk hizo precisamente eso Se dice que los bancos están fuertemente armados Grok realiza compras si quiere participar en la IPO de SpaceX, pero si no obtienen el valor de su dinero, estos acuerdos pueden ser una solución a corto plazo.

Como si su pésimo desempeño no fuera lo suficientemente vergonzoso, Musk admitió recientemente que xAI usó modelos OpenAI para ayudar a entrenar y mejorar a Grok. Este proceso, conocido como destilación, es estándar cuando las empresas utilizan sus propios modelos, pero es más controvertido cuando se trata de utilizar un sistema competidor. Grok ni siquiera puede vencer a los modelos con los que entrena.

En su versión orientada al consumidor y al público, Grok es deliberadamente desagradable. Musk ha descrito el chatbot como una alternativa menos sesgada y menos censurada a herramientas como ChatGPT, pero eso se traduce en un producto con estándares probatorios laxos, una obsesión enfermiza con Musk y un largo historial de resultados ofensivos, conspirativos y sexistas. Incluso si las barreras de seguridad en el lugar de trabajo son diferentes, es posible que no sean del tipo que la empresa agradece. El ilustre historial de Grok incluye elogiar a Adolf Hitler, cuestionar el número de muertos en el Holocausto, compilar millones de deepfakes sexuales no consensuales y no olvidemos la vez que se hizo llamar «Mikahtler». Si su cachorro es un empleado humano, siento que RR.HH. no tardará en involucrarse.

SpaceX parece entender el problema. En su presentación, la compañía advirtió que los métodos «candentes» o «problemáticos» de Grok entrañaban «mayores riesgos», incluidos daños a la reputación, escrutinio regulatorio y demandas. En lenguaje corporativo: este chatbot dará lugar a una demanda contra nosotros.

En lenguaje corporativo: este chatbot dará lugar a una demanda contra nosotros.

Grok toma su nombre de Robert A. Heinlein Un extraño en una tierra extrañadonde aproximadamente significa una comprensión profunda y profunda de algo. Lo que hay que entender aquí no es particularmente complicado: Musk ha gastado miles de millones en la construcción de un chatbot que no es muy bueno, no es muy popular y de alguna manera es clave para justificar la valoración astronómica de SpaceX. Buena suerte con eso.

Seguir temas y autores De esta historia para ver más como esto en el feed personalizado de su página de inicio y recibir actualizaciones por correo electrónico.


(etiquetas para traducción) AI