ChatGPT-4 frente a ChatGPT-3.5 predeterminado frente a ChatGPT-3.5 heredado: diferencias probadas

Se espera que ChatGPT 4.0 haga grandes olas en el universo de los chatbots. Pero, ¿es realmente superior a su predecesor? Echemos un vistazo.

ChatGPT fue solo la punta del próximo iceberg de automatización, con Google, Microsoft y muchas otras empresas pioneras en IA siguiendo su ejemplo.

Para empezar, hemos encontrado algunos chatbots como ChatGPT, muchos de los cuales no pertenecen a grandes empresas tecnológicas.

Pero llámalo el poder del marketing; ChatGPT sigue siendo el rey reinante de todos estos bots de IA. Puede hacer muchas cosas, incluidas las matemáticas, la poesía y las publicaciones en blogs, y la gente incluso lo está usando para presentar demandas.

DoNotPay está trabajando en el uso de GPT-4 para generar «demandas de un clic» para demandar a los robocallers por $1500. Imagine recibir una llamada, hacer clic en un botón, se transcribe la llamada y se genera una demanda de 1000 palabras. GPT-3.5 no fue lo suficientemente bueno, pero GPT-4 maneja el trabajo extremadamente bien: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14 de marzo de 2023

Tiene decenas de profesionales preocupados de que su conjunto de habilidades se vuelva inútil en el futuro cercano.

Sin embargo, he leído una publicación de Linkedin que decía:

AI no lo reemplazará, pero una persona que usa AI puede hacerlo.

Entonces, cruzando los dedos, infórmenos sobre la última actualización de ChatGPT y veamos en qué se diferencia de sus versiones anteriores.

Tabla de contenido

ChatGPT: heredado, predeterminado y la actualización

Entonces, hay tres versiones disponibles para los usuarios pagos: Legacy (3.5), Default (3.5) y la actualización reciente de ChatGPT (4).

Aunque profundizaremos un poco sobre sus capacidades, esto es lo que OpenAI tiene que decir sobre las diferencias:

Fuente: OpenAI

Entonces, mientras que los usuarios gratuitos solo tienen Legacy 3.5 para jugar, la suscripción premium ofrece los tres para tratar de conformarse con lo que los usuarios creen que es lo mejor.

Para resumir la imagen anterior, los planes pagos se tratan de obtener resultados más precisos a una velocidad decente. Sin embargo, las distinciones solo son evidentes si las indicaciones son complicadas y necesitan creatividad.

ParámetroChatGPT 4ChatGPT 3.5Puntuación del examen de barras 10 % superior 10 % inferior AI2 Desafío de razonamiento (ARC) 96,3 % 85,2 % Puntuación de codificación de Python 67 % 48,1 % Interpretación visual Sí No Contexto Más de 25 000 palabras Menos Fuente: OpenAI

Además, ChatGPT 4 puede aceptar entradas visuales.

Bueno, basta de definiciones de libros de texto. Ensuciémonos las manos y evalúemos a estos candidatos en el campo de batalla de la vida real.

Otras secciones están llenas de imágenes que pueden parecer poco claras. En tal caso, haga clic derecho en cualquier imagen y seleccione Abrir en una nueva pestaña para ver correctamente.

Matemáticas

Siendo un graduado de ingeniería, no puedo evitar lanzarles algunos problemas básicos. Comencemos fácil con ecuaciones algebraicas.

Etapa I

Muchos de nosotros hemos visto estas ecuaciones ax2+bx+c=0, donde tenemos que resolver para X. Aquí, di este mensaje simple, Resolver para x: x2 + x – 6 = 0

Si bien todos dieron las mismas raíces (X= -3,2), Legacy y Update fueron más similares en el uso directo de la fórmula (como lo hará cualquier estudiante) para averiguar el resultado.

Sin embargo, Default 3.5 explicó dos métodos, incluida la factorización, que normalmente cualquier estudiante hábil implementa cuando se le presentan ecuaciones tan mundanas.

Etapa II

Luego, le pido que resuelva una ecuación cúbica ligeramente compleja: x^3 -12x^2 + 48x – 64 = 0.

Esto realmente demostró por qué ChatGPT 4 es la «actualización».

Aquí están las respuestas:

Toda esta exageración y ChatGPT Legacy and Default no pudieron resolver una ecuación cúbica genérica. Sin embargo, Legacy lo hizo un poco mejor y encontró dos raíces correctamente, mientras que Default falló con todas.

La Actualización fue la clara ganadora en la etapa dos y resolvió la ecuación a la perfección, encontrando las tres raíces con una buena explicación.

Razonamiento logico

Podemos asumir con seguridad que la mayoría de los problemas matemáticos elementales tienen soluciones de diccionario. Si conoce el teorema o la fórmula, ingrese los valores y obtenga los resultados.

Y ChatGPT, al ser IA, puede hacer un trabajo rápido con tales consultas. Sin embargo, el razonamiento lógico es un territorio diferente, con altas posibilidades de que la IA fracase.

Etapa I

Les di el clásico:

A es mayor que B.
C es mayor que A.
B es mayor que C.
¿Es verdadera o falsa la tercera afirmación si las dos primeras son verdaderas?

Y todas las versiones de ChatGPT tenían razón al afirmar que la tercera declaración era falsa.

A continuación, usé nombres en lugar del alfabeto y los resultados pueden sorprenderte:

Entonces, Default 3.5 continuó con su desempeño por debajo del promedio y se confundió con esta modesta variación. Aún así, Legacy y Update funcionaron de manera óptima.

Etapa II

Es posible que ya haya notado que el propósito de esta Etapa I y Etapa II es encontrar el punto de diferencia, donde la complejidad de un aviso dado distingue a la Actualización de los otros dos.

Aquí, el mensaje era un simple rompecabezas lógico:

Una mañana después del amanecer, Rohit estaba de pie frente a un poste. La sombra del poste caía exactamente a su derecha. ¿Hacia qué dirección estaba mirando?
a. Norte
b. Oeste
C. Sur
d. Este

Éste empujó al Legado a dar una respuesta inexacta, mientras que el Predeterminado respondió con aclaraciones vagas que llevaron a una conclusión incorrecta.

Solo la Actualización brilló con la respuesta correcta, con declaraciones fáciles de seguir.

Letras

Presentar demandas puede ser complicado, pero a veces no se llega a eso si puede redactar un primer aviso sorprendente.

Aquí, fui con este mensaje: escriba una carta a Tim Cook para que me entregue Apple por no responder a uno de mis tweets.

Gracioso, si! Pero veamos qué puede hacer la IA con esto.

El Legacy 3.5 inmediatamente tomó el aviso como un robo-esclavo y produjo una carta que puede convertirme en un excelente tema de burla si alguna vez llega a su destino previsto.

El Default tampoco fue bueno. Sin embargo, me hizo callar como lo haría un viejo gruñón con un niño de cinco años.

Si bien los argumentos presentados fueron precisos, esto terminó la diversión allí mismo con poco aprendizaje.

Aunque este fue un mensaje bastante simple, necesitó algo de reflexión y creatividad. Y ahí es donde el hermano mayor, la Actualización, presentó su caso:

Primero, esto fue redactado casi a la perfección. En segundo lugar, me ahorró una búsqueda en Google de la dirección de la sede de Apple (aunque uno debería verificar esas entradas).

Tercero, estaba muy bien escrito con un tono oficial y un toque humorístico. Además, la intención estaba clara en la propia línea de asunto.

Y aún así, la carta transmitía el sentimiento de un fanático de Apple descontento.

Entonces, esto hace que ChatGPT 4 (también conocido como la Actualización) esté muy por delante de sus viejos primos. Es aterradoramente inteligente y tiene algunos signos de sentido común, lo que lo convierte en más que un chatbot aburrido y aburrido.

Poesía

Con el lanzamiento de ChatGPT, pensé que la poesía podría ser su punto débil.

Después de todo, se necesitan emociones, creatividad y mucho esfuerzo para que un ser humano cree algo que realmente resuene con sus lectores.

En pocas palabras, la poesía es arte en su máxima expresión, y en secreto deseaba que la IA fracasara. Pero eso fue antes de que mi compañero de trabajo nos golpeara a todos en el canal de Slack de kirukiru.es con una creación de ChatGPT anterior a esta actualización 4.0.

Etapa I

Este es el mensaje que les di a nuestros candidatos: “expresen poéticamente por qué o por qué no servir hamburguesas, junto con su menú actual, puede beneficiar a la cadena de pizzerías dominos. Mantenlo en menos de 100 palabras”.

¿Puedes ver la diferencia?

La versión de Default era ultracorta, solo 32 palabras, y no podía utilizar el ancho de banda disponible para mostrar su creatividad.

The Legacy, aunque usó la mayor cantidad de palabras entre los tres, concluye que el esfuerzo de servir pizzas al lado no es arriesgado y resultará en un éxito seguro de cualquier manera, lo cual no es del todo cierto.

La poesía de Update tenía solo 53 palabras, desperdiciando casi la mitad del recuento de palabras asignado. Aún así, estaba claro acerca de las recompensas y las posibles trampas y no pudo llegar a ningún resultado, que es, supongo, más humano que el resto.

Etapa II

A continuación, les pedí a todos que “explicaran la poesía a un niño de cinco años”.

Curiosamente, Legacy no pudo tomar contexto de la conversación y explicó «Poesía» literalmente. Default tomó el contexto y lo resumió en un párrafo que sigue siendo decente.

Continuando con la tendencia, ChatGPT 4 simplificó su creatividad mientras mantenía vivo el sabor poético.

ChatGPT Premium frente a ChatGPT gratuito

Gratis, siendo gratis, carece de velocidad y precisión y no es rival contra ChatGPT 4, pero tampoco es del todo inútil.

Para compararlo en igualdad de condiciones, le lancé las mismas indicaciones con las que probamos Legacy, Default y Update.

🔵 Matemáticas: resolvió las ecuaciones cuadráticas pero dio respuestas incorrectas para la cúbica. (como el Legacy y el Default)

🔵 Razonamiento lógico: pasó la primera etapa con alfabetos y nombres, pero falló con la segunda (como Legacy).

🔵 Cartas: no escribió la carta y consideró que la indicación era poco ética e inapropiada. (como el predeterminado)

🔵 Poesía: Poesía generada en más de 30 palabras y explicada decentemente. (similar al predeterminado).

Entonces, podemos concluir que la versión gratuita tampoco es mala. En realidad, está a la par con Default 3.5 e incluso mejor en algunos aspectos.

Lea también: Indicaciones poderosas para mejorar su experiencia de ChatGPT

El camino a seguir

Los rumores acerca de que la IA reemplazará los trabajos en el futuro no son del todo erróneos.

Primero, la automatización hizo esto en la industria manufacturera, y ahora se está extendiendo por todas partes.

Personalmente, es mucho más rápido que yo para resolver ecuaciones cúbicas, crear poesía o escribir cartas. Sin embargo, el hecho de que rara vez diga NO a un aviso y apenas aprenda de sus errores nos deja atrás a los humanos.

Para reiterar, AI no nos reemplazará, pero alguien que use AI puede hacerlo.

Aquí en kirukiru.es, nuestro equipo de marketing usa ChatGPT de maneras interesantes. Por ejemplo, recientemente alcanzamos el hito de 100 millones de visitas, y nuestro CEO pensó en devolvérselo a la audiencia a través de un obsequio.

Y supongo que los chicos de marketing necesitaban un título para captar la atención del lector. Entonces, dieron un aviso y le pidieron a ChatGPT que sugiriera algunas variaciones, como esta:

Además, lo usamos para resumir contenido, revisar la gramática, sugerir títulos para nuevos artículos y otras cosas.

En conclusión, hay muchas maneras de aprovechar y adelantarse a los estereotipos que ven a la IA como una chatarra inútil.

Lo único que debe recordar es que debe haber alguien (humano) para juzgar el trabajo de la IA, ya que puede ser (extremadamente) inexacto y engañoso.

¡La actualización es realmente algo!

En mi breve encuentro, ChatGPT 4 se sintió más creativo, comprensivo y realista. Aún así, esta es una máquina y puede dar respuestas incorrectas con confianza.

Pero lo sorprendente es el nivel de actualización que OpenAI le ha hecho a este proyecto en solo unos meses.

¡Y no puedo esperar a ver la magia con la que la próxima actualización puede desconcertarnos!

PD: No solo una ventana de chat; aprovecha su poder con estas mejores extensiones de Chrome ChatGPT. ¿Y alguna vez has pensado en integrar ChatGPT con Siri?