Guía completa para detectar el plagio de AI Chatbot

Los chatbots de IA como ChatGPT no se limitan solo a responder sus preguntas. Pueden escribir correos electrónicos, cartas de presentación, ensayos, poesía, publicaciones de blog y mucho más.

La escritura con IA es como un camaleón: puede combinarse tan bien con cualquier otro tipo de escritura que sería difícil notar la diferencia.

Desafortunadamente, esto hace que sea increíblemente difícil para nosotros, los humanos, detectar cuándo una IA ha escrito algo en lugar de una persona. Claro, todos podríamos seguir el consejo de Sherlock Holmes y «eliminar lo imposible», pero ¿quién tiene tiempo para eso?

¿Qué pasa si te digo que el párrafo anterior está escrito por una IA? Sí, le pedí a YouWrite que escribiera una introducción rápida para esta publicación, que es lo que surgió. Bastante convincente, ¿verdad? Ese es el problema, es demasiado convincente que cualquiera pueda presentarlo como un trabajo propio para beneficiarse de él.

Las IA no solo reformulan el contenido; aprenden el tema y lo presentan en un lenguaje natural usando RLHF. Esto significa que el contenido generado no se sentirá robótico para leer ni se puede comparar con los datos disponibles en línea para detectar plagio.

Capturar contenido generado por IA no es fácil, y no voy a darle falsas esperanzas de que pueda capturarlo con un 100 % de precisión. Sin embargo, con un poco de trabajo de detective y algo de ayuda de las herramientas de detección de escritura de IA, puede detectar la mayoría de los trabajos de IA.

A continuación, encontrará formas manuales de detectar plagio de IA y también algunas herramientas automáticas.

Tabla de contenido

Detecta manualmente el plagio de IA 🕵️

ChatGPT ni siquiera es un gran problema cuando se trata de plagio de IA. Existen muchas herramientas alternativas que se basan en la misma tecnología GPT-3 y están diseñadas para escribir. Estos son muy avanzados y están hechos específicamente para crear contenido similar al humano que es difícil de captar.

Las herramientas de detección automática son un poco impredecibles según el tipo de contenido, la longitud y la complejidad. Entonces, al menos actualmente, conectar manualmente los puntos para determinar si el artículo es generado por IA o no es la mejor manera.

A continuación, he enumerado algunas pistas comunes que podría buscar para capturar contenido generado por IA.

#1. Información obsoleta

ChatGPT y otra IA basada en GPT-3 vieron reducido su conocimiento a fines de 2021. Aunque algunos bots de IA tienen un motor de búsqueda incorporado para buscar la información más reciente, todavía dependen de datos antiguos para escribir contenido de formato largo como ensayos o publicaciones de blog.

Si nota que el artículo habla constantemente de datos desactualizados, específicamente antes de 2021, entonces podría ser generado por IA.

En la siguiente captura de pantalla, le pedí a YouWrite que me contara sobre la reciente Copa Mundial de la FIFA, y esto es lo que surgió.

Habla del Mundial 2018 en lugar del reciente 2022. Aunque la herramienta se actualiza para hablar sobre eventos recientes como la Copa Mundial 2022, para escribir publicaciones largas, todavía usa los datos obsoletos en los que se basa.

#2. Usa la misma estructura de oraciones para las descripciones

Mientras escribe descripciones de múltiples productos/aplicaciones, AI generalmente usa la misma estructura de oración que edita para adaptarse a la descripción de un producto. Las descripciones suelen comenzar con la misma palabra, como The, It, A o el nombre del producto. Las descripciones también tienen un enfoque dedicado que se repite.

Por ejemplo, a continuación, le pedí a ChatGPT que me informara sobre «sitios web de trabajos de entrada de datos». Puede ver que todas las descripciones comienzan con «A» y tienen un enfoque estricto.

También le hice la misma pregunta a YouChat, e hizo lo mismo y repitió el nombre de cada sitio web al principio, y las descripciones en sí parecen una versión reformulada de cada uno.

Si el artículo que está analizando tiene una descripción de naturaleza similar, es una excelente manera de captar la escritura de IA.

#3. Usa oraciones cortas

Para la mayoría de los artículos, AI usará oraciones de una sola línea con una sola coma como máximo. Tal vez intentan minimizar la posibilidad de error, pero evitan escribir oraciones largas que puedan requerir el uso de dos puntos, punto y coma o líneas horizontales gruesas.

Sé que esta no es la mejor pista para captar la escritura de IA, pero vale la pena considerarla para demostrar aún más tus sospechas.

#4. Puede proporcionar información incorrecta

Para preguntas complejas que generalmente implican algún tipo de instrucción, la IA puede no comprender la intención y proporcionar información incorrecta. No estoy hablando de información desactualizada aquí, solo te dicen con confianza la información incorrecta cuando no entienden el tema.

Por ejemplo, le pedí a YouWrite que me dijera «cómo rootear un teléfono Android sin una PC». Todavía me mostró métodos que implican el uso de una PC en algún momento de la instrucción.

#5. No agrega una opinión personal

Cuando se habla de algo, la IA solo habla de hechos conocidos. A diferencia de los humanos, no hablará de su experiencia personal con él. Aunque se puede instruir a las IA para que creen una redacción práctica, tienden a evitar hacerlo de manera predeterminada.

Si nota que el artículo solo habla de hechos bien conocidos, es muy probable que esté escrito por una IA. Por ejemplo, al hablar de una aplicación, hablará de sus funciones en lugar de la fluidez de la navegación o de cómo usar la aplicación.

#6. Breves explicaciones

Como las IA están limitadas por el conocimiento actualmente disponible, tienden a escribir breves explicaciones y descripciones. En mi experiencia, si hablan sobre un tema en particular, como el enraizamiento de Android, mantienen la explicación dentro de 2-3 párrafos como máximo. Y para cosas como aplicaciones o productos, la descripción generalmente no excede 1 párrafo.

Los humanos pueden escribir en profundidad sobre algo, incluidas las características, las limitaciones, la experiencia personal, los precios, etc. Por otro lado, la IA generalmente se enfoca en las características principales o los aspectos más destacados, por lo que la redacción también es corta. Si el instructor solicita más detalles, la posibilidad de información incorrecta aumenta significativamente.

#7. Revisa la historia del escritor.

Como maestro o webmaster, si tiene acceso al trabajo o tareas anteriores del escritor, podría ser una buena idea compararlo con el artículo del que sospecha. Es muy poco probable que el escritor tenga un estilo de escritura similar al de una IA. Aunque AI puede cambiar los tonos de escritura, los estilos que elige son bastante genéricos y no puede copiar su tono.

Tomando el ejemplo del párrafo generado por IA en la introducción de esta publicación. Cualquiera que haya leído mis publicaciones anteriores puede ver fácilmente que mi estilo de escritura es completamente diferente en comparación con él.

Simplemente puede leer 2 o 3 trabajos anteriores del escritor y ver si coincide con el estilo de escritura del artículo sospechoso.

Herramientas para detectar plagio de IA

Hay un montón de herramientas disponibles que pueden detectar contenido escrito por IA. Sin embargo, su precisión es diferente entre sí y puede fallar según el tipo de contenido y la extensión.

Probé estas herramientas usando diferentes tipos de contenido generado por ChatGPT, GPT-3 Playground, WriteSonic, Rytr y YouWrite. Consiguieron detectar todo tipo de contenido generado por ChatGPT y GPT-3 Playground.

Aunque tuvieron resultados mixtos para herramientas de escritura dedicadas, curiosamente, todos fallaron en detectar YouWrite, supongo que es porque YouWrite comete errores similares a los humanos con el fin de evitar la detección.

Le recomendaré que use estas herramientas junto con la verificación manual del contenido. Primero, analice el contenido con una de estas herramientas y luego verifique manualmente si hay pistas para confirmar aún más la sospecha.

A continuación, enumero los que ofrecieron los mejores resultados y son los más fáciles de usar:

Nota: Para la demostración, usaré texto generado por WriteSonic en «Beneficios de los mangos».

#1. Contenido a escala

Descubrí que el detector de contenido de IA de Content At Scale es el más preciso para la mayoría de las pruebas que realicé. Le permite escanear hasta 2500 caracteres por escaneo y hace una predicción porcentual que muestra la densidad del contenido real o falso.

Es seguro asumir que el contenido que es más del 60% falso está escrito por contenido de IA, al menos en su mayor parte. En la siguiente captura de pantalla, puede ver que el 96 % del contenido es falso, que generé completamente con IA.

#2. GPTZero

Si desea ver exactamente qué contenido genera la IA, entonces GPTZero es una buena opción. GPTZero no califica el contenido. En su lugar, destaca el contenido exacto que probablemente genera la IA.

Aunque muestra puntajes de perplejidad y ráfagas para tener una idea de la aleatoriedad en el texto, lo que es más importante, admite 5000 caracteres por escaneo y también puede cargar archivos. Escanear contenido grande ayuda mucho a mejorar la precisión.

#3. Detector de salida GPT-2

Los creadores de ChatGPT también ofrecen un bot para detectar su propio trabajo. Como GPT-2 y GPT-3 solo son diferentes en los datos totales utilizados para el entrenamiento, este detector GPT-2 también funciona bien para las IA basadas en GPT-3.

No hay límite en la cantidad de contenido que puede escanear, por lo que es perfecto para detectar contenido muy largo generado por IA. También encontré que su precisión es buena, especialmente para el contenido generado por ChatGPT. Sin embargo, se pierde un poco en las predicciones, así que solo considere sus resultados cuando muestre más del 50% del contenido como falso.

#4. Detector de contenido de IA de Writer

Los resultados de Writer AI Content Detector son cuestionables cuando detecta contenido de herramientas de escritura de IA, pero funciona muy bien para el contenido generado por ChatGPT. Puede escanear 1500 caracteres por escaneo e incluso agregar la URL del contenido si ya está publicado.

Para mi prueba de texto generado por IA, dijo que el 94% del contenido es generado por humanos, lo cual está bastante mal en comparación con otras herramientas. No obstante, aún vale la pena usarlo para detectar contenido de ChatGPT, especialmente si ya está publicado.

#5. Borrador y gol

Una herramienta de detección de escritura AI simple pero poderosa. En mi experiencia, Draft & Goal ofreció resultados similares a Content At Scale, pero no tiene un límite de conteo de palabras para que pueda escanear redacciones largas. Sin embargo, su tiempo de escaneo aumenta según la cantidad de contenido que escanea.

Para mi texto de ejemplo, dice que el 94% del texto es generado por IA.

Mis pensamientos 💭

Personalmente, creo que la ayuda de AI es en realidad una excelente manera de eliminar el bloqueo del escritor, obtener toda la información en un solo lugar y encontrar inspiración. Sin embargo, nunca debería reemplazar la escritura humana ya que la IA se limita al conocimiento ya conocido.

También puede explorar algunas de las mejores herramientas de verificación de plagio para evitar la copia.