Saltar al contenido

El aprendizaje automático ha revelado exactamente cuánto de una obra de Shakespeare fue escrita por otra persona – MIT Technology Review

Matricularse en El algoritmo – inteligencia artificial, desmitificada

¿También mantenerse actualizado sobre las iniciativas y eventos de MIT Technology Review?

Durante gran parte de su vida, William Shakespeare fue el dramaturgo de una compañía de actores llamada King’s Men que representaba sus obras en las orillas del río Támesis en Londres. Cuando Shakespeare murió en 1616, la compañía necesitaba un reemplazo y recurrió a uno de los dramaturgos más prolíficos y famosos de la época, un hombre llamado John Fletcher.

La fama de Fletcher se ha sofocado desde entonces. Pero en 1850, un analista literario llamado James Spedding notó una notable similitud entre las obras de Fletcher y los pasajes de Shakespeare. Enrique VIII. Spedding concluyó que Fletcher y Shakespeare deben haber colaborado en la obra.

La evidencia proviene de estudios de las idiosincrasias lingüísticas de cada autor y cómo surgen en Enrique VIII. Por ejemplo, Fletcher escribe a menudo S.M en vez de usted, y ellos en vez de ellos. También tendía a agregar la palabra señor o todavía o Siguiente a una línea de pentámetro estándar para crear una sexta sílaba adicional.

Estas características permitieron a Spedding y otros analistas sugerir que Fletcher debió estar involucrado. Pero exactamente cómo se dividió el juego es muy discutido. Y otros críticos han sugerido que otro dramaturgo inglés, Philip Massinger, fue en realidad coautor de Shakespeare.

Es por eso que a los analistas e historiadores les encantaría determinar, de una vez por todas, quién escribió qué partes de Enrique VIII.

Ingrese Petr Plecháč de la Academia Checa de Ciencias en Praga, quien dice que ha resuelto el problema utilizando el aprendizaje automático para identificar la autoría de más o menos cada línea de la obra. “Nuestros resultados respaldan en gran medida la división canónica de la obra entre William Shakespeare y John Fletcher propuesta por James Spedding”, dice Plecháč.

El nuevo enfoque es sencillo en principio. Los algoritmos de aprendizaje automático se han utilizado durante algunos años para identificar patrones distintivos en la forma en que los autores escriben.

La técnica utiliza un cuerpo del trabajo del autor para entrenar el algoritmo y un cuerpo de trabajo diferente y más pequeño para probarlo. Sin embargo, debido a que el estilo literario de un autor puede cambiar a lo largo de su vida, es importante asegurarse de que todas las obras tengan el mismo estilo.

Una vez que el algoritmo ha aprendido el estilo en términos de las palabras y patrones rítmicos más utilizados, es capaz de reconocerlo en textos que nunca ha visto.

Plecháč sigue exactamente esta técnica. Primero entrena el algoritmo para reconocer el estilo de Shakespeare usando otras obras escritas al mismo tiempo que Enrique VIII. Estas obras son La tragedia de Coriolano, La tragedia de Cymbeline, El cuento de invierno, y La tempestad.

Luego entrena el algoritmo para reconocer el trabajo de John Fletcher usando obras que escribió en ese momento:Valentiniano, Monsieur Thomas, El premio de la mujer, y Bonduca.

Finalmente, suelta el algoritmo Enrique VIII y le pide que determine el autor del texto, utilizando una técnica de ventana rodante para desplazarse por la obra.

Los resultados son interesantes. Tienden a estar de acuerdo con el análisis de Spedding de que Fletcher escribió escenas que representan casi la mitad de la obra. Sin embargo, el algoritmo permite un enfoque más detallado que revela cómo la autoría a veces cambia no solo para nuevas escenas, sino también hacia el final de las anteriores. Por ejemplo, en el Acto 3, Escena 2, el modelo sugiere una autoría mixta después de la línea 2081 y encuentra que Shakespeare se hace cargo por completo en la línea 2200, antes del inicio del Acto 4, Escena 1.

Plecháč también entrenó a su modelo para reconocer el trabajo de Philip Massinger, pero encuentra poca evidencia de su participación. “La participación de Philip Massinger es bastante improbable”, concluye.

Es un trabajo interesante que muestra cómo los lingüistas y analistas literarios utilizan el aprendizaje automático para comprender mejor nuestro pasado literario.

Sin embargo, queda mucho trabajo por delante. Por ejemplo, cuando los algoritmos de visión artificial se entrenaron para reconocer el estilo artístico, los informáticos rápidamente descubrieron cómo extraer un estilo y aplicarlo a otras imágenes, utilizando una técnica conocida como transferencia de estilo neuronal. De la noche a la mañana, fue posible darle a una fotografía corriente el estilo de un Van Gogh o un Monet.

Eso plantea la cuestión de si una técnica similar es posible para el texto. ¿Podría ser posible transformar un ensayo, o incluso un artículo para MIT Technology Review, al estilo de Shakespeare o John Fletcher, por ejemplo?

Lamentablemente, todavía no, salvo en la forma trivial de reemplazar la palabra como ellos con ellos y así. Esto se debe en gran parte a que los lingüistas o sus cargas algorítmicas no comprenden suficientemente la estructura subyacente de la comunicación.

Ref: arxiv.org/abs/1911.05652: Contribuciones relativas de Shakespeare y Fletcher en Enrique VIII: un análisis basado en las palabras más frecuentes y los patrones rítmicos más frecuentes

Este contenido se publicó originalmente aquí.