L’articolo ha come obiettivo la verifica di quanto possa mutare il corpus di Google Libri, utilizzato come fonte per retrodatazioni lessicali. Su un campione di 1000 retrodatazioni raccolte in Google nel 2011, la maggioranza dei riferimenti, ancora disponibile nel 2015, non è più rintracciabile nel 2017. In compenso, si sono aggiunti testi nuovi, che talvolta raffinano i risultati ottenuti. Nel 2015 gli aggiornamenti hanno riguardato circa il 40% del campione di riferimento, ma solo per il 10% si è trattato di aggiornamenti importanti, tali da modificare il secolo di prima attestazione delle parole. A distanza di poco più di un anno, gli aggiornamenti sono stati minimi ed è emersa forte la criticità della sparizione di fonti.
Fonti di Google per la lessicografia: prova di monitoraggio
Maconi Ludovica
2017-01-01
Abstract
L’articolo ha come obiettivo la verifica di quanto possa mutare il corpus di Google Libri, utilizzato come fonte per retrodatazioni lessicali. Su un campione di 1000 retrodatazioni raccolte in Google nel 2011, la maggioranza dei riferimenti, ancora disponibile nel 2015, non è più rintracciabile nel 2017. In compenso, si sono aggiunti testi nuovi, che talvolta raffinano i risultati ottenuti. Nel 2015 gli aggiornamenti hanno riguardato circa il 40% del campione di riferimento, ma solo per il 10% si è trattato di aggiornamenti importanti, tali da modificare il secolo di prima attestazione delle parole. A distanza di poco più di un anno, gli aggiornamenti sono stati minimi ed è emersa forte la criticità della sparizione di fonti.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.