Che cosa vuol dire “essere famosi"”?
Si può creare un insieme scientifico di persone “famose”, “importanti”?
Si può. L'ha fatto un team di ricercatori che nel 2022 ha pubblicato A cross-verified database of notable people, 3500BC-2018AD, il database più completo e affidabile delle persone “notevoli” della storia umana.
Come?
Frugando tra Wikipedia (in varie lingue) e Wikidata, e poi ripulendo tutto con deduplicazioni e controlli incrociati. Il risultato è una sorta di élite storica composta da 2,29 milioni di individui: uno ogni 43.000 esseri umani mai vissuti.
Il metodo funziona bene in alto, dove l’informazione è abbondante. Ma in basso, fra i “quasi famosi”, iniziano i problemi: dati scarsi, errori di classificazione, ambiguità.
Una curiosità: in certi casi Wikipedia fornisce il 15% di informazioni in più rispetto a Wikidata, dimostrando che il crowdsourcing non è ancora morto. E sì, c’è un pregiudizio anglosassone ben documentato nell’edizione inglese dell’enciclopedia. Ma a volte pesa, a volte non tanto.
Dietro tutto questo, però, non c’è solo l’ossessione per le liste: il vero motore è una serie di domande di scienze sociali su genere, sviluppo economico, urbanizzazione e cultura.
In definitiva, un lavoro certosino per capire chi ricordiamo e perché.
→️ https://www.nature.com/articles/s41597-022-01369-4