Usare il PageRank come misura della rilevanza scientifica

Scritto da Marco il 29 gennaio 2009

Categorie: web

È un concetto molto interessante, che usai circa un anno fa allo scopo di spiegare ad alcuni scienziati l’importanza di usare un portale web accessibile e dinamico per pubblicare una rivista scientifica.

Le slide di quella presentazione non le ho mai messe online, ma alcune di esse sono state incorporate in una che feci qualche mese dopo, che si possono trovare sul mio slideshare.

Una cosa che secondo me Stevenson su Ars Technica [1] non spiega con chiarezza, è la relazione abbastanza stretta che esiste tra il Page Rank di Google e l’Impact Factor. Entrambi infatti poggiano sullo stesso concetto di base: costruire un modello di Citation Network in cui si attribuisce ad ogni articolo / pagina web un punteggio in base al numero di citazioni che questo riceve, pesando il valore di ciascuna citazione in base al punteggio della fonte.

Fin quì i concetti di base, poi per approfondire le differenze, si può vedere il lavoro di Maslov et al.[2] che introduce il concetto di CiteRank, ovvero un algoritmo sempre basato sulle citazioni, ma in cui la distribuzione dei pesi cambia in funzione della minore anzianità della fonte, che nella ricerca scientifica ha ovviamente un peso diverso.

Una differenza piuttosto drastica è invece determinata dal sistema con cui il citation network è costruito. Se google deve mandare in giro i propri crawler e costruirsi dei modelli sofisticatissimi di archiviazione [3], il sistema delle citazioni scientifiche può contare su uno strumento creato appositamente per tracciare le citazioni, usando un singolo strumento: il Digital Object Identifier, abbreviato con DOI. In effetti si tratta semplicemente di un sistema di routing delle citazioni, e come detto sopra i principi di base restano assolutamente integri.

Su queste similitudini si basa infatti il successo impressionante delle riviste scientifiche online, avvenuto negli ultimi anni.

Usando il modello dell’Open Access, riviste come PLoS e BioMedCentral hanno infatti visto il proprio Impact Factor schizzare alle stelle, grazie all’elevata rintracciabilità dei lavori pubblicati, che si traduce irreversibilmente in una maggiore probabilità di essere citati, e concretamente in un effettivo alto numero di citazioni.

L’apertura dei contenuti delle riviste scientifiche avvenuta con questo sistema è oggettivamente un passo avanti enorme nel mondo scientifico, fino a poco tempo fa monopolizzato dal sistema delle subscription, spesso costosissime, che si associavano ad altrettanto costose tariffe di pubblicazione.

La Rete ha avuto impatto (e che impatto!) anche in tutto ciò: l’accesso libero ai contenuti e la loro più semplice rintracciabilità sta consentendo uno sviluppo notevole della ricerca anche nei paesi in via di sviluppo, ma quì finirei per diventare autoreferenziale, quindi rimando solo ad un link di esempio ad una rivista open access dedicata alla ricerca sulle malattie infettive.

A questo punto si potrebbe fare anche un passo avanti.

Riprendendo il concetto di Debbie Weil di Return on Blogs [4], si potrebbe dunque concludere che in realtà in un futuro non troppo lontano il successo della ricerca scientifica potrebbe anch’esso passare per i blog? Mi sembra presto per dirlo, ma nel frattempo quelli di CrossRef — per non saper ne leggere ne scrivere — hanno creato un plugin per WordPress.

References:

  1. Stevenson (2009) Using PageRank to assess scientific importance. Ars Technica
  2. Maslov et al. (2008) Promise and Pitfalls of Extending Google’s PageRank Algorithm to Citation Networks.  J.Neurosci. vol. 28 issue 44 pp. 111031105. DOI: 10.1523/JNEUROSCI.0002-08.2008
  3. Brin et al.  (1998) The Anatomy of a Large-Scale Hypertextual Web Search Engine. Computer Networks and ISDN Systems. vol.30 pp. 107-117. Section 2.1. DOI:10.1.1.42.3243
  4. Weil (2006) The Corporate Blogging Book. Piatkus Books. ISBN: 978-0749927431

0 Commenti a questo post Fai sapere che ne pensi!

1 Trackback per questo post

  1. Notizie dai blog su quali plugin usare per il blog Says:

    […] Usare il PageRank come misura della rilevanza scientifica È un concetto molto interessante, che usai circa un anno fa allo scopo di spiegare ad alcuni scienziati l’importanza di usare un portale web accessibile e dinamico per pubblicare una rivista scientifica. blog: marco.log | leggi l'articolo […]

Scrivi un commento. Fai sapere che ne pensi!