Bibliometria De Bellis - Biblioteca Scientifica Interdipartimentale
Transcript
Bibliometria De Bellis - Biblioteca Scientifica Interdipartimentale
Dipartimento di Scienze Chimiche e Geologiche, 23/06/2016 Bibliometria e valutazione della ricerca: certezze, controversie, opportunità Nicola De Bellis Ufficio Bibliometrico (CSBA) Università di Modena & Reggio Emilia [email protected] [email protected] INTRODUZIONE: DI COSA PARLIAMO 01 Certezze Controversie Opportunità 02 03 04 01 INTRODUZIONE: DI COSA PARLIAMO partiamo da un concetto di base QUALITATIVA valutazione documenti QUANTITATIVA Accuratezza/Correttezza/ 01 Struttura/Aggiornamento Le informazioni presentate sono corrette e accurate? L'organizzazione del testo è adeguata? Le fonti sono pertinenti e aggiornate? 01 per sapere se un'informazione riportata è scorretta o inaccurata bisogna conoscere quella corretta/accurata in alcuni casi la validità/correttezza è problematica persino per gli esperti, es.: metodologia statistica negli studi sperimentali di ambito socio-psicologico Persone Qual è lo status e la reputazione dei soggetti coinvolti (autore, curatore, editore)? 02 è un controllo relativamente facile ma anche rischioso: autori ormai affermati hanno un rapporto di fiducia con gli editori che gli permette di pubblicare anche libri o articoli poco originali sulla base della fiducia acquisita difficilmente un autore giovane ha un curriculum solido alle spalle, non per questo ciò che pubblica va scartato non è facile applicare questo criterio agli editori, infatti ... ... oggi è possibile pubblicare in riviste che chiedono soldi agli autori per rendere poi gratuitamente accessibile l'articolo: spesso sono predatori senza scrupoli che non applicano alcun filtro qualitativo (una lista di predatory journals si trova qui: http://scholarlyoa.com/publishers) Controllo/Consenso C'è stato un controllo da parte di qualcuno? Chi altro ci crede? Cosa ne pensano quelli che l'hanno già letto? 03 la peer review è il filtro fondamentale anche se la semplice etichetta peer reviewed non è da sola sinonimo di qualità e non copre tutti i casi possibili 04 Interessi Ci sono interessi in gioco? L'autore cerca di dimostrare una tesi senza considerare punti di vista alternativi? è il criterio più difficile da applicare: alla base di ogni studio c'è una prospettiva teorica e/o metodologica più o meno disinteressata che condiziona i risultati l'esempio classico è quello delle ditte farmaceutiche che sponsorizzano studi a favore dell'efficacia di un farmaco, ma è un esempio fuorviante: ci sono tante zone d'ombra anche in studi di altro tipo e provenienza gran parte della letteratura accademica passa di default attraverso una valutazione qualitativa ... ma la peer review è un metodo infallibile? almeno tre lacune: 1 2 3 ricerche sbagliate o fraudolente sfuggono spesso al controllo dei pari salvo ritrattazioni documenti di qualità che non hanno ancora subìto peer review o non la subiranno mai (es.: preprint, working paper) la peer review non dice nulla sulla qualità relativa dei documenti INDICATORE = qualcosa di accessibile che indica delle proprietà di qualcos'altro di inaccessibile in maniera imperfetta temperatura corporea = indicatore di febbre ma la febbre può avere tante cause e la sensibilità dei termometri può variare si arriva così alle valutazioni quantitative QUALITATIVA valutazione documenti QUANTITATIVA BIBLIOMETRIA / SCIENTOMETRIA / INFORMETRICA = studio quantitativo dei testi e delle reti bibliografiche (citazioni) nei documenti scientifici esiste un anello che collega bibliometria e valutazione della ricerca e si chiama ... ... analisi delle citazioni studio quantitativo dei legami bibliografici tecnica bibliometrica prevalente dagli anni '60 in poi estendibile ad altre unità di analisi (es. hyperlink, download) A cita B in un riferimento bibliografico R di una pubblicazione accademica A B dal punto di vista di A, il link R è un riferimento bibliografico (bibliographic reference) dal punto di vista di B, il link R è una citazione (citation) articolo citante (citing paper) A riferimento bibliografico (reference, cited reference) B A1 A2 A3 A4 B il documento/autore B riceve 4 citazioni, i.e. 4 riferimenti bibliografici da altrettanti documenti/autori puntano a B il documento/autore B sta esercitando un impatto (bibliografico? scientifico? retorico?) sulle 4 fonti citanti per chi fa o usa la bibliometria impatto bibliografico equivale perlopiù a impatto reale (conoscitivo, pratico) = indicatore di qualità scientifica C1 A1 A2 C2 A3 C3 C4 B quando la rete dei legami bibliografici diventa più fitta si può: contare il numero di citazioni ricevute dai documenti/autori per stimarne l'impatto analizzare la rete bibliografica con strumenti matematici (calcolo delle probabilità, network analysis, etc.) oltre le citazioni A scarica il full text di B A evoca o “segue” B sul social web A cataloga B in un reference manager A A (biblioteca) cataloga B in un OPAC A (sito web) crea un link a B (sito web) B la nuova frontiera è cercare tracce dell'impatto al di fuori delle bibliografie: è il mondo della cybermetrica e delle metriche alternative o altmetrics applicazioni 1 Valutazione indicatori di produttività e impatto basati su statistiche relative a pubblicazioni e citazioni 2 Mappatura associazioni costanti di legami bibliografici o altmetrici allo scopo di identificare discipline, specialità, fronti di ricerca emergenti sono aspetti collegati: valutazione = confronto con reference set della stessa disciplina o fronte di ricerca numero pubblicazioni numero e distribuzione temporale delle pubblicazioni scientifiche di un autore, ma di per sè indica poco, bisogna: definire ciò che conta come “scientifico” (es. meeting abstract, relazione di convegno) dare un peso alle diverse tipologie di pubblicazioni numero citazioni Numero e distribuzione temporale delle citazioni ricevute da un set di documenti: è il mattone col quale sono costruiti indicatori più complessi è un indicatore che ha tanti problemi ... li vedremo dopo numero medio citazioni PROBLEMA quantità vs. qualità: in media 3 articoli citati in totale 30 volte valgono quanto 30 articoli citati 300 volte 10 10 10 indice h (di Hirsch) h=5 un ricercatore ha h index = h se ha pubblicato h articoli ciascuno dei quali citato almeno h volte ... anche questo ha tanti problemi, ad esempio la scarsa “sensibilità” Impact Factor (IF) IF(rivista J nell'anno y) = A B A = numero di citazioni ricevute, nell'anno y, da tutti gli articoli pubblicati su J nei due anni precedenti y –1, y–2 (compresi editoriali, lettere, commentari, etc.) B = numero totale di citable items (solo research papers & notes, reviews, NO editoriali, lettere, commentari, etc.) pubblicati su J lungo gli stessi 2 anni y-1, y-2 Impact Factor (IF) è l'indicatore più (ab)usato e bistrattato della storia della bibliometria spesso si confonde l'IF con tutta la evaluative bibliometrics termini MeSH che descrivono gli argomenti di ricerca di un autore UNIMORE rete di collaborazione tra gli autori che citano una rivista rete di collaborazione tra le nazioni di provenienza degli autori che citano una rivista utilità delle mappe com'è fatta la struttura intellettuale (visibile) di un settore di ricerca quali sono i fronti di ricerca emergenti in una disciplina come si evolve la visibilità internazionale di un'entità (autore, subject, rivista) IT'S NOT JUST ABOUT NUMBERS! 01 CERTEZZE certezza numero uno: la bibliometria è tra noi certezza numero due i database fondamentali per la bibliometria sono due: Web of Science (WoS) e Scopus ... lasciate perdere Google Scholar (GS) certezza numero tre numero articoli autocitazioni coautori età tipo documento disciplina e area di ricerca i numeri grezzi di citazioni (e indicatori derivati come l'hindex) non vanno bene perché dipendono da fattori che non hanno nulla a che vedere con l'impatto Informed Peer Review = valutazione qualitativa (in)formata da indicatori bibliometrici gli indicatori bibliometrici usati sono “relativi” o “normalizzati”: si cerca di confrontare il simile con il simile a livello nazionale e/o internazionale numero pubblicazioni recenti, numero citazioni, indice h contemporaneo: tutti indicatori vincolati al superamento di soglie disciplinari indicatori bibliometrici = numero citazioni in ISI Web of Science o Scopus + indicatore impatto rivista (non solo Impact Factor) nella VQR ANVUR confronta il SIMILE CON IL SIMILE in modo indiretto: un articolo/rivista di una certa subject category viene confrontato con tutti gli articoli/riviste della stessa subject category WoS o Scopus più precisamente ANVUR determina, per ogni articolo: il percentile del numero di citazioni in relazione a tutti gli articoli simili per tipologia (article, review), anno di pubblicazione, subject category in WoS e/o Scopus il percentile dell'indicatore d'impatto della rivista in relazione tutte le riviste simili per anno di pubblicazione e subject category indicizzate in WoS e/o Scopus 02 CONTROVERSIE copertura limitata e irregolare ambiguità in profili autore errori nel citation matching WoS e Scopus hanno limiti strutturali e tecnici di varia natura ... qualcosa si può fare per contrastarli ma alcuni limiti sono insormontabili ESISTONO CENTINAIA (O MIGLIAIA) DI LOST CITATIONS ovvero citazioni non contate correttamente dal sistema per tante tipologie di documenti ... in Scopus si trovano tra i Secondary Documents la situazione è molto grave per i conference papers: lo abbiamo segnalato, questa la risposta di ELSEVIER il numero percentile rappresenta il posto che il bambino occupa rispetto ad altri 100 bambini della stessa età e dello stesso peso (o altezza) cresciuti nelle stesse condizioni socio-economiche in un paese occidentale ... non c'è corrispondenza con le distribuzioni bibliometriche gli usi normativi dei percentili presuppongono un riferimento più o meno indiretto alla distribuzione gaussiana MA ... “Perché a chiunque ha sarà dato e sarà nell'abbondanza; ma a chi non ha sarà tolto anche quello che ha” (Matteo 25:29) ... il capitale simbolico, al pari di quello materiale, tende a concentrarsi in poche mani (autori, gruppi, enti) per dinamiche indipendenti dal merito i dataset bibliometrici hanno una distribuzione profondamente asimmetrica che rende poco significativi valori medi e tecniche analitiche convenzionali come correlazione e regressione uno studente supera un esame col massimo dei voti nel complesso solo l'1% dei candidati ha ottenuto il massimo questa situazione può essere descritta in due modi alternativi: il punteggio dello studente occupa il 99esimo percentile in quanto il 99% dei candidati ha ottenuto un voto strettamente minore; il punteggio dello studente occupa il 100esimo percentile in quanto il 100% dei candidati ha ottenuto un voto minore o uguale a quello del candidato. PUNTEGGIO RANK 1000 500 500 500 500 500 500 500 500 200 1 2 2 2 2 2 2 2 2 10 PERCENT PERCENT PERCENT _1 _2 _3 100% 100% 100% 90% 10% 50% 90% 10% 50% 90% 10% 50% 90% 10% 50% 90% 10% 50% 90% 10% 50% 90% 10% 50% 90% 10% 50% 10% 0 0 La posizione degli 8 punteggi uguali a 500 può essere interpretata in vari modi: è nel 90° percentile perché maggiore o uguale al 90% dei punteggi è nel 10° percentile perché maggiore del 10% dei punteggi è nel 50° percentile perché occupa il centro della distribuzione è nel range percentile 10-89 in alcune discipline è la correzione più importante di tutte soluzioni possibili FIRST Autore 1 Autore 2 FULL Autore 3 20 citazioni 1 i 1 1 1 ... 2 N FRACTIONAL RANKBASED Autore 1 20 Autore 2 0 Autore 3 0 Autore 1 20 Autore 2 20 Autore 3 20 Autore 1 20/3 Autore 2 20/3 Autore 3 20/3 Autore 1 0.55 Autore 2 0.27 Autore 3 0.18 le classi di soggetto (subject categories) in WoS e Scopus sono assegnate alle riviste non ai singoli articoli incites.isiknowledge.com/common/help/h_field_category_wos.html questo articolo supercitato uscito su Nature, ad esempio, non viene classificato in BIOCHEMISTRY e MOLECULAR BIOLOGY ma in multidisciplinary sciences ... la distribuzione delle citazioni in quelle subject categories quindi è falsata di default modello bibliometrico di scienza ispirata da criteri universali e impersonali di giudizio pubblica disinteressata basata su affermazioni logicamente coerenti e verificate o verificabili governata da peer review imparziale Robert K. Merton (1910-2003) tante piccole peer reviews realizzate ogni volta che un documento ne cita un altro in bibliografia la valutazione (imperfetta) di pochi sostituita dalla micro-valutazione meno imperfetta (?) di tanti a partire dagli anni '70 il modello bibliometrico di scienza è stato demolito sul piano teorico la peer review ha tanti difetti fonte immagine: http://tinyurl.com/kdtg6h9 chiedendo direttamente agli autori le ragioni per citare, si è scoperto che le citazioni non sono atti di micro peer review alla stessa conclusione si è giunti esaminando il contesto delle citazioni negli articoli citation context gli articoli più citati sono spesso NON rivoluzionari (metodi, reviews, linee guida) “Un articolo senza riferimenti bibliografici è come un bambino che passeggia di notte da solo in una città che non conosce: isolato, perso, qualunque cosa può succedergli” (Bruno Latour) lettera ricevuta da un prof. UNIMORE: l'autore citato chiede di dichiarare il motivo della citazione la risposta 03 OPPORTUNITÀ come si sopravvive in un mondo governato dalla bibliometria? STRATEGIA 1 Read! Write! Read! Write! Read! Write! Read! Write! Read! Write! Read! Write! l'errore più grosso: pensare che una volta terminato un esperimento con “buoni” risultati la maggior parte del lavoro sia fatta ... invece di là inizia la parte più difficile! http://www.gocomics.com/ fare ricerca e comunicarla sono due attività radicalmente diverse: per la seconda non esistono corsi specifici !!!!! questo manuale si segnala per l'originalità: si basa su lettura e analisi di estratti da articoli ACS e altre tipologie (conference papers, poster, progetti, etc.) nato dalla collaborazione tra esperti di chimica e linguistica applicata approccio read-analyze-write: analizza le convenzioni stilistiche nella letteratura chimica (sono le regole del gioco linguistico “scrivere un articolo di chimica”) alcuni problemi ricorrenti e annesse soluzioni (fonte: Eric Lichtfouse, Writing for Impact Factor Journals. New York: Nova Science, 2013, p. 5) per inquadrare correttamente la novità del contributo bisogna conoscere la letteratura (problema di controllo e gestione bibliografica), essere up-to-date (convegni, seminari, news) e recepire le critiche altrui (tutor, revisori) NON SCRIVERE SOLO PER POCHI ELETTI la ricerca innovativa avviene spesso al confine tra settori diversi, ciascuno con un suo “linguaggio” potenziali utilizzatori (citanti) e finanziatori/employers potrebbero essere tagliati fuori (fonte: Eric Lichtfouse, Writing for Impact Factor Journals. New York: Nova Science, 2013, p. 8) STRATEGIA 2 know your enemy! potete ad esempio sapere quali sono i numeri medi di citazioni (valori attesi) a livello di macroaree ISI WoS https://esi.incites.thomsonreuters.com oppure potete sapere quante citazioni servono per entrare nel top 50%, 20%, 10% etc. a livello di macroaree ISI WoS di qui capite anche perché non si possono confrontare direttamente gli indici bibliometrici di un chimico con quelli di un geologo https://incites.thomsonreuters.com se avete un account Web of Science (con email UNIMORE) e vi collegate a questo indirizzo in rete d'ateneo avete accesso a dati bibliometrici normalizzati ad esempio questo ricercatore ha un impatto normalizzato (in WoS) 2.78 volte superiore alla media internazionale (pari a 1) in IRIS si vedono i percentili Scopus a livello di citazioni individuali e indicatori di rivista STRATEGIA 3: (let everybody) know yourself !!! WORKFLOW AREE BIBLIOMETRICHE STRATEGIA 4: share everything (worth sharing)! mettete su IRIS i pdf dei lavori: le chances di essere letti e citati aumentano ... un gruppo di lavoro UNIMORE si preoccuperà di: controllare la correttezza dei metadati controllare i diritti di distribuzione dei fulltext cercate di tenere aggiornato almeno un profilo 2.0 tre slides riassuntive sulle scelte informate: dalla progettazione alla disseminazione ... tipologia di studio e scelta argomento influenzano le probabilità di citazione citare in maniera accurata le fonti crea una rete sociale virutale con gli autori citati non solo testo (immagini, video, dataset) progettare la ricerca organizzare le bibliografie con sofware appropriati e social (Mendeley, Zotero) scelta strategica coautori titoli, parole chiave e abstract ottimizzati in funzione della reperibilità da parte dei motori di ricerca contenuto e forma appropriati (leggere attentamente le sezioni Aims & Scope e Instructions for Authors) indicizzazione WoS/Scopus o presenza nel citation index tempi di revisione dichiarati e acceptance rates scegliere la rivista quartile categoria IF, SNIP, SJR, altri indicatori JCR prestigio editore, editor-inchief e comitato editoriale policy Open Access e costi (attenzione ai predatory publishers: http://scholarlyoa.com/publishers) preparare curriculum arricchito (modelli BECKER e ACUMEN, vedi slide seguenti) monitorare e promuovere altmetrics (es. Researchgate, Academia.edu, Nature Network) disseminare full text e link in tutti i luoghi possibili (open archive disciplinare o istituzionale, sito o blog personale, etc.) unitamente a CV e profilo ORCID autore disseminare i risultati monitorare indicizzazione in WoS, Scopus, IEEE inviare copia o segnalazione a tutti i potenziali citing authors (cfr. mappe) disseminare i risultati attraverso convegni, seminari, comunicati stampa ESTENSIONE CV 1: modello BECKER https://becker.wustl.edu/impact-assessment/model ESTENSIONE CV 2: modello ACUMEN http://research-acumen.eu/wp-content/uploads/D6.14-Good-Evaluation-Practices.pdf http://eprints.rclis.org/20496 in questo articolo trovate una rassegna di oltre 30 sistemi per incrementare la probabilità di citazione di un articolo GRAZIE!