zanimive statistike objavljanja na arxiv

ArXiv (arxiv.org) je online arhiv znanstvenih preprintov člankov iz fizike, matematike in sorodnih disciplin. Njegovi začetki segajo v leto 1991, ko je Paul Ginsparg osnoval mailing listo znanstvenih preprintov za ozki krog raziskovalcev teorije strun. Koncept se je kaj hitro razrasel in razširil na ostala področja. Tako je na arXiv sedaj že več kot pol milijona znanstvenih preprintov, vseh povsem prosto dostopnih. Na marsikaterem področju, recimo v astrofiziki in fiziki visokih energij, je tako običajna pot do objave nekako taka: po tem, ko avtorji končajo s pisanjem članka, ga najprej pošljejo na arXiv. Potem počakajo nekaj dni, ali dlje, na morebitne komentarje. Nato pošljejo članek v znanstveni časopis, kjer gre v recenzijo in, če je ta ugodna, nato tudi v objavo (ali pa v popravljanje). Običajno nato avtorji tudi končno verzijo članka, tako kot je objavljena v časopisu, ponovno pošljejo na arXiv. Na arXiv so tako večinoma enake verzije člankov, kot so v samih časopisih - s pomembno razliko, da so javno dostopni.

ArXiv je pomembno spremenil razširjanje informacij v fiziki visokih energij. Nič več niso raziskovalci iz manj premožnih okolij prikrajšani za dostop do najnovejših izsledkov (kar seveda ne pomeni, da niso še vedno drugače hendikepirani). Prav tako je postal tudi poseben ritual vsakodnevno branje na novo prispelih člankov na arXiv. Sistem namreč deluje tako, da zbira na novo poslane preprinte, nakar vsak delovnik razpošlje po elektronski pošti naslove in abstrakte razvrščene po področjih (recimo astro-ph za astronomijo in astrofiziko, hep-ph za visokoenergijsko teoretično fiziko, ki je blizu eksperimentom, hep-th za visokoenergijsko teoretično fiziko, ki je bolj abstraktna - recimo teorija strun, itd... ). Podobno vsak delovnik sistem generira novo internetno stran z na novo poslanimi preprinti za posamezna področja.

In tu postanejo stvari zabavne. V kakšnem vrstnem redu se namreč pojavijo preprinti na internetni strani je določeno s tem, v kakšnem vrstnem redu so bili poslani na server. Pri čemer je začetni čas ob štirih popoldan po vzhodnoameriškem času (ob 10h zvečer po srednjeevropskem). Če preprint prispe malo pred deseto zvečer, potem se bo pojavil na dnu liste, če prispe malo po deseti zvečer pa na vrhu liste - ampak en dan kasneje. Je to sploh pomembno? Človek bi tako naivno pomislil, da niti ne. Kvaliteta znanstvenega dela pač govori sama zase, kajne?

A očitno ni tako. Tudi sam poznam kar nekaj ljudi, ki pošiljajo na arXiv izključno tik po deseti (tudi nekateri od mojih sodelavcev :-)). In niso edini. Več kot zgovoren je naslednji graf na desni, povzet iz članka, ki je danes prispel na arXiv. V desetminutnem intervalu po 16h EST (22h CET) je namreč poslanih kar desetkrat več preprintov kot v ostalih desetminutnih intervalih. Očitno torej avtorji menijo, da se "splača" biti prvi na vsakodnevni mailing listi. Pa je to res? Je, odgovarjata avtorja članka. Če je članek na prvem mestu na astro-ph ima namreč kar 83% večjo mediano citatov na dolgi rok kot če je nižje na lestivici (100% več citatov za hep-ph in 50% več za hep-th). Razlog za to sta dva
V članku nato avtorja pregledata še množico ostalih efektov. Recimo korelacijo med številom ogledov člankov in njihovo citiranostjo. Tu je zanimivo, da imajo na dolgi rok največ ogledov pregledni članki in ostali pedagoški članki, kot so na primer zapisi predavanj, kar pa se ne pozna v številu citatov, ki jih prejmejo...