Wikipedia:Bar/Discussioni/WebCite in agonia. Come risolvere il problema dei link non più funzionanti?

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

WebCite in agonia. Come risolvere il problema dei link non più funzionanti?


Come noto una delle questioni più importanti di Wikipedia è la verificabilità delle fonti che mettiamo a corredo delle nostre voci. Quando linkiamo siti esterni è esperienza comune che certe pagine scompaiano o cambino indirizzo, vanificando magari il certosino lavoro di raccolta delle fonti e rendendo "non verificabile" il contenuto di una voce. Mi è da poco successo di rimetter mano a una voce che avevo curato con un certo grado di dettaglio e ho scoperto che una buona parte dei link nelle note che avevo messo sono nel frattempo "morti": pagine sparite o spostate. Così ho preso per buono il consiglio mai abbastanza sottolineato di "archiviare" le pagine web usate come fonte. Archiviare significa sfruttare uno dei servizi web esistenti che non fanno altro che copiare il contenuto di una certa pagina web in un altro server e di fornire un url apposito con la garanzia che la pagina "archiviata" rimanga disponibile a lungo (in teoria anche per sempre). I templatlate "cita qualcosa" ({{cita web}}, {{cita news}}, ecc.) che usiamo sono tutti addestrati per ricevere, oltreché l'url originale della pagina web che vogliamo linkare, anche un url di archivio che linka alla versione archiviata altrove della pagina stessa. Un esempio è questa voce. Per archiviare versioni "statiche" di pagine web uno dei servizi più noti è WebCite che ha il vantaggio di utilizzare una licenza libera e di essere, da quanto capisco, abbastanza autonomo poiché gestito da un consorzio canadese senza fini di lucro. Da qualche giorno, proprio ora che avevo inziato ad usarlo, sulla home page del sito di WebCite compare un sinistro avviso che sostanzailmente dice che se per la fine dell'anno la raccolta fondi che hanno organizzato non raggiunge gli obbiettivi prefissati, i gestori del servizio smetteranno di accettare nuovi ingressi nel loro archivio. Ad oggi hanno raccolto meno di 1.000 dollari da 43 donatori e l'obbiettivo fissato è 50.000 dollari. Siamo un po' distanti :-) Un po' pessimisticamente ne deduco che WebCite non sia messo benissimo e che il rischio sia che ci possiamo trovare tra breve senza uno strumento utilissimo anche se ancora poco utilizzato. Il punto è che salvare pagine web complete di codice html, immagini e chissà cos'altro richiede una marea di spazio, un mucchio di server e quindi un mucchio di soldi...

Su Meta è stata avviata una discussione che in sostanza verte sull'idea di "adottare" WebCite come progetto della WMF. Si dice che solo en.wiki ospita 180 mila link di WebCite. La nostra Fondazione ci mette i soldi (le raccolte fondi di WMF hanno certamente una visibilità maggiore di quelle di WebCite), i server, gli HD e salva il servizio rendendolo disponibile ai progetti. Ora, io non so se questa sia la soluzione migliore o se sia meglio usare un altro sistema (ad es. Wikiwix Archive), magari sfruttando possibili sviluppi di Wikidata. Nella discussione che ho linkato si parla anche di estensioni al software MediaWiki o altre alternative. Volevo solo mettere la comunità al corrente del problema e sottolineare che linkare versioni archiviate delle pagine web che usiamo come fonte dovrebbe diventare una nostra priorità soprattutto per le voci che reputiamo di qualità o da vetrinare. Questa una vecchia discussione sull'argomento. Pareri? --Amarvudol (msg) 13:35, 19 feb 2013 (CET)[rispondi]

Tempo fa parlai con Restu20 proprio di questa esigenza. Logica vorrebbe che un'enciclopedia on line che basa molti dei suoi contenuti su testi disponibili on line si preoccupi da subito della salvaguardia degli stessi. È chiaro che la soluzione ottimale sarebbe quella di avere una copia di backup gestita dalla fondazione e che il software archivi periodicamente (se non automaticamente) tutte le pagine web linkate: se stiamo andando in questa direzione sono stra felice. --Cpaolo79 (msg) 14:06, 19 feb 2013 (CET)[rispondi]
in questo modo rischieremmo però un'autoreferenzialità ("noi" salviamo quello che "noi" usiamo come fonte: chi assicura la terzietà?) -- .mau. ✉ 14:21, 19 feb 2013 (CET)[rispondi]
(conflittato) Alla prima apertura del sito WebCite, AVG mi ha segnalato la presenza di un virus (dal nome "Manhole" o qualcosa del genere); quando l'ho riaperto le volte successive il virus non si è ripresentato.
In generale sono favorevole ad acquisire o sviluppare servizi per archiviare le pagine web o a utilizzare altri strumenti a tale scopo. Però dovremmo anzitutto verificare quanto spazio utilizzano i server per svolgere tali servizi, chiedendo tali informazioni ai siti che si occupano di ciò.
Segnalo inoltre il sito The Wayback Machine. --Daniele Pugliesi (msg) 14:27, 19 feb 2013 (CET)[rispondi]
Concordo con i dubbi di .mau., il rischio autoreferenzialità è forte e si rischia fortemente di far saltare così anche la neutralità delle voci (un conto è salvare file con licenza libera, un altro siti web). Io rimango fortemente perplesso... --Gce (msg) 15:48, 19 feb 2013 (CET)[rispondi]
Intanto segnalo che esiste anche archive.is. L'autoreferenzialità comunque svanisce nel momento in cui chi archivia le foto rimane slegato da chi tiene l'archivio, fa strano il fatto che la wikimedia foundation si basa molto su un progetto che sta fallendo ma che non può sostenere perché altrimenti sarebbe in "conflitto di interessi". L'unica soluzione sarebbe che wikimedia foundation regali 50 000 euro a webcitation e torni tutto come prima, ma non so quanto sia "giusto" che tu salvi dal fallimento una associazione e un istante dopo perdi ogni legame con essa.--dega180 (msg) 19:51, 19 feb 2013 (CET)[rispondi]
Io invece non vedo un particolare rischio di autoreferenzialità: il fatto che una pagina sia archiviata ANCHE da Wp/Wm non significa che la fonte smetta di essere terza. Se quello che si salva è una copia non modificabile della pagina in un momento specifico nel tempo, sarà come accedere a quella stessa pagina, solo su un server diverso.--Idonthavetimeforthiscarp~~niente tempo per le carpe 20:30, 19 feb 2013 (CET)[rispondi]

────────────────────────────────────────────────────────────────────────────────────────────────────Il problema è che il server diverso è quello che gestisci proprio tu che citi la fonte, io teoricamente potrei dire: questo fa lo screenshot del sito, cambia le parole come piace a lui, e usa lo screenshot fasullo come fonte.--dega180 (msg) 20:43, 19 feb 2013 (CET)[rispondi]

Eh, vabé, e allora uno fa lo screenshot del sito, cambia le parole come piace a lui e usa lo screenshot fasullo uploadato da qualche altra parte come fonte, cosa cambia?--Idonthavetimeforthiscarp~~niente tempo per le carpe 21:26, 19 feb 2013 (CET)[rispondi]
Attualmente quando tu visualizzi screenshot di un sito archiviato su webcitation, webcitation ti fa vedere una barra in alto con scritto il sito internet da cui lo screenshot è stato fatto, e garantisce webcitation, che non ha alcun interesse a mettere screenshot fasulli, che lo screenshot non è fasullo. Nel momento in cui webcitation viene gestito da wikipedia ci sarebbe un "conflitto di interesse". Per esempio se tu vai in questo link: http://www.webcitation.org/6ETZAJAjj puoi vedere nella barra in alto che lo screenshot è stato preso dal sito del tribunale di milano http://www.tribunale.milano.it/ , e sei sicuro che non sia taroccato perché webcitation è completamente distaccato dal tribunale di Milano, se webcitation fosse un sito del tribunale di Milano avresti potuto pensare che quello è solo uno scherzo.--dega180 (msg) 00:09, 20 feb 2013 (CET)[rispondi]
Ma perché conflitto d'interesse? se un link è usato come fonte, senz'altro ci saranno ALTRE fonti disponibili, se quel link specifico non è più attivo, per un'affermazione non sarà difficile trovare fonti ancora attive, e tenere gli screenshot "vecchi" a ulteriore riprova.--Idonthavetimeforthiscarp~~niente tempo per le carpe 18:05, 20 feb 2013 (CET)[rispondi]
Infatti, non capisco dove c'è conflitto di interesse e autoreferenzialità: le pagine continueranno a riportare il link originale al sito esterno a Wikipedia; in più avranno sempre (questa la vera differenza) un url di backup, gestito dalla fondazione stessa. Tale url è utile solo nel caso in cui quello originale è rotto: non vedo dove sia il conflitto; cosa facciamo ci aggiustiamo gli url di backup a nostro piacimento dopo che l'originale è morto? --Cpaolo79 (msg) 18:36, 20 feb 2013 (CET)[rispondi]

────────────────────────────────────────────────────────────────────────────────────────────────────Eh sì, oppure ci inventiamo una pagina che non è mai esistita scrivendoci su quello che ci piace di più e la spacciamo per dead link. Il nostro obiettivo è quello di fare una enciclopedia affidabile senza il bisogno che la gente si fidi di wikimedia foundation.--dega180 (msg) 13:33, 21 feb 2013 (CET)[rispondi]

Quello si può fare pure adesso con webcite, se uno ha voglia e tempo, non vedo la differenza.--Idonthavetimeforthiscarp~~niente tempo per le carpe 14:56, 21 feb 2013 (CET)[rispondi]
Trovo sufficientemente fondate le obiezioni sollevate da Dega180. In particolare, l'azione di WebCite è triplice: 1. fa un backup di una pagina; 2. garantisce la corrispondenza fra backup e pagina; 3. garantisce che il backup è fatto in una data ben precisa. Le attività 2. e 3., per forza di cose, devono restare imparziali e indipendenti. --RrronnyDicami!Cosefatte 12:36, 27 feb 2013 (CET)[rispondi]