Wikipedia:Bar/Discussioni/Su P.I. si parla dei bot creatori di voci

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Su P.I. si parla dei bot creatori di voci


Segnalo quest'articolo apparso oggi su Punto Informatico, che riguada il famoso "bot delle farfalle" che ha permesso a sv.wiki di arrivare a 1.700.000 voci in poco tempo.

Ci sono comunque diverse imprecisioni, tipo si fa confusione fra numero di edit e numero di voci create, spiegando che (sic!) su sv.wiki ha creato 2,7 milioni di voci, che sono l'8,5% delle voci di quella wiki (!). Inoltre a fine articolo si riporta un link a una voce che, mano alla cronologia, è stata creata dal bot ma editata da diversi utenti, presentandola come il risultato finale del lavoro del bot.

Ad ogni modo, questo offre uno spunto interessante, che ogni tanto si ripropone, ossia di riflettere sulla possibilità offerta dai bot ben programmati di creare delle voci che possano andare al di là dello stub minimale, che riporti fonti e template completi. Anni fa anche al Progetto Astronomia avevamo un bot, tale HubbleBot, in grado di creare voci come HD 81157, sufficientemente complete al punto da non aver neanche bisogno del template stub. Notare che nella crono di questa voce non appare alcun intervento umano successivo, ma soltanto bot per aggiustare categorie cambiate, interwiki rimossi, eccetera. Purtroppo in questo caso specifico il bot è fermo da anni, ma tutti i "raw" utilizzati per creare le voci sono sempre disponibili (1 e 2) in attesa che qualche nuovo bot li macini per completare il lavoro.

L'articolo cita anche una certa "resistenza" degli utenti storici all'uso massiccio dei bot per la creazione di pagine, fatto questo che esiste davvero. Io stesso ormai mi posso definire uno "storico" e in effetti i bot sguinzagliati in particolare per la creazione massiccia di contenuti non mi stanno particolarmente simpatici, perché prima che questi si lancino nella creazione occorre studiare attentamente ogni caso, fare moltissime prove, eccetera onde evitare grossi danni e palesi imprecisioni. Tuttavia, è anche possebile dimostrare che un bot è in grado di creare contenuti validi e sufficientemente completi, per alcune e limitate categorie di voci.

Questo genere di contributi non potrà naturalmente essere una soluzione per risolvere i problemi delle wiki poco frequentate o in calo di contributori, soprattutto perché comunque le voci create necessitano di una certa supervisione imprescindibile. --Roberto Segnali all'Indiano 12:54, 17 lug 2014 (CEST)[rispondi]

In realtà i BOT sono strautili nel creare strutture di base delle voci, i cosiddetti "scheletri", che potranno poi, in una visione anche a lungo termine (c'è qualcuno che va di fretta?) essere ampliati da esseri umani. La creazione a mano di tali "scheletri" (incipit, template sinottico, eventuali altri template di navigazione, categorizzazione, paragrafi con {{...}}, ecc.) costituirebbe una enorme perdita di tempo per qualunque essere umano in quanto si tratta di numerose azioni ripetute e uguali che differiscono per determinate variabili ampiamente prevedibili che possono essere immesse in maniera automatica.
Quello che non comprendono gli "utenti storici", come tu li definisci, è proprio il ruolo che avrebbero i BOT che non sarebbero creatori di contenuti veri e propri ma principalmente strumenti utili ai redattori (e quindi ai lettori) nelal creazione di stub di base. Ecco perchè tali "utenti storici" si spaventano quando sentono parlare di bot autori di voci, perchè non ne comprendono il ruolo e, contrastandone l'utilizzo per partito preso, ogni volta che si comincia a progettarne l'utilizzo, non fanno altro che danneggiare it.wiki.
Poi, cosa che non si è mai compresa e che nessun "utente storico" è riuscito mai a spiegare, è il motivo per il quale se uno stub (ricordiamo cos'è uno stub, vedi esempi) è creato da un essere umano va bene, se quello stesso stub è creato con un bot non va più bene. Partito preso e pregiudizi di natura sentimentale ed emotiva, nient'altro. --95.237.37.153 (msg) 16:42, 17 lug 2014 (CEST)[rispondi]
non so se posso fregiarmi dell'ambito titolo di utente storico, per il quale ho già presentato - presso l'apposito sportello comunitario - domanda da almeno due anni (dannata burocrazia)... posso però dirti che l'insostenibile avversione di cui parli ha delle motivazioni anche comprensibili, se si fa un piccolo sforzo per cercarle... prendiamo la differenza tra creare stub umani e botoleschi... di per sè, nel contenuto "informativo" le voci possono persino equivalere... ora però troverai che c'è una certa differenza tra il creare qualche decina di voci al giorno, rispetto a vararne, magari migliaia, alla velocità della luce... soprattutto, e qui c'è da ragionare, una volta che finito il lavoro, chi controllerà nel futuro il tutto? nel primo caso il tapino dovrebbe avere le nuove creature negli osservati speciali e riuscire, nel limite del possibile, a tenerle d'occhio... ma anche non ce la facesse, gli altri wikipediani possono certo coadiuvarlo... il secondo caso, specie se si tratta di inserimenti massivi, qualche effetto collaterale potrebbe comportarlo... dunque, o si propone da subito come si intendere gestirlo, e allora le perplessità potrebbero sciogliersi come neve al sole, oppure le riserve sono legittime e qualificarle come "un danneggiamento di it:wiki" (libera cit.) è, come minino, ingeneroso... vedi, secondo me, basta che la proposta di utilizzo del bot (es: voglio inserire le voci su tutte le stelle catalogate così superiamo anche quegli spocchiosi di en:wiki :-)) sia corredata da "uno studio" circa la gestione delle eventuali criticità post-lavoro botolesco... fatto questo penso che si avranno tutti i via libera desiderati e credo persino dai famigerati utenti storici... --torsolo 08:41, 18 lug 2014 (CEST)[rispondi]
Non credo che il controllo delle voci sia un problema, perché dubito che ci siano molti edit su insetti o roba simile. Ho ad esempio negli osservati speciali tutti i domini di primo livello, e nell'ultimo mese, messi insieme, hanno ricevuto 5 modifiche, 2 delle quali da parte di utenti autoverificati. Insomma, una modifica da controllare ogni 10 giorni. Credo che la situazione sarebbe comunque gestibile :) Jalo 09:08, 18 lug 2014 (CEST)[rispondi]
ah, ma allora procediamo pure :-) --torsolo 09:51, 18 lug 2014 (CEST)[rispondi]
In verità se l'albero delle categorie cui le nuove pagine fa riferimento è piuttoso ramificato, il controllo richiede moltissimo tempo (il bot stellare per esempio categorizza in una trentina di categorie che fanno riferimento a una decina di categorie maggiori). Se ci fosse la possibilità di estendere le modifiche correlate anche alle sottocategorie di una determinata categoria sarebbe tutto molto più facile. In ogni caso come detto io personalmente non sono contrario a prescindere, tant'è vero che i raw del bot stellare li abbiamo progettati in due mie sottopagine e sto ancora aspettando che qualcuno si faccia carico di finire il lavoro. --Roberto Segnali all'Indiano 10:04, 18 lug 2014 (CEST)[rispondi]
Quoto Jalo e aggiungo che c'è anche questo strumento, che ha il "pro" di andare in profondità nelle sottocategorie ma il contro di mettere nelle modifiche anche Wikidata. Se proprio si vuole essere sicuri si possono fare appposite liste (esempio) per il controllo delle modifiche correlate. Insomma, il controllo del vandalismo su grandi classi omogenee di voci poco visitate, non è un problema insormontabile. --Retaggio (msg) 10:56, 18 lug 2014 (CEST)[rispondi]
si, se il botolatore si prende l'onere... o se lascia l'incarico ad altri, che si sostituiscono a lui... diversamente qualche problema non trascurabile potrebbe pure porsi... ma non vorrei fare il pessimista... --torsolo 11:35, 18 lug 2014 (CEST)[rispondi]
Favorevole all'inserimento di voci astronomiche con i bot, del resto mi pare che ci sia poco o niente da aggiungere a livello "umano" a quelle voci, mi paiono già abbastanza complete (relativamente all'argomento trattato) nel momento della creazione automatica; se i dati sono corretti (e qui proporrei di testare l'effettivo buon funzionamento su un campione ridotto e "umanamente controllato" di voci nuove), non penso ci sia questa grande incombenza di aggiornamenti delle voci stesse. --Adalingio 13:00, 19 lug 2014 (CEST)[rispondi]

(rientro) quando una voce è facilmente botolabile è perché la sua natura è di almnacco "100%" e i suoi dati sono già su qualche piattaforma statistica o scientifica accessibile. Queste voci sono spessimo duplicati di archivi in rete, quindi si deve avere la ragionevole certezza che ci sia qualcuno che se ne occupi di andare oltre, almeno per una ragionevole quantità di esse, altrimenti è un'operazione alquanto sterile. Chi cerca informazioni su l'asteroide qualsivoglia, il film rarissimo o la specie ignota ai più è quasi sempre più addentro a certi argomenti che il medio utente e questi archivi li conosce. Se non li consoce, alla fine il loro risultato compare in google sopra l'eventuale voce semivuota di wikipedia in molti casi.

Al massimo c'è un caso su 10000 di località o personalità di almanacco divenuta famosa su cui si ha la voce semivuota fin da subito, ma la differenza è nulla all'atto pratico:, parliamo di voci visitate di botto da decine di migliaia di persone per le quali cambia quasi niente se sono fatta da un saggio wikipediano sul momento per tamponare o se il saggio wikipediano wikifica un lavoro improvvisato o ci sono già due righe di bot che dobbiamo correre a proteggere e monitorare e ampliare comunque. All'atto pratico il grosso del lavoro è da un'altra parte in quei casi.

Intendo dire che il bot serve a accelerare un'azione umana la quale comunque deve essere ragionevolmente inseribile in una serie di altre operazioni, altrimenti è come mettere le piastrelle a una stanza senza soffitto. Logico che se costa poco si può sempre fare, probabile che saranno così poco visistate da non necessitare un pattugliamento aggiuntivo, ma sono delle cattedrali nel deserto.

Dipendesse da me, io accelererei molte cose via bot, qualsivoglia azione mecanica e ripetitiva... persino alcuni annullamenti se avessi la certezza che l'errore commesso dal bot fosse 1 su 10000, ma quando si parla di sviluppo naturale delle voci io propendo per una visione col freno a mano, piccoli pacchetti di voci al massimo.

Ci sono voluti anni per disorfanare voci di vini e minerali... per dire, sarebbe stato davvero tanto peggio se invece di sparare 5000 voci di vini a freddo lo si fosse fatto magari dopo aver aspettato che si creasse un vero progetto stabile dietro? Sia chiaro: se un progetto di lunga e stabile durata lo chiede responsabilmente, di botolare delle voci, con tutto un piano di OS e navbox e categorie razionale dietro, la cosa a me va benissimo.

Comunque l'aspetto positivo delle botolazioni è che si fa sempre in tempo a recuperare sugli altri. Se 4 o 5 lingue procedono a fare una certa azione di inserimento, e aumentano le chances quindi che sia a portata di clic del lettore qualche informazione un minimo rielaborata almeno in altre lingue, dopo 12-24 mesi lo possiamo fare anche noi. Dubito che due anni prima o dopo su voci tanto secondarie ci facciano percepire tanto diversamente.--Alexmar983 (msg) 14:22, 19 lug 2014 (CEST)[rispondi]

Il caso del bot stellare in verità è l'esempio del contrario: presi i dati scientifici, se ne fanno delle "deduzioni di logica" a carattere discorsivo. Vedi per esempio il paragrafo osservazione, studiato in modo tale che prendendo le coordinate e la luminosità della stella si possano derivare numerose informazioni su periodo e regione terrestre in cui essa è visibile. E lavorando sui "raw" in modo ancora più approfondito si potrebbero persino inserire ulteriori informazioni tutt'altro che scontate. Queste voci nascono per altro già "disorfanizzate", perché per creare i titoli si seguono i link presenti negli elenchi di stelle per costellazione. --Roberto Segnali all'Indiano 14:43, 19 lug 2014 (CEST)[rispondi]
(confl.) hai ragione, mi stavo dimenticando dell bot che si riporta all'inizio. Ho visto la voce, penso si possa fare, non a caso non ho fatto esempio di voce banale con gli oggetti del profondo cielo, ma l'intervento era lungo e volevo chiedere a un amico esperto di astronomia un parere terzo ma non è in linea da ore.
Credo che quanto ho scritto rimanga valido a livello procedurale: per me deve in primis garantire una solida supervisione il progetto competente.
In ogni caso, anche altri bot hanno output di carattere discorsivo, con una minima rielbaorazione dai dati, semplicemente aumenta il numero di discorsi sensati che si possono fare con certi dati. Io non so ad esempio se certe osservazioni su un programmino di astronomia si possono comunque avere con un clic, e di programmi ce ne sono molti, certo quando la voce inizia a racchiudere interazioni/comparazioni/elaborazioni che non sono disponibili tutti da una stessa interfaccia certo che la cosa vale di più. Anche perché parliamo di decine di migliaia di voci inevitabilmente omogenee fra loro, quindi puoi perdere un po' di tempo in più per produrre un output più avanzato con maggiore densità di valore aggiunto.
Un po' mi "inquieta" che l'omogeneità comporti una perdita di ricchezza che non è stimabile immediatamente. Due righe posso ampliarsi in modo molto diverso, io mi auguro che ci sia qualcosa in più da dire su queste voci comunque. Non ho nulla contro l'omogeneità se viene da un processo di sintesi di contributi sul lungo periodo, qua la sintesi delle esperienze umane si concentra in maggioranza nelle breve fase di stesura del programma del bot.
Proprio per questo suggerisco di procedere in questo in modo graduale, spezzettando il blocco di articoli inseribili in quote omogenee con lo sviluppo delle voci, riservarsene almeno una o due per un ampliamento in breve tempo, incorporare nuovi elementi o migliorie nel blocco delle voci successive... senza contare che far correre ciclicamente un bot aiuta a non disperdere competenze e favorire un certo ricambio generazionale nei manovratori. Quanti sono voci potenzialmente inseribili di oggetti del profondo cielo?--Alexmar983 (msg) 16:19, 19 lug 2014 (CEST)[rispondi]


Ricordo:

Roberto, il dato sul 10 % circa di voci totali si riferisce al fatto che 2,7 milioni di voci (in sv, ceb, war) è circa un decimo dei 32 milioni totali di voci in tutte le lingue. --Nemo 16:17, 19 lug 2014 (CEST)[rispondi]

Alexmar983, le voci riguardano stelle e non oggetti deep-sky (si potrebbero fare anche quelle, ma lì la cosa è già più complicata e difficilmente via bot si potrà fare qualcosa di più di un template e una riga e mezzo, a meno di non passare settimane a studiare un "raw" efficace e universale). In effetti è il motivo per cui un bot deep-sky non è stato mai lanciato. Sulle stelle, comunque non superiamo le 5000 voci nuove.
Nemo, lo so ma l'articolo parla espressamente di 2,7 milioni di voci su sv.wiki che sono il 18% di quella specifica wiki, non parla di contributi globali. --Roberto Segnali all'Indiano 16:29, 19 lug 2014 (CEST)[rispondi]
al di là delle definizioni (pensavo che le stelle rientrassero nella definizione di profondo cielo, ma solo eprché non è il mio settore), ammetto che non ho ancora chiaro il "valore aggiunto" del contenuto di queste voci rispetto ai vari progrmamini che il mio amico astronomo mi mostrò anni fa (non è denigratorio, è che proprio non lo so stimare).
Per i dati, considerando che oramai siamo abbastanza sotto 100000 voci annue come ritmo, mi pare siamo sulle 250 al giorno come ordine di grandezza, quindi anche inserirne 5000 in una botta si noterebbero ma non così tanto. personalmente penso che se trovassimo un accordo su come modulare l'attività di questi bot in modo graduale su base giornaliera o settimanale sarebbe un punto a favore per il futuro. Per me avere due o tre bot che pubblicano voci di argomenti diversi in parallelo a piccole dosi spaventa di meno che tante singolarità corpose.--Alexmar983 (msg) 17:01, 19 lug 2014 (CEST)[rispondi]
Giusto per la precisione, su una cosa che ho letto più sopra (che a distanza di anni mi ritrovo ancora a dire le stesse cose): è da febbraio 2007 che non viene più creata una, dico una, voce di asteroide con un Bot. Sono dunque 7 buoni anni che tutte le voci di asteroidi vengono create a mano, una ad una, come natura crea (cit.).
Ah, e comunque i Bot non sono il demonio: sono uno strumento nelle nostre mani, come il treno che ci permette di andare dove vogliamo in breve tempo, invece del famoso "cavallo di San Francesco" (ri-cit.) Ovviamente ci vuole un macchinista competente e una gestione centralizzata del traffico, ma questo è ovvio... --Retaggio (msg) 10:09, 21 lug 2014 (CEST)[rispondi]
Personalmente che tu sia stato usato un bot 7 anni prima o due mesi prima, non cambia il valore delle considerazioni fatte fin qua. Io non pongo nessun carico psicologico in questo, paradossalmente dovete fare attenzione che il carico psicologico lo si crea scrivendo cose come "non sono il demonio" come interpretazione di alcuni giudizi della comunità, io non lo farei. A me sembra che la discussione in generale non sia sfavorevole all'uso dei bot.--Alexmar983 (msg) 10:26, 21 lug 2014 (CEST)[rispondi]
Ué... io non sono stato usato un bot 7 anni fa! :-P --Retaggio (msg) 10:46, 21 lug 2014 (CEST)[rispondi]
togli il "tu", ero venuto a farlo io adesso. --Alexmar983 (msg) 10:51, 21 lug 2014 (CEST)[rispondi]
Il "carico psicologico", come dici tu, esiste (e certamente non è il mio). La prova è che sono sette anni, mese più mese meno, che su questa wiki non si usano più i bot per la creazione di voci. Io reputo non utile questo che, come dici anche tu, è un blocco psicologico e invito a superarlo e a guardare le cose con oggettività. --Retaggio (msg) 11:05, 21 lug 2014 (CEST)[rispondi]
da allora quanto il problema è stato proposto in un contesto abbastanza neutrale come impostazione, come questa discussione? Io mi ricordo da quando sono qua qualche incursione nell'argomento quando altre wiki minori botolavano a ritmo continuo e macinavano record, e non stupisce che le reazioni fossero sulla difensiva (o, visto che ero già anni fa neutrale/possibilista con cautela/attendista proponitivo sull'argomento, potrei anche dire "snob"... secondo me se 3 o 4 wiki maggiori lo facessero la realtà morderebbe anche qua). Anche i "sette anni" non sono solo un numero, abbiamo usato bot in una fase di espansione esponenziale con grandi carenze, poi il quadro è mutato, e ci vuole un minimo di riaggiustamento nell'inquadrare le cose, è fisiologico. Qualcosa si impara sempre alla fine per fare le cose meglio. Magari con la giusta impostazione comunicativa la questione si poteva riprendere anche qualche anno prima, d'altro canto visto che con i bot a recuperare tempo lo si fa in un attimo, e parliamo di voci perfieriche malgrado tutto, non l'ho mai messo nella mia lista di "priorità". Comunque adesso sembra che ci siamo, e possiamo/potete aggiustare il tiro per scontentare meno/invogliare più gente possibile.
se volete un altro consiglio, suggerirei un'azione progressiva anche per vedere ogni tanto una voce alla settimana in Wikipedia:novità, un altro gesto che aiuterà a rompere il ghiaccio. Quindi se potete magari prendere ogni tanto una voce su cui avete qualcosa in più d dire, potenziarla un poco e proporla sarebbe una buona cosa.--Alexmar983 (msg) 11:35, 21 lug 2014 (CEST)[rispondi]
La questione bot e la conseguente "reazione psicologica" dipendono anche dagli argomenti che si propone di inserire tramite i bot. Un proliferare di un milione e passa di microstub sulle forme di vita, sulle quali "a manina" si potrebbe scrivere molto di più, può facilmente creare un atteggiamento comunitario di sfiducia. Un campione di voci molto meno esteso (con le stelle sarebbero poche migliaia, secondo i dati di Roberto), con informazioni maggiori, inserite in un argomento che per sua natura tende a necessitare di non troppe nozioni in una voce (spesso oltre ai dati tecnici si sa poco o nulla di questi corpi celesti...), secondo me potrebbe essere accettato di buon grado senza troppi problemi. Se ci sono le possibilità tecniche di farlo, sarei sicuramente favorevole a procedere. --Adalingio 11:49, 21 lug 2014 (CEST)[rispondi]
Io sono favorevole alla creazione delle voci sulle stelle. Paradossalmente la media delle voci scritte a mano è meno accurata della voce portata in esempio. --Horcrux九十二 12:39, 21 lug 2014 (CEST)[rispondi]
Concordo con Horcrux, guardando il bicchiere mezzo pieno si può dire che il bot sulle stelle dia una garanzia di importazione di informazioni mai sotto un certo livello standard, e questa come garanzia non mi pare trascurabile. --Adalingio 13:03, 21 lug 2014 (CEST)[rispondi]
[ Rientro] Se però si volesse fare un ottimo lavoro, bisognerebbe usare i bot per caricare i dati su Wikidata, in modo che a beneficiarne siano tutte le wiki, mentre qua si potrebbe utilizzare template complessi che pescano i dati da Wikidata, e creano stub decenti come quello indicato a inizio discussione un po' come fa il template bio per l'incipit, ma esteso a tutta la voce. --ValterVB (msg) 21:17, 21 lug 2014 (CEST)[rispondi]
meglio è nemico del bene, ma se i botolatori sono disponibili non vedo controindicazioni in quanto dici, come indicazione generale. Già in passato in altre discussioniavevamo accenato che il futuro delle voci-almanacco-bot sarebbe stato influenzato da wikidata, non sarebbe male acquisire competenze ed esperienza e pareri per il futuro. --Alexmar983 (msg) 21:37, 21 lug 2014 (CEST)[rispondi]