Wikipedia:Bar/Ricerche con Google

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Ricerche con Google e pagina inesistente.

[modifica wikitesto]

Ho notato che l'articolo Codice Morse non appare nei risultati di ricerca di Google [1], probabilmente ce ne sono altri, ma quello che mi preme ora è capire perchè ciò avviene con quell'articolo.
Qualcuno ha qualche idea, se ne era già parlato in passato?

le ipotesi scartate:

  • La pagina è nuova e il ragnetto non è ancora passato. No, la pagina ha la sua bella età :)
  • La pagina è orfana. No, con google si trova questo articolo: Samuel Morse.

altre ipotesi

  • Io avrei un'ipotesi forse un po' strana: C'è un articolo che linka a Codice morse (minuscolo). Ora, dato che in Google le pagine inesitenti (quelle con scritto "Wikipedia non ha ancora un articolo con questo nome....") sono pochissime, è possibile che google abbia un sistema per scartare dai risultati le pagine inestistenti di wikipedia. Se per google le pagine "Codice_morse" e "Codice_Morse" sono la stessa pagina, e per combinazione inserisce nella sua lista da esplorare prima quella in minuscolo, quella in Maiuscolo non viene indicizzata. Lo so, probabilmente c'è una spiegazione molto più semplice che ora mi sfugge :) Ma nel dubbio ora faccio un redirect da "codice morse".

--lukius 18:12, Ott 31, 2004 (UTC)

Non sono sicuro ma mi pare di ricordare che google analizza e cataloga le pagine a seconda del numero d link che le collegano. La loro importanza (il ranking) viene deciso a seconda dei link, magari codice morse ha pochi link e quindi non è stato inserito nel database. La mia è un'ipotesi, ho seguito un corso sulle basi di dati ma la tecnologia che sta dietro a google è stata solo accennata e quindi posso solo ipotizzare. Hellis 22:14, Ott 31, 2004 (UTC)
Davvero curioso, tenendo conto che le pagine che la linkano sono ben indicizzate: [2]
Lukius Google non distingue tra maiuscole e minuscole ai fini della ricerca, ma penso che ne tenga conto nell'identificazione degli url.
ciao --Balubino (discutimi) 03:08, Nov 1, 2004 (UTC)
Direi che il motore di ricerca è consapevole dell'esistenza della pagina (provare [3]) ma per qualche curioso motivo non ne ha indicizzato il contenuto.
ciao --Balubino (discutimi) 03:18, Nov 1, 2004 (UTC)
Sì, hai ragione. La pagina esiste nel DB di Google ma non è indicizzata.
Altra cosa strana, dal tuo link numero [3], si vede che Google "conosce" anche la relativa pagina di edit, e quella non dovrebbe conoscerla visto che negli Header c'è "noindex,nofollow".
Comunque, se fosse solo quella la pagina non indicizzata non sarebbe niente. Mi preoccupo solo che non ce ne siano diverse centinaia uguali :( --lukius 08:46, Nov 1, 2004 (UTC)

Aggiunta

Ho provato alcune ricerche in google per vedere grosso modo quante pagine non sono indicizzate. Sono parecchie purtroppo :( se provate a cercare con google all'interno di it.wiki senza specificare nessuna chiave di ricerca, le pagine non indicizzate sono quelle che non riportano alcun testo sotto il titolo della pagina, e anche il titolo dell'articolo è in realtà l'url.
Ho quindi provato a fare una ricerca eslcudendo la lettera "A" (quindi escludendo quasi tutte le pagine già indicizzate), giusto per curiosità, ecco il risultato [4]. Non so perchè succede ciò, forse google ha un limite di pagine indicizzate per ogni sito? --lukius 21:26, Nov 1, 2004 (UTC)

Aggiunta all'Aggiunta Dalle faq di google:

  • A differenza di altri motori di ricerca, Googlebot, il crawler proprietario di Google, è in grado di visualizzare risultati anche se la pagina in questione non è stata inclusa nella scansione. I risultati possono quindi comprendere pagine conosciute ma non ancora incluse nella scansione. In tal caso, i titoli non vengono visualizzati e vengono riportati soltanto gli URL. --TierrayLibertad 21:33, Nov 1, 2004 (UTC)
Sì, visualizza la pagina se la parola che cerchi è nell'Url, ma non nel testo dell'articolo, visto che non lo conosce. Immagino anche con un PageRank vicino allo zero. Inoltre nel caso del codice morse qui sopra, la pagina si chiama "Codice_Morse", col trattino, quindi se cerchi "codice morse" non la trovi.
In ogni caso, è chiaro che sono pagine non ancora indicizzate, ma essendo in alcuni casi roba che ha sei mesi, mi sembra che il ragnetto abbia bisogno di una revisionatina :) --lukius 21:49, Nov 1, 2004 (UTC)

C'è scritto anche che troppi link abbassano il ranking. Quindi è probabile che a molte pagine venga dato un rank tale da non farle visualizzare. È anche per questo che esiste il motore di ricerca interno (quando è attivo). --[[Utente:Iron Bishop|`IB ...]] 21:40, Nov 1, 2004 (UTC)

Salve, mi inserisco nella discussione (sebbene sia un perfetto ignorante del campo) perché ho notato la stessa cosa con l'articolo numero di Mach. Se faccio questa ricerca su Google trovo tutte (!) le pagine che linkano a numero di Mach, e perfino Mach (aeronautica) e il 'disambigua' Mach. E' un problema di maiuscole o di 'aggiornamento'?
Bye. Retaggio 14:01, Nov 3, 2004 (UTC)

Dopo la discussione qui sopra e dopo aver visto quali pagine risultano non indicizzate da google, credo che la possibilità che sia un problema di maiuscole sia poco probabile, visto che ci sono moltissimi articoli con una parola sola.
Tuttavia, annuncio, ora in google la pagina codice Morse è indicizzata, quindi o è stato il mio redirect (improbabile), o una coincidenza (dopo sei mesi proprio ora :)), oppure l'averne parlato qui ha destato l'attenzione del ragnetto :) --lukius 17:05, Nov 3, 2004 (UTC)

P.S. vorrei segnalare che la pagina "Codice Morse" appena indicizzata, si è piazzata in nona posizione sulle ricerche in Google con la chiave "codice morse", su quasi 3000 risposte. Non c'è male wikipedia ;) --lukius 17:09, Nov 3, 2004 (UTC)

Una breve occhiata [5] ci assicura che anche il numero di Mach è indicizzato. Dato che un po' lo faccio anche di lavoro, se trovate altri casi eclatanti scrivetemelo in qualche modo, può sempre essere utile per affinare qualcosa :) Ciao, Matteo (scrivimi) 12:36, Nov 10, 2004 (UTC)

Sono 'piacevolmente' sorpreso... La pagina numero di Mach in Google si trova al 'secondo posto' su circa 18800 risposte... Mamma mia... Che forza wikipedia! Bye. Retaggio 12:52, Nov 10, 2004 (UTC)

Che forza la wiki! :D Comunque le pagine non indicizzate sono ora più di 40.000, la prima volta erano 29000. Non so se il ragnetto ha trovato altre 10.000 pagine da indicizzare inidizzando le altre, o se alcune pagine dopo un tot periodo di tempo vengono "de-indicizzate" e messe in coda per l'aggiornamento. Boh! Per Numero di Mach la pagina era abbastanza recente (1 ottobre) e quindi mi riesce facile immaginare che il ragno non sia mai passato, ma per Codice Morse erano sei mesi, e questo mi lascia un po' più perplesso. --lukius 12:59, Nov 10, 2004 (UTC)