Nuove guide e bozze

Discussioni relative alla Gestione del wiki Guide@Debianizzati.Org
MadameZou

Re: Nuove guide e bozze

Messaggio da MadameZou »

Ok, non so cosa succeda a voi, ma io quando digito nella search box swap e invece di dare Invio da tastiera, premo il pulsante Vai arrivo alla pagina di Glossario sullo swap, se invece premo il pulsante ricerca mi restituisce come secondo risultato della ricerca la guida di stampante "Utilizzare un file come swap"

Quanto alla guida di Risca su LVM invece, usando come stringa di ricerca LVM che effettivamente è la prima parola del titolo, non si ottengono risultati né con una né con l'altra delle opzioni (Vai o Ricerca). La guida è rintracciata correttamente invece se si cerca inserendo la stringa logical volume.
Potrebbe aver ragione Ferdy, sul numero di lettere. Ma...se si prova a cercare la parola apt, premendo Vai si raggiunge correttamente la pagina di glossario dedicata ad apt. La cosa strana è che inserendo la stessa parola (sia tutto maiuscolo che tutto minuscolo, nel caso fosse case sensitive) e premendo Ricerca, non si ottiene alcun risultato. Ora è ovvio che il termine apt è presente in almeno il 90% delle guide del nostro wiki, per non parlare di numerosissimi titoli.

Ora vado a leggermi il FM di Mediawiki. Stay tuned.
Avatar utente
ferdybassi
Administrator
Administrator
Messaggi: 3317
Iscritto il: 28/12/2006, 4:22
Località: S. Angelo Lodigiano (LO)

Re: Nuove guide e bozze

Messaggio da ferdybassi »

MadameZou ha scritto: Ok, non so cosa succeda a voi, ma io quando digito nella search box swap e invece di dare Invio da tastiera, premo il pulsante Vai arrivo alla pagina di Glossario sullo swap, se invece premo il pulsante ricerca mi restituisce come secondo risultato della ricerca la guida di stampante "Utilizzare un file come swap"
Confermo. Premere Invio corrisponde al pulsante Vai.
Quanto alla guida di Risca su LVM invece, usando come stringa di ricerca LVM che effettivamente è la prima parola del titolo, non si ottengono risultati né con una né con l'altra delle opzioni (Vai o Ricerca).
...
se si prova a cercare la parola apt, premendo Vai si raggiunge correttamente la pagina di glossario dedicata ad apt. La cosa strana è che inserendo la stessa parola (sia tutto maiuscolo che tutto minuscolo, nel caso fosse case sensitive) e premendo Ricerca, non si ottiene alcun risultato.
Questo farebbe supporre che non vengono ricercate parole più corte di quattro caratteri...

Ciao ciao
mm-barabba

Re: Nuove guide e bozze

Messaggio da mm-barabba »

Di mediawiki ho sempre odiato la funzione cerca .

:mad:
MadameZou

Re: Nuove guide e bozze

Messaggio da MadameZou »

Dunque, mi sembra di aver fatto un minimo di luce sulla questione della funzione di ricerca. E di avere anche qualche proposta e/o soluzione in merito.

Una piccola premessa per chi, come me fino a due giorni fa  :wink:, non si intendesse di questi argomenti ma fosse comunque curioso di leggere gli esiti di questa piccola indagine. I guru non storcano la bocca: la faccio facile ...perché difficile non so farla! :p
Tutti i dati contenuti nel wiki (ma anche in un normalissimo sito web) vengono gestiti tramite un database che li organizza in vario modo sotto forma di tabelle, vari programmi poi interagiscono con questo database (usando un linguaggio e una sintassi specifica) per accedere a tali dati. Il database usato da Mediawiki è MySQL.
Il motore di ricerca di default in un'installazione base di Mediawiki ( mi riferisco ovviamente al caso in cui non vengano utilizzate extension particolari relative alla funzione cerca, cosa che accade, ad esempio, nel caso di Wikipedia e Wikimedia) si basa semplicemente sul search backend di MySql.
Ciò significa che l'utente immette la stringa di ricerca nel form, il sito invia la richiesta al database MySQL che restituisce il risultato in base alle regole stabilite nei suoi file di configurazione. La ricerca è una chiamata come un'altra al database, e non interviene un'applicazione particolare a rendere più sofisticata la funzione di ricerca.
Spero di non aver scritto castronerie, ma mi pare di aver capito che la cosa funziona così.
Il tipo di ricerca utilizzata nel caso di specie da MySql è una Full-text Search (per approfondimenti sulla ricerca Full-text vedi: qui),

Tra le caratteristiche principali del search backend di MySql (a meno di personalizzazioni da parte dell'amministratore) sono:
- Lunghezza minima della stringa di ricerca:  come aveva già intuito ferdybassi, il motore di ricerca interno considera nulle le richieste per parole di lunghezza inferiore a 4 caratteri;

-Ricerca nulla per un preciso elenco di stopword: le stopword sono parole generiche ed estremamente comuni, nella lingua inglese, che non restituiranno alcun risultato (per un elenco delle stopword in un'installazione di default di Mediawiki senza personalizzazione del backend di MySql per la ricerca, si veda qui

(per una lista completa delle caratteristiche della ricerca full-text in MySql vedi qui; poi però bisogna valutare quali di queste funzioni è stata resa disponibile all'utente su Mediawiki.)

Ora il punto è che il nostro wiki, come potete vedere da questa pagina si trova alla versione di Mediawiki 1.11.2 e di MySql 5.0.51a-24. Questo è un dato importante perché come potete vedere da questa pagina a partire dalle versioni successive di Mediawiki ci sono stati dei cambiamenti sul modo di gestire la ricerca via MySql, in particolare:

- Limite di lunghezza delle parole nella stringa di ricerca ---> eliminato con la versione di Mediawiki 1.14 (ora si possono ricercare parole con numero di caratteri inferiore a 4)

- Uso di wildcard in particolare l'asterisco,( ad esempio: foo*) ---> reso possibile a partire da Mediawiki 1.12
- Esclusione di alcune parole dalla ricerca (ad esempio: -foo) ---> reso possibile a partire da Mediawiki 1.12

Evidentemente il punto riguarda non tanto la ricerca fulltext di MySql, quanto piuttosto il modo in cui viene implementata in Mediawiki attraverso il motore di ricerca di default che è misto MySql/php. Per spiegare meglio questo mi sembra corretto linkarvi questo bell'articolo che spiega come creare un motore di ricerca basato su MySql (e la sua ricerca fulltext) e php: http://php.html.it/articoli/leggi/898/un-motore-di-ricerca-in-php-e-mysql/.

Questo mi porta alla conclusione che le strade da seguire per migliorare la funzione di ricerca nel wiki siano:

- Aggiornare la versione di Mediawiki;
- Installare una extension per potenziare la ricerca: ce ne sono di interessanti anche per wiki non enormi, come il nostro

Personalmente credo che sia più saggia la seconda soluzione, perché effettivamente non so cosa comporti, in termini di rischi di perdita di dati, un aggiornamento di versione nel caso del wiki.
Ovviamente ne parlerò agli admins.

ps: un ultima chicca per voi, trovata scartabellando questi link sui motori di ricerca interni: http://www.searchtools.com/index.html non ho ancora avuto il tempo di esaminarlo a fondo, ma sembra un sito interessante e ben fatto per chi voglia capire i motori di ricerca interni ai siti. E magari costruirsene uno proprio anziché affidarsi al solito google. :wink:
Avatar utente
pmate
Hero Member
Hero Member
Messaggi: 3625
Iscritto il: 11/12/2007, 23:41
Contatta:

Re: Nuove guide e bozze

Messaggio da pmate »

MadameZou ha scritto: ps: un ultima chicca per voi, trovata scartabellando questi link sui motori di ricerca interni: http://www.searchtools.com/index.html non ho ancora avuto il tempo di esaminarlo a fondo, ma sembra un sito interessante e ben fatto per chi voglia capire i motori di ricerca interni ai siti. E magari costruirsene uno proprio anziché affidarsi al solito google. :wink:
Segnalo anche nutch capace di fare non solo "Intranet-Crawling" ma anche "Whole-Web Crawling".  :wink:
Nota: software rilasciato sotto Apache license e quindi incompatibile con la GPL.
A tal proposito la FSF dice:
In ogni caso non esiste una ragione per evitare di utilizzare programmi rilasciati sotto questa licenza, come ad esempio il server web Apache.
Detto questo, MadameZou... K+ ma grande come un palazzo!
Bellissimo post, frutto di ricerche precise e pieno di tanti spunti interessanti che sarà piacevolissimo approfondire.

Complimenti davvero!


pmate
Unix E' user friendly... E' solo selettivo su chi può essergli amico... (Tollef Fog Heen)

Immagine
MadameZou

Re: Nuove guide e bozze

Messaggio da MadameZou »

Wow, thanks pmate!  :biggrin:
Avatar utente
Risca
wiki member
wiki member
Messaggi: 2011
Iscritto il: 09/02/2009, 11:37
Località: Torino-Milano
Contatta:

Re: Nuove guide e bozze

Messaggio da Risca »

Complimenti MadameZou! Hai svolto proprio un ottimo lavoro, preciso e chiaro.
K+ anche da parte mia...
Rispondi