Think Pragmatic!

Rubber ducking about stuff.

Yahoo! Microsearch

Scritto il 25/03/2008 da Alessandro Martin.    

Da qualche mese Yahoo! ha lanciato Yahoo! Microsearch un sistema di ricerca, in versione beta, in grado di combinare i risultati tradizionali con i metadati estratti dalle pagine web. Tradizionalmente, senza entrare troppo nel dettaglio, gli algoritmi di data mining utilizzati dai motori di ricerca si basano su un principio tutto sommato simile: i contenuti rilevati a seguito di una scansione del web vengono indicizzati, pesati e categorizzati tenendo conto di una numerosa serie di fattori (traffico, link in entrata, unicità dei testi, ecc…). Si tratta dunque di un processo estremamente dinamico perché influenzato da molti fattori interni ed esterni al sito, ed estremamente complesso perché basato su una enorme mole di documenti molto poco strutturati. Con il diffondersi dell’idea del Web Semantico, ha preso piede anche la consapevolezza che, se si vuole ottenere di più dal Web, è necessario a pensare a come le informazioni presenti nelle pagine web possono essere rese più facilmente disponibili ad una elaborazione automatica. Ciò è possibile attraverso una più rigida strutturazione dei documenti associata all’uso di metadati che rendano i contenuti comprensibili anche alle macchine. Il problema problema è stato affrontato secondo approcci differenti e con confortanti segnali di successo come nel caso dei Microformats. Ciò che mancava era lo stimolo di un big player che dimostrasse le potenzialità dell’inserimento di metadati nelle pagine web presentandolo non come un sostituto dei normali sistemi di information retrieval ma piuttosto come un loro prezioso complemento.

Yahoo!, nonostante le ben note difficoltà economiche, è riuscita ha mostrare che il Web Semantico è dietro l’angolo e può essere costruito passo dopo passo. Cerchiamo però, come al solito, di essere pratici e di vedere cosa offre concretamente questo nuovo servizio sperimentale. Il risultato di una ricerca su Yahoo! Microsearch è una combinazione di risultati tradizionali e di informazioni estratte dal parsing di dati espressi conMicroformats, RDF e RDFa. Dei Microformats ho già parlato diverse volte, mentre dedicherò a RDF e RDFa un post più approfondito in futuro. Quello che qui mi interessa sottolineare è che il valore aggiunto dal nuovo servizio di Yahoo! non sta tanto nell’estrazione di dati strutturati da pagine web, cosa di per se relativamente semplice, quanto piuttosto nell’idea che tali dati possano essere messi in relazione fra loro e presentati all’utente sotto forma di:

  • Smart Snippets, ovvero brevi descrizioni che non siano solo frammenti di testo estratti da un documento sul web ma piuttosto una combinazione delle informazioni disponibili circa l’oggetto della ricerca che forniscano all’utente materiale (es. indirizzo e numero di telefono) sulla base del quale poter intraprendere delle azioni (es. telefonare) senza essere costretti a visitare la pagina.
  • Mappe, timeline e altre rappresentazioni visuali che aggreghino informazioni provenienti da più risorse sul web.

Dato che un esempio vale più di molte parole consiglio di provare una ricerca con i termini Ivan Herman su Yahoo! Microsearch e su un altro motore di ricerca per toccare con mano come può cambiare una SERP nel lungo viaggio verso il Web Semantico.

Fra le altre cose si può notare come l’idea di fornire come risultato di una query dati che possono essere usati subito per soddisfare i propri bisogni informativi è indicativa di almeno due tendenze diverse: da un lato ci si avvicina verso la visione di T. Berners Lee del motore di ricerca come agente informativo sempre più ricco ed intelligente, dall’altro si va verso strategie che tendono a rendere il motore di ricerca sempre più spesso luogo di destinazione e non più solo punto di partenza per la navigazione dell’utente, come segnala Marco Loguercio nel suo post sul SES di New York.

microformats semantic web SEO Yahoo!