MasterNewMedia Italia
Scopri i migliori tool per comunicare,
collaborare e fare marketing
   
Curated by: Luigi Canali De Rossi
 


17 giugno 2008

La Ricerca Semantica Incontra I Contenuti Online: E' Arrivato Powerset

Un nuovo motore di ricerca focalizzato sulla scoperta di nuovi contenuti è stato recentemente inaugurato e reso accessibile a tutti online. Si chiama Powerset e promette di perfezionare l'intero processo di ricerca permettendo a te, come utente, di condurre le tue indagini online attraverso l'utilizzo di singole keyword, di intere frasi o di semplici domande. La pagina con i risultati della ricerca di Powerset visualizza l'esito della ricerca aggregando informazioni un bel numero di fonti, ma mettendo sempre in risalto i contenuti più rilevanti trovati su Wikipedia.

search-engine-powerset-home-page-485.jpg

"L'obbiettivo di Powerset è quello di cambiare il modo in cui le persone interagiscono con la tecnologia, cercando di dare ai computer la capacità di comprendere il nostro linguaggio. ...Powerset effettua la ricerca processando in primo luogo il linguaggio naturale, con lo scopo di migliorare la nostra capacità di reperire le informazioni rendendo esplicito il significato del nostro linguaggio ordinario."
(Fonte: Powerset)

In questo articolo John Blossom, esperto di media e di contenuti business, analizza questa nuova presenza nel mercato dei motori di ricerca.

 

powerset-sg-740748.gif




Powerset: La Ricerca Semantica Incontra i Contenuti Online

di John Blossom

Ci sono cervelloni e cervelloni, ma un caso a parte è sicuramente quello di Barney Pell, a lungo esperto di start-up nella Silicon Valley e attualmente fondatore e Chief Technology Officer di Powerset. Barney è una di quelle rare persone che sono state geniali sia alla NASA che nell'industria dei software, con una prospettiva di carriera che gli ha permesso di radunare vari team di lavoro nel corso degli anni, riuscendo a sviluppare tecnologie molto avanzate per la ricerca sul linguaggio naturale.




Uno Sguardo di Insieme Alla Ricerca Con Powerset

Powerset ha di recente svelato i primi risultati ottenuti dallo studio di una nuova tecnologia che fornisce contenuti di qualità per la ricerca semantica: un interessante punto di vista su come si possano concepire forme completamente nuove di contenuto per il mercato attraverso le tecnologie di ricerca più avanzate.

Sfruttando in primo luogo le risorse di Wikipedia per i contenuti, la tecnologia di Powerset analizza frasi di senso compiuto per fornire risultati di ricerca che siano adeguati sia per domande espresse nel linguaggio naturale che per semplici keyword.




La Prova su Strada di Powerset

La tecnologia di cui parliamo si trova ancora a uno stadio preliminare e alcuni target per la ricerca funzionano meglio di altri: ma in generale direi che si tratta di una tecnologia che lavora al meglio con gli oggetti e con i nomi di persona piuttosto che con i concetti.

Se digiti ad esempio "Who is Bill Gates?" ottieni una schermata simile a quella che ho catturato e che trovi all'inizio di questo articolo e che comprende un riquadro in alto con le informazioni biografiche raccolte dal database di Freebase, seguite dai risultati dell'analisi semantica di Powerset ovvero i "Factz", che focalizzano meglio il contenuto dei vari articoli di Wikipedia sul personaggio. Uno di questi "Factz" ti dice ad esempio che Gates ha dato una testimonianza in tribunale, tenuto un discorso, reso pubblico un indirizzo, una demo, una presentazione e una deposizione. Cliccando su uno qualunque di questi termini ottieni maggiori dettagli dall'articolo corrispondente.

Sotto la biografia iniziale e sotto i "Factz" compaiono i risultati della ricerca di partenza, compreso l'articolo che corrisponde meglio a Bill Gates come fondatore della Microsoft, cioè in pratica l'articolo di base di Wikipedia sull'argomento con i relativi link alla versione di Powerset dello stesso contenuto. Accanto sulla destra trovi una comoda presentazione visuale dell'outline dell'articolo oppure un'altra lista di "Factz" da tenere in primo piano. Mi piacciono in particolare alcune delle inferenze che emergono dalla definizione di contenuto di Wikipedia, a cui ho contribuito qualche tempo fa: "information provides value; experiences provide value; content provides value." Cioè: l'informazione fornisce valore; l'esperienza fornisce valore; il contenuto fornisce valore. Piuttosto vero.

Mi piace come Powerset affianchi risultati di ricerca organici ai contenuti federati, dando il suo meglio su argomenti molto ben definiti e fornendoti così le migliori informazioni in modo rapido ed efficace.

Tuttavia i "Factz", che sono generati automaticamente, incontrano lo stesso problema di molti altri strumenti semantici nel momento in cui analizzano basi molto piccole di dati: l'inadeguatezza delle inferenze. Ad esempio nei "Factz" su Bill Gates Powerset deduce che è il fondatore di Cher: un'inferenza derivata dal fatto che il biografo Howard Johns era noto per rivelare spesso gli indirizzi delle celebrità. Tra queste appunto "Cher & Microsoft co-founder Bill Gates". Hmm. Non credo che prenderò nota di questa informazione.

Non mi fanno impazzire neanche i risultati di ricerca organici, che tendono a fare errori in termini di ricerca prossimale (word proximity).

Con una base di dati relativamente ridotta come quella di Wikipedia non è sempre facile indirizzare al meglio l'analisi dei contenuti come avviene con i testi nei motori di ricerca.




Il Quadro Generale

Il quadro generale in questi primi giorni dal rilascio di Powerset dimostra come alcune fonti di contenuto possano essere trasformate in forme completamente nuove, e questo grazie alle nuove tecnologie federate per la ricerca.

Spesso in questi giorni paragono le tecnologie per la ricerca a quelle per i feed dei dati, ma in questo caso è importante rendersi conto che si tratta in realtà di una tecnologia completa nel processo di pubblicazione dei contenuti, che possono infatti essere aggregati, filtrati e organizzati in modalità del tutto nuove che accrescono il valore delle stesse pubblicazioni.

Con l'uso dei contenuti liberi di Wikipedia e di Freebase la tecnologia di Powerset si dimostra efficace nell'illustrare in modo semplice questo concetto, anche se con alcune pecche iniziali.




Consigli Strategici Per i Publisher Online



I publisher
che intendono rimanere in prima linea sul fronte del mercato dei contenuti si stanno rivolgendo in massa a queste nuove tecnologie federate, cercando di trovare una soluzione che aggiunga valore ai prodotti già esistenti; ci aspettiamo allora di sentire parlare ancora molto di tecnologie come Powerset che possono svolgere questo compito in tempi rapidi.

 
 
 
 
 
Commenti    
blog comments powered by Disqus

 

 

 

 

9432
 




 

I Toolkit di Robin


 









 

 

 

 

  • RSS Feed

          Mail
    Nome:
    Email:
     



     
     

     

    Web Analytics