p5rn7vb

Posts Tagged “web semantico”

DBpedia è attualmente uno dei più importanti progetti legati al Web semantico, di cui oggi parliamo proprio per capire come internet stia evolvendo verso una dimensione più intelligente, basata sui dati collegati tra loro in modo strutturato (“Linked Open Data“).

Il progetto DBpedia consiste nella trasposizione in dati strutturati di tutto l’enorme patrimonio di conoscenze di Wikipedia, in modo che tali dati siano collegabili ad altri insiemi di dati ed utilizzabili in modo automatico dalle applicazioni. DBpedia è considerata da Tim Berners Lee (l’inventore del Web) come una delle parti più importanti proprio del progetto Linked Data, basato su RDF, il formato standard del Web semantico.

In parole povere, il formato RDF permette di “dare senso” alle informazioni, suddividendole in unità minime (“statement”), dette “triple”, ciascuna definita da 3 elementi(soggetto – predicato – oggetto) che consentono di creare relazioni con altre informazioni. Il soggetto è una risorsa, il predicato è una proprietà e l’oggetto è un valore (e quindi anche il puntamento  ad un’altra risorsa). Un esempio di tripla è ”Umberto_Eco” “è_autore_di” “Il_nome-della_rosa”.

Lo stato dell’arte di DBpedia è il seguente: a settembre 2011 (ultimi dati disponibili) comprendeva più di 3.64 milioni di elementi, 1.83 milioni dei quali classificati in un’ontologia consistente, incluse 416.,000 persone, 526.000 luoghi, 106.000 album musicali, 60.000 film, 17.500 videogiochi, 169.000 organizzazioni, 183.000 specie animali e 5.400 patologie. Il tutto in 97 lingue e con link a 6,2 milioni di link ad altri dataset. Questi ultimi comprendono, tra gli altri,  GeoNames (il database con oltre 10 milioni di nomi geografici), il Progetto Gutenberg (una biblioteca con i testi dei libri di pubblico dominio), Musicbrainz (enciclopedia della musica), il CIA World Fact Book, eccetera, oltre a numerosi dataset ontologici che consentono di creare correlazioni tra i vari domini di conoscenza. Tutto in licenza Creative Commons.

Anche in Italia, naturalmente, sta crescendo DBpedia, con oltre 1 milione di entità estratte da Wikipedia in lingua italiana e nell’ambito del progetto Linked Open Data Italia. Quest’ultimo comprende, per ora, qualche dataset di un certo rilievo, come Dati.camera.itMusei Italiani e Scuole Italiane.

Link utili e altre informazioni su questo argomento

Comments No Comments »

Schema.org è un’iniziativa congiunta di Google, Microsoft e Yahoo! – ai quali si è poi aggiunto Yandex, il maggiore motore di ricerca russo – per consentire ai webmaster di creare contenuti strutturati, e perciò più facilmente individuabili dai motori di ricerca, grazie ad uno schema predefinito. Tale schema apre le porte ad un vero Web semantico, nel quale sia possibile collocare informazioni, concetti e persino oggetti  (internet delle cose) riconoscibili per quello che realmente sono. La tassonomia proposta è organizzata a partire da 7 grandi gruppi di contenuti: opere dell’ingegno, eventi, cose immateriali, organizzazioni, persone, luoghi, prodotti.

Schema.org si basa sui Microdata, un set di specifiche HTML5 proposto non dal W3C, ma dal WHATWG, un gruppo di lavoro indipendente fondato da Apple, Mozilla e Opera. I Microdata consentono di inserire descrizioni di tipo semantico all’interno del codice HTML, che poi i motori di ricerca possono interpretare. Chi gestisce i contenuti del sito, può associare ad ogni “oggetto” tutti i metadati che vuole, utilizzando il vocabolario proposto da Schema.org. Ma è anche un bel po’ di lavoro in più da fare!

Secondo alcuni commentatori, Schema.org rappresenta un bel passo avanti verso il Web semantico, estendendo il principio di “URI” (l’indirizzo che identifica univocamente un oggetto presente in internet) dai soli documenti messi on line a concetti o entità astratte del mondo reale. Facebook lo aveva già fatto con l’introduzione di OpenGraph e del Like. Secondo i critici, invece, Schema.org rappresenta una mossa di Google proprio per contrastare Facebook, snobbando peraltro il formato RDF (col quale i Microdata sono in concorrenza), sostenuto dal W3C e sul quale si basa, ad esempio, tutta la gestione degli Open Data.

Link utili su questo argomento ed esempio di applicazione

Comments No Comments »

Oltre a tante nuove caratteristiche, che cominciano e rendere il web molto più interattivo, l’arrivo di HTML5 ci porta 30 nuovi elementi per “marcare” documenti e applicazioni, in modo da rendere più comprensibili i contenuti delle pagine alle macchine stesse e migliorare l’accessibilità, la cercabilità, l’internazionalizzazione e l‘interoperabilità dei nostri siti.

Il sito Smashing Magazine ci offre un’interessante panoramica dei nuovi elementi HTML5 che rendono più semantica una pagina web. Alcuni elementi di pura presentazione (come center, font e big) non sono più validi, mentre altri (come small) sono stati ridefiniti per renderli semantici. Altri ancora (come source e track) servono a definire i contenuti di audio e video. Poi ci sono quelli che definiscono le parti di una pagina web (come header, footer, nav, section, article, aside). La regola che vale per tutti è la “graceful degradation“, cioè il fatto che le nuove caratteristiche sono comunque utilizzabili anche nei browser più vecchi.

Link utili su questo argomento

Comments No Comments »