Web Semantico, cos'è e come nasce?

Indice degli argomenti

1 Web Semantico: cos’è e come nasce?
2 Un problema di semantica
3 Lo sviluppo del Web Semantico
4 La struttura del Web Semantico
- 4.1 Lo strato di base
- 4.2 Il core e la semantica
5 Il linguaggio SPARQL (Simple Protocol And RDF Query Language)
6 Il top del Web Semantico: lo strato finale
7 Crypto e User Interface & Applications: il top della struttura

Web Semantico: cos’è e come nasce?

Nell’era di internet il linguaggio è diventato sempre più complesso: termini neo-nati si accompagnano a vecchie parole che vengono tuttavia utilizzate per definire nuovi significati. Oltre alla nuova terminologia, internet è stato in grado di rivoluzionare la possibilità di passare da un testo ad un altro grazie ai link, che permettono di cliccare su una parola per essere catapultati su altre pagine che ne possono spiegare il significato, dare informazioni, illustrarne l’uso e molto altro ancora. La complessità del Web, quindi, non sta solo nelle grandi e numerose informazioni che vi si trovano, ma soprattutto nell’associazione tra tutte le differenti informazioni, collegate tra di loro grazie ad associazioni, link, parole chiave e molto altro.
Tutte queste associazioni sono rese possibile da una serie di algoritmi e programmi che hanno trasformato il Web da un contenitore in cui era abbastanza difficile trovare dei contenuti, ad un ambiente in cui ogni elemento pubblicato, sia esso un video, una foto o un documento, è facilmente trovabile grazie proprio alle associazioni tra informazioni e dati che permettono di rintracciare tutto quanto sia connesso ad un determinato argomento, parola o dato. Proprio questo nuovo modo di vivere il Web, nato a cavallo tra la fine del vecchio secolo e l’inizio del nuovo, è definito Web Semantico (Semantic Web nella definizione inglese originale).
Il Web Semantico nasce soprattutto come un’idea, una soluzione che Tim Berners-Lee, il fondatore del World Wide Web, ha voluto realizzare per migliorare la comunicazione tra utenti del Web e macchine. Il problema di base, infatti, è quello di rendere unico il linguaggio di richiesta e le risposte, ossia quanto viene richiesto dall’utente e quanto viene compreso dalla macchina.

Un problema di semantica

La semantica è una parte specifica del linguaggio che permette lo studio e quindi la comprensione del significato preciso delle parole o delle frasi. Quando si parla di Web Semantico, quindi, si parla di un Web in grado di comprendere in pieno quanto gli viene richiesto. I primi utilizzatori dei Web ricorderanno bene come fosse complesso effettuare ricerche, su come si dovessero scegliere con attenzione le parole chiave e di come i risultati non sempre corrispondevano a quanto realmente si stava cercando. Oggi, effettuare una ricerca in rete è molto più semplice: basta scrivere esattamente quello che si sta cercando per avere un elevato numero di risultati corrispondenti alle proprie necessità.
Bisogna tuttavia sottolineare che i motori di ricerca ad oggi sono altamente funzionali per quanto riguarda ricerche comuni, ma ancora non perfetti per una serie di argomenti e pagine. Molte pagine Web, infatti, pur esistendo in rete, non sono indicizzate, per cui vengono difficilmente reperite dai motori stessi. In altri casi, si possono verificare risultati non corrispondenti alle reali necessità dell’utente o, ancora, possono non essere trovate pagine che sarebbero utili all’utente. Se, quindi, rispetto al ventennio scorso il Web ha fatto passi da gigante, proprio grazie all’utilizzo del Web Semantico che permette la comprensione di quanto viene richiesto al motore di ricerca, dall’altro esistono ancora molti miglioramenti che bisogna fare per poter avere la certezza che la sintassi riportata e le necessità degli utenti coincidano al cento per cento. Proprio per questo motivo, quanti lavorano allo sviluppo del Web Semantico hanno come obiettivo quello di ottenere il massimo sviluppo e le massime possibilità dalle ricerche: si è alla ricerca, cioè, di un sempre maggiore miglioramento della comprensione da parte degli algoritmi di ricerca, in maniera da poter ricercare solo ed esclusivamente quanto richiesto dall’utente.

Lo sviluppo del Web Semantico

Chi studia e lavora con il Web Semantico sa bene che, per quanto giovane, questa scienza già prevede due fasi, una che può essere definita quella della nascita e che si è protratta fino al 2006 e un’altra, quella attuale, che dal 2006 ad oggi ha portato una serie di nuovi risultati. La prima fase ha visto lo sviluppo del Web Semantico tramite il così detto metodo sintetico o delle ontologie, mentre la seconda fase utilizza il metodo analitico, o dei linked data. Il cambiamento è stato necessario quando si è visto che non si riusciva più, utilizzando il solo metodo sintetico, a realizzare ricerche concrete ed intelligenti, ossia semanticamente connesse a quanto realmente richiesto dagli utenti. Lo scopo principale del Web Semantico, infatti, resta quello di permettere ai calcolatori di comprendere al meglio la semantica delle richieste dell’utente. Per questo motivo, è fondamentale che gli algoritmi di ricerca siano caratterizzati da tre elementi fondamentali:

organizzazione della conoscenza;
rappresentazione della conoscenza;
strumentazione per accedere alla conoscenza.

L’organizzazione della conoscenza permette di identificare e relazionare i diversi elementi utili alla ricerca. La rappresentazione della conoscenza è invece lo step che permette di descrivere i diversi dati, la strumentazione è invece data da una serie di programmi che possono comprendere, leggere ed operare su tutte le rappresentazioni trovate in rete. In realtà, quest’ultima fase, che prevederebbe una maggiore interazione con i sistemi di intelligenza artificiale, ancora non è stata ampiamente sviluppata per lasciare maggiore spazio alle prime due. Lo scopo principale di quanti stanno lavorando al miglioramento delle tecniche del Web Semantico, infatti, è quello di incrementare ancora di più la precisione e la comprensione delle richieste degli utenti. Oggi, per quanto le risposte fornite dai motori di ricerca siano sempre molto numerose, è spesso prassi comune dover visitare più pagine prima di poter trovare quello che realmente si sta cercando. Lo scopo finale del Web Semantico è invece quello di offrire all’utente non solo la risposta fredda derivante dalla ricerca effettuata sulle parole immesse nel motore di ricerca, ma anche quella di individuare, grazie a sistemi di intelligenza artificiale, le diverse necessità che ogni singolo individuo può avere nel momento in cui sta effettuando una determinata ricerca. Si tratta, al momento, di uno step non ancora raggiunto, ma non per questo irraggiungibile.

La struttura del Web Semantico

Struttura Web Semantico — Struttura del Web Semantico

Se può essere facile comprendere lo scopo del Web Semantico, la comprensione della sua struttura e delle stratificazioni dei livelli è sicuramente molto più complessa, ma non per questo incomprensibile. Per comprendere quali sono le tecnologie che vengono utilizzate per strutturare questo tipo di Web è necessario immaginare una serie di stratificazioni, tra le quali quelle intermedie rappresentano probabilmente quelle più complesse ed elaborate, sicuramente quelle più soggette a modifiche con lo sviluppo del Web Semantico stesso. Al momento gli strati possono essere suddivisi in tre principali raggruppamenti, strato base, core e strato finale, ognuno composto a sua volta da ulteriori strati. È importante comprendere che questa stratificazione può variare, con l’evolversi delle tecnologie del Web Semantico o con la necessità di variazioni della struttura.

Lo strato di base

Denominato URI/IRI, questo strato è, per così dire, un livello storico del Web, presenta ancor prima che si sviluppasse l’idea del Web Semantico. In questo strato vengono inserite le basi della comunicazione via Web, ossia le URL, che permettono di identificare i siti Web.

Il core e la semantica

XML(S), Namespace, RDF(S), OWL, SPARQL, RIF. La parte centrale della struttura del Web Semantico, come già detto, è probabilmente quella più importante, ma anche quella maggiormente soggetta a cambiamenti, aggiornamenti e variazioni. Il core è costituito da una serie di linguaggi che permettono la descrizione delle informazioni e, naturalmente, la strutturazione di dati e meta-dati.
Tra i linguaggi più noti vi è sicuramente l’XML (eXtensible Markup Language), che permette la modellizzazione di dati e l’attribuzione di significati. Proprio l’attribuzione del significato tramite l’XML permette di dare vita alla semantica, che viene poi maggiormente sviluppata nei linguaggi derivati, come l’RDF (Resource Description Framework) o l’OWL (Ontology Web Language). Va sottolineato che questi linguaggi non vanno confusi con l’HTML, per il quale vi è una maggiore difficoltà alla personalizzazione di tag e creazione libera e semantica di link.

Il linguaggio SPARQL (Simple Protocol And RDF Query Language)

Questo linguaggio, anch’esso parte del core della struttura del Web Semantico, rappresenta una delle innovazioni apportate con il passaggio dal Web ontologico a quello dei linked data. Rappresenta un linguaggio di interrogazione, specifico per l’RDF, con campi di applicazione ancora molto vasti e da scoprire. La connessione tra SPARQL e RDF è quella di un’interrogazione, ossia di estrazione di informazioni per una migliore indicizzazione e ricerca delle informazioni via Web.

Anche il RIF (Rule Interchange Format) è un elemento nuovo nella struttura del Web Semantico. Si tratta, infatti, di un format entrato ufficialmente in funzione nel 2010, con lo scopo di migliorare la produzione di metodi standard che permettano un migliore scambio di informazioni e regole sul Web. Lo scopo principale del RIF è quello di migliorare l’integrazione di dati specifici, siano essi personali, aziendali o pubblici, in maniera da migliorare le interazioni con il Web. In particolare, il RIF dovrebbe utilizzare determinate informazioni derivanti da precedenti ricerche e necessità dell’utente per garantire soluzioni quanto più vicine a quelle che realmente si stanno cercando.

Il top del Web Semantico: lo strato finale

Lo strato finale della struttura del Web Semantico è caratterizzato da elementi che, per molti versi, sono ancora in fase di sviluppo. Si tratta di strutture definite Unifying Logic, Proof e Trust. Questi tre elementi rappresentano il più importante raggruppamento della struttura del Web Semantico soprattutto perché sono i livelli sui quali si potranno incrementare gli sviluppi di una “collaborazione” tra Web Semantico e Intelligenza Artificiale. In particolare, il livello Trust ha, o meglio avrà, il compito di suddividere tutte le informazioni rilevate in base all’affidabilità ossia in base alla reale corrispondenza tra quanto digitato dall’utente e quanto trovato dalla macchina. Per assicurare una corretta validità delle risposte, il livello Proof effettua delle prove, in grado di stabilire l’affidabilità dei dati. Tali prove sono basate su deduzioni logiche, supportate dal livello Unifying Logic. Appare evidente come questi tre elementi del Web Semantico, per assicurare il pieno successo, dovranno fare uso di agenti intelligenti, in grado di supportare la ricerca e la fase di attendibilità della stessa.

Crypto e User Interface & Applications: il top della struttura

Se la base della struttura del Web Semantico è ben consolidata, il top risulta invece ancora in fase di elaborazione e definizione. Lo strato finale, ossia quello che definisce l’interfaccia tra utenti e macchine è ancora in stato di elaborazione, il che significa che il Web Semantico prevede ulteriori possibili sviluppi e miglioramenti quando verranno definiti al meglio le modalità e le tecniche che permettono un migliore utilizzo di ogni elemento strutturale di questa innovativa versione del Web Semantico.