Ce travail présente une vue générale sur le web sémantique et ses moteurs de recherche qui présentent les nouveaux outils pour les TICE. Le fonctionnement du web sémantique intègre au web actuel la possibilité d’agréger plusieurs données liées entre elles : soit « sémantiquement », soit par des attributs qui les déterminent. Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C.
1. Introduction
Le web sémantique se considère comme un vaste laboratoire de recherche permettant le développement des langages pour un traitement intelligent des données afin d’en faciliter l’échange. De ce fait le web sémantique pourra fournir des services plus achevés à ses utilisateurs, le fait de trouver l’information pertinente, la sélectionner et la réutiliser d’une manière flexible est important pour les chercheurs de l’information. D’après ces raisons, le web sémantique est regardé parmi les nouveaux outils pour les technologies de l’information et de la communication pour l’enseignement (TICE).
Toute phrase écrite comporte une syntaxe qui représente des signes utilisés et une sémantique qui est le sens véhiculé. Le Web, dans son état actuel, est syntaxique: les actuels moteurs de recherche veillent à trouver l’information recherchée grâce aux signes qui les composent. Le web n’aurait pas pu se développer sans les moteurs de recherche, qui, pour beaucoup d’internautes, en constituent l’unique point d’entrée. L’enjeu est de trouver l’information recherchée par le sens qu’elle véhicule. C’est l’objectif de web sémantique, techniquement appelé « le Web de données ».
Avec le web sémantique, l’internet devient intelligent, comprend le sens de l’information et progresse dans cet apprentissage. Cela implique l’utilisation de nouvelles technologies de balisage des documents, afin de rendre leur structure plus intelligible par l’homme et la machine. L’idée du web sémantique est de fournir aux machines des données qu’elles pourraient comprendre et à partir desquelles elles pourraient tirer de nouvelles connaissances.
On peut distinguer entre l’actuel web et le web de demain ; le web sémantique ; par le fait que le premier est sous forme d’un ensemble de documents basés spécialement sur HTML, la recherche de l’information se passe par les mots clé et il est utilisé par l’être humain. Le deuxième type est tout à fait différent et plus développé par rapport au web classique. En fait il s’agit d’un ensemble de connaissances qui sont basées essentiellement sur XML et RDF, la recherche s’effectue par concepts (ontologie) et c’est que la machine qui traite l’information.
2. Présentation de web sémantique
2.1 Architecture du web sémantique
L’architecture de web sémantique peut être divisée en trois niveaux. Un niveau de nommage et adressage représenté par la couche la plus basse. Le niveau syntaxique représenté via la deuxième couche XML, le reste des couches représente le niveau sémantique.
Les prochains paragraphes vont expliquer les différentes technologies utilisées par le web sémantique.
2.2 Technologies du web sémantique
2.2.1 RDF
Il existe plusieurs types de technologies dans le domaine du Web sémantique dont le RDF représente la base. Toutes les technologies existantes du Web sémantique tournent autour de ce langage. C’est un modèle de données pour les objets et exprime leurs relations. Ce modèle est formellement défini par un triplet (sujet, prédicat, objet). Le sujet représente une ressource. Un prédicat est une propriété qui fait une liaison entre un sujet et un objet. Ce dernier est une ressource ou un littéral [1].
Une ressource est plus proche d’un objet dans un langage de programmation. A titre d’exemple, une personne serait une ressource, mais le nom de la personne serait un littéral. Chaque triplet est représenté sous forme d’un arc orienté. Sa source est le sujet, sa destination est l’objet et le prédicat est la liaison entre la source et la destination. Par exemple, la déclaration “Paris is in France” peut être représentée sous forme d’un arc orienté comme montre la figure suivante.
Toute ressource a un URI qui identifie la ressource d’une manière unique.
2.2.2 OWL : Ontologie
Pour créer des données en RDF, on utilise principalement ce que l’on appelle une ontologie. Ce mot provient de la philosophie, Il s’intéresse à l’étude de la nature de l’existence. En informatique, ce mot a pris une signification différente : Une ontologie est un ensemble structuré et formel de concepts permettant de donner un sens aux informations. OWL : langage permettant de créer des ontologies, vocabulaires plus complexes servant de support aux traitements logiques (inférences, classification automatique…).
On écrit une ontologie principalement en OWL, l’un des langages développés et normés par le W3C. Il en existe un autre, RDFS : Ressource Description Framework Schema, aussi normé et développé par le W3C, mais moins évolué que OWL.
2.2.3 SPARQL
Il y a aussi SPARQL : qui est un langage permettant d’effectuer des requêtes sur un graphe RDF. Grâce à lui, on accède aux données du Web des données. Cela signifie qu’en théorie, on pourrait accéder à toutes les données du Web avec ce standard.
3 Exemple d’application WS
3.3.1 Protégé :
Protégé est un éditeur qui permet de construire une ontologie pour un domaine donné, de définir des formulaires d’entrée de données, et d’acquérir des données à l’aide de ces formulaires sous forme d’instances de cette ontologie. Protégé est également une librairie Java qui peut être étendue pour créer de véritables applications à bases de connaissances en utilisant un moteur d’inférence pour raisonner et déduire de nouveaux faits par application de règles d’inférence aux instances de l’ontologie et à l’ontologie elle même (méta-raisonnement) [2].
3.2 Mondeca
Mondeca est un éditeur de logiciel spécialisé dans les technologies du web sémantique (Web 3.0). Mises en œuvre par des éditeurs, activités de santé, industries, centres de recherche, les solutions Mondeca permettent la gestion de référentiels métiers, terminologies, taxonomies, bases de connaissances et ontologies ainsi que l’agrégation et l’annotation sémantique des contenus et leur mise à disposition au sein de portail sémantiques.
4 . Les moteurs de recherche classiques
Il est vrai que les moteurs de recherche à base de mot clé jouent un rôle primordial pour l’immense succès connu par le web, pourtant ils ont des limites dans certaines utilisations [3].
4.1 Limites des moteurs de recherche à base de mot clé.
Ces moteurs de recherche extrait un grand nombre d’informations sur le web, mais avec une faible précision. Le chercheur de l’information est obligé d’ouvrir plusieurs pages web dans la majorité des cas pour les lire afin d’avoir l’information recherchée, donc l’intervention humaine dans ce cas est indispensable pour l’interprétation et la combinaison des résultats. En outre les résultats sont très sensibles au vocabulaire.
4.2 Les moteurs de recherche sémantiques
La recherche sémantique a pour objectif d’améliorer la précision de recherche par la compréhension de l’objectif de recherche et la signification contextuelle des termes tels qu’ils apparaissent dans l’espace de données recherché, que ce soit sur le Web ou dans un système fermé, afin de générer des résultats plus pertinents. L’auteur Seth Grimes listes les « 11 approches qui lie la sémantique à la recherche1« , et Hildebrand et al.2 donnent un aperçu qui liste les systèmes de recherche sémantique et identifie d’autres utilisations de la sémantique dans le processus de recherche.
Guha et Rob McCool distinguent deux formes principales de recherche: la navigation et la recherche. Dans la recherche par navigation, l’utilisateur utilise le moteur de recherche comme outil de navigation pour trouver le document ciblé. La Recherche sémantique n’est pas applicable aux recherches par navigation. Dans la recherche sémantique, l’utilisateur fournit au moteur de recherche une phrase qui est destinée à désigner un objet sur lequel l’utilisateur tente de recueillir de l’information et de recherche. Il n’y a pas de document particulier que l’utilisateur connait à ce sujet. Au contraire, l’utilisateur tente de localiser un certain nombre de documents qui, ensemble, lui donner les informations qu’il essaie de trouver. La Recherche sémantique se prête bien ici.
5 .Conclusion
Cet article présente une vue générale sur le web sémantique, ses objectifs ainsi des moteurs de recherche qui utilisent effectivement la sémantique. L’enjeu primordial des moteurs de recherches est d’offrir un meilleur service à l’utilisateur et ceci grâce à l’évolution du Web Sémantique ainsi qu’aux différentes technologies qui servent à améliorer les interactions et les interfaces utilisateurs.
Retrouvez toutes les vidéos et communications en ligne sur notre page « plateau TV » ici
Retrouvez toutes les communications écrites et les photos d’Educatank Forum 2014 ici