A télécharger sur Archives ouvertes en sciences de l’Information et de la communication, la thèse que Jean Pierre Cahier à soutenue en décembre 2005 à l’université Technologique de Troyes : “Ontologies sémiotiques pour le Web socio sémantique”

Un gros pavé de 300 pages…


Leçons de choses : MONDECA blog

24 / 11/ 2006 Sylvie Le Bars - Arkandis

Voici une bonne nouvelle, MONDECA partage son expérience et ses réflexions sur la sémantique et ses usages… Sobre, d’une rédaction clair, presque captivant -enfin compte tenu du sujet-

“Leçons de Choses” est édité par la R&D de Mondeca. Son but est de vous faire partager nos réflexions et expérience dans le domaine des technologies de pointe qui sont nos outils quotidiens : langages du Web Sémantique, ontologies, linguistique appliquée à l’indexation automatique des contenus, taxonomies et navigation intelligente, géosémantique …

Collaborateurs de ce blog à ce jour, dans l’ordre d’apparition à l’écran. La liste est amenée à grandir … Bernard Vatant Thomas Francart Laurence Noël

Les premiers billets

Le site de Mondeca

Leçons de Choses


Denis Failly publie, sur le blog de la bibliothèque de Nextmodernity, son interview de Pierre Levy à propos de IEML.

Quelques extraits des propos de Pierre Levy : Dans un style sobre, c’est un système d’adressage sémantique des documents numériques. Dans un style plus lyrique, je comparerais l’internet à un « cerveau global », à qui il ne manque que le système symbolique adéquat pour faire accéder l’intelligence collective humaine à la conscience réflexive. Mon hypothèse est qu’IEML pourrait précisément jouer le rôle de ce système symbolique initiateur d’une nouvelle dimension cognitive.

En général, une indexation en IEML permettra : - la recherche par concepts (et non plus seulement par chaînes de caractères), - la génération automatique de liens entre documents portant sur des sujets identiques ou complémentaires, - le calcul de distances sémantiques et éventuellement la génération automatique de cartes sémantiques (synthèses) de grands corpus - les inférences et analyses automatiques au sein d’ensembles de documents « quelconques » séléctionnés par les utilisateurs selon leurs propres critéres. Je précise que tout cela représente aujourd’hui (été 2006) un vaste programme de recherche et non pas des solutions techniques immédiatement disponibles.

Je reviendrai dans les prochains jours sur IEML, un projet de recherche tout à fait passionnant pour l’accès à l’information.

Ressources sur IEML


Conférence annuelle sur l’éditeur d’ontologies Protege

12 / 07/ 2006 Sylvie Le Bars - Arkandis

La conférence annuelle sur Protege – l’éditeur open source d’ontologies développé à Stanford- se tiendra à Stanford du 23 ou 26 juillet 2006. [http://protege.stanford.edu/conference/2006/] [communiqué de presse]


PRESS INDEX TEMIS MONDECA une remarquable plate-forme

06 / 04/ 2006 Sylvie Le Bars - Arkandis

Source présentation à l’Atelier BNP Paribas du 6 avril 2006

TEMIS, MONDECA et PRESS INDEX se sont associés pour développer une plate-forme de traitement de l’information textuelle époustouflante. Je suis vraiment bluffée par l’apparente qualité de la sémantique qui est mise en œuvre dans la solution. On a l’impression de toucher du doigt une véritable compréhension du langage naturel.

Pour les besoins de la démonstration, les textes étaient analysés en privilégiant un intérêt pour l’intelligence économique. Le choix du thème intervient sur les divers éléments linguistiques et modélisation des connaissances qui sont utilisés pour le text-mining et la structure de la bases de connaissances.

D’un point de vue intelligence économique la plate-forme va permettre d’indexer les textes qui lui sont soumis suivants les noms d’entreprises, les noms de dirigeants, les lieux… (approche standard), mais aussi sur les faits notables explicités dans les textes tels que fusions d’entreprises, levé de fonds, lancement de nouveaux produits, modifications des l’exécutive etc.

TEMIS, qui est chargé du text-mining de la plate-forme, identifie les entités nommées en rapport avec les entreprises citées ainsi que les faits marquants.

Les faits marquants sont transformés en instances dans la base de connaissance dont la structure est une ontologie gérée par la solution ITM de MONDECA.

D’un point de vue technique, l’ontologie qui sert de modèle à la base de connaissances est organisée en -classes d’objets tels que « Entreprise » « Personne ».. -attributs décrivant les représentants de la classe tels que Alias, Chiffre d’affaire… - associations entre les différentes classes tels que « prend une participation dans », « achète »

Le résultat du traitement hebdomadaire de la presse aboutit à une base de connaissances de tous les événements marquants d’un point de vue intelligence économique. Chaque événement est normalisé sous la forme d’une phrase élémentaire qui met en relations par exemple deux entreprises : « X achète Y ». La ou les phrases qui sont à l’origine de la phrase élémentaire sont associées à celle-ci garantissant une traçabilité de l’analyse, ainsi qu’une appréciation sur la réalisation de l’événement : rumeur, fait avéré…

Il est ainsi possible en utilisant la base de connaissance gérée par MONDECA de produire des fiches de synthèses sur l’activité d’une entreprise donnée. Fiche qui reprend uniquement les faits identifiés, avec la possibilité de lire l’article qui a permis de constituer cette connaissance.

La plate-forme fonctionne en 4 étapes:

  • PRESS INDEX collecte les articles (fil de presse, presse papier, blogs..) soit près de 550 000 pages/jour et produit pour chaque article un fichier XML.
  • TEMIS analyse chaque source. En extrait les entités nommées et les éléments susceptibles de devenirs des faits marquants.
  • MONDECA construit les faits marquants et les enregistrent dans la base de connaissance.
  • PRESS INDEX propose ces résultats à ses clients sous la forme d’un portail, ou d’un flux de connaissances.

Cette plate-forme qui sera opérationnelle dans quelques mois sur le site de PRESS INDEX apporte une réelle innovation dans l’analyse, le traitement et l’accès à l’information textuelle.

Quelques chiffres :

TEMIS crée en 2000 emploie 45 personnes et distribue ses produits en France, Allemagne, US. MONDECA crée en 2000 emploie 13 personnes. Propose une plate forme opérationnelle depuis 2003, et distribue en France, Europe et US avec TEMIS. PRESS INDEX crée en 1997 c’est 8,2 M. Euros de CA, 130 personnes qui travaillent pour l’entreprise.


L’Ontologie Est Surfaite : Catégories, Tags et Liens

15 / 03/ 2006 Sylvie Le Bars - Arkandis

J’avais fin novembre 2005 rédigé un billet intitulé : Si Pollux avait eu des tags…il n’aurait pas perdu son sucre

L’article source de ma réflexion a été traduit par Christophe Ducamp et est accessible sur le site de l’Elanceur.


Une ontologie pour supporter les folksonomies

07 / 12/ 2005 Sylvie Le Bars - Arkandis

L’initiateur de cette idée est Tom Gruber.
Tom Gruber se présente ainsi sur son espace personnel sur le web : tomgruber.org : Tom Gruber is an innovator in technologies that extend human intelligence.

Il vient de publier un article : Ontology of Folksonomy: A Mash-up of Apples and Oranges

Cet article prolonge l’article de Shirky -commenté ici- en ré intoduisant les ontologies pour l’interopérabilité des tags.
Gruber propose de créer un groupe de travail pour définir une ontologie qui permettrait aux différentes applications qui hébergent du contenu indexé par des mots-clés –tags- du genre del.icio.us ou Flickr, de mixer –mashup- leurs contenus. Cette agrégation nécessiterait un minimum d’interopérabilité qui peut se traduire par une ontologie.
Attention il est bien question d’ontologie sur la façon d’associer un mot-clé à un objet, et non une recommandation sur les mots-clés eux-mêmes.
C’est en effet une piste intéressante, tant que l’on confie du contenu à des plates-formes différentes, les signets ici, les photos là, son réseau social ailleurs…

Indépendamment de cette réflexion sur l’interopérabilité des plates-formes dont le contenu est valorisé par les utilisateurs, je recommande la lecture de l’article qui expose brillamment l’apport des tags à la recherche collaborative.

[via Cataloga]


Ontologie quand tu nous tiens!

30 / 11/ 2005 Sylvie Le Bars - Arkandis

Le journal du management publie aujourd’hui un article de Didier Naud (BFD Management) intitulé « La gestion des connaissances une affaire de méthode et de pratique ».



Et là surprise, après quelques paragraphes un peu convenus…. Un panégyrique des ontologies…

Mais en y regardant de près Didier Naud commence sa carrière comme professeur de philosophie… on ne se refait pas.

tags


Ontopia annonce Ontopoly

29 / 11/ 2005 Sylvie Le Bars - Arkandis

Ontopoly, a new web-based tool for creating, populating and managing corporate ontologies, will be launched by Ontopia at Online Information 2005

Article sur ManagingInformation.org
Ontopia.net

tags


Le Blog d'Arkandis

Ce journal, en ligne depuis décembre 2004, me permet de vous faire partager mon point de vue sur l'actualité des technologies d'accès à l'Information de l'Entreprise.

Abonnez vous a ce blog

Recherche


Droits