26 / 04/ 2006 Sylvie Le Bars - Arkandis
Ce soir au grand Rex SOIRÉE DE LANCEMENT DE VEER-ZAARA EN PRÉSENCE DE L’ÉQUIPE DU FILM (Shah Rukh KHAN, Preity ZINTA, Rani MUKERJI, Yash CHOPRA, Sanjeev KOHLI)
Le rêve…..
Billet sur le même sujet : Swades
[En savoir plus sur Parisit]
21 / 04/ 2006 Sylvie Le Bars - Arkandis
Impossible de rater l’annonce de Google dans le monde de « l’enterprise search » énormément d’échos de leur communiqué de presse.
Mais là on est un peu déçu. Cette annonce concerne la fameuse vision 360° qui consiste à accéder à toutes les informations de l’entreprise à partir de l’uniquement interface de recherche, quelle que soit l’application qui héberge ces informations.
Comment!!! Google Search Appliance ne proposait pas encore cette fonctionnalité !
Ohhh ! La chantilly a un goût de déjà vu chez les éditeurs de business search.
Cette fonctionnalité annoncée est baptisée OneBox. Bon marketing. OneBox suggère la simplicité.
Je ne m’étends pas plus sur le sujet. Vous pourrez lire
- le billet de ITSpotter et celui d’Abondance très politiquement correct.
- Le billet de NetEco qui donne la parole à Jean Ferré DG de Sinequa et John M. Lervik DG de FAST forcément un peu plus polémique.
- Et celui de generation-nt.
Un lien vers GoogleSearchAppliance
20 / 04/ 2006 Sylvie Le Bars - Arkandis
Le 16 mai 2006.. lire la suite sur ITSpotter…
Sylvie Le Bars - Arkandis
Une question récurrente : »Pourquoi n’installer-vous pas Google sur l’intranet de l’entreprise » Google me donne satisfaction sur le net, alors que les outils de recherche dont je dispose sur l’intranet ou le portail de mon entreprise sont minables. Evidemment Autonomy ne justifie pas son article en ces termes. Google n’est bien sûr pas cité et la question reste subliminale.
L’argumentaire développé par Autonomy concerne tout d’abord des contraintes techniques :
- Hétérogénéité : Pas plus de 10% des informations contenues dans la grande valise « informations gérées par l’entreprise » sont sur des pages HTML. Le reste est contenu dans des applications business, documentaires, des bases de données…La prise en compte de cette hétérogénéité est complexe.
- Sécurité : Le résultat d’une requête ne peut contenir que des informations sur lesquelles l’utilisateur possède le droit de consultation.
- Pertinence : Dans 80% des cas la requête posée concerne un document dont l’utilisateur connaît l’existence ou dont il est l’auteur. Il n’y a donc qu’une bonne réponse à la requête, avec une exigence absolue.
- Multilinguisme : La recherche doit prendre en compte tous les documents quelle que soit la langue d’expression.
Mais en regard de ces contraintes l’entreprise dessine un univers qui favorise la recherche.
- En effet l’employé qui effectue la recherche n’est pas anonyme, et les outils de recherche peuvent prendre en compte son identité pour guider sa recherche ou influencer sur la pertinence des informations proposées en regard d’une requête.
- Une recherche par navigation est plus rapide qu’une recherche par moteur de recherche à condition de maîtriser l’arborescence de navigation. Et là encore l’entreprise peut proposer à ses employés une navigation qui correspond à leur métier. Il n’est pas question d’éviter le jargon métier, mais bien de le mettre en valeur pour augmenter la trouvabilité de l’information.
En conclusion : un « Google like » dans l’entreprise ce n’est pas pertinent. Pourquoi se priver des spécificités de l’entreprise pour accroître la trouvabilité des informations ! .
Lire l’article d’Autonomy : Business search vs. Consumer Search
16 / 04/ 2006 Sylvie Le Bars - Arkandis
Prescient Digital Media publie un billet de Cathy McKnight qui expose la complémentarité entre Architecture de l’information et Taxinomie Don’t forget to add the Tax(onomy)
“Information architecture involves the structure, organization and navigation elements of a site. A good IA will ensure that employees using your intranet will be able to find the information on the site once they are there. And for those administering the site, a solid IA will make managing the site’s content – past, current and future – easier. Conversely, a well thought out and executed taxonomy can increase your intranet’s traffic exponentially, because the information on it is catalogued, and easy to find.”
[Lu sur Intranet Blog]
12 / 04/ 2006 Sylvie Le Bars - Arkandis
Le supplément du KMWorld d’avril 2006 est consacré à l’accès à l’information.
24 pages, avec des articles rédigés par FAST, ENDECA, InQuira, Schema Logic, Zylab, BearingPoint, ENGENIUM, ISYS search Software, MataCarta, Recommind, Coveo…
On distingue dans ces contributions celles qui concernent le « Site Search » recherche d’information sur le site d’une entreprise et la recherche d’information sur l’Intranet de l’Entreprise.
Les thèmes abordés dans ce livre blanc concernent :
- La Sémantique vedette de ce document, avec tous les exemples et démonstrations sur l’importance d’une représentation des connaissances d’un domaine indépendamment des documents.
- Navigation à facettes. Cette technique de navigation réservée à mon sens à la navigation dans les catalogues est mise en valeur dans l’article d’Endeca. Rien de nouveau.
- Les outils de recherche pour l’investigation des gros volumes de documents dans le traitement de dossiers de justice.
- Très intéressant : le cahier des charges d’une solution d’accès à l’information, article proposé par BearingPoint.
- Search analytics : les traces des recherches effectuées constituent une mine d’informations pour mesurer l’efficacité d’une solution d’accès à l’information.
- Le text-mining est à peine abordé avec un article de Recommind.
- La visualisation des résultats de la recherche : graphisme, clusterisation n’est pas abordé, sauf avec MetaCarta qui propose une solution qui géo-localise toutes les informations avec ce chiffre surprenant : « 70% de tous les documents non structurés contiennent une référence géographique ».
- Le thème “Architecture de l’Information” n’est pas abordé, surprenant…
Le livre Blanc : Best Practices in Enterprise Search.
06 / 04/ 2006 Sylvie Le Bars - Arkandis
Source présentation à l’Atelier BNP Paribas du 6 avril 2006
TEMIS, MONDECA et PRESS INDEX se sont associés pour développer une plate-forme de traitement de l’information textuelle époustouflante. Je suis vraiment bluffée par l’apparente qualité de la sémantique qui est mise en œuvre dans la solution. On a l’impression de toucher du doigt une véritable compréhension du langage naturel.
Pour les besoins de la démonstration, les textes étaient analysés en privilégiant un intérêt pour l’intelligence économique. Le choix du thème intervient sur les divers éléments linguistiques et modélisation des connaissances qui sont utilisés pour le text-mining et la structure de la bases de connaissances.
D’un point de vue intelligence économique la plate-forme va permettre d’indexer les textes qui lui sont soumis suivants les noms d’entreprises, les noms de dirigeants, les lieux… (approche standard), mais aussi sur les faits notables explicités dans les textes tels que fusions d’entreprises, levé de fonds, lancement de nouveaux produits, modifications des l’exécutive etc.
TEMIS, qui est chargé du text-mining de la plate-forme, identifie les entités nommées en rapport avec les entreprises citées ainsi que les faits marquants.
Les faits marquants sont transformés en instances dans la base de connaissance dont la structure est une ontologie gérée par la solution ITM de MONDECA.
D’un point de vue technique, l’ontologie qui sert de modèle à la base de connaissances est organisée en -classes d’objets tels que « Entreprise » « Personne ».. -attributs décrivant les représentants de la classe tels que Alias, Chiffre d’affaire… - associations entre les différentes classes tels que « prend une participation dans », « achète »
Le résultat du traitement hebdomadaire de la presse aboutit à une base de connaissances de tous les événements marquants d’un point de vue intelligence économique. Chaque événement est normalisé sous la forme d’une phrase élémentaire qui met en relations par exemple deux entreprises : « X achète Y ». La ou les phrases qui sont à l’origine de la phrase élémentaire sont associées à celle-ci garantissant une traçabilité de l’analyse, ainsi qu’une appréciation sur la réalisation de l’événement : rumeur, fait avéré…
Il est ainsi possible en utilisant la base de connaissance gérée par MONDECA de produire des fiches de synthèses sur l’activité d’une entreprise donnée. Fiche qui reprend uniquement les faits identifiés, avec la possibilité de lire l’article qui a permis de constituer cette connaissance.
La plate-forme fonctionne en 4 étapes:
- PRESS INDEX collecte les articles (fil de presse, presse papier, blogs..) soit près de 550 000 pages/jour et produit pour chaque article un fichier XML.
- TEMIS analyse chaque source. En extrait les entités nommées et les éléments susceptibles de devenirs des faits marquants.
- MONDECA construit les faits marquants et les enregistrent dans la base de connaissance.
- PRESS INDEX propose ces résultats à ses clients sous la forme d’un portail, ou d’un flux de connaissances.
Cette plate-forme qui sera opérationnelle dans quelques mois sur le site de PRESS INDEX apporte une réelle innovation dans l’analyse, le traitement et l’accès à l’information textuelle.
Quelques chiffres :
TEMIS crée en 2000 emploie 45 personnes et distribue ses produits en France, Allemagne, US. MONDECA crée en 2000 emploie 13 personnes. Propose une plate forme opérationnelle depuis 2003, et distribue en France, Europe et US avec TEMIS. PRESS INDEX crée en 1997 c’est 8,2 M. Euros de CA, 130 personnes qui travaillent pour l’entreprise.
05 / 04/ 2006 Sylvie Le Bars - Arkandis
Classifications et taxinomies sont utilisées pour concevoir l’interface d’accès à l’information de l’entreprise. Les éléments de l’interface reproduisent les premiers niveaux de la classification pour guider l’utilisateur vers l’information recherchée.
Attention au détournement de classification pour un usage de navigation, repérage, identification ; elles ne sont généralement pas conçues pour cet usage.
La taxinomie (du grec ταξινομία taxis : rangement et nomos : loi) est la partie de la biologie visant à établir une classification systématique des êtres vivants, appelée aujourd’hui systématique. Cette classification inventaire permet de classer toute nouvelle espèce. Sa transposition pour accéder à de l’information est illusoire.
Après « la taxinomie » inventaire un vivant, le mot taxinomie a été réutilisé pour désigner des systèmes de classification.
Quant à lui, le mot taxonomie a été forgé pour parler de l’étude de la classification, une sorte de méta classification.
Prenons maintenant la célèbre classification périodique des éléments : inventaire et prédictions sur l’existence d’éléments non encore découverts lors de son élaboration. La classification périodique des éléments est un outil de travail pour les chimistes.
Certaines classifications permettent de décider du comportement à adopter face à un objet donné. Prenons par exemple un véhicule, sa classification suivant son poids, le nombre de place… permet de déterminer le permis nécessaire pour le conduire, les règles spécifiques du code routier s’appliquant…
D’autres classifications sont élaborées pour prédire le comportement d’un objet.
De très nombreuses classifications sont élaborées pour comprendre un phénomène dans l’objectif de pouvoir ensuite agir. Prenons par exemple la classification des causes de décès, les statistiques sur l’évolution de ces causes sont exploitées en médecine, mais aussi économie, politique, prévention sanitaire…
Aucune de ces classifications n’est transposable dans le domaine de l’accès à l’information.
Moins exotique, prenons la classification utilisée dans les bibliothèques, celle de Dewey par exemple. Elle est conçue pour organiser et classifier le savoir. Elle n’est pas transposable sauf peut-être pour accéder aux documents d’une bibliothèque virtuelle, en lui imposant des contraintes physiques qui n’existent plus : pas de matérialité du livre, pas de rayonnage…
Et les thésaurus ? Un thésaurus est une ressource terminologique utilisée pour décrire le contenu d’un document. Son organisation n’est pas hiérarchique. Et surtout son objectif n’est pas de classer des contenus, mais d’en parler en respectant un vocabulaire contrôlé.
Ces taxinomies ne peuvent être transposées pour accéder à l’information d’une entreprise. Elles permettent de comprendre comment des objets (sujets, actions…) se situent dans un ensemble, comment interagir avec ces objets…
Alors… il faut construire des classifications ou taxinomies sur mesure pour accéder à l’information de l’entreprise. L’élaboration de cette architecture de l’information prendra idéalement en compte : les processus pour lesquels le besoin d’information émerge, la diversité des catégories d’utilisateurs, sans oublier les liens transverses que le supermarché sait si bien exploiter en disposant la crème chantilly en regard des fraises.
04 / 04/ 2006 Sylvie Le Bars - Arkandis
Passionnée par la lecture de l’article : Chronologie des supports, des dispositifs spatiaux, des outils de repérage de l’information. » de Sylvie FAYET-SCRIBE, j’ai eu envie de vous faire partager cette lecture. Voici quelques extraits de l’introduction :
« Cet article consiste à présenter un tableau chronologique (compris entre la préhistoire et le XXe siècle), et son commentaire qui donnent à voir l’histoire des “techniques intellectuelles” permettant le repérage de l’information. C’est-à-dire les méthodes et les outils ayant la capacité de repérer et de retrouver l’information: indexation, classification, activité résumante, encyclopédies, dictionnaires et outils de recensement: répertoires, annuaires, chronologies; ainsi que les moyens de retrouver les références du document (et non l’information elle-même) : bibliographies et catalogues… »
« … la conception de l’information spécialisée, telle qu’elle est définie actuellement, délimite fortement le domaine investi par cette notion : “L’information spécialisée est une information destinée aux spécialistes (industriels, chercheurs, enseignants) qui leur est nécessaire dans leur activité professionnelle et qui conditionne une prise de décision ou une action particulière. Il faut la différencier de l’information pour le grand public notamment par la nature des informations transmises ainsi que le canal de communication emprunté.” (Chartron, 1992, p.351). »
« …Cette mise en forme de la connaissance se fera d’abord par le langage, puis par l’écriture, et celle-ci s’inscrira dans le document… »
« …”Toute connaissance mémorisée, stockée sur un support, fixée par l’écriture ou inscrite par un moyen mécanique, physique, chimique, électronique, constitue un document. Dans la chaîne primaire de création, tant que le document est créé mais n’est pas encore utilisé par un récepteur, il reste un document virtuel. Dès lors qu’il est employé et décodé par un récepteur, le document devient réel : il a trouvé son utilisateur” (Meyriat et Estival, 1981, p.84)… »
« .. Utiliser un document, y puiser une information est un acte fondamental. Il y a des documents qui ont été produits pour être porteurs d’informations.. »
Cet article a été publié en 1997 dans le N° 4 de la revue Solaris dont le dossier s’intitule « Le savoir et ses outils d’accès : repères historiques »
03 / 04/ 2006 Sylvie Le Bars - Arkandis
ITSpotter, le portail dédié à la gestion de l’information et des connaissances lance ses deux premières chaînes thématiques : Accès à l’information et Veille
Ces fils de nouvelles viennent en complément de l’annuaires des outils de KM et de veille mis en ligne depuis plusieurs mois par Gilles Balmisse.
Je me suis focalisée sur le fil de news consacré à “l’accès à l’information” et on y trouve tous les communiqués de presse que j’ai pu recenser ces dernières semaines. Un travail très complet.
