Je reprends la main sur ce blog pour vous parler de mon expérience de Google Book Search.

Début septembre, Google annonce un nouveau service, la possibilité de constituer en ligne sa propre bibiothèque et surtout d’effectuer une recherche sur celle-ci.

Ayant déjà une grosse partie de ma bibliothèque professionnelle en ligne sur LibraryThing, il suffisait d’exporter depuis LibraryThing les N° ISBN des livres -service proposé par LibraryThing, un bon service qui ne confisque pas vos données - et de les réintroduire dans Google Book.

Première déception : 139 livres importés, 86 inconnus.

Ensuite j’ai testé la fonction de recherche avec le mot mémoire - j’ai beaucoup d’ouvrages sur le sujet : mémoire collective, mémoire d’entreprise, … - Google book search retrouve les livres qui ont le mot mémoire dans le titre -belle performance- et propose un unique extrait qui permet de situer le mot mémoire dans le texte d’un livre intitulé “A la recherche de la mémoire”.

Un service inutilisable…du moins pour ma bibliothèque professionnelle…

Ma bibliothèque sur LibraryThing

books.google.com


Utilisatrice +++ de del.icio.us - 1940 bookmarks sur ce service - je me précipite sur deliGoo. deliGoo est une extension pour Firefox ou IE. Ce service effectue des recherches dans les signets confiés à del.icio.us.

deliGoo effectue une recherche fullText, mais il circonscrit cette recherche aux sites qui ont été bookmarkés dans del.icio.us.

Le moteur prend en compte plusieurs critère qui permettent de focaliser la recherche :

  • Je peux limiter la recherche aux signets enregistrés par un utilisateur;

  • Je peux limiter la recherche à un tag spécifique;

Ces deux paramètres sont combinables. Je peux ainsi rechercher parmi tous les signets ceux qui ont été tagués par “entreprise2.0″. Ou je peux effectuer cette recherche uniquement sur les signets que j’ai tagués “entreprise2.0″.

Une fois le champs de recherche délimité, deliGoo effectue une recherche fullText.

Voici par exemple le résultat que j’ai obtenu en recherchant IBM sur les signets que j’ai tagués entreprise2.0.

J’obtiens 4 résultats parmi les 103 signets que j’ai tagués “entreprise2.0″.

Ce moteur est un mashup qui utilise Google Custom Search.

Un service que vous pouvez utiliser même si vous n’utilisez pas del.icio.us. Une façon très intéressante de valoriser le socialComputing pour rechercher de l’information.

découvert notamment avec Christophe Deschamps


Sur le marché des logiciels de moteurs de recherche et de navigation, la compétition est rude. Beaucoup d’éditeurs ont remporté un certain succès en peu de temps, profitant de la vague d’intérêt portée actuellement par les entreprises à la problématique de la recherche. Et nous voilà bombardés par des versions bêta s’éternisant au fil des mois et pourtant jamais abouties…. Lire la suite sur NetEconomie - article publié le 5 juillet 2006


Un forum consacré à aux moteurs de recherche en entreprise

12 / 05/ 2006 Sylvie Le Bars - Arkandis

Voici l’adresse d’un tout nouveau forum consacré au moteur de recherche en entreprise : http://groups.yahoo.com/group/search_dev/

Sa presentation A technical and business discussion group for developers, consultants, IT people and managers who work with Enterprise Search Engines such as Verity/Autonomy, FAST, Ultraseek and Google.

While some engines already have specific groups (which we will link to), most large companies own more than one engine; vendor selection and integration can be rather complex, and of course each vendor pushes their own solutions.

The technical requirements of corporate Intranet search are quite different than those of public portals and generic B2C search. The good news is that most vendors now offer quality spidering technology, support many document formats, and have rich Java APIs. Coders unite!

We hope this group will be a good starting point and technical meeting area.

Usage: You are responsible for the contents of your postings; we suggest you do not divulge proprietary information. Discussions of specific vendors should be professional and factual.

Keywords: Verity/Autonomy K2, IDOL and Search97; FAST Search & Transfer FDS, ESP and InStream; Ultraseek (sold under Infoseek, Inktomi, Verity and Autonomy brands); Endeca; the “Google Search Appliance” / “Google Box”; Lucene/Nutch; IBM OmniFind; Oracle Text; Cold Fusion; and many others. Many of these vendors have been included on the Gartner Magic Quadrants. [image]


TripleHop Europe devient PolySpot

20 / 03/ 2006 Sylvie Le Bars - Arkandis

TripleHop Europe, partenaire de TripleHop Inc de 2000 à 2005, est devenu PolySpot au 1 janvier 2006. Cette évolution fait suite au rachat en juin 2005 de certains des actifs de la société Triplehop Inc par Oracle. A son catalogue, une solution de recherche et de navigation déclinée en deux versions : PolySpot Enterprise Search et PloySpot Start Search. La fiche descriptive de PolySpot Enterprise Search est accessible ici.

PolySpot exposait sa solution à Documation2006 -communiqué de presse - et est partenaire du prochain Intracom2006.

Voir aussi l’article du JournalDuNet


Telle est la question à laquelle les intervenants du séminaire organisé par le GFII tenteront de répondre demain le 21 mars 2006.

“…Il nous a semblé intéressant d’évaluer l’adéquation des moteurs Internet avec les besoins des entreprises, analysés par grandes fonctions : finance, commercial, ressources humaines, etc. En effet, la nature des documents et la finalité de leur exploitation sont très variables, nécessitant donc des traitements spécifiques… “


Sur Outils Froids Christophe Deschamps met en ligne l’article qu’il a rédigé pour le numéro de janvier 2006 de Veille Magazine. Voici un résumé très condensé de cet article réalisé avec FreeMind.

L’article : 2006, année charnière pour les moteurs de recherche d’entreprise ?


Une signature graphique du contenu d’un document

22 / 02/ 2006 Sylvie Le Bars - Arkandis

représentation graphique du contenu sémantique d\'un document

Voici une interface très originale pour effectuer des recherches sur un large corpus de documents. Ce prototype est développé au MIT.

3 étapes : 1 - création d’un histogramme ordonné de la fréquence des mots pour chaque document 2- dessin de cet histogramme à partir d’un point central, ce qui donne une surface, une sorte d’icône, de signature graphique 3- évaluation de la pertinence d’un document par reconnaissance de forme…

Le mieux pour comprendre c’est de suivre les étapes telles qu’elles sont proposées ici.

[source information aesthetics]


Exalead s’allie avec le specialiste francais de la semantique

08 / 02/ 2006 Sylvie Le Bars - Arkandis

Exalead annonce, dans le cadre de son offre one:search dédiée aux entreprises, un partenariat avec Lingway. Les approches complémentaires des technologies des deux éditeurs français vont permettrent de donner une nouvelle dimension à la recherche d’informations en entreprises. -à suivre- L’intégration des 2 technologies sera présentée pour la première fois à l’occasion de Documation 2006 (15 et 16 mars 2006 – CNIT La Défense), sur les stands des 2 sociétés et également dans le cadre d’un Atelier commun le mercredi 15 mars 2006 à 11h30.

Lu sur NetEco

Ressources : Le communiqué de presse Exalead One :search Lingway


Classer, Indexer ou utiliser la recherche full-text ?

17 / 01/ 2006 Sylvie Le Bars - Arkandis

Hiérarchie de dossiers versus recherche « full-text »

J’ai installé et testé de nombreux moteurs de recherche desktop. Ils fonctionnent parfaitement.
Et pourtant… lorsque je cherche un document sur mon poste de travail, je navigue dans la hiérarchie des mes dossiers. Je fais très rarement appel au moteur de recherche desktop, et uniquement lorsque ma recherche est floue, et ne concerne pas une information précise.

Tags versus recherche full-text

Dans un autre registre, j’ai confié l’archivage de mes messages électroniques à Gmail. Là, pas de dossiers et sous dossiers, mais au mieux des mots clés. Les messages reçus passent d’un simple clic de la boite de réception à la boite d’archive. Il est ainsi assez rare, que je prenne le temps d’associer un mot-clé à un message. En conséquence, lorsque je recherche un message, mon comportement doit être assez proche de la poule qui a trouvé un couteau. Je souviens généralement de l’émetteur du message, mais comme ce critère n’est pas pris en compte pour le filtrage que si j’ai explicitement désigné cet émetteur pour alimenter mon carnet d’adresses, il me reste la recherche « full-text »… Et c’est là, que l’on peut mesurer la difficulté à poser la bonne question. Lorsque j’utilise Google pour rechercher une information, je n’ai aucun moyen de vérifier si la question que je pose est efficace par rapport à mon besoin. J’ai en retour des centaines de réponses quelque soit ma question. Par contre, lorsque je recherche un email, que je sais qu’il existe, je mesure immédiatement l’efficacité de ma question à la pertinence des emails. Finalement ce n’est pas si évident de poser la bonne question. On en vient parfois même a redouter de l’avoir supprimé.

Tags del.icio.us versus tags Gmail

Troisième exemple. Je confie la gestion de mes signets à del.icio.us. Comme pour Gmail, pas de hiérarchie juste des mots-clés. Mais là, l’espace dédié à l’indexation du message est une grande case blanche. del.ici.us ne me force pas à la compléter, mais cet espace « appelle » le renseignement. Et « naturellement » j’indexe chaque signet de plusieurs tags. Il est probable que si Gmail laissait un espace vide pour indexer mes messages, je le complèterais. Alors qu’aujourd’hui je dois d’abord créer un mot-clé puis le sélectionner dans une liste déroulante…

Conclusion

Ce retour d’expérience suggère que l’utilisation d’un moteur de recherche n’est finalement pas si naturelle et évidente. Et que les hiérarchies et plus nouvellement l’indexation multiple ont encore de beaux jours devant eux. Sa transposition dans le cadre de l’entreprise, nous suggère que l’organisation des contenus n’est pas une activité vaine. -billet à suivre-


«« Billets précédents  • 

Le Blog d'Arkandis

Ce journal, en ligne depuis décembre 2004, me permet de vous faire partager mon point de vue sur l'actualité des technologies d'accès à l'Information de l'Entreprise.

Abonnez vous a ce blog

Recherche


Droits