22 / 10/ 2007 Sylvie Le Bars - Arkandis
Je reprends la main sur ce blog pour vous parler de mon expérience de Google Book Search.
Début septembre, Google annonce un nouveau service, la possibilité de constituer en ligne sa propre bibiothèque et surtout d’effectuer une recherche sur celle-ci.
Ayant déjà une grosse partie de ma bibliothèque professionnelle en ligne sur LibraryThing, il suffisait d’exporter depuis LibraryThing les N° ISBN des livres -service proposé par LibraryThing, un bon service qui ne confisque pas vos données - et de les réintroduire dans Google Book.
Première déception : 139 livres importés, 86 inconnus.
Ensuite j’ai testé la fonction de recherche avec le mot mémoire - j’ai beaucoup d’ouvrages sur le sujet : mémoire collective, mémoire d’entreprise, … - Google book search retrouve les livres qui ont le mot mémoire dans le titre -belle performance- et propose un unique extrait qui permet de situer le mot mémoire dans le texte d’un livre intitulé “A la recherche de la mémoire”.
Un service inutilisable…du moins pour ma bibliothèque professionnelle…
Ma bibliothèque sur LibraryThing

20 / 07/ 2007 Sylvie Le Bars - Arkandis
Google co-op est un service que j’utilise très largement. Il permet de concevoir son propre moteur de recherche - ou ses propres moteurs de recherche, j’en ai plusieurs - à partir des sources que l’on sélectionne. Une autre façon de faire de la veille sans encombrer son agrégateur.
Et là je découvre que Google propose un moteur de recherche sur les co-op.
Premier test. J’utilise le mot clé “veille” et je découvre qu’Eric Salviac qui nous a fait l’amitié de participer à notre dernier ExplorCamp propose un Google co-op sur la veille, le web2.0, KM et Entreprises2.0 avec plus de 800 sources…
Search Google Custom Search Engines

06 / 03/ 2007 Sylvie Le Bars - Arkandis
Je recommande la lecture de ce billet de Gilles Balmisse intitulé : Evaluation financière de la mise en oeuvre d’une solution de recherche d’information en entreprise - première partie les coûts.
Il aborde très précisément la structure de coût pour la mise en oeuvre d’une application de recherche d’information.
11 / 05/ 2006 Sylvie Le Bars - Arkandis
J’assistais ce matin à l’une des matinales « retour d’expérience » de PolySpot.
PolySpot l’éditeur de logiciel français de PolySpot Enterprise Search, un moteur de recherche statistique qui propose une vue 360° de l’information de l’entreprise, avec l’indexation de sources gérées dans des applications telles que Documentum, Lotus Notes, Vignette, Oracle, SQL Serveur, Share Point, Exchange, FileNet, DocsOpen…
Après une brève présentation de la solution, c’est Michel Bernardini des Etudes Economiques du groupe BNP-Paribas qui a présenté l’application de recherche multi sources LEOnard, construite avec PolySpot Enterprise Search.
Cette matinale sera suivie de bien d’autres, par exemple le 18 mai 2006.
Si vous avez un projet de déploiement d’un moteur de recherche je vous recommande d’assister à cette présentation en petit comité qui permet de poser toutes les questions possibles.
PolySpot, c’est 15 personnes, dont 11 se consacrent à la R&D, ce qui permet la customisation de la solution pour répondre au plus près des besoins exprimés par le client.
A propos de PolySpot sur ce blog
03 / 03/ 2006 Sylvie Le Bars - Arkandis
“It’s a separate database that indexes all of your data,” Larry Ellison said. “There are crawlers, in a sense it is very similar to what Google does, but you’re not crawling the public Internet. You’re crawling and indexing all of your private databases, Microsoft Word files and all your data and building in a separate Oracle database all these indexes.”
Secure Enterprise Search 10g should be available by the end of May.
“Secure Enterprise Search 10g will also integrate directly into authentication and security policy systems on the corporate network.”
- à suivre-
Pour en savoir plus : http://www.oracle.com/technology/products/oses/index.html
29 / 11/ 2005 Sylvie Le Bars - Arkandis
A la base de cette réflexion, il y a l’article de Clay Shirky « Ontology is overrated : Categories, Links, and Tags » qui reprend deux présentations qu’il a faites. La première à O’Reilly Etech en mars intitulées “Ontology is overrated”. La seconde à IMCExpo en avril, intitulée : « Folksonomies & Tags : the rise of user developed classification”.
Cet article est articulé en deux parties.
La première expose l’usage de la classification :
- par les chimistes avec la classification des éléments,
- par les bibliothécaires,
- par Yahoo,
La seconde expose l’émergence d’une classification par les tags, avec le très populaire del.icio.us.
La qualité des exemples proposés est remarquable, mais je n’ai pas trouvé la cohérence de l’argumentation.
La classification périodique des éléments est un outil de travail qui a entre autre permis d’anticiper des découvertes. Pas trop de rapport avec l’accès à l’information.
Pour ce qui est de l’information distinguons les deux rôles : celui qui classe l’information et celui qui souhaite la retrouver.
Dans le cas des bibliothèques, de yahoo … celui qui classe l’information n’est pas celui qui souhaite la retrouver. Et là forcement il y a frottement. J’entends mon homme qui régulièrement me demande « Mais où as tu rangé le ….. ? » Même avec l’expérience, le classement de l’autre reste problématique, énigmatique…
Avec del.icio.us, il y a identité entre celui qui range et celui qui retrouve. C’est le même quidam qui décore une référence avec des tags et qui utilisera les tags pour retrouver ses trésors. C’est plus facile d’être en cohérence avec ses propres tags, quoi que….sans jardinage l’entropie retrouve ses droits (cf mon précédent billet).
Pour être cohérente, la comparaison doit être réalisée entre la recherche d’une information en utilisant une classification et la même recherche en utilisant les tags posés par le collectif.
Avec un second niveau de comparaison avec la même recherche basée sur l’indexation full-text du document telle que réalisée par Google.
Expérimentation
Je fais le test avec Pollux (l’avantage de l’utilisation d’un nom permet de contourner l’aspect du plurilinguisme sous-jacent).
Google plus de 2 millions de résultats
delicious 9 résultats
Vous me direz que mon exemple est mal choisi, et que web2 serait un meilleur candidat compte tenu de la population qui a connaissance et utilise ce service.
Google :4,5 millions
delicious : 19 mille en comptant les doublons
Il n’y a toujours pas photo, et pourtant personnellement je me tournerais aujourd’hui plutôt vers delicious pour glaner une référence sur le sujet.
Je n’ai pas encore lu d’études sur la pertinence des résultats lorsque l’on effectue une recherche en utilisant delicious.
Et puis en ce qui concerne les ontologies… là j’ai l’impression que l’auteur a raté une marche…cf billet publié par Stefano’s Linotype
Ressources :
Le site web de Clay Shirky
L’article en question
La classification des éléments
15 / 11/ 2005 Sylvie Le Bars - Arkandis
J’ai assisté, la semaine passée, à une démonstration d’Excalibur le moteur de recherche sémantique de Convera. Ce service de recherche sur le web est tout neuf. Très onéreux. Destiné à de très grosses entreprises.
Bien sûr une recherche qui fait intervenir la sémantique est incomparablement plus efficace qu’une recherche de type Google. Google reste au ras du mot, et propose les résultats suivant une priorité souvent discutable.
Mais, quels seront les utilisateurs de ce type de service ?
Je n’imagine pas qu’un service d’intelligence économique ou de veille se lance dans une chasse aveugle sur la toile. La moindre expérience permet de dessiner les contours d’une surveillance.
Sur le site de Convera il semblerait que les médias soient désignés comme utilisateurs potentiels. Mais pour une culture de surface, la première page de résultats de google est souvent largement suffisante…
La présentation était réalisée par la société Acamaya qui représente l’éditeur en France.
08 / 09/ 2005 Sylvie Le Bars - Arkandis
http://portal.acm.org/toc.cfm?id=1083356&type=proceeding
[relai de (pluri)TAL]
13 / 06/ 2005 Sylvie Le Bars - Arkandis
Les actes de la 6ème rencontre Terminologie et Intelligence Artificielle sont en ligne. Le texte de François Gaudin intitulé « Point de vue d’un socio terminologue » est tout à fait accessible même pour un non-spécialiste de la terminologie computationnelle.
Sylvie Le Bars - Arkandis

Le colloque « indice, index, Indexation » se déroulera à Lille les 3 et 4 novembre 2005.
Extrait de la présentation : Dans une société où les supports et les modes de circulation de l’information se différencient et se multiplient sans cesse, le recours à des processus de guidage voire de contrôle de l’attention s’avère de plus en plus nécessaire. Ces transformations conduisent à de nouvelles formes de médiation. Ainsi, l’apparition des médias électroniques a remis en question tout le secteur de l’édition et de la documentation, qu’il s’agisse du rôle des acteurs, du traitement des sources, des types d’usages. Ce sont non seulement les supports documentaires qui ont changé, mais la manière dont on accède aux textes au moyen de signes indiciels et de différentes formes d’index (métadonnées, annuaire de sites, etc.)….
Thèmes des propositions Le colloque « indice, index, Indexation » porte donc sur ces métamorphoses à l’œuvre dans les secteurs éditorial et documentaire, et sur les enjeux liés aux pratiques, stratégies et logiques sociales qui s’y déploient. Il concerne en priorité mais non exhaustivement les quatre thèmes suivants :
* Histoire et culture des index et de l’indexation.
* L’indexation comme processus sémiotique et cognitif.
* Pratiques humaines et pratiques automatisées de l’indexation.
* Enjeux économiques et sociétaux de l’indexation.
….
