Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

The Mit's Blog

En plus d'intégrer et skier, il sait même écrire !
(Blog de Renaud Comte)

Actualités

MOSS 2007 & Autonomy : le partenariat de raison et plus encore

(J'en connais du coté de la Romandie qui vont adorer cette annonce)

 &
deviennent paternaires dans le domaine de la gestion et la recherche d'information

AUTONOMY ENHANCES SECURE, SCALABLE SEARCH FOR SHAREPOINT SERVER 2007 AS MICROSOFT ENTERPRISE SEARCH PARTNER

Ceci plus la DOD 5015.2 commence à donner de veritables lettres de noblesse à notre si sympathique plateforme SharePoint.

A propos, savez vous au moins ce qu'est Autonomy ?

Non ?

En bref, Autonomy est un des produits incontournables dans les outils de catégorisation et de recherche documentaire.

Son concept : analyser le "sens" d'un document, paragraphe, phrase pour retrouver dans un volume documentaire le sens le plus proche ou cohérent. La notion de full text ou de keyword ne peuvent que retrouver des occurences voir des équivalences, cette approche vient donc vraiment enrichir la fonctionnalité de recherche de MOSS.

Et ce partenariat est loin d'être un simple coup marketing :

  • Plus de 500 fonctions intégrés à SharePoint comme des WebParts par exemple
  • Une sécurité mappé directement entre MOSS et Autonomy
  • un systeme de recherche multi threadé pour supporter aisemment des TBs de données en indexation.
  • les wyzards de profiling documentaire : automatic linking, categorization, profiling, ...
  • Moteur de recherche fédérateur des contenus internes et externes de MOSS 2007
  • Support de l'indexation de plus de 1000 formats comme les Blogs ou l'audio/video
  • ....

Ayant participer à divers étude de recherche, je vais même rajouter quelques points de détails non négligeables

Pour rappel, je suis venu au monde de SharePoint par Site Server 3.0 Search : j'adore les moteurs de recherche smile_regular

Si le moteur d'indexation de MOSS 2007 a été bien renforcé dans sa derniére version, il manque cependant d'un peu de finesse sur des opérations de recherche documentaire. Je vais prendre un exemple.

En systéme documentaire, il n'est pas absurde de vouloir chercher des mots clé proches les uns des autres :

  • dans la même phrase
  • dans le même paragraphe
  • dans le même chapitre

Eh oui, trouver 3 mots dans le même document ne peut pas toujours être significatif
>>> imaginez les docs marketings ou le mot VSTS et MOSS peuvent être presents mais tellement elmoigné dans leur chapitre respectif que finalement le document soir NO RELEVANT.

La solution sous MOSS est de travailler avec l'opérateur NEAR : http://msdn2.microsoft.com/en-us/library/ms461909.aspx

The NEAR term can be represented by the keyword NEAR or by a tilde (~).

When the words in the query joined by NEAR are found within approximately 50 words of one another in the column that is being searched, the NEAR term returns a match. The closer together the two words are, the higher the calculated rank for the NEAR term. The farther apart the two words are, the lower the rank.

Note  The number of words is approximate; it can be less than 50. If the match words specified with the NEAR term are both found in the column being searched, but are farther apart than 50, the result is still returned but has a rank of 0.

Voyez vous le probléme ? non ?
>>> Ce prédicat de recherche est :

  1. non paramétrable en terme de scope : phrase, paragraphe ou chapitre
  2. c'est dans un scope de plus ou moins 50 mots !

Il n'y a donc pas de solution, ni workaround possible. Autonomy sait cependant gérer nativement ce genre de besoin.

Donc, un partenariat TRES TRES intéressant.

Renaud Comte aka TheMit (Je cherche pas, je trouve, chacun son rôle smile_regular)
Member of WygTeam
http://www.wygwam.com

Technorati tags: , , ,
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :
Posted: vendredi 8 juin 2007 11:57 par themit

Commentaires

Pas de commentaires

Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- CSDL Function par Matthieu MEZIL le il y a 9 heures et 30 minutes

- LINQ To Entities par Matthieu MEZIL le il y a 13 heures et 2 minutes

- Faire apparaitre l’onglet ‘Développeur’ dans Office 2010 par Julien Chable le 03-13-2010, 01:41

- [Astuce] Patch pour Microsoft Forums NNTP Bridge V1 par Le petit blog de Pierre / Pierre's little blog le 03-12-2010, 23:31

- Pb lors de l’installation SharePoint 2010… par Le blog de Patrick le 03-12-2010, 14:08

- [WF4] Ajouter des contraintes à une activité (2/2) par Blog de Jérémy Jeanson le 03-12-2010, 08:35

- [WF4] Ajouter des contraintes à une activité (1/2) par Blog de Jérémy Jeanson le 03-12-2010, 08:03

- [ASP.NET] Ne pas se faire avoir par IHttpModule et sa méthode Init() par Thomas Jaskula le 03-12-2010, 00:04

- [MSTD10] SharePoint 2010 et Team Foundation Server par Philippe Sentenac [MVP SharePoint] le 03-11-2010, 10:49

- [MSTD10] SQL Server 2008 pour les développeurs et Visual Studio Team System Database Edition par Michel Perfetti [Miiitch] le 03-11-2010, 10:00