MOSS 2007 & Autonomy : le partenariat de raison et plus encore
(J'en connais du coté de la Romandie qui vont adorer cette annonce)
& 
deviennent paternaires dans le domaine de la gestion et la recherche d'information
AUTONOMY ENHANCES SECURE, SCALABLE SEARCH FOR SHAREPOINT SERVER 2007 AS MICROSOFT ENTERPRISE SEARCH PARTNER
Ceci plus la DOD 5015.2 commence à donner de veritables lettres de noblesse à notre si sympathique plateforme SharePoint.
A propos, savez vous au moins ce qu'est Autonomy ?
Non ?
En bref, Autonomy est un des produits incontournables dans les outils de catégorisation et de recherche documentaire.
Son concept : analyser le "sens" d'un document, paragraphe, phrase pour retrouver dans un volume documentaire le sens le plus proche ou cohérent. La notion de full text ou de keyword ne peuvent que retrouver des occurences voir des équivalences, cette approche vient donc vraiment enrichir la fonctionnalité de recherche de MOSS.
Et ce partenariat est loin d'être un simple coup marketing :
- Plus de 500 fonctions intégrés à SharePoint comme des WebParts par exemple
- Une sécurité mappé directement entre MOSS et Autonomy
- un systeme de recherche multi threadé pour supporter aisemment des TBs de données en indexation.
- les wyzards de profiling documentaire : automatic linking, categorization, profiling, ...
- Moteur de recherche fédérateur des contenus internes et externes de MOSS 2007
- Support de l'indexation de plus de 1000 formats comme les Blogs ou l'audio/video
- ....
Ayant participer à divers étude de recherche, je vais même rajouter quelques points de détails non négligeables
Pour rappel, je suis venu au monde de SharePoint par Site Server 3.0 Search : j'adore les moteurs de recherche 
Si le moteur d'indexation de MOSS 2007 a été bien renforcé dans sa derniére version, il manque cependant d'un peu de finesse sur des opérations de recherche documentaire. Je vais prendre un exemple.
En systéme documentaire, il n'est pas absurde de vouloir chercher des mots clé proches les uns des autres :
- dans la même phrase
- dans le même paragraphe
- dans le même chapitre
Eh oui, trouver 3 mots dans le même document ne peut pas toujours être significatif
>>> imaginez les docs marketings ou le mot VSTS et MOSS peuvent être presents mais tellement elmoigné dans leur chapitre respectif que finalement le document soir NO RELEVANT.
La solution sous MOSS est de travailler avec l'opérateur NEAR : http://msdn2.microsoft.com/en-us/library/ms461909.aspx
The NEAR term can be represented by the keyword NEAR or by a tilde (~).
When the words in the query joined by NEAR are found within approximately 50 words of one another in the column that is being searched, the NEAR term returns a match. The closer together the two words are, the higher the calculated rank for the NEAR term. The farther apart the two words are, the lower the rank.
Note The number of words is approximate; it can be less than 50. If the match words specified with the NEAR term are both found in the column being searched, but are farther apart than 50, the result is still returned but has a rank of 0.
Voyez vous le probléme ? non ?
>>> Ce prédicat de recherche est :
- non paramétrable en terme de scope : phrase, paragraphe ou chapitre
- c'est dans un scope de plus ou moins 50 mots !
Il n'y a donc pas de solution, ni workaround possible. Autonomy sait cependant gérer nativement ce genre de besoin.
Donc, un partenariat TRES TRES intéressant.
Renaud Comte aka TheMit (Je cherche pas, je trouve, chacun son rôle
)
Member of WygTeam
http://www.wygwam.com
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :