Google Search Appliance et SharePoint... un an après
Il y a de celà un peu plus d'un an, j'avais comparé le moteur de recherche de la Google Search Applicance (GSA) à celui de Microsoft Office SharePoint Server (MOSS). Pour rappel, en dehors de la partie recherche sur laquelle chaque outil avait ses avantages et ses faiblesses, la GSA se voyait quasi inutilisable en authentification silencieuse dans un contexte SharePoint (notamment...). Depuis pas mal de choses ont changées, avec des nouvelles fonctionnalités du côté de la GSA, et de nouveaux produit côté Microsoft (je pense à Search Server).
Les évolutions de la GSA :
L'OS et la partie logicielle de la Google Search Applicance sont en perpetuelle évolution. La version 5 de la box Google est sortie durant l'été dernier... et elle n'est pas venue seule. Google avait mis à disposition un projet open source depuis un bon moment, visant à répondre au problème de sécurité. Ce projet, nommé "Access Connector", était basé sur une sorte de serveur web proxy utilisant le protocole SAML, chargé de garantir l'identité de l'utilisateur requêtant la Google Box. La documentation autour de ce projet était très pauvre, voire erronée, et le support très loin de ce à quoi on aurait pu s'attendre (ah oui, open source signifie de plus en plus projet sans engagement...)
Au final, j'avais pu mettre en place une solution de recherche Google dans SharePoint présentant les caractéristiques suivantes :
- Une grosse lenteur pour obtenir le résultat des requêtes (environ 30s)
- Des Timeouts très fréquents (une fois sur trois)
- Parfois des pages de résultats vides
Bref, ce n'est jamais passé en production même si, effectivement, lorsque les résultats étaient enfin obtenus, je savais pourquoi j'aime bien Google.
Le temps est donc passé, La GSA est passée en version 5 et une nouvelle version de l'Access Connector est apparue. Résultat des courses :
- Plus de timeout
- Des résultats s'affichant sous 8 à 10 secondes en général (grumpf)
- Plus d'incohérence sur les résultats
Quelles difficultés avec la GSA ?
Si l'authentification de vos sites SharePoint n'est pas en Kerberos, vous pouvez oublier la GSA. Dans le cas contraire, votre AD est-il bien en mode full 2003 ? Et dans ce cas, pouvez vous activer la délégation (Trusted for delegation) pour vos serveurs ? Sachez que toutes ces manipulations m'ont pris pas mal de temps, et même entouré du département éxploitation de mon client, j'ai fini par avoir une interruption de service non prévue sur les serveurs indexés.
Je savais que la mise en place de la GSA n'était pas chose aisée... et je ne comprends toujours pas pourquoi, même au sein de la SharePoint Conference 2008 la GSA est présentée comme un produit plug'n'play. L'occasion pour moi de vous montrer un bout de slide qui m'a fait bondir :

C'est n'importe quoi !
Evidemment, on peut considérer que c'est beaucoup plus simple si on ne se préoccupe pas des droits ni si on pense que les utilisateurs peuvent bien se logger avant chaque recherche... ces contraintes ne sont pas vraiment dans ma conception de ce qu'est un portail d'entreprise...
Les atouts de la GSA
Toujours les mêmes qu'il y a un an... la possiblité d'étendre les données indexées, de jouer sur les associations de données à remonter lors des recherches... et puis la pertinence. Que c'est bon d'avoir une interface de recherche simple qui remonte ce que l'on cherche sans avoir besoin de faire de recherche avancée. D'autres atouts encore, comme le multilangue et beaucoup d'autres choses. D'autant que d'autres outils sont apparus (comprenez open source)... je pense à des connecteurs visant à ramener des données de systèmes externes, dont SharePoint ! Autrement dit, enfin la possibilité d'utiliser la GSA intelligemment avec les sites SharePoint. Bon, ne nous emballons pas... je n'ai certes pas poussé très loin les tests, mais une journée complète ne m'aura pas permi d'obtenir quoi que ce soit ce connecteur
Alors, GSA avec SharePoint à présent ou pas ?
Difficile à dire, ça dépend de beaucoup d'éléments. Force est de constater que l'obtention des resultats de recherche reste lent et que ça ne risque pas de s'améliorer (c'est le fonctionnement normal de la GSA en mode authentifié). Côté fonctionnalités, la moindre chose demande un gros effort d'intégration. Certes, la Google Box peut faire plein de choses merveilleuses, mais pas toute seule. . Bref, je reste très mitigé sur l'utilisation de la GSA dans SharePoint... mais même si Google va lentement sur ce coup là, il semble aussi y aller surement si je me fie aux bonnes évolutions depuis l'année dernière. C'est donc à suivre pour moi.
Côté interface, c'est du XSL donc aucun soucis à l'intégrer pleinement dans son portail (comme l'illustre ma capture ci dessous... désolé pour le floot, je ne pouvais pas faire autrement)

Sous le floot se cache des résultats de recherche Google
Et le moteur de recherche de MOSS alors ?
Et bien c'est un vrai bon moteur de recherche. On est loin des incohérences du moteur SPS2003... loin au point de se demander pourquoi prendre un autre moteur de recherche (sauf recherche spécialisée évidemment). Cependant, le moteur de recherche de MOSS a connu quelques soucis techniques (je pense au memory leak pré SP1) et en connais encore quelques uns par moment. Côté fonctionnel, des choses toutes simples, OOB dans la recherche SPS 2003 ne sont plus possibles nativement dans MOSS 2007. Je pense à la recherche de personnes. La notion de distance sociale est excellente, certes. Mais lorsque les fonctionnels ne veulent pas en entendre parler et veulent retrouver leur classement par ordre alphabétique comme sous 2003, ça se corse. Bref, tout n'est pas rose du côté MOSS, mais ça reste quand même bien clair, directement intégré aux sites SharePoint, customisable, pertinent, et ça gère des stats de recherche...
Egalement, en version entreprise MOSS est capable d'indexer des données provenant de WebServices et de bases de données... là ou la GSA s'arrête à du DB2.
Conclusion
Pas de vainqueur ni de vaincu, comme vous deviez l'imaginer avant de lire ce post, car tout dépend de votre système d'information en place. Sachez toutefois que les deux solutions sont techniquement possible. La Google Search Appliance reste très lourde à mettre en place et demande un temps énorme s'intégrer aux sites SharePoint au même niveau que MOSS le fait, pour une rapidité d'éxécution moins bonne au final, mais une pertinence qui a fait la renommée de Google. De son côté, MOSS bénéfice de la recherche OOB et de formulaires de recherche extensibles et propices à une bonne recherche en entreprise. Dans le cas ou vous êtes sur WSS et que vous vous posez la question du moteur de recherche, sachez que vous avez également la solution Microsoft Search Server et la Google Mini 
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :