Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

Blog Technique de Romelard Fabrice

Les dernières Actualités de Romelard Fabrice (Alias fabrice69 ou F___) principalement autour des technologies Microsoft

Actualités

  • Toutes les actualités et informations sur les technologies Microsoft principalement autour de .NET et SQL Server

Archives

MOSS Search : Quelle fréquence et type d’indexation pour les sources de contenu SharePoint

Dans le cadre de la mise en place de ferme MOSS, la question de la recherche devient cruciale. On doit bien sur configurer le moteur de recherche, comme expliqué dans cet article :

Vient ensuite la planification de l’indexation. En effet, il existe, comme dans de nombreux autres systèmes, deux type d’indexation pour une source de données :

  • L’indexation complète (ou Full Crawl)
  • L’indexation incrémentale (ou Incremental Crawl)

Ainsi, on se pose rapidement la question des différences entre ces deux types d’indexation ?

On peut facilement justifier de ces différences (Full et Incremental) sur un système de sauvegarde, mais comment expliquer celles-ci dans un moteur d’indexation.

Microsoft a ainsi mis à notre disposition un document (White Paper) sur le sujet que l’on peut trouver sur le site Technet :

Ce document vous fournit différentes informations dont justement ces différences (Page 15).

Ainsi, on apprend que l’incrémentale (pour une source de contenu SharePoint 2007) n’indexera que les différences (Changement des documents, modification des sécurités ou métadata, suppression, ajout, …) des listes documentaires. Il ne sera pas fait de mise à jour si vous ajoutez des nouvelles vue dans vos listes ou des pages ASPX, ce qui n’est pas forcément un drame en soit. Je vous laisse découvrir les autres différences.

Une fois cette information comprise, on se pose alors la question de la planification, quand doit-on choisir chaque type d’indexation ?

Ainsi, le document nous explique les différents cas où on doit effectuer une indexation complète. Pour faire simple, les cas sont du type :

  • Pour initialiser, réparer ou réinitialiser notre index (car pour effectuer une incrémentale, il faut déjà avoir effectué un Full)
  • Suite à l’installation de Patch ou Service Pack (sur l’indexeur ou la source)
  • Appliquer de nouvelles règles d’indexation (crawl rules) ou changement du schéma des propriétés de recherche
  • Si on veut réindexer toutes les pages ASPX (nouvelles pages ajoutées)
  • Après une indexation arrétée par l’administrateur ou ayant subit 100 erreurs lors de l’indexation incrémentale
  • Quand on effectue une restauration des bases de contenu ou que le temps de rétention de l’îndexeur sont trop long

On voit donc bien que ce sont pour la plupart des cas, des situations d’urgences mais possibles, surtout si on travaille dans un environnement distribué (nombreuses fermes régionales).

On doit donc effectuer un choix en fonction de différents critères comme :

  • Le nombre de documents
  • Le débit disponible dans son réseau
  • Le taux de renouvellement ou de modification
  • Les heures de travail (pour choisir la plage entrainant le moins d’impact)

Dans mon cas précis (14 fermes régionales WSS V3 réparties dans le monde entier avec des débits variables), nous avons choisi une répartition simple (à expliquer et à mettre en place) qui diminue au maximum le travail de l’indexeur tout en fournissant un service optimal :

  • Indexation complète répartie sur 14 semaines (chaque dimanche, l’indexeur travaillera une ferme locale différente)
  • Indexation Incrémentale chaque jour de semaine (mais planifiée à une heure de nuit pour chaque ferme locale afin de ne pas pénaliser les utilisateurs locaux)

Le fait de faire un incrémental chaque nuit (dans la ferme distante) permet de diminuer le nombre de documents à mettre à jour dans l’index et donc diminuer le temps pris par le moteur pour travailler avec la ferme WSS V3 distante. De plus, cela permet d’assurer au moteur d’indexation du travail sur quasiment toute la plage des 24 Heures.

La rotation sur 14 semaines de l’indexation complète permet d’assurer la qualité de notre index, car tous les 3 mois tout l’index de chaque source est totalement rafraichi. On limite aussi les impacts d’une modification éventuelle effectuée dans les fermes locales sans que l’administrateur du moteur de recherche soit averti. Cela permet enfin de limiter les risques de déclenchement automatique du Full Crawl (comme cela peut arriver lors de problèmes sur l’incrémental).

Le document est relativement court, mais fourni des informations indispensables pour tout administrateur de ferme MOSS.

Romelard Fabrice [MVP]

Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :
Posted: mercredi 16 juillet 2008 09:00 par ROMELARD Fabrice

Commentaires

Pas de commentaires

Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- Office 365: Nettoyage des versions de List Item avant migration depuis SharePoint On Premise vers SharePoint Online par Blog Technique de Romelard Fabrice le 08-08-2017, 15:36

- Office 365: Comment supprimer des éléments de liste SharePoint Online via PowerShell par Blog Technique de Romelard Fabrice le 07-26-2017, 17:09

- Nouveau blog http://bugshunter.net par Blog de Jérémy Jeanson le 07-01-2017, 16:56

- Office 365: Script PowerShell pour assigner des droits Full Control à un groupe défini par Blog Technique de Romelard Fabrice le 04-30-2017, 09:22

- SharePoint 20XX: Script PowerShell pour exporter en CSV toutes les listes d’une ferme pour auditer le contenu avant migration par Blog Technique de Romelard Fabrice le 03-28-2017, 17:53

- Les pièges de l’installation de Visual Studio 2017 par Blog de Jérémy Jeanson le 03-24-2017, 13:05

- UWP or not UWP sur Visual Studio 2015 ? par Blog de Jérémy Jeanson le 03-08-2017, 19:12

- Désinstallation de .net Core RC1 Update 1 ou SDK de Core 1 Preview 2 par Blog de Jérémy Jeanson le 03-07-2017, 19:29

- Office 365: Ajouter un utilisateur ou groupe dans la liste des Site collection Administrator d’un site SharePoint Online via PowerShell et CSOM par Blog Technique de Romelard Fabrice le 02-24-2017, 18:52

- Office 365: Comment créer une document library qui utilise les ContentTypeHub avec PowerShell et CSOM par Blog Technique de Romelard Fabrice le 02-22-2017, 17:06