Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

SharePoint Grib's Lair

Journal technique de Sébastien PICAMELOT

Le temps d’exploration des moteurs de recherche : principaux facteurs

Je relaie un billet de Joel Oleson sur ce thème qui me tient à coeur : la recherche en entreprise.
Il indique quels sont les principaux facteurs influant sur le temps nécessaire à l’indexation :

  • Le nombre de threads d’indexation/d’exploration, 
  • La taille des documents à indexer, leur type, ainsi que les Ifilters utilisés pour les parcourir, 
  • Le type de réseau ainsi que ses caractéristiques : bande passante, temps de latence, perte de paquets,
  • Mémoire / Utilisation CPU / Utilisation de ou des interface(s) réseau sur le serveur de destination et sur les serveurs source,
  • L’applicatif sur le serveur de destination (WSS 2.0, WSS 3.0 SPS 2003, MOSS 2007, dossiers partagés, Sites Web, etc…)  et le type d’indexation (incrémental/full), 
  • Le Business Data Catalog utilise ses propres threads pour l’exploration de données structurées et peut donc être un facteur supplémentaire. 

Quelques ordres de grandeur :

  • De quelques dizaines à quelques centaines de Mo  : à  compter  en minutes,
  • De quelques dizaines à quelques centaines de Go : à compter en heures, 
  • De un à dix To : à compter en jours, potentiellement de l’ordre d’une semaine,
  • De 10 à 100 To : à compter en semaines.

Il indique également qu’a été observée une moyenne de 20 documents indexés par seconde dans un contexte très favorable contre une moyenne de 5 par secondes dans de moins bonnes conditions. Bien sûr, la moyenne dépend de la source explorée.

Il cite également d’un document sur les performances de recherche et le « capactity planning » (dimensionnement d’architecture) actuellement à l’état de draft, mais qui sera probablement publié le mois prochain.

Références :
Plan to deploy index and query servers

Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :
Posted: vendredi 9 février 2007 09:25 par Gribouillon
Classé sous : ,

Commentaires

Pas de commentaires

Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- Merci par Blog de Jérémy Jeanson le 10-01-2019, 20:47

- Office 365: Script PowerShell pour auditer l’usage des Office Groups de votre tenant par Blog Technique de Romelard Fabrice le 04-26-2019, 11:02

- Office 365: Script PowerShell pour auditer l’usage de Microsoft Teams de votre tenant par Blog Technique de Romelard Fabrice le 04-26-2019, 10:39

- Office 365: Script PowerShell pour auditer l’usage de OneDrive for Business de votre tenant par Blog Technique de Romelard Fabrice le 04-25-2019, 15:13

- Office 365: Script PowerShell pour auditer l’usage de SharePoint Online de votre tenant par Blog Technique de Romelard Fabrice le 02-27-2019, 13:39

- Office 365: Script PowerShell pour auditer l’usage d’Exchange Online de votre tenant par Blog Technique de Romelard Fabrice le 02-25-2019, 15:07

- Office 365: Script PowerShell pour auditer le contenu de son Office 365 Stream Portal par Blog Technique de Romelard Fabrice le 02-21-2019, 17:56

- Office 365: Script PowerShell pour auditer le contenu de son Office 365 Video Portal par Blog Technique de Romelard Fabrice le 02-18-2019, 18:56

- Office 365: Script PowerShell pour extraire les Audit Log basés sur des filtres fournis par Blog Technique de Romelard Fabrice le 01-28-2019, 16:13

- SharePoint Online: Script PowerShell pour désactiver l’Option IRM des sites SPO non autorisés par Blog Technique de Romelard Fabrice le 12-14-2018, 13:01