Bienvenue à Blogs CodeS-SourceS Identification | Inscription | Aide

The Mit's Blog

En plus d'intégrer et skier, il sait même écrire !
(Blog de Renaud Comte)

Actualités


  • Ancien MVP SharePoint 8 ans ...
    Des projets .Net, SharePoint 2013 ou Office 365 ??

    Contactez-nous :

Archives

SharePoint et l'indexation de sources externes

Je reprends mon job, merci Fabrice pour l'interim (désolé private Joke)

SPS 2003 contient un moteur de recherche vraiment sympathique. indexant aussi bien différents fomats via les ifilters (du zip au PDF en passant par les MP3 ) que sur des partages réseaux ou des sites HTTP secures ou non

Cependant, il faut bien différencier l'indexation d'un site local comme un WSS ou un share avec un site distant sous bande passante réduite.

Et oui, un crawleur comme SPS est loin d'être léger quand il démarre : les documents sont téléchargés indexés et ainsi de suite provoquant charge reseau et procésseur
>>> essayez donc de rafraichir 20 gig de Data via l'indexeur à 9heures le matin, vous pourrez directement constater la géne occasionnée !!!

Il y a quelques régles à suivre qui sont en fait tout à fait simple et logique

  1. préférez les maj incrementales aux heures creuses et une compléte toute les semaines ou le mois
    >> la compléte permet d'avoir un index performant alors que l'incremental le degrade doucement
     
  2. Attention à la charge !!
    >>> prévoyez un réglage de la fréquence dans la globale admin
    - trop de documents simultanés peut largement pénalisé le serveur
    - laissez un laps de temps entre 2 indexes pour lissé l'impact de charge
    (demandez donc à Nix la charge du robot google sur CS quand ca démarre ...)
     
  3. Passez en mode avancé, et créez votre propre index pour le separer de votre portail ou site intranet (PortalNonContent)
    >>> vous avez ainsi vos propres régles et propre log : tout est plus simple
     
  4. Vérifiez vos logs de reussite / echec afin de controler que le site indéxé ne génére pas d'erreur du fait de la charge, et oui, le resultat d'indexation ne serait que plus erronée
     
  5. Si vous utilisez des tags ou autres, n'oubliez pas le fameux fichier ROBOT voir le meta tag Robot content="no-index" pour eviter d'indexer certaines pages ou alourdir le volume de recherche
     
  6. Il peut être intéressant de créer des pages dynamique réserver pour l'indexation avec des vues spécifiques
    - lien vers des fiches avec querystring (liaison BDD par Exemple)
    - lien vers des pages difficile d'accés (Menu Flash, ou navigation complexe )
    >>> il suffit d'identifier le compte d'indexation et/ou le user Agent de votre robot
    Par défaut dans SPS, il s'agit de Mozilla/4.0 (compatible; MSIE 6.0; Windows NT; MS Search 4.0 Robot)

Et il y a encore plein d'autre points ...

Je ne saurais trop vous conseiller aussi la lecture de ces 2 liens

Et bon crawling à tous

Renaud Comte aka TheMit

Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :
Posted: jeudi 27 avril 2006 15:05 par themit
Classé sous :

Commentaires

F___ French Blog a dit :


Maintenant que mon interim est terminée sur Sharepoint (la mise en place de la corbeille sos SharePoint...
# mai 1, 2006 21:36
Les commentaires anonymes sont désactivés

Les 10 derniers blogs postés

- Merci par Blog de Jérémy Jeanson le 10-01-2019, 20:47

- Office 365: Script PowerShell pour auditer l’usage des Office Groups de votre tenant par Blog Technique de Romelard Fabrice le 04-26-2019, 11:02

- Office 365: Script PowerShell pour auditer l’usage de Microsoft Teams de votre tenant par Blog Technique de Romelard Fabrice le 04-26-2019, 10:39

- Office 365: Script PowerShell pour auditer l’usage de OneDrive for Business de votre tenant par Blog Technique de Romelard Fabrice le 04-25-2019, 15:13

- Office 365: Script PowerShell pour auditer l’usage de SharePoint Online de votre tenant par Blog Technique de Romelard Fabrice le 02-27-2019, 13:39

- Office 365: Script PowerShell pour auditer l’usage d’Exchange Online de votre tenant par Blog Technique de Romelard Fabrice le 02-25-2019, 15:07

- Office 365: Script PowerShell pour auditer le contenu de son Office 365 Stream Portal par Blog Technique de Romelard Fabrice le 02-21-2019, 17:56

- Office 365: Script PowerShell pour auditer le contenu de son Office 365 Video Portal par Blog Technique de Romelard Fabrice le 02-18-2019, 18:56

- Office 365: Script PowerShell pour extraire les Audit Log basés sur des filtres fournis par Blog Technique de Romelard Fabrice le 01-28-2019, 16:13

- SharePoint Online: Script PowerShell pour désactiver l’Option IRM des sites SPO non autorisés par Blog Technique de Romelard Fabrice le 12-14-2018, 13:01