Lors d’une de mes précédentes participations au meeting du Club MOSS à Paris, j’avais évoqué la problématique à laquelle je faisait face depuis peu.
En effet, la structure mondiale de mon entreprise nous oblige à avoir un environnement éclaté en terme d’infrastructure SharePoint. Ainsi, nous avons donc une quinzaine de fermes Windows SharePoint Services V3 (WSS) de par le monde et une cinquantaine de Web Applications. Cela nous donne environ 2000 collections de sites WSS (allant de quelques MB à plusieurs dizaines de GB).
Tout cela est indexé par une ferme Microsoft Office SharePoint Server 2007 (MOSS) standard, intégrant une répartition des sources de contenu par Web Application, soit donc une cinquantaine de sources de contenu.
L’idée est donc au départ éléguante, mais c’était sans compter sur :
- La problématique de la grille des temps d’indexation
- Périodicité des indexations incrémentales
- Périodicité des indexations complètes
- Le débit disponible sur le réseau
- Le temps d’indexation de chaque source, dépendant
- du volume de contenu à indexer
- de la disponibilité des fermes à indexer (charge, performances, utilisation pour autre chose, …)
- du débit réseau disponible
- …
- Le cas particulier du reset d’une indexation incrémentale
En effet, lorsque SharePoint est entrain d’effectuer une indexation incrémentale sur une source de contenu, tout problème devient très critique. Si quelque chose devait toucher le serveur d’indexation durant ce temps, celle-ci est annulée et la source de contenu est considérée comme devant être totalement réindexée “Crawling Full”.
Tout cela pour en arriver à ma situation actuelle qui est plutôt compliquée à gérer, car je ne peux pas couper les indexations en cours, mais celles-ci sont quasiment interminables. Je vous montre une capture de la page d’administration du Search pour que vous compreniez
J’ai donc dépassé les 700 Heures (soit quasiment un mois) d’indexation pour certaines sources de contenu, que ce soit en “Crawling Full” ou “Crawling Incremental”, comme vous pouvez le voir ci-dessous
En conclusion, je vous conseille de faire une réelle évaluation avant de planifier les indexations des sources de contenu. Il est préférable de faire une grille des temps, avec pour chaque source :
- Le temps pour une indexation Full
- Le temps pour une incrémentale (une estimation au pire)
- Le degré d’importance de “fraicheur des données”
Ensuite, de vous placer cela sur une feuille excel (ou Project) avec une marge entre chaque lancement et enfin de paramàtrer vous sources avec la périodicité obtenue.
Dans le cas contraire, vous risquez de venir me rejoindre dans les affres de l’indexation continue.
Romelard Fabrice [MVP]
Commentaires
Enregistrer un commentaire