Lors de la mise en place d’une ferme SharePoint intégrant le service de recherche, il est de bon ton d’installer les filtres de recherche (ifilter) pour le PDF mais surtout pour les documents Office au format OpenXML.
Microsoft Office 2007 iFilter Pack
Chez Microsoft, ce package est mis à la disposition de tous avec le nom :
Cette version est aussi nommée iFilter pack 1.0 et permet d’indexer tous les documents Office au format OpenXML (docx, xlsx, pptx, …) ou au format précédent OpenXML (doc, xls, ppt, …).
Erreur d’indexation des fichier Visio (VSD)
Le fait est que ce filtre n’est pas excempte de soucis et particulièrement pour les documents VISIO (VSD), comme on le voit expliqué dans ce message :
Ainsi le moteur de recherche lorsque la ferme est installée en 64 Bits prend beaucoup de temps lors de l’indexation avec ce pack de filtres, mais surtout n’arrive pas à indexer correctement les fichiers VISIO. Ces fichier VISIO s’accumulent dans le répertoire temporaraire du compte d’indexation :
- C:\Documents and Settings\[SearchServiceAccount]\Local Settings\Temp\gthrsvc\
Et les sources de contenu mettent un temps très long à être indexé. De plus, on trouve un grand nombre d’erreurs dans les logs d’indexation avec le message :
http://xxxxTeamSite/sites/...yyyyyVSDFile.vsd
The filtering process has been terminated
La raison vient du fait que ce pack de filtres n’a pas été correctement optimisé pour les environnement X64, un patch a été publié depuis pour corriger ces erreurs :
Microsoft Office 2010 iFilter Pack
Depuis, Microsoft Office 2010 a été livré accompagné de son pack de filtres :
Ainsi que le Service Pack 1 de ce pack de filtres :
- Service Pack 1 for Microsoft Office Filter Pack 2010 (KB2460041) 64-bit Edition
- Détails du Service Pack 1 du pack de filtres
Ce pack de filtres comprends les fichiers de type :
- Legacy Office Filter (97-2003; .doc, .ppt, .xls)
- Metro Office Filter (2007; .docx, .pptx, .xlsx)
- Zip Filter
- OneNote filter
- Visio Filter
- Publisher Filter
- Open Document Format Filter
Il faut donc couper le service de recherche du serveur d’indexation, supprimer le pack de filtres 1.0 et installer celui de 2010, puis son service pack 1. On redémarre le service de recherche et on relance une indexation de son contenu (de préférence un Full Crawl).
Il est aussi préférable de faire la même opération sur tous vos serveurs ayant le service de recherche :
- WSS V3 Search
- MOSS Search
- SP Search Server 2008
- SharePoint Foundation 2010 Search
- SharePoint Server 2010 Search
- SP Search Server 2010
- Indexing Services
- SQL Server index
- Exchange Server
Conclusion
Selon mes premières observations, l’indexation des documents Office devient alors beaucoup plus rapide, on peut à peine les voir passer dans le répertoire temporaire du compte de service :
- C:\Documents and Settings\[SearchServiceAccount]\Local Settings\Temp\gthrsvc\
Il faut donc pour ma part, relancer l’indexation Full Crawl de mes 60 sources de contenu distantes, soit environ 8-9 Millions de documents à travers le monde. Nous verrons bien si cette mise à jour aide à l’efficacité de cette indexation.
Romelard Fabrice [MVP]
Commentaires
Enregistrer un commentaire