Indexation Web: contrôlez vos créations de tags

Popularisée par l’essor des sites Internet permettant aux internautes de poster leurs contenus et de les classer à leur guise (Web 2.0), parmi lesquels des sites de partage de photos ou de vidéos, l’indexation libre permet de développer la sérendipité sur le site et de dépasser la spécificité d’un domaine, mais répond à une logique personnelle, propre à l’auteur du contenu en question, et non collective. Les folksonomies doivent donc appréhendées avec précaution dans le cadre de l’élaboration des plans de classement des sites Internet.

Faciles à mettre en œuvre, souples, adaptables, couvrant l’ensemble des ressources documentaires, les folksonomies occultent toutefois les spécificités de ces contenus et favorisent la vision d’un internaute et non l’intérêt collectif. Variations et erreurs orthographiques, synonymie et niveaux de langages divers, ambigüité et manque d’expertise (un comble pour la presse professionnelle) marquent ce système d’indexation et l’affaiblissent, d’où la limitation de son recours. Le manque de relations hiérarchiques est également incriminé. Lire la suite

Liens: indexation web, Obama et l’information, veille

99,97 % du Web non-indexé ?

Documents verrouillés, techniques de référencement à la maîtrise inégale, liens morts ou pages non-réactualisées, inadaptation aux standards, sites blacklistés: les raisons qui conduisent à une non-indexation au sein des principaux moteurs de recherche sont nombreuses. Si les fondateurs de Google s’étaient fixés pour objectif, en créant la gigantesque régie publicitaire d’aujourd’hui, de donner accès à toutes les ressources – quitte à entraver les textes législatifs ou à les forcer, comme on le voit actuellement avec son programme de numérisation de livres -, force est de constater que leur but est loin d’être atteint. Pour parvenir à ce chiffre de 99,97%, le « web profond », le quotidien britannique The Guardian s’est appuyé sur des travaux universitaires et a interrogé des spécialistes de l’indexation. Les tentatives de création d’un historique telles qu’Archive.org semblent, après publication de ce chiffre, bien vaines… Lire la suite