Liens: indexation web, Obama et l’information, veille

99,97 % du Web non-indexé ?

Documents verrouillés, techniques de référencement à la maîtrise inégale, liens morts ou pages non-réactualisées, inadaptation aux standards, sites blacklistés: les raisons qui conduisent à une non-indexation au sein des principaux moteurs de recherche sont nombreuses. Si les fondateurs de Google s’étaient fixés pour objectif, en créant la gigantesque régie publicitaire d’aujourd’hui, de donner accès à toutes les ressources – quitte à entraver les textes législatifs ou à les forcer, comme on le voit actuellement avec son programme de numérisation de livres -, force est de constater que leur but est loin d’être atteint. Pour parvenir à ce chiffre de 99,97%, le “web profond”, le quotidien britannique The Guardian s’est appuyé sur des travaux universitaires et a interrogé des spécialistes de l’indexation. Les tentatives de création d’un historique telles qu’Archive.org semblent, après publication de ce chiffre, bien vaines… Lire la suite

Suivre

Get every new post delivered to your Inbox.