Liens: indexation web, Obama et l’information, veille

99,97 % du Web non-indexé ?

Documents verrouillés, techniques de référencement à la maîtrise inégale, liens morts ou pages non-réactualisées, inadaptation aux standards, sites blacklistés: les raisons qui conduisent à une non-indexation au sein des principaux moteurs de recherche sont nombreuses. Si les fondateurs de Google s’étaient fixés pour objectif, en créant la gigantesque régie publicitaire d’aujourd’hui, de donner accès à toutes les ressources – quitte à entraver les textes législatifs ou à les forcer, comme on le voit actuellement avec son programme de numérisation de livres -, force est de constater que leur but est loin d’être atteint. Pour parvenir à ce chiffre de 99,97%, le « web profond », le quotidien britannique The Guardian s’est appuyé sur des travaux universitaires et a interrogé des spécialistes de l’indexation. Les tentatives de création d’un historique telles qu’Archive.org semblent, après publication de ce chiffre, bien vaines… Lire la suite