osint:plateformedecache

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révisionLes deux révisions suivantes
osint:plateformedecache [2020/08/16 15:49] tekosint:plateformedecache [2020/08/16 16:13] tek
Ligne 17: Ligne 17:
 Ici, la page mise en cache date du 10 août, soit 6 jours avant que j'y accède au moment de l'écriture de ce guide. La mise en page n'est pas aussi parfaite que sur la page originale, probablement à cause de problèmes de cache avec le CSS. (Attention, il faut bien noter que seul le HTML est mis en cache, ce qui veut dire que toutes les ressources comme les images ou le CSS sont encore stockées sur le site original, pensez-y en terme de sécurité dans vos recherche, voir la partie [[osint:preparer-son-poste|Préparer son poste]] de ce guide) Ici, la page mise en cache date du 10 août, soit 6 jours avant que j'y accède au moment de l'écriture de ce guide. La mise en page n'est pas aussi parfaite que sur la page originale, probablement à cause de problèmes de cache avec le CSS. (Attention, il faut bien noter que seul le HTML est mis en cache, ce qui veut dire que toutes les ressources comme les images ou le CSS sont encore stockées sur le site original, pensez-y en terme de sécurité dans vos recherche, voir la partie [[osint:preparer-son-poste|Préparer son poste]] de ce guide)
  
-Ces pages peuvent être très utile pour voir des modifications récentes sur des pages, mais plus encore pour accéder à du contenu supprimé, les moteurs de recherche indexent énormément de choses, y compris des pages de réseaux sociaux. Toutes les astuces de recherche listées dans la page précédentes sur les [[osint:moteursderecherche|moteurs de recherches]] peuvent vous aider pour retrouver du contenu supprimé récemment. Par exemple, vous pouvez utiliser une recherche comme <code>site:twitter.com/n0thing2hide</code> dans Google pour avoir une liste des tweets du compte Twitter de nothing2hide et retrouver en cache les tweets supprimés récemment.+Ces pages peuvent être très utile pour voir des modifications récentes sur des pages, mais plus encore pour accéder à du contenu supprimé, les moteurs de recherche indexent énormément de choses, y compris des pages de réseaux sociaux. Toutes les astuces de recherche listées dans la page précédentes sur les [[osint:moteursderecherche|moteurs de recherches]] peuvent vous aider pour retrouver du contenu supprimé récemment. Par exemple, vous pouvez utiliser une recherche comme //site:twitter.com/n0thing2hide/dans Google pour avoir une liste des tweets du compte Twitter de nothing2hide et retrouver en cache les tweets supprimés récemment.
  
 Les moteurs de recherche suivant donnent également accès au cache de leurs pages indexées: Les moteurs de recherche suivant donnent également accès au cache de leurs pages indexées:
Ligne 29: Ligne 29:
 La [[https://web.archive.org/|Wayback Machine]] de [[http://archive.org/|Internet Archive]] est probablement votre meilleur outil de cache dans une investigation en ligne. L'ONG Internet Archive s'est donné pour mission d'archiver le plus possible d'Internet afin de sauvegarder des connaissances et les mettre à disposition de tout le monde. Pour cela, iels ont développé des robots qui parcourent le web et archivent des pages web. Ces pages sont ensuite accessibles dans la Wayback Machine. La [[https://web.archive.org/|Wayback Machine]] de [[http://archive.org/|Internet Archive]] est probablement votre meilleur outil de cache dans une investigation en ligne. L'ONG Internet Archive s'est donné pour mission d'archiver le plus possible d'Internet afin de sauvegarder des connaissances et les mettre à disposition de tout le monde. Pour cela, iels ont développé des robots qui parcourent le web et archivent des pages web. Ces pages sont ensuite accessibles dans la Wayback Machine.
  
-Prenons le site de Nothing 2 Hide par exemple, nothing2hide.org. En faisant une recherche dans [[https://web.archive.org/web/2019*/http://nothing2hide.org/|la WayBack Machine]] avec l'url <code>https://web.archive.org/web/2019*/http://nothing2hide.org/</code>, on voit un historique de toutes les sauvegardes faites par Internet Archive:+Prenons le site de Nothing 2 Hide par exemple, nothing2hide.org. En faisant une recherche dans [[https://web.archive.org/web/2019*/http://nothing2hide.org/|la WayBack Machine]] avec l'url http://nothing2hide.org/, on voit un historique de toutes les sauvegardes faites par Internet Archive:
  
 {{ :osint:cache3.png?800 |}} {{ :osint:cache3.png?800 |}}
  
 +Par exemple, voici comment était le site de Nothing 2 Hide en [[https://web.archive.org/web/20180710130825/https://nothing2hide.org/fr/|Juillet 2018]] : 
 +
 +{{ :osint:cache4.png?600 |}}
 +
 +Une fonctionnalité intéressante de la Wayback Machine est la possibilité de voir toutes les pages archivées pour un site web. Pour cela, il faut faire une recherche en ajoutant un ***** à votre rercherche, par exemple [[https://web.archive.org/web/*/http://nothing2hide.org/*[http://nothing2hide.org/*]] :
 +
 +{{ :osint:cache5.png?600 |}}
 +
 +Attention, les sites peuvent demander à avoir leurs données supprimées de la Wayback Machine, c'est par exemple ce qu'à fait l'entreprise vendeuse de stalkerware [[https://www.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|Flexispy]] lorsque les média se sont intéressés à ce marché. Il est dont tout à fait possible que certains sites qui vous intéressent ne soient pas accessible dans la Wayback Machine.
  
  
Ligne 43: Ligne 52:
  
  
 +===== Aller plus loin ======
 +
 +Quelques ressources complémentaires sur le cache (en anglais): 
 +  * https://kit.exposingtheinvisible.org/en/how/web-archive.html
  
 +Plusieurs outils en ligne de commande peuvent être intéressants pour automatiser des recherches ou le téléchargement de données : 
 +  * [[https://github.com/hartator/wayback-machine-downloader|wayback-machine-downloader]] permet de télécharger du contenu de la Wayback machine 
 +  * [[https://github.com/pastpages/savepagenow|savepagenow]] permet de sauvegarder une page dans la Wayback Machine
 +  * [[https://github.com/pastpages/archiveis|archiveis]] permet de sauvegarder une page dans archive.today