Outils du site

Outils pour utilisateurs


Panneau latéral

P2PFR:Wiki

glossaire:checksum (lu 8501 fois)

Checksum & Hash (Somme de contrôle)

Il s'agit d'une suite courte de caractères qui est calculée à partir des données d'un fichier. Ainsi, si les données du fichier comportent la moindre variation par rapport à leur original, le checksum n'aura plus du tout la même valeur. Comparer le checksum permet ainsi de vérifier si 2 fichiers sont identiques.

On parle parfois de “hash” (anglais) ou de “condensé” (voire de “condensat”) pour désigner cette suite de caractères.

Il s'agit d'un procédé couramment utilisé lors des transferts de données, à différents niveaux (couche physique, TCP/IP, bittorrent…) et de façon automatique.

Lorsque ce calcul n'est pas fait de façon automatique (comme lors du transfert par HTTP…) et que l'intégrité du fichier téléchargé a une importance, ce calcul peut aussi être effectué manuellement à l'aide d'outils tels que md5sum ou sha1sum. Exemple: pour vérifier que le gros fichier ISO qu'on a téléchargé ne contient pas d'erreur et est identique à l'original avant de le graver sur CD/DVD.

Bien que l'algorithme utilisé pour ce calcul soit choisi de façon à ce qu'il soit peu probable que 2 fichiers différents aient le même hash, certains algorithmes (md5) garantissent moins bien cela que d'autres (sha512). Il est donc plus ou moins facile et possible pour une personne qui le souhaiterait de forger un fichier ayant le même hash qu'un autre, tout en ayant un contenu différent.

Puisque les hashs sont censés identifier des fichiers, ce principe technique est utilisé comme base de certains P2P pour identifier les oeuvres. On peut faire correspondre un hash à une oeuvre. Les réseaux P2P qui en tirent partie sont eMule (de façon moindre) et BitTorrent (de façon intensive).

Sur eMule, les sommes de contrôle sont essentiellement utilisées comme parade aux faux fichiers (fakes). Or, les hashs peuvent être couteux en puissance de calcul, ce qui est problématique quand on doit vérifier de grandes quantités de données. C'est pourquoi eMule ne calcule les hashs que sur une partie du fichier (et non sa totalité).

Avec BitTorrent, les hashs sont calculés sur l'intégralité des fichiers à échanger. Ils sont enregistrés au sein du fichier .torrent, ou bien ils peuvent être directement transmis à l'internaute sous la forme d'un lien magnet://.

glossaire/checksum.txt · Dernière modification: le 21/07/2017 à 23h07 par 111110101011