Rychly binarni diff

Jan Pechanec jp at devnull.cz
Wed Feb 17 21:01:25 CET 2010


On Wed, 17 Feb 2010, Dan Lukes wrote:

> A jestli ne ?
>
> Zalezi jestli budou soubory casteji shodne nebo casteji ruzne. Pokud se da
> ocekavat, ze budou vetsinou ruzne, pak si muzeme dovolit v pripade shodneho
> hashe soubory skutecne 1:1 porovnat. Nebudeme to delat casto.
>
> Pokud se naopak da ocekavat, ze soubory jsou vetsinou shodne je vhodnejsi jiny
> postup - spocitat druhy hash jinym algoritmem. Treba md4 (u me 11 sekund).

	pravdepodobnost, ze nahodne vybrane 2 soubory budou mit stejny MD5 
hash, je 1/2^128, je to tak? Ruznych moznosti, jak to vyjde, je 2^128*2^128, 
a moznosti, kdy je hash stejny, je 1^128. Z toho mi vychazi 1/2^128.

	je "potreba" dal kontrolovat? Pokud ano, to uz asi je potreba 
kontrolovat bajt po bajtu, protoze ani 2 nebo 3 ruzny algoritmy uz nemusi 
stacit.

	muze se nam stat chyba pokud pouzijeme hash? Samozrejme muze, ja 
nerekl ze ne. Ale stejne jako u bezpecnosti, nejslabsi clanek je ten 
rozhodujici. MD5 to zde opravdu neni.

> Pravdepodobnost simultanni kolize dvou ruznych algoritmu na neshodnych datech
> je uz opravdu velice mala.

	ja si nemyslim, ze udelat dalsi sumu neni fajn, ale opravdu si 
myslim, ze je to v uvazovanym pripade naprosto zbytecny.

	h.

-- 
Jan Pechanec <jp (at) devnull (dot) cz>
http://www.devnull.cz


More information about the Users-l mailing list