Ky6uk
15.01.2013 10:27 ШОRK
Псач, у меня к тебе внезапный профессиональный вопрос. Какой алгоритм хеширования не зависит от размера файла. Т.е. просчет хеша файла в 2 терабайта занимает столько же времени, что и файла в 17 байт. Гуглить не могу по личным причинам.
лол
ппц ты, я же серьезно спрашиваю
https://sites.google.com/site/murmurhash...
>Excellent performance — measured on an Intel Core 2 Duo @ 2.4 ghz
>MurmurHash 2.0 — 2056.885653 mb/sec
stat -c %s filename.txt
паталогически боюсь новых алгоритмов. А вдруг там всё в КОЛЛИЗИЯХ?
>Excellent collision resistance — Passes Bob Jenkin's frog.c torture-test. No collisions possible for 4-byte keys, no small (1- to 7-bit) differentials.
а если у меня 100 файлов идентичного размера, лолка?
тогда collision, очевидно
утверждение рандомного пса
А зачем тогда спрашиваешь?
wof
есть же много старых алгоритмов, проверенных временем
Интересный и до сих пор не закрытый философский вопрос... Если один алгоритм проверен временем, а второй алгоритм проверен formal verification (на Coq, причём за авторством @gds), то какому алгоритму, ты, @Ky6uk отдашь предпочтение, зная, что первый алгоритм — старый, а второй алгоритм — новый?
wof
лол
Вомбат, батяня, батяня, вомбат.
Считай хеш по 10 байтам в середине файла, бгг
int hash(FILE* pf) { return 1; }
З.Ы. не благодари
Добавил в избранное
тот, который не читает весь файл, obv.
/18
/4
Тогда считать только изменяющуюся часть файла
Берешь размер файла, прибавляешь к числу путь к файлу, делаешь хеш. Профит.
А если все в одно директории валяется?
Почти победил ИТТ, если бы не "делаешь хеш" — нет нерекурсивного выхода, лол
и если они еще и называются все одинаково? :cf:
И размер файла одинаковый?
И вообще это хардлинки
да. 100 файлов в одной директории с одним именем и размером.
Я имел ввиду путь+имя файла.
Но ntfs этого не позволит.
не пизди, 146
СЛАВА РУСИ
1488
mkfs.rus
благородные доны, ввиду редукции сей дискуссии к дедфудотреду, спешу откланяться
посмотрите, кто говорит. говорит автор /18
Тупо похуй на тебя. ПППССССССССССССсссссс поссал на обиженку.
он в *пидарас-листе, настроил автообсыкалку
Алсо, считай хеш при создании/редактировании каждого отдельного файла обычным sha1 и храни где-нибудь рядом. Или нужно ВСЕХ СРАЗУ ПОСЧИТАТЬ ХЕШ БЫСТРО БЛЯТЬ?
короче бестолковых советов тред объявляю закрытым, завтра что-нибудь придумаю
гагага
Ты пипец тупой, придумай простой нерекурсивный выход для /24 и ответ готов
у меня рабочий день кончился, сорри
Возьми себе ещё, я угощаю
Короче, по результатам обсуждения правильный ответ такой:
на входе filename
найти filesize
найти fullpath // или сразу требовать вместо filename
вернуть crc32/md5/sha ( от filesize + fullpath)
можно ещё посолить
обосрался
с тобой никто не срал ;]
ты тупой, зачем алгоритм проверять временем?
одна исторее охуительнее другой
А ТУТ ТОГДА ЗАЧЕМ ХЕШИРОВАТЬ ПОСЛЕ ЭТОГО ВООБЩЕ?
коллизии в кайф
зачем?
http://я_с_ним_срал.jpg.to
анрилейтед