Ky6uk 15.01.2013 10:27 ШОRK

Псач, у меня к тебе внезапный профессиональный вопрос. Какой алгоритм хеширования не зависит от размера файла. Т.е. просчет хеша файла в 2 терабайта занимает столько же времени, что и файла в 17 байт. Гуглить не могу по личным причинам.

Recommended by: @kurkuma, @ulidtko
1. anoos 15.01.2013 10:28 QVIP

лол

2. Ky6ukanoos /1 15.01.2013 10:30 ШОRK

ппц ты, я же серьезно спрашиваю

3. anoosKy6uk /2 15.01.2013 10:35 QVIP

https://sites.google.com/site/murmurhash...
>Excellent performance — measured on an Intel Core 2 Duo @ 2.4 ghz
>MurmurHash 2.0 — 2056.885653 mb/sec

4. amd63 15.01.2013 10:36 Azoth

stat -c %s filename.txt

5. Ky6ukanoos /3 15.01.2013 10:37 ШОRK

паталогически боюсь новых алгоритмов. А вдруг там всё в КОЛЛИЗИЯХ?

6. anoosKy6uk /5 15.01.2013 10:37 QVIP

>Excellent collision resistance — Passes Bob Jenkin's frog.c torture-test. No collisions possible for 4-byte keys, no small (1- to 7-bit) differentials.

7. Ky6ukamd63 /4 15.01.2013 10:38 ШОRK

а если у меня 100 файлов идентичного размера, лолка?

8. amd63Ky6uk /7 15.01.2013 10:38 Azoth

тогда collision, очевидно

9. Ky6ukanoos /6 15.01.2013 10:40 ШОRK

утверждение рандомного пса

10. anoosKy6uk /5 15.01.2013 10:40 QVIP

А зачем тогда спрашиваешь?

11. anoosKy6uk /9 15.01.2013 10:41 QVIP

wof

12. Ky6ukanoos /10 15.01.2013 10:41 ШОRK

есть же много старых алгоритмов, проверенных временем

13. amd63Ky6uk /12 15.01.2013 10:46 Azoth

Интересный и до сих пор не закрытый философский вопрос... Если один алгоритм проверен временем, а второй алгоритм проверен formal verification (на Coq, причём за авторством @gds), то какому алгоритму, ты, @Ky6uk отдашь предпочтение, зная, что первый алгоритм — старый, а второй алгоритм — новый?

14. Ky6ukamd63 /13 15.01.2013 10:47 ШОRK

wof

15. kurkuma 15.01.2013 10:50

лол

16. amd63Ky6uk /14 15.01.2013 10:51 Azoth

Вомбат, батяня, батяня, вомбат.

17. anoos 15.01.2013 10:51 QVIP

Считай хеш по 10 байтам в середине файла, бгг

18. hirthwork 15.01.2013 11:05 mcabber

int hash(FILE* pf) { return 1; }
З.Ы. не благодари

19. anooshirthwork /18 15.01.2013 11:06 QVIP

Добавил в избранное

20. gelraen 15.01.2013 11:06 work-laptop

тот, который не читает весь файл, obv.

21. hirthworkgelraen /20 15.01.2013 11:07 mcabber

/18

22. amd63gelraen /20 15.01.2013 11:08 Azoth

/4

23. anoosamd63 /22 15.01.2013 11:10 QVIP

Тогда считать только изменяющуюся часть файла

24. anonkzKy6uk /7 15.01.2013 11:10 QIP свободное общение

Берешь размер файла, прибавляешь к числу путь к файлу, делаешь хеш. Профит.

25. anoosanonkz /24 15.01.2013 11:11 QVIP

А если все в одно директории валяется?

26. amd63anonkz /24 15.01.2013 11:11 Azoth

Почти победил ИТТ, если бы не "делаешь хеш" — нет нерекурсивного выхода, лол

27. Ky6ukanoos /25 15.01.2013 11:12 ШОRK

и если они еще и называются все одинаково? :cf:

28. anonkzKy6uk /27 15.01.2013 11:12 QIP свободное общение

И размер файла одинаковый?

29. anoosanonkz /28 15.01.2013 11:12 QVIP

И вообще это хардлинки

30. Ky6ukanonkz /28 15.01.2013 11:13 ШОRK

да. 100 файлов в одной директории с одним именем и размером.

31. anonkzanoos /25 15.01.2013 11:13 QIP свободное общение

Я имел ввиду путь+имя файла.

32. anonkzKy6uk /30 15.01.2013 11:13 QIP свободное общение

Но ntfs этого не позволит.

33. amd63Ky6uk /30 15.01.2013 11:13 Azoth

не пизди, 146

34. anoosamd63 /33 15.01.2013 11:13 QVIP

СЛАВА РУСИ

35. anonkzanoos /34 15.01.2013 11:13 QIP свободное общение

1488

36. amd63anoos /34 15.01.2013 11:14 Azoth

mkfs.rus

37. hirthwork 15.01.2013 11:14 mcabber

благородные доны, ввиду редукции сей дискуссии к дедфудотреду, спешу откланяться

38. amd63hirthwork /37 15.01.2013 11:15 Azoth

посмотрите, кто говорит. говорит автор /18

39. anooshirthwork /37 15.01.2013 11:15 QVIP

Тупо похуй на тебя. ПППССССССССССССсссссс поссал на обиженку.

40. Ky6ukanoos /39 15.01.2013 11:16 ШОRK

он в *пидарас-листе, настроил автообсыкалку

41. anoos 15.01.2013 11:19 QVIP

Алсо, считай хеш при создании/редактировании каждого отдельного файла обычным sha1 и храни где-нибудь рядом. Или нужно ВСЕХ СРАЗУ ПОСЧИТАТЬ ХЕШ БЫСТРО БЛЯТЬ?

42. Ky6ukanoos /41 15.01.2013 11:25 ШОRK

короче бестолковых советов тред объявляю закрытым, завтра что-нибудь придумаю

43. anoosKy6uk /42 15.01.2013 11:26 QVIP

гагага

44. amd63Ky6uk /42 15.01.2013 11:26 Azoth

Ты пипец тупой, придумай простой нерекурсивный выход для /24 и ответ готов

45. Ky6ukamd63 /44 15.01.2013 11:27 ШОRK

у меня рабочий день кончился, сорри

46. amd63Ky6uk /45 15.01.2013 11:28 Azoth

Возьми себе ещё, я угощаю

47. amd63 15.01.2013 11:32 Azoth

Короче, по результатам обсуждения правильный ответ такой:
на входе filename
найти filesize
найти fullpath // или сразу требовать вместо filename
вернуть crc32/md5/sha ( от filesize + fullpath)

48. amd63amd63 /47 15.01.2013 11:33 Azoth

можно ещё посолить

49. 238328 15.01.2013 13:40

обосрался

50. kurkuma238328 /49 15.01.2013 13:41 Gajim

с тобой никто не срал ;]

51. 238328Ky6uk /12 15.01.2013 13:41

ты тупой, зачем алгоритм проверять временем?

52. 238328anonkz /24 15.01.2013 13:42

одна исторее охуительнее другой

А ТУТ ТОГДА ЗАЧЕМ ХЕШИРОВАТЬ ПОСЛЕ ЭТОГО ВООБЩЕ?

53. kurkuma238328 /52 15.01.2013 13:42 Gajim

коллизии в кайф

54. 238328amd63 /47 15.01.2013 13:43

зачем?

55. 238328kurkuma /50 15.01.2013 13:43

http://я_с_ним_срал.jpg.to

56. kurkuma238328 /55 15.01.2013 13:44 Gajim

анрилейтед

Do you really want to delete ?