komar 07.02.2013 09:04 thinkpad

INVALID BYTE SEQUENCE IN UTF-8

1. gds 07.02.2013 09:07

так ведь бывает такое. причом тут руби?

2. komargds /1 07.02.2013 09:09 thinkpad

А какого хуя меня это должно ебать, когда я делаю тупое сравнение двух строк?

3. gdskomar /2 07.02.2013 18:07

так разное сравнение бывает. Если делаешь побайтовое, то не должно ебать. Если посимвольное — должно, хотя бы для того, чтобы как можно раньше определить, что строка битая.и не годится для дальнейшей работы.

4. komargds /3 08.02.2013 08:12 thinkpad

> посимвольное
Вот нахуй оно кому всралось? Я не хочу символы, я хочу в окамл с массивами байтиков!

5. gdskomar /4 08.02.2013 08:22

кому-то да всралось, более того, кому-то даже http://www.ietf.org/rfc/rfc3454.txt нужно. (ну и всякие юникод-нормализации где-то между этим.)

6. komargds /5 08.02.2013 08:23 thinkpad

Специализированная хуета, которой место в библиотеках.

7. gdskomar /6 08.02.2013 08:24

ну вот, и библиотека будет дёргать stringprep, а ты будешь получать ровно ту же ошибку: "хуита в utf-8".
Но то, что побайтовое сравнение нужно — это факт.

8. komargds /7 08.02.2013 08:26 thinkpad

Библиотеку я подключу тогда, когда мне понадобится их ебаное посимвольное сравнение и прочая юникодная хуетень.

Do you really want to delete ?