Вы когда-нибудь задумывались о том, как происходит кодирование в UTF-8? Я до сегодняшнего дня не задумывался. А тут сроки поджали делать курсовую по системному программированию. Тему выбрал себе, на первый взгляд, тривиальную: перекодирование текста из KOИ-8 в UTF-8. Однако когда я стал разбираться с матчастью, оказалось, что тупой подстановкой соответствующих кодов с unicode.org (чего было бы достаточно при преобразовании однобайтных кодировок) я не добьюсь нужного результата. Соль в том, что в UTF-8 для кодирования одного символа используется от одного до четырех байт, специальным образом представляющих соответствующий код Юникода. (Кстати, раньше я почему-то считал, что UTF-8 и Unicode суть синонимы, что оказалось ошибкой.) Принцип представления наглядно описан в википедии: http://en.wikipedia.org/wiki/UTF-8#Descr... Такие дела.
Kona-chan
19.12.2010 12:44 Gajim
Recommended by:
@uzername
Do you really want to delete ?
Да, как-то приходилось. UTF-8 хорош компактностью, но плох невозможностью мгновенной навигации внутри строки.