О роли кодировок в жизни веб-сервера
16.06.07 12:55 ◇
keywords: web, технологии
Читал о роли nginx в формировании светлого будущего, и вот какой момент заинтересовал:
Внутри проектов удобно иметь кодировкуИ вот тут свой верх взяло сомнение. По моим прикидкам, все наоборот.UTF-8, поскольку в ней можно отобразить почти все необходимые символы. Но при передаче по сети текста (если не учитывать сжатия через deflate которое принимают не все клиенты) в кодировкеUTF-8 он имеет объем почти в два раза больше чем в кодировке cp1251 илиkoi8-r. Большинство клиентов используют кодировку cp1251 и если выбирать изkoi8-r и cp1251 отдавать клиенту лучше в cp1251. Вот тут то и нужен nginx он получает ответ от бэкенда вUTF-8 и на лету перекодирует его в cp1251, при этом символы которых нет вUTF-8 заменяются наhtml-entities, поэтому ничего не теряется.[ >>> ]
а) С учетом того, что доля контента в полностью загруженной странице (как правило) не превышает 10% (остальное графика, html, скрипты; если без дизайна то порядка 50%), то объем страницы в
б) В
Вот и получается, что практичнее обрабатывать (и хранить в БД) лучше в cp1251 (или
Допустим, нам нужно обработать большой массив данных по преобразованию
И сравним теперь с ситуацией, когда все числа только 32 бит. Где будут проще алгоритмы и быстрее обработка?
б) не согласен, переменная длина структуры данных ошибка дизайна. я всегда должен знать, где и в какой кодировке хранятся данные. если данные входят из вне, их кодировку следует проверить и в случае чего конвертировать.
поправьте меня, если я заблуждаюсь в своих рассуждениях.
ArtReal: Не совсем понял, с чем именно несогласие. С тем, что обрабатывать надо с фиксированным числом байт на символ (а не с переменным) или с тем, что выдавать с сервера поток нужно не в
(не
[ 2 ] Павел / 16.06.2007 21:14
На счет ps: используя шаблоны, алгоритмы будут одинаковы. В контексте кодировок это значит, что используемые алгоритмы могут быть достаточно
Другими словами: на каком конкретном примере можно проиллюстрировать проблемы, о которых Вы говорите?
ArtReal: Ну, с точки зрения программиста, которому язык позволяет сказать set
Зато эта разница начинает хорошо ощущаться при дефиците ресурсов.
И, кстати, со стороны
(можно я не буду углубляться в теорию алгоритмов, адаптивность при критических нагрузках и основы оптимизации?)