Главная » 2015 » Сентябрь » 14 » Чего не хватает типографам / typograph
10:02
Чего не хватает типографам / typograph
Originally published at Проектирование сайтов. Please leave any Комментарии there. Есть сайты, на которых я контролирую качество текстов, поступающих от пользователей. У текстов есть содержательные характеристики, улучшение которых отнимает много времени, а также технические характеристики. К техническим можно отнести отсутствие грамматических ошибок и типографику. Вопрос о важности технических характеристик UGC оставлю открытым. Замечу, что их улучшение поддается автоматизации. Сейчас даже браузеры умеют проверять орфографию в полях textarea. И существует целый класс программ, улучшающих типографику. Периодически на меня находит вдохновение, и я пытаюсь поставить на какой-нибудь сайт типограф. До последнего времени пассивно констатировал факт, что пользовательские тексты типографам не по зубам. Наконец, осознал проблему.Все типографы, что я видел, ориентированы на опытных пользователей. Скажем, они умеют заменять два дефиса на тире. Но пользовательские тексты полны «экстремальной» типографики. Многоточия могут состоять из пяти или даже из одиннадцати точек. Вообще многоточие нередко является самым распространенным знаком препинания. После точек и запятых не ставятся пробелы. Новые строки начинаются середины предложений. Весь текст набирается в верхнем регистре. Тире не отбиваются пробелами. В таких случаях типографы теряются. Они не понимают, что одиннадцать точек нужно заменить на три, или что после запятых в 99 % случаев должен стоять пробел, или что дефис, стоящий в начале абзаца, нужно преобразовать в тире, независимо от прочих условий. А между тем большинство «экстремальных» случаев с хорошей вероятностью определяются несложными эвристиками. Если слово из русских букв в середине содержит запятую, скорее всего после нее пропущен пробел. Если доля многоточий высока, скорее всего их можно заменить на точки. Если \n окружают пробелы и маленькие русские буквы, скорее всего можно объявление новой строки вырезать. Регулярные выражения способны сделать из безобразного в плане типографики текста настоящую красоту. Если разработчики какого-нибудь типографа добавят к расстановке неразрывных пробелов и хитрых кавычек набор правил для обработки текста в стиле неопытных пользователей, это будет сильным ходом. Если нужны примеры raw input'а или интересны те закономерности, что я уже выявил, с удовольствием поделюсь.
Просмотров: 427 | Добавил: admin | Рейтинг: 0.0/0
Всего комментариев: 0
avatar