Мы часто видим ошибки и опечатки в интернете. Как правило, принято или с достоинством пройти мимо, в глубине души презирая неграмотного (или невнимательного) писателя, или, наоборот, с увлечением развернуть просветительскую деятельность (не всегда, к сожалению, уважительную). В лучшем случае, если на сайте установлен Orphus — нажать Ctrl+Enter.
Так поступал и я, пока однажды с ужасом не заметил, что написал «вООбщем» или нечто подобное. Разрушительное влияние чтения форумов, да и, что уж там, самого Хабра, на читательскую грамотность — налицо. А между тем — сейчас есть многое, что могло бы облегчить участь наших бедных глаз!
Приношу извинения за конспективность дальнейшего изложения. Как всегда, цейтнот. Прошу задавать вопросы в комментариях.
Осталось сделать лишь несколько простых идеологических шагов.
Шаг 1. Существует класс ошибок, которые можно исправить автоматически. Например, заменить ВООБЩЕМ и ВОБЩЕМ на В ОБЩЕМ не составит труда, равно как и заметить, что в русском языке нет глаголов, оканчивающихся на -ЮТЬСЯ. Автоматически же искать разницу между ДЕРЖАТСЯ и ДЕРЖАТЬСЯ не рекомендую.
Такой подход применяется для борьбы с нецензурной бранью в чатах и на форумах — и довольно деструктивно. В остальных случаях, как правило, текстовый редактор лишь подчёркивает красным незнакомые слова при наборе их автором текста (писателем). Это рассуждение плавно подводит нас к следующему шагу.
Шаг 2. Читатель имеет право исправить текст перед прочтением. Да-да, не обязательно уповать на грамотность писателя или бдительность редактора/модератора. Можно самому делать свой интернет чище и светлее.
Так и родилась идея chas-correct — расширения для браузера, автоматически исправляющего многие ошибки. Репозиторий на github. Поддерживаются Firefox, Firefox Mobile и Chromium-подобные. (Для Google Chrome — инструкция по установке).
Посмотрев исходники, бородатый хабраюзер презрительно усмехнётся: «Школокод на регулярках!». Да, на регулярках. А вы попробуйте провести синтаксический анализ текста в режиме реального времени в браузере (или на прокси-сервере — такой вариант тоже рассматривался, но реализован не был). Задействовать облако — не вариант: мы же не хотим, чтобы наши личные сообщения светились в централизованном сервисе проверки орфографии?
Вы скажете: «Это не панацея. Всё исправить невозможно». Конечно, это не абсолют. Но попробуйте поставить chas-correct и почитать хабр с ним недельку-другую, а потом выключить — разница будет, уж поверьте. (NB: слова, написанные капсом, оно не трогает. Если вы не видите здесь ошибок — скорее всего, оно работает.)
Вы скажете: «Код ужасен. Его надо причесать и оптимизировать». Я отвечу: патчи принимаются. Просто совесть не позволяет мне более держать эту идею неопубликованной. (Здесь должна быть хрестоматийная история про Васю и Петю, писавших стартапы)
Вы скажете: «Подробности в студию! Цифры эффективности, методики сбора словаря…» Найду время — выложу подробности. Вкратце — скачивал постранично Баш и Хабр со товарищи, резал на слова, самые частотные прогонял через Яндекс.Спеллер (говорю же, технологии-то есть!). Остаётся открытым для обсуждения в комментариях вопрос, на какие русскоязычнве сайты ориентировать расширение.
Конечно, работу над расширением нужно продолжать. Есть и третий идеологический шаг — но его только предстоит сделать, и это уже совсем другая история.
ссылка на оригинал статьи http://habrahabr.ru/post/256339/
Добавить комментарий