Делаем себя развидеть это, или Право на предварительную правку

от автора

Мы часто видим ошибки и опечатки в интернете. Как правило, принято или с достоинством пройти мимо, в глубине души презирая неграмотного (или невнимательного) писателя, или, наоборот, с увлечением развернуть просветительскую деятельность (не всегда, к сожалению, уважительную). В лучшем случае, если на сайте установлен Orphus — нажать Ctrl+Enter.

Так поступал и я, пока однажды с ужасом не заметил, что написал «вООбщем» или нечто подобное. Разрушительное влияние чтения форумов, да и, что уж там, самого Хабра, на читательскую грамотность — налицо. А между тем — сейчас есть многое, что могло бы облегчить участь наших бедных глаз!

Приношу извинения за конспективность дальнейшего изложения. Как всегда, цейтнот. Прошу задавать вопросы в комментариях.
Осталось сделать лишь несколько простых идеологических шагов.

Шаг 1. Существует класс ошибок, которые можно исправить автоматически. Например, заменить ВООБЩЕМ и ВОБЩЕМ на В ОБЩЕМ не составит труда, равно как и заметить, что в русском языке нет глаголов, оканчивающихся на -ЮТЬСЯ. Автоматически же искать разницу между ДЕРЖАТСЯ и ДЕРЖАТЬСЯ не рекомендую.
Такой подход применяется для борьбы с нецензурной бранью в чатах и на форумах — и довольно деструктивно. В остальных случаях, как правило, текстовый редактор лишь подчёркивает красным незнакомые слова при наборе их автором текста (писателем). Это рассуждение плавно подводит нас к следующему шагу.

Шаг 2. Читатель имеет право исправить текст перед прочтением. Да-да, не обязательно уповать на грамотность писателя или бдительность редактора/модератора. Можно самому делать свой интернет чище и светлее.

Так и родилась идея chas-correct — расширения для браузера, автоматически исправляющего многие ошибки. Репозиторий на github. Поддерживаются Firefox, Firefox Mobile и Chromium-подобные. (Для Google Chrome — инструкция по установке).

Посмотрев исходники, бородатый хабраюзер презрительно усмехнётся: «Школокод на регулярках!». Да, на регулярках. А вы попробуйте провести синтаксический анализ текста в режиме реального времени в браузере (или на прокси-сервере — такой вариант тоже рассматривался, но реализован не был). Задействовать облако — не вариант: мы же не хотим, чтобы наши личные сообщения светились в централизованном сервисе проверки орфографии?

Вы скажете: «Это не панацея. Всё исправить невозможно». Конечно, это не абсолют. Но попробуйте поставить chas-correct и почитать хабр с ним недельку-другую, а потом выключить — разница будет, уж поверьте. (NB: слова, написанные капсом, оно не трогает. Если вы не видите здесь ошибок — скорее всего, оно работает.)

Вы скажете: «Код ужасен. Его надо причесать и оптимизировать». Я отвечу: патчи принимаются. Просто совесть не позволяет мне более держать эту идею неопубликованной. (Здесь должна быть хрестоматийная история про Васю и Петю, писавших стартапы)

Вы скажете: «Подробности в студию! Цифры эффективности, методики сбора словаря…» Найду время — выложу подробности. Вкратце — скачивал постранично Баш и Хабр со товарищи, резал на слова, самые частотные прогонял через Яндекс.Спеллер (говорю же, технологии-то есть!). Остаётся открытым для обсуждения в комментариях вопрос, на какие русскоязычнве сайты ориентировать расширение.

Конечно, работу над расширением нужно продолжать. Есть и третий идеологический шаг — но его только предстоит сделать, и это уже совсем другая история.

ссылка на оригинал статьи http://habrahabr.ru/post/256339/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *