Яндекс и Schema.org: началась стандартизация «Островов»

от автора

Мы в Яндексе понимаем важность стандартизации и стараемся, чтобы даже то, что вебмастера делают для нас, было прозрачным и доступным всем. В мае мы анонсировали платформу «Острова», а недавно её часть уже вошла в стандарт Schema.org.

Schema.org — это совместная инициатива крупнейших поисковых систем. Главная задача представителей Яндекс, Google, Yahoo! и Microsoft— разработка единой схемы для семантической разметки в HTML5.

Проект Schema.org стоит в одном ряду с развитием Semantic Web и Linked Data. Единая схема позволяет вебмастерам создавать метаданные, которые известны сразу всем крупнейшим поисковым системам. Они дают их роботам возможность «понимать», что содержит сайт, и позволяют улучшать качество поиска.

Обо всём этом мы подробно поговорили с Сашей ajax_ya Шубиным — человеком, который отвечает в Яндексе за взаимодействие со Schema.org.

Привет, Саша. Расскажи, пожалуйста, что такое Actions и почему принятие этого стандарта важно для нас?

Привет. Actions — это большое изменение словаря schema.org, которое призвано описать взаимодействие объектов между собой. Это большое и важно изменение, потому что если раньше schema.org описывала отдельные объекты, то сейчас это про какие-то действия, которые связаны с этими объектами. Почему это важно для нас и почему это важно для платформы «Острова»? Как ты, возможно, знаешь, сейчас в платформе «Острова» предоставляются две возможности, которые вебмастера могут использовать. Одна из них — это кнопки, которые появляются прямо на выдаче Яндекса. Для их описания мы специфицируем набор возможных взаимодействий, которые пользователь может осуществлять с сайтом. И именно список этих взаимодействий, а также их параметризация очень важны для нас и именно они были приняты в первой части стандарта Actions.

А почему нужно было принимать новый стандарт? Почему нельзя было использовать те, которые уже есть?

Да, это хороший вопрос. Дело в том, что существующие стандарты (например, Activity Streams или в OpenGraph-платформе есть также Actions) рассматривают действие или взаимодействие как глагол. Они не рассматривают его как самостоятельную сущность, не пытаются понять его смысл. Они утверждают, что взаимодействие, какое-то действие (например «иду, идти») — это просто глагол, предлагают описать различные его формы и концентрируются на объектах, между которыми взаимодействие происходит. Нам же было важно, чтобы действие, action, было самостоятельным. Чтобы у него были свои параметры, чтобы его могли использовать отдельно. И именно это — самое важное изменение в новом стандарте, которого не было в старых вариантах.

А что было сложного в придумывании этого нового? Были ли какие-то сложности в процессе принятия стандарта?

Да, сложности были. Например, в процессе принятия нужно было выстроить иерархию взаимодействия. Например, в платформе «Острова» мы даем возможность отправить сообщение. На самом деле, отправить email — это часть более общего взаимодействия: коммуникации. И сейчас в schema.org это так и есть. В иерархической структуре отправить сообщение — это часть действия коммуникации. Другая проблема в том, что некоторые взаимодействия могут иметь несколько смыслов. Ну, например, можно зачекиниться на рейс в аэропорту, а можно зачекиниться в Foursquare. Мы в рабочей группе долго думали — то есть, буквально было несколько ночных встреч, на которых мы обсуждали все эти тонкости: как можно разделить check in в смысле check in на рейс и check in в смысле check in на Foursquare.

Думали представить их двумя разными глаголами, но не получилось, и в итоге пришли к следующему решению. Если у тебя в рамках взаимодействия check in указано только место, где оно произошло, то, скорее всего, ты имел в виду check in как check in на Foursquare или Facebook. А если у тебя есть ещё какой-то объект (как, например, рейс), то это именно check in на какой-то рейс, перелет. И именно вот так оно представлено сейчас в платформе Острова.

А расскажи вообще о schema.org. Как она образовалась и для чего вообще нужна.

Schema.org — это набор словарей, которые понимают все основные потребители, большие поисковые системы — Яндекс, Google, Bing и Yahoo!.. Возникла она два года назад, но на самом деле история её значительно глубже и больше. Дело в том, что первые попытки использовать структурированную информацию были довольно давно. Первая большая инициатива Yahoo! Search Monkey была запущена в 2008 году. После этого были продукты и у Google, и у Яндекса, и у Bing. Но у них у всех была такая проблема: для описания какого-то объекта, для которого ты делаешь продукт, тебе нужен стандарт, словарь. Часть таких стандартов уже существовала. Например, микроформаты позволяли что-то указывать. Однако этого было недостаточно, и поэтому каждая поисковая система придумала свой стандарт для различных сущностей. И в итоге получилась следующая ситуация. Вебмастеру для взаимодействия с различными поисковыми системами для описания одного и того же объекта нужно было использовать разные стандарты, т.е. объект один, а стандарты — разные. Больше работы, больше ненужного кода, очень плохо для экосистемы и в итоге плохо для всех. Поэтому было принято решение объединить свои усилия в этой области и сделать единый стандарт, который бы понимали все. Это удобно в первую очередь вебмастеру, потому что он может, указав соответствующие теги один раз, наладить взаимодействие со всеми потребителями, со всеми поисковыми системами.

А почему нам важно участие в schema.org?

С одной стороны, нам важно быть в курсе текущих изменений, нам важно понимать, что будет следующим, чтобы вовремя доносить это до вебмастеров, чтобы проблема разных стандартов для описания одних и тех же сущностей ушла, чтобы её не было. С другой стороны, мы таким образом имеем возможность сами вносить изменения в словарь, предлагать какие-то свои новые сущности, которые важны для наших продуктов и которые важны нашим вебмастерам. Поскольку мы единственные русскоязычные участники рабочей группы, мы имеем возможность доносить до рабочей группы фидбек от наших вебмастеров. Для нас это большая ответственность.


А actions — это первый стандарт, который был принят schema.org по предложению Яндекса?

Нет, это не первый стандарт. Первый стандарт для описания целевой аудитории был принят примерно полгода назад. Мы в какой-то момент подумали, что было бы хорошо и полезно, если бы вебмастер мог указать, подсказать нам, для какой целевой аудитории он создал страницу. Например, у меня есть интернет-магазин. Я торгую товарами для детей: колясками, сосками, игрушками. Если на каждой такой странице я, допустим, укажу, что эта коляска предназначена для детей от нуля до одного года, а эта коляска — для детей от года до трех. Это полезная информация, которую мы можем использовать для улучшения поиска. Мы посмотрели на существующие аналоги, но поняли, что ничего из того, что сейчас есть, нам не подходит. Существующие аналоги либо узконаправленные, либо очень сложные, либо не про то. И мы поняли, что лучше придумать свой. Легкий, но, тем не менее, отвечающий нашим требованиям стандарт, и подложить его в рабочую группу schema.org. Мы так и сделали. Было довольно много разных обсуждений внутри и снаружи. В процессе мы его несколько упростили, немного изменили состав и формулировки, чтобы отвечать западным стандартам описания целевой аудитории: пол, возраст. И в итоге приняли.

Как человек, который непосредственно участвует в работе schema.org, расскажи вообще о процессе. Как идет работа?

Это рабочая группа с четырьмя поисковыми системами. От каждой поисковой системы есть представители (обычно их несколько). Существует рассылка почтовая, существуют еженедельные встречи (аудио и видео). Соответственно, мы вечером (обычно это происходит в 10 вечера, раньше по пятницам, но теперь хорошо, что по четвергам) встречаемся и обсуждаем текущие вопросы: текущие изменения словарей, новые предложения, как можно улучшить, как общаться с коммьюнити и т.д. Примерно два раза в год происходит личная встреча для обсуждения тех же вопросов, ну и каких-то более сложных, которые удаленно сложно обсудить. Тем более, из-за разницы во времени (максимальная разница между нами составляет 11-12 часов, когда у нас поздний вечер, у них — раннее утро) в таком состоянии не все вопросы можно обсудить. Для внешнего коммьюнити кроме этого существют еще другие средства: открытая рассылка, открытая вики. Все это реализовано средствами W3C, и любой желающий может туда прийти без какой-либо дополнительной регистрации, без чего-нибудь такого и общаться с рабочей группой, вносить свои предложения, предлагать свои изменения. Все это рассматривается, на все эти вопросы отвечают.

Может, ты расскажешь о каких-то наших дальнейших планах в работе schema.org?

Самая важная часть, самое важное для нас сейчас — это принятие второй части описания взаимодействий. Дело в том, что сейчас был принят только перечень основных действий и их параметризация. На самом деле, совсем не охвачена часть про то, как действие может быть реализовано. Это важная часть платформы Острова. Это вторая часть стандарта actions, который сейчас обсуждается в schema.org, и, я надеюсь, будет принят в скором времени. Кроме того, у нас есть еще несколько других предложений, связанных с нашими новыми продуктами, но про это я, к сожалению, не могу говорить.

Понятно. Спасибо большое, Саша, за интересный рассказ! Я надеюсь, что мы еще поговорим о нашей работе в schema.org.

Спасибо.

ссылка на оригинал статьи http://habrahabr.ru/company/yandex/blog/190760/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *