Регистрация
Зарегистрируйся на сайте и получи доступ к полному контенту сайта и подпискам бесплатно!

Быстровыдача. Актуальность и особенности работы с ней

22
0
1 546 0
Аудио Текст Презентация
11 декабря 2015

Быстровыдача способна давать большой объем качественного трафика сайтам с постоянным потоком новостных публикаций. Конкуренция здесь пока слишком мала, а потенциал – огромен. Как формируется быстровыдача Яндекса, чем отличается от «органики» и как с ней работать, вы узнаете из доклада Дмитрия Шахова на CyberMarketing-2015.

Быстровыдача. Актуальность и особенности работы с ней

Быстровыдача способна давать большой объем качественного трафика сайтам с постоянным потоком новостных публикаций. Конкуренция здесь пока слишком мала, а потенциал – огромен. Как формируется быстровыдача Яндекса, чем отличается от «органики» и как с ней работать, вы узнаете из доклада Дмитрия Шахова на CyberMarketing-2015.

(00:09) Рад всех приветствовать в этом зале. Первое, что я должен сказать, это если бы не SeoPult, этого доклада бы не было. На самом деле это действительно так, когда ко мне обратились с предложением рассказать что-то интересное, вот, темы под рукой какой-то не было, которую я там глубоко прорабатывал, но был интересный заход со стороны клиента, которому нужна была исключительно быстровыдача. То есть, как оказалось, есть целый пласт сайтов, которым абсолютно не интересно работать с обычной SEOшкой. Вот, кроме того, все вы знаете, из конференции в конференцию перемывают одно и то же: как правильно писать title, как накрутить поведенческие и так далее. Это вес уже перемыто, перетерто, и хочется найти уже что-то такое, на что можно обратить ваше внимание, возможно, туда вы попытаетесь залезть самостоятельно и извлечь оттуда трафик. А трафика там реально очень много.
(01:14) Но прежде чем мы приступим к докладу, я вам спалю очень простую тему, как вам поднять позиции сразу по всем запросам с помощью SeoPult. Очень просто: покупаете тысячу упоминаний своего бренда без ссылки, а пользователь видит упоминание, пытается найти его в поиске, у вас поднимается брендовый трафик, а брендовый трафик – это один из мощных факторов, влияющих на позиции по всему ядру. Вот такое простое палево, а теперь мы приступаем, собственно, к докладу.
(01:49) Итак, кто же у нас работает с быстровыдачей? По факту оказалось, когда я начал уже мониторить рынок, общаться с аналитиками, с быстровыдачей, кроме нескольких, скажем так, хаков, никто серьезно не работает, то есть системно с быстровыдачей никто не заморачивается. Поэтому пришлось вытягивать информацию буквально по крупицам. Большое спасибо Паше Никулину из компании Demis, большое спасибо Мише Сливинскому, Стасу Пономарю за ту информацию, которой они поделились. Спасибо Диме, который сегодня здесь будет выступать, за пример, который здесь будет спален в качестве артефакта.
(02:35) Итак, какие у нас бывают виды быстровыдачи? Для тех, кто не знает, есть обычная быстровыдача, которой диагностируется по Яндекс.XML по параметру size=0, и есть Ultra – некоторые считают, что она в Яндекс.XML не видна, но при определенных параметрах ее можно извлечь из Яндекс.XML. Это уже интересно для тех, кто серьезно занимается аналитикой в области SEO. Но, тем не менее, есть более простой способ определить Ultra – это через параметры сохраненки, или ищите в адресной строке src=FT – это признак Ultra.
Ultra отличается от обычной быстровыдачи, классической, тем, что она живет всего до 6 часов, затем она переходит в обычную быстровыдачу. Обычная быстровыдача попадает в органику, а Ultra подмешивается в нее, то есть, например все вы знаете, что в обычную органику Яндекс сейчас подмешивают Яндекс.Маркет. Так вот Ultra также подмешивается в органику, не являясь ее составной частью.
(03:58) Как быстро появляется быстровыдача? Это может быть практически мгновенно: здесь я специально взял пример, где новость, только-только размещенная на сайте, уже через минуту была на выдаче, то есть сайты, откуда информация для быстровыдачи формируются буквально за минуту. Это сразу заставляет понимать то, что он для формирования быстровыдачи используются несколько другие механизмы, нежели для формирования обычной. То есть, например, ссылочный здесь не играет практически никакой роли: ну что можно увидеть, какую информацию можно собрать за одну минуту?
(04:38) По коммерческим вопросам тоже в принципе быстровыдача присутствует, ее можно обнаружить таким способом, выполнив сортировку по времени, и вы обязательно практически по любому коммерческому запросу какой-то объем быстровыдачи найдете. Более того, вот с таким подмешиванием даже по коммерческим запросам связан тот самых, который ходит по рынку и который на сегодня практически прикрыт Яндексом, - это скармливание быстроботу каких-то новых документов на коммерческом сайте, и за счет этого выныривание на позиции быстровыдачи. На сегодня эта дырочка практически прикрыта.
(05:19) Итак, откуда же берется быстровыдача? Быстровыдача берется через мониторинг так называемых хабов, хабами выступает ограниченный спектр сайтов – отсылаю вас к докладу госпожи Остроумовой из Яндекса, в конце будет приведена ссылка на него. Хабы – это абсолютно небольшой спектр сайтов, там буквально их несколько тысяч, они постоянно мониторятся, причем мониторятся даже не все их страницы, а главные страницы категорий, и оттуда забирается информация для формирования быстровыдачи, то есть собираются какие-то ссылки на новые документы, и дальше бот уже из этой информации формирует быстровыдачу. Но и, кроме того, ряд источников может быть размечен Яндексом для того, чтобы их мониторить отдельно. По сути, скажем так, хабом по сути это не является, посмотрим позже, но, скажем так, такая база источников есть.
(06:22) Итак, как же на самом деле Яндекс определяет, какие показать сниппеты выше, какие – ниже? Для Яндекса есть такой параметр, как прибыль Яндекса – это, на мой взгляд, вообще очень интересная штука, которое на сегодня в принципе как-то серьезно не анализируется в качестве возможного фактора для ранжирования и в том числе обычной выдачи. Яндекс, оказывается, замеряет свою возможную прибыль, которая по сути пропорциональна количеству переходов с поиска на документ, то есть это та прибавка, которую может передать Яндекс на конкретный документ, по сравнению с тем трафиком, который на этот документ есть. Соответственно, чем выше эта прибыль, которую Яндекс может по этому документу отдать, тем выше его ценность для Яндекса в целом, и он может это проверить достаточно быстро на основе каких-то хостовых характеристик. То есть он постоянно копит информацию о документах с какого-то конкретного домена, и на основе этого уже определяет свою возможную прибыль.
(07:31) Ну и угасание интереса. Понятно, что со временем документ, который появляется на основной выдаче, будет востребован все меньше и меньше, и меньше. Проведено было Яндексом исследование, которое показало, что только очень небольшая доля документов востребована на длительном периоде, все остальные затухают в период от 2 до 6 дней. Вот отсюда, собственно, и строк жизни быстровыдачи возникает. Опять же угасание – это тоже хостовый параметр, который, понятно что у каждого документа он свой, но поскольку предсказать как, сколько будет жить этот документ, насколько он будет интересен пользователям, на перспективу Яндекс не может, он делает эти выводы на основе других документов, которые он раньше забирал с этого домена. Таким образом, получается, что наполнение быстровыдачи идет через документы, для которых Яндекс вычислил наибольшую прибыль с наименьшим угасанием в отношении конкретного хоста. Соответственно, чем востребованнее документы с конкретного домена, тем чаще они попадают в быстровыдачу. Вот такой простенький пример на логику: три новостных портала, у одного новостного портала хорошая редакторская команда, она делает оригинальные заголовки, но при этом сдержанная подача; у второго портала оригинальные заголовки тоже, но акцент идет на новости, которые относятся к категории желтых, или как говорит конкурент по первому пункту – кровь, кишки, распи******ло; третий вариант – это третий сайт, где, видимо, редактора нет, либо редакторская команда, скажем так, подходит более сухо к формированию своего новостного списка – там заголовки формируются под событийные ключи по сути, скорее всего это происходит неосознанно, поскольку я знаю эту команду, там профессионалов по SEO нету, вот так они их пишут, когда заголовки такие, которые примерно совпадают с теми запросами, которые в дальнейшем пользователи могут вести в поисковую строку. Вот какие сайты на самом деле выигрывают в быстровыдаче здесь? Вот по факту выигрывает третий, вот реально, несмотря на то, что больше объем и у первого, и второго, выигрывает сначала третий, втрое место занимает второй. Логика здесь в общем-то достаточно простая, то есть поиск для формирования быстровыдачи использует новости, которые, во-первых, сильнее подпадают, вернее скажем так, могут быть с точки зрения текстовой релевантности быть определены как более подходящие, а с другой стороны желтые новости вызывают более, скажем так, длительное угасание, то есть вызывают больший интерес, нежели новости – просто там сняли котенка с дерева, ну узнал, сняли, все хорошо, второй раз ты на эту новость не вернешься, ты не будешь ее искать. То есть про котенка там новость будет жить максимум полчаса, а вот какое-нибудь ДТП, где человека разворотило и размазало по всей площади, или там про какое-нибудь изнасилование громкое, люди будут искать информацию и спустя двое суток, и трое и могут даже там продолжать неделю что-то искать.
(11:10) Итак, есть еще такой момент, что у каждого запроса есть свежесть. Есть один из документов, который в конце в Яндексе будет приведен, Яндекс вычисляет свежесть запроса для того, чтобы вычислить, сколько позиций отвести под быстровыдачу. Так вот количество позиций под быстровыдачу зависит от нарастания потока документов. Это легко отмониторить по спортивным запросам: те команды, не востребованы широкой публикой, там под быстровыдачу будет там 2-3, там 6 позиций, там, где прошел, скажем, какой-то громкий матч крупной команды дорогой, или вообще лига чемпионов – там глубина быстровыдачи может составлять две-три страницы спокойно.
(11:58) В чем проблема с быстровыдачей? Есть серьезные сложности в аналитике, все дело в том, что то, что мы извлекаем из Яндекс.XML, имеет довольно такую странную природу, и по ней какую-либо аналитику строить нельзя, потому что в одном случае мы получаем быстровыдачу на вторую позицию, другом случае мы буквально, чуть ли не нажав F5, получаемые ее на пятой позиции, где-то – на двенадцатой позиции, причем один и тот же сайт. Соответственно, вот эти постоянные баги мешают какой-то анализ делать, здесь нужно сканировать напрямую – напрямую инструментов нету, но, слава богу, сейчас появился сервис Rush Analytics, который напрямую выдачу сканирует. Там еще хоть как-то можно это сделать, но опять же там не размечается именно позиция быстровыдачи, она никак не определяется в сервисе. Поэтому на сегодня, фактически, выполнять эту аналитику можно, либо написав какие-то свои парсеры, что опять же спотыкается в сканирование быстровыдачи, то есть в капче и так далее, и так далее, либо это всё делать вручную, что тоже так много не наанализируешь.
(13:01) Кроме того, Ultra смывается, если просто пытаться искать в расширенном поиске по сайту, то есть, получается, что Ultra имеет такbt запросозависимые документы – как только подставляешь домен, Ultra пропадает. Опять же, невозможно проанализировать, мало того, что она живет всего шесть часов, то и просто выполняя поиск по домену, она пропадает. Хотя это, кстати, может быть быстрым способом для парсеров, как быстро определить, что Ultra на выдаче, а что не Ultra. Если кто-то задумается парсер писать.
(13:44) Ну еще вот такой момент, связанный с тем, что когда ищешь по дате индексации документа, это не документированной оператор и даты, который по дате индексации ищет, так вот просто определить количество общих документов сам по себе, если убрать, то есть быстровыдачу, мы не можем определить, сколько на данный момент есть документов в быстровыдаче в Яндексе. Этот запрос не работает в принципе, то есть это такая тайна. Когда бы вы не задали этот запрос, салон запроса он имеет… Кто-то там кашлянул, да? Мы посмотреть, сколько документов в быстровыдаче не можем. Если, например, вы сталкивались с анализатором текстовых апдейтов от компании Пиксель Плюс, я уж не помню тот визер внедрил или нет, так вот там строятся, скажем так, как там строится, там фактически определяется по оператору idate количество документов, которые появились новых в Яндексе. Сколько новых документов в быстровыдаче мы понять не можем, как только мы добавляем хост, мы уже видим, сколько документов быстровыдачи есть, то есть вот здесь элементарный пример приведен. Просто оператор idate и date стоит, выдает две страницы, добавляем хост – и уже видим пять страниц, возможно, там дальше. И это не работает не для idate, не для date.
(15:20) Кому же интересна работа с быстровыдачей в первую очередь? Понятно, что это новостные сайты любой природы, которые генерируют определенный поток новостей – такие маркируются достаточно быстро, как сайты для забора с них новостей, и в хабы попадают достаточно часто, и для них это нужно и полезно. Сайты трансляций – это сайты как раз вообще полностью сидящие на быстровыдаче, это как раз тот случай о котором я говорил: пришел сайт трансляций, весьма крупный – от пятидесяти до трехсот тысяч хостов в день, и все это формируется быстровыдачей, то есть вот вы можете оценить себе объем интереса, который можно извлекать оттуда, особенно те, которые занимаются из вас информационными сайтами, можно прикинуть, какой объем трафика там крутится. И сайт абсолютно неоптимизированный, но благодаря тому, что там наработались определенные характеристики, о которых мы будем говорить дальше, влияющие на ранж быстровыдачи, сайт регулярно там выскакивает и собирает вот такой трафик. Также сайты букмекеров, они фактически тоже завязаны на появление новой формации о матчах и так далее. Форумы – там тоже постоянно идет обновление, но форма редко продвигается, и в принципе это как-то особо не нужно. А с досками объявлений вышел такой факап, то есть одной стороны постоянно добавляются новые объявления на доски объявлений, но, когда начинаешь мониторить появление новых объявлений в качестве быстровыдачи, происходит интересная штука: поиск подменяет, то есть поиск делает выбор не в пользу точно такого же объявления, то есть даже просто ищешь прям по тексту, а подбирает более старое объявление, получается, что с точки зрения досок обьявлений, почему-то те документы, которые попадают в быстровыдачу, для досок объявлений не выводятся. Это довольно странно, но, тем не менее, так есть.
(17:30) Интересный еще пункт, о котором мы тоже поговорим, как об артефакте, это коммерческие сайты, где можно сформировать поток документов, который может быть принят поиском за новостной. Но это такой прикольный хак, который может заменить тот самый, когда вы пытались свой новый документ с коммерческого сайта скормить через какой-то хаб, то есть поставить ссылку на новостном сайте, либо скормить быстроботу иным образом, и вы занимали тем самым позицию быстровыдачи. Так вот, можно это сделать на системной основе, если сформировать потоком документов, который может быть принят за новостной. Разберемся как раз вот с тремя возможными вариантами, как этого достичь.
(18:13) Итак, 3 проблемы, и как их решать: как попасть в быстровыдачу в принципе, как в ней хорошо ранжироваться и как породить, по сути, вакансию быстровыдачи под себя в органике. Итак, получается, что ранж у нас зависит от ценности источника, нам нужна максимальная прибыль при минимальном угасании на большом пуле документов, который наш хоста формирует. Соответственно, также мы знаем, что поиск ориентируется на те ссылки, которые он успевает поймать. Понятно, что ссылки, с обычных доменов здесь не очень интересно, а здесь будут играть роль ссылки с хабов, то есть появление сразу большого количества ссылок на этот документ на хабах, и будет играть роль появление ссылок в социальных сетях тоже, которой мониторится поиск. Но и понятно, от вас требуются клики на выдаче. Как мы можем на это все влиять? Клики на выдаче. Я долго думал, есть ли способ накрутить на выдаче, вплоть до того, что хотел попросить там 20 человек кликнуть на определенный сниппет, но потом подумал, что системно это сделать практически невозможно, то есть для того чтобы, я думаю, что много кликов не нужно, чтобы поднять позицию конкретного сниппета на быстровыдаче, однако выполнять такую процедуру системно, на большом пуле документов – это относится к разряду скорее фантастическому. Поэтому проще на самом деле управление сниппетом, если вы помониторите быстровыдачу, то увидите, что в большинстве случаев более менее интересные позиции занимают те документы, где заголовок, то есть title, дает достаточно информации, вызывает интерес с точки зрения появления клика на таком сниппете.
(20:15) Кроме того, что вы можете сделать? Это наращивать качество документов на своем источнике. Это, конечно, работа системная, длительная и мало для кого подходит, если вы хотите какую-то кнопку «бабло», то здесь это не сработает. Но если вы хотите выработать определенный алгоритм путем аналитики сайта, когда пользователи будут пользоваться, скажем так, вашими статьями, документами трансляциями на длительном периоде времени, часто по ним переходить в быстровыдаче, то, скорее всего, это будет вызывать рост все новых документов, которые вы плодите, в момент появления их в быстровыдаче.
(21:00) Ну и следующий момент – это активный репост документов в социальных сетях, сразу после публикации, то есть фактически здесь играет роль первые минуты. Это та же самая методика, которая при продвижении в YouTube – чем быстрее вы накликаете лайки, чем быстрее вы наработайее просмотры на ролике в YouTube, тем быстрее он выскочит в ТОП. Тоже самое происходит и с быстровыдачей, чем быстрее появляются какие-то репосты вашего материала, тем больше шансов, что это будет обнаружено поиском, и, соответственно, сыграет роль при формировании быстровыдачи. Ну и, соответственно, сюда же относится массовое всплывание документа на хабах. Отсюда получается, что если у вас новостной ресурс, то имеет смысл подключать он его не только в один агрегатор, но и все остальные, какие вы только сможете найти, – это Яндекс.Новости, Google.Новости, Рамблер.Новости, Mail.Новости, Медиаметрикс, Труд.com – всего там порядка 20 агрегаторов в России существует. Вот пример, где новость на актуальную тему выполнена на сайте, именно на трастовике, сразу было сделано 50 твитов, новость вошла в ТОП, скажем так, эта новость была связана с картой Крыма, плюс громкий заголовок, и новость достаточно долго висела в ТОПе, потом начала падать, докинули еще 50 твитов, и по этому запросу новость закрепилася на очень длительный период времени, то есть уже вышла из быстровыдачи, но все равно продолжала вистеть там. Всего на эту новость было получено более десяти тысяч переходов, что, в общем-то, для новостника регионального достаточно серьезная цифра. Но можно пойти более простым методом: попасть в источники, которые постоянно мониторится поиском, либо отсвечивать каким-то образом в хабах на постоянной основе и таким образом собирать информацию на всякие низкочастотные событийные запросы. Вот, например, kinozadrot.net – сайт, который посвящен размещению пиратки, однако там есть раздел с онлайн-трансляциями, где создатель этого сайта просто плодит документы под будущие события, под самые-самые незначительные события, какие только могут быть, то есть я сомневаюсь, что кто-то из вас знают, что есть такая команда Йокерит хоккейная, тем не менее, даже под нее сущетсвет, под этот матч конкретная карточка. Самое интересное, что никакой трансляции там реально нет, потому что эта карточка создается на автоматической основе, то есть человек, видимо, закладывает определенные названия команд, плюс формулу там «прямая трансляция», «дата» и все. У него это массовый характер имеет, у него там сотни, тысячи этих, карточек сформированы, и таким образом ловли рыбки в мутной воде он выхватывает весьма серьезный трафик, если ему удается попасть в какой-то момент по какому-то запросу, ему хватает просто существования этого документа. При этом, если зайти на этот сайт, вы увидите, что реально там никакой трансляции нет, по факту там стоит слепой плеер, где ничего не проигрывается, якобы ждет трансляцию, и сверху крутится реклама. То есть все, что человек делает, это просто пытается заработать на рекламе. Тем не менее, вот так вот хитро он решает проблему привлечения трафика по событийным запросам.
(24:48) Ну и еще один пример, интересный вот такой артефакт выявился. Если ваш сайт позволяет генерировать поток новых документов с новостной какой-то составляющей, то есть постоянно у вас появляются какие-то новые документы, которые могут быть интересны пользователям, то может произойти ситуация, когда этот поток начнет занимать места в быстровыдаче. В данном случае здесь абсолютно корпоративный сайт, и они выкладывают карточки своих заказов. В итоге сайт с ядром там в 3 тысячи запросов, которые максимум кластеризуются в 300 страниц, по факту имеет индексацию, ну по крайней мере вчера она была 89 тысяч, то есть на тот момент когда еще на анализировал, это было порядка 50 тысяч документов, никакой особой ценности данные документы не представляли, там просто информация о заказе, она оформлена в виде красивого шаблона, с карточкой, с переменными данными, с отзывами, title в виде 6-7-словного низкочастотного запроса. Я так понимаю, что решалась утилитарная задача повышения полноты ответа в нише, но по факту возник такой интересный артефакт, когда данные документы из-за того, что они каждый день формируются, стали попадать в быстровыдачу, причем по высокочастотным запросам в весьма конкурентной нише.
Поэтому я призываю вас посмотреть, подумать, насколько это вам подходит – на данный момент конкуренции в этой нише практически близка к нулю, кроме
одного хака со скармливанием быстроботу, никто особо этим не пользуется, а на сегодня этот хак уже особый-то и не работает, игроков мало, а трафика много. Кроме того, если человек набирает и попадает по такой позиции на сайт, то он, скорее всего, будет конвертироваться гораздо лучше, чем человек с отложенным спросом.
(26:59) Вот ссылочки на документы Яндекса, один из документов относится к 2011 году, второй – к 2014 году, но, собственно, тот, который относится к 2014 году, гораздо лучше посмотрите видео, которое вот внизу размещено, там как раз тот доклад. Ну и бонус вам, бонус. Какое сегодня число? 23, да. А эта новость уже напрямую размещенная на сайте, напрямую к докладу, конечно, отношения не имеет, это для тех, кто не знает, можно таким образом подхватывать позиции по запросам, содержащим интент в виде даты. То есть, выпуская новость еще задолго до даты наступления, но фиксируя ее датой проведения там этого события, вы подхватываете, во-первых, переходы с подсказок, когда люди набирают что-то там «матч арсенал-эвертон 24 октября». Кроме того, скажем так, такие сайты гораздо быстрее заходят по другим запросам, связанным с проведением этого матча. Вот на этом с докладом, собственно, все.
(28:16) Ведущий: Теперь у вас будут вопросы. Спасибо, Дима. Аплодируем. У кого появились вопросы, как я уже говорил: если гарантированно хотите задать вопрос, подходите к микрофонам, которые стоят по середине зала. Здесь, если я вижу руки, а там нет людей, то, соответственно, я вас спрашиваю. Итак, давайте начнем с той стороны, потом вот так вот будем.
(28:40) Слушатель: Дим, привет. Спасибо, за доклад. Я внимательно слушал, вопрос про пример, который ты давал на логику. Мне показалось, что там достаточно мало данных было для анализа, и есть ли другие критерии? Там, где три новостных портала, у них там разные заголовки, разное содержание. Можешь ли ты еще как-то оценить, что еще влияет, кто выиграет в быстровыдаче, ультравыдаче? Кроме заголовка там, трафика…
(29:17) Д.Ш.: Не, ну если обрисовать критерии, не очень хорошо слушал, соответственно, играет, во-первых, пул документа, который формировался на характеристике документов, которые идут с хоста, - это во-первых, нам то есть это хостовые характеристики, их можно изменить только за очень длительный период времени, и судя по докладу госпожи Остроумовой, пересматриваются они не очень часто. Кроме того, обращать внимание попаданием в агрегаторы и в социальные сети. Ну можно напрямую пытаться кормить бота, если ты можешь до него добраться каким-то образом. Быстробота. У тебя есть еще какие-то варианты? Ну вот по крайней мере так, чтобы системно, я каких-то других вариантов не нашел, то есть есть какие-то странные артефакты, когда сайт не должен быть на быстровыдаче, но он там есть. Такие артефакты есть, но какой-либо системности в появлении их я не заметил.
(30:20) С.: Второй вопрос: откуда информация, насколько она точна, насколько ей можно вообще доверять? Про все, что ты рассказывал, ты опираешься на какие-то, делаешь выводы, что нужно сделать это, твиты, по количеству документов, вот ты сослался на доклад Яндекса, а еще какие есть источники, где можно опровергнуть или убедиться вот во всей этой информации? Или это твоя личная статистика?
(30:49) Д.Ш.: Ну я как раз говорю, что формации очень мало, она носит эпизодический характер, ведь все, на что я мог опираться – это исследования тех аналитиков, которые я упомянул, а там тоже весьма неглубокие исследования, так на исследования и доклады Яндекса, ну и на собственную кукую-то аналитику, которую успел собрать за это время. Но проблема в том, что собрать большой пул документов из-за вот этих сложностей и сделать какие-то общие выводы на большой выборке не представлялось возможным, однако, скажем так, те выборки, которые удавалось получить, они примерно подтверждают то, что выше сказано. Пока никто не стал выкладывать то, что выходит, скажем так, что можно зафиксировать как удачный случай.
(31:40) В.: Ну что же, следующий вопрос этой стороны. Представляйтесь.
(31:41) С.: Меня Сергей Доронин зовут. Дим, спасибо за доклад, такой интересный. А вот скажи, такой вопрос: вот эти страницы из будущего – last modified у них какой стоит? Когда это должно появиться или?
(31:55) Д.Ш.: Нет, они как обычные документы, кроме того, надо понимать, что Яндекс все равно будет фиксировать дату ту, которую он поймал, когда считывал документ в первый раз, поэтому дата там стоит, естественно, старая. Вот это такой интересный момент.
(31:11) С.: То есть когда они появляются?
(31:12) Д.Ш.: Там фишка же не в этом, какой даты стоит документ, там фишка в том, что фиксируется, скажем так, в этом документе текст, дата проведения события. Причем он встроен получается органично, как дата самой новости, и получается, когда человек набирает запрос там «матч такой-то на дату такую-то», то вхождение всех частей данного запроса на документе есть, причем органично есть, а не вписано в текст каким-то иным образом.
(32:44) С.: Еще вопрос. Ты не проводил исследование, когда несколько страниц из будущего соревнуются между собой, как они ранжируются?
(32:52) Д.Ш.: А вот там уже вступают эти хостовые характеристики, которые остальные. На самом деле, если помониторить быстровыдачу на события, которые должны произойти через 2-3 и тогда в будущем, то практически все они используют вот эту технологию. То есть ставят датой дату проведения события, а не реальную дату появление этого документа.
(33:15) С.: А из них лучше тот, у кого хостовые лучше, да?
(33:18) Д.Ш.: А из них лучший дальше Яндекс выбирает по хостовым характеристикам, по твитам и так далее.
(33:25) В.: Ну давайте еще вопрос.
(33:27) С.: Здравствуйте, меня зовут Леонтьев Григорий, как раз представитель Хёрст Шкулев Медиа. Как раз на издательство, которое делает новостные сайты в том числе, поэтому знакомы с этой темы немножко, у меня есть вопрос непосредственно по слайдам. У вас слайд такой, как управлять ценностью: не очень понятно было, что такое наращивание качества документов на источнике и непонятно массовое всплывание документа на хабах.
(34:04) Д.Ш.: Ну, скажем, если ваш документ не показывает каких-то интересных поведенческих характеристик, то есть пользователь на нем не задерживается, востребованность его низкая, таких документов, то есть если вы просто гоните пургу новостную, то есть где-то откуда-то просто дергаете информацию, то ценность такого документа, понятно, будет ниже, чем у процент каких-то других документов, которые более пропродуманно формируются. Вот здесь вот есть график вот такой интересный.
(34:35) С.: Пургу не гоним.
(34:37) Д.Ш.: Ну пургу не гоните, молодцы. Все, что я могу сказать.
(34:40) С.: А про массовое всплывание документа на хабах? Что это означает?
(34:48) Д.Ш.: Ну к скольки агрегаторам ваши сайты подвязаны? Ко всем?
(34:54) С.: С Яндекс.Новостями и собственно все.
(34:55) Д.Ш.: Сколько? Сколько подвязано? Вот по моему опыту, новостные сайты подвязаны ну максимум там к двум-трем-четырем агрегаторам. А по факту их намного больше, то есть когда мы начали мониторить рынок агрегаторов, то по факту их там только крупных около десятка получается.
(35:14) Ну я так понял, что как можно больше источников, подписаться на как можно больше агрегаторов.
(35:19) Д.Ш.: Скажем так, даже исходя, если опираться исключительно на доклад Яндекса, то у них должника мониторится там несколько тысяч хабов. То есть если вы обнаруживаете сайт, который постоянно мониторится по каким-то причинам Яндексом, а это, как правило, сайты новостных агентств, вы можете с ними запартнериться, чтобы ссылка на вашсайт находилась на главной странице их сайта. Таким образом, благодаря такому обмену, когда у вас будет какая-то новая информация , вы ее вбрасываете на главную страницу этого сайта, и, соответственно, она будет подхватываться быстроботом.
(35:55) С.: Но эти ссылки, они обычно ставятся друг на друга.
(36:01) Д.Ш.: Ну какая разница? Вот я выступал в Харькове, там Олег Шестаков сказал, что в качестве скормки боту выкладывали до десяти тысяч ссылок на страниц. Вот после того, как они выложили 10 тысяч страниц, 10 тысяч ссылок на одной странице, то Яндекс забанил эту главную страницу. А тысячу спокойно кормится.
(36:32) С.: Хотел бы тогда с вами поделиться, просто тема действительно достаточно узкая, и вот мы размещали новости эксклюзивные: журнал «Антенна», который читает там вся Россия, стоит он 15 рублей. В нем новость там, условно говоря, про Наталью Водянову, какая-то там эксклюзивная, которую никто не знает, эта новость публикуется заранее на сайте, то есть завтра о ней будут знать все, на сегодня никто не знает, и вот мы экспериментируем.
(37:03) Д.Ш.: А вот для таких новостей вы должны готовить комплекс подготовительных мероприятий.
(37:08) С.: А вот смотрите, какие мероприятия у нас были: мы делали даже не одну новость, а две-три, с разными вариациями ключевых слов, с разным объемом текста и так далее, но, тем не менее, они отличались немножко друг от друга. И что мы замечали? Да, действительно, быстро статья появлялась на следующий день, но даже в течение дня позиции прыгали, и в основном позиции прыгали так, что в ТОП выплывали те сайты, где у которых эта Наталья Водянова была изначально, допустим, в разделе «Энциклопедия звезд» на хорошем месте, то есть если она была в ТОПе по запросу «Наталья Водянова» на сайте Х…
(37:52) Д.Ш.: Значит, вы по хостовым характеристикам проигрывали. Вот, если хотите обсудить, потом подойдите ко мне, мы с вами посмотрим на ваши артефакты.
(38:00) С.: Хорошо, спасибо.
(38:01) В.: Давайте последний вопрос, если есть. Есть вопрос? Если нет, Дим, спасибо огромное за доклад.

Развернуть текстовую версию
Комментарии
Похожие видео