ПредишенСледващото

Евгений прекарал си работни характеристики на технологията "Спектър". И той започва, както обикновено, с историята на въпроса.

Когато потребителите да задават въпроси на Yandex, около 20% от случаите те са повторно заявката е двусмислен. Например, за [Наполеон] някой иска да намери военен лидер, а някой - рецепта за торта. Искането иска от [земята], хората могат да търсят и ресторант с доставка до дома, и рецептата за това ястие.

подразбира се изолира при използване на социални статистика търсения. По принцип е разумно. Някой от търсене [лаптопа] иска да си купи нов лаптоп, някой иска да си купи лаптоп б / г.

Видове теми намерени резултати:

1. Темата на страницата: "Нов, за да купуват." Подчертани в откъс от: продажна цена. купува, каталог, нова и т.н.

2. При спазване на страницата: ". Б / г" Светеща във фрагмента: б / ф, използвани. и т.н. Не свети: купи, Цена, ремонт

3. Темата на страницата: "ремонт" е подчертана във фрагмента: ремонт. и т.н. Не свети: продажна цена, б /

Според Евгений, първоначално технология "Спектър", за да работи правилно. Теми са отделни и не се пресичат. След това работих както обикновено представа за оптимизатори - пиша повече различни думи, и изведнъж нещо ще излезе, и да. Сега "Спектър" работи по различен начин.

Сега за искането е предоставен списък с допълнителни намерения (

намерения, теми) потребителят добавят при издаване на резултатите от отделна база данни на класифицираните страници (от значение):

- Отбелязването "спектър" на думи в "нормалните" резултатите

- Осветление на "спектър" на думи, независимо от намеренията (тези)

- Смесване - патерица. Понякога има сайтове, които пълзят по всички искания. Той е сравнително добре позната нещо, когато по искане на [работа] обхождане сайтове за "реклами", поради факта, че той е трябвало, когато той е бил написан на думата "работа", а сайтът е по-подходяща база данни. Разбира се, никой не може да се предположи, че рекламите за сайта е класифициран за [работа]. "Тежкотоварни автомобили" проблем запушват.

- Понякога някои от примеси води до едно намерение. Например, няколко интерпретации на коментари. Например, модел заявка на машината [Suzuki Grand Vitara]. Там, изолирани и снимки и описания и разходите, както и спецификации - всички възможни Намерения Това означава, че се открояват:

Технологии

Как да се разграничи спектъра на примес към една и съща намерение, по същата тема?

Според идентификатор на документа в XML-въпрос. Откроени фрагменти се сменят редовно. Тя може да се види, че в резултат на шестия и петия посветени на мнения, но в допълнение има много мнения и друга възможност за намеренията на потребителите. Ние всеки намерен резултатът е идентификатор на документа:

Нормално документ 4 фрагмент

Спектър. 3 фрагмент

Bystrorobot 3 фрагмент

Ultrarobot (понастоящем няма) 2 фрагмент

Например, заявката [I] е десет от десет на резултати спектър в доставката. И различни видове заявки [Перм, Казан, Новосибирск]. Това е много ясно защо в този единствено число: [Виктор Цой], [за кучета]. Впечатлението е, че не е първата дума, но след това той е бил отрязан и изхвърлен, и искането в тази форма е в "Спектър".

Ето един въпрос [Казан], вътр. тема "Спектра" - 7 от 10:

Технологии

Това, което имаме визуална тема? Карта, атракции, новини, хотели. Казан - длъжностно лице, вероятно, всеки сайт на град Казан. И на последно място - Gismeteo.ru, прогноза за времето. Всичко изглежда наред. Но когато влезе в заявката [Казан], виждаме, че "Спектра" просто няма и никакви примеси след това не се виждат:

Технологии

Това е често срещан проблем. Учудващо е, че "Спектра" на това искане не е, въпреки факта, че честотата на това десет пъти повече от заявката [Казан].

Някои сайтове са щастливи-силни. Някои сайтове са много често попадат в "Спектър". Ясно е, че колкото повече искания, толкова по-големи обекти. А спектър от голям брой примеси, най-големият лидер - това www.torrentino.com, www.zaycev.net, а след това отново www.fast-torrent.ru - в общи, развлекателни обекти.

Някои сайтове са щастливи да получат временен "Спектър", след което ги търкам.

Срок функции. Ние идентифициран най-информативните план-функции, основани на взаимно информация ... Както се очакваше, най-контрастни условията са магазин, рублата, каталог, цена, цената и кошница ... Пълният списък на термини, използвани за класификация се състои от около сто термини ,

Лексикални особености. Ние използвахме списъка на марки и търговски марки

Срок функции ... лексикален различни мнения е много по-висока от тази на магазин страници, списъкът с контрастиращи думи е много по-дълъг и надвишава 7000 думи.

Лексикално списък features.The от 165 ръчно събрани оценка прилагателни-добри, красиви, прекрасни, лоши, отвратителни, ужасни и т.н. (Добре, отличен, magnifi сто, лошо, отвратително, ужасно, и т.н.)

Един човек попита за възможността на продукта и трябва да реши проблема, че иска да купи продукта или той искаше да прочетете за него. За класирането на заявките и страници използва за съхраняване на терминология, където около сто думи, известни с магазина. Преглед на използваната класификация за около 7000 думи, както и някои прилагателни Изработени на ръка. Редът на думите в класификатора - 7-10 хиляди.

Но най-интересното е, че въпросът за - тя също е многословен парчета. Например, [пица] в Москва. Очевидно е, че [пица] или [доставка] се разпределят поотделно и фрагментът [начало] подчертано изцяло. Две думи в същия пасаж:

Технологии

Като цяло, издаването на такива дълги парчета в "Спектър" е много голяма. От общо 83 000, за да отговори 20-25% от спектъра на примесите, и имаше само 127 уникални парчета.

Топ дълги фрагменти, както следва:

какво - 21 773, 26,1%

гледате онлайн - 17034, 20.4%

текстове - 10970, 13.1%

Ръцете - 9809, 11.7%

у дома - 4062, 4,9%

Прогноза за времето - в 2639, 3,2%

прегледи на собствениците - 2324, 2,8%

текстове - в 2049, 2.5%

Текстове - 1862 2,2%

шофьор изтегляне - 1001, 1,2%

Карта - 992, 1,2%

спецификации - 970, 1.2%

онлайн часовник - 899, 1,1%

карта на града - 681, 0.8%

изтегляне на водача - 634, 0.8%

Очевидно е, че тези фрагменти се добавят ръчно. Но, разбира се, страшно, че Yandex ще се занимаем с тези думи в класацията, тъй като те все още са в класацията не се използват, и да се използва само класиралият "Спектра". Какво да се прави?

Ако приемем, че класацията не участват, тогава единственият възможен интерес - е да се получи в един спектър от примеси. Следваща - един сайт за качество. Някои сайтове са смесени често. Изясняване на класификацията на словото и многословен парчета за вашите заявки (искания за различни предмети). Не се колебайте да ги използвате в текста. И така нататък.

Благодаря ви за вниманието!

Удобства: - Дали е разследвани тип заявка, която попада в спектралната примес? Ясно е, че тя трябва да съдържа допълнителни думи, които характеризират Намерения. Да те мине през един оператор или по някакъв начин е добавен? Фактът, че ние може да изолира думата - това е ясно. Вземете своя собствена тема, се впише условия. Всички тези неща можем да изчислим думи и фрази. Но е логично да се предположи, че сайтовете са смес от това намерение, и те са лидерите в някои търсене. дали такова проучване се извършва? Всички въпроси или искания за лидер на групата. Каква заявка? Или го направя другия тип хит?

Евгени Trofimenko: - Има два варианта за вашия въпрос. Или за искане или около пресечната точка на темите в "спектър".

Удобства: - Pro искания.

Евгени Trofimenko: - Не, това не е проучвана.

Удобства: - това е, че е логично да се предположи, за решаване на проблема за получаване на "спектър" трябва да се разбира в всяко искане за него, за да се превърне в лидер?

Евгени Trofimenko - Не е лидер. Мисля, че трябва да има поне един въпрос, който е на спектъра, и който ви подхожда.

Удобства: - да бъде използван спектрален резултат и изглежда по всяко едно фиксирано място, в шести или осми. Тогава спектрален резултатът беше номер едно класиран на първо място?

Евгени Trofimenko: - Значи, вие искате да попитам как промяна в позицията на спектрален примес?

Удобства: - Да. Може би това е изследвана?

Евгени Trofimenko: - Не, това не е проучвана. Ти просто трябва да се справят с една малка група от заявки.

Удобства: - Това означава, че само с промяна на позицията на спектрален примес?

Евгени Trofimenko: - Разбира се, промени.

Удобства: - Бих искал да се изясни, тук е мястото, където да получите допълнително. думи, за да се смесят?

Евгени Trofimenko - Парс предоставяне на тези искания, които ви интересуват.

Удобства: - Но има и не е всичко, най-вероятно ще бъде?

Евгени Trofimenko: - Да, има не е всичко. И, за да не направи разбор на всички вас за всеки сайт, намерени, извади три обекта. След това, има и desyatochka маркирана. И преминавайки през различни адреси в рамките на сайта, можете да получите повече.

Свързани статии

Подкрепете проекта - споделете линка, благодаря!