Антон Санченко письменник

Великий українізатор

30 Листопада 2012, 16:37

Тобто давати додаткові бали в ранжуванні результатів пошуку тим сайтам, які плекають свої українські версії, попри те, що за трафіком досі це було невигідно.

Знаю, що кажу, бо колись вираховував процентне співвідношення мов запитів російська/українська для однієї української пошукової системи. Це була вибірка з кількох тисяч пар пошукових термінів. Результати отримав такі: 63% (російська) до 37% (українська). Це був десь 2007 рік, а пошукова система називалася «Мета». Тож дістав добру нагоду розмежовувати професіоналів інтернету та юзерів. Профі запитували про українську: «Чому так багато?!» натомість юзери: «Чому так мало?»

Роком пізніше, за подібною вибіркою, але ще й із розбивкою по областях, обрахував розподіл Yandex. Найбільший відсоток українських запитів – 34% – був у Тернопільській області, що частково підтвердило те, що мої цифри взяті не зі стелі, однак водночас і змусило замислитися.

Тернопільська область – це моноетнічна область, де проживають 98% україномовних українців, без жодних але. І навіть це осердя України, шукаючи необхідну інформацію, послуговується переважно російськими запитами. Цьому мало би бути якесь пояснення. Так, вони шукають російською саме тому, що знають, що хочуть знайти. І вже не раз переконалися, що українською цього не знайдуть, бо ледь не всі українські сайти інтернет-магазинів чи файлообмінників мають російськомовний інтерфейс.

Але не треба отак одразу лаяти веб-майстрів. А ви самі що обрали б? 63% чи 37%. Коли витрати на розробку сторінок однакові? Понад те, якщо веб-майстер виявляється справжнім патріотом української мови і робить-таки українську версію сайта, виявляється, що один клік мишею, щоб перемкнутися зі стартової російської версії на українську, не лінь зробити лише 8% користувачів. Тоді який сенс в українських версіях узагалі?

Сенс таки є. Бо російською мовою, хай там як, користуються ще кілька країн (Росія, Білорусь, Казахстан тощо) І якщо конкуренції в пошуковій видачі з Білоруссю і Казахстаном можна не дуже боятися, то суперництво за першість із москвичами – інша річ. До того, як пошукові системи розробили алгоритми локальної видачі, різні для кожного міста і країни, неможливість перемогти москвичів у Yandex за запитом «пластиковые окна» примусила всіх українських гравців цього ринку будівельних матеріалів зібратися на пиво й ухвалити вольове рішення. Вони домовилися, що всі українські будівельні сайти вживатимуть словосполучення «металлопластиковые окна», щоб не витрачатися на безперспективну конкуренцію з москвичами, бо український трафік Yandexтоді становив щось із 9% загального, а так званих посилланнєвих бюджетів вимагав не менше від московських. Ось уже в Yandexі український офіс давно є, і регіональна видача, а віконний термін прижився, і його широко використовують у рекламі. Хто в темі, ностальгійно усміхається, почувши це в по радіо.

Мене колись дуже потішило це оригінальне вирішення проблеми будівельниками, яке дозволило відлаштуватись від московського трафіку, і саме тоді я подумав, що значно раціональніше було відлаштуватися взагалі за мовною ознакою. Навіщо вигадувати нові російські слова, коли маєш про запас цілу мову? Але історично так склалося, що уанет розвивався як відгалуження рунету, тобто були часи, коли навіть українських сайтів бракувало, щоб вбити вечір серфінгом, а усіх користувачів мережі в Україні було менше, ніж жителів Троєщини. Тобто певний час раділи і геть нецільовому російському трафіку, що пожвавлював лічильники і дозволяв звітувати перед інвесторами. Не дивно, що і головними пошуковими машинами для України ми, за аналогією, вважали російські Rambler, Aport, Yandex, під які і підлаштовували, тобто «оптимізували» сайти. Бо навіть власної інтернет-статистики до появи bigmirне мали.

Наступний «переворот твого світу», втрата якихось ілюзій і хибних уявлень пов’язані для мене саме з цим українським рейтингом сайтів. У 2004 році bigmirувів можливість відстежувати долі різних пошукових машин саме в українському трафіку, і несподівано з’ясувалося, що лідером є аж ніяк не загальновизнаний (за аналогією) Yandex, який щойно звитяжно обійшов Rambler, а… прикольний, але не більше, Google. При чому лідером настільки переконливим, понад 50% ринку пошукових запитів, що його вже можна було сприймати як монополіста.

Тож звідтоді, варто було б Google заявити, що він більше любить зелені сайти, наступного ж дня половина сайтів уанету перефарбувалась би в зелений, попри істерики і самогубства дизайнерів. Тож навіть до зливу інформації, що Google віддає перевагу українським версіям сайтів, треба ставитися з усією серйозністю. Google належить до тих нечисленних сайтів, які шикують мережу під себе, а не підлаштовуються під неї.

Історія любові «Гугля» з Україною має кілька етапів. Спочатку він ніяк не вирізняв її серед решти 154 країн. Більше цього, геть нічого про неї не знав.

Виключно цим можна пояснити, що тривалий час він мав для неї лише одну мовну версію (як не перебільшено буде називати мовною версією надписи на його двох лаконічних кнопках) і ця версія була… українська. Тобто написи на двох кнопочках були українською. І цього виявилося достатньо.., щоб відвоювати у росіян левову частку ринку, зовсім не напружуючись.

Пам’ятаєте, я казав, що неекономно вигадувати нові російські слова, коли маєш у рукаві цілу зайву мову? Ось цієї прямолінійності – якщо країна Україна, то мова інтерфейсу українська – виявилось достатньо, щоб людина, яка вперше користується пошуком, одразу зрозуміла, що заморська пошукова машина, по-перше, розуміє українську мову, а отже, по-друге, шукає по українських сайтах. А раз українську розуміє, а пошуковець американський – англійську за замовчанням, а російську вже непевне. Після нетривалого тестування пошукових алгоритмів на улюблених запитах з трьох літер, цього виявилося достатньо, щоб «Гугль» встановлювали стартовою сторінкою сисадміни усіх київських установ і підприємств. З українською мовною версією. Таким нехитрим штибом цей пошуковик завоював місцевий ринок, ще на ньому не з’явившися.

А ось коли в нього нарешті з’явилися місцеві консультанти, а відтак і представництво, а згодом і філіал, які пояснили, що українська мова неправильна, виник пристосований для локальних уявлень про локальні умови російський інтерфейс. Хоча, повторюю, на той час Google вже міг обирати хоч лемківський діалект, і всі сайти просто брали б до уваги і «брали під козирок», не сперечаючись.

Консультанти, на мою скромну думку, геть невиправдано порадили скопіювати яндексівський підхід із транслітом українських запитів у російські і видачею за ними російських сайтів (скажімо, на «Україна» видає також сайти з «Украина»), тоді як Yandexмав на те дещо інші резони. Але, може, я й неправильно оцінюю кількість україномовних сайтів у нашій мережі на той час, можливо, за більшістю запитів тоді просто не було чого видавати українською, тож на запит «футбольна форма» доводилося підтягувати результати за запитом «футбольная форма».

В тому, що все саме так, я мав нагоду переконатися колись на власному досвіді, коли створив сайт, який із певних причин мав лише одну мовну версію – українську. Сайт несподівано швидко, всього за місяць набрав PageRank5 у Google, лише за рахунок посилань користувачів, настільки дефіцитним він виявився в той час, але мої спроби монетизувати ці високі показники цитованості на продажних посиланнях на інші сайти результатів не мали. Виявилося, що просто немає комерційних українських сайтів, готових купувати лінки, що властиво російському сегменту, а російські зовнішні посилання були тому сайтові протипоказані.

Тобто не варто дорікати Googleякоюсь мовною зверхністю, «джаст» бізнес. Принаймні українську новинну стрічку, чого досі не зробили ні Yandex, ні навіть Мета, Googleзапустив за першої ж нагоди, ледь набралася достатня кількість новинних джерел українською.

Але повернімося до нашої детективної історії. Досі була передісторія.

Ми випили три кави, переглянули з десяток скриншотів, за деякі з них в часи свого захоплення оптимізацією я віддав би багато: свого супротивника варто знати досконало. Зокрема, переконався, що в інтерфейсі так званого рейтера – людини, яка перевіряє і коригує результати автоматичної видачі (такі підрозділи є в усіх пошукових машинах), параметр «мова» таки має місце.

Принаймні запропоновані мені для ілюстрації запити засвідчили вже вичищеність від іншомовних сайтів. Тобто за запитом «игры» й «ігри» видача вже майже не перетиналася, як колись, і вся перша десятка за словом «ігри» мала українську версію, навіть якщо в одному випадку й з’явилася російська сторінка (мабуть, краще прокачана посиланнями).

 

Не наводитиму всіх прикладів, бо це не спеціальна стаття. Мене зацікавив саме цей, позаяк я чимало років спостерігаю за топ100 пошукових запитів згадуваного bigmirі пам’ятаю, що «ігри» в українському написанні є одним із топових запитів поряд із «игры» в російському.

Так само зацікавила пара «новини/новости» – теж із того самого рейтингу популярних запитів.

Видача тут начебто і не мала б перетинатися, адже слова надто різняться написанням, але перетинається на 70%. І навіть за російським запитом «новости» в першій десятці українського «Гугля» переважають новинні сайти… які окрім резонної російської мають також українську версію – 7 із 10.

І наостанок. Найбільше мене переконав такий бажаний для багатьох запит «автобазар», який залежно від обраної мови інтерфейсу виводив на першій позиції то українську, то російську версію однойменного сайта.

Від подальших висновків я утримаюсь. Хоча аналізував ще погоду і кілька інших «жирних» запитів. Висновок один – «Гугль» почав звертати увагу на мову. Як це впливає на конкретний сайт у загальній формулі релевантності, судити зарано, але починайте придивлятися й аналізувати. Можливо, додати на сайт українську версію – це найекономніший шлях йому сподобатися.

Це я написав пораду для веб-майстрів. А що робити решті? Шукайте українською, якщо це ваша рідна мова, не полінуйтеся перемкнути Googleна український інтерфейс, це забезпечить саме шукані результати, цього достатньо. Якщо за справу вже взявся «Гугль», невдовзі мовна картина в нашому сегменті мережі повністю нормалізується і відповідатиме реальному стану речей в живій природі, ні більше, ні менше. Тобто жителі Тернопілля принаймні шукатимуть рідною мовою і знаходитимуть, що їм треба, без перекладачів.

Позначки: