Тему поста навеяла тема с форума Серчэнжинес об учете транслитерации в ссылках. Примеров можно привести достаточно много:

Но на самом деле не все так просто, например, по моей фамилии написанной транслитом (Bessonov) мой блог упорно не хочет находиться в поиске, тогда как ссылки с текстом ”Бессонов” есть, и непосредственно по “Бессонов” сайт выдается как найден по ссылке.
Таким образом, не любой транслит учитывается в ссылочном, а существует, по-видимому, некоторая база пар фраз, которая составляется по определенному алгоритму, похожему на алгоритм составления словаря аббревиатур (читаем блог о поиске Яндекса, если кто не в курсе). И ссылочные факторы ранжирования, влияющие на одну из этих фраз в паре, влияют и на другую фразу.
Источниками информации при формировании списка пар взаимозаменяемых транслитерированных фраз, вероятней всего, являются логи поисковых запросов и коллекция всех текстов Интернет зоны ru. Сначала из логов поисковых запросов извлекается первоначальный список фраз, являющихся транслитерацией к данной (вспоминаем ассоциированные запросы в сервисе подбора слов Яндекс.Директ, т.е. что еще искали пользователи, набиравшие первоначальную формулировку фразы), а затем на основании встречаемости транслитераций во всем русскоязычном вебе производится фильтрация наиболее правильной транслитерации.
На примере запроса хундай, наверное, эта процедура должна выглядеть примерно так:
хундай – > huinday, hundai, hunday, hyndai, hyundai
и на основании частот встречаемости различных вариантов англоязычного написания хундай в русскоязычном вебе и происходит выбор правильного варианта транслитерации (возможно нескольких вариантов). Как-то так.
А теперь попробуем проверить предполагаемую теорию на некоторых примерах:
1. mitsubishi - интересно по какому русскоязычному написанию найдется сайт. На всякий случай сделаем еще и запасной вариант mitsubishi, ведь внутреннее ссылочное ранжирование никто не отменял.
2. Далее шмитс - известная марка полуприцепа. И подстраховка шмитс для верности.
3. Теперь тот же полуприцеп, но в более частотном написании шмитц
4. Ну и попробуем что-нибудь из фамилий использовать, например, так Ivanov и запасной вариант со ссылкой на внутреннюю страницу моего блога Ivanov.
Пока достаточно, посмотрим на результаты того, что уже есть.
Полюбился СЕО Пресс? Подпишись на RSS.
Интересно изучить: