Как анализировать сайт на кириллическом домене

PUNYCODE idna_convert преобразование кириллических доменов На работе и вне её я постоянно сталкиваюсь с необходимостью пропинговать, проверить тиц и pr, проанализировать сайт с кириллическими доменами, количество которых сильно возрасло с появлением доменной зоны РФ. Такие домены только в браузерах и поисковиках отображаются русскими символами, а на самом деле любой сервер и любая программа оперирует с такими доменами предварительно преобразовав название домена в набор из латинских символов, цифр и дефисов. Поэтому многие анализаторы, пингеры и прочие «проверяльщики» не могут работать с такими доменами.
Пока сам не столкнулся с задачей массовой проверки и пинга кириллических доменов, я даже не задумывался по какому алгоритму домены с кириллическими (и не только) символами преобразуются (шифруются) в перевариваемый «нормальный» формат. И больше всего меня заинтересовало существует ли на PHP решение для такой ситуации, чтобы без проблем можно было преобразовать кириллический домен в набор символов и обратно. Оказалось решение есть и очень даже простое! =)

Немного погуглив я решил найти ответ на вопрос «какой алгоритм используется для шифровки доменов». Нашел много результатов и попал на сайт одного хостера, в «FAQ» разделе которого был упомянут интересующий меня метод для преобразования. Оказывается кириллическое представление доменов преобразуется в соответствии с алгоритмом PUNYCODE (приведенным в технических стандартах RFC-3490, 3491, 3492) в международный вариант, который выглядит как комбинация из латинских букв и цифр.
Ключевое слово «PUNYCODE» было получено и зайдя на всем известный сайт www.phpclasses.org вбил в поиск это заветное слово. Поиск нашел php класс idna_convert, который преобразует любой домен в международный формат! Скачал архив, проинклюдил где нужно и посмотрев пример использования, который прилагается в архиве класса, легко прикрутил этот класс в сервис проверки сайтов — кириллические домены стали доступны для проверки и анализа. =)
Те, у кого на сайте есть различные анализаторы и еще не в теме, то сможете скачать этот класс на указанном мной сайте по поиску http://www.phpclasses.org/search.html?words=PUNYCODE&go_search=1
Архив с классом прикреплять к посту не буду, т.к. ничто не вечно и лучше скачивать актуальные верси классов с первоисточников =)
А вот ссылку, куда я прикрутил этот класс дам с удовольствием =) Чтобы вы могли убедиться в работоспособности и попробовали проанализировать сайт на кириллическом домене! Этот класс использую в своем сервисе, который позволяет сделать анализ wap сайта


Если Вам интересны темы, про которые я пишу в своем блоге, то Вы можете Подписаться на обновления. Подписываться на новости и обновления можно по емайл или через популярные сервисы yandex и google!

Эта запись была опубликована в рубрике Всяко-разно, Мои сайты и проекты, Полезное для w мастеров и отмечена метками , , , . Добавить в закладки ссылку.

Добавить комментарий