Domeny wielojęzyczne (IDN) w perspektywie globalnej

Jakiś czas temu na naszym blogu opublikowaliśmy artykuł Domena z polskimi znakami. Czy warto? Wtedy, też po raz pierwszy poruszyliśmy temat domen IDN (ang. Internationalized Domain Name), czyli takimi, które zawierają znaki narodowe spoza alfabetu łacińskiego. Domeny te nazywane są również domenami wielojęzycznymi (za NASK).

Przy okazji niniejszego artykułu zajmiemy się tym zagadnieniem znacznie szerzej, ponieważ rozważymy je nie tylko z polskiej, ale także globalnej perspektywy. Specjalnie na tę okazję sprawdziliśmy wyniki IDN World Report – rozwijanego od kilku lat projektu badawczego zainicjowanego przez UNESCO oraz EUrid. Oto co z niego wyczytaliśmy.

Jak działają domeny IDN?

Nazwy stanowiące rdzeń systemu adresowania w Internecie działają, ponieważ są interoperacyjne i unikalne. Oznacza to, że każdy użytkownik podłączony do sieci Internet w dowolnym miejscu na świecie może dostać się do tego samego miejsca docelowego, wpisując nazwę domeny (jako część adresu internetowego lub adresu e-mail). Idea internacjonalizacji zestawów znaków obsługiwanych w ramach DNS jest prawie tak stara, jak sam Internet, jednak m.in. ograniczenia techniczne spowodowały ograniczenie zestawu znaków w DNS.

Jak to wygląda od strony technicznej?

Techniczne standardy domen wielojęzycznych zostały opracowane w połowie lat 90-tych. Tamto rozwiązanie zachowuje ograniczony zestaw znaków dla DNS (ASCII) i dokonuje transliteracji (przekładu) każdego innego znaku.

Czym zatem jest ASCII? Jest to system kodowania znaków za pomocą cyfr. W tablicy znaków ASCII zebrane są używane znaki alfanumeryczne i przyporządkowane im kody liczbowe. Na przykład: litera „a” jest kodowana jako liczba 97, a znak spacji jest kodowany jako 32.

Jeżeli wpiszemy w pasku adresu przeglądarki nazwę domeny lub hosta zawierającą choćby jeden znak inny niż ASCII wówczas przeglądarka, wspierająca domeny IDN, za pomocą specjalnego algorytmu (RFC 3490) przetłumaczy nam nazwę domeny do odpowiedniej, równoważnej postaci ASCII domeny wielojęzycznej przechowywanej w zasobach DNS.

Formy xn-- ASCII nazw domen są bez znaczenia dla ludzi, ale ważne dla naszych komputerów (serwerów nazw), które odczytują nazwy domen. Tak więc, ludzie widzą znaczące, przekodowane znaki, kiedy poruszają się po Internecie, podczas gdy podstawowe techniczne rozwiązania nazw domen pozostają niezmienione.

Źródło: https://idnworldreport.eu/year-2017/universal-acceptance/what-is-universal-acceptance/

Reasumując rozwiązanie to opiera się na istnieniu dwóch postaci domeny:

  • Formy zewnętrznej – ze znakami diakrytycznymi
  • Formy technicznej (wewnętrznej) odwzorowanej za pomocą specjalnego algorytmu (Punycode) do takiej postaci, aby można było ją wprowadzić w DNS. W formie technicznej (wewnętrznej) nazwa domeny składa się z alfabetu łacińskiego, ale rozpoczyna się sekwencja „xn--„.

Czemu rozwój IDN jest taki ważny?

Internet szybko stał się integralną częścią naszego życia. Choć od jego powstania do upowszechnienia komercyjnego Internetu minęło kilka dziesięcioleci, od czasów Web 2.0 zmiany zaczęły następować niezwykle szybko. W 2006 roku zdumiewało nas, że miliard ludzi jest już online; w 2017 roku ponad 4,5 miliarda populacji posiadało już dostęp do Internetu.

Nie wszędzie jednak dostęp do Internetu jest taki sam. Podczas, gdy w Europie oraz Ameryce Południowej jest praktycznie wszechobecny, tak w wielu innych częściach świata wskaźniki penetracji Internetu są nadal poniżej 50%. Następne miliardy internautów potrzebować będą systemu adresowania internetowego, który spełnia ich potrzeby – nazw domenowych obsługujących języki, którymi ta ludność mówi i którą rozumieją.

67% świata nie używa języka opartego na alfabecie łacińskim
– Ram Mohan, sekretarz generalny i przewodniczący ICANN Universal Acceptance Steering Group

Po drugie: Istnieje międzynarodowy konsensus co do potrzeby promowania różnorodności językowej, zarówno w cyberprzestrzeni, jak i poza nią.

Krótka historia domen wielojęzycznych

Implementacja domen wielojęzycznych rozpoczęła się na dobre w 2000 roku w domenach drugiego poziomu (przed .com i .net). W ciągu następnych dziesięciu lat rejestry krajowe zajmowały się ich wdrożeniem, głównie opierając się na zestawach znaków pochodzących z języka lokalnego.

W Polsce miało to miejsce 11 września 2003 roku. To wtedy NASK wprowadził możliwość rejestracji domen zawierających polskie znaki. Niektórzy eksperymentowali z innymi strategiami internacjonalizacji nazw domen, ale technologia IDN okazała się najbardziej skuteczna.

Nie oznacza to jednak, że domeny wielojęzyczne okazały się proste do wdrożenia. Wiele wyzwań pozostaje, w tym (na poziomie technicznym), jak radzić sobie z wariantami znaków, które są powszechne w skryptach arabskich i chińskich. Kolejnym wyzwaniem jest np. spójna reprezentacja w przeglądarkach i e-mailach na poziomie użytkownika (user experience).

W 2006 roku na fali dyskusji dotyczących zarządzania Internetem (brak IDN jako domen najwyższego rzędu) jako kluczowy element budowania wielojęzycznego Internetu określono konieczność jak najszybszego utworzenia wielojęzykowych domen narodowych.

W 2010 r. ICANN podjął historyczny krok w zatwierdzaniu ccTLD dla czterech krajów: Egiptu (.مصر), Arabii Saudyjskiej (.السعودية), Rosji (.рф) i Zjednoczonych Emiratów Arabskich (.امارات). Od tego czasu odnotowuje się stały wzrost liczby rejestrów IDN.IDN (zawierających znaki narodowe spoza alfabetu łacińskiego przed jak i po kropce).

Warto nadmienić, że zaledwie w dwa tygodnie po pozytywnej decyzji ICANN odnośnie niełacińskich domen pojawiły się pierwsze adresy zapisane po arabsku. Jak komentowali niektórzy: od tamtego momentu przestał w tym momencie być domeną jedynie świata zachodniego, otwarcie na inne kręgi kulturowe wspomóc może rozwój globalnej sieci w regionach używających innych sposobów zapisu.

Autorzy raportu przekonują, że głównym wyzwaniem dla masowego upowszechnienia się domen IDN jest ich niewielka powszechna akceptacja: zarówno jeśli chodzi o adresy e-mail, nazwy ID użytkowników, oraz akceptacja tychże w przeglądarkach, aplikacjach i urządzeniach.

Jeżeli nie wiesz, co się za tym kryje – spójrz, poniższy przykład pochodzi z największego sklepu internetowego na świecie.

Źródło: https://idnworldreport.eu/wp-content/uploads/2018/01/Screenshot-2-702×1024.png

Fakty i liczby

Każdego roku zespół badawczy IDN World Report publikuje kluczowe fakty i dane liczbowe dotyczące wykorzystania IDN. Oto najważniejsze z nich.

Źródło: https://idnworldreport.eu/year-2017/

Liczba domen wielojęzycznych od początku ustanowienia badań systematycznie wzrasta. Powyższy obejmuje rejestrację domen IDN pierwszego i drugiego poziomu. Silny wzrost (28%) w 2016 r. Wynika ze wzrostu liczby rejestracji drugiego poziomu w ramach domeny .cn (Chiny) o ponad 400% w ciągu 2 ostatnich lat (uwzględnionych w badaniu). Szacuje się, że w grudniu 2016 roku zarejestrowanych zostało 8,7 milionów domen wielonarodowych.

Źródło: https://idnworldreport.eu/infographics/idns-emerging-economies-2/

Domeny wielonarodowe najpopularniejsze są w krajach azjatyckich oraz Rosji. W Polsce ich liczba szacowana jest na ok. 41 000. Uważamy jednak, że liczba ta będzie się stale zwiększać. Po pierwsze zauważono korelację pomiędzy wzrostem gospodarczym a zwiększeniem się liczby rejestracji domen IDN. Po drugie – jeżeli posiadasz domenę bez ogonków, to naturalnym wydaje się zarejestrowanie wersji IDN, aby zabezpieczyć się przed ewentualnymi nieuczciwymi działaniami konkurencji bądź nieprzyjaznych Ci osób.

Źródło: https://idnworldreport.eu/infographics/idns-percentage-of-all-domains-2/

Na sam koniec grafika przedstawiające procent domen wielojęzycznych na tle domen zakodowanych w ASCII. Ich liczba stale przybywa. Jeszcze 2 lata temu stanowiły jedynie 2%. Coś na podsumowanie? Nie bój się rejestrować domen z polskimi (ani innymi) znakami diakrytycznymi 🙂

Ps. Dla tych, którzy zaczynają już przeliczać kwoty – ceny odnowienia domen z polskimi znakami są znacznie niższe od tych bez (dotyczy to jednak tylko domen .pl). Dlaczego tak się dzieje? Wynika to z polityki cenowej rejestru domeny .pl. Domeny z polskimi znakami są znacznie rzadziej używane, dlatego też NASK poprzez niższe opłaty chce zachęcić polskich użytkowników Internetu do rejestrowania domen z polskimi znakami.

Ps. 2 Do poszukiwania Twoich domen IDN wykorzystaj naszą wyszukiwarkę. Świetnie sobie poradzi z nazwa domenową w każdym języku.

 

Źródła:
https://www.dns.pl/
https://www.dns.pl/IDN/idn-faq.html
https://idnworldreport.eu/year-2017/
https://idnworldreport.eu/what-is-the-universal-acceptance-steering-group/
http://di.com.pl/domeny-arabskie-juz-dzialaja-31558

Podobał Ci się artykuł? Udostępnij

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *