HTML head lang ru en коды языка
HTML5CSS.ru
ЛУЧШИЙ САЙТ ДЛЯ РАЗРАБОТЧИКОВ
❮ Назад Дальше ❯
Коды языка ISO
Атрибут HTML lang может использоваться для объявления языка веб-страницы или части веб-страницы. Это предназначено для оказания помощи поисковых систем и браузеров.
В соответствии с рекомендацией W3C необходимо объявить основной язык для каждой веб-страницы с атрибутом lang внутри тега <html>, например:
<html lang=»en»>
…
</html>
Для русского языка
<html lang=»ru»>
…
</html>
В XHTML язык объявляется внутри тега <html> следующим образом:
<html xmlns=»http://www.w3.org/1999/xhtml» lang=»en» xml:lang=»en»>
…
</html>
ISO 639-1 Коды языков
ISO 639-1 Определяет аббревиатуры для языков.
В HTML и XHTML их можно использовать в атрибутах lang и XML: lang.
Смотрите также: Следующая ссылка на коды стран.
Язык | ISO Код |
---|---|
Абхазии | ab |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanian | sq |
Amharic | am |
Arabic | ar |
Aragonese | an |
Armenian | hy |
Assamese | as |
Avaric | av |
Avestan | ae |
Aymara | ay |
Azerbaijani | az |
Bambara | bm |
Bashkir | ba |
Basque | eu |
Belarusian | be |
Bengali (Bangla) | bn |
Bihari | bh |
Bislama | bi |
Bosnian | bs |
Breton | br |
Bulgarian | bg |
Burmese | my |
Catalan | ca |
Chamorro | ch |
Chechen | ce |
Chichewa, Chewa, Nyanja | ny |
Chinese | zh |
Chinese (Simplified) | zh-Hans |
Chinese (Traditional) | zh-Hant |
Chuvash | cv |
Cornish | kw |
Corsican | co |
Cree | cr |
Croatian | hr |
Czech | cs |
Danish | da |
Divehi, Dhivehi, Maldivian | dv |
Dutch | nl |
Dzongkha | dz |
English | en |
Esperanto | eo |
Estonian | et |
Ewe | ee |
Faroese | fo |
Fijian | fj |
Finnish | fi |
French | fr |
Fula, Fulah, Pulaar, Pular | ff |
Galician | gl |
Gaelic (Scottish) | gd |
Gaelic (Manx) | gv |
Georgian | ka |
German | de |
Greek | el |
Greenlandic | kl |
Guarani | gn |
Gujarati | gu |
Haitian Creole | ht |
Hausa | ha |
Hebrew | he |
Herero | hz |
Hindi | hi |
Hiri Motu | ho |
Hungarian | hu |
Icelandic | is |
Ido | io |
Igbo | |
Indonesian | id, in |
Interlingua | ia |
Interlingue | ie |
Inuktitut | iu |
Inupiak | ik |
Irish | ga |
Italian | it |
Japanese | ja |
Javanese | jv |
Kalaallisut, Greenlandic | kl |
Kannada | kn |
Kanuri | kr |
Kashmiri | ks |
Kazakh | kk |
Khmer | km |
Kikuyu | ki |
Kinyarwanda (Rwanda) | rw |
Kirundi | rn |
Kyrgyz | ky |
Komi | kv |
Kongo | kg |
Korean | ko |
Kurdish | ku |
Kwanyama | kj |
Lao | lo |
Latin | la |
Latvian (Lettish) | lv |
Limburgish ( Limburger) | li |
Lingala | ln |
Lithuanian | lt |
Luga-Katanga | lu |
Luganda, Ganda | lg |
Luxembourgish | lb |
Manx | gv |
Macedonian | mk |
Malagasy | |
Malay | ms |
Malayalam | ml |
Maltese | mt |
Maori | mi |
Marathi | mr |
Marshallese | mh |
Moldavian | mo |
Mongolian | mn |
Nauru | na |
Navajo | nv |
Ndonga | ng |
Northern Ndebele | nd |
Nepali | ne |
Norwegian | no |
Norwegian bokmål | nb |
Norwegian nynorsk | nn |
Nuosu | ii |
Occitan | oc |
Ojibwe | oj |
Old Church Slavonic, Old Bulgarian | cu |
Oriya | or |
Oromo (Afaan Oromo) | om |
Ossetian | os |
Pāli | pi |
Pashto, Pushto | ps |
Persian (Farsi) | fa |
Polish | pl |
Portuguese | pt |
Punjabi (Eastern) | pa |
Quechua | qu |
Romansh | rm |
Romanian | ro |
Russian | Русский | ru |
Sami | se |
Samoan | sm |
Sango | sg |
Sanskrit | sa |
Serbian | sr |
Serbo-Croatian | sh |
Sesotho | st |
Setswana | tn |
Shona | sn |
Sichuan Yi | ii |
Sindhi | sd |
Sinhalese | si |
Siswati | ss |
Slovak | sk |
Slovenian | sl |
Somali | so |
Southern Ndebele | nr |
Spanish | es |
Sundanese | su |
Swahili (Kiswahili) | sw |
Swati | ss |
Swedish | sv |
Tagalog | tl |
Tahitian | ty |
Tajik | tg |
Tamil | ta |
Tatar | tt |
Telugu | te |
Thai | th |
Tibetan | bo |
Tigrinya | ti |
Tonga | to |
Tsonga | ts |
Turkish | tr |
Turkmen | tk |
Twi | tw |
Uyghur | ug |
Ukrainian | uk |
Urdu | ur |
Uzbek | uz |
Venda | ve |
Vietnamese | vi |
Volapük | vo |
Wallon | wa |
Welsh | cy |
Wolof | wo |
Western Frisian | fy |
Xhosa | xh |
Yiddish | yi, ji |
Yoruba | yo |
Zhuang, Chuang | za |
Zulu | zu |
❮ Назад Дальше ❯
Популярное
html картинка
как вставить картинку в html
цвет текста фона
размер текста html
цвет размер шрифта html
формы html
список html
таблица html
как сделать ссылку в html
Copyright 2018-2020 HTML5CSS. ru
Правила и Условия Политика конфиденциальности О нас Контакты
Атрибут lang и значение для SEO
CULTURE SPEC.CULTURE ENGLISH NAME
—————————————————————
Invariant Language (Invariant Country)
af af-ZA Afrikaans
af-ZA af-ZA Afrikaans (South Africa)
ar ar-SA Arabic
ar-AE ar-AE Arabic (U.A.E.)
ar-BH ar-BH Arabic (Bahrain)
ar-DZ ar-DZ Arabic (Algeria)
ar-EG ar-EG Arabic (Egypt)
ar-IQ ar-IQ Arabic (Iraq)
ar-JO ar-JO Arabic (Jordan)
ar-KW ar-KW Arabic (Kuwait)
ar-LB ar-LB Arabic (Lebanon)
ar-LY ar-LY Arabic (Libya)
ar-MA ar-MA Arabic (Morocco)
ar-OM ar-OM Arabic (Oman)
ar-QA ar-QA Arabic (Qatar)
ar-SA ar-SA Arabic (Saudi Arabia)
ar-SY ar-SY Arabic (Syria)
ar-TN ar-TN Arabic (Tunisia)
ar-YE ar-YE Arabic (Yemen)
az az-Latn-AZ Azeri
az-Cyrl-AZ az-Cyrl-AZ Azeri (Cyrillic, Azerbaijan)
az-Latn-AZ az-Latn-AZ Azeri (Latin, Azerbaijan)
be be-BY Belarusian
be-BY be-BY Belarusian (Belarus)
bg bg-BG Bulgarian
bg-BG bg-BG Bulgarian (Bulgaria)
bs-Latn-BA bs-Latn-BA Bosnian (Bosnia and Herzegovina)
ca ca-ES Catalan
ca-ES ca-ES Catalan (Catalan)
cs cs-CZ Czech
cs-CZ cs-CZ Czech (Czech Republic)
cy-GB cy-GB Welsh (United Kingdom)
da da-DK Danish
da-DK da-DK Danish (Denmark)
de de-DE German
de-AT de-AT German (Austria)
de-DE de-DE German (Germany)
de-CH de-CH German (Switzerland)
de-LI de-LI German (Liechtenstein)
de-LU de-LU German (Luxembourg)
dv dv-MV Divehi
dv-MV dv-MV Divehi (Maldives)
el el-GR Greek
el-GR el-GR Greek (Greece)
en en-US English
en-029 en-029 English (Caribbean)
en-AU en-AU English (Australia)
en-BZ en-BZ English (Belize)
en-CA en-CA English (Canada)
en-GB en-GB English (United Kingdom)
en-IE en-IE English (Ireland)
en-JM en-JM English (Jamaica)
en-NZ en-NZ English (New Zealand)
en-PH en-PH English (Republic of the Philippines)
en-TT en-TT English (Trinidad and Tobago)
en-US en-US English (United States)
en-ZA en-ZA English (South Africa)
en-ZW en-ZW English (Zimbabwe)
es es-ES Spanish
es-AR es-AR Spanish (Argentina)
es-BO es-BO Spanish (Bolivia)
es-CL es-CL Spanish (Chile)
es-CO es-CO Spanish (Colombia)
es-CR es-CR Spanish (Costa Rica)
es-DO es-DO Spanish (Dominican Republic)
es-EC es-EC Spanish (Ecuador)
es-ES es-ES Spanish (Spain)
es-GT es-GT Spanish (Guatemala)
es-HN es-HN Spanish (Honduras)
es-MX es-MX Spanish (Mexico)
es-NI es-NI Spanish (Nicaragua)
es-PA es-PA Spanish (Panama)
es-PE es-PE Spanish (Peru)
es-PR es-PR Spanish (Puerto Rico)
es-PY es-PY Spanish (Paraguay)
es-SV es-SV Spanish (El Salvador)
es-UY es-UY Spanish (Uruguay)
es-VE es-VE Spanish (Venezuela)
et et-EE Estonian
et-EE et-EE Estonian (Estonia)
eu eu-ES Basque
eu-ES eu-ES Basque (Basque)
fa fa-IR Persian
fa-IR fa-IR Persian (Iran)
fi fi-FI Finnish
fi-FI fi-FI Finnish (Finland)
fo fo-FO Faroese
fo-FO fo-FO Faroese (Faroe Islands)
fr fr-FR French
fr-BE fr-BE French (Belgium)
fr-CA fr-CA French (Canada)
fr-FR fr-FR French (France)
fr-CH fr-CH French (Switzerland)
fr-LU fr-LU French (Luxembourg)
fr-MC fr-MC French (Principality of Monaco)
gl gl-ES Galician
gl-ES gl-ES Galician (Galician)
gu gu-IN Gujarati
gu-IN gu-IN Gujarati (India)
he he-IL Hebrew
he-IL he-IL Hebrew (Israel)
hi hi-IN Hindi
hi-IN hi-IN Hindi (India)
hr hr-HR Croatian
hr-BA hr-BA Croatian (Bosnia and Herzegovina)
hr-HR hr-HR Croatian (Croatia)
hu hu-HU Hungarian
hu-HU hu-HU Hungarian (Hungary)
hy hy-AM Armenian
hy-AM hy-AM Armenian (Armenia)
id id-ID Indonesian
id-ID id-ID Indonesian (Indonesia)
is is-IS Icelandic
is-IS is-IS Icelandic (Iceland)
it it-IT Italian
it-CH it-CH Italian (Switzerland)
it-IT it-IT Italian (Italy)
ja ja-JP Japanese
ja-JP ja-JP Japanese (Japan)
ka ka-GE Georgian
ka-GE ka-GE Georgian (Georgia)
kk kk-KZ Kazakh
kk-KZ kk-KZ Kazakh (Kazakhstan)
kn kn-IN Kannada
kn-IN kn-IN Kannada (India)
ko ko-KR Korean
kok kok-IN Konkani
kok-IN kok-IN Konkani (India)
ko-KR ko-KR Korean (Korea)
ky ky-KG Kyrgyz
ky-KG ky-KG Kyrgyz (Kyrgyzstan)
lt lt-LT Lithuanian
lt-LT lt-LT Lithuanian (Lithuania)
lv lv-LV Latvian
lv-LV lv-LV Latvian (Latvia)
mi-NZ mi-NZ Maori (New Zealand)
mk mk-MK Macedonian
mk-MK mk-MK Macedonian (Former Yugoslav Republic of Macedonia)
mn mn-MN Mongolian
mn-MN mn-MN Mongolian (Cyrillic, Mongolia)
mr mr-IN Marathi
mr-IN mr-IN Marathi (India)
ms ms-MY Malay
ms-BN ms-BN Malay (Brunei Darussalam)
ms-MY ms-MY Malay (Malaysia)
mt-MT mt-MT Maltese (Malta)
nb-NO nb-NO Norwegian, Bokmal (Norway)
nl nl-NL Dutch
nl-BE nl-BE Dutch (Belgium)
nl-NL nl-NL Dutch (Netherlands)
nn-NO nn-NO Norwegian, Nynorsk (Norway)
no nb-NO Norwegian
ns-ZA ns-ZA Northern Sotho (South Africa)
pa pa-IN Punjabi
pa-IN pa-IN Punjabi (India)
pl pl-PL Polish
pl-PL pl-PL Polish (Poland)
pt pt-BR Portuguese
pt-BR pt-BR Portuguese (Brazil)
pt-PT pt-PT Portuguese (Portugal)
quz-BO quz-BO Quechua (Bolivia)
quz-EC quz-EC Quechua (Ecuador)
quz-PE quz-PE Quechua (Peru)
ro ro-RO Romanian
ro-RO ro-RO Romanian (Romania)
ru ru-RU Russian
ru-RU ru-RU Russian (Russia)
sa sa-IN Sanskrit
sa-IN sa-IN Sanskrit (India)
se-FI se-FI Sami (Northern) (Finland)
se-NO se-NO Sami (Northern) (Norway)
se-SE se-SE Sami (Northern) (Sweden)
sk sk-SK Slovak
sk-SK sk-SK Slovak (Slovakia)
sl sl-SI Slovenian
sl-SI sl-SI Slovenian (Slovenia)
sma-NO sma-NO Sami (Southern) (Norway)
sma-SE sma-SE Sami (Southern) (Sweden)
smj-NO smj-NO Sami (Lule) (Norway)
smj-SE smj-SE Sami (Lule) (Sweden)
smn-FI smn-FI Sami (Inari) (Finland)
sms-FI sms-FI Sami (Skolt) (Finland)
sq sq-AL Albanian
sq-AL sq-AL Albanian (Albania)
sr sr-Latn-CS Serbian
sr-Cyrl-BA sr-Cyrl-BA Serbian (Cyrillic) (Bosnia and Herzegovina)
sr-Cyrl-CS sr-Cyrl-CS Serbian (Cyrillic, Serbia)
sr-Latn-BA sr-Latn-BA Serbian (Latin) (Bosnia and Herzegovina)
sr-Latn-CS sr-Latn-CS Serbian (Latin, Serbia)
sv sv-SE Swedish
sv-FI sv-FI Swedish (Finland)
sv-SE sv-SE Swedish (Sweden)
sw sw-KE Kiswahili
sw-KE sw-KE Kiswahili (Kenya)
syr syr-SY Syriac
syr-SY syr-SY Syriac (Syria)
ta ta-IN Tamil
ta-IN ta-IN Tamil (India)
te te-IN Telugu
te-IN te-IN Telugu (India)
th th-TH Thai
th-TH th-TH Thai (Thailand)
tn-ZA tn-ZA Tswana (South Africa)
tr tr-TR Turkish
tr-TR tr-TR Turkish (Turkey)
tt tt-RU Tatar
tt-RU tt-RU Tatar (Russia)
uk uk-UA Ukrainian
uk-UA uk-UA Ukrainian (Ukraine)
ur ur-PK Urdu
ur-PK ur-PK Urdu (Islamic Republic of Pakistan)
uz uz-Latn-UZ Uzbek
uz-Cyrl-UZ uz-Cyrl-UZ Uzbek (Cyrillic, Uzbekistan)
uz-Latn-UZ uz-Latn-UZ Uzbek (Latin, Uzbekistan)
vi vi-VN Vietnamese
vi-VN vi-VN Vietnamese (Vietnam)
xh-ZA xh-ZA Xhosa (South Africa)
zh-CN zh-CN Chinese (People’s Republic of China)
zh-HK zh-HK Chinese (Hong Kong S. A.R.)
zh-CHS (none) Chinese (Simplified)
zh-CHT (none) Chinese (Traditional)
zh-MO zh-MO Chinese (Macao S.A.R.)
zh-SG zh-SG Chinese (Singapore)
zh-TW zh-TW Chinese (Taiwan)
zu-ZA zu-ZA Zulu (South Africa)
lang | Yocton
Глобальный атрибут lang
(от англ. «language» ‒ «язык») позволяет задать язык элемента и для нередактируемых элементов, и для редактируемых элементов, которые заполняются пользователем. Данный атрибут в элементе <html>
устанавливает язык для всего текста на странице. Авторам рекомендуется указывать атрибут lang
в элементе html, указав приоритетный язык документа, что помогает инструментам синтеза речи и инструментам перевода. В качестве задаваемого значения должно выступать значение допустимое документом BCP 47.
Синтаксис
<element lang="значение">
Например,
<div lang="ru">Этот тект на русском языке</div>
Значения атрибута
Если значением атрибута является пустая строка lang = ""
, то язык устанавливается на неизвестный, а если значение атрибута недопустимо в соответствии с BCP47, он считается недействительным. Полный синтаксис BCP47 достаточно сложен, чтобы указывать специфические языковые диалекты, но в большинстве случаях это не требуется.
Так предусмотрено указание через дефис (-) подверсии языка (версия языка: en-us, zh-gan; набор символов для написания: sr-Latn ‒ сербский-латиница).
Имеется три наиболее распространенных вида субтега:
Языковой субтег Обязательный. Все языковые тэги должны начинаться с субтэга основного языка. 2-или-3-символьный код, который определяет базовый язык, обычно записываемый строчными буквами. Например, код языка для английского — en , а код для Бадеши — bdz .
Субтеги письменности Необязательный. Субтеги письменности должны быть использованы в качестве части языкового тэга только тогда, когда необходимо передать какую-то отличительную информацию через тэг. Обычно это случаи, когда один язык использует различные типы письма или когда контент был записан с помощью нетипичной для данного языка письменности (например, русский текст, написанный латиницей, будет иметь такой тег: ru-Latn). Субтеги письменности всегда состоят из четырёх букв, и должны идти после любых субтегов языка или диалекта и до всех других субтегов. Этот субтег определяет систему записи, используемую для языка, и всегда имеет длину 4 символа, причем первая буква заглавная. Например, французский, написаный шрифтом Брайле — fr-Brail
а ja-Kana
— японский, написанный с алфавитом катаканы. Если язык написан весьма типичным способом, например, английский в латинском алфавите, нет необходимости использовать этот субтег.
Субтеги региона Необязательный. Этот субтег определяет диалект базового языка из определенного места и представляет собой либо 2 прописные буквы , соответствующие коду страны, либо 3 числа, соответствующие области, не относящейся к стране. Субтэги региона связывают выбранный вами субтэг языка с определённым регионом мира. Субтэги региона должны идти после всех субтэгов языка и письменности. Как и субтэги письменности, субтэги региона следует использовать только, если они вносят информацию, необходимую, чобы отличить этот языковой тэг от другого; если нет — отбрасывайте его. Например, en-GB
может быть полезным отличием при проверке правописания, но субтэг региона в ja-JP
вряд ли полезен, если только вы намеренно не подчёркиваете, что это не японский, используемый в других частях мира. Есть 2 типа субтэгов региона: двухбуквенные коды и коды, состоящие из трёх цифр. Последние, как правило, определяют многонациональные регионы, а не конкретные страны. Например es-ES
означает испанский, на котором говорят в Испании, тогда, как es-419
означает испанский, распространённый в Латинской Америке Субтег письменности предшествует региону, если присутствуют оба, например, ru-Cyrl-BY
является русским, написанным на кириллице, как говорят в Беларуси.
Даже если атрибут lang
установлен, он нен учитывется, если установлен атрибут xml:lang
, т.к. он имеет больший приоритет.
Для CSS псевдо-класса :lang
два неправильных значения различаются, если их имена различны. Так, значение :lang(es)
соответствует и lang="es-ES"
, и lang="es-419"
, а вот значение :lang(xyzzy)
не будет соответствовать lang="xyzzy-Zorp!"
.
Коды распространенных языков
Язык | Код |
---|---|
Абхазский | ab |
Азербайджанский | az |
Аймарский | ay |
Албанский | sq |
Английский | en |
Американский английский | en-us |
Арабский | ar |
Армянский | hy |
Ассамский | as |
Африкаанс | af |
Башкирский | ba |
Белорусский | be |
Бенгальский | bn |
Болгарский | bg |
Бретонский | br |
Валлийский | cy |
Венгерский | hu |
Вьетнамский | vi |
Галисийский | gl |
Голландский | nl |
Греческий | el |
Грузинский | ka |
Гуарани | gn |
Датский | da |
Зулу | zu |
Иврит | iw |
Идиш | ji |
Индонезийский | in |
Интерлингва (искусственный язык) | ia |
Ирландский | ga |
Исландский | is |
Испанский | es |
Итальянский | it |
Казахский | kk |
Камбоджийский | km |
Каталанский | ca |
Кашмирский | ks |
Кечуа | qu |
Киргизский | ky |
Китайский | zh |
Корейский | ko |
Корсиканский | co |
Курдский | ku |
Лаосский | lo |
Латвийский, латышский | lv |
Латынь | la |
Литовский | lt |
Малагасийский | mg |
Малайский | ms |
Мальтийский | mt |
Маори | mi |
Македонский | mk |
Молдавский | mo |
Монгольский | mn |
Науру | na |
Немецкий | de |
Непальский | ne |
Норвежский | no |
Пенджаби | pa |
Персидский | fa |
Польский | pl |
Португальский | pt |
Пуштунский | ps |
Ретороманский | rm |
Румынский | ro |
Русский | ru |
Самоанский | sm |
Санскрит | sa |
Сербский | sr |
Словацкий | sk |
Словенский | sl |
Сомали | so |
Суахили | sw |
Суданский | su |
Тагальский | tl |
Таджикский | tg |
Тайский | th |
Тамильский | ta |
Татарский | tt |
Тибетский | bo |
Тонга | to |
Турецкий | tr |
Туркменский | tk |
Узбекский | uz |
Украинский | uk |
Урду | ur |
Фиджи | fj |
Финский | fi |
Французский | fr |
Фризский | fy |
Хауса | ha |
Хинди | hi |
Хорватский | hr |
Чешский | cs |
Шведский | sv |
Эсперанто (искусственный язык) | eo |
Эстонский | et |
Яванский | jw |
Японский | ja |
Пример
<p lang="ru" >Евклид (др. -греч. <span lang="el">Εὐκλείδης </span>) — древнегреческий математик, автор первого из дошедших до нас теоретических трактатов по математике.</p>
Совместимость браузеров
Настольные браузеры
Базовая поддержка | да | да | да | да | да | да |
---|
Мобильные браузеры
Базовая поддержка | да | да | да | да | да | да | да |
---|
См. также:
- WHATWG HTML Living Standard
- HTML5
seodon.ru | Общие атрибуты HTML
- Общие атрибуты
- accesskey
- class
- dir
- id
- lang
- style
- tabindex
- title
Опубликовано: 25.06.2010 Последняя правка: 08. 12.2015
Атрибут lang используется для указания языка, на котором написан текст внутри HTML-элемента. Эта информация может быть полезна различным программам и устройствам для того, чтобы более корректно обрабатывать данный текст. Например, информация атрибута lang может использоваться в следующих программах:
- В поисковых машинах (Yandex, Google и т.д.).
- В речевых синтезаторах.
- В браузерах при выводе документа на печать.
- При определении браузерами внешнего вида кавычек, дефисов, размеров пробелов и т.д., так как в разных языках они могут отличаться.
- В программах-переводчиках и проверки правописания.
На сегодняшний день большинство программ умеет определять язык текста и без атрибута lang, так как они используют определенные таблицы символов в формате Unicode, с которыми сверяют символы текста HTML-страницы. В этих таблицах каждый символ языка имеет определенный код, таким образом, допустим, английская и русская буквы «A» хоть и одинаковы внешне, но имеют разные коды.
Атрибут lang появился в HTML довольно давно, но раньше он поддерживался ограниченным количеством тегов, а теперь он есть у всех. Поэтому, если на страницах описания каких-то тегов вы увидите логотип HTML 5 () напротив атрибута, то знайте, что этот тег начал поддерживать атрибут lang именно с версии HTML 5. C другой стороны, хоть в HTML 5 теперь все теги могут иметь этот атрибут — не совсем понятно, как его можно использовать в некоторых случаях. Более того, в описаниях W3C также нет конкретики по данному вопросу, например о том, чем может быть полезен атрибут lang в теге <BASE>.
Значения
Значением атрибута lang является указание кода языка. Ниже представлена часть из таких кодов.
Код | Язык | Код | Язык |
---|---|---|---|
ab | Абхазский | lt | Литовский |
az | Азербайджанский | mo | Молдавский |
en | Английский | de | Немецкий |
en-us | Американский вариант английского | fa | Персидский (фарси) |
ar | Арабский | pl | Польский |
hy | Армянский | pt | Португальский |
ba | Башкирский | ro | Румынский |
be | Белорусский | ru | Русский |
bg | Болгарский | sa | Санскрит |
hu | Венгерский | sr | Сербский |
vi | Вьетнамский | sk | Словацкий |
nl | Голландский | sl | Словенский |
el | Греческий | tg | Таджикский |
ka | Грузинский | th | Тайский |
iw | Иврит | tr | Турецкий |
ji | Идиш | tk | Туркменский |
ga | Ирландский | uz | Узбекский |
is | Исландский | uk | Украинский |
es | Испанский | fi | Финский |
it | Итальянский | fr | Французский |
kk | Казахский | hi | Хинди |
ky | Киргизский | hr | Хорватский |
zh | Китайский | cs | Чешский |
ko | Корейский | sv | Шведский |
lv | Латышский | eo | Эсперанто |
la | Латынь | et | Эстонский |
Значение по умолчанию: нет.
Синтаксис
<p lang="значение">...</p> <html lang="значение">...</html> <div lang="значение">...</div>
Обязательный атрибут: нет.
Пример HTML: применение атрибута lang
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "https://www.w3.org/TR/html4/strict.dtd"> <html> <head lang="ru"> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> <title>seodon.ru - атрибут lang</title> </head> <body> <p>Добро пожаловать на Сеодон.ру</p> <p lang="en">Welcome to Seodon.ru</p> </body> </html>
Результат примера
Поддержка версиями HTML
Версия: | HTML 4.01 | HTML 5 | XHTML 1.0 | XHTML 1.1 |
Поддержка: | Да | Да | Да | Да |
Поддержка браузерами
Браузер: | Internet Explorer | Google Chrome | Mozilla Firefox | Opera | Safari |
Версия: | 6. 0 и выше | 2.0 и выше | 2.0 и выше | 9.2 и выше | 3.1 и выше |
Поддержка: | Да | Да | Да | Да | Да |
Что такое hreflang и как добавить атрибуты lang в код страницы
23857 1
How-to | – Читать 8 минут |
Прочитать позже
АУДИТ САЙТА — АТРИБУТЫ HREFLANG
Инструкцию одобрил
Руководитель SEO отдела в Mnogoland
Юрий Горбатый
Атрибуты hreflang и lang нужны, чтобы указать ссылки на страницы сайта, созданные на различных языках. Они помогают поисковым системам отображать в выдаче результаты, оптимизированные под определенный регион, язык либо диалект.
Что такое hreflang и lang
Если компания работает в различных странах и ресурс мультиязычный, стоит указывать при помощи специальных атрибутов — для какого региона и языка предназначена та или иная страница. Это позволит поисковым системам идентифицировать различные версии сайта и показывать пользователю подходящий вариант.
Также данные атрибуты позволят избежать проблем, связанных с дублированием контента, которые могут возникнуть при индексации страниц со сходным содержимым, предназначенным для различных регионов.
Например, в международном интернет-магазине могут совпадать описания товаров, однако отличаться валюта для показа в Великобритании и США. Если не прописать различный регион для каждой из версий страниц, поисковики могут посчитать их дублями.
Google рекомендует прописывать языковые и региональные версии для мультиязычных сайтов в следующих случаях:
Переведены только пункты меню и сведения в подвале страницы, а основная информация оставлена на основном языке. Этот вариант чаще всего используется для разделов с пользовательским контентом — на форумах или страницах с отзывами.
На сайте используется один язык с некоторыми региональными различиями. Например, содержимое на английском немного различается для жителей США, Новой Зеландии и Австралии.
Все страницы проекта существуют на различных языках. К примеру, ресурс на итальянском перевели на французский и испанский языки.
Обозначить альтернативные версии страниц на различных языках и для конкретных географических территорий можно такими методами:
- посредством атрибута hreflang HTML-тега <link>:
- добавив версии в заголовках HTTP:
- в карте ресурса sitemap.xml:
- в теге <html>, добавив атрибут <lang>:
Правила указания языков и регионов страниц
<link rel="alternate" href="https://site.com/" hreflang="x-default" />
Данный параметр добавляется в следующих случаях:
- при наличии на проекте IP-зависимых страниц, с которых пользователи перенаправляются на подходящую языковую версию сайта;
- для страниц, на которых реализована возможность динамического выбора контента на каком-либо языке;
- на страницы, где осуществляется выбор региона и языка.
Как использовать hreflang в теге <link>
Атрибут hreflang добавляется в раздел заголовка <head> и имеет такой синтаксис:
<link rel="alternate" hreflang="код языка" href="URL-адрес" >
Например, синтаксис, определяющий три альтернативные версии страницы на английском, украинском и русском языках, будет таким:
<link rel="alternate" hreflang="en" href="https://serpstat.com/" /> <link rel="alternate" hreflang="uk" href="https://serpstat.com/uk/" /> <link rel="alternate" hreflang="ru" href="https://serpstat.com/ru/" />
В заголовок добавляются ссылки на все версии, в том числе — на исходную страницу.
Google не распознает подходящий язык для посетителя исходя из URL-адреса, важно указывать его код явно. В этом случае пользователи из России, Украины и Англии либо посетители, разговаривающие на одном из трех указанных языков, попадут на необходимые целевые страницы с результатов поиска. Информация о регионе и языке пользователя определяется по настройкам браузера.
Данный вариант может быть достаточно громоздким для тех сайтов, которые переведены на множество языков. Добавление длинного кода со всеми ссылками отрицательно влияет на производительность проекта. Поэтому для таких крупных проектов целесообразнее использовать другие методы указания языковых версий.
Использование hreflang в заголовках HTTP
Сообщить поисковым системам о версиях страницы на различных языках и оптимизированных под определенные регионы можно с помощью заголовков HTTP. Это предпочтительный вариант для оптимизации файлов, созданных не в формате HTML, — например, PDF-документов и прочего контента.
Информация в заголовках прописывается так:
Link: <полный URL-адрес файла на первом языке>; rel="alternate"; hreflang="двухбуквенный код первого языка", <полный URL-адрес файла на втором языке>; rel="alternate"; hreflang="двухбуквенный код второго языка"
Добавление hreflang в Sitemap
Можно также использовать для указания языковых и региональных версий страниц Sitemap. В данный файл добавляется список необходимых ссылок таким образом:
Сначала корректно прописывается пространство имен.
Затем добавляется тег <URL>.
После него следует тег <loc>, в котором указан URL-адрес страницы.
Затем прописываются все версии вместе с исходной страницей в теге <xhtml:link>, где указываются коды языков и регионов.
Размещается закрывающий тег </URL>.
После этого повторяются пункты 2-5 для всех URL-адресов с существующими языковыми версиями.
Использование атрибута lang в теге <html>
Альтернативный способ указать поисковым системам язык страницы — добавление lang в тег <html>. Этот атрибут указывает язык для всей страницы, в том числе ее заголовка. Если на странице размещены отдельные фрагменты текста на других языках, то для них можно прописать необходимое значение, отличное от заданного в теге <html>.
Пример синтаксиса для установки английского языка:
<html lang="en">
Для установки определенных диалектов языка предназначены коды спецификации BCP 47. Например, код es-419 обозначает испанский язык, используемый в Латинской Америке и Карибском регионе. Для подбора необходимых кодов можно воспользоваться утилитой Language Subtag Lookup, в которой доступен список всех кодов языков, отфильтрованных по определенным параметрам:
Валидация мультиязычных версий проекта
Проверить корректность введенных языковых и региональных данных на сайте можно с помощью валидатора Flang, указав URL проекта и нажав «Validate now!»:
Также есть другой валидатор — hreflang.ninja, работающий аналогичным образом:
Заключение
Установка языка и региона на страницах мультиязычных сайтов и проектов, работающих в различных странах, поможет посетителям получать в поисковой выдаче подходящие страницы.
Благодаря использованию атрибутов lang и hreflang не только улучшается пользовательский опыт, но и исключается проблема дублирования контента, что важно для SEO. Поисковые системы распознают даже сходные по содержимому страницы как адаптированные для различных регионов.
Использование x-default позволяет предусмотреть универсальную версию страницы. На нее будут перенаправляться пользователи, проживающие в тех странах и разговаривающие на тех языках, которые не определены на сайте с помощью hreflang.
При указании языковых, региональных и диалектных кодов важно проверять их соответствие спецификациям. Проверить это можно с помощью валидаторов.
Аудит всего сайта или отдельной страницы в один клик. Полный список ошибок, отсортированный по критичности, пути их устранения и рекомендации. Любая периодичность проверки и автоматическая рассылка отчетов на почту.
Запустить аудит сайта
Сэкономьте время на изучении Serpstat
Хотите получить персональную демонстрацию сервиса, тестовый период или эффективные кейсы использования Serpstat?
Оставьте заявку и мы свяжемся с вами 😉
Оцените статью по 5-бальной шкале
4 из 5 на основе 15 оценок
Нашли ошибку? Выделите её и нажмите Ctrl + Enter, чтобы сообщить нам.
Рекомендуемые статьи
How-to
Denys Kondak
Как настроить 301 редирект с http на https-версию сайта
How-to
Denys Kondak
Что должно присутствовать в теге Body
How-to
Denys Kondak
Как модерировать комментарии на сайте, чтобы избежать фильтров поисковиков
Кейсы, лайфхаки, исследования и полезные статьи
Не успеваешь следить за новостями? Не беда! Наш любимый редактор подберет материалы, которые точно помогут в работе. Только полезные статьи, реальные кейсы и новости Serpstat раз в неделю. Присоединяйся к уютному комьюнити 🙂
Нажимая кнопку, ты соглашаешься с нашей политикой конфиденциальности.
Поделитесь статьей с вашими друзьями
Вы уверены?
Спасибо, мы сохранили ваши новые настройки рассылок.
Сообщить об ошибке
Отменить
PS Remote Play
Для использования функции «Дистанционная игра» требуется консоль PS5 или PS4.
Благодаря функции «Дистанционная игра» вы можете удаленно управлять своей консолью PlayStation® в любом месте, где есть высокоскоростное соединение с Интернетом.
С помощью приложения [PS Remote Play] вы можете управлять своей консолью PlayStation®5 или PlayStation®4, находясь вдали от нее.
Например, вы можете играть в игры для PS5™ и PS4™ на компьютере в другой комнате или на смартфоне.
Ниже приведен перечень различных сочетаний совместимых устройств и консолей PlayStation, позволяющих использовать функцию «Дистанционная игра». Инструкции по загрузке приложения и началу использования функции «Дистанционная игра» можно получить по одной из указанных ниже ссылок.
- Управление консолью PS5 с ПК Windows
- Управление консолью PS5 с компьютера Mac
- Управление консолью PS5 с мобильного устройства
- Управление консолью PS5 с другой консоли PS5
- Управление консолью PS5 с консоли PS4
- Управление консолью PS4 с ПК Windows
- Управление консолью PS4 с компьютера Mac
- Управление консолью PS4 с мобильного устройства
- Управление консолью PS4 с консоли PS5
- Управление консолью PS4 из системы PS Vita*
- Управление консолью PS4 из системы PS TV*
- *
- Используя приложение [Соединение PS4], вы можете управлять своей консолью PS4 с помощью системы PlayStation®Vita или системы PlayStation®TV.
Подробнее о том, как настроить и использовать функцию «Дистанционная игра» на ваших системах, см. в Руководстве пользователя PS Vita или в Руководстве пользователя PS TV.
В зависимости от конкретных данных или способа их использования функция «Дистанционная игра» может быть недоступна. Подробности см. в разделе Ограничения.
Если не удается установить соединение или оно нестабильно, см. раздел Если функция «Дистанционная игра» недоступна.
Информация об изменениях [PS Remote Play]
Версия 5.5.0 для компьютера с Windows
- Упрощена работа с клавиатурой при использовании функции «Дистанционная игра» на компьютере с Windows.
- Поле ввода удалено, поэтому можно вводить текст прямо на компьютере с Windows при помощи клавиатуры.
- Теперь вы можете использовать клавиатуру для игр, которые ее поддерживают.
- В зависимости от настроек компьютера с Windows теперь поддерживаются такие функции:
- переключение на темный режим;
- отображение текста большего размера.
- Повышена стабильность работы приложения при использовании некоторых функций.
Версия 5.5.0 для компьютера Mac
- Упрощена работа с клавиатурой при использовании функции «Дистанционная игра» на компьютере Mac.
- Поле ввода удалено, поэтому можно вводить текст прямо на компьютере Mac при помощи клавиатуры.
- Теперь вы можете использовать клавиатуру для игр, которые ее поддерживают.
- Теперь можно увеличить или уменьшить размер текста, выбрав пункт [Отображение] в строке меню Mac.
- В зависимости от настроек Mac теперь можно переключаться на темный режим.
- Повышена стабильность работы приложения при использовании некоторых функций.
Версия для мобильных устройств
Информацию об обновлениях см. в Google Play™ или App Store.
Ограничения
- В некоторых играх функция «Дистанционная игра» не поддерживается.
Игры, для которых требуются некоторые периферийные устройства, например PlayStation®VR или PlayStation®Camera, несовместимы с функцией «Дистанционная игра». Вам не удастся использовать функцию «Дистанционная игра» на консоли PS5 или PS4 в указанных ниже случаях.
- Когда у вас включена функция «Общий доступ к экрану» или Share Play либо когда вы транслируете ход игры.
- Когда у пользователей включена функция «Дистанционная игра», Share Play или «Общий доступ к экрану» либо когда они транслируют ход игры.
- Когда вы воспроизводите диск Blu-ray Disc™ или DVD.
- Когда вы используете PS VR в режиме VR.
При использовании функции «Дистанционная игра» действуют указанные ниже ограничения.
- Вам не удастся использовать функцию «Общий доступ к экрану» или Share Play либо транслировать ход игры.
- Вам не удастся воспроизвести диск Blu-ray Disc™ или DVD.
- Вам не удастся воспроизводить музыку с использованием службы Spotify®.
- В зависимости от конкретной игры или видеослужбы на вашем устройстве, возможно, не будут отображаться некоторые или все данные видео.
- Подробности о приеме и выводе звука во время выполнения функции «Дистанционная игра» см. на нашем веб-сайте поддержки.
- Содержимое этого сайта может быть изменено без предварительного уведомления.
- В данном документе используются комбинированные изображения. Иллюстрации и изображения экрана могут отличаться от внешнего вида и изображений на экране реального продукта.
- Сведения о функциях системы и названия пунктов меню, опубликованные на этом сайте, могут отличаться в зависимости от версии системного программного обеспечения консоли PS5 или PS4, версии операционной системы вашего компьютера или мобильного устройства либо версии приложения, установленного на вашем компьютере или мобильном устройстве.
- , PlayStation, PS5, PS4, DualSense и DUALSHOCK — товарные знаки или зарегистрированные товарные знаки Sony Interactive Entertainment Inc.
- SONY является зарегистрированным товарным знаком или товарным знаком Sony Group Corporation.
- App Store, iPad, iPhone, Mac and macOS are trademarks of Apple Inc. registered in the U.S. and other countries.
- The Bluetooth® word mark and logos are registered trademarks owned by Bluetooth SIG, Inc. and any use of such marks by Sony Interactive Entertainment Inc. is under license. Other trademarks and trade names are those of their respective owners.
- “Blu-ray Disc™” and “Blu-ray™” are trademarks of the Blu-ray Disc Association.
- Google Play and Android are trademarks of Google LLC.
- Intel and Intel Core are trademarks of Intel Corporation or its subsidiaries in the U.S. and/or other countries.
- Spotify is a registered trademark of Spotify Ltd.
- Wi-Fi® is a registered trademark of Wi-Fi Alliance®.
- Все другие товарные знаки являются собственностью соответствующих владельцев.
ASTRO’s PLAYROOM: ©2020 Sony Interactive Entertainment Inc.
Horizon Zero Dawn: ©2017 Sony Interactive Entertainment Europe. Разработчик: Guerrilla.
В чем разница между ?
Посмотреть обсуждение
Улучшить статью
Сохранить статью
- Уровень сложности: Базовый
- Последнее обновление: 08 мая, 2020
Посмотреть обсуждение
Улучшить статью
Сохранить статью
Атрибут lang указывает, какой язык используется для написания содержимого веб-страницы. Он используется для установки языка для всего текста веб-страницы.
Разница между описана ниже:
Пример:
050 = "en" > h2{ |
Вывод:
указывает код языка страницы, за которым следует код страны. это значит Американский стиль английского языка используется для всего текста на странице.
означает индийский стиль английского языка
Пример:
|
Output :
Рекомендуемые статьи
Страница :
В чем разница между и ?
Спросил
Модифицированный 3 года, 10 месяцев назад
Просмотрено 168k раз
В чем разница между
и
? Какие еще значения могут следовать за тире?
Согласно w3. org «Любой двухбуквенный субкод считается кодом страны [ISO3166]». значит ли это, что любое значение, указанное под кодом alpha-2, является допустимым значением?
- HTML
- язык
3
Первый тег lang
указывает только код языка. Второй указывает код языка, за которым следует код страны.
Какие еще значения могут следовать за тире? Согласно w3.org «Любой двухбуквенный субкод понимается как код страны [ISO3166]. означает ли это, что любое значение, указанное под кодом альфа-2, является допустимым? ценность?
Да, однако значение может иметь или не иметь реального значения.
по существу означает "эта страница написана на американском английском языке". Аналогичным образом,
будет означать "эта страница написана на английском языке в Соединенном Королевстве".
Если вы действительно хотите указать недопустимую комбинацию, вы можете это сделать. Это бы ничего не значило, но
соответствует спецификации, насколько я понимаю. Тем не менее, эта комбинация языка и страны мало что даст, поскольку в Испании обычно не говорят по-английски.
Я имею в виду, помогает ли это как-то еще браузеру отображать страницу?
Это не помогает браузеру отображать страницу, но полезно для поисковых систем, программ чтения с экрана и других вещей, которые помимо людей могут читать и пытаться интерпретировать страницу.
5
Да, вы можете использовать любой код страны, но это не означает, что браузер или другое программное обеспечение распознает его или сделает что-то по-другому из-за него. Например, программа чтения с экрана может одинаково работать с «en-US» и «en-GB», если они поддерживают только американский акцент в английском языке. Однако другая часть программного обеспечения, имеющая два разных голоса, может настраиваться в соответствии с кодом страны.
1
Это должно помочь: http://www.w3.org/International/articles/language-tags/
Золотое правило при создании языковых тегов — делать тег как можно короче. Избегайте региона, скрипта или других вложенных тегов, за исключением тех случаев, когда они добавляют полезную отличительную информацию. Например, используйте ja для обозначения японского языка, а не ja-JP, если нет особой причины, по которой вам нужно сказать, что это японский язык, на котором говорят в Японии, а не где-либо еще.
В приведенном ниже списке показаны различные типы доступных вложенных тегов. Мы рассмотрим их и то, как они используются, в следующих разделах.
язык-extlang-script-регион-вариант-расширение-частное использование
1
RFC 3066 содержит подробную информацию о допустимых значениях (выделение и ссылки добавлены):
Все двухбуквенные вложенные теги интерпретируются как коды стран ISO 3166 alpha-2. из [ИСО 3166] , или впоследствии назначенный технической поддержкой ISO 3166 агентство или руководящие органы по стандартизации, обозначающие область, к которой этот языковой вариант относится.
Я интерпретирую это как означающее, что любой действительный (в соответствии с ISO 3166) двухбуквенный код действителен в качестве вложенного тега. Далее в RFC говорится:
.Теги со вторыми вложенными тегами от 3 до 8 букв могут быть зарегистрированы с IANA, в соответствии с правилами, изложенными в главе 5 этого документа.
Кстати, это похоже на опечатку, так как кажется, что к процессу регистрации относится глава 3, а не глава 5.
Быстрый поиск в реестре IANA показывает очень длинный список всех доступных языковых вложенных тегов. Вот один пример из списка (который будет использоваться как en-scouse
):
Тип: вариант
Подтег: scous
Описание: Scouse
Добавлено: 18. 09.2006
Префикс: en
Комментарии: Английский ливерпульский диалект, известный как Scouse
Доступно всевозможных подтегов; быстрая прокрутка уже показала fr-1694acad
(французский язык 17 века).
Полезность некоторых из этих (я бы сказал, подавляющего большинства) тегов, когда речь идет о документах, предназначенных для отображения в браузере, ограничена. Спецификация интернационализации W3C просто гласит:
.Браузеры и другие приложения могут использовать информацию о языке контента, чтобы предоставить пользователям наиболее подходящую информацию или представлять информацию пользователям наиболее подходящим образом. Чем больше контент помечен и помечен правильно, тем более полезным и распространенным такие приложения станут.
Я изо всех сил пытаюсь найти подробную информацию о том, как браузеры ведут себя при встрече с различными языковыми тегами, но они, скорее всего, принесут пользу тем пользователям, которые используют программу чтения с экрана, которая может использовать тег для определения языка/диалекта. /accent для представления содержимого.
Схема XML требует, чтобы пространство имен xml было объявлено и импортировано перед использованием xml:lang (и других значений пространства имен xml) RELAX NG предварительно объявляет пространство имен xml, как и в XML, поэтому дополнительное объявление не требуется.
Первый вопрос прост. Есть много en
s (английских), но (в основном) только один американский английский. Можно предположить, что есть en-CN
, en-GB
, en-AU
. Думаю, может быть даже австрийский английский, но это скорее да, вы можете, чем да.
2
Твой ответ
Зарегистрируйтесь или войдите в систему
Зарегистрируйтесь с помощью Google
Зарегистрироваться через Facebook
Зарегистрируйтесь, используя адрес электронной почты и пароль
Опубликовать как гость
Электронная почта
Обязательно, но не отображается
Опубликовать как гость
Электронная почта
Требуется, но не отображается
Информация о языке и направление текста
Информация о языке и направление текстапредыдущий следующий содержимое элементы атрибуты индекс
Содержание
- Указание языка содержимого: атрибут языка
- Коды языков
- Наследование языковых кодов
- Интерпретация языка коды
- Указание направления текста и
столы: дир атрибут
- Введение в двунаправленный алгоритм
- Наследование направления текста информация
- Установка направления встроенного текст
- Переопределение двунаправленного алгоритма: БДО элемент
- Ссылки на символы для направленности и входной контроль
- Влияние таблиц стилей на двунаправленность
В этом разделе документа обсуждаются два важных вопроса, влияющих на интернационализация HTML: указание языка ( язык атрибут) и направление (т. dir атрибут) текста в документе.
Определения атрибутов
- язык = код языка [CI]
- Этот атрибут указывает базовый язык значений атрибута элемента и текстовое содержание. Значение по умолчанию этого атрибута неизвестно.
Информация о языке указана через lang Атрибут может использоваться пользовательским агентом для управления рендерингом в различных способы. Некоторые ситуации, когда информация о языке, предоставленная автором, может быть полезна включают:
- Помощь поисковым системам
- Вспомогательные синтезаторы речи
- Помощь пользовательскому агенту в выборе вариантов глифов для высококачественной типографики
- Помощь пользовательскому агенту в выборе набора кавычек
- Помощь пользовательскому агенту в принятии решений о переносах, лигатурах и интервалах
- Помощь программам проверки орфографии и грамматики
Атрибут lang указывает язык содержимого элемента и значения атрибутов; актуально ли это для данного атрибута зависит от синтаксиса и семантики атрибута и задействована операция.
Целью атрибута lang является предоставление агентам пользователя возможности отображать содержание более осмысленно, основанное на принятой культурной практике для данного язык. Это не означает, что пользовательские агенты должны отображать символы, которые нетипичны для конкретного языка менее значимыми способами; пользовательские агенты должен сделать все возможное, чтобы отобразить все символы, независимо от значения, указанного lang .
Например, если символы греческого алфавита появляются посреди Английский текст:
Ее сверхспособности были результатом γ-излучение,объяснил он.
пользовательский агент (1) должен попытаться отобразить содержимое на английском языке в соответствующем способом (например, при обращении с кавычками) и (2) должен максимально попытаться отобразить γ, даже если это не английский символ.
См. раздел неотображаемые символы для связанной информации.
8.
1.1 Коды языковЗначение атрибута lang — это код языка, который идентифицирует естественный язык, на котором говорят, пишут или иным образом используют для общения информации среди людей. Компьютерные языки явно исключены из языковые коды.
[RFC1766] определяет и объясняет коды языков, которые должны использоваться в HTML. документы.
Вкратце, языковые коды состоят из основного кода и, возможно, пустого серия субкодов:
код языка = первичный код ("-" субкод)*
Вот несколько примеров языковых кодов:
- "en": английский
- "en-US": версия английского языка для США.
- "en-cockney": английская версия кокни.
- «и-навахо»: язык навахо, на котором говорят некоторые коренные американцы.
- «x-klingon»: первичный тег «x» указывает на экспериментальный язык. тег
Двухбуквенные первичные коды зарезервированы для языка [ISO639]. сокращения. Двухбуквенные коды включают fr (французский), de (немецкий), it (итальянский), nl (голландский), el (греческий), es (испанский), pt (португальский), ar (арабский), he (иврит), ru (русский), zh (китайский), ja (японский), hi (хинди), ur (урду) и са (санскрит).
Любой двухбуквенный субкод считается страной [ISO3166]. код.
8.1.2 Наследование языковых кодов
Элемент наследует информацию о коде языка в соответствии со следующим порядок старшинства (от высшего к низшему):
В этом примере основным языком документа является французский ("fr"). Один абзац объявляется на испанском ("es"), после чего основной язык возвращается на французский язык. В следующем абзаце есть встроенный японский язык ("ja"). фраза, после которой основной язык возвращается к французскому.
<ГОЛОВА> Создать многоязычный документ ГОЛОВА> <ТЕЛО> ...Интерпретируется как французский......Интерпретируется как испанский...
...Снова интерпретируется как французский...
...Французский текст прерывается some Японский Здесь снова начинается французский. .. ТЕЛО>
Примечание. Ячейки таблицы могут наследовать язык значения не из его родителя, а из первой ячейки в диапазоне. Пожалуйста, проконсультируйтесь раздел о выравнивании наследство для деталей.
8.1.3 Интерпретация языковых кодов
В контексте HTML код языка должен интерпретироваться пользовательскими агентами. как иерархия токенов, а не одиночный токен. Когда пользовательский агент настраивает рендеринг в соответствии с информацией о языке (скажем, путем сравнения таблицы стилей языковые коды и lang ), он всегда должен отдавать предпочтение точному совпадению, но также следует считать достаточным совпадение первичных кодов. Таким образом, если Значение атрибута lang "en-US" установлено для HTML элемент, пользовательский агент должен предпочесть информацию о стиле, которая соответствует "en-US" сначала, затем более общее значение "en".
Примечание. Иерархия языковых кодов не гарантирует, что все языки с общим префиксом будут понятны тем, кто свободно владеет одним или больше этих языков. Они позволяют пользователю запрашивать эту общность, когда это правда для этого пользователя.
Определения атрибутов
- dir = LTR | РТЛ [КИ]
- Этот атрибут указывает базовое направление направленно-нейтрального текста
(т. е. текст, который не имеет внутренней направленности, как определено в
[UNICODE]) в содержимом элемента и значениях атрибутов. Он также указывает
направленность таблиц.
Возможные значения:
- LTR : Текст или таблица слева направо.
- РТЛ : Текст или таблица с написанием справа налево.
В дополнение к указанию языка документа с помощью lang атрибут, авторам может потребоваться указать базу направленность (слева направо или справа налево) частей текст документа, структура таблицы и т. д. Это делается с помощью dir атрибут.
Спецификация [UNICODE] назначает направленность символам и определяет (сложный) алгоритм для определения правильной направленности текст. Если документ не содержит отображаемого символа с направлением справа налево, соответствующий пользовательский агент не требуется для применения двунаправленного [UNICODE] алгоритм. Если документ содержит символы, написанные справа налево, и если пользователь агент отображает эти символы, пользовательский агент должен использовать двунаправленный алгоритм.
Хотя в Юникоде указаны специальные символы, определяющие направление текста, HTML предлагает конструкции разметки более высокого уровня, которые делают то же самое: dir атрибут (не путать с элементом DIR ) и BDO элемент. Таким образом, чтобы выразить цитату на иврите, более интуитивно писать
....цитата на иврите...
, чем эквивалент со ссылками Unicode:
״ . ..цитата на иврите... ״
Пользовательские агенты должны , а не использовать язык атрибут для определения направления текста.
Атрибут dir наследуется и может быть переопределен. Пожалуйста, проконсультируйтесь с раздел о наследовании направления текста информация для деталей.
8.2.1 Введение в двунаправленный алгоритм
Следующий пример иллюстрирует ожидаемое поведение двунаправленного алгоритм. Он включает в себя английский язык, шрифт слева направо и иврит, сценарий справа налево.
Рассмотрим следующий пример текста:
английский2 ЕВРЕЙ2 английский4 ЕВРЕЙ4 английский5 ЕВРЕЙСКИЙ6
Символы в этом примере (и во всех связанных примерах) хранятся в компьютер так, как они отображаются здесь: первый символ в файле это «e», второй — «n», а последний — «6».
Предположим, преобладающий язык документа, содержащего этот абзац английский. Это означает, что основное направление — слева направо. Правильный представление этой строки будет:
английский2 2WERBEH английский4 4WERBEH английский5 6WERBEH <------ <------ <------ Ч Ч Ч --------------------------------------------------> Е
Пунктирные линии обозначают структуру предложения: английский язык преобладает, и некоторые тексты на иврите встроены. Достижение правильного презентации не требует дополнительной разметки, так как фрагменты на иврите корректно реверсируются пользовательскими агентами, применяющими двунаправленный алгоритм.
Если, с другой стороны, преобладающим языком документа является иврит, основное направление справа налево. Следовательно, правильное представление:
. 6WERBEH английский5 4WERBEH английский4 2WERBEH английский2 -------> -------> -------> Е Е Е <------------------------------------------------- ЧАС
В этом случае все предложение было написано справа налево, а встроенные английские последовательности были должным образом перевернуты двунаправленным алгоритм.
8.2.2 Наследование направления текста информация
Двунаправленный алгоритм Unicode требует основного направления текста для текста блоки. Чтобы указать базовое направление блочного элемента, установите элемент атрибут dir . Значение по умолчанию для dir атрибут "ltr" (текст слева направо).
Когда атрибут dir установлен для блочного элемента, он остается в силе на время существования элемента и любых вложенных элементов блочного уровня. Параметр Атрибут dir во вложенном элементе переопределяет унаследованное значение.
Чтобы установить основное направление текста для всего документа, установите dir атрибут элемента HTML .
Например:
С другой стороны, встроенные элементы<ГОЛОВА> ...заголовок справа налево... ГОЛОВА> ...текст справа налево. .....текст слева направо...
...снова текст справа налево...
не наследуют каталог . атрибут. Это означает, что встроенный элемент без dir атрибут , а не открывает дополнительный уровень встраивания с относительно двунаправленного алгоритма. (здесь элемент считается блочный или встроенный в зависимости от представления по умолчанию. Обратите внимание, что INS и DEL элементы могут быть блочными или встроенными в зависимости от их контекста.)
8.2.3 Установка направления встроенного текста
Двунаправленный алгоритм [UNICODE] автоматически обращает встроенные последовательности символов в соответствии с их внутренней направленностью (как показано по предыдущим примерам). Однако, как правило, возможен только один уровень встраивания. быть учтены. Для достижения дополнительных уровней встроенных изменений направления, вы должны использовать атрибут dir встроенного элемента.
Рассмотрим тот же пример текста, что и раньше:
английский2 ЕВРЕЙ2 английский4 ЕВРЕЙ4 английский5 ЕВРЕЙСКИЙ6
Предположим, преобладающий язык документа, содержащего этот абзац английский. Кроме того, приведенное выше английское предложение содержит раздел на иврите. простирается от HEBREW2 до HEBREW4, а раздел на иврите содержит Английская цитата (english4). Таким образом, желаемое представление текста:
английский2 4WERBEH английский4 2WERBEH английский5 6WERBEH -------> Е <----------------------- ЧАС --------------------------------------------------> Е
Чтобы добиться двух встроенных изменений направления, мы должны поставить дополнительные информации, что мы и делаем, явно ограничивая второе вложение. В этом например, мы используем элемент SPAN и атрибут dir для разметки текста:
английский2 ЕВРЕЙСКИЙ2 английский4 ЕВРЕЙСКИЙ4 английский5 ЕВРЕЙСКИЙ6
Авторы также могут использовать специальные символы Unicode для достижения нескольких встроенных меняется направление. Чтобы добиться встраивания слева направо, окружите встроенный текст с символами СЛЕВА НАПРАВО EMBEDDING ("LRE", шестнадцатеричный 202A) и POP НАПРАВЛЕННОЕ ФОРМАТИРОВАНИЕ ("PDF", шестнадцатеричный 202C). Чтобы добиться справа налево встраивание, объемный встроенный текст с символами ВНЕДРЕНИЕ СПРАВА-НА-ЛЕВО («RTE», шестнадцатеричное 202B) и PDF.
Использование разметки направленности HTML с Unicode персонажи. Авторы и разработчики авторского программного обеспечения должны быть известно, что могут возникнуть конфликты, если атрибут dir используется во встроенных элементы (в т.ч. БДО ) одновременно с соответствующими [UNICODE] символы форматирования. Желательно использовать тот или иной исключительно. Метод разметки обеспечивает лучшую гарантию структурности документа. целостности и устраняет некоторые проблемы при редактировании двунаправленного текста HTML с помощью простого текстового редактора, но некоторые программы могут лучше использовать [UNICODE] символы. Если используются оба метода, следует проявлять большую осторожность. осуществляется для обеспечения надлежащего вложения разметки и направленного встраивания или переопределить, в противном случае результаты рендеринга не определены.
8.2.4 Переопределение двунаправленного алгоритма: элемент
BDOBDO - - (%inline;)* -- I18N BiDi over-ride --> язык %LanguageCode; #ПРЕДПОЛАГАЕТСЯ -- код языка -- dir (ltr|rtl) #ТРЕБУЕТСЯ -- направленность -- >
Начальный тег: требуется , Конечный тег: требуется
Определения атрибутов
- dir = LTR | РТЛ [КИ]
- Этот обязательный атрибут указывает базовое направление текста элемента
содержание. Это направление переопределяет присущую символам направленность, поскольку
определено в [UNICODE]. Возможные значения:
- LTR : Текст слева направо.
- RTL : Текст справа налево.
Атрибуты, определенные в другом месте
- lang (информация о языке)
Двунаправленный алгоритм и атрибут dir обычно достаточны для управлять встроенными изменениями направления. Однако могут возникнуть ситуации, когда двунаправленный алгоритм приводит к неправильному представлению. БДО элемент позволяет авторам отключить двунаправленный алгоритм для выделенных фрагментов текста.
Рассмотрим документ, содержащий тот же текст, что и раньше:
английский2 ЕВРЕЙ2 английский4 ЕВРЕЙ4 английский5 ЕВРЕЙСКИЙ6
, но предположим, что этот текст уже приведен в порядок. Одна причина возможно, стандарт MIME ([RFC2045], [RFC1556]) отдает предпочтение визуальному порядку, т. е. такому расположению символов справа налево. последовательности вставляются в поток байтов справа налево. В электронном письме выше может быть отформатирован, включая разрывы строк, как:
английский2 4WERBEH английский5 6WERBEH
Это противоречит двунаправленному коду [UNICODE]. алгоритм, потому что этот алгоритм инвертировал бы 2WERBEH, 4WERBEH и 6WERBEH во второй раз, показывая еврейские слова слева направо, а не справа налево.
В этом случае решение состоит в том, чтобы переопределить двунаправленный алгоритм с помощью поместить выдержку из электронной почты в элемент PRE (для сохранения разрывов строк) и каждый строка в Элемент BDO , чей атрибут dir имеет значение . LTR :
<ПРЕД> английский2 2ВЕРБЕХ английский4 4WERBEH английский5 6WERBEH ПРЕД>
Это сообщает двунаправленному алгоритму "Оставьте меня слева направо!" и будет произвести желаемую презентацию:
английский2 4WERBEH английский5 6WERBEH
Элемент BDO следует использовать в сценариях, где абсолютный контроль над требуется порядок следования (например, многоязычные номера деталей). Атрибут dir является обязательным для этого элемента.
Авторы также могут использовать специальные символы Unicode для переопределения двунаправленный алгоритм -- ОТМЕНА СЛЕВА НАПРАВО (202D) или СПРАВА НАЛЕВО ЗАМЕНА (шестнадцатеричный 202E). НАПРАВЛЕННОЕ ФОРМАТИРОВАНИЕ POP (шестнадцатеричное 202C) символ завершает двунаправленное переопределение.
Примечание. Напомним, что конфликты могут возникнуть, если каталог атрибут используется во встроенных элементах (включая BDO ) одновременно с атрибутом соответствующие символы форматирования [UNICODE].
Двунаправленность и кодировка символов Согласно [RFC1555] и [RFC1556], существуют специальные соглашения по использованию значения параметра "charset" для указания двунаправленной обработки в почте MIME, в в частности, чтобы различать визуальные, неявные и явные направленность. Значение параметра "ISO-8859-8" (для иврита) обозначает визуальное кодирование, «ISO-8859-8-i» обозначает неявную двунаправленность, а «ISO-8859-8-e» обозначает явную направленность.
Поскольку HTML использует алгоритм двунаправленности Unicode, соответствующий документы, закодированные с использованием ISO 8859-8, должны быть помечены как «ISO-8859-8-i». Явный управление направлением также возможно с помощью HTML, но не может быть выражено с помощью ISO 8859-8, поэтому «ISO-8859-8-e» не следует использовать.
Значение "ISO-8859-8" подразумевает, что документ отформатирован визуально, неправильное использование некоторой разметки (например, ТАБЛИЦА с выравниванием по правому краю и без переноса строк) чтобы обеспечить разумное отображение в старых пользовательских агентах, которые не обрабатывают двунаправленность. Такие документы не соответствуют настоящей спецификации. При необходимости их можно привести в соответствие с текущей спецификацией (а при то же самое время будет правильно отображаться в старых пользовательских агентах), добавив BDO разметка там, где это необходимо. Вопреки тому, что сказано в [RFC1555] и [RFC1556], ISO-8859-6 (арабский) — , а не визуальное упорядочивание.
8.2.5 Символ ссылки на направленность и управление соединением
Поскольку иногда возникают неясности относительно направленности некоторых символы (например, знаки препинания), спецификация [UNICODE] включает символы, чтобы обеспечить их правильное разрешение. Кроме того, Юникод включает некоторые символы для управления поведением присоединения, где это необходимо (например, некоторые ситуации с арабскими буквами). HTML 4 включает ссылки на эти символы.
В следующем фрагменте DTD представлены некоторые направленные сущности:
Объект zwnj используется для блокировки поведения присоединения в контекстах где присоединение произойдет, но не должно. zwj сущность делает противоположный; это заставляет присоединиться, когда этого не произошло бы, но должно. Например, Арабская буква «HEH» используется для сокращения «хиджры», названия исламского календарная система. Так как изолированная форма «HEH» выглядит как цифра пять как используется арабским шрифтом (на основе индийских цифр), чтобы предотвратить путая «HEH» как последнюю цифру пять в году, начальная форма «HEH» использовал. Однако нет следующего контекста (т. е. присоединительного письма), к которому "HEH" может присоединиться. 9Этот контекст обеспечивает символ 0751 zwj .
Точно так же в персидских текстах бывают случаи, когда буква, которая обычно присоединять последующую букву в курсивной связи не следует. символ zwnj используется для блокировки присоединения в таких случаях.
Другие символы, lrm и rlm , используются для сила направленности направленно-нейтральных персонажей. Например, если двойная кавычка ставится между арабским (справа налево) и латинским (слева направо) буква, направление кавычек непонятно (это цитируя арабский текст или латинский текст?). lrm и Символы rlm имеют свойство направления, но не имеют ширины и слова/строки. ломать имущество. Пожалуйста, обратитесь к [UNICODE] для получения дополнительной информации. Детали.
Зеркальные глифы персонажей. В целом, двунаправленный алгоритм не отражает глифы символов, а оставляет их незатронутый. Исключение составляют такие символы, как круглые скобки (см. [UNICODE], таблица 4-7). В тех случаях, когда требуется зеркальное отображение, например, для Египетские иероглифы, греческий бустрофедон или специальные дизайнерские эффекты. должны управляться стилями.
8.2.6 влияние таблиц стилей на двунаправленность
Как правило, использование таблиц стилей для изменения визуального отображения элемента с блочный уровень для встроенного или наоборот является простым. Однако, поскольку двунаправленный алгоритм опирается на встроенный/блочный уровень, необходимо соблюдать особую осторожность во время трансформация.
Когда встроенный элемент, не имеющий атрибута dir , преобразуется в стиль блочного элемента с помощью таблицы стилей, он наследует дир атрибут из ближайшего элемента родительского блока, чтобы определить базовое направление блок.
Когда элемент блока, не имеющий атрибута dir , преобразуется в стиль встроенного элемента таблицей стилей, результирующее представление должен быть эквивалентен, с точки зрения двунаправленного форматирования, форматированию получается явным добавлением атрибут dir (присвоено унаследованное значение) для трансформируемый элемент.
предыдущая следующая содержимое элементы атрибуты индекс
Атрибут lang: браузеры лгут, рассказывают сладкую ложь
опубликовано
Атрибут lang
является важным компонентом базовой структуры HTML-документа. Важно правильно определить его, потому что он влияет на многие аспекты взаимодействия с пользователем. К сожалению, негативные последствия отсутствия или неправильного атрибута не всегда очевидны. Австрийский новостной сайт orf.at узнал об этом на собственном горьком опыте совсем недавно.
Применительно к элементу
атрибут lang
определяет естественный язык страницы. Если ваш документ написан на французском языке, вы должны установить его на фр.
…
…
Эта информация используется поисковыми системами, программами чтения с экрана, расширениями для браузеров и другим программным обеспечением.
Почему атрибут lang так важен?
Адриан Роселли написал об использовании атрибута Lang, поэтому я не буду повторять все, что он говорит, но приведу несколько примеров того, как этот атрибут влияет на UX, и покажу, что произошло недавно на самом популярном австрийском веб-сайте в Австрия.
Автоматический перевод
Инструменты перевода, такие как Google Translate, могут предложить перевести содержимое страницы, если язык, определенный в элементе
, не совпадает с языком по умолчанию в браузере. Кажется, не имеет значения, на каком языке на самом деле написана страница, для Google Translate важно значение lang
атрибут. В следующем примере Chrome дает мне возможность перевести хорватский текст на странице, который не является хорватским, на английский, потому что я установил lang
на hr
.
…
Знает ли Барри Манилоу, что вы совершаете набег на его гардероб?
< /тело>
Это имеет смысл и в принципе полезная функция, но может быть проблематичной, если переводы не нужны:
Вена в этом месяце участвовала в выборах для избрания (нового) муниципального правительства, и orf.at опубликовал результаты на своем веб-сайте. Они разделили результаты по округам, от 1-го округа «Внутренний город» до 23-го округа «Лизинг». Вскоре после того, как они опубликовали результаты, они получили сообщения об ошибках от пользователей, в которых говорилось, что некоторые названия районов были неправильными. При попытке воспроизвести баг заметили, что Chrome предлагает перевести страницу. Если вы просто закроете подсказку, ничего не произойдет, но если раньше вы позволяли Google Translate автоматически переводить страницы, он больше не спрашивал, а просто автоматически переводил страницу.
Страница была написана на немецком языке, но естественный язык страницы был установлен на английский язык в HTML ( en
), и поэтому пользователи Chrome, которые указали браузеру переводить английский язык на немецкий, автоматически увидели это:
Google Translate изменил название 23-го округа «Лизинг» на «Люген» (с на по-английски), а название 10-го округа с «Зиммеринг» на «Зиден» (с на по-английски). Google Translate предположил, что авторы хотели написать «лежа» (lügen по-немецки) и что «варка на медленном огне» — это не просто название, а процесс приготовления жидкостей.
Как это случилось?
Во-первых, я должен сказать, что это не имеет большого значения. Я пишу об этом просто потому, что это интересный побочный эффект проблемы, которая обычно влияет на доступность, а не на пользовательский опыт в целом.
Я знаю некоторых разработчиков на orf.at, и я также знаю, что они заботятся о качестве и доступности, так почему же это все же произошло? Конечно, потому что мы все люди, и дерьмо случается, но конкретная проблема на orf.at заключалась в том, что они используют vue-cli, который автоматически создает стандартную структуру для документов, которая устанавливает lang
атрибут en
по умолчанию. Разработчики этого не заметили, потому что валидаторы и инструменты автоматического тестирования доступности просто проверяют наличие атрибута и действительность значения.
Предотвращение этой ошибки
Итак, это ошибка, которую трудно обнаружить, но как мы можем предотвратить ее?
- Фреймворки и другие установки, предлагающие шаблонную HTML-структуру, могут сделать выбор естественного языка частью процесса автоматической или ручной установки вместо установки по умолчанию. Разработчики orf.at уже создали проблему для vue-cli.
- Документация должна включать раздел о структуре HTML-документа и объяснять, почему некоторые вещи важны и какие побочные эффекты может иметь неправильная реализация.
- Вы можете использовать что-то вроде a11y.css для отладки вашего документа или создать свой собственный файл debug.css и добавить тесты, которые вы хотите запустить в своей среде разработки. «Тесты» звучат красиво, но это просто набор селекторов, которые показывают большую красную рамку или другие визуальные индикаторы, если есть ошибка.
Отладка атрибута lang
Есть несколько вещей, которые вы можете проверить.
- Присутствует ли атрибут
lang
? Если нет, покажите красную пунктирную рамку.
html:not([lang]) {
граница: 10 пикселей с красными точками;
}
Можно даже вывести сообщение об ошибке.
html:not([lang])::before {
content: 'атрибут lang отсутствует'; Дисплей
: встроенный блок;
фон: красный;
позиция: фиксированная;
верх: 0;
осталось: 0;
отступ: 0,3 см;
цвет: #fff;
размер шрифта: 1. 2rem;
}
Отсутствует демонстрация атрибута lang на CodePen
- Атрибут lang присутствует, но значение пустое?
html[lang=''],
html[lang*=' '] {
граница: 10 пикселей с красной точкой;
}
Демонстрация пустого атрибута lang на CodePen
- Атрибут lang содержит правильное значение?
html:not(:lang(en)) {
граница: 10 пикселей с красной точкой;
}
Неверное значение в демонстрационной версии атрибута lang на CodePen
Преимущество использования псевдокласса lang()
заключается в том, что этот тест будет работать, даже если значение равно en-US
или en-GB
, и т. д. .
Примечание. Это не будет работать на многоязычных веб-сайтах, и вам придется настраивать его для каждого проекта в зависимости от языка.
- Собираем все вместе:
html:not([lang]),
html:not(:lang(en)),
html[lang=''],
html[lang*=' '] {
граница: 10 пикселей с красными точками;
}html:not([lang])::before,
html[lang='']::before,
html[lang*=' ']::before,
html:not(:lang(en) ::before {
display: inline-block;
фон: красный;
позиция: фиксированная;
верх: 0;
осталось: 0;
набивка: 0,3 см;
цвет: #fff;
размер шрифта: 1. 2rem;
}html:not(:lang(en))::before {
content: 'неверное значение атрибута lang';
}html[lang='']::before,
html[lang*=' ']::before {
content: 'атрибут lang пуст';
}html:not([lang])::before {
content: 'атрибут lang отсутствует';
}
Отладка атрибута lang на CodePen
Как уже упоминалось, атрибут lang
влияет не только на автоматический перевод, но и на многие другие аспекты взаимодействия с пользователем. Вот еще два примера:
Программы чтения с экрана
Средства чтения с экрана, программное обеспечение, которое люди используют для чтения контента на странице, могут выбирать другой голосовой профиль в соответствии со значением параметра 9.0050 lang атрибут. Если вы установите его на русский ( ru
), но язык страницы английский, это может звучать так, как будто кто-то говорит по-английски с сильным русским акцентом.
Стив Фолкнер записал демо, чтобы показать вам эффекты.
Кавычки
Кавычки могут меняться в зависимости от естественного языка страницы.
Кавычки на английской странице выглядят так:
Знает ли Барри Манилоу, что вы обыскиваете его гардероб?
…
Знает ли Барри Манилоу, что вы совершаете набег на его гардероб?
HTML>
Немецкий:
Знает ли Барри Манилоу, что вы обыскиваете его гардероб?
…
Знает ли Барри Манилоу, что вы совершаете набег на его гардероб?
Французский:
Знает ли Барри Манилоу, что вы обыскиваете его гардероб?
…
Знает ли Барри Манилоу, что вы совершаете набег на его гардероб?
HTML>
Вы можете узнать больше о кавычках в CSS в Вот что я не знал о «контенте».
Другие
Правильное использование значения также может повлиять на расстановку переносов, соответствие WCAG , поля ввода, проверку орфографии и выбор шрифта по умолчанию для языков CJK (китайский, японский и корейский). Подробности читайте в статье Адриана Роселлиса (и в разделе комментариев).
Соври мне, скажи мне сладкую ложь
Атрибут HTML Lang: что это такое? Почему это важно?
12 июль
12 июль
СодержаниеЧто такое атрибут HTML lang?
Почему атрибут HTML lang важен и полезен?
Влияет ли атрибут языка HTML на SEO?
Как реализовать атрибут lang на вашем веб-сайте
Как выбрать коды языка
Распространенные ошибки при использовании HTML-тегов lang
Заключение
Атрибут lang определяет язык текстового содержимого, используемого на веб-странице. Обычно он используется, чтобы четко обозначить язык страницы, чтобы избежать путаницы.
Поисковые системы используют атрибут lang, чтобы возвращать поисковику результаты, относящиеся к определенному языку, а также сигнализирует системе чтения с экрана о необходимости переключения на другой язык.
Эта статья поможет вам понять тег lang в HTML и его важность, что он делает, как внедрить его на свой сайт и влияет ли он на SEO?
Готовы? Давайте начнем.
Что такое атрибут HTML Lang?
Атрибут языка HTML используется для определения языка текста, используемого на любой веб-странице. Основная цель этого атрибута — указать язык основного документа.
Он также используется онлайн-ридерами, которые меняют язык для отображения правильного произношения и акцента содержимого веб-страницы.
Тег HTML lang поддерживается широко используемыми веб-браузерами, такими как Chrome, Internet Explorer, Firefox, Safari и Opera.
Вот синтаксис атрибута HTML LANG:
. .
Например, если языком содержимого является английский, тогда код языка должен быть «en»: Французский язык, код языка должен быть:
В HTML 5 атрибут lang можно использовать с любым элементом HTML, например
и
.
Например, если у вас есть веб-страница, содержимое которой написано на 4 разных языках — английском, французском, русском и испанском, то правильные коды языков можно указать следующим образом:
Этот абзац на английском языке. ce parae est en français этот абзац на французском языке este parrafo está en francés ...
<тело>
В приведенном выше коде поисковые системы может четко понимать язык четырех разных абзацев и отображать их в поисковой выдаче, когда это необходимо.
Кроме того, программы чтения с экрана могут выбирать правильный язык и произношение для лучшей доступности для слабовидящих пользователей.
Почему атрибут HTML Lang важен и полезен?
Атрибут lang в HTML имеет решающее значение, потому что он помогает поисковым системам, таким как Google, Bing, Yandex и другим, возвращать результаты для конкретного языка в поисковой выдаче.
Источник изображения: Reliablesoft
Если у вас есть несколько версий веб-страницы для разных регионов или языков, вы должны сообщить поисковым системам об этих версиях. Это поможет поисковым системам отображать лучшую версию вашего сайта в зависимости от их языка или местоположения.
Вот несколько основных причин, по которым HTML-тег lang полезен:
- Он помогает поисковым системам понять правильный язык веб-страницы. Это повышает качество результатов поиска, поскольку поисковые системы могут возвращать результаты на основе языковых предпочтений искателя.
- Расширения браузера и другое программное обеспечение, такое как средства перевода, могут использовать тег lang для отображения информации на правильном языке. Теги
- Lang также позволяют изменять стиль содержимого в зависимости от языка. Например, вы можете установить определенный шрифт для определенного языка. Кроме того, пользовательские агенты могут автоматически выбирать шрифты в зависимости от языка документа.
- Средства чтения с экрана, синтезаторы речи и переводчики Брайля используют атрибут lang для вывода текста. В таких странах, как Великобритания, правительство обеспечивает использование правильных языковых тегов в соответствии с рекомендациями W3C по обеспечению доступности веб-сайтов.
Влияет ли атрибут HTML Lang на SEO?
Этот атрибут HTML lang не влияет на поисковую оптимизацию, поскольку основные поисковые системы, такие как Google и Bing, не используют этот тег для фильтрации результатов поиска по языку или местоположению.
Google использует тег hreflang для определения местоположения и языка вашего контента.
Вот синтаксис тега hreflang:
Или
Где en
относится к английскому языку, а gb
относится к Соединенному Королевству. Это означает, что страница предназначена для англоязычных пользователей из Великобритании.
Аналогичным образом Bing использует метатег content-language для понимания языка документа.
Вот синтаксис метага «контент-языка»:
или
Где en
относится к английскому языку, а us
относится к США. Это означает, что страница предназначена для англоязычных пользователей в США.
Таким образом, атрибут HTML lang не влияет на поисковую оптимизацию. Тем не менее, вы всегда должны использовать тег lang, потому что он влияет на взаимодействие с пользователем и помогает сделать ваш веб-сайт дружественным W3C.
При работе с многоязычными веб-сайтами следует использовать теги hreflang и content-language для Google и Bing соответственно в зависимости от целевых местоположений и поисковых систем.
Как реализовать атрибут языка на вашем веб-сайте
Вы можете добавить языковой тег на веб-страницу, отредактировав исходный код.
Вы всегда должны использовать элемент HTML в качестве объявления для определения языка, поскольку HTML наследует все остальные элементы на странице.
Например, если вы хотите установить французский язык в качестве языка всей веб-страницы, используйте этот тег:
900fr"1
Это веб-страница на английском языке.
Тег заголовка h2
Вы также можете указать язык различных абзацев в документе. В этом случае вам нужно использовать несколько языковых тегов HTML вместе.
Вот пример страницы с двумя разными языками:
Это абзац, написанный на английском языке. ce parae est en français
...
...
Более того, если вы хотите указать язык какого-либо контента при отсутствии разметки, используйте span, bdi или div.
Вот пример:
Скажите привет по-корейски, как 안녕하세요. 9 0003
Всегда следует добавлять атрибут HTML lang, чтобы задать язык веб-страницы по умолчанию.
Браузеры, поисковые системы и другие приложения могут использовать эту информацию для наиболее подходящего отображения информации пользователям.
При работе с несколькими языками вам потребуется помощь в выборе правильных кодов для каждого местоположения.
Вот полный список языковых кодов ISO для каждого местоположения:
Язык | Код ISO |
---|---|
Абхазская | аб |
Афар | аа |
Африкаанс | аф |
Акан | ак |
Албанский | кв |
Амхарский | утра |
Арабский | ар |
Арагонский | и |
Армянский | хай |
Ассамский | как |
Аварик | ав |
Авестийский | |
Аймара | и |
Азербайджанский | аз |
Бамбара | бм |
Башкирский | или |
Басков | ЕС |
Белорусская | будет |
Бенгальский (бангла) | млрд |
Бихари | бх |
Бислама | -би |
Боснийский | бс |
Бретонский | бр |
Болгарский | бг |
Бирманский | мой |
Каталонский | ок |
Чаморро | ч |
Чеченская | |
Чичева, Чева, Ньянджа | нью-йоркский |
Китайский | ж |
Китайский (упрощенный) | ж-Ханс |
Китайский (традиционный) | ж-Хант |
Чувашский | резюме |
Корниш | кВт |
корсиканский | совместно с |
Кри | кр |
Хорватский | час |
Чехия | кс |
Датский | да |
Дивехи, Дивехи, Мальдивские острова | дв |
Голландский | нл |
Дзонгка | дз |
Английский | и |
Эсперанто | эо |
Эстонский | и |
Овца | ее |
Фарерские острова | для |
Фиджийский | фдж |
Финский | фи |
Французский | из |
Фула, Фула, Пулаар, Пулар | и далее |
Галисийский | гл |
Гэльский (шотландский) | гд |
Гэльский (мэнский) | гв |
Грузинский | ка |
немецкий | из |
Греческий | эль |
Гренландский | кл |
Гуарани | г |
Гуджарати | гу |
Гаитянский креольский | |
Хауса | га |
Иврит | он |
Гереро | Гц |
Хинди | привет |
Хири Моту | хо |
Венгерский | ху |
Исландский | это |
Идо | ио |
Игбо | иг |
Индонезийский | ид, в |
Интерлингва | иа |
Интерлингв | т. е. |
Инуктитут | иу |
Инупиак | ик |
Ирландский | га |
Итальянский | это |
Японский | и |
Яванский | СП |
Калааллисут, Гренландия | кл |
Каннада | кн |
Канури | крон |
Кашмири | кс |
Казахская | кк |
Кхмерский | км |
Кикую | ки |
Киньяруанда (Руанда) | RW |
Кирунди | р-н |
Кыргызстан | кк |
Коми | кв |
Конго | кг |
Корейский | ко |
Курдский | ку |
Кваньяма | кж |
Лаос | вот |
Латинский | ла |
Латышский (латышский) | ур. |
Лимбургский (лимбургский) | ли |
Лингала | по |
Литовский | л |
Луга-Катанга | лю |
Луганда, Ганда | лг |
Люксембург | фунтов |
Манкс | гв |
Македонский | мк |
Малагасийский | мг |
малайский | мс |
малаялам | мл |
Мальтийский | м |
Маори | миль |
маратхи | г-н |
Маршалловы острова | мч |
Молдавский | пн |
Монгольский | мин |
Науру | на |
Навахо | нв |
Ндонга | нг |
Северный ндебеле | и |
Непальский | и |
Норвежский | нет |
Норвежский букмол | номер |
Норвежский нюнорск | нн |
Нуосу | II |
Окситанский | ок |
Оджибве | или |
Старославянский, староболгарский | у. е. |
Ория | или |
Оромо (Афаан Оромо) | или |
Осетинский | ОС |
Пали | пи |
Пушту, пушту | пс |
Персидский (фарси) | ФА |
польский | пл. |
Португальский | пт |
пенджаби (восточный) | па |
Кечуа | или |
ретороманский | п.м. |
Румынский | ро |
Русский | руб |
Сами | се |
Самоа | см |
Санго | сг |
Санскрит | с |
Сербский | ср |
сербско-хорватский | ш |
Сесото | ул |
Сетсвана | тн |
Шона | сн |
Сычуань И | II |
Синдхи | сд |
сингальский | и |
Сисвати | нержавеющая сталь |
Словацкий | ск |
Словенский | сл |
Сомалийский | так |
Южный ндебеле | № |
Испанский | эс |
Суданский | и |
Суахили (кисуахили) | ПО |
Свати | нержавеющая сталь |
Шведский | св |
Тагальский | тл |
Таитянский | ты |
Таджикский | тг |
Тамильский | та |
татарский | тт |
Телугу | тэ |
Тайский | -й |
Тибетский | бо |
Тигриня | и |
Тонга | отдо |
Цонга | тс |
Турецкий | т. р. |
Туркменский | тк |
Тви | тв |
Уйгурский | уг |
Украинский | Великобритания |
Урду | ур |
Узбекский | уз |
Венда | и |
Вьетнамский | ви |
Волапюк | или |
Валлон | ва |
Валлийский | су |
Волоф | или |
Западно-фризский | ф. |
Коса | хв |
Идиш | йи, йи |
Йоруба | лет |
Чжуан, Чжуан | за |
Зулу | по |
Вы можете выбрать код языка в зависимости от вашего целевого местоположения и добавить его на веб-страницу.
Если вы хотите найти вложенные теги для региональных языков, вы можете использовать инструмент поиска языковых вложенных тегов.
Введите код основного местоположения вашего целевого местоположения, и инструмент автоматически выберет все связанные вложенные теги для этого местоположения.
Вот пример:
Обычные ошибки при внедрении HTML LANG TAGSВот некоторые из наиболее распространенных ошибок, используемых при использовании HTML Lang Attrubt:
. Вот некоторые из самых распространенных ошибок.
Заключение
HTML-атрибут lang – жизненно важный элемент вашего веб-сайта. Неважно, обслуживаете ли вы пользователей из разных мест или нет; Использование действительных атрибутов языка HTML имеет решающее значение для улучшения доступности вашего веб-сайта и взаимодействия с пользователем.
Если вы хотите улучшить SEO своего веб-сайта, обязательно используйте теги hreflang и теги content-language соответственно.
Я надеюсь, что это руководство по языку HTML помогло ответить на часто задаваемые вопросы, связанные с тегом языка HTML.
Удачной пометки!
Языковые коды HTML | Học web chuẩn
Mã ngôn ngữ iso
thuộc tính lang trong html ược dùng ể khai báo ngôn ngữ html trang web hay một phần của trang web, mục đ đ đ v à à à v v v k k v v v v v v v v v v wệ wyn.
Тео Кьен Нгхо Куа W3C, Бан Нен Кхай Бао Нгон Нго Чин Чо Муи Транг Веб Вой Чак Тхуок Тинь lang bên trong thành phần như sau:
Html:
...
Xhtml:
...
Mã ngôn ngữ ISO 639-1
Язык | Код ISO |
---|---|
Абхазский | аб |
Афар | аа |
Африкаанс | аф |
Албанский | кв |
Амхарский | утра |
Арабский | ар |
Арагонский | и |
Армянский | хай |
Ассамский | как |
Аварик | ав |
Авестийский | |
Аймара | и |
Азербайджанский | аз |
Бамбара | бм |
Башкирский | или |
Басков | ЕС |
Белорусская | будет |
Бенгальский (бангла) | млрд |
Бутани | дз |
Бенгальский | млрд |
Бихари | кв. |
Бислама | -би |
Боснийский | бс |
Бретонский | бр |
Болгарский | бг |
Бирманский | мой |
Белорусский (Белорусский) | будет |
Камбоджийский | км |
кастильский | эс |
Каталонский | ок |
Чаморро | ч |
Чеченская | |
Чероки | чр |
Чева | нью-йоркский |
Чичева | нью-йоркский |
Китайский | ж |
Чжуан | за |
Церковно-славянский | у.е. |
Церковнославянский | у.е. |
Чувашский | резюме |
Корниш | кВт |
корсиканский | совместно с |
Кри | кр |
Хорватский | час |
Чехия | кс |
Датский | да |
Дивехи | дв |
Дивехи | дв |
Голландский | № |
Дзонгка | дз |
Эдо | мк |
Английский | и |
Эсперанто | эо |
Эстонский | и |
Овца | ее |
Фарерские острова | или |
Фарси | ФА |
Фиджийский | фдж |
Фиджи | фдж |
Финский | фи |
Фламандский | нл |
Французский | из |
Фризский | ф. у. |
Фула | и далее |
Фульфульде | |
Гэльский | гд |
Гэльский (мэнский) | гв |
Галисийский | гл |
Ганда | LG |
Грузинский | ка |
немецкий | из |
Гикую | ки |
Греческий | эль |
Гренландский | кл |
Гуарани | г |
Гаитянский | |
Гуджарати | гу |
Гаитянский креольский | |
Хауса | га |
Гавайский | |
Иврит | он, ив |
Гереро | Гц |
Хинди | привет |
Хири Моту | хо |
Венгерский | ху |
Ибибио | |
Исландский | это |
Идо | ио |
Игбо | иг |
Индонезийский | ид, в |
Интерлингва | иа |
Интерлингв | т. е. |
Инуктитут | иу |
Инупиак | ик |
Ирландский | га |
Итальянский | это |
Японский | и |
Яванский | СП |
Калааллисут | кл |
Каннада | кн |
Канури | крон |
Кашмири | кс |
Казахский | кк |
Кхмерский | км |
Кикую | ки |
Киньяруанда (Руанда) | ряд |
Киргизский | кк |
Коми | кв |
Конго | кг |
Кирунди (Рунди) | р-н |
Конкани | |
Корейский | ко |
Куаньяма | кж |
Курдский | ку |
Лаосский | вот |
Латинский | ла |
Латышский (латышский) | ур. |
Летцебургеш | фунтов |
Лимбурган | ли |
Лимбургер | ли |
Лимбургский (лимбургский) | ли |
Лингала | по |
Литовский | л |
Люба-Катанга | лю |
Люксембургский | фунтов |
Македонский | мк |
Малагасийский | мг |
малайский | мс |
малаялам | мл |
Мальдивский | дв |
Мальтийский | м |
Манкс | гв |
Маори | миль |
Маратхи | г-н |
Маршалловы острова | мч |
Молдавский | пн |
Монгольский | мин |
Науру | на |
Навахо | нв |
Навахо | нв |
Ндонга | нг |
Непальский | и |
Северный Ндебеле | -й |
Северные саамы | се |
Норвежский | нет |
Ньянджа | нью-йоркский |
Окситанский | ок |
Оджибва | или |
Староболгарский | у. е. |
Старославянский | у.е. |
Старославянский | у.е. |
Ория | или |
Оромо (Афан, Галла) | или |
Папьяменту | стр. |
Осетинский | ОС |
Осетинский | ОС |
Пали | пи |
Панджаби | па |
Персидский | ФА |
польский | пл. |
Португальский | пт |
Провансальский | ок |
Пушту (пушту) | пс |
польский | пл. |
Португальский | пт |
Пенджаби | па |
Кечуа | или |
Рето-романтика | п.м. |
Румынский | ро |
Рунди | р-н |
Русский | руб |
Саамский (саамский) | смэ |
Самоа | см |
Сангро | сг |
Санскрит | с |
Шотландский гэльский | гд |
Сербский | ср |
сербско-хорватский | ш |
Сесото | ул |
Сетсвана | тн |
Сербский | ср |
Шона | серийный номер |
Сычуань И | или |
Синдхи | сд |
Сингальский | и |
сингальский | и |
Сисвати | нержавеющая сталь |
Словацкий | ск |
Словенский | сл |
Сомалийский | так |
Южный Ндебеле | № |
Испанский | эс |
Суданский | и |
Суахили (кисуахили) | ПО |
Свати | нержавеющая сталь |
Шведский | св |
Сирийский | ся |
Тагальский | тл |
Таитянский | ты |
Таджикский | тг |
Тамазайт | тиа |
Тамильский | та |
татарский | тт |
Телугу | тэ |
Тайский | -й |
Тибетский | бо |
Тигриня | и |
Тонга | отдо |
Цонга | тс |
Тсвана | тн |
Турецкий | т. |