国際コード Top Languages Mathematics English

ニュース

2007年10月19日 フランスが海外領土へのコード割当を変更 (→詳細)
2006年9月26日 セルビア・モンテネグロの国コード分割。 セルビア (RS, SRB, 688), モンテネグロ (ME, MNE, 499) (→詳細)。 同時に CS は過渡的予約状態に移行 (transitionally reserved)。
2006年3月29日 ジャージー (Jersey) 島、ガンジー (Guernsey) 島、マン島 (Isle of Man) の国コード JE, GG, IM 発効 (officially assigned →詳細)
2006年1月11日3文字コード zxx 追加。 おそらく言語の集合体用。 Used to declare the absence of linguistic information とのこと。具体例不明。
2005年11月8,16日 東フリジア語 frs、 北フリジア語 frr の追加に伴い、 従来の fr (fry) を西フリジア語に限定。
2005年8月16日アイヌ語 (Ainu, aïnou)の言語コード決定。 2文字:なし、3文字:ain
2004年2月24日クリンゴン語の言語コード決定。 2文字:なし、3文字:tlh (→詳細)。決定に際しては「当事国」での呼び名 (vernacular name) を規準にするという ISO の方針が適用された模様。 なお、同文字のユニコードへの登録は提案中 (→詳細)
2004年2月13日オーランド島 (Åland Islands : フィンランド・スウェーデン間バルト海上の内政自治の島) の国コード AX 発効 (→詳細)
2003年7月23日セルビア・モンテネグロの国コード決定。 2文字:CS、3文字:SCG、番号:891 (従来通り) (→詳細)。 同時に YU は過渡的予約状態に移行。

はじめに

単なる記号列に過ぎないはずのコードですが、コード自体またはその一覧表には、 各国の地理的状況、歴史的経緯、国際関係、あるいは個性や思惑の一端が窺えます。

目次

ニュース
はじめに
いろいろな国際コード
国名と言語名を読むためのフランス語入門 (符号、単語、冠詞、接続詞と前置詞)


わけありの



国コード (ISO 3166-1)
言語コード (ISO 639) [変更があった] [A3 が2種類ある]
[A2 が特徴的] [A2 も A3 も特徴的]
[元語が意外] [引用者の覚書 ?] [マイナー ?]
[古代から現代へ] [語族、系、諸語] [特殊な言語、分類]
拾遺集 各国語で各国名
英語言語名の語尾
極北の語族
南極と孤島
国コード例外
関連サイト ありがとう

いろいろな国際コード

例えば、 日本国政府が発行するパスポートの発行国の欄には JPN と印字されていますし、 海外から日本に電話するときはどこかで 81 とダイヤルしますし、 日本の多くの書籍には ISBN4- で始まる番号が振られています。 これらのコードは国を越えて通用するように国際的な規準に基づいています。 国際コードはいろいろありますが、主なものを挙げると
各種の国際コード
コード種別標準規格 管理組織*1関連サイトなど
国コード ISO 3166-12文字 ISO 3166/MA DIN : 前 MA。 事務局は2001年12月に DIN (ベルリン)から ISO (ジュネーブ)に移転した。
UNSD : 国連統計部
UNECE : 国連欧州経済委員会 (UN/LOCODE を管理・維持)
UPU : 万国郵便連合。国連の専門機関。 日本国内では日本郵政公社 (2003年3月までは郵政省) の 国際郵便条件表 (日本語のみ) に各国の郵便事情。
WCO : 世界税関機構 (通称)
WIPO : 世界知的所有権機関。国連の専門機関
ICANN : The Internet Corporation for Assigned Names and Numbers。 インターネットガバナンスにおける国際的な頂点組織として、ドメイン名、 IPアドレス等インターネット資源のポリシー調整。日本国内では JPNIC
IANA : The Internet Assigned Numbers Authority。 現在は ICANN における機能の名称。
3文字
3数字
ISO 3166-2行政区画
ISO 3166-3旧国名
言語コード ISO 639-12文字 ISO 639-1/RA*2 ISO 639/JAC : コードの追加・変更の受け付け窓口、 RA にアドバイスする立場にある。
Ethnologue : 現地調査を踏まえた学術的で詳細な独自の3文字コードを持つ。 ISO コードとの対応表あり(各種コードでソート可能)
ISO 639-23文字 ISO 639-2/RA*3
文字コード ISO 8859-1, ... ,10 ISO 世界の文字」に 関連情報があります。
Unicode (ISO/IEC 10646) The Unicode Consortium
国際通貨コード ISO 4217 ISO 4217/MA*4 XE : 主要通貨のクロスレート (vs. USD, EUR) を1分おきに表示。
theFinancials.com : コード、国名、通貨名、金銭表示形式、為替レート (vs. USD) を併記。
国際証券コード ISIN (ISO 6166) ISO 東京証券取引所 : 証券コード協議会の事務局を務める。日本国内の ISIN の付番機関。
国際電話の国番号 E.164 ITU-T*5 WTNG : 詳しい
KDDI : 国際電話会社の一つ
国際標準図書番号 ISBN (ISO 2108) The International ISBN Agency 日本図書コード管理センター : 日本国内の ISBN の付番機関。
(*1) MA : Maintenance Agency, RA : Registration Authority, JAC : Joint Advisory Committee。
(*2) INFOTERM (International Information Centre for Terminology) は、 1971年に UNESCO (国連の教育、科学、文化担当部門) によって設立された。 その任務は terminology (術語学)の分野で国際的な協力を手助けし調整すること。 最初の10年は 主に ON (英語で ASI) 内で活動。ISO 639-1/RA は INFOTERM の仕事の一つ。
(*3) 米国国会図書館 (The Library of Congress) の内部組織。
(*4) 英国規格協会の通貨コードサービス (BSI Currency Code Service)。 有料
(*5) ITU は国際電気通信連合、国連の専門機関の一つ。 ITU-T はその電気通信標準化部門、かつての CCITT。

コードはいろいろな形で応用されています。例えば、 国コードは、パスポートだけでなく、インターネットのドメイン名、 国際通貨コード (2文字の国コード + 1文字の通貨記号)、 国際証券コード、国際郵便業務などに使われています。 また、Unix の Locale などもコードのアプリケーションの一種と考えられます。 (「各国の数値および金額の記数法」参照)

コードの管理組織の中には、更新履歴や FAQ を Web 上で公開しているところもあり なかなか面白いです。本稿でも規格そのものと共に随所に引用させていただきました。 なお、規格は情報として無料または有料で提供されています。 配布形態は、ペーパー、CDROM、オンラインなど、また、データ形式も、 テキスト、HTML、PDF、Microsoft 社の WORD, EXCEL, ACCESS など各種あります。 有料の場合、支払いも、組織(の事務局の所在地)によって、 スイスフラン (CHF)、米ドル($)、英ポンド(£)だったりします。

一方で、インターネットで規格の一部または全部を 無料、無補償で提供している第三者(個人または組織)サイトもたくさんあります。 ここでも、 インターネット上のリソースから、なるべく機械的に、なるべくコンパクトに、 国コード(ISO 3166-1)と言語コード(ISO 639-1)の一覧表を作ってみました。 Display the list on a new frame をクリックすると新フレームに、 Display the list on this frame をクリックすると本フレームに表示されます。
国コード
一覧表
Display the list on a new frame ISO 3166/MA から英語版と仏語版の2文字リストをダウンロードし 国名を capitalize した上で2文字コードでソート・マージしたものと、 UNSD からコピーした3文字&数字リストとを、英語国名をキーにマージ。 239行。
Display the list on this frame
予約コード Display the list on a new frame ISO 3166/MA が予約しているコード。ユーザー用、現段階では未使用、 一時的/不確定/例外的な予約状態の5種類に分類されており、 UPU, ITU, WCO, WIPO, ISO 4217/MA との関係が示されている。
Display the list on this frame
言語コード
一覧表
Display the list on a new frame ISO 639-2/RA のリストをコピーし、 2文字コードだけ抜き出し、 重複を排除した上で (ISO 639-2/RA のリストは丁寧に作られています)、 2文字コードでソート。 182行。
Display the list on this frame

国名と言語名を読むためのフランス語入門

国名と言語名は英語と仏語で提供されているので、 本稿でも英仏併記を踏襲しました。 せっかくの機会ですので、国名と言語名を読める程度の仏語解説を試みます。 英語も仏語もラテン文字を用いますので、文中に両言語が混在すると 混乱しそうですが、文脈で判別できるようにしたつもりです。 明示なく出てくるラテン文字は英語です。 必要な場合 [ ] 内に仏語を示しました。

一説によると、印欧祖語 (Proto-Indo-European) がゲルマン系 (→West Germanic) と イタリック系 (→仏語) に分化し始めたのは約5000年前、West Germanic が Old High German (→独語) と Anglo-Frisian (→英語) に 分化し始めたのが約2000年前と推定されていますので、 1000年ほど前のノルマン人の侵入により仏語は英語語彙に影響を与えたとはいえ、 仏語の方が独語よりも英語から離れていると思います。 コード一覧表を眺めていると、 まず、仏語には´`^¨などの符号が付いた文字があることに気付きます。 (次の表の「符号付き文字」の欄が空白に見える場合は、お手数ですが 旧版または 英語版 をご覧ください。)
符号付き
文字
符号の名称 符号の機能 HTML*7 TeX*8
英語仏語 本文数式
é
É
Brésil acute accent accent aigu*1 揚音符 (はっきりeと発音する)*2 é \'{e}\acute{e}
à è ù
À È Ù
Grèce grave accent accent grave 抑音符*3 è \`{e}\grave{e}
â ê î ô û
Â Ê Î Ô Û
Île circumflex
accent
accent
circonflexe
曲折音符*3 î \^{\i}\hat{\i}
ë ï ü
Ë Ï Ü
Haïti*1 dieresis tréma*4 ou
diérèse
分音符 (前の母音とは別に発音) ï \"{\i}\ddot{\i}
ç Ç français cedilla cédille*5 a, o, u の前で c に [s] の音を持たせる。 ç Ç \c{c} \c{C}-
œ Œ œil ligature ligature*6 連字、合字 - \oe \OE-
(*1) 仏語では語頭の h や語末の s, t, e などは通常発音しません。これを黙字 (silent letter [lettre muette, h muet, e muet, etc.]) といいます。 例えば Haïti は「アイティ」、accent は「アクサン」となります。 しかし、普通には発音しない語末子音でも、次の語の頭が母音のときは、 連続して発音します。この子音字復活のことをリエゾン [liaison] といいます。 したがって、accent aigu は「アクサンテギュ」と読みます。 そもそも、仏語には、末尾子音の語と語頭母音の語をつなげて発音する アンシェヌマン [enchaînement] という習慣があります。
(*2) ´は「強く」の意味ではないことに注意します。
(*3) 現代仏語では発音には影響しません。
(*4) 仏語では「トレマ」といいます。ドイツ語の umlaut (a, o, u に付く)も 同じ符号ですが意味が異なります。ウムラウトは母音変異 (mutation) を意味します。
(*5) 仏語では「セディーユ」といいます。ポルトガル語にもあります。 機能は異なりますが、符号としてはトルコ系の言語などにも見られます。
(*6) これは符号ではなく、連続する母音字 o と e をくっつけて1文字にする という意味です。æ (a と e の ligature) もあるにはありますが、 仏語では稀で、ノルウェー語、デンマーク語などに多く見られるようです。 連続する母音字は他にもいろいろありますが、くっつけません。 母音とは無関係な印刷用の fi, ff なども ligature といい、 こちらは見栄えを良くするという働きがありますが、œ には特別な働きはなく、 ただ、œ や æ が発音上意味をもっているギリシャ語や ラテン語に由来する語に多いようです。 仏語には英語のような二重母音 (diphthong [diphtongue]) という考え方はなく
  • この例の発音は「オェユ」(国際音標文字 (IPA) で œj、意味は英語の eye)、 一方、ギリシャ神話のオイディプス王 Œdipe は「エディプ」。
  • 後で出てきますが、au (前置詞 à + 定冠詞 le) の発音は [o]。 このように二字で一調音 (articulation) のものは 二重字 (digraph [digramme])といいます。他に cl, gr, ch, gn など。
  • トレマ(¨)はあくまで「分音」
  • 英語 Siberia は「サイリア」ですが、 仏語 Sibérie は「シベリ」
なお、Latin1 文字セットは æ, Æ は含みますが œ, Œ は 含みませんので、フランス語を常用している人でも、コンピューター上では、 Unicode 環境でない限り、普通に oe, OE と綴ります。
(*7) 正確には Additional named entities for ISO 8859-1をご覧ください。
(*8) i の前の \ は i の・を消して ı とする働きがあります。

次に目で見てわかるのは、仏語で国名は大文字始まりですが、 言語名、民族名のときは小文字始まりという点です。 また、語順も英語とは少し違うようです。例えば、日=英=仏の順に、
西サハラ = Western Sahara = Sahara Occidental、
現代ギリシャ語 = Modern Greek = grec moderne など。
ついでに、よく見掛ける単語も少々。
東西南北 = east, west, south, north = est, ouest, sud, nord、 東洋 / 西洋は英仏ともに Orient / Occident。
国 = state = état、状態とか身分という意味もあります。
島 = island = île、諸島 = islands = îles。 名詞の単数形・複数形は英語同様ですが、例によって発音されません。 ただし、冠詞で区別が付きます。なお、英語にも isle(s) という単語がありますが 国名には使われないようです。
新しい = new = nouveau (elle)。 仏語の名詞は男性名詞と女性名詞に分類されていて
1) 名詞自体が語尾変化することがあります。 例えば、男友達は ami, 女友達は amie
2) 冠詞が異なります(後述)。
3) さらに、形容詞(名詞の前後に付く)も性によって語尾変化 *1することがあります。例えば、 ニューカレドニア、ニュージーランド、パプアニューギニアは女性名詞なので Nouvelle-Calédonie, Nouvelle-Zélande, Papouasie-Nouvelle-Guinée *2となります。 一方、ボジョレー地方産葡萄酒は男性名詞なので beaujolais nouveau (ボジョレー・ヌーボー)となります。
(*1) 形容詞は単数・複数によっても語尾変化することがあります。
(*2) 記号“-”はトレデュニオン [trait d'union] といい一語であることを主張します。 この場合は固有名詞化する働きがあります。

冠詞をまとめて整理しましょう。
言語\冠詞 定冠詞 不定冠詞
単数複数 単数複数
男性女性中性 男性女性中性 男性女性中性 男性女性中性
ゲルマン系英語 the a, an-
オランダ語 dehetde een
ドイツ語 1 derdiedasdie eineineein-
2 desderdesder eineseinereines
3 demderdemden einemeinereinem
4 dendiedasdie eineneineein
イタリック系
(ラテン系、
ロマンス諸語)
仏語 le, l'la, l' -les unune -des
イタリア語 illa-ile- ununa--
スペイン語 ellaloloslas- ununa-unosunas-
ポルトガル語 oa-osas- umuma-unsumas-
(注1) イタリア語の定冠詞も後続の母音または子音によって l', lo, gli と 少し複雑に変化します。
(注2) ドイツ語の1〜4は「格」を表します。
1 : 主格、2 : 所有格、3 : 間接目的格、4 : 直接目的格

冠詞は、英語とオランダ語では比較的単純ですが、 他の言語では数と性によっても変化し、 加えてドイツ語では格によっても変化し複雑です。 しかし、複雑化は情報量の増加につながっていますので一長一短といえます。 仏語の特徴としては

最後に接続詞と前置詞です。一覧表に出てくるものは限られています。
et は 英語の and に相当する接続詞です。
(例1) Trinité-et-Tobago はトリニダード・トバゴ。
(例2) トワエモアは toi et moi。英語の you and I。
et + 母音はリエゾンされません。
(例3) Svalbard et Île Jan Mayen はスバールバルとヤン・マイエン島 (ノルウェー領)
(例4) 千夜一夜物語は Les mille et une nuits。
なお、同物語はアッバース朝時代の散文の代表作とされるが、 元はペルシャ語の物語をアラビア語に翻訳し(9世紀)、 後にアラビア的要素を加味したもの。英語に翻訳されて Arabian Nights。
de は 英語の of に近い前置詞です。
(例1) Territoire Britannique de l'Océan Indien はインド洋のイギリス領。
(例2) オーデコロンは eau de Cologne。eau は水、Cologne はドイツのケルン市。
母音字と無声の h の前では d' となります。
(例3) Côte d'Ivoire (コートジボアール) は象牙海岸。
(例4) クーデター は coup d'État。coup は襲撃、État は政府。
après は英語の after (時間)または「後ろに」(空間) 。
(例) après 1453 は1453年以降。明後日は après-demain。 marcher après qn は「人の後を歩く」
jusqu'à は英語の till (時間)、to (程度)。 jusque の e が母音 à の前でエリジョンされた形。
(例) jusqu'à 1453 は1453年まで。
ちなみに avant は英語の before (時間)または「前に」(空間)。
(例) 一昨日は avant-hier。avant-garde は前衛、本来は軍事用語。

このくらいで、国名と言語名は何とか読めるのではないでしょうか。 あと、ここでは説明しきれませんでしたが、 鼻母音(鼻からも息を出す)と r の発音(うがい(嗽)するときの有声音に近い) などが特徴的です。

わけありのコード

ある語にアルファベットを割り当てる場合、通常、わかりやすさのため、 元の語の略語になるように配慮します。 元の語が英語(または仏語)ならば、英語(または仏語)を 知っている人は、コードから元の語をだいたい連想できるでしょう。 ここでは、英語を知っているだけでは 元の語を連想しにくいと思われるコードを中心に 特徴のあるものを列挙し、その理由を調査・推測してみました。 2文字コード、3文字コードはそれぞれ、 A2, A3 と略記しました。

なお、国名や言語名を英語頭文字で分類すると
アルファベット ABCDEFG HIJKLMN OPQRSTU VWXYZ
国名 15202247815 683792214 1121428148 52022 239
言語名 1411114468 61021481110 561417154 33122 182
といったバラツキがあり、コードには重複してはいけないという宿命がある以上、 人気がある(?)頭文字で始まる名前を略すときは多少不自然になるのはやむを得ません。 コードの中には、単に名前の衝突を避けるために選ばれたのか、 何か想定された元語があったのか判断できないものもありました。 その由来をご存知の方はお教えください。

国コード (ISO 3166-1)

A2 は、おおむね英語国名の略になっています。 ただし、旧フランス領から独立した国は仏語国名の略になっているようです。 なお、A3 は A2 を見やすくしたに過ぎません。ISO 3166/MA の FAQ によると
The alpha-3 code allows a better visual association between country name and code element than the alpha-2 code.
特に S 始まりの国名は既に26を超えており、英語以外の言語の略を採用している 国があるのでまだ空きはありますが、激戦区といえます。 ISO 3166/MA が提供している 26×26のマトリックスで空き具合が一目でわかります。

では特徴ある国コードを拾ってみます。
A2A3 国名コメント
英語仏語日本語
BABIH Bosnia and Herzegovina Bosnie -Herzégovineボスニア・ヘルツェゴビナ 現政府のホームページには Bosne i Hercegovine とありますので、 A3 の I は 現地の言葉で and を意味するのでしょう。
BYBLR BelarusBélarusベラルーシ BY は Byelorussia から。byelo は 英語の white または fair
CHCHE SwitzerlandSuisseスイス Information about Switzerlandの冒頭に説明があります。 「スイスは "Confoederatio Helvetica" としても知られているので CH はその略。"Confoederatio" は "連邦" を 意味し "Helvetica" はラテン語の "Helvetier" に由来する。 "Helvetier" は後にスイスとなる地に住んでいた人々を指す」 *1
DEDEU GermanyAllemagneドイツ Die bundesregierung (=The Federal Government) に Frankreich, Deutschland und Russland ... という記事がありました。 ドイツ語でそれぞれ、フランス、ドイツ、ロシアの意味。
DZDZA AlgeriaAlgérieアルジェリア DZ は Al Djazair から。アルはアラビア語の定冠詞。
EEEST EstoniaEstonieエストニア EE は … から。言語コードは et / est
EHESH Western SaharaSahara Occidental西サハラ EH は Saguia el Hamra から。 1975年にスペインが撤退した地域の北部の名称。 現在、モロッコとポリサリオ戦線*2 が帰属を巡って係争中。
ESESP SpainEspagneスペイン ES は España から。
FKFLK Falkland Islands (Malvinas) Îles Falkland (Malvinas)フォークランド諸島 南米大陸最南端のホーン岬の東。 アルゼンチンでは Islas Malvinas と呼ぶ。
GBGBR United KingdomRoyaume-Uniイギリス GB は United Kingdom of Great Britain and Northern Ireland から。 「国コード例外」参照。
GWGNB Guinea-BissauGuinée-Bissauギニアビサウ GW は … から。
HRHRV CroatiaCroatieクロアチア HR は Hrvatska から。
KGKGZ KyrgyzstanKirghizistanキルギスタン 1993年5月に conventional long form : Kyrgyz Republic, conventional short form : Kyrgyzstan と部分的に stan を外した。 スタンはウルドゥー語で国、他の中央アジア4か国の名は常にスタンが付く。
KHKHM CambodiaCambodgeカンボジア KH は Khmer から。言語名は英仏ともに Khmer
KMCOM ComorosComoresコモロ KM は … から。モザンビークとマダガスカル島の間にある群島国家。 マイヨット島 (Mayotte) の帰属問題がフランスとの間で未解決。
KYCYM Cayman IslandsÎles Caïmanesカイマン諸島 KY は … から。カリブ海。イギリス領。
LKLKA Sri LankaSri Lankaスリランカ Sri は冠詞か何かなのでしょう。 旧セイロンですが、国名変更が1972年で、 ISO 3166 is this commonly accepted International Standard and the ISO 3166/MA has been updating it since 1974. とのことですので、コード変更は不用でした。
MKMKD The former Yugoslav Republic of Macedonia L'ex-République Yougoslave de Macédoine マケドニア MK は Makedonija (Македониjа) から。 国名は FYROM と略記されることも。*3
MPMNP Northern Mariana IslandsÎles Mariannes du Nord 北マリアナ諸島 MP は … から。アメリカ領。
PSPSE Occupied Palestinian Territory Territoire Palestinien Occupéパレスチナ FAQ によると「この名称は、 パレスチナ当局が管轄している地域の名称として国連が承認したものである」
PWPLW PalauPalaosパラオ PW は … から。
SBSLB Solomon IslandsÎles Salomonソロモン諸島 SB は … から。
SISVN SloveniaSlovénieスロベニア SI は … から。
SVSLV El SalvadorEl Salvadorエルサルバドル El はスペイン語の定冠詞(単数・男性)。
TLTLS Timor-LesteTimor-Leste東ティモール Leste はポルトガル語、East の意。 独立前後は East Timor で通っていたと思いますが、 ISO も当事国の名称を採用したようです。 「国コード例外」参照。
TWTWN Taiwan, Province of China Taïwan, Province de Chine台湾 中国との関係でこのような表現になっている。 *4
UAUKR UkraineUkraineウクライナ 言語コードは uk / ukr。 UK という国コードは例外的予約状態にあり、ccTLD でイギリスが使用。 「国コード例外」参照。
VAVAT Holy See (Vatican City State) Saint-Siège (État de la Cité du Vatican) バチカン市国 Holy See は ローマ教皇(法王)庁。Curia Romana とも。公用語はラテン語。 ローマ市内に位置する都市国家。
WSWSM SamoaSamoaサモア WS は Western Samoa から。西サモアは旧称。 サモア諸島の東側は米サモア (AS)。
YTMYT MayotteMayotteマヨット YT は … から。コモロ諸島とマダガスカル島の間にある島。
ZAZAF South AfricaAfrique du Sud南アフリカ ZA は Zuid Afrika から。Zuid はオランダ語、南の意。
(*1) ヘルベチカは多くのバージョンを持ち人気のあるサンセリフ系書体としても 知られていますが、オリジナルはスイスのタイプデザイナー Max Miedinger によって1957年にデザインされました。念のためですが、彼の出身地でもある チューリッヒ (保険会社名でもある) は Zürich です。
(*2) POLISARIO は略語。
西語 : Frente Popular para la Liberación de Saguía el Hamra y Río de Oro,
仏語 : Front Populaire de Libération de Saguia el-Hamra et du Rio de Oro,
独語 : Volksfront für die Befreiung von Saguia el Hamra und Río de Oro,
英語 : Popular Front for the Liberation of Saguia el Hamra and Rio de Oro,
日本語:サギア・エル・ハムラリオ・デ・オロ解放のための人民戦線
(*3) 1995年の米国製地図の余白には、 Macedonia has proclaimed independent statehood, but has not been formally recognized as a state by the United States. などとあり、同様に、 Serbia and Montenegro have asserted the formation of a joint independent state, but this entity has not ...
(*4) FAQ によると「台湾は国連に加盟していないので、 その名は国連の国名についての公報には掲載されない。本リストに掲載した名称 は UNSD の公式発表『統計目的の国と地域のコード』に基づいている。 国連の情報源を信じ ISO 3166/MA は政治的に中立な立場をとる」
(*5) SI, HR, BA, MK は1991,2年に YU から分離独立。 1929年から続いたユーゴスラビア連邦 (YU, YUG, Yugoslavia, Yougoslavie) も、 2003年2月4日、新国家「セルビア・モンテネグロ」の憲法が発効した時点で消滅。

かつての FAQ には以下の記述がありました。 「Serbia, Montenegro and Kosovo はユーゴスラビア連邦共和国を 構成する地域であり、それぞれにはコードは割り当てられていない。 ユーゴスラビアのコード (YU, YUG, 891) が使われるべきである」

さらに,2006年6月にモンテネグロが分離独立。

言語コード (ISO 639)

ISO 639-2/RA は「コードは言語名に由来するが、コード付与者は、 コードは言語名の省略形ではなく、言語の識別子である点に注意してほしい」 と訴えています。常に省略形を採用するのは困難であり、 言語コードを応用したシステムは言語コードではなく言語名を表示するのだから、 エンドユーザーにとってはコード自体は意味を持たないというわけです。 また、今後のコード化では、その言語を使っている国(々)から 特定のコードが要求されている場合を除き、可能ならば、 当事国での呼び名 (vernacular name) を規準にするという方針を立てています。

では特徴ある言語コードを拾ってみます。 こちらはいくつかのパターンに分類しました。

変更があった

言語の発生は考えにくいですが、ISO 639 に未登録だった言語が追加されたり A3 のみだった言語に A2 も割り当てられたり、といった 変更はけっこう頻繁です。 しかし、既存の検索システムの保護(互換性の保証)という観点から、 原則としてコードの変更は認められていません。また、言語名の変更は、 言語の別名として扱い、表中では ; で区切って並べることになっています。 以下は例外と思われます。いずれも前のコードは現在再割り当てされていません。
A2A3 言語名コメント
英語仏語日本語
idind Indonesianindonésienインドネシア語 1989年に変更。前は in だった。変更理由不明。
heheb Hebrewhébreuヘブライ語 1989年に変更。前の iw は Iwrith の略。
yiyid Yiddishyiddishイディッシュ語 1989年に変更。前の ji は ドイツ語の Jiddisch。
sh- Serbo-Croatianserbo-croateセルボ・クロアチア語 2000年に削除。ただし、同じ日付で ボスニア語 bs / bos Bosnian [bosniaque] が追加されていますので一種の変更と思われます。
jvjav Javanesejavanaisジャワ語 2001年に A3T だった jaw が取り下げられた。

A3 が2種類ある

ISO 639-2/RA の規準書 ( Normative Text) によると、一部の言語向けに二つのコード体系が用意されています。 一つは bibliographic 用途 (ISO 639-2/B)で、 主に図書館、文献検索システム、出版業界で使用。その付与規準は
その言語を使っている国(々)の好み
国際的な文献データベースで流通している
当事国の言語または英語での言語表現形式
もう一つは terminology 用途 (ISO 639-2/T)で、 主に術語学、辞書編集、言語学の分野で使用。その付与規準は
当事国の言語での言語表現形式
その言語を使っている国(々)の好み
ISO 639-2/RA の FAQ によると二つのコードが存在するのは歴史的な理由によるそうです。 「ISO 639-2 の開発が始まった時点で、既に30年以上に渡って文献検索システムで 使われてきた3文字コードと、ISO 639 の2文字コード(今の ISO 639-1、 カバー範囲は3文字コードより遥かに狭い)とが存在していた。そして、 ある関係者からは、既に2文字コードリストに登録されている言語の3文字コードは 一般に同じ2文字を共有したいという要望が出されていた。調べてみると、 元となる言語名の表現形式が違うため、22の言語において、 既存の3文字コードと2文字コードとがかけ離れていることが判明。 これらの言語に新しい3文字コードを付与すると、数百万件単位のレコードを持つ 既存システムへの影響が甚大なので、これらの言語には二つのコードを付与する ことにした。両コードは同義語扱いで重複はない」とのことです。

以下の22言語が該当します。
A2A3 言語名コメント
A3TA3B 英語仏語日本語
bobodtib Tibetantibétainチベット語 bo は Bodskad (あるいは Bhotia) から。 主に中国の西蔵自治区、インドのシッキム州で。
cscescze Czechtchèqueチェコ語 cs は čeština から。 cestina の c と s の上に付く v 字に似たアクセント符号は caron という。 英語チェコ語辞書参照。 表示するには文字セット Latin2 が必要。
cycymwel Welshgalloisウェールズ語 cy は Cymraeg から。ケルト系。主にイギリスのウェールズで。 cf. Evariste Galois
dedeuger Germanallemandドイツ語 de は Deutsch から。
elellgre Modern Greekgrec moderneギリシャ語 el は Ellinika (ελληνικα') から。 英語にも Hellenic という語がある。 「古代から現代へ」参照。
eueusbaq Basquebasqueバスク語 eu は Euskara から。
fafasper Persianpersanペルシャ語 fa は Farsi から。 ビルマよりずっと前の1935年に国号変更(ペルシャ→イラン)したが、 「ペルシャ語」という言葉は残った。Ethnologue は ISO の fa を Western Farsi、アフガニスタンでパシュトゥ語 (ps) の次に多く話されている ダリ語 (Dari) を Eastern Farsi と呼んでいる。
frfrafre Frenchfrançaisフランス語 A3B と A2 が「かけ離れている」とは思えません。 A3B の頭2文字が A2 になっているのに A3T があるのはこの言語だけ。
hrhrvscr Croatiancroateクロアチア語 hr は Hrvatski から。
hyhyearm Armenianarménienアルメニア語 hy は Hayeren から。印欧語族アルメニア系。独自文字を持つ。 コーカサス三国の一つ。
isislice Icelandicislandaisアイスランド語 is は Islenzk から。 アイスランド語で氷は ís なので英語は意訳したようです。仏語では glace。
kakatgeo Georgiangéorgienグルジア語 ka は Kartuli から。コーカサス語族カルトベリ系。独自文字を持つ。 コーカサス三国の一つ。
mimrimao Maorimaoriマオリ語 mi は Maori の頭と尻尾を取った?
mkmkdmac Macedonianmacédonienマケドニア語 mk は Makedonski (Македонски) から。
msmsamay Malaymalaisマレー語 ms は Bahasa Malaysia から。Bahasa は言語の意。
mymyabur Burmesebirmanビルマ語 my は Myanmasa から。1989年に現政権が英語国名を変更し、 ISO 3166-1 でも Myanmar (MM /MMR) となっていますが、 ビルマの人は昔から自国をミャンマーとも呼んでいたそうです。 「ミャンマー」は普及したと思いますが言語名の変更には至らないようです。
nl nlddut Dutchnéerlandaisオランダ語 nl は Nederlands から。 英語にも Netherlands, Holland という単語があるが、 これらは地方または国を指し、言語、国民は Dutch。 Ethnologue によると The name 'Dutch' is resented by some speakers.
Flemishflamandフランドル語 ベルギーでは Vlaams といい、主に West Vlaanderen 州で話されている言語を指す。ISO が nl で括ったのはやや無理。 20世紀末の時点でベルギーの話者数は、 オランダ語:約460万、フランス語:約400万、フランドル語:約100万。 *1
roronrum Romanianroumainルーマニア語 rum は Rumanian から。 インターネット上は Romanian の方が流通しているようです。
skslkslo Slovakslovaqueスロバック語 「歴史的な理由」の典型。
sqsqialb Albanianalbanaisアルバニア語 sq は Shqip から。
srsrpscc Serbianserbeセルビア語 srp は Srpski から。scc は…から。
zhzhochi Chinesechinois中国語 zh は Zhongwen (中文の音訳、中:zhong1 + 文:wen2) から。 *2
(*1) フランドルは、 北海/ドーバー海峡沿いの、オランダ南西部、ベルギー北西部、 フランス北部を含む地方。 バロック (Baroque) の巨匠ルーベンス (Rubens, 1577-1640)はこの地の出。 さらに、フランドルは Flanders の仏語読みで、英語読みだとフランダース。 1872年にイギリスの女流作家デ・ラ・ラメー (de la Ramee, 1839〜1908) が著した 「フランダースの犬」は テレビアニメでも有名。
(*2) 現在、方言も含めて zh で括られていますので、 中国固有の言語でコードが登録されているのは、満州語 (mnc)、チベット語 (bo)、 およびいずれも1989年に iu とともに A2 が追加された ウイグル語 (ug) とチワン語 (za)、 2002年に A2 と A3 が追加された四川省の彝語 (ii) くらい。 「中国の言語と文字」参照。 なお、ch は Chamorro [chamorro]、国コードの CH は スイスなので注意。

A2 が特徴的

A3 は英語名の自然な省略形なのですが、A2 が特徴的です。
A2A3 言語名コメント
英語仏語日本語
esspa Spanishespagnolスペイン語 es は español から。
Castiliancastillan- スペイン語の別名。カステラの語源。*1
ffful Fulahpeulフラ語 ff は Fulfulde から。1999年に A2 追加。Niger-Congo 語族。 セネガル、ギニア、ナイジェリア、ニジェールなど ギニア湾岸からサハラ砂漠まで。*2
hzher Hererohereroヘレロ語 hz は … から。2000年に A2 追加。Niger-Congo 語族。 主にナミビアの一部で。
kjkua Kuanyamakuanyama- kj は Kwanjama から。2000年に A2 追加。Niger-Congo 語族。 アンゴラの一部で。本言語名はまだカタカナに音訳されていないようです。
Kwanyamakwanyama-
kvkom Komikomコミ語 kv は … から。2000年に A2 追加。ウラル語族 Finno-Ugric 系。 主にロシアの一部で。Ethnologue はさらに Komi-Zyrian と Komi-Permyak に分類。
kwcor Cornishcornique コーンウォール語 kw は Kernewek, Kernowek から。1998年に A2 追加。 ケルト系。イングランド南西部の Duchy of Cornwall で。 第一言語としては 1777年に一旦途絶えたが復活。 現在では20才以下の住民の一部が第一言語としている。
kykir Kirghizkirghizeキルギス語 ky は Kyrgyz (Кыргыз) から。国名は Kyrgyzstan (Кыргызстан)(KG /KGZ)
ndnde North Ndebelendébélé du Nord ンデベレ語nd は Ndebele から。2000年に A2 追加。 Niger-Congo 語族。主にジンバブエの一部で。
nrnbl South Ndebelendébélé du Sud nr は Nrebele から。2000年に A2 追加。 Niger-Congo 語族。主に南アフリカのごく一部で。
svswe Swedishsuédoisスウェーデン語 sv は Svenska から。
tytah Tahitiantahitienタヒチ語 ty は … から。2000年に A2 追加。 Eastern Malayo-Polynesian 系。「国コード例外」参照。
(*1) カステラを製出した Castilla はスペインの一地方ですが、 そのポルトガル音が先に日本に入り、日本人には「カステーラ」と聞こえたので、 カステラはポルトガル語ということになっています。 スペイン語では「カスティーリャ」と発音します。現在は首都 Madrid を挟んで、北の Castilla Y León 州、南の Castilla-la Mancha 州に分かれています。 La Mancha はミュージカルや映画の「ラ・マンチャの男」で有名。 原作はセルバンテス (Cervantes, 1547-1616)の「ドンキホーテ」(Don Quixote)。
(*2) インターネットで「フラ」を検索するとフラダンス (hula dance, ハワイの民族舞踊)と フランス語 (French, 印欧語族イタリック系の言語)が多くヒットしますが、 「西アフリカの民族」で遊牧民族として紹介されていました。

A2 も A3 も特徴的

A2A3 言語名コメント
英語仏語日本語
fyfry Western Frisianfrison occidental 西フリジア語 fy は Frysk から。ゲルマン系。主にオランダ北部の Fryslân (Friesland) 州で。沿岸に広がる西フリージア諸島含む。
gagle Irishirlandaisアイルランド語 ga は Gaelic, Gaeilge から。 gle の e は Eireann から。Eire (エール : 1937-1949) はアイルランドの旧称。 ケルト系。cf. Erse
gdgla Gaelicgaéliqueゲール語 gd は Gàidhlig から。gla の a は Alba (アルバ王国)から。 ケルト系。主にイギリスのスコットランドで。
Scottish Gaelicgaélique écossais スコットランド・ゲール語
gvglv Manxmanxoisマン島語 g は Gaelg, Gailck から。v は Vannin から。ケルト系。 Ethnologue は死語と位置付けている。 「国コード例外」参照。
mannois
ikipk Inupiaqinupiaqイヌピアック語 ik は … から。アラスカ州北部および北西部で話されているイヌイット語。 「極北の語族」参照。
lglug Gandagandaルガンダ語 lg は Luganda から。1999年に A2 追加。Niger-Congo 語族。主にウガンダで。
scsrd Sardiniansardeサルデーニャ語 sc は … から。2000年に A2 追加。イタリック系。 イタリアのサルデーニャ島で。
sesme Northern Samisami du Nordサミ語 se は Same から ? 2000年に A3 追加。Uralic, Finno-Ugric。 主にノルウェーで。Ethnologue によると The name 'Lapp' is derogatory.
ssssw Swatiswatiシスワティ語 ss は Siswati から。Swazi とも。Niger-Congo 語族。 主にスワジランド、南アフリカで。
tgtgk Tajiktadjikタジキスタン語 tg は … から。 Таджик の音訳は Tadzhik ?

元語が意外

A2, A3 とも英語名の自然な省略形なのですが、元語が意外でした。
A2A3 言語名コメント
英語仏語日本語
dvdiv Divehimaldivienディベヒ語 1999年に A2 追加。モルディブ共和国(イスラム系)の公用語。 言語はシンハラ語(インド系、スリランカで話されている)に近いが、 右から左へ綴る独自文字を持つ。ディベヒは島民の意。 英語がこの語を言語名に採用したのは、 英国が、19世紀半ばから20世紀半ばまで同国を保護したからでしょう。
klkal Kalaallisut-- グリーンランドに住む人々の言葉。 島民 (といっても地球上最大の島) は自分たちが住んでいるところを Kalaallit Nunaat という。Kalaallit はグリーンランドに住む人を意味する kalaaleq の複数形、Nunaat は国。 極北の語族」参照。
Greenlandicgroenlandaisグリーンランド語
nynya Chichewachichewaチチェワ語 2000年に A2 追加。Niger-Congo 語族。マラウイ (Malawi) ではチェワ語、サンビアではニャンジャ語。チチェワ語はチェワ語の別名。 20世紀末の時点でマラウイに約400万、ザンビアに約100万、 世界合計で約600万の話者。
Chewachewaチェワ語
Nyanjanyanjaニャンジャ語
zazha Zhuangzhuang- 1989年に iu, ug とともに A2 が追加された。 主に中国の広西壮族自治区で。壮(僮):zhuang4
Chuangchuangチワン語

引用者の覚書 ?

少なくとも最新の ISO 639-2 の一覧表には載っていないのですが、 旧版には載っていたかもしれない、 あるいは、一覧表の引用者が覚書として付け加えたのかもしれない、 一言の注記がいくつかあります。
A2A3 言語名コメント
英語仏語日本語
bnben Bengalibengaliベンガル語 A2 は Bangla の略とも取れます。 主にインドのウェスト・ベンガル州とバングラデシュで。 ウェスト・ベンガル州議会で州名変更案が可決されていますので、 一覧表に ; Bangla と加筆される日が来るかもしれません。
iuiku Inuktitutinuktitutイヌイット語(カナダ) 1989年に ug, za とともに A2 が追加された。 (Eskimo) と注記されることがありますが、語族という意味合いなのでしょう。 「極北の語族」参照。
lvlav Latvianlettonラトビア語 Lettish ともいう。これは珍しいです。 「英語言語名の語尾」参照。
omorm Oromogallaオロモ語 (Afan) Oromo と注記されることがあります。 主にエチオピアの一部で。 オロモ語で afaan に 口とか言葉という意味があるそうです。 afan と afaan は音訳の差でしょう。
pspus Pushtopachtoパシュトゥ語 Pashto, Pashtu などと音訳されることもある。 主にアフガニスタンやパキスタン北西部で。1936年からアフガニスタンの公用語。
rmroh Raeto-Romancerhéto-romanレト・ロマンス語 英語で Rhaeto-Romance と綴られることが多いようです。 イタリック系。主にスイスの一部で。roh は Romansch, Romansh, Romanche から。 レト・ロマンス語では rumantsch。 cf. 仏語 rhétorique : 修辞学、 Rhétie : 古代ローマの一地方、現在のスイス東部。

マイナー ?

ここから先は言語名および国名は英語だけにします。
以下の言語は ( ) 付きでリストに登録されています。A3B のベースとなった MCLL (「語族、系、諸語」参照) でも、 言語としては別だが適当な名前がない場合、修飾語ではなく ( ) を付けて区別することがありますので、それを引き継いでいるケースと、 あまり知られていない言語なので、ISO が地名または語族名をメモしたケースが 考えられます。
A2A3 言語名メモコメント
-btkBatak(Indonesia) バタク語。Western Malayo-Polynesian 系。インドネシアのスマトラ島で。 独自の文字を持つ。話者数 : 約 580万 (1991)
-denSlave(Athapascan) スレーブ語。Athapascan 諸語。 den は Dené から。話者数 : 約 3,000 (1998)
-luoLuo(Kenya and Tanzania) ルオ語。Nilo-Saharan 語族。ケニアの Nyanza 地方と、タンザニアの一部で。 話者数 : 約 340万 (1987)
toton Tonga(Tonga Islands) 別の言語に同じ名前を付けてしまったので、この場合 ( ) は必須。 Eastern Malayo-Polynesian 系。南太平洋のトンガ王国で。 話者数 : 約10万 (1987)
-tog(Nyasa) Niger-Congo 語族。マラウイ共和国の一部で。 話者数 : 約 22万 (1993)。Nyasa 語とも。 Nyasa はアフリカの大地溝帯 (the Great Rift Valley) の南端に位置する湖 (アフリカ大陸で3番目に大きい、南端から Shire 川が流れ出てザンベジ川に合流) の英語名。マラウイではマラウイ湖と呼ぶ。

古代から現代へ

学術目的もありますので、ISO 639 には、現用でない言語 (文献のみある、 使われてはいるが宗教的ないし儀式的な場面に限られる) も登録されています。 登録されている言語で A2 のあるものは、 サンスクリット語 (sa)、パーリ語 (pi)、ラテン語 (la) くらいと思います。 A3 になると、コプト語 (Coptic)(cop)、ゴート語 (Gothic)(got)、 ヒッタイト語 (Hittite)(hit) など、くらいしか知りません。 そこで当面リストに年代情報付きで登録されてる言語を集めてみました。 具体的な年代が記されているということは、その頃に、後生の人をして別のコードを 付与せしめるほどの言語の変化があったと考えられますが、 分かるところだけ歴史の教科書から引用しました。
A2A3言語名 年代*1コメント
-egyEgyptian(Ancient) 現代のエジプトはアラビア語。
-grcGreek,Ancient (to 1453) この年、オスマン・トルコがコンスタンティノープルの攻略に成功し、 一千余年間にわたり東に雄飛した東ローマ帝国(ビザンティン帝国)を滅亡させた。 オスマン・トルコは異教徒に対し比較的寛大で、ギリシャ文化は生気を取り戻した。
elgre/ell,Modern(1453-) もちろん現用。
-dumDutch, Middle (ca. 1050-1350)-
-angEnglish,Old (ca.450-1100)-
-enm,Middle(1100-1500)-
-gohGerman ,Old High (ca.750-1050)-
-gmh,Middle High (ca.1050-1500)-
-sgaIrish,Old (to 900) -
-mga,Middle(900-1200) -
-froFrench,Old (842-ca.1400) 起点の842年は その年に書かれた Les Serments de Strasbourg が現存する Old French 最古の文章だから。 翌843年にはフランク王国が三分裂し、後の伊・独・仏の基が作られた。
-frm,Middle (ca.1400-1600)-
-proProvençal, Old(to 1500) -
ocociOccitan; Provençal (post 1500) イタリック系。主にフランス南部。
-otaTurkish, Ottoman (1500-1928) オスマン・トルコ (1299-1922) の最盛期(16世紀)からトルコ革命まで。 トルコ語は、1928年にアラビア文字を廃止し、ラテン文字に切り替えた。
-peoPersian, Old (ca. 600-400 B.C.) -
-nonNorse, Old- Old Icelandic (to 1550), Old Norwegian (to 1350)
-chuChurch Slavic- chu は、他に Church Slavonic, Old Slavonic, Old Church Slavonic, Old Bulgarian という名前でも登録されている。
(*1) ca. はラテン語の circa の略。about の意。

語族、系、諸語

A3 コードは A2 を包含し、幅広い言語を扱っています。 コード数を数えたところ 449 個 ありました。 中には言語の集合体 (collective language) のコードも含まれます。これは、 新たにコード (individual code) を割り当てる基準を満たさない言語の分類に使われ、 リスト中、"languages" または "(Other)" という語で示され、 A3 だけに存在します。

individual code を持たない言語は、ISO 639-2 に登録されている言語とともに、 the MARC Code List for Languages (以下 MCLL と略記) に掲載されています。 ISO のリストはコードと名前の対応表ですが、MCLL は簡単な構造と付加情報を 含んでいます。例えば、言語の別名とか。 individual code を持たない言語を どの集合体に分類したかという情報も提供しています。しかし、individual code を 持つ言語までは分類していませんので、系統樹を作ることはできません。

現在 MCLL には、1979個 (別名を含めると4000個以上) の言語が登録されています。 ですので、MCLL の約 23% が ISO 639-2 に登録され, さらにその約 40% が ISO 639-1 に登録されている勘定です。 ISO 639-2 はコードを割り当てたが、 MCLL では別名扱いまたは集合体の一要素扱いになっている言語が15個ほどありますが、 見解の相違でしょう。

言語の集合体の一覧を以下に示します (「語族」では地図と対応させました)。 表の * 欄は、L : languages、O : (Other) を意味します。 太字は語族です。語族(および分類)は他にも George Boeree's Language Pages, the Homepage of Arjen and Nandita, L'aménagement linguistique dans le monde, Ethnologue, Yamada Language Center, the LINGUIST List などで各種紹介されています。語族は英語で、a language family, a family of languages, a phylum (生物学では動植物の最上位の分類を意味し 「門」と訳される) などといい、その分類は学説に依存します。
A3 言語の集合体名* 系列地域コメント
afaAfro-AsiaticO アフロ・アジア語族アフリカ北部からアラビア半島-
algAlgonquianL 北米の語族北米 Abnaki などがここに属す。
apaApacheL Na-Dene 語族 Athapascan 系 アパッチ諸語北米-
athAthapascanL Na-Dene 語族の系北米 アパッチ諸語やナバホ語 (nv /nav) を含む。Athabascan とも綴られる。語源は クリー語 (Cree (cr /cre), Algonquian 語族、カナダ中央部の先住民の言葉) で 「疎らな草々」を意味する athapaskaaw。
ausAustralianL オーストラリア語族オーストラリア-
baiBamilekeL Niger-Congo 語族の系カメルーン-
batBalticO 印欧語族バルト系バルト海周辺-
berBerberO Afro-Asiatic 語族の系アフリカ北部-
bntBantuO Niger-Congo 語族の系アフリカ赤道周辺-
caiCentral
American Indian
O 中米インディアン諸語-
cauCaucasianO コーカサス語族コーカサス地方-
celCelticO 印欧語族ケルト系アイルランド島周辺-
cmcChamicL オーストロネシア語族チャム諸語中国、ベトナム、カンボジア ヴェトナム中南部少数民族
cusCushiticO Afro-Asiatic 語族の系アフリカの角-
draDravidianO ドラビダ語族インド南部 Kannada (kn /kan), Tamil (ta /tam), Malayalam (ma /mal), Telugu (te /tel) 以外。
fiuFinno-UgrianO ウラル語族の系 フィンランドからロシア北西部(ウラル山脈の東側)、ハンガリー Finno-Ugric とも
gemGermanicO 印欧語族ゲルマン系ドイツからイギリス、北欧 チュートン系 (Teutonic) とも。 Old Frisian などがここに属す。
incIndicO 印欧語族インド系インド北部 少なくとも、インド憲法に掲載されている言語はコードを持っています。 「インド周辺の言語と文字」参照。
ineIndo-EuropeanO 印欧語族インドからヨーロッパ-
iraIranianO印欧語族イラン系 イラン周辺-
iroIroquoianL北米北米 -
khiKhoisanO コイサン語族アフリカ南部-
mapAustronesianO オーストロネシア語族太平洋からインド洋 アウストロネシア語族とも。インドネシア、フィリピン、ニュージーランド、 台湾、マダガスカル島も含む
mkhMon-KhmerO Austro-Asiatic 語族モンクメール系南アジア-
mnoManoboL オーストロネシア語族の系フィリピン南部-
munMundaL Austro-Asiatic 語族の系インド-
mynMayanL マヤ諸語中米(メキシコ、ガテマラなど)-
naiNorth
American Indian
O 北米インディアン諸語-
nicNiger-KordofanianO ニジェール・コルドファン語族アフリカ中央部 Ethnologue の Niger-Congo 語族と同義と思われます。 Ethnologue は Kordofanian (主にスーダン) を系と捉えている。
nubNubianL Nilo-Saharan 語族の系スーダン-
otoOtomianL 中米メキシコ-
paaPapuanO パプア諸語ニューギニア島とその周辺 Ethnologue は、West Papuan (インドネシアのイリアン・ジャヤ州と マルク(Maluku, 旧モルッカ)諸島) と East Papuan (パプアニューギニアとソロモン諸島) を2つの語族として扱っている。 まとめて (かつ今は消滅したタスマニア諸語と併せて) Indo-Pacific 語族と する分類もある。
phiPhilippineO オーストロネシア語族フィリピン諸語 フィリピン-
praPrakritL 印欧語族インド系プラークリット諸語インド サンスクリット語が文語・雅語とすればプラークリット諸語は口語・俗語。 パーリ語より古く 300 B.C. - 400 A.D. 頃の言語と推定されている。
roaRomanceO 印欧語族イタリック系西欧 ロマンス諸語
saiSouth
American Indian
O 南米インディアン諸語-
salSalishanL 北米北米-
semSemiticO Afro-Asiatic 語族セム系 アフリカ北部からアラビア半島-
sioSiouanL 北米北米-
sitSino-TibetanO シナ・チベット語族中国からビルマ-
slaSlavicO 印欧語族スラブ系ロシア西部からバルカン半島-
smiSamiOL ウラル語族 Finno-Ugric 系サミ諸語北欧、バルト海周辺 se/sme : Northern Sami, --/sma : Southern Sami, --/smn : Inari Sami, --/smj : Lule Sami, --/sms : Skolt Sami 以外の サミ語。
ssaNilo-SaharanO ナイル・サハラ語族アフリカ中央部 ハム語族 (Hamitic) とも
taiTaiO Tai-Kadai 語族の系南アジア-
tupTupiL 南米ブラジル-
tutAltaicO アルタイ語族 ロシア中央から極東-
wakWakashanL 北米北米-
wenSorbianL 印欧語族スラブ系の系ドイツ-
ypkYupikL Eskimo-Aleut 語族ユピック諸語アラスカからシベリア 極北の語族」参照。

特殊な言語、分類

「言語」の定義は難しいですが、 少なくとも、ISO 639 はプログラミング言語は扱っていません。 表の * 欄は、L : languages, O : (Other), i : individual code を意味します。
A2A3 (言語)名*コメント
-art Artificial*1 O その他の人工言語。現在の MCLL では Ande, Babm, Enochian, Glosa, Ido,*2 International auxiliari linguo (INTAL), Loglan, Neo, Novial, Tsolyáni が相当。
eo epo Esperantoi 人工言語。エスペラント。1872年から1885年にかけてポーランドの ワルシャワ (Warsaw (en), Warszawa (po)) で L.L. Zamenhof が開発。 約115か国に約200万の話者 (1999年)。 日本エスペラント学会もある。
io ido Ido i 人工言語。イードー。エスペラントをいっそう簡易化した国際補助語。
vo vol Volapüki 人工言語(の古典)。1880年にドイツのバーデン (Baden) で Johann Martin Schleyer がプロジェクトを立ち上げた。
-ile Interlinguei 人工言語。自然言語風。1922年にエストニアの Edgar de Wahl が開発。 "Occidental" とも。 oiscodli に関連情報。
ia ina Interlingua*3 i人工言語。ラテン語風。 1950年頃に Alexander Gode が開発し、 International Auxiliary Language Association (IALA) が出版。 Interlingua-English に関連情報。
-afh Afrihilii 人工言語。アフリカ大陸の国際補助語 (IAL)。 K. A. Kumi Attobrah 著 " Ni Afrihili Oluga: The African Continental Language" (1973) 参照 (絶版 ?)。
-crp Creoles and pidginsO クレオール語は二つの言語社会(通常一方はヨーロッパ)が 交流した結果発生した言語。両言語の性質を取り込み、 クレオール語を母国語とする人々もいる。
ピジン語は二つ以上の言語要素からなる交易目的の言葉。 ピジン語を母国語とする人はいない。中国人が発音した`business'が語源とされる。
cpe, English-based
cpf, French-based
cpp, Portuguese-based
bibis Bislamai クレオール語。英語ベース。バヌアツで。
hohmo Hiri Motui ピジン語。モツ語 (Motu) ベース。パプアニューギニアで。 2000年に A2 追加。
-tpi Tok Pisini クレオール語。英語ベース。メラネシア(パプアニューギニア周辺)。
-mis MiscellaneousL 系統不明な諸言語。現在の MCLL では Ainu (アイヌ語), Andamanese, Burushaski, Chukchi, Etruscan (エトルリア語)*4, Gilyak, Hattic, Hurrian (Mitani, Subarian), Iberian, Indus script, Kamchadal (Itelmes), Ket (Yenisei-Ostiak), Koryak, Nancowry, Nenets, Nganasan, Nicobarese, Palan, Yugh, Yukaghir が相当。
-sgn SignL 身振り、手振り、表情など、会話や文字によらない意思伝達方法。 現在の MCLL では American Sign Language, Australasian Signed English, British Sign Language が相当。
-mul MultipleL 複数の collective language に属する言語 ? 現在、MCLL には該当する言語はありません。
-qaa -- コードのユーザーが自由に使ってよい。
|
qtz
-und Undetermined- 言語を特定できないときに使う。
-### Blanks- その言語による文書も音声も残っていないときに使う。
(*1) James Chandler さんのページが詳しい。 他に、Ethnologue は、ブリュッセルの EU ビル内で EU メンバーが使っている、 いくつかのヨーロッパ主要言語の要素を寄せ集めた言語も、 Europanto として人工言語に分類しています。 また、文献の量が登録基準を満たしていないかもしれませんが、 オリジナルな文字で綴られた ヴォイニッチ手稿 が解読されたらここ分類されるのかもしれません。さらに、テレビや映画の Star Trek に登場する クリンゴン語 も分類するとしたらここでしょう。 (2004年に A3 を取得。tlh: Klingon; tlhIngan-Hol)
(*2) 言語 Ido に関して、ISO は individual code を割り当て、 MCLL は Artificial (Other) 扱いです。これは MCLL が Ido とは別に "Ido (African)" を Ijo の別名として扱っているからです。 Ethnologue によると Ijo は Niger-Congo 語族の語群で、 ナイジェリアに約177万の話者(1991年)。
(*3) Collins の辞書には、「1. (通常大文字始まりで) 英語とロマンス諸語に共通する語に基づく人工言語。 2. 一般に、自然言語の意味を表現するための人工言語。 機械翻訳の際の中間言語なども含む。(lingua はイタリア語、language の意)」 と説明されていますので、ISO の ia は IALA の Interlingua といえます。
(*4) エトルリア (Etruria) は 1000 - 500 B.C. 頃に現イタリアのトスカーナ地方に興った国。

拾遺集

各国語で各国名

下段は言語名です。
日本語 日本 アメリカイギリス オランダドイツ フランスイタリア スペインポルトガル
日本語 英語蘭語独語 仏語伊語西語葡語
英語 Japan United States United Kingdom NetherlandsGermany FranceItaly SpainPortugal
JapaneseEnglish DutchGerman FrenchItalian SpanishPortuguese
蘭語 Japan Verenigde StatenVerenigd Koninkrijk NederlandDuitsland FrankrijkItalië SpanjePortugal
JapansEngels NederlandsDuits FransItaliaans SpaansPortugees
独語 Japan Vereinigte Staaten Vereinigtes Königreich NiederlandenDeutschland FrankreichItalien SpanienPortugal
JapanischEnglisch NiederländischDeutsch FranzösischItalienisch SpanischPortugiesisch
仏語 Japon États-UnisRoyaume-Uni Pays-BasAllemagne FranceItalie EspagnePortugal
japonaisanglais néerlandaisallemand françaisitalien espagnolportugais
伊語 Japón Stati UnitiRegno Unito Paesi BassiGermania FranciaItalia SpagnaPortogallo
giapponeseinglese olandesetedesco franceseitaliano spagnoloportoghese
西語 Japón Estados UnidosReino Unido Países BajosAlemania FranciaItalia EspañaPortugal
japonésinglés holandésalemán francésitaliano español; castellanoportugués
葡語 Japão Estados UnidosReino Unido Países BaixosAlemanha FrançaItália EspanhaPortugal
japonêsinglês holandêsalemão francêsitaliano espanholportuguês

英語言語名の語尾

言語名(≒民族名)は、通常、その言語が主に話されている国または地域の 名前の末尾を変化させて作られますが、変化のさせ方には一定の傾向があり、 語呂のいいものが一つだけ選ばれています。 A2 を持つ言語を英語名の末尾2文字で分類すると
〜an〜sh〜se〜ic 〜ri,〜li〜ga,〜da,〜chその他
4117137 各5各43以下
末尾3文字で分類すると
〜ian〜ish〜ese 〜ali, 〜nga〜ama,〜nda,〜tanその他
301513 各4各32以下

極北の語族

Ethnologue によるエスキモー・アリュート(アレウト) (Eskimo-Aleut) 語族の分類 を紹介します。
Ethnologue 言語名国名話者数 A2A3ISO 言語名
AleutUSA305人(1995年) -aleAleut
EskimoInuit Eastern Canadian Inuktitut Canada14,000人(1991年) iuiku Inuktitut
Western Canadian Inuktitut4,000人(1981年)
Greenlandic Inuktitut Greenland40,000人(1990年) klkal Kalaallisut; Greenlandic
North Alaskan Inupiatun USA3,500人(1990年) ikipk Inupiaq
Northwest Alaska Inupiatun4,000人(1978年)
YupikAlaskan Pacific Gulf Yupik400人(1995年) -ypk Yupik languages
Central Yupik10,000人(1995年)
Siberian Central Siberian Yupik808人(1990年)
Naukan YupikRussia100人(1991年)
Sirenik Yupik1人(1995年)

この分類によると、1989年に A2 が登録されたイヌイット語(カナダ) (iu) と、 以前から A2 も登録されてたイヌピアック語 (ik) とグリーンランド語 (kl) を 併せてイヌイット系言語といい、これとは別系列にユピック系言語 (ypk) が存在し、 両系の上位系列がエスキモー系です。さらに、アリューシャン列島の言語 (ale)と 併せてエスキモー・アリュート語族を形成しています。

また、いくつかの語は The Collins English Dictionary (c) 1998 HarperCollins Publishers から抄訳を試みました。

アリュート (Aleut) n.
1. アリューシャン列島または南西アラスカに住む人。 2. その話す言葉。[語源はロシア語のアリュート、おそらく 「チュコト (Chukchi or Chukots) 半島 (訳者注 : シベリアの最東端、アラスカとはベーリング海峡を挟む)に端を発す」の意]
エスキモー (Eskimo) n.
1. ( pl. -mos or -mo.) 北カナダ、グリーンランド、アラスカ、東シベリアに住む人。 極寒(ごっかん)の気候に適応した物質文化を持つ。 2. その話す言葉。 3. エスキモーとアリュートを含む語族。 adj. 4. エスキモー的。 [かつては Esquimau と綴った。 Abnaki の言葉で「生の肉を食う人」を意味する esquimantsic に由来する Esquimawes が語源] (訳者注: 別の説もある) 使い方:多くの人はこの語は offensive と考えており、 北米ではしばしばイヌイットという語が使われる。
アブナーキ (Abnaki) n.
1. ( pl. -ki or -kis.) かつてメイン州およびケベック州に住んでいた北米インディアン。 2. その話す言葉。Algonquian 語族 (alg) に属す。
イヌイット (Inuit or Innuit) n., pl. -it or -its
北米またはグリーンランドに住んでいるエスキモー。 アジアやアリューシャン列島からのエスキモーとは区別される。 カナダのエスキモーの総称。 [語源はエスキモー語で人を意味する inuk の複数形。すなわち人々の意]
インクティテュット (Inuktitut) n.
Canadian. イヌイット語; Eskimo. [エスキモー語で inuk (人) + titut (話)]
ユピック (Yupik) n.
アラスカまたはアジアのエスキモー。

南極と孤島

UNSD は「本サイトで用いている名称や表現は、 いかなる国、領土、都市、地域またはそこの当局の法的状態、または そこの領有や国境の決定に関しても、いかなる事務局側の意見の表明をも意味しない。 また、国や地域の区分けは、統計的な利便性を目的とするものであって、 国々や地域の政治的または他の同盟関係に関して、 いかなる国連の憶測をも意味しない」と慎重に言葉を選んでいます。 したがって、国コード等のリストのカバーする範囲が、 ISO 3166/MA のリストのそれとは若干異なる場合があります。
Various datasets may or may not include coverage of outlying and overseas areas, depending on the type of data and source.
リストのバージョンの違いも考えられますが、 以下の1大陸と8島がこの may not include に相当するとみていいでしょう。 つまり UNSD のリストには含まれていません。 居住ではなく、観光、調査・研究または軍事目的等で使われている地域と思われます。
A2地域名帰属 地図 (別窓に表示)コメント
AQ Antarctica- (Political) 2001 (223K) 南極大陸 (地図は Antarctic Region)。
CX Christmas IslandAU (Small Map) 2002 (5K) インド洋ジャワ海溝 (Java Trench) 周辺。
CC Cocos (Keeling) Islands (Small Map) 2002 (6K) インド洋、クリスマス島のさらに西。1609年 Keeling さんが 先に島を見付けたが、Cocos さんの名が先に(手書きの)地図に記された。
HM Heard Island and Mcdonald Islands (Shaded Relief) 1976 (64K) 南極に近いインド洋
TF French Southern TerritoriesFR (Small Map) 2002 (4K) 南極に近いインド洋。
BV Bouvet IslandNO (Small Map) 2002 (5K) 南極に近い南大西洋。
GS South Georgia and the South Sandwich Islands GB (Small Map) 2002 (7K) 南極に近い南大西洋。
IO British Indian Ocean Territory (Small Map) 2002 (6K) インド洋中央のチャゴス群島 (Chagos Archipelago) を指す。 ディエゴ・ガルシア (Diego Garcia) 島含む。
UM United States Minor Outlying IslandsUS Minor Outlying Islands とは漠然とした表現ですが、 ハワイ諸島は ハワイ州、アリューシャン列島は アラスカ州、 米サモア (AS)、北マリアナ諸島 (MP)、プエルト・リコ (PR)、 グアム (GU)、米バージン諸島 (VI)はコードが割り当てられていますので、 結局、 カリブ海の Navassa 島と 太平洋の Baker 島、Howland 島、Jarvis 島、Johnston 環礁、Kingman リーフ、 Midway 諸島、Palmyra 環礁、Wake 島などを指すことになります。

国コード例外

ISO, UNSD, IANA 三者の国コードリストには微妙な違いがあります。例えば、 チャネル諸島とマン島は、ISO 3166/MA のリストには掲載されていないのですが、 UNSD のリストには掲載されていて数字コードのみが付与されており、 IANA からは ccTLD が割り当てられています。 また、IANA は 原則として ISO 3166-1 の A2 に基づいて新しい ccTLD (国コードトップレベルドメイン) を割り当てる方針を採っており、2000年の パレスチナのケースを例に説明していますが、 イギリスと(結果的に)東ティモールは例外です。

主な例外は次の通りです。例外は主に 「予約コード」と 関係しています。
A2A3N3国または地域名帰属 ccTLD位置と地図 (別窓に表示) 「ISO コメント」その他
GBGBR826 United KingdomGB uk (Small Map) 2002 (24K)
グレート・ブリテン島とアイルランド島北部が英国本土だが、 周辺および大西洋、インド洋に島を領有する。

ガンジー島、ジャージー島は、 チャネル諸島 (Channel Islands*2)の主な島。 「チャネル」は英仏間のイギリス海峡 (English Channel) を指す。 東はドーバー海峡 (Dover Strait) から北海へ、西は大西洋へとつながる。 両島はイギリス側からこの順に連なるが、 むしろフランスのノルマンディー (Normandie) 半島に近い。

マン島はアイリッシュ海(イギリスとアイルランドの間)の島。
「Republic, Kingdom, United, Federal or Democratic は 非常にしばしば国名に使われるので曖昧さを避け GB とした。期せずして GB は 連合王国の国際車両識別記号、*1 すなわち、車に貼る楕円形の国籍ステッカーのコードにもなっている」
GGGGY831Guernsey gg 「これら ccTLD は、ISO が郵便業務に限定して予約したコードを、 ISO の制限に反して利用したものである。 公式な N3 はない。また、Channel Islands という名前には、 ISO が公式に割り当てたまたは予約したコードは存在しない」 なお、マン島には言語 (gv /glv) があります。
JEJEY832Jersey je
IMIMN833Isle of Man im
SH SHN 654Saint Helena ac (Small Map) 2002 (7K)
セントヘレナは、南大西洋の Saint Helena island (ナポレオンの終の栖(ついのすみか)となった島)、 Ascension (島、上昇とか即位の意)、Tristan da Cunha (群島) の総称。 それぞれは互いにかなり離れている。
ISO は郵便業務に限定して Ascension Island と Tristan da Cunha に コードを予約していますが、その一つが ccTLD に利用された恰好になっています。
EA-- Ceuta and MelillaES- (Political) 1982 (265K)
セウタ、メリーリャはモロッコ国内の飛び地。 特にセウタは大西洋と地中海を結ぶジブラルタル海峡のアフリカ側。 (逆にスペイン側のトラファルガー岬近くにイギリス領ジブラルタル)
カナリー諸島は西サハラ (EH) の沖合。
「これらの地域には公式なコードは存在しないが、コードの割り当てを正当化するに 足る関税制度上の特別な資格 (a particular customs status) を有する。 セウタ、メリーリャは合わせて一つの予約コードで識別され、また一つの予約コードが カナリー諸島に割り当てられた。A3, N3 は存在しない」
IC-- Canary Islands-
PFPYF258 French PolynesiaFR pf (Political) 1989 (190K)
フランス領ポリネシアは、赤道を境としてハワイとほぼ対称の位置にある 南太平洋の群島。
「タヒチは、それ自体がフランス領ポリネシアの一部を構成する 群島社会 (the Society Archipelago) の主要な島でなので PF に含められる」 なお、タヒチには言語 (ty /tah) があります。
GPGLP312 GuadeloupeFR gp (Small Map) 2002 (7K)
カリブ海の西インド諸島の一つの島の南北。 島の英語名は St. Martin (または St. Marten)。
「島北部はフランス領グアドループ島 (Guadeloupe) の一部で、 島南部はオランダ領アンティル諸島 (Netherlands Antilles) の一部、 と南北で宗主権 (sovereignty) が異なり、ISO の規格では、 どちらを対象とするかによってコードを使い分けることになる」
ANANT530 Netherlands AntillesNL an
TLTLS626 Timor-LesteTL tp (Shaded Relief) CIA 2002 (182K) 2002年に独立(旧ポルトガル領)。 現在 TP (East Timor) は過渡的予約状態になっていますので、 TL が発効する前に ccTLD が割り当てられたのでしょう。 公用語はテトゥン語 (tet) とポルトガル語 (po)。
(*1) 国連が決めています。 「国際車両識別記号」または 「 Where's That Vehicle Come From?」参照。 なお、2001年9月からは ユーロプレートでも OK。
(*2) しかし、海峡諸島というのも一般的な名前で、例えば、カリフォルニア州沿岸 サンタバーバラ海峡 (Santa Barbara Channel) の島々も Channel Islands と呼ばれ 国立公園に指定されています。