世界の文字 Top Languages Mathematics English
手元のエディタ*0で 世界のいろいろな文字を表示できましたので 若干の追加・修正(灰色文字)と説明を加え、 以下にまとめました。 エディタの表示をカット & ペーストでもってきましたので、 少なくともアクセント記号付きのラテン文字(ローマ字)を含む語には、 プロポーショナル・スペーシング(やリガチャやカーニング)は働いていません。

ラテン文字*1キリル文字(ロシア文字)、 ギリシャ文字、アラビア文字、ヘブライ文字、アムハラ文字、 デーバナーガリ文字(インド諸文字*2の1つ)、 タイ文字、ラオ文字、チベット文字、 CJK文字*3があります。

この他で有名な文字は、インド諸文字*2グルジア文字アルメニア文字、 ビルマ文字、クメール文字(カンボジア)、 モンゴル文字などです。

言語名 「こんにちは」相当の言葉備考
日本語で英語でその言語で
アムハラ語 Amharic Original name of Amharic Hello of Amharic アムハラ文字*4
アラビア語 Arabic العربية Hello of Arabic *5アラビア文字*6
チェコ語 Czech Original name of Czech Hello of Czech -
デンマーク語 Danish Dansk Hej, Goddag -
オランダ語 Dutch Nederlands Hallo, Dag -
Flemish Vlaams ベルギーのオランダ語
英語 English English Hello -
エスペラント語 Esperanto Esperanto Saluton 人工的な言語
エストニア語 Estonian Eesti Tere, Tervist -
FORTRAN FORTRAN FORTRAN PROGRAM プログラミング言語。自然言語ではありません。
フィンランド語 Finnish Suomi Hei -
フランス語 French Original name of French Bonjour, Salut -
ドイツ語 German Deutsch Nord Guten Tag 低地ドイツ語(北部)
Original name of German Hello of German 高地ドイツ語(南部)、標準ドイツ語
ギリシャ語 Greek Original name of Greek Hello of Greek -
ヘブライ語 Hebrew עברית Hello of Hebrew *5
ヒンディー語 Hindi हिन्दी Hello of Hindi , Hello of Hindi デーバナーガリ文字*2
イタリア語 Italian Italiano Ciao, Buon giorno -
ラオス語 Lao Original name of Lao Hello of Lao , Hello of Lao -
マルタ語 Maltese Malti Ciao 地中海の島国
ノルウェー語 Norwegian Norsk Hei, God dag -
ポーランド語 Polish Polski Hello of Polish , Hello of Polish , Hello of Polish -
ロシア語 Russian Original name of Russian Hello of Russian キリル文字
スロバキア語 Slovak Original name of Slovak Hello of Slovak -
スペイン語 Spanish Original name of Spanish Hello of Spanish -
スウェーデン語 Swedish Svenska Hej, Goddag -
タイ語 Thai Original name of Thai Hello of Thai , Hello of Thai -
チベット語 Tibetan Original name of Tibetan Hello of Tibetan -
ティグリニア語 Tigrigna Original name of Tigrigna Hello of Tigrigna *4
トルコ語 Turkish Original name of Turkish Merhaba -
ベトナム語 Vietnamese Original name of Vietnamese Hello of Vietnamese *7
ユーゴスラビア語 Yugoslavian - Zdravo 現セルビア語ではないようです。
日本語 Japanese Original name of Japanese Hello of Japanese , Hello of Japanese 漢字仮名 *3
中国語 Chinese Original name of Chinese , Original name of Chinese , Original name of Chinese Hello of Chinese 簡体字*3
広東語 Cantonese Original name of Cantonese , Original name of Cantonese Hello of Cantonese , Hello of Cantonese 繁体字(的)*3
朝鮮語 Korean Original name
  of Korean Hello of Korean , Hello of Korean ハングル*3
(*0) GNU Emacs 20.7.2 (i386-vine-linux-gnu, X toolkit) of Wed Jan 17 2001 on apollo.athome

Muleftpサーバーから フォントをダウンロードした後で、エディタのメニュー・バーから Mule - Show Script Examples (C-h h)を選ぶと

This is a list of ways to say hello in various languages.
Its purpose is to illustrate a number of scripts.
に続いて表示されます。
(*1) ラテン文字は世界中で使われています。 一部地域除くヨーロッパ、アフリカ。南北アメリカ、オセアニアのほぼ全土。 一口にアルファベット26文字といっても、 実際には言語ごとに文字が追加・削除されていたり、 アクセント記号類が付いたりして変化に富んでいます。 コンピュータで文字を表すにはコード化が必要ですが、 国際機関 ( ISO の iso-8859)、国 (アメリカの ASCII 、ロシアの KOI8-R 、日本の JIS など)、企業 ( マイクロソフト社 の Windows、 アップル社 の Macintosh) がそれぞれ規格を決めています。現在は、 これらの規格がサポートしていない文字を含めコードの統一を目指す Unicode (ISO 10646)が進行中です。 iso-8859 で言語を分類すると次のようになります。 「 各国の数値および金額の記数法」もご覧ください。
文字セットと言語
識別子 名前 ISOの認識 W3Cの調査結果
チボラロマンさん の
コメント
iso-8859-1Latin1 1987西欧言語 アフリカーンス語 (af), アルバニア語 (sq), バスク語 (eu), カタロニア語 (ca), デンマーク語 (da), オランダ語 (nl), 英語 (en), フェロー語 (fo), フィンランド語 (fi), フランス語 (fr), ガリシア語 (gl), ドイツ語 (de), アイスランド語 (is), アイルランド語 (ga), イタリア語 (it), ノルウェー語 (no), ポルトガル語 (pt), スコットランド語 (gd), スペイン語 (es), スウェーデン語 (sv). そして、グァラニー語 (gn)、レト・ロマンス語 (rm)、 北アフリカのアラビア語 (ar)、スワヒリ語 (sw)、 ズールー語 (zu) および ラテン B 拡張文字 を併用する他のバンツー諸語。
iso-8859-2Latin2 1987東欧言語 クロアチア語 (hr), チェック語 (cs), ハンガリー語 (hu), ポーランド語 (pl), ルーマニア語 (ro), セルビア語1 (sr), スロバック語 (sk), スロベニア語 (sl). および ソルビア語 (wen)。
iso-8859-3Latin3 1988他のラテン文字言語 エスペラント語 (eo), マルタ語 (mt). そして、1988年の Latin5 導入以前のトルコ語。
iso-8859-4Latin4 1988北欧言語 Latin6 にとって替わられた。 エストニア語 (et)、バルト諸語すなわちラトビア語 (lv, Lettish) と リトアニア語 (lt)、および、グリーンランド語 (kl) と ラップ語 (se)。
iso-8859-5非ラテン文字 1988キリル文字言語 ブルガリア語 (bg), ベラルーシ語 (be), ウクライナ語 (uk), セルビア語2 (sr), マケドニア語 (mk),ロシア語 (ru). 1990 年以前のハネアゲ付き g (Ґ, ґ, ghe with upturn) のないウクライナ語 (uk)。
iso-8859-6 1987アラビア文字言語 アラビア語 (ar). 残念ながらアラビア語 (ar) の基本文字のみで、 ペルシャ語 (fa) 用の4つの拡張文字、 パキスタンのウルドゥー語 (ur) 用の8つの拡張文字は含まれない。 また、この固定フォントはテキスト表示には向かない。
iso-8859-7 1987ギリシャ語 ギリシャ語 (el).
iso-8859-8 1988ヘブライ語 ヘブライ語 (he ← iw). および イディッシュ語 (yi ← ji).
iso-8859-9Latin5 1989トルコ語 トルコ語 (tr).
iso-8859-10Latin6 1992 イヌイット語 (kl, iu), ラップ語 (se). 全北欧地域をカバーするために Latin4 を再編成。 最後の失われつつあるイヌイット語 (グリーンランドのエスキモー語) と非スコルト系サミ語 (ラップ語)。 (cf. Skolt Saami)
iso-8859-11非ラテン文字 タイ語 (th).
iso-8859-12予約
iso-8859-13Latin7 ラトビア語 (lv), リトアニア語 (lt). バルト海沿岸地域 (Baltic Rim) をカバーし、 Latin6 のラトビア語 (lv) サポートを再確立。
iso-8859-14Latin8 最後のゲール語 (gd) とウェールズ語 (cy) の文字を Latin1 に追加し、 ケルト諸語をカバー。
iso-8859-15Latin9 エストニア語 (et).
(*2) インドには固有の文字がたくさんあります。 (⇒ インド紙幣)
場所語族特徴文字
北方印欧角張っている デーバナーガリ文字、ベンガル文字、グルムーキー文字、グジャラート文字、オリヤー文字
南方ドラビダ丸味を帯びている タミール文字、テルグー文字、カンナダ(カナリーズ)文字、マラヤラム文字
オリヤー文字(ベンガル湾沿い中部インドのオリッサで使われている)は、 例外的に丸みを帯びています。

また、スリランカの7割以上で話されているシンハラ語は、 孤立した印欧語族インド系で、シンハラ文字はドラビダ諸文字の系統です。

(*3) 中国、日本、朝鮮の文字をまとめて CJK 文字ということがあります。 他のアルファベット系の文字が高々102個なのに対し、 2桁以上多くの文字を持っています。コンピュータで 1 文字を表すのに 2 バイト必要なことから2バイト文字とも呼ばれます。 中国は漢字のみ、日本は漢字+仮名、朝鮮は原則的にハングルのみです。 また、漢字は表意文字、仮名は表音文字、ハングルは表意+表音文字です。

漢字は歴史が古く周辺の国々にも伝えられ、各国の事情に応じて字形が変化しました。 現在、日常的に漢字を使っているのは、中国と日本だけで、 ベトナムと朝鮮は漢字を捨て、それぞれ、ラテン文字、ハングルに切替えました。 以下に各国の漢字の違いを示します。
規格名漢字見本 文字数文字の内訳備考
GB spirits and development of GB 中国約 7500漢字(簡体字)中心 標準中国語(北京語)の文字
JIS spirits and development of JIS 日本約 7000漢字中心+仮名など 各種の追加規格あり(後述)
KSC spirits and development of KSC 韓国約 8300 ハングル約2300+漢字約5000+その他 漢字は補助的に使う(例えばex-の意味で「前」)
BIG5 spirits and development of BIG5 台湾約 13500漢字(繁体字)中心 広東語圏(香港、澳門など)でも 使われることがある。台湾には CNS という規格もある。

通常、漢字のJIS規格というと JIS X 0208 (6879字 = 第1水準:2965字 + 第2水準:3390字 + 非漢字:524字) を 指しますが、字が足りないというような理由で、

  • JIS X 0212(補助漢字、JIS X 0208 に含まれない約 6000字)
  • JIS X 0213(拡張漢字、JIS X 0208 に約 4300字追加)
  • JIS X 0221(国際規格 Unicode 準拠、JIS X 0208 とは独立な約 34000字)
などの規格が追加されました。 例えば「キリンもおいてはドバにしかず」をどうしても漢字で出したい場合
JISX0212 も老いては駑馬に如かず
となりますが、赤字が JIS X 0208 の範囲を越えています。 追加された漢字はどのコンピュータでも扱えるわけではありませんので、 ここではグラフィクスで表示していますが、 ユニコードを使えば 騏驎。 なお、キリンの「偏」は「馬」です。「鹿」だと麒麟となり、 こちらは JIS X 0208 の範囲ですが、この成句には使えません。

次のフォームで JIS X 0208 の一覧を表示できます。

(*4) アムハラ文字はエチオピアのアムハラ語やエリトリアのティグリニア語などで 使われています。日本の仮名と同様、子音と母音の組ごとに規則的に字が 割り当てられ、約250の文字を持っており CJK 文字以外では最多です。
(*5) アラビア語(正確にはアラビア文字を使う言語)とヘブライ語は右から左へ読み書きします。
Emacs はコンピュータにのるほとんどの言語の入力環境をサポートしていますが、 手元のバージョン(とインストレーション)では
Right-to-left writing is not yet supported.
とのことですので、手作業で文字列をひっくり返してからイメージにしました。 エディタが出力するテキスト・ファイルを印刷する場合は、 PostScriptに変換するツールが用意されていてその過程で文字列が 右から左へ並べ替えられるようです。
なお、これらの言語でも数字は左から右に書きます。アラビア文字は数字を 表す独自の文字を持っており、現在世界的に流通しているアラビア数字(算用数字)とは かなり異なります。 (⇒ 世界の数字) Mule Project が提供する arabic.el を Emacs でオープンすると以下を得ます。

arabic figures

この他、独自の方向に文字を書くシステムとして、 日本語の「縦書き右から左へ」と、 モンゴル文字によるモンゴル語の「縦書き左から右へ」があります。

一般言語裏返しアラビア語、ヘブライ語
時計回りに90° world writing system 反時計回りに90°
日本語縦書き裏返しモンゴル文字
(注)電光掲示板では,書く方向と逆方向に文字が流れます.
(*6) アラビア文字は子音字が語ごとに左へ(←)連なり、その上または下に 母音(基本的に a , i , u の3つのみ)がアクセント記号のように付きます。 したがって、大文字・小文字がない代わりに、 文字ごとに語頭形、語中形、語末形、独立形があり、 バランスのよい一筆書きを可能にしています。

モンゴル文字も、語を縦に連ねるため、文字ごとに語頭形、語中形、語末形がある という点でアラビア語と似ています。

アラビア文字の文字数は言語ごとに若干増減します。
アラビア語28 =28 近来では、欧米技術情報の紹介誌では字が追加されているそうです。
ペルシャ語+4 =32イラン
ウルドゥー語+3 =35インドの一部やパキスタンの一部
パシュート語+4 =39アフガニスタン
シンディ語+17 =52インドの一部やパキスタンの一部

また、ここで紹介されているアラビア文字は、ナスヒー体という書体ですが、 もう一つ、ナスターリク体も有名です。比較すると
Naskh, Naqshナスヒー 活字体楷書 アラビア語圏に広く普及しています。
Nastaliq, Nastaleeq, Nastaliquwナスタ[ー]リ[ー]ク 筆記体草書ウルドゥー語、 イラン(新聞はナスヒー体)、アフガニスタンで使われています。

(*7) 現代ベトナム語はラテン文字を採用していますが、 主に母音用の文字が3種の付加記号で拡張されていて、 それらとは別に6声調を表すために5つの声調記号が 母音字の上または下に付くことがありますので、 1母音字につき最大18種のパターンがあります。サンプルに e の上に ^ が付き さらにその上に声調記号 ' が付いている例があります。 また、e や a の下の点はカスレではなく、声調記号です。
最終更新日 : 2003.7.10 初版 : 2001.10.5