ウィキペディア日本語版のヘルプページです。
仮に特殊文字と呼んでいる多言語文字は、コンピュータの環境によっては表示や入力のために準備が必要です。ここではウィキペディア日本語版の一般的な閲覧環境について説明しています。
ですが基本的に多くの文字が何もしなくても標準の状態で使用でき、2006年のWindows Vistaやその次のWindows 7以降、また、ChromeOSや、macOSの最近のものでは設定が不要なことが多いでしょう。一部の特殊文字や、環境が古い場合には表示のために設定が必要な場合があります。
特殊文字を表示するには、つまり多言語の文字集合であるUnicodeをウェブページ上で表示するためには、必要なユニコードフォントがコンピュータに用意されている必要があります。ただし、最近のパソコンでは既に用意されていることも多いでしょう。
またブラウザの対応も必要ですが、Mozilla Firefox、Google Chrome、Microsoft Edge、Opera、Safari、Konquerorなど最近のブラウザのほとんどでは、特別な設定なしに特殊文字が表示できます。それでも、結合文字を多用する一部の文字体系では、設定が必要な場合があります。一方、Internet Explorerのようなブラウザでは、対応したフォントを使用するように設定する必要があります。
かなり以前では、Microsoft Windows 95以降で使われたフォントのMS ゴシックとMS 明朝には、多言語のフォントはあまり多く含まれていないため、対応するフォントを用意する必要がありました。2006年リリースのWindows Vista以降では、フォントのメイリオが標準状態で用意されておりフォントの追加はほとんど必要なくなりました。Windows 10においては設定は不要です。
この項目「Help:特殊文字」は加筆依頼に出されており、内容をより充実させるために次の点に関する加筆が求められています。 加筆の要点 - Microsoft Windows 8に関する記述 (貼付後はWikipedia:加筆依頼のページに依頼内容を記述してください。記述が無いとタグは除去されます) (2017年8月) |
オペレーティングシステム (OS) によっては、特定の特殊文字を利用するために追加のインストールやセットアップが必要な場合があります。
もはやほとんど使用されない古いOSについては、過去版の「Microsoft Windows 98/Me/、apple Mac OS 9の設定」、「Microsoft Windows 2000/2003 Serverの設定」を参照してください。
対応: アラビア文字*、 アルメニア文字*、 インド系文字(詳細を参照)*、 ギリシア文字、 キリル文字、 グルジア文字*、 シリア文字(エストランゲロ体)*、 ターナ文字、 ヘブライ文字*、 ラテン文字(ヨーロッパ諸語、トルコ語、ベトナム語*)、 中国語簡体字、 中国語繁体字、 ハングルと朝鮮語の漢字、 日本語の表記体系。
基本的に、特殊文字の表示のためになにかする必要はありませんが、上で「*」をつけた文字体系を表示できるようにするには、次の設定が必要です:
Microsoft Windows XP では、ClearType 技術を使って文字の輪郭を滑らかに表示することができます:
Microsoft Windows Vista、および、Microsoft Windows 7 では、標準設定で既に多くの言語をサポートしており、閲覧にあたって特にあなたが何かをする必要はありません。ただし、ビルマ文字、コプト文字などは Windows Vista, Windows 7 上にフォントが含まれていないため、それぞれの節を参照して追加でインストールする必要があります。
Microsoft Windows 7では、Uniscribeの不具合により補助多言語面の文字のうち、Unicode 5.1の時点で未定義だった(つまり Unicode 5.2以降で定義された)コードポイントの文字がそのままでは表示できません。ARIB外字や携帯電話の絵文字の一部などが該当します。SP1をインストールすると、修正されたUniscribeがインストールされ、表示できるようになります。
また、香港増補字符集に関しては、フリーの対応フォント(Ming(for ISO10646)・DFSongStd・AR PL UMing HK・CYanHeiHK)の方が確実です。
Microsoft Windows 10 では、標準状態で表示できない言語はありません。
この節の加筆が望まれています。 |
対応: アラビア文字(アラビア語、ウズベク語、ダリー語、パシュトー語、ペルシア語)、アルメニア文字(アルメニア語)、インド系文字(詳細を参照)、カナダ先住民文字(イヌクティトゥット語)、ギリシア文字(現代ギリシア語および古典ギリシア語)、キリル文字(スラブ諸語)、チェロキー文字(チェロキー語)、中国語簡体字、中国語繁体字、日本語の表記体系とアイヌ語用片仮名、ハングルと朝鮮語の漢字、ヘブライ文字(ヘブライ語)、ラテン文字(トルコ語、ハワイ語、ベトナム語、ヨーロッパと旧ソ連の言語)、他。
アラビア文字、ヘブライ文字、キリル文字、パンジャーブ語の表記、アルメニア文字、チェロキー文字、カナダ先住民文字、ブラーフミー系文字(インド系文字)については、追加インストールが必要です。
この節の加筆が望まれています。 |
対応: ラテン文字、国際音声記号、ルーン文字、ギリシア文字、キリル文字(スラヴ語派の言語、ウラル語族の言語、モンゴル語等)、アラビア文字(アラビア語、ペルシア語、ウルドゥ語等)、インド系文字(詳細を参照)、ティフナグ文字、中国語簡体字、中国語繁体字、日本語の表記体系の文字、ハングルと朝鮮語の漢字。
必要な文字のフォントをインストールすれば表示ができます。
対応:
言語ごとのフォントを簡単にインストールしたければ、それぞれの言語対応をインストールします。
表示に必要なフォントだけをインストールすることもできます。
DejaVuフォント(#多言語フォントの節を参照)は、ほとんどのアルファベットとアブジャドの文字を含んでいます。コンソールでrootになって、次のコマンドを打ち込みます:
yum install dejavu-fonts dejavu-fonts-experimental
これで表示できないものについては、個々の文字体系のフォントをインストールします。コンソールでrootになって、次のコマンドを打ち込みます:
yum install fonts-言語名
言語名は次のものから選べます:
arabic
(アラビア文字 - アラビア語、ペルシア語、ウルドゥ語等)、chinese
(中国語の簡体字と正体字(繁体字))、hebrew
(ヘブライ文字)、japanese
(日本語の表記体系)、korean
(ハングルと朝鮮語の漢字)、punjabi
(アラビア文字 - パンジャーブ語)。インド系文字(詳細を参照)。
この一覧にないものについても、適切なフォントをインストールすることで表示できるようになります。以下の節の解説も参照してください。
スマートフォンやタブレットなどに使われるOSであるAndroidでは、2015年にリリースされたAndroid 6.0より Noto Sans CJK という非常に広範囲の文字に対応したフォントが実装されるようになりました。
ただし標準のブラウザである Google Chrome では特殊文字がきちんと表示されないことがあります。そのような場合 Firefox ブラウザを使うと、決め打ちで Noto Sans CJK を用いて閲覧できるので、特殊文字もきちんと表示できる可能性が高くなります。
多くの文字体系の文字を含んだフォントがあります。これをインストールすれば、さまざまな文字体系の文字を表示できるようになります。
多言語フォントをインストールできないときや、以下のフォントに含まれていない文字を表示したいときや、特定の文字体系でより品質の高いフォントがほしいときは、必要な文字体系の適切なUnicodeフォントをインストールする必要があります。以下の節の解説も参照してください。
JIS X 0213にある文字の表示には、適切なフォントがインストールされている必要があります。なお一部の環境では、JIS X 0213に対応していても2004年の改訂による例示字形の変更に対応していないため、漢字の字形に違いがあることもあります。
その他の環境でも、適切なフォントをインストールできれば表示が可能です。#多言語フォントおよび#Unicode OpenTypeフォントの節を参照してください。
携帯電話の絵文字はウィキペディアでは、絵文字はUnicode 6.0の形式で使用され、外字での絵文字は使用されません。表示可能かどうかの確認はUnicode6.0の携帯電話の絵文字の一覧を表示することで確認できます。
下表で、表示したい文字について右の欄に表示されるものが左側の画像と同じなら、すでにその文字のフォントはインストールされています。
(世界人権宣言より)
文字体系 | 正しい表示 | お使いのコンピュータでは |
---|---|---|
漢字(簡体字) |
人人生来自由, | |
漢字(繁体字) |
人人生來自由, | |
ハングル |
모든 인간은 태어날 때부터 |
漢字は、言語によって字形が異なる場合があります。下表の例の上段のように字形が言語によって変わらないのが不都合であれば、以下の説明にしたがってフォントのインストールと設定を行う必要があります。
日本語 | 簡体字 | 繁体字 | 朝鮮語 | |
---|---|---|---|---|
より正確な表示の例 | ||||
お使いのコンピュータでは | 判 逸 骨 | 判 逸 骨 | 判 逸 骨 | 判 逸 骨 |
Windows XP 日本語版では、東アジアの言語の文字は自動的にインストールされます。
CJK統合漢字拡張Aが表示できない場合は、Microsoft社の提供するGB18030拡張サポートをインストールし、簡体字中国語の表示フォントをSimSun-18030/NSimSun-18030に変更すると表示できます。
通常のハングルは特に設定をしなくても Windows XP 以上・OS X などで正常に表示されます。現在の正書法で使われなくなった古ハングルについては、Windows 8 以上では何もしなくても正しく表示されますが、それ以前の Windows や OS X ではひとつの文字が分割して表示されることがあります。#ハングル・朝鮮漢字の節にあるフォントをインストールすることで正しく表示されるようになります。
片仮名のアイヌ語用表音拡張文字を表示するには、JIS X 0213ないしはUnicode 3.2以降に対応したフォントが必要です。#JIS X 0213にある文字の節を参照してください。
文字体系 | 正しい描画 | お使いのコンピュータでは |
---|---|---|
オリヤー文字 | କ + େ → କେ | |
カンナダ文字 | ಕ + ಿ → ಕಿ | |
グジャラーティー文字 | ક + િ → કિ | |
クメール文字 | ម + ្ + ស + ៅ → ម្សៅ | |
グルムキー文字 | ਕ + ਿ → ਕਿ | |
シンハラ文字 | ඵ + ේ → ඵේ | |
タイ文字 | ฐ + ู → ฐู | |
タミル文字 | க + ே → கே | |
チベット文字 | ར + ྐ + ྱ → རྐྱ | |
デーヴァナーガリー | क + ि → कि | |
テルグ文字 | య + ీ → యీ | |
ビルマ文字 | ဃ + ြ → ဃြ | |
ベンガル文字 | ক + ি → কি | |
マラヤーラム文字 | ക + െ → കെ | |
ラオ文字 | ກ + ົ + ້ → ກົ້ |
インド系文字(ブラーフミー系文字)では、フォントをインストールするだけでなく、結合文字などを正しく描画できるようにコンピュータのオペレーティングシステムや閲覧ソフトウェアを設定しなければならないことがあります。
文字体系 | 正しい表示 (Unicode 4.1) | お使いのコンピュータでは |
---|---|---|
コプト文字 | Ϧⲉⲛ ⲧⲁⲣⲭⲏ ⲛⲉ ⲡⲓⲥⲁϫⲓ ⲡⲉ. ⲟⲩⲟϩ ⲡⲓⲥⲁϫⲓ ⲛⲁϥⲭⲏ ϧⲁⲧⲉⲛ ⲫϯ. ⲟⲩⲟϩ ⲛⲉ ⲟⲩⲛⲟⲩϯ ⲡⲉ |
コプト文字は、かつてはUnicodeのギリシア文字ブロックに含まれ、一部の文字をギリシア文字と共有していました。Unicode 4.1.0 以降、コプト文字はギリシア文字とは別の独自のブロックを割り当てられるようになりました。しかし、古いコードポイントの文字を含む記事もまだたくさんあります。
WAZU JAPAN's Gallery of Unicode Fonts - Copticで、新旧両方のマッピングに対応したフリーなフォントが見つかります。
現代では使われていない文字体系や人工文字は、主にUnicodeの追加多言語面に登録されることになっています。しかし、一部の環境では追加多言語面の文字を表示できません。
Firefoxでは、Pango対応が有効になっていれば表示できます。Windows版と、一部のLinuxディストリビューションとともに配布されている版では、有効になっています。
さらに、必要な文字体系の文字を含んだフォントのインストールが必要です。Code2001(2010年11月22日時点のアーカイブ)フォントは、以下の文字体系に対応しているフリーなフォント(ベータ版)です。
合成専用の文字を使い、重ねることで囲み文字を表現したものは、特定のフォントでなければ記号と別々に表示されます。合成表示が可能なフォントは次のような物があります。なお、OS Xでは標準で表示可能です。
ウィキペディア日本語版では、記事にはできるだけJIS X 0201とJIS X 0208の範囲に含まれる文字を使うことを推奨しています。この範囲の文字なら、日本語に対応した環境ではまず問題がおこることはないからです。しかし、記事の内容によっては、JIS X 0208の範囲にない文字が不可欠です。JIS X 0208に含まれない文字をウィキテキストに入力する方法は、5つあります。
à
など。この方式は、一部のブラウザできちんと表示されない時にも安全な方法です。¡
。残念ながら、一部の古いブラウザでは、これらのコードを正しく変換できません。しかし、例えばトルコ語アルファベットのような、文字実体参照が存在しないUnicode文字を入力する唯一の方法です。128 から 159 の範囲は HTMLでは使用が不正とされる制御記号への参照なので、 ƒ
のようなこの範囲の文字の参照は不正で、表示結果が保証されません。最初の方法、2番目の方法および3番目の方法で入力できない文字は、編集時の文字化けを避けるため、文字をそのまま入力するのではなく、できるかぎり文字実体参照か数値文字参照で入力してください。最後の方法は、ほかの執筆者が編集できなくなったり、文字化けが起こって記事の内容を壊してしまうことがあるので、なるべく使わないでください。
編集したテキストがおかしくなることがあります。編集に使うアプリケーションがUnicodeに完全に対応しておらず、特定の範囲の文字だけしか処理できないものだと、それ以外の文字がなにかほかの文字に置き換わってしまうのです。いわゆる「文字化け」です。文字が「?」に化ける例がよく見られますが、テキストの一部や全部が別のものに化けてしまう例も報告されています。
やや古いウェブブラウザやコンソールブラウザを使って編集したときや、記事のソースをUnicodeに対応していない外部アプリケーション(テキストエディタなど)で編集して再びブラウザに入力しなおしたときなどに、こうしたことが起こります。
記事に特殊文字が含まれていないように見えても、こうしたアプリケーションを使って編集しないようにしてください。というのは、言語間リンクのマークアップにはさまざまな言語の文字が含まれるからです。本文は正しく編集できても、言語間リンクを壊してしまうことがあります。
以下のブラウザでは、記事に特殊文字がほとんど含まれていないのなら、閲覧は問題なくできます。しかし、編集に使うと記事の内容を壊してしまいます。これらのブラウザを編集に使わないでください。
この節の加筆が望まれています。 |
テキストエディタで記事を編集するときは、Unicodeに対応しているものを使ってください。オペレーテングシステムがUnicodeに対応しているからといって、その上で動作するアプリケーションもそうだとはかぎりません。古い日本語用のテキストエディタでは、CP932 (シフトJIS)、MacJapanese、EUC-JPなどに含まれる文字しか処理できないものがあります。
また、Unicodeに対応しているアプリケーションでも、基本多言語面 (BMP) の範囲の文字しか処理できないものもあります。こうしたアプリケーションで編集すると、一部の漢字などが文字化けすることがありますので注意してください。
最近のブラウザのほとんどは、何らかのレベルでUnicodeに対応していますが、対応の程度はブラウザによります。もっともよく遭遇する問題は、Internet Explorerが表示したい文字を表示できるフォントを捜さずに、レジストリにあるあらかじめ構成されたフォントリンクに依存してしまうというものです。このため、Internet Explorerのために、しばしば使用フォントを強制的に設定する必要があります。一部の文字については、これを補助するテンプレートのセットがあります。
なお、<font face="Arial Unicode MS">...</font> といった指定でフォントを指定しても、閲覧する側がそのフォントをインストールしている場合にしか意味を成しません。このような指定はしないでください。
テンプレート | 説明 |
---|---|
{{Unicode|テキスト}}
|
{{Unicode}}テンプレートは、さまざまなUnicodeブロックにある文字を混在表示させるときに使えます。特定の言語や文字体系のフォントを指定したい場合は、できるだけこの後に挙げたほかのテンプレートを使ってください。 |
{{Lang|言語コード|テキスト}}
|
朝鮮語や中国語などのためには、{{Lang}}テンプレートで言語を指定してやることで、正しいフォントを選択させることができます。日本語環境の場合、JIS X 0208に含まれる文字は、こういった特別な処置なしでも問題なく表示されるはずです。 |
{{Polytonic|テキスト}}
|
{{Polytonic}}は、ポリトニック・ギリシア語のためのフォントを指定するテンプレートです。 |
{{IPA|テキスト}}
|
国際音声記号のためのテンプレートです。適切なフォントを指定したうえで、{{IPA}}は で、{{ipa}}は /.../ で囲みます。{{IPA2}}は囲みません。 |
{{SAMPA|テキスト}}
|
{{SAMPA}}は、SAMPAおよびX-SAMPAのためのテンプレートです。 で囲みます。 |
{{Script|文字体系コード|テキスト}}
|
(準備中) シュメール、アッカド、アッシリアの楔形文字、ルーン文字、アラビア文字のナスタアリーク体などについては、言語とともにフォントの指定も必要となります。これらの文字体系(用字系)の指定には{{Script}}テンプレートが使えます。このテンプレートは現在準備中です。 |
閲覧する利用者のウェブブラウザが適切に設定されていないと、特殊文字が正しく表示できないことがあります。特殊文字を使っている記事では、利用者に注意をうながすために、記事の冒頭にお知らせテンプレートを貼りつけておくのもよいでしょう(これは必ず必要なわけではありません)。以下のようなテンプレートがあります。
テンプレート | 表示例 |
---|---|
{{特殊文字}}
|
|
{{インド系文字}}
|
|
{{JIS2004}}
|
|
{{記事名の制約|title=タイトル}}
|
この節の加筆が望まれています。 |
ウェブブラウザには、ハイパーリンクに下線がついていなくてもつける設定があることがありますが、特殊文字にリンクするときに、この下線のために誤読が起きることがあります。
例えば、+ - < > ⊂ ⊃ へリンクをつけるとと + - < > ⊂ ⊃となりますが、設定によっては ± = ≤ ≥ ⊆ ⊇ に見えてしまうかもしれません。このような場合は、次のように、リンクを別にするとよいでしょう。
複数の文字にリンクする時は混乱は若干起こりにくいようです。例えば、x > 3といった具合です。
特殊文字を含むテキストを編集するには、お使いのコンピュータがその文字を表示できるように設定されていなければなりません(下記の「ヒエログリフ」と「数式」についてはサーバ上の画像を使うので、表示のための設定は不要です)。#閲覧の節も参照してください。この節では、表示はできるようになっているとして、どのようにして文字を入力するのかを説明します。
以下のものはサーバ上の画像を使うため、ブラウザの機能に依存しません。また、入力するための特別なソフトウェアのインストールも必要ありません。
たとえば <hiero>P2</hiero> は
|
を表示します。
たとえば
<math>X_k = \sum_{n=0}^{N-1} x_n \cos\!\left\{\frac{\pi}{N} \left(n+\frac{1}{2}\right) k \right\}</math>
は
を表示します。
+でキーボード レイアウトを切り替えられます(たとえば日本語IMEとスウェーデン語キーボードを交互に切り替えられます)。言語バーでは、どのキーボード レイアウトを使うかを画面上で選択できます。
この節の加筆が望まれています。 |
ここで説明している方法は、GNOMEを使用しているすべての環境でできますが、日本語入力メソッドとの併用にはあまり向いていません。下のほうの節で自分のつかっているオペレーティングシステムについての説明があれば、そちらの方法で設定をしてください。
ここで説明している方法は、KDEを使用しているすべての環境でできますが、日本語入力メソッドとの併用にはあまり向いていません。下のほうの節で自分のつかっているオペレーティングシステムについての説明があれば、そちらの方法で設定をしてください。
Fedoraでは、標準の入力メソッドとしてSCIMがインストールされます。これは、さまざまな言語の種々のキーボード配列に対応しており、日本語入力と切り替えながら入力することもできます。ここでは、Fedora 7で、SCIMを使って入力する方法を説明します。
SCIMをインストールしていないか、ほかの入力メソッドを使っているときは、まず、rootになって、SCIMとim-chooserをインストールします。XTermやGNOMEターミナルを開き、rootになって、下記のコマンドを打ち込みます(下で、scim-anthyは日本語用のSCIM入力メソッドエンジンです。ほかのエンジンを使いたければ変えてください)。
yum install scim-m17n scim-qtimm scim-bridge-gtk scim-anthy im-chooser
そして、システム > 設定 > 他の個人設定 > 入力メソッドを選択してim-chooserを起動します。「カスタム入力メソッドを使う」を選択し、その横のドロップダウンボックスで「SCIM」を選択して、「閉じる」をクリックします。
必要なキーボードをインストールするには、rootになって、以下を実行します。
yum install m17n-db-言語名
言語名 は、つぎのものから選べます:
arabic
(エジプトのアラビア語)、chinese
(中国語)、croatian
(クロアチア語)、greek
(現代ギリシア語)、hebrew
(ヘブライ語)、russian
(ロシア語)、serbian
(セルビア語)、slovak
(スロバキア語)、swedish
(スウェーデン語)、amharic
(アムハラ語)、armenian
(アルメニア語)、dhivehi
(ディベヒ語)、farsi
(ペルシア語)、georgian
(グルジア語)、kazakh
(カザフ語)、latin
(ラテン文字一般)、syriac
(シリア語)、vietnamese
(ベトナム語)、インドと東南アジアの言語。
* インドと東南アジアの言語についてはHelp:多言語対応 (インド系文字)を参照。
日本語についてはAnthyが利用できます。ローマ字入力、仮名入力、親指シフト配列から選択できます。
yum install scim-anthy
朝鮮語については、2ボル式、3ボル式とそれらの改良型のキーボードが利用できます。
yum install scim-hangul
キーボードをインストールしたら、ログインし直します。
言語ごとに、一般に使用されているいくつかの配列のキーボードから選択できます。たとえば繁体中国語では、注音輸入法 (zh)、併音輸入法 (zh)、倉頡輸入法 (zh) などのいくつかの入力方式から選択できます。
入力メソッドのホットキー(デフォルトでは+)を押して入力メソッドを有効にすると、デスクトップのパネルに現在選択されている言語のアイコンが表示されます。キーボードの切り替えは、このアイコンをクリックすると表示される一覧から選択すればできます(SCIMで切り替えのホットキーを設定し、アイコンから選択しなくてよいようにもできます。詳細はSCIMのヘルプを見てください)。
本節はインターネット上で取得可能なフリーフォントの一覧です。
リンク先より必要なフォントをダウンロードして利用することが可能です。
このフォントは、Microsoft WindowsとLinux、Mac OS Xのほとんどのディストリビューションで対応しています。
JIS X 0213:2004には、アイヌ語用片仮名、人名用漢字などが含まれます。
JIS X 0212-1990には、いくつかのダイアクリティカルマークつきラテン文字などが含まれます。
以下のサイトでも、多くのフリーフォントが見つかります。