80 likes | 172 Views
文字エンコーディング. 2010 年 7 月. 目次. 文字セット 文字コード 文字エンコーディング. 文字セット. 漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと 「文字集合」とも呼ばれる 国や言語によってさまざまな文字セットがある 文字セットによって含まれる文字が異なる JIS 漢字コード – ひらがなや漢字など ASCII – 英数字、記号など Unicode – 世界の主要言語の文字. 文字セット(例). ASCII. Unicode. a. A. 1. “. い. JIS 漢字コード. う. あ. ア.
E N D
文字エンコーディング 2010年7月
目次 • 文字セット • 文字コード • 文字エンコーディング
文字セット • 漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと • 「文字集合」とも呼ばれる • 国や言語によってさまざまな文字セットがある • 文字セットによって含まれる文字が異なる • JIS漢字コード – ひらがなや漢字など • ASCII – 英数字、記号など • Unicode – 世界の主要言語の文字
文字セット(例) ASCII Unicode a A 1 “ い JIS漢字コード う あ ア い A あ a é う 川 И 川 ア 1 翻 翻 “ 山 山 ɛ
文字コード • それぞれの文字や記号に割り当てられた固有の数字のこと • 文字セットによって、同じ文字に対して異なる数字が割り当てられる場合がある (16進数で表記)
文字エンコーディング • 文字コードをコンピュータが利用できるデータに変換(符号化)する方式 • 「文字符号化方式」とも呼ばれる • JIS漢字コードおよびASCIIを符号化する方式 • Shift_JIS • EUC-JP • ISO-2022-JP • Unicodeを符号化する方式 • UTF-8 • UTF-16
文字エンコーディング(例) • JIS漢字コード+ASCII • Unicode
注意 • この資料は文字コードの概念を説明するためのものです • 分かりやすく説明するため、詳細を割愛しています • 詳細についてはウィキペディアの下記のページを参照してください • 「文字コード」 • 「文字集合」 • 「文字符号化方式」