rdfs:comment
| - Unikoda alfabeto (eo)
- Dit is een lijst van de groepen karakters in de Unicode-standaard 15.0. De karakters zijn verdeeld over zeventien planes, elk met ruimte voor 65536 tekens, genummerd 0 t/m 16 (soms ook hexadecimaal 0 t/m 10): (nl)
- The Unicode Consortium and the ISO/IEC JTC 1/SC 2/WG 2 jointly collaborate on the list of the characters in the Universal Coded Character Set. The Universal Coded Character Set, most commonly called the Universal Character Set (abbr. UCS, official designation: ISO/IEC 10646), is an international standard to map characters, discrete symbols used in natural language, mathematics, music, and other domains, to unique machine-readable data values. By creating this mapping, the UCS enables computer software vendors to interoperate, and transmit—interchange—UCS-encoded text strings from one to another. Because it is a universal map, it can be used to represent multiple languages at the same time. This avoids the confusion of using multiple legacy character encodings, which can result in the same (en)
- UnicodeやISO/IEC 10646には、単純計算で U+0000 ~ U+10FFFF の 1,114,112 = 220 + 216 個の符号位置がある。 Unicode 5.0.0の時点で、これらの符号位置のうち 102,012 (9.2%) が割り当て済みであり、ほかに 137,468 (12.3%) がに、2,048 がに予約されており、そして 66 がに指定され、872,582 (78.3%) が未割り当てのまま残されている。割り当てられた符号位置の数は以下のような構成である。
* 2,684 は特定のブロック内への割り当てのために予約されている。
* 98,893 は図形文字である。
* 435 は制御、整形、グリフ/文字の異体字選択用のである。 (さらに詳細な内訳はを参照) Unicodeの文字はさまざまな方法で分類できる。すべての文字は用字 (script) が割り当てられている。なお、たくさんの文字に「Common」(用字をまたがって共通に使う)、もしくは「Inherited」(隣接した文字から用字を受け継ぐ) という用字が割り当てられている。Unicodeにおける用字とは、字のみならず、その用字特有の句読点、ダイアクリティカルマーク、および他のマークや数字や記号をも含む一貫した書記体系である。一つの用字が一つかそれ以上の言語をサポートする。 (ja)
|