Baza kodów pocztowych

Zaloguj się do baz wiedzy
 
Portal Internetowy Serwery WWW
 

Kodowanie znaków

Strona zawiera informacje o kodowaniu znaków oraz tablice kodowe

Wstęp

Strony kodowe:
  • podstawowe, VGA codepage 437, Codepage 437, 852, 1250, 1252, ISO-8859-1, ISO-8859-2, ...
  • inne, Latin-3, -4, -5, -6, -7, -8, -9, -10, Codepage 737, 775, 850, 855, 857, 860, 861, 862, 863, 865, ...
Znaki Unicode:
  • podstawowe, łacina podstawowa i rozszerzona, znaki kontrolne, międzynarodowy alfabet fonetyczny, ...
  • symbole, strzałki, ramki, znaki Braille'a, symbole walut, figury, oznaczenia matematyczne i techniczne, ...
  • różne, dodatkowe znaki alfabetu, diakrytyczne znaki, małe znaki interpunkcji, znaki specjalne, ...
  • CJK - Chiński, Japoński i Koreański

Przykładowe znaki Unicode dla poniższych tabel
Numery stron kodowych dla Windows 2000
Przegląd przez najpopularniejsze sposoby kodowania polskich znaków
Encje najczęściej używanych symboli na stronach internetowych
Odsyłacze do innych polecanych stron





Podstawowe strony kodowe:


VGA codepage 437 (VGA ROM charset) - DOS-owa strona kodowa bez polskich znaków, dla kart VGA
Codepage 437 (IBM PC: default) - DOS-owa strona kodowa bez polskich znaków
Codepage 852 (IBM PC: East European) - DOS-owa strona kodowa z polskimi znakami
Codepage 1250 (Microsoft Windows Central European) - inaczej nazywana: Windows Latin-2, ANSI-2. Strona kodowa używana w systemach Windows
Codepage 1252 (Microsoft Windows Western European) - inaczej nazywana: Windows Latin-1, ANSI-1
Latin-1 (ISO-8859-1: Western European) - strona kodowa używana m.in. w Internecie
Latin-2 (ISO-8859-2: Central European) - strona używana m.in. w Internecie z polskimi znakami



Inne strony kodowe:


Latin-3 (ISO-8859-3: South European and Esperanto)
Latin-4 (ISO-8859-4: Baltic, old)
Latin-5 (ISO-8859-5: Cyrillic)
Latin-6 (ISO-8859-6: Arabic)
Latin-7 (ISO-8859-7: Greek)
Latin-8 (ISO-8859-8: Hebrew)
Latin-9 (ISO-8859-9: Turkish)
Latin-10 (ISO-8859-10: Nordic)
Latin-15 (ISO-8859-15: Revised Western European)
DEC Multilingual Character Set
Codepage 737 (IBM-PC: Greek)
Codepage 775 (IBM-PC: Baltic)
Codepage 850 (IBM-PC: European)
Codepage 855 (IBM-PC: Cyrillic)
Codepage 857 (IBM-PC: Turkish)
Codepage 860 (IBM-PC: Portuguese)
Codepage 861 (IBM-PC: Icelandic)
Codepage 862 (IBM-PC: Hebrew)
Codepage 863 (IBM-PC: Canadian French)
Codepage 865 (IBM-PC: Nordic European)
Codepage 866 (IBM-PC: Cyrillic 2)
Codepage 869 (IBM-PC: Greek 2)
Codepage 874 (IBM-PC / Microsoft Windows: Thai)
Codepage 1251 (Microsoft Windows Cyrillic)
Codepage 1253 (Microsoft Windows Greek)
Codepage 1254 (Microsoft Windows Turkish)
Codepage 1255 (Microsoft Windows Hebrew)
Codepage 1256 (Microsoft Windows Arabic)
Codepage 1257 (Microsoft Windows Baltic)
Codepage 1258 (Microsoft Windows Vietnamese)



Strony testowe dla znaków Unicode:

Podstawowe:

  Łacina podstawowa i znaki kontrolne C0  -  C0 Controls and Basic Latin, (0-127)
  Łacina podstawowa (cd) i znaki kontrolne C1
  -  C1 Controls and Latin-1 Supplement, (128-255)
  Łacina rozszerzona-A
  -  (Latin Extended-A), (256-383)
  Łacina rozszerzona-B
  -  (Latin Extended-B), (384-591)
  Łacina rozszerzona, dodatkowe znaki
  -  Latin Extended Additional, (7680-7935)
  Międzynarodowy alfabet fonetyczny
  -  (IPA Extensions), (592-687)

  Arabski
  -  Arabic, (1536-1791)
  Bengalski
  -  Bengali, (2432-2559)
  Birmański
  -  Myanmar, (4096-4255)
  Zunifikowane sylabariusze dla pierwszych narodów Kanady
  -  Unified Canadian Aboriginal Syllabics, (5120-5759)
  Cherokee,
(5024-5119)
  Cyrylica
  -  Cyrillic, (1024-1279)
  Devanagari,
(2304-2431)
  Etiopski
  -  Ethiopic, (4608-4991)
  Grecki
  -  Greek, (880-1023)
  Grecki rozszerzony
  -  Greek Extended, (7936-8191)
  Gruziński
  -  Georgian, (4256-4351)
  Gudżarati
  -  Gujarati, (2688-2815)
  Gurmukhi,
(2560-2687)
  Hebrajski
  -  Hebrew, (1424-1535)
  Kanara
  -  Kannada, (3200-3327)
  Khmerski
  -  Khmer, (6016-6143)
  Laotański
  -  Lao, (3712-3839)
  Malajalamski
  -  Malayalam, (3328-3455)
  Malediwski (diwehi), thaana
  -   Thaana, (1920-1983)
  Mongolski
  -  Mongolian, (6144-6319)
  Ogamiczne pismo
  -  Ogham, (5760-5791)
  Orija
  -  Oriya, (2816-2943)
  Ormiański
  -  Armenian, (1328-1423)
  Runy
  -  Runic, (5792-5887)
  Syngaleski
  -  Sinhala, (3456-3583)
  Syryjski,
(1792-1871)
  Tamilski
  -  Tamil, (2944-3071)
  Telugu,
(3072-3199)
  Tajski
  -  Thai, (3584-3711)
  Tybetański
  -  Tibetan, (3840-4031)

  Znaki diakrytyczne
  -  Combining Diacritical Marks, (768-879)
  Znaki modyfikujące
  -  Spacing Modifier Letters, (688-767)

Symbole:

  Diakrytyczne znaki dla symboli  -  Combining Diacritical Marks for Symbols, (8400-8447)
  Elementy bloków
  -  Block Elements, (9600-9631)
  Figury geometryczne
  -  Geometric Shapes, (9632-9727)
  Indeksy górne i dolne
  -  Superscripts and Subscripts, (8304-8351)
  OCR­A i MICR symbole
  -  Optical Character Recognition, (9280-9311)
  Otoczone znaki alfanumeryczne
  -  Enclosed Alphanumerics, (9312-9471)
  Oznaczenia matematyczne
  -  Mathematical Operators, (8704-8959)
  Ramki
  -  Box Drawing, (9472-9599)
  Różne symbole
  -  Miscellaneous Symbols, (9728-9983)
  Strzałki
  -  Arrows, (8592-8703)
  Symbole techniczne
  -  Miscellaneous Technical, (8960-9215)
  Symbole walut
  -  Currency Symbols, (8352-8399)
  Symbole złożone z liter
  -  Letterlike Symbols, (8448-8527)
  Ułamki i cyfry rzymskie
  -  Number Forms, (8528-8591)
  Znaki Braille'a
  -  Braille Patterns, (10240-10495)
  Znaki interpunkcji
  -  General Punctuation, (8192-8303)
  Znaki kontrolne
  -  Control Pictures, (9216-9279)
  Znaki ozdobne
  -  Dingbats, (9984-10175)

Różne:

  Arabski - dodatkowe fonty A  -  Arabic Presentation Forms-A, (64336-65023)
  Arabski - dodatkowe fonty B
  -  Arabic Presentation Forms-B, (65136-65279)
  Diakrytyczne znaki (dodatek)
  -  Combining Half Marks, (65056-65071)
  Dodatkowe znaki alfabetu
  -  Alphabetic Presentation Forms, (64256-64335)
  Obszar zarezerwowany do prywatnego użytku
  -  Private Use Area, (57344-63743)
  Małe znaki interpunkcji
  -  Small Form Variants, (65104-65135)
  Pełnej i połówkowej szerokości znaki
  -  Halfwidth and Fullwidth Forms, (65280-65519)
  Znaki planowane (wysokie)
  -  High Surrogates, (55296-56191)
  Znaki planowane (niskie)
  -  Low Surrogates, (56320-57343)
  Znaki planowane dla wykorzystania prywatnego
  -  Private Use High Surrogates, (56192-56319)
  Znaki specjalne
  -  Specials, (65520-65535)

CJK - Chiński, Japoński i Koreański:

  Bopomofo Extended, (12704-12735)
  Bopomofo,
(12544-12591)
  CJK Compatibility Forms,
(65072-65103)
  CJK Compatibility Ideographs,
(63744-64255)
  CJK Compatibility,
(13056-13311)
  CJK Radicals Supplement,
(11904-12031)
  CJK Symbols and Punctuation,
(12288-12351)
  CJK Unified Ideographs Extension A,
(13312-19893)
  CJK Unified Ideographs,
(19968-40959)
  Enclosed CJK Letters and Months,
(12800-13055)
  Hangul Compatibility Jamo,
(12592-12687)
  Hangul Jamo,
(4352-4607)
  Hangul Syllables,
(44032-55203)
  Hiragana,
(12352-12447)
  Ideographic Description Characters,
(12272-12287)
  Kanbun,
(12688-12703)
  KangXi Radicals,
(12032-12255)
  Katakana,
(12448-12543)
  Yi Radicals,
(42128-42191)
  Yi Syllables,
(40960-42127)

 

Doświadczenie



Mamy już 10 lat doświadczenia w prowadzeniu marketingowych baz danych


Profesjonalizm



Najbardziej kompleksowa, rozbudowana i aktualna baza miejscowości w Polsce. Źródło danych słownikowych gotowe do wykorzystania w systemach informatycznych

Zaufanie



Dotychczas nasze produkty wybrało ponad 1000 firm i instytucji, takie zaufanie zobowiązuje
 
Wszelkie prawa zastrzeżone - WASKO S.A. 1988-2012