HTML ھەرپ توپلىمى

HTML ھەرپ توپلىمى

HTML بېتىنى توغرا كۆرسىتىش ئۈچۈن توركۆرگۈچ چوقۇم ئۆزىنىڭ قايسى ھەرپ توپلىمىنى ئىشلىتىۋاتقانلىقىنى پەرقلەندۈرۈشى كېرەك.

ئېنتېرنىت تورى دەسلەپكى مەزگىلدە ASCII ھەرپ توپلىمىنى ئىشلەتكەن. ASCII ئۆلچىمى 0-9 غىچە رەقەم، چوڭ ۋە كىچىك يېزىلغان ئېنگىلىزچە ھەرپ، شۇنداقلا بەزى ئالاھىيدە بەلگىلەرنى ئۆز ئىچىگە ئالىدۇ.

مۇكەممەل ASCII پايدىلىنىش قوللانمىسى

كۆپلىگەن دۆلەتلەرنىڭ ھەرپلىرى ASCII كە تەۋە ئەمەس، شۇڭا ھازىرقى زامان توركۆرگۈچىسىنىڭ ئەسلىدىكى قوللايدىغان ھەرپ توپلىمى ISO-8859-1.

مۇكەممەل ISO-8859-1 پايدىلىنىش قوللانمىسى

ئەگەر توربەت ISO-8859-1 كە ئوخشىمايدىغان ھەرپ توپلىمىنى ئىشلەتسە، ئۇنداقتا <meta> خەتكۈچىدە بەلگىلەش كېرەك.

ISO ھەرپ توپلىمى

ISO ھەرپ توپلىمى خەلقئارا ئۆلچەملەشتۈرۈش تەشكىلاتى (ISO) نىڭ ئوخشىمىغان ھەرپ جەدۋىلى ياكى تىللا ئۈچۈن بېكىتكەن ئۆلچەملىك ھەرپ جەدۋىلى.

تۆۋەندە دۇنيانىڭ ھەرقايسى رايونلىرىدا ئىشلىتىۋاتقان ھەرخىل ھەرپ توپلاملىرى تىزىملىكى بېرىلدى:

ھەرپ توپلىمى تەسۋىر ئىشلىتىش دائىرىسى
ISO-8859-1 Latin alphabet part 1 شىمالىي ئامېرىكا، غەربىي ياۋروپا، لاتىن ئامېرىكىسى، كارىب دېڭىزى، كانادا، ئافرىقا
ISO-8859-2 Latin alphabet part 2 شەرقىي ياۋروپا
ISO-8859-3 Latin alphabet part 3 SE Europe، دۇنيا تىلى، باشقا ئارىلاش تىللار
ISO-8859-4 Latin alphabet part 4 سكاندىناۋىيە ۋە بالتىق دېڭىزى، شۇنداقلا باشقا ISO-8859-1 قىسمىدا بولمىغانلىرى
ISO-8859-5 Latin/Cyrillic part 5 قەدىمقى سلاۋىيان تىلى ئېلىپبەسىنى ئىشلىتىدىغان تىللار، مەسىلەن بۇلغارىيە تىلى، بېلرۇس يېزىقى، رۇسچە، ماكېدون تىلى
ISO-8859-6 Latin/Arabic part 6 ئەرەب ھەرپلىرىنى ئىشلىتىدىغان تىللار
ISO-8859-7 Latin/Greek part 7 ھازىرقى زامان گرېك تىلى، شۇنداقلا شۇنىڭدىن شەكىللەنگەن ئالگېبرالىق ئىپادىلەر
ISO-8859-8 Latin/Hebrew part 8 سىبىرىيەچىنى ئىشلىتىدىغان يېزىق
ISO-8859-9 Latin 5 part 9 تۈرك تىلى
ISO-8859-10 Latin 6 لاپ تىلى، گېرمان تىلى، ئېسكىموس شىمالىي ياۋروپا تىلى
ISO-8859-15 Latin 9 (aka Latin 0) ISO 8859-1 غا ئوخشاش، ياۋرو بەلگىسى ۋە باشقا ھەرپلەر ئورنىنى ئالغان ئاز ئىشلىتىلىدىغان تىنچ بەلگىلەر
ISO-2022-JP Latin/Japanese part 1 ياپون تىلى
ISO-2022-JP-2 Latin/Japanese part 2 ياپون تىلى
ISO-2022-KR Latin/Korean part 1 كورىيە تىلى

Unicode ئۆلچىمى

يۇقاردا بېرىلگەن ھەرپ توپلاملىرىنىڭ ھەممىسىنىڭ سېغىم چەكلىمىسى بار، شۇنداقلا كۆپ تىل مۇھىتى بىلەن سىغىشمىغاچقا، Unicode ئىتتىپاقى Unicode ئۆلچىمىنى ئېلان قىلدى.

Unicode ئۆلچىمى دۇنيادىكى بارلىق ھەرپ، ئىپادە ۋە شەرتلىك بەلگىلەرنى قاپلىدى.

ھەرقانداق سۇپا، پروگرامما ۋە تىل بولۇشىدىن قەتئىينەزەر، بىردەك تېكىست سانلىق ئۇچۇرىنى بىر تەرەپ قىلىش، ساقلاش ۋە ئالماشتۇرۇش مەشغۇلاتى ئېلىپ بارالايدۇ.

Unicode ئىتتىپاقى

Unicode ئىتتىپاقى Unicode ئۆلچىمىنى ئېلان قىلدى. ئۇلارنىڭ مەقسىتى ئۆلچەملىك Unicode ئايلاندۇرۇش فورماتى (UTF) ئارقىلىق ھازىرقى زاماندىكى بارلىق ھەرپ توپلاملىرىنىڭ ئورنىنى ئېلىش.

Unicode ئۆلچىمى نۆۋەتتە زور مۇۋەپپەقىيەتكە ئېرىشكەن بولۇپ، XML، Java، ECMAScript (JavaScript)، LDAP، CORBA 3.0، WML لاردا Unicode ئىشلىتىش ئومۇملاشتى. كۆپلىگەن مەشغۇلات سېستىمىسى شۇنداقلا ھازىرقى زامان توركۆرگۈچلىرىمۇ ئوخشاشلا Unicode نى قوللايدۇ.

Unicode ئىتتىپاقى رەھبىرىيلىك ئۆلچەملەشتۈرۈشنى تەرەققىي قىلدۇرۇش تەشكىللىرى بىلەن ھەمكارلاشتى، مەسىلەن ISO ، W3C شۇنداقلا ECMA.

Unicode ئوخشىمىغان ھەرپ توپلاملىرى تەرىپىدىن سىغدۇرىلالايدۇ. كۆپ ئىشلىتىلىدىغان كودلاش ئۇسۇلى UTF-8 ۋە UTF-16 :

UTF-8
UTF8 دىكى ھەرپ 1-4 كىچە بايت ئۇزۇنلۇقتا بولىدۇ. UTF-8 ئۆلچىمى Unicode ئۆلچىمىنىڭ خالىغان ھەرپىنى ئىپادىلىيەلەيدۇ. UTF-8 يەنە ASCII بىلەن سىغىشقان بولۇپ، ئۇ توربەت ۋە ئېلخەتنىڭ ئالدىن تاللاپ ئىشلىتىدىغان كودلاش ئۇسۇلىدۇر.
UTF-16
16 بىتلىق Unicode ئايلاندۇرۇش فورماتى بىر خىل Unicode ئۆزگىرىشچان ھەرپلەر كودلىشى بولۇپ، بارلىق Unicode بۇيرۇق جەدۋىلىگە كودلاش ئېلىپ بارىدۇ. UTF-16 ئاساسلىق مەشغۇلات سېستىمىسى ۋە مۇھىتىدا ئىشلىتىلىدۇ، مەسىلەن مىكروسوفىتنىڭ Windows 2000/XP/2003/Vista/CE لىرى شۇنداقلا Java ۋە .NET ھەرپلىك كود مۇھىتى قاتارلىقلاردا.

ئەسكەرتىش: ئەڭ ئالدىدىكى 256 دانە Unicode ھەرپ توپلىمىدىكى ھەرپلەر 256 دانە ISO-8859-1 ھەرپىدۇر.

ئەسكەرتىش: بارلىق HTML 4 بىر تەرەپ قىلغۇچلار بىردەك UTF-8 نى قوللايدۇ، شۇنداقلا بارلىق XHTML ۋە XML بىر تەرەپ قىلغۇچلار UTF-8 ۋە UTF-16 نى قوللايدۇ.