КомпьютерлерАқпараттық технологиялар

Кодтау «Unicode»: сипаты кодтау стандарты

Әрбір пайдаланушы интернет оның функциясының бір немесе басқа орнату әрекеті кем дегенде бір рет жазбаша экранда көріп латын әріптерімен сөз «Unicode.» ол сіз осы мақаланы оқып үйренеді, қандай болып табылады.

анықтама

Кодтау «Unicode» - таңба кодтау стандарты. Ол Юникод Inc. коммерциялық емес ұйымының ұсынған болатын 1991. стандартты құжаттың таңбалар әр түрлі ірі ықтимал санын жақындастыруға арналған. оның негізінде құрылды бет, (орыс кәріс) әр түрлі тілдер мен математикалық белгілері хаттар мен таңбалар болуы мүмкін. Бұл жағдайда, таңбалар жиынының барлық таңбалардың кез келген проблемалар жоқ көрсетіледі.

құру себептері

Бір кезде, ұзақ бір жүйенің пайда болуына дейін «Unicode» кодтау құжаттың авторы преференциялар негізінде таңдалады. Осы себепті, жиі құжатты оқып, ол әр түрлі кестелерді пайдалану қажет болды. Кейде қатты орташа пайдаланушы өмірін қиындатады, бірнеше рет істеу қажет. Жоғарыда айтылғандай, 1991 жылы осы мәселені шешу кодтау жаңа түрін ұсынуға Юникод Inc. коммерциялық емес ұйым шақырылды. Ол ескірген және стандарттар түрлі амалдарын әзірленді. «Unicode» - уақытта мүмкін емес қол ozvolila кодтау: таңбалардың үлкен санын қолдайтын құралын құру. The нәтижесі асып көптеген күту - болды құжаттар бір мезгілде қамтитын екі ағылшын және орыс мәтін, латын, және математикалық өрнектер.

Бірақ арқасында қазірдің өзінде сол уақытта қолданыстағы стандарттардың үлкен түрлі туындаған проблемаларды шешуге қажеттілігі алдында бірыңғай кодтау құру. Олардың ең көп таралған:

  • Elvish жазу, немесе «түсініксіз сөздер»;
  • таңбалар жиынының шектеулері;
  • Мәселе кодтаудың түрлендіру;
  • қаріп қайталау.

Шағын тарихи шолу

аула 80 делік. Компьютерлік аппараттық емес, сондықтан ортақ және бар нысаны әр түрлі бүгін. әрбір OS бірегей болып табылады және әрбір энтузиастардың нақты қажеттіліктерін тазартылған ал. Ақпарат алмасу қосымша дәнекерлеуіш барлық айналады үшін қажет. Тырысып оқуға құжат құрылған басқа операциялық жүйе, жиі дисплейлер оғаш жиынтығы кейіпкерлері, және The Game басталады отырып The кодтау. Ол әрқашан тіпті кейінірек тез жасауға, және алты айдан ашылмады кейде қажетті құжат, және жоқ. жиі ақпарат алмасу адамдар, өздері үшін түрлендіру кестені жасаңыз. Ал содан кейін оларға жұмыс қызықты бөлшекті ашады: екі бағытта оларды құру керек, алға және артқа «Менің сіздің бастап». нәтижесі, бірақ керісінше емес - қарапайым инверсия есептеу машина, мүмкін емес, ол үшін көзі оң жақ бағаннан, және сол жеткізіңіз. Сіз кез келген құжаттың арнайы таңбаларды пайдалану қажеттігін көрсеңіз, олар бірінші қосылатын болды, содан кейін тағы бір, ол осы таңбаға істеу керек, қандай серіктеске түсіндіруге үшін «түсініксіз сөздер.» бола емес, Ал әрбір кодтау үшін ОЖ телнұсқаларын үлкен санына құруға әкелді, ол өз қаріптерді дамыту немесе жүзеге асыру екенін ұмытпауымыз керек.

UTF-8, UTF-16, ANSI, UCS-2: бетте қаріптер деп одан әрі елестетіп көріңізші, сіз шағын нотасымен бірдей Times New Roman 10 дана көресіз. Енді сіз әмбебап стандарттарын әзірлеу аманатты екенін түсіну?

«Құрушылардың әкелердің»

Xerox жылғы 1987 кезде Джо Беккер табуға болады Юникод құру көздері, Apple Ли Коллинз және Марк Дэвис бірге әмбебап таңбалар жиынының практикалық құру саласында зерттеулер басталды. Жылы тамыз 1988, Dzho Беккер жарияланған жобасы ұсыныс үшін The құру 16-биттік көптілді халықаралық кодтау жүйесі.

Бірнеше ай өткен соң Юникод жұмыс тобы ортақ кодтау стандартын алдын ала қалыптастыру бойынша жұмыс аяқталуға мүмкіндік беретін, Sun Microsystems және басқа да бірнеше мамандар Гленн Rayt, RLG жылғы Кен Уистлер және Майк Kernegana қамтиды кеңейтілді.

Жалпы сипаттама

Unicode символы тұжырымдамасына негізделген. Осы анықтама бойынша жазбаша нақты түрінде бар және grapheme (олардың «портреттері») арқылы іске дерексіз құбылыс жатады. Әрбір таңба белгілі бірлігі стандартқа тиесілі «Unicode» Бірегей код беріледі. Мысалы grapheme B ағылшын және орыс алфавитін, сондай-ақ, бірақ ол Unicode 2 түрлі кейіпкерлердің сәйкес келеді. Олар үшін конверсия жататын кіші әріппен, негізгі деректер базасын, сипаттар жиынтығы және толық атауын сипаттайды әрқайсысы т. Е,.

Unicode артықшылықтары

«Unicode» кодтау басқа замандастарының бастап «шифрлау» таңбалар үшін белгілері орасан қор бар. 28 таңбадан қолдап отыр, оның алдындағы 8 бит болды, бұл факт, бірақ жаңа дизайны деп алға үлкен қадам болды, қазірдің өзінде 216 таңбалар болды. Бұл кодтау дерлік барлық қолда бар және ортақ алфавиттер мүмкіндік берді.

Бар The пайда туралы «Unicode» бұдан былай қажеті үшін пайдалану түрлендіру үстел: ақ бір стандартты, бұл жай ғана жоққа The қажеттілігі үшін оларға. Сол сияқты, олар келмеске кетіп, ал «түсініксіз сөздер» - бір стандартты оларға қайталанатын қаріптерді жасау қажеттігі жүзеге мүмкін емес, сондай-ақ ереже құрады.

Unicode дамыту

Әрине, прогресс жерде емес, және бірінші тұсаукесері 25 жыл бойы өтті, өйткені. Алайда, кодтау «Unicode» қасарысып әлемдегі өзінің позициясын сақтайды. көптеген жолдармен бұл іске асыру оңай болды және тарады, меншіктік (төленген) және ашық бастапқы Ппрограммалық қамтамасыз етудiң өңдеушiлерiне танылған фактісі арқасында мүмкін болды.

Біз ғасыр бұрын тоқсанында бірдей коды «Unicode» бөлімін қараңыз бүгін сенеміз тиіс емес. Қазіргі уақытта, ол нұсқасы 5.h.h ауыстырылды, және кодталған рәміздер саны көп маржа белгілері әлі Юникод-16 (кодтау, олардың шектелген санының 216 максималды сомасын) қолдау қолдау үшін бас тартты пайдалану мүмкіндігі туралы 231. дейін ұлғайды. Өзі құрылған сәттен бастап және нұсқасы 2.0.0 дейін «Unicode Standard», ол 2 есе дерлік енгізілген таңбалар саны өсті. кейінгі жылдары өсуі мүмкіндіктер мен жалғасы. Арналған нұсқа 4.0.0 қазірдің өзінде бар қажеттілік үшін өсім The стандартты өзі, және бұл жүзеге болды. Нәтижесінде, «Unicode» бүгін біз оны білеміз, ол нысанын тапты.

Юникод тағы қандай?

байтақ қатар, үнемі таңбалардың саны жаңартылған, мәтін ақпаратты -Encoding «Unicode» тағы бір пайдалы қасиет болып табылады. Бұл аталатын қалыпқа болып табылады. Орнына сарп арқылы The бүкіл құжат сипаты арқылы сипаты, және алмастыратын The белгішелердің The хат-кестеде, пайдалану бірі The қолданыстағы қалыпқа алгоритмдері. Бұл не?

Оның орнына арнайы алгоритм, түрлі алфавит ұқсас болуы мүмкін, сол сипаттағы тұрақты тексеру жөніндегі компьютердің ресурстарын ысырап. Ол сізге ұқсас белгілер бөлек баған іздеу кестесін жасайды және барлық деректерді қайта емес, қайта-қайта, оларға қазірдің өзінде қолдануға мүмкіндік береді.

Мұндай алгоритмдері әзірленді және енгізілді төрт. Әрбір айырбастау сондықтан олардың кез келген біреуін қоңырау мүмкін ең тиімді болып табылады, бірінен ерекшеленеді, қатаң белгілі принципі бойынша орын алады. ерекше қажеттіліктері үшін арналған әрбір, енгізілген және табысты пайдаланылды.

тарату стандарты

оның тарихы кодтау «Unicode» 25 жылдары Мен әлемдегі, бәлкім, ең кең тараған алды. осы Стандартқа сәйкес бағдарламалар мен веб-беттер ретінде реттеледі. кеңдігімен Unicode енді интернет-ресурстардың 60% астам пайдаланылады деп көрсетуі мүмкін.

Енді, сіз «Unicode» стандартты пайда болған, білемін. Қандай ол, сіз сондай-ақ білетін және өнертабыс толық маңызын бағалай алады, сарапшылар Unicode Inc. тобы арқылы жүзеге асырылады 25 жылдан астам бұрын.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 kk.birmiss.com. Theme powered by WordPress.