КомпьютерлерАқпараттық технологиялар

Компьютерде мәтін ақпаратты кодтау

Компьютер - сіз, жасау түрлендіру және алатын күрделі құрылғы ақпаратты сақтау. Алайда, компьютерлік біз үшін өте түсінікті жолын жұмыс істемейді - графикалық, мәтіндік және сандық деректер екілік массивтерді ретінде сақталады сандар. Осы мақалада біз мәтіндік ақпаратты қалай кодтау қарастырамыз.

таңбалар тізбегі - біз үшін қандай компьютер мәтіні болып табылады. Әрбір символы, бірлік және нөл белгілі бір жиынтығы болып табылады. рәміздерді астында жоғарғы және төменгі регистрлерді ғана емес білдіреді латын әріптерін әліпбиін, сонымен қатар белгілері, арифметикалық белгілер, арнайы таңбаларды, арнайы таңбаларды және тіпті кеңістік тыныс.

мәтіндік ақпаратты екілік кодтау

ішкі контроллері туралы белгілі бір пернені басу арқылы түрлендіріледі электрлік сигнал жібереді екілік код. Кодекс экранда көрсетіледі белгілі бір символы, сәйкес келеді. ұсыну үшін латын әліпбиіне халықаралық жүйесі құрылды кодтау сандық формат ASCII жылы. Осылайша бір символы жазу үшін 1 байт, бірлік және нөл сегіз-символдар тізбегі тұрады талап етеді. жазу аралығы - 00000000 жылғы 11111111 үшін, мәтін ақпаратты, яғни кодтау осы жүйені пайдалана отырып, АҚШ-тың 256 таңбаларды білдіруге мүмкіндік береді. Көп жағдайда, бұл жеткілікті болып табылады.

ASCII екі бөлікке бөлінеді. (00000000 жылғы 01111111 дейін) бірінші 127 символдар халықаралық болып табылады және белгілі бір символдар және ағылшын алфавитінің әріптер бар. Екінші бөлігі - (10000000 жылғы 11111111 дейін) кеңейту - латын ерекшеленеді жазу табылатын ұлттық әліпбиін, ұсынуға арналған.

ASCII кодтау мәтіндік ақпарат хаттар реттік нөмірі, оның ASCII-код үлкен мән, яғни, үлкен, ретін арттыру қағидаты бойынша құрылған. кестенің қайраткерлері және орыс бөлігі сол принцип бойынша құрылады.

Алайда, әлемде кириллица әріптері үшін кодтау бірнеше түрлері бар. ең көп таралған - пайдаланылатын CP 1251 (кодтау мәтіндік ақпарат, KOI-8 (бірінші ruifitsirovannyh Unix операциялық жүйесінде 70-ші жылдары үшін қолданылған сегіз-бит кодтау), ISO 8859-5 (Халықаралық стандарттау бюросы әзірлеген) болып табылады Қазіргі заманғы OS Windows), сондай-ақ 65536 таңбаларды енгізу үшін пайдаланылуы мүмкін Юникод 2-байттық кодтау. байланысты олар әр түрлі операциялық жүйелер мен түрлі пайымдауларға үшін, әр уақытта әзірленді, бұл шын мәнінде кодтау осындай алуан. пайдаланушыны кодтау сәйкессіздіктен жылғы шатасып белгішелер жиынын көресіз - Осыған байланысты, жиі бір орта мәтінді аудару кезінде қиындықтар бар. Мен бұл жағдайды қалай түзетуге болады? Word, мысалы, кезінде құжат, мәтін дисплейі проблемалар туралы хабарлама ашылды және перекодирование үшін бірнеше опцияны ұсынады.

Осылайша, компьютердің жер қойнауы мәтіндік ақпаратты кодтау және өңдеу - процесс күрделі және уақыт жұмсайды ұйымдастырылған. кез келген әліпбиінің барлық рәміздер сандар ғана белгілі бір тізбегі болып табылады екілік жүйесін, бір ұяшық - бұл ақпаратты бір байт болып табылады.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 kk.birmiss.com. Theme powered by WordPress.