Что такое кодировка символов во внутренней памяти (ISCII)?

Опубликовано: 31 Января, 2022

Все мы знаем, что компьютер не хранит буквы, числа и изображения напрямую. Он преобразует их в маленькие кусочки, называемые битами, которые имеют два значения: 0 или 1. Чтобы правильно представить каждую букву или число, нам нужны некоторые правила для их правильного хранения. Эти правила соответствуют схеме кодирования. Мы рассмотрим 3 самые популярные схемы кодирования хранилища:

ASCII

ASCII означает Американский стандартный код для обмена информацией . ASCII был введен в 1963 году Американской ассоциацией стандартов (ASA). ASCII подразделяется на 2 подкатегории:

  • Стандартный ASCII: Стандартный ASCII представляет первую половину ASCII, то есть первые 128 символов от 0 до 127. Стандартный ASCII включает непечатаемый и нижний ASCII. Непечатаемый ASCII содержит символы, которые не могут быть напечатаны на экране, и составляют различные системные коды. Они начинаются с диапазона от 0 до 31. Нижний ASCII включает оставшийся диапазон стандартного ASCII, то есть от 32 до 127. Он содержит алфавиты, числа, а также специальные символы.
  • Расширенный ASCII: Расширенный ASCII был предложен, потому что, хотя стандартного ASCII было достаточно для представления всех основных символов основных языков, его недостаточно, чтобы охватить их все. Расширенный ASCII решает эту проблему, добавляя еще 128 символов, таким образом увеличивая общее количество символов ASCII до 256.

ISCII

ISCII расшифровывается как индийский скриптовый код для обмена информацией . Он был предложен Бюро индийских стандартов (BIS) в 1991 году. Это 8-битный стандарт, в котором первые 128 символов, то есть от 0 до 127, совпадают со стандартным ASCII. Следующие 128 символов представляют собой символы индийской письменности. В кодировке присутствуют самые популярные языки, на которых говорят в Индии. К ним относятся деванагари, гуджарати, бенгали, ория, пенджаби, ассамский, каннада, телугу, малаялам, тамильский.

Юникод

С изобретением ASCII возникло ощущение, что кодировка символов ограничена и недостаточна для охвата всех языков мира. Следовательно, была необходима новая схема кодирования для охвата всех языков. Консорциум Unicode, некоммерческая организация, спроектировал и разработал Unicode в 1991 году. Первоначально в нем было всего 50 000 символов. Но сегодня Unicode охватывает более 128 000 символов.

Типы кодировки Unicode:

  • UTF-8: для кодирования используется 8 бит. Он используется в электронной почте через Интернет. Это стандартная схема кодирования, используемая в веб-приложениях и программах.
  • UTF-16: для кодирования используется 2 байта, т.е. 16 бит.
  • UTF-32: для кодирования используется 4 байта, т.е. 32 бита.

Зачем нам Юникод?

  • Unicode позволяет нам разработать единое приложение для множества различных платформ и языков. Нам не нужно переделывать одно и то же приложение для запуска на другом языке.
  • Это приводит к снижению затрат на разработку приложений.
  • Это предотвращает повреждение данных.
  • Он действует как единая схема кодирования для всех языков и платформ.
  • Его можно рассматривать как надмножество всей схемы кодирования, и, следовательно, мы можем преобразовать все схемы кодирования в Unicode и наоборот.

Вниманию читателя! Не переставай учиться сейчас. Получите все важные концепции теории CS для собеседований SDE с курсом теории CS по доступной для студентов цене и будьте готовы к отрасли.