Что такое организация данных?
Иногда мы смотрим на определенную информацию и долго обрабатываем всю информацию, но ее становится трудно запомнить, особенно когда данные, предоставленные нам, длинные и сложные. Это когда человеческий мозг начинает визуализировать вещи, чтобы сделать их более запоминающимися. Короче говоря, это то, что делает и обработка данных. Процесс сбора и представления данных таким образом, чтобы их было легко понять человеческому мозгу. известен как обработка данных. Обработка данных, также известная как статистика, оказалась наиболее эффективным способом представления данных.
Организация необработанных данных
Прежде чем изучать организацию данных, давайте подумаем только о термине «данные». Что такое данные?
Данные — это не что иное, как систематически записанные значения и факты о количестве. Когда данные, доступные нам, не являются систематизированными или организованными, они известны как необработанные данные. В основном данные, предоставляемые нам, представляют собой необработанные данные, и их систематическая организация может быть в виде гистограммы, пиктограммы, двойной гистограммы или любой другой формы визуального представления, называемой организацией необработанных данных.
Пример необработанных данных
15 человек спросили об их любимых видах спорта, вот ответы, которые они дали,
Крикет, волейбол, теннис, крикет, крикет, теннис, бадминтон, волейбол, бадминтон, бадминтон, крикет, теннис, волейбол, крикет, теннис.
Организация необработанных данных в виде таблицы
| Спортивный | Число Людей |
| Крикет | 5 |
| Волейбол | 3 |
| Большой теннис | 4 |
| Бадминтон | 3 |
Совершенно очевидно, что данные, представленные в виде таблицы, лучше понять и упорядочить, в то время как необработанные данные трудно запомнить.
Следовательно, приведенную выше таблицу легче интерпретировать и анализировать. Эта таблица называется таблицей частотного распределения и объясняет, сколько раз выбраны определенные данные.
Частота
Термин «частота» в таблице распределения частот говорит о том, сколько раз встречались или повторялись определенные данные. Например, в приведенном выше примере количество людей — это частота, частота выбора крикета в качестве вида спорта равна 5, а частота выбора бадминтона в качестве вида спорта — 3 и так далее.
Сгруппированное частотное распределение
Групповое частотное распределение используется, когда данные чрезвычайно велики и сложно упорядочить частотность отдельных данных.
Например, в классе 20 учеников, и все они сдали тест по математике из 100. Все они сдали тест. Ниже приведены полученные ими оценки,
35, 31, 80, 44, 50, 67, 89, 40, 45, 66, 71, 86, 56, 59, 69, 67, 82, 92, 43, 57.
Поскольку формирование таблицы для всех данных даст очень большую таблицу, лучше сгруппировать их отдельно, а затем записать частоту для соответствующей группы.
Давайте составим группу из 10 баллов, начиная с 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100.
| Оценки в группе | Количество студентов |
| 30-40 | 3 |
| 40-50 | 4 |
| 50-60 | 3 |
| 60-70 | 3 |
| 70-80 | 2 |
| 80-90 | 4 |
| 90-100 | 1 |
Необходимость организации данных
Преимущества организации данных,
- Это экономит много времени.
Возьмите предыдущий пример и выясните, какой вид спорта выбирает большинство людей, ответ может быть дан как по необработанным данным, так и по систематизированным данным, но в последнем случае время, затрачиваемое на ответ на вопрос, и сложность ответа были намного меньше. .
- Удаляет возможные ошибки.
В неорганизованных данных вероятность ошибки не равна нулю, могут быть ошибки либо при сборе данных, либо при их представлении, однако в организованных данных гарантируется, что предоставленные данные полностью правильны и не содержат ошибок.
- Легко понять и запомнить.
Организованные данные визуально привлекательны и намного легче запоминаются, чем необработанные данные.
Методы организации данных
Существует множество методов организации данных, от простых и простых методов, таких как пиктограммы и метки, до методов, которые можно использовать для сложных и больших данных, таких как гистограммы, гистограммы и двойные гистограммы. Давайте кратко узнаем о каждом из этих методов,
Счетные отметки
Tally — это самый простой способ понять числа и просто пометить их по группам. Для 1 – 1 балл, для 2 – 2 балла, для 3 – 3 балла, для 4 – 4 балла, для 5 – перекрестите 4 балла, чтобы представить цифру 5, повторите то же самое для других цифр.
В приведенной ниже таблице объясняется, как представлены метки Tally,

Пиктограмма
Представление данной информации в виде изображений, чтобы данные были в визуальной форме, а также легко понимались, является пиктограммой. Пиктограммы можно назвать самой ранней формой не только представления определенных данных, но и способом общения, когда языки еще не были открыты, единственный недостаток пиктограмм в том, что их не рекомендуется использовать, когда информация слишком велика и сложна, т. картинки будут утомительны.
Гистограмма
Графический способ представления данных с помощью длинных столбцов, длина которых определяется частотой появления каждого из данных. Гистограммы являются наиболее часто используемым методом организации данных, поскольку они помогают легко определить относительный размер данных, и даже большой объем данных может быть помещен в гистограмму с помощью масштабирования.
Пример:
Представьте следующую таблицу в виде гистограммы,
| Спортивный | Число Людей |
| Крикет | 5 |
| Волейбол | 3 |
| Большой теннис | 4 |
| Бадминтон | 3 |

Двойная гистограмма
Предположим, что есть два набора данных, которые связаны друг с другом, и для представления двух наборов данных не обязательно требуются две гистограммы, вместо двух отдельных гистограмм в таком случае предлагается двойная гистограмма. Двойная гистограмма лучше, так как две отдельные величины можно очень легко сравнить. Например, человек ведет учет расстояния, которое он проезжает на своем велосипеде каждый день, и он хочет увидеть свое улучшение за две отдельные недели, для этого же может быть представлен двойной график за две недели.
Круговая диаграмма
Это графическое представление данных на круге, круговой диск известен как пирог, поскольку он имеет ту же форму. Срезы на круговой диаграмме показывают объем данных для каждой категории. Пропорциональные или относительные данные лучше всего представляются на круговой диаграмме, поскольку все данные легко сопоставимы.
Пример,
Представьте следующие данные на круговой диаграмме,
| Спортивный | Число Людей |
| Крикет | 5 |
| Волейбол | 3 |
| Большой теннис | 4 |
| Бадминтон | 3 |
Круговая диаграмма для приведенной выше таблицы,

Примеры проблем
Вопрос 1: В течение 3 недель мужчина решает следить за своим здоровьем и бегать каждое утро, он бегал каждое утро, а затем составил сгруппированную таблицу распределения частот, пройденные им километры указаны ниже, Составьте таблицу для того же.
3 км, 3,5 км, 5 км, 4,8 км, 6 км, 5 км, 6,1 км, 4 км, 5,9 км, 7 км, 7,2 км, 6,3 км, 6,8 км, 7,1 км, 8 км, 6,5 км, 8,1 км, 8,8 км, 7,4 км, 6,9 км, 8,1 км,
Решение:
The Grouped Frequency distribution when the groups are divided as, 2-4km, 4-6km, 6-8km, 8-10km shall look like,
Kilometers Covered Number of days 2-4km 2 4-6km 5 6-8km 10 8-10km 4
Вопрос 2: В саду есть 5 разных видов цветочных растений, 3 растения маргаритки, 5 растений подсолнуха, 4 растения зеленого тюльпана, 6 растений розы, 2 растения георгина. Сделайте пиктограмму для вышеуказанных данных.
Решение:
The Pictures that represents the number of plants in the garden,
The Pictograph for the data given in question is,
Вопрос 3: Нарисуйте круговую диаграмму для следующих данных, взятых из деревни, информация о различных возрастных группах и о том, в каком процентном соотношении они присутствуют в деревне.
| Возраст жителей | Относительная численность населения в процентах |
| Младенец | 5 % |
| Взрослый | 35 % |
| Молодой | 40 % |
| Старый | 20 % |
Решение:
The Pie Chart for the above data,
Вопрос 4: Сделайте столбчатую диаграмму для данных, полученных из деревни, чтобы получить информацию об их возрасте и о том, в какой пропорции представлены различные категории.
| Возраст жителей | Относительная численность населения в процентах |
| Младенец | 5 % |
| Взрослый | 35 % |
| Молодой | 40 % |
| Старый | 20 % |
Решение:
The Bar Graph for the Table given above,
Вопрос 5: Нарисуйте метки для полученных данных о количестве растений в саду,
Ромашка- 3, Подсолнух- 5, Зеленый тюльпан- 4, Роза- 6, Георгин- 2
Решение:
The Tally Marks For the above data,




