статистике есть целый набор показателей, которые характеризуют центральную тенденцию. Выбор того или иного индикатора в основном зависит от характера данных, целей расчетов и его свойств.
Что подразумевается под характером данных? Прежде всего, мы говорим о количественных данных, которые выражены в числах. Но набор числовых данных может иметь разное распределение. Под распределением понимаются частоты отдельных значений. К примеру, в классе из 23 человек 2 школьника написали контрольную работу на двойку, 5 – на тройку, 10 – на четверку и 6 – на пятерку. Это и есть распределение оценок. Распределение очень наглядно можно представить с специальной диаграммы – гистограммы. Для данного примера получится следующая гистограмма.
Во многих случаях количество уникальных значений намного больше, а распределение похоже на нормальное. Ниже приведена примерная иллюстрация нормального распределения случайных чисел.
Итак, центральная тенденция. Если частоты анализируемых значений распределены по нормальному закону, то есть симметрично вокруг некоторого центра, то центральная тенденция определяется вполне однозначно – это есть тот самый центр, и математически он соответствует средней арифметической.
Как нетрудно заметить, в этом же центре находится и максимальная частота значений. То есть при нормальном распределении центральная тенденция есть не только средняя арифметическая, но и максимальная частота, которая в статистике называется модой или модальным значением.
На диаграмме оба значения центральной тенденции совпадают и равны 10.
Но такое распределение встречается далеко не всегда, а при малом числе данных – совсем редко. Чаще бывает так, что частоты распределяются асимметрично. Тогда мода и среднее арифметическое не будут совпадать.
На рисунке выше среднее арифметическое по-прежнему составляет 10, а вот мода уже равна 9. Что в таком случае считать значением центральной тенденции? ответ зависит от поставленных целей анализа. Если интересует уровень, сумма отклонений от которого равна нулю со всеми вытекающим отсюда свойствами и последствиями, то это средняя арифметическая. Если нужно максимально частое значение, то это мода.
Итак, зачем нужна мода? Приведу пару примеров. Экономист планово-экономического отдела обувной фабрики интересуется, какой размер обуви пользуется наибольшим спросом. Средний размер обуви, скорее всего, здесь не подойдет, тем более, что число может получится дробным. А вот мода – как раз нужный показатель.
Расчет моды
Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.
Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.
Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов.
1 The story took place in a forest in Epping (История происходила в лесу в Эппинге).
2 The main characters were three friends named Jamie, Mark and Sean (Главные герои – три друга Джеми, Марк и Шон).
3 The climax event was discovering a chest full of gold coins which had been stolen from the museum (Кульминационный момент был в изучении сундука, полного золотых монет, которые были украдены из музея).
4 They felt proud and happy (Они чувствовали себя гордыми и счастливыми).
Было тепло, солнечный полдень в Эппинге. Джеми и его два друга, Марк и Шон, гуляли счастливые по лесу, рассказывая историю их недавних каникул.
Вдруг, пока они наслаждались их прогулкой, ногу Марка что-то ударило, и он упал. Когда он встал, он заметил что-то торчащее из-под земли: уголок коричневой, пыльной коробки. Три любопытных друга в восторге достали коробку, но она была слишком глубоко зарыта в земле, что значило, что им придется откопать ее, чтобы достать ее. Однако, темнело, и они решили прикрыть коробку листьями и вернуться на следующий день.
В следующий полдень, мальчики поспешили к спрятанной коробке в лесу с маленькой лопаткой. Как только они добрались до места, они начали копать с энтузиазмом, и после часа изнуряющей работы, троица наконец-то вытащила таинственную коробку. Марк открыл коробку осторожно, и то, что он увидел в ней, заставило его дыхание остановиться: десятки и десятки маленьких, золотых монеток!
Позже, они отнесли сундук в полицию и узнали, что кто-то украл эти монеты из местного музея и спрятал их в лесу. Три друга были теперь горды и счастливы, что обнаружили украденные сокровища. Но они стали еще и знамениты, так как их история и фотография появилась на главной странице местной газеты!
1. Which phrases does Jonathan use to say when the story happened? — Какие фразы использует Джонатан, чтобы сказать, когда история случилась?
It was in – это было в, It was the middle of the night — была середина ночи
2. Which time expressions does he use to talk about each step in the story? — Какие выражения времени он использует, чтобы говорить о каждом шаге в истории?
Then – затем, After – после этого.
3. Which sentences contain both the Past Simple and the Past Continuous? — Какие предложения содержат как простое прошедшее так и прошедшее продолженное?
My brother and I were sleeping and Mum came to wake us up. — Мой брат и я спали, и мама пришла, чтобы разбудить нас.
We didn’t really know what was happening. — Мы действительно не знали, что происходит.
We ran into the living room and we saw that the whole family was waiting for us. — Мы побежали в гостиную, и мы увидели, что вся семья ждала нас.
4. Which adjectives does he use to describe how he was feeling? — Какие прилагательные он использует, чтобы описать, как он себя чувствовал?
Excited — в восторге
5. Which words does he use to end his story? — Какие слова он использует, чтобы закончить свою историю?
Finally — в конце концов
It was in 1969. I was about five years old. My brother and I were sleeping and Mum came to wake us up. We didn’t really know what was happening. We got dressed and after that we went downstairs. It was the middle of the night — we felt really grown-up! We ran into the living room and we saw that the whole family was waiting for us — my mum, my dad and my grandparents. Then my Dad switched on our new colour TV. I still remember his face. He looked so proud! After that we sat and watched — the pictures weren’t very clear, but I remember Neil Armstrong was doing a funny sort of dance. And the Earth looked very small and blue. Nobody spoke — we were so excited. I think the whole world was watching that evening. Finally the programme ended and we went back to bed. But I couldn’t sleep. It was an unforgettable night.
Это было в 1969 году. Мне было около пяти лет. Мой брат и я спали, и мама пришла, чтобы разбудить нас. Мы действительно не знали, что происходит. Мы оделись и после этого мы пошли вниз. Была середина ночи — мы чувствовали себя действительно по-взрослому! Мы побежали в гостиную, и мы увидели, что вся семья ждала нас — моя мама, мой папа и мои бабушка и дедушка. Затем мой папа включил наш новый цветной телевизор. Я до сих пор помню его лицо. Он выглядел таким гордым! После этого мы сидели и смотрели — снимки были не очень понятными, но я помню, Нейл Армстронг забавно станцевал. И Земля выглядела очень маленькой и синей. Никто не говорил — мы так были возбуждены. Я думаю, что весь мир смотрел телевизор в тот же вечер. Наконец программа закончилась, и мы вернулись в постель. Но я не мог спать. Это был незабываемый вечер.
статистике есть целый набор показателей, которые характеризуют центральную тенденцию. Выбор того или иного индикатора в основном зависит от характера данных, целей расчетов и его свойств.
Что подразумевается под характером данных? Прежде всего, мы говорим о количественных данных, которые выражены в числах. Но набор числовых данных может иметь разное распределение. Под распределением понимаются частоты отдельных значений. К примеру, в классе из 23 человек 2 школьника написали контрольную работу на двойку, 5 – на тройку, 10 – на четверку и 6 – на пятерку. Это и есть распределение оценок. Распределение очень наглядно можно представить с специальной диаграммы – гистограммы. Для данного примера получится следующая гистограмма.
Во многих случаях количество уникальных значений намного больше, а распределение похоже на нормальное. Ниже приведена примерная иллюстрация нормального распределения случайных чисел.
Итак, центральная тенденция. Если частоты анализируемых значений распределены по нормальному закону, то есть симметрично вокруг некоторого центра, то центральная тенденция определяется вполне однозначно – это есть тот самый центр, и математически он соответствует средней арифметической.
Как нетрудно заметить, в этом же центре находится и максимальная частота значений. То есть при нормальном распределении центральная тенденция есть не только средняя арифметическая, но и максимальная частота, которая в статистике называется модой или модальным значением.
На диаграмме оба значения центральной тенденции совпадают и равны 10.
Но такое распределение встречается далеко не всегда, а при малом числе данных – совсем редко. Чаще бывает так, что частоты распределяются асимметрично. Тогда мода и среднее арифметическое не будут совпадать.
На рисунке выше среднее арифметическое по-прежнему составляет 10, а вот мода уже равна 9. Что в таком случае считать значением центральной тенденции? ответ зависит от поставленных целей анализа. Если интересует уровень, сумма отклонений от которого равна нулю со всеми вытекающим отсюда свойствами и последствиями, то это средняя арифметическая. Если нужно максимально частое значение, то это мода.
Итак, зачем нужна мода? Приведу пару примеров. Экономист планово-экономического отдела обувной фабрики интересуется, какой размер обуви пользуется наибольшим спросом. Средний размер обуви, скорее всего, здесь не подойдет, тем более, что число может получится дробным. А вот мода – как раз нужный показатель.
Расчет моды
Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.
Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.
Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов.