|
«Статистика дизайн информации», 2 часа Тема урока: «Статистика – дизайн информации», 2 часа
Статистика - это математическая теория, позволяющая познать мир через опыт. В. Томпсон Цель урока: ввести понятие статистики, статистических исследований , найти применение статистических данных при решении вероятностных задач
Методы достижения цели: сбор данных по определенной тематике, применение табличных и диаграммных методов, групповая и индивидуальная работа.
Ход урока.
1. Понятие статистики и ее задачи.
2. Значение таблиц и диаграмм в ходе представления информации.
3. Выборочный метод.
4. Графическое представление статистического распределения.
5. Выборочное среднее.
6. Мода и размах выборки.
7. Дисперсия и среднее квадратичное отклонение.
1. Математическая статистика - наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Главной задачей математической статистики является установление соответствия между данными реального мира и его математическим описанием.
Людям присуще воспринимать окружающую среду как последовательность фактов, событий. Им дано анализировать поступающую информацию (хотя и не всем из них это удается) и делать выводы из такого анализа и учитывать их в своей сознательной деятельности. Поэтому можно смело утверждать, что во все времена, все люди занимались и занимаются статистическими “исследованиями”, даже не зная иногда такого слова “статистика”.
Все наши наблюдения за окружающим нас миром можно условно разделить на два класса: наблюдения за событиями, которые могут произойти или не произойти; наблюдения за физическими величинами, значения которых в момент наблюдения могут быть различными. В окружающем нас мире происходят случайные события, а наблюдаемые нами значения показателей внешней среды являются случайными величинами.
При этом важные характерные черты наблюдаемых явлений проясняются в ходе сбора статистических сведений и наглядного их представления. Умение регистрировать статистические сведения и представлять их в виде простейших таблиц и диаграмм уже само по себе характеризует наличие у школьника некоторого статистического опыта. В нем находят отражение самые первые, пусть еще не до конца осознанные представления о неоднозначности и изменчивости реальных явлений, о случайных, достоверных или невозможных результатах наблюдений, о конкретных видах статистических совокупностей, их особенностях, общих свойствах. Эти умения дают возможность формировать правильное представление не только о явлениях с ярко выраженной случайностью, но и о таких явлениях, случайная природа которых неочевидна и затушевана многими осложняющими восприятие факторами.
2. Одна группа учащимися обрабатывает данные классного журнала по определенному предмету. По ним определяет, какие оценки получил каждый ученик, сравнить результаты одноклассников и сделать прогноз о том, какие оценки им поставят за четверть.
Другая группа учащимся два месяца наблюдает за погодой, полученные данные представляет в таблице:
Погода
| месяцы
| Всего дней
| Ясно
|
|
|
| Пасмурно
|
|
|
| Переменная облачность
|
|
|
| Используя таблицу отвечает на вопросы: «В каком месяце было больше ясных дней? Сколько всего было пасмурных дней?»
Список класса
| Любимые лакомства
|
|
|
|
| Любимые лакомства
| Подсчет голосов
| Всего ребят
| пряники
|
| 0
| конфеты
| IIIIIIIIIIII
| 12
| мороженое
| IIIIIIIIIII
| 11
| печенье
| II
| 2
| Третья группа проводит опрос в классе по теме: «Любимые лакомства». Учащимся предлагается ответить на вопрос: « Что ты любишь больше всего: пряники, конфеты, мороженое, печенье?» Сначала таблица, которую составляют учащиеся, оказывается слишком длинной и неудобной для анализа:
Тогда составляем другую таблицу:
Такая таблица дает более наглядное представление о предпочтениях учащихся.
Данные таблиц представляем в виде столбчатых и круговых диаграмм. Ученики учатся читать диаграммы. В ходе анализа выясняем, что столбчатые диаграммы следует использовать в тех случаях, когда необходимо наглядно сопоставить результаты опроса, продемонстрировать динамику процесса, показать, как изменяется со временем интересующее нас явление и т.д.; что круговые диаграммы используются в тех случаях, когда нужно представить соотношения между частями целого.
Простейшие навыки в «чтении» таблиц и графиков позволяют подметить некоторые закономерности наблюдаемых явлений, увидеть за формами представления статистических данных конкретные свойства явлений с присущими им особенностями и причинными связями.
В дальнейшем ученик сможет применить эти навыки: на уроках физики, химии, биологии при выполнении лабораторных и практических работ оформить результаты наблюдений и опытов; на уроках географии, истории, обществознания использовать таблицы и справочники, воспринимать информацию, представленную в графической форме. Эти умения необходимы каждому человеку, так как со статистическим материалом, представленным в различной форме, он постоянно встречается во всех источниках информации, рассчитанных на массовую аудиторию,— в газетах, журналах, книгах, по телевидению и т. п.
3. Для решения задач исследования проводится эксперимент (измерение, тестирование, анкетирование), в результате которого получают значение некоторой случайной величины (результаты тестирования, кол-во баллов). Если в эксперименте участвуют все объекты генеральной совокупности, то такое обследование называют сплошным. При изучении множества однородных объектов относительно некоторого характерного признака (количественного или качественного), обычно подвергают испытаниям некоторое его подмножество (выборку) случайно отобранных объектов. Множество объектов, из которых производится выборка, называется генеральной совокупностью. Задачей исследования является изучение признаков генеральной совокупности, которые определяются влиянием некоторых случайных факторов.
На практике обычно применяют выборочный метод, который заключается в том, что из генеральной совокупности случайным образом извлекают n элементов. Количество элементов в выборке называется ее объемом. Исследователь изучает и анализирует выборочную совокупность и на основании полученных показателей делает вывод о параметрах генеральной совокупности.
Допустим, из генеральной совокупности извлечена выборка объемом n, измерена некоторая величина Х, в результате чего получен ряд значений х1, х2, . . . хn. Наблюдаемые значения хi признака Х называются вариантами.
Пример: измерена масса тела девочек 7 лет. Полученные данные образуют ряд: 24 22 23 28 24 23 25 27 25 25.
Отдельные значения этого ряда называются вариантами. Если варианта хi появилась m раз, то число m называют частотой значения признака, а ее отношение к объему выборки m/n - относительной частотой значения признака.
Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным рядом. Пример ранжированного ряда: 23 23 24 24 25 25 25 27 28.
Х
| 22
| 23
| 24
| 25
| 27
| 28
| m
| 1
| 2
| 2
| 3
| 1
| 1
| Соответствие между вариантами вариационного ряда и их частотами называется статистическим распределением выборки.
4. Графическое представление статистического распределения. Для его построения на оси x откладывают значения вариант, на оси у - соответствующие им частоты. Точки с координатами (хi; mi) соединяют отрезками, полученная ломаная линия называется полигоном частот. Можно построить и полигон относительных частот.
У каждой выборки есть своего рода «паспортные данные». Они весьма существенны и важны. Следует только точно понимать, что они в принципе не могут дать полных данных о выборке: абсолютной информацией о выборке является сама выборка. Но так как объемы выборок данных, как правило, очень велики, то приходится иметь дело с некоторым набором важных числовых характеристик этих выборок.
5. Выборочным средним называется среднее арифметическое всех значений величины, встречающихся в выборке. . Вычисление среднего значения массы тела девочек 7 лет: Х=(24+22+23+28+24+23+25+27+25+25)/10=24,6.
Если выборочное среднее вычисляется по вариационному ряду, то находят сумму произведений вариант на соответствующие частоты, и делят на количество элементов в выборке.
. Х=(22+23•2+24•2+25•3+26+27)/10=24,6.
Выборочное среднее, не имеет наглядной иллюстрации с помощью полигона частот. Оно, по определению, усредняет все различные результаты, заменяя полную, но объемную информацию одним-единственным числом. Само это число, как мы видим, может и не входить в результаты выборки.
Выборочное среднее является основной характеристикой положения, показывает центр распределения совокупности, позволяет охарактеризовать исследуемую совокупность одним числом, проследить тенденцию развития, сравнить различные совокупности. Выборочное среднее значение имеет наглядный физический смысл. На оси абсцисс отметим п точек координаты которых равны вариантам выборки. В первую точку поместим массу, равную относительной частоте первой варианты. Во вторую точку поместим массу, равную относительной частоте второй варианты и т. д. Получится система из п материальных точек. Общий вес этой системы равен 1. Так вот, ее центр тяжести в точности совпадает с выборочным средним значением.
6.Мода — величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т.е. варианта, обладающая наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. На графике – это точка, в которой достигается максимум полигона частот.
Пример: найти моду выборочной совокупности по массе тела девочек 7 лет. Мо = 25.
Размах выборки – это разница между максимальной и минимальной вариантами.
R=Xmax - Xmin. . Этот показатель является характеристикой рассеяния ряда и
показывает диапазон варьирования величины. На графике – это длина области
определения полигона частот.
Мы составили простейший «паспорт» выборки. Он состоит из размаха, моды, выборочного среднего.
Если выборка представлена большим количеством различных значений случайной величины, то проводят группировку данных. В результате получается интервальный вариационный ряд. Размах варьирования признака разбивают на несколько равных интервалов и указывают количество вариант, попавших в каждый интервал. В этих случаях, в первую очередь, следует разумно выбрать шаг деления промежутка между наименьшей и наибольшей вариантой. Слишком маленький шаг даст слишком большое число участков и не упростит вычисления. Слишком большой шаг приведет к слишком серьезному искажению первоначальных данных. Идеальный случай, когда шаг уже кто-то заранее сообщил: учитель, учебник. Например. Алгоритм построения интервального вариационного ряда.
1. Исходя из объема выборки, определить количество интервалов.
| n
| 25-40
| 40-60
| 60-100
| 100-200
|
| k
| 5-6
| 6-8
| 7-10
| 8-12
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
интервал
| Середина интервала
| m
| 60-65
| 62,5
| 14
| 65-70
| 67,5
| 33
| 70-75
| 72,5
| 29
| 75-80
| 77,5
| 14
| 80-85
| 82,5
| 7
| 85-90
| 87,5
| 3
| п – количество опрошенных, к - количество интервалов, к≈√п.
2. Вычислить размах ряда: R=Xmax - Xmin.
3. Определить ширину интервала: h≈R/k.
4. Составить интервальный вариационный ряд.
Пример. После измерения массы тела 100 женщин тридцати лет получили следующие данные:
Графическим изображением интервального вариационного ряда является гистограмма частот. Для ее построения на оси х откладывают интервалы шириной h, на каждом интервале строят прямоугольник высотой m.
Вычисление среднего значения массы тела женщин 30 лет. Х=(62,5•14+67,5•33+72,5•29+77,5•14+82,5•7+87,5•3)/ 100=71,3. Задачи для решения ( по группам – 7 групп по 5 задач) 1. Стоимость мясных блюд в кафе "Привет" представляет ряд: 198; 214; 222; 224; 229; 173; 189. Найдите разницу между средним арифметическим и медианой этого ряда.
2. Учащимися класса за контрольную работу по алгебре были получены оценки: 3; 4; 4; 4; 2; 5; 5; 5; 3; 3; 4; 3; 3; 5; 4. Найдите разницу между средним арифметическим и медианой этого ряда.
3. Записан рост (в сантиметрах) пяти учащихся: 158, 166, 134, 130, 132. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
4. Записан вес (в граммах) пяти плодов сливы: 32, 29, 41, 48, 40. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
5. Записана длина прыжка с разбега (в см) пяти участников школьной спартакиады: 366, 368, 340, 332, 354. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
6. Поезда прибывали на станцию метро со следующими интервалами: 2мин 11с; 2мин 8с; 2 мин 10с; 2 мин 12с; 2 мин 19с. Найти среднее значение и медиану данного ряда интервалов движения.
7. Записан возраст (в годах) семи сотрудников: 25, 37, 42, 24, 33, 50, 27. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
8. Записана температура воздуха (в градусах Цельсия) пяти измерений в течение дня: 10, 17, 23, 18, 12. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
9. Записана высота (в см) пяти саженцев-трехлеток яблони сорта «Антоновка»: 147, 140, 136, 153, 134. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
10. Курс доллара в течение недели: 30,48; 30,33; 30,45; 30,28; 30,37; 30,29; 30,34. Найдите медиану этого ряда.
11. В течение четверти Маша получила следующие отметки по химии: 2, 3, 5, 4, 2, 5, 4, 4, 3, 2, 4, 5, 5, 5, 5. Найдите медиану оценок.
12. В течение четверти Дима получил следующие отметки по физике: 2, 3, 3, 4, 2, 5, 4, 4, 3, 4, 5, 3, 3, 5, 4. Найдите среднее арифметическое отметок и медиану оценок. В ответе запишите разность медианы и среднего арифметического.
13. Каждые полчаса гидролог замеряет температуру воды в водоеме и получает следующий ряд значений: 12,8; 13,1; 12,7; 13,2; 12,7; 13,3; 12,6; 12,9; 12,7; 13; 12,7. Найдите медиану этого ряда.
14. На протяжении одной недели апреля в одно и то же время суток измеряли температуру воздуха на улице (в градусах Цельсия): 7, 10, —3, 5, 0, —4, -1. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
15. Записан рост (в сантиметрах) пяти учащихся: 154, 170, 134, 129, 133. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
16. В течение четверти Ира получила следующие отметки по математике: три «двойки», две «тройки», десять «четверок» и пять «пятерок». Найдите сумму среднего арифметического и медианы ее оценок.
17. Для семи будильников нашли отклонение от точного времени (в минутах): 7, -3, 0, -4, 4, -2, 5. На сколько отличается среднее арифметическое этого набора чисел от его медианы?
18. В десяти прыжках на лыжах с трамплина спортсмен показал следующие результаты (в метрах): 96; 84; 89; 101; 98; 94; 96; 92; 101; 99. Установите соответствие между статистическими характеристиками этого ряда:
A. среднее арифметическое; Б. медиана; B. размах и их значениями: 1) 17 2) 96 3) 95 4) 97
-
19. Десять детей младшей группы спортшколы по плаванию в соревнованиях в 50-метровом бассейне показали следующие результаты (в секундах): 44, 32, 29, 31, 48, 28, 42, 33, 38, 35. Установите соответствие между статистическими характеристиками этого ряда:
A. среднее арифметическое; Б. медиана ; B. размах и их значениями: 1) 34 2) 20 3) 38 4) 36
-
20. В таблице приведены расходы семьи на питание в течение недели. Найти размах данного ряда.
понедельник
| вторник
| среда
| четверг
| пятница
| суббота
| воскресенье
| 300
| 300
| 290
| 320
| 290
| 345
| 350
| 21. В таблице приведен возраст сотрудников одного из отделов:
№
| Фамилия
| Возраст
| 1
| Башмачкин
| 42
| 2
| Галошев
| 24
| 3
| Каблуков
| 30
| 4
| Сапогов
| 24
| 5
| Тапочкин
| 40
| Найдите размах, моду, медиану и среднее арифметическое этого ряда.
22. В таблице приведены количества очков, набранных в чемпионате некоторыми баскетболистками: №
| Фамилия
| Возраст
| 1
| Дождева
| 48
| 2
| Градова
| 26
| 3
| Лунева
| 20
| 4
| Метелева
| 40
| 5
| Снегова
| 26
| Найдите размах, моду, медиану и среднее арифметическое этого ряда.
23. Игрок в боулинг сделал 5 бросков и выбил 8, 9, 7, 10, 6 кеглей. Найдите среднее арифметическое этого ряда чисел и медиану.
24. Средняя температура в январе –18 градусов, в феврале –15 градусов, в марте –7 градусов, в апреле +12 градусов. Найдите среднее арифметическое этого ряда чисел.
25. В магазине в течение 5 дней с 10 до 11 утра фиксировалось количество посетителей, сделавших покупки. Получили следующий ряд данных: 33; 24; 38; 36; 24. На сколько отличается среднее арифметическое этого набора чисел от его моды?
26. На соревнованиях по стрельбе учащимися 9 класса были показаны результаты, представляющие ряд 82, 49, 61, 77, 58, 42 очков. Найдите среднее арифметическое этого ряда чисел.
27. Температура воздуха в Москве в течение недели представляла ряд 23, 25, 27, 24, 21, 28, 27 градусов ниже нуля. Укажите медиану этого ряда чисел.
28. Продажа фруктов в магазине за неделю представляет ряд 345, 229, 456, 358, 538, 649, 708 кг в день. Найдите разницу между медианой и средним арифметическим этого ряда чисел.
29. Повышение цен на некоторые продукты представляет собой ряд 3,4; 6,5; 2,8; 3,7; 5,1; 4,1; 5,9 процентов. Найдите разницу между медианой и средним арифметическим этого ряда чисел.
30. В таблице приведены данные по производству пшеницы в России в 1995-2001 гг. млн.тонн
год
| 1995
| 1996
| 1997
| 1998
| 1999
| 2000
| 2001
| производство
| 30,1
| 34,9
| 44,3
| 27,0
| 31,0
| 34,5
| 47,0
| Найдите разницу между медианой и средним арифметическим этого ряда чисел.
31. Коля и Вася прыгали в длину и записали в сантиметрах результаты своих пяти попыток.
Вася
| 190
| 205
| 195
| 210
| 200
| Коля
| 185
| 200
| 215
| 190
| 190
| Найдите размах между числовыми значениями прыжков каждого мальчика и разницу между медианами результатов Васи и Коли.
32. Стоимость билетов на поезд "Тургенев" ( Москва – Симферополь): люкс – 9053 руб., купе – 4124 руб., плацкарт – 2384 руб. Определите медиану и среднее арифметическое этого ряда чисел.
33. Согласно опубликованным результатам 2011 года, самый дорогой сэндвич – в Исландии (7,44 доллара), Норвегии (6,63) и Швейцарии (5,04). Найдите среднее арифметическое этого ряда чисел.
34. Игрок в боулинг сделал 5 бросков и выбил 8, 9, 7, 10, 6 кеглей. Найдите среднее арифметическое этого ряда чисел.
35. Средняя температура в январе –18 градусов, в феврале –15 градусов, в марте –7 градусов, в апреле +12 градусов. Найдите медиану и размах этого ряда чисел.
7. Выборочное среднее дает представление о том, вокруг какой точки числовой оси группируются значения случайной величины. Но эти значения могут группироваться вокруг этой величины более или менее густо.
Например, некий человек каждый день ездит на работу. У него есть два варианта на выбор: он может сесть возле самого дома на трамвай и доехать прямо до работы, а может немного пройти до метро, проехать на метро, и еще немного пройти от метро до работы. Время поездки в обоих случаях, конечно же, - случайные величины. Оба варианта поездки занимают примерно одно и то же время, но первый из них подвержен гораздо большему влиянию внешних обстоятельств (трамваи ломаются гораздо чаще, чем поезда метро, на улицах бывают пробки и т. д.). Будем отмечать на числовой оси время, затраченное на эти ежедневные поездки (каждый из вариантов поездки будем отмечать на своей оси, получим два рисунка). Ясно, что на рисунке, описывающем поездки на метро, точки будут лежать очень густо, очень мало отклоняясь от среднего значения,
а на рисунке, который описывает поездку на трамвае, будут заметны очень большие отклонения от среднего.
Для того чтобы различать такого рода ситуации используется дисперсия (от латинского слова dispersio - рассеиваю). На основе статистических данных находим выборочную дисперсию:
. Если выборочная дисперсия вычисляется по вариационному ряду, то используется следующая формула.
Итак, чем больше дисперсия, тем больше разброс значений случайной величины, тем больше неопределенности, случайности в ее поведении.
Дисперсия измеряется в квадратных единицах, поэтому не является основным показателем рассеяния вариационного ряда.
Выборочное среднее квадратичное отклонение s является основной характеристикой разброса значений, оно измеряется в тех же единицах, что и сама случайная величина. .
Рассмотрим следующий пример. В 2009 учебном году выпускники лицея №12 г. Жуковского сдавали ГИА по математике. Экзамен сдавали 71 человек. По полученным оценкам была составлена таблица:
Х=(3•4+4•21+5•46)/71 ≈4,59; D≈0,35; σ≈0,59.
По данным показателям можно сделать вывод, что экзамен сдан успешно.
Работа по группам (см. приложение)
Домашнее задание: собрать и обработать данные о заболеваниях в детей в школе №12 г.Жуковского.
Приложение.
|
|
|