Математические методы обработки статистических рядов. Наглядная математическая статистика. Лагутин М.Б. Методы математической статистики

Математическая статистика

Предмет и методы

Математическая статистика - раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений . В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.

В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчётов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).

Примечания

Литература

  • Вероятность и математическая статистика. Энциклопедия / Гл. ред. Ю. В. Прохоров. - М.: Изд-во «Большая Российская Энциклопедия», 1999.
  • Вальд А. Последовательный анализ, пер. с англ.- М.: Физматгиз, 1960.
  • Ширяев А. Н. Статистический последовательный анализ. Оптимальные правила остановки - М.: Наука, 1976

См. также

Ссылки


Wikimedia Foundation . 2010 .

  • Линейная алгебра
  • Математическая физика

Смотреть что такое "Математическая статистика" в других словарях:

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Современная энциклопедия

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надежность и точность … Большой Энциклопедический словарь

    Математическая статистика - МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Истоки математической статистики можно найти в сочинениях ученых конца 17 начала 19 вв. Во многих… … Иллюстрированный энциклопедический словарь

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - наука, занимающаяся описанием и анализом результатов наблюдений массовых явлений методами теории вероятностей. Типичные задачи М. с. определение типов распределений случайной величины, проверка статистических гипотез, оценивание параметров и т. п … Геологическая энциклопедия

    МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - (от лат. status – состояние). Смежная для методики обучения языкам наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Законы М. с. широко используются в организации… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

    Математическая статистика - раздел математики, посвященный методам и правилам обработки и анализа статистических данных (т.е. сведений о числе объектов, обладающих определенными признаками, в какой либо более или менее обширной совокупности). Сами… … Экономико-математический словарь

    математическая статистика - Раздел математики, посвященный методам и правилам обработки и анализа статистических данных (т.е. сведений о числе объектов, обладающих определенными признаками, в какой либо более или менее обширной совокупности). Сами методы и правила строятся… … Справочник технического переводчика

    Математическая статистика - раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой либо… … Большая советская энциклопедия

    математическая статистика - наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность … Энциклопедический словарь

Математическая статистика – это раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических целей .

Статистическими данными называются сведения о числе и характере объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными свойствами.

Метод исследования, опирающийся на рассмотрение статистических данных от тех или иных совокупностей объектов, называется статистическим.

Формальная математическая сторона статистических методов исследования безразлична к природе исследуемых объектов и составляет предмет математической статистики.

Основная задача математической статистики состоит в получении выводов о массовых явлениях и процессах по данным наблюдений над ними или экспериментов.

Статистика – наука, которая позволяет увидеть закономерности в хаосе случайных данных, выделить установившиеся связи в них и определить наши действия, чтобы увеличить долю правильно принятых решений.

Многие известные сейчас зависимости между различными аспектами окружающего нас мира получены путем анализа накопленных человечеством данных. После статистического обнаружения зависимостей человек уже находит то или иное рациональное объяснение обнаруженным закономерностям.

Для изложения начальных определений статистики обратимся к примеру.

Пример . Предположим, необходимо оценить степень изменения коэффициента интеллектуальности за 3 года обучения у 100 студентов. В качестве показателя рассмотрим отношение нынешнего коэффициента к ранее измеренному коэффициенту (три года назад), умноженному на 100 %.

Получим последовательность 100 случайных величин: 97,8; 97,0; 101,7; 132,5; 142; …; 122. Обозначим ее через Х .

Определение 1. Последовательность наблюдаемых в результате исследования случайных величин Х в статистике называется признаком.

Определение 2. Различные значения признака называются вариантами.

Из приведенных значений вариант трудно получить некоторую информацию о динамике изменения коэффициента интеллектуальности в процессе обучения. Упорядочим данную последовательность по возрастанию: 94; 97,0; 97,8; …142. Из полученной последовательности уже можно извлечь некоторую полезную информацию – например, легко определить минимальное и максимальное значения признака. Но не видно, как распределен признак среди всей совокупности обследуемых студентов. Разобьем варианты на интервалы. Согласно формуле Стерджеса, рекомендуемое число интервалов

m = 1+3,32lg(n) ≈ 7,6, а величина интервала .

Диапазоны полученных интервалов приведены в столбце 1 таблицы.


Посчитаем, сколько значений признака попало в каждый интервал, и запишем в столбец 3.

Определение 3. Число, показывающее, сколько вариант попало в данный i-й интервал, называется частотой и обозначается n i .

Определение 4. Отношение частоты к общему числу наблюдений называется относительной частотой (w i) или весом.

Определение 5. Вариационным рядом называется расположенный в порядке возрастания или убывания ряд вариантов с соответствующими им весами.

Для данного примера вариантами являются середины интервалов.

Определение 6. Накопленной частотой ( ) называется число вариант со значением признака меньшим, чем х (хÎR).

Министерство образования и науки Российской Федерации

Костромской государственный технологический университет

И.В. Землякова, О.Б. Садовская, А.В. Чередникова

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

в качестве учебного пособия для студентов специальностей

220301, 230104, 230201 очной формы обучения

Кострома

ИЗДАТЕЛЬСТВО

УДК 519.22 (075)

Рецензенты: кафедра математических методов в экономике
Костромского государственного университета им. Н.А. Некрасова;

канд. физ.-мат. наук, доцент кафедры математического анализа

Костромского государственного университета им. Н.А. Некрасова К.Е. Ширяев.

З 51 Землякова, И.В. Математическая статистика. Теория и практика: учебное пособие / И.В. Землякова, О.Б. Садовская, А.В. Чередникова. – Кострома: Изд-во Костром. гос. технол. ун-та, 2010. – 60 с.

ISBN 978-5-8285-0525-8

Учебное пособие содержит в максимально доступной форме теоретический материал, примеры, тесты и прокомментированный алгоритм выполнения заданий по типовому расчету.

Предназначено для студентов вузов, обучающихся по специальностям 220301, 230104, 230201 очной формы обучения. Может использоваться как во время лекций, так и на практических занятиях.

УДК 519.22 (075)

ISBN 978-5-8285-0525-8

 Костромской государственный технологический университет, 2010

§1. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 4

§2. ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ. 4

РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ. СПОСОБЫ ОТБОРА 4

(СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ) 4

§3. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ. 6

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ 6

§4. СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 18

§5. ГЕНЕРАЛЬНАЯ СРЕДНЯЯ. ВЫБОРОЧНАЯ СРЕДНЯЯ. 20

ОЦЕНКА ГЕНЕРАЛЬНОЙ СРЕДНЕЙ ПО ВЫБОРОЧНОЙ СРЕДНЕЙ 20

§6. ГЕНЕРАЛЬНАЯ ДИСПЕРСИЯ. ВЫБОРОЧНАЯ ДИСПЕРСИЯ. 22

ОЦЕНКА ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ ПО ИСПРАВЛЕННОЙ ДИСПЕРСИИ 22

§7. МЕТОД МОМЕНТОВ И МЕТОД НАИБОЛЬШЕГО ПРАВДОПОДОБИЯ НАХОЖДЕНИЯ ОЦЕНОК ПАРАМЕТРОВ. МЕТОД МОМЕНТОВ 25

§8. ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ 27

§9. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ СТАТИСТИЧЕСКИХ ДАННЫХ ТЕОРЕТИЧЕСКОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ 31

§ 10. ПОНЯТИЕ О КОРРЕЛЯЦИОННОМ И РЕГРЕССИВНОМ АНАЛИЗЕ 39

ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ 44

ОТВЕТЫ И УКАЗАНИЯ 46

Приложения 51

§1. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математические законы теории вероятностей не являются абстрактными, лишёнными физического содержания, они представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях.

Каждое исследование случайных явлений, выполняемое методами теории вероятностей, опирается на экспериментальные данные.

Зарождение математической статистики было связано со сбором данных и графическим представлением полученных результатов (сводки рождаемости, бракосочетаний и т.д.). Это описательная статистика. Нужно было свести обширный материал к небольшому числу величин. Разработка методов сбора (регистрации), описания и анализа экспериментальных (статистических) данных, получаемых в результате наблюдения массовых, случайных явлений, составляет предмет математической статистики .

При этом можно выделить три этапа :

    сбор данных;

    обработка данных;

    статистические выводы-прогнозы и решения.

Типичные задачи математической статистики:

    определение закона распределения случайной величины (или системы случайных величин) по статистическим данным;

    проверка правдоподобия гипотез;

    нахождение неизвестных параметров распределения.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

§2. ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ.

РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ. СПОСОБЫ ОТБОРА

(СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ)

Массовые случайные явления могут быть представлены в виде тех или иных статистических совокупностей однородных объектов. Каждая статистическая совокупность обладает различными признаками.

Различают качественные и количественные признаки. Количественные признаки могут изменяться непрерывно или дискретно .

Пример 1. Рассмотрим производственный процесс (массовое случайное явление) изготовления партии деталей (статистическая совокупность).

Стандартность детали – качественный признак. Размер детали – количественный признак, изменяющийся непрерывно.

Пусть требуется изучить статистическую совокупность однородных объектов относительно некоторого признака. Сплошное обследование, т. е. исследование каждого из объектов статистической совокупности на практике применяется редко. Если исследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование нет смысла. Если совокупность содержит очень большое число объектов, то провести сплошное обследование практически невозможно. В таких случаях из всей совокупности случайно отбирают ограниченное число объектов и исследуют их.

Определение. Генеральной совокупностью называется вся подлежащая изучению совокупность.

Определение. Выборочной совокупностью или выборкой называется совокупность случайно отобранных объектов.

Определение. Объёмом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Объём генеральной совокупности обозначается через N , а выборки через n .

На практике обычно применяют бесповторную выборку , при которой отобранный объект не возвращается в генеральную совокупность (иначе получаем повторную выборку).

Для того чтобы по данным выборки можно было судить о всей генеральной совокупности, выборка должна быть репрезентативной (представительной). Для этого каждый объект должен быть отобран случайно, и все объекты должны иметь одинаковую вероятность попасть в выборку. применяются различные способы отбора (рис. 1).

Способы отбора

(способы организации выборки)

Двухступенчатый

(генеральная совокупность разделена

на группы)

Одноступенчатый

(генеральная совокупность не делится

на группы)


Простой случайный

(объекты извлекаются случайно

из всей совокупности)

Типический

(объект выбирается из каждой типической части)

Комбинированный

(из общего числа групп отбирают несколько и из них по несколько объектов)


Простая случайная повторная выборка

случайная бесповторная выборка

Механический

(из каждой группы

выбирают по одному объекту)

Серийный

(из общего числа групп – серий отбирают несколько

и их сплошь исследуют)

Рис. 1. Способы отбора


Пример 2. На заводе 150 станков производят одинаковые изделия.

1. Изделия со всех 150 станков перемешивают и случайно отбирают несколько изделий – простая случайная выборка .

2. Изделия с каждого станка располагаются отдельно.

      Со всех 150 станков отбирают по несколько изделий, причём анализируют отдельно изделия с более изношенных и менее изношенных станков – типическая выборка.

      С каждого из 150 станков по одному изделию – механическая выборка.

      Из 150 станков отбирают несколько (например, 15 станков), и все изделия с этих станков исследуют – серийная выборка.

      Из 150 станков выбирают несколько, а затем по несколько изделий с этих станков – комбинированная выборка.

§3. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ.

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ

Пусть требуется изучить статистическую совокупность относительно некоторого количественного признака X . Числовые значения признака будем обозначать через х i .

Из генеральной совокупности извлекается выборка объёма п.

    Количественный признак Х дискретная случайная величина .

Наблюдаемые значения х i называют вариантами , а последовательность вариантов, записанных в возрастающем порядке, – вариационным рядом .

Пусть x 1 наблюдалось n 1 раз,

x 2 наблюдалось n 2 раз,

x k наблюдалось n k раз,

причем
. Числа n i называют частотами , а их отношение к объёму выборки, т.е.
, – относительными частотами (или частостями), причем
.

Значение вариант и соответствующие им частоты или относительные частоты можно записать в виде таблиц 1 и 2.

Таблица 1

Варианта x i

x 1

x 2

x k

Частота n i

n 1

n 2

n k

Таблицу 1 называют дискретным статистическим рядом распределения (ДСР) частот, или таблицей частот.

Таблица 2

Варианта x i

x 1

x 2

x k

Относительная частота w i

w 1

w 2

w k

Таблица 2  ДСР относительных частот, или таблица относительных частот.

Определение. Модой называется наиболее часто встречающийся вариант, т.е. вариант с наибольшей частотой. Обозначается x мод .

Определение. Медианой называется такое значение признака, которое делит всю статистическую совокупность, представленную в виде вариационного ряда, на две равных по числу части. Обозначается
.

Если n нечетно, т.е. n = 2 m + 1 , то = x m +1.

Если n четно, т.е. n = 2 m , то
.

Пример 3 . По результатам наблюдений: 1, 7, 7, 2, 3, 2, 5, 5, 4, 6, 3, 4, 3, 5, 6, 6, 5, 5, 4, 4 построить ДСР относительных частот. Найти моду и медиану.

Решение . Объем выборки n = 20. Составим ранжированный ряд элементов выборки: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7. Выделим варианты и подсчитаем их частоты (в скобках): 1 (1), 2 (2), 3 (3),
4 (4), 5 (5), 6 (3), 7 (2). Строим таблицу:

x i

w i

Наиболее часто встречающийся вариант x i = 5. Следовательно, x мод = 5. Так как объем выборки n – четное число, то

Если на плоскости нанести точки и соединить их отрезками прямых, то получим полигон частот .

Если на плоскости нанести точки , то получим полигон относительных частот .

Пример 4 . Построить полигон частот и полигон относительных частот по данному распределению выборки:

x i

Каждое исследование в области случайных явлений своими корнями всегда уходит в эксперимент, в опытные данные. Числовые данные, которые собирают при изучении какого-либо признака некоторого объекта, называются статистическими . Статистические данные являются первоначальным материалом исследования. Для того, чтобы они представляли научную или практическую ценность, их надо обработать методами математической статистики.

Математическая статистика - это научная дисциплина, предметом изучения которой является разработка методов регистрации, описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных явлений.

Основными задачами математической статистики являются:

    определение закона распределения случайной величины или системы случайных величин;

    проверка правдоподобия гипотез;

    определение неизвестных параметров распределения.

Все методы математической статистики основаны на теории вероятностей. Однако в силу специфичности решаемых задач математическая статистика выделяется из теории вероятностей в самостоятельную область. Если в теории вероятностей считается заданной модель явления и производится расчет возможного реального течения этого явления (рис.1), то в математической статистике подбирается подходящая теоретико-вероятностная модель, исходя из статистических данных (рис.2).

Рис.1. Общая задача теории вероятностей

Рис.2. Общая задача математической статистики

Как научная дисциплина математическая статистика развивалась вместе с теорией вероятностей. Математический аппарат этой науки построен во второй половине XIX века.

2. Генеральная совокупность и выборка.

Для изучения статистических методов вводятся понятия генеральной и выборочной совокупностей. В общем случае под генеральной совокупностью понимается случайная величина X с функцией распределения
. Выборочной совокупностью или выборкой объемаn для данной случайной величины X называется набор
независимых наблюдений этой величины, гденосит название выборочного значения или реализации случайной величиныX. Таким образом, можно рассматривать как числа (если эксперимент проведен и выборка состоялась) и как случайные величины (до проведения эксперимента), поскольку они меняются от выборки к выборке.

Пример 1 . Для определения зависимости толщины ствола дерева от его высоты было отобрано 200 деревьев. В данном случае объем выборки n=200.

Пример 2. В результате распиловки древесностружечных плит на круглопильном станке было получено 15 значений удельной работы резания. В этом случае n=15.

Д
ля того чтобы по данным выборки уверенно судить об интересующем нас признаке генеральной совокупности, объекты выборки должны правильно ее представлять, то есть выборка должна бытьрепрезентативной (представительной). Репрезентативность выборки обычно достигается случайностью отбора объектов: каждому объекту генеральной совокупности обеспечивается равная со всеми остальными вероятность попадания в выборку.

Рис.3. Демонстация репрезентативности выборки