Одномерные непрерывные распределения. Ч. 2 [3изд.]
 978-5-9963-2548-1, 978-5-9963-2509-2, 978-5-94774-470-5, 978-5-94774-468-2

Citation preview

ОДНОМЕРНЫЕ НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ

Continuous Univariate Distributions Volume 2 Second Edition

NORMAN L. JOHNSON University of North Carolina Chapel Hill, North Carolina SAMUEL KOTZ University of Maryland College Park, Maryland N. BALAKRISHNAN McMaster University Hamilton, Ontario, Canada

A Wiley-Interscience Publication JOHN WILEY & SONS, INC. New York • Chichester • Brisbane • Toronto • Singapore

ТЕОРИЯ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ

Н. Л. Джонсон, С. Коц, Н. Балакришнан

ОДНОМЕРНЫЕ НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ в двух частях

Часть 2 Перевод 2го английского издания В. А. Кокотушкина под редакцией Е. В. Чепурина

3-е издание (электронное)

Москва БИНОМ. Лаборатория знаний 2014

УДК 519.2 ББК 22.17 Д42

С е р и я о с н о в а н а в 2010 г. Д42

Джонсон Н. Л. Одномерные непрерывные распределения [Электронный ресурс] : в 2 ч. Ч. 2 / Н. Л. Джонсон, С. Коц, Н. Балакришнан ; пер. 2-го англ. изд. — 3-е изд. (эл.). — Электрон. текстовые дан. (1 файл pdf : 603 с.). — М. : БИНОМ. Лаборатория знаний, 2014. — (Теория вероятностных распределений). — Систем. требования: Adobe Reader XI ; экран 10". ISBN 978-5-9963-2509-2 (Ч. 2) ISBN 978-5-9963-2548-1 Приводятся необходимые общие сведения из теории непрерывных одномерных распределений, описан ряд их важных общих классов. Подробно излагаются свойства девяти семейств базовых распределений (нормального, логнормального, Коши, Вейбулла, хи-квадрат, гамма-, обратного гауссовского, Парето). Важно, что издание снабжено обширной библиографией, таблицами и графиками, необходимыми для активной работы с соответствующими семействами распределений. УДК 519.2 ББК 22.17

Деривативное электронное издание на основе печатного аналога: Одномерные непрерывные распределения : в 2 ч. Ч. 2 / Н. Л. Джонсон, С. Коц, Н. Балакришнан ; пер. 2-го англ. изд. — М. : БИНОМ. Лаборатория знаний, 2012. — 600 с. : ил. — (Теория вероятностных распределений). — ISBN 978-5-94774-470-5 (Ч. 2); ISBN 978-5-94774-468-2.

В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений, установленных техническими средствами защиты авторских прав, правообладатель вправе требовать от нарушителя возмещения убытков или выплаты компенсации

ISBN 978-5-9963-2509-2 (Ч. 2) ISBN 978-5-9963-2548-1

c 1994 by John Wiley & Sons, Inc. Copyright ○ All Rights Reserved. This EBook is published under license with the original publisher John Wiley & Sons, Ltd. c БИНОМ. Лаборатория знаний, 2012 ○

Предисловие редактора перевода Книга, которую Вы держите в руках, является завершающим томом трехтомника 1), посвященного наиболее полному изложению на русском языке математических свойств более чем 300 параметрических семейств распределений одномерных дискретных и непрерывных случайных величин. Этот трехтомник в обязательном порядке должен быть во всех библиотеках университетов и вузов, в которых теория вероятностей и математическая статистика являются обязательным элементом образовательной программы, в библиотеках организаций естественной, гуманитарной и экономической сфер, где феномен случайности является значимым фактором профессиональной деятельности. Немаловажно отметить, что представленный авторами материал охватывает временной промежуток «от Ферма и Паскаля» и почти до начала двухтысячных годов. Семейства распределений одномерных случайных величин вошли в научный обиход в качестве мощной математической дисциплины, востребованность которой для описания явлений реальной действительности с течением времени только возрастает. В трехтомнике более 5000 ссылок на публикации в весьма авторитетных изданиях; более половины из этих публикаций связаны тематически с реальными приложениями. Часто статистическая модель для описания данных выбирается по принципу прецедента. И в этом случае приходится обращаться к анализу уже вышедших публикаций. Аналогичный библиографический анализ приходится проводить и на начальном этапе математических исследований, дабы избежать, например, повторения уже полученных ранее результатов. История и методы построения распределений, нашедшие свое отражение в трехтомнике, способны подтолкнуть читателя и к построению новых семейств распределений: процесс их возникновения, конечно, не закончен. Авторский коллектив трехтомника широко известен своей преподавательской деятельностью, общепризнанными результатами в теории и приложениях статистических методов, обширным цитированием в научной и справочной статистической литературе. Выбранная ими структура представления материала и объем представленных сведений должны заинтересовать достаточно широкий круг «стохастического» сообщества. Действительно, сам перечень характеристик, в рамках которого описываются отдельные семейства распределений, говорит о фундаментальности представленных сведений. Так, каждая из глав, где сообщаются свойства одного из 24 наиболее популярных семейств распределений, строится по следующей схеме. Сначала обсуждаются существующие параметризации для плотности или функции распределения соответствующей семейству распределений случайной величины (тема 1), за этой темой следует исторический экскурс в процесс становления семейства 1) Здесь

имеются ввиду: • Джонсон Н. Л., Коц С., Кемп А. Одномерные дискретные распределения. М. : БИНОМ. Лаборатория знаний, 2010. • Джонсон Н. Л., Коц С., Балакришнан Н. Одномерные непрерывные распределения. Часть 1, М. : БИНОМ. Лаборатория знаний, 2010. • Джонсон Н. Л., Коц С., Балакришнан Н. Одномерные непрерывные распределения. Часть 2, М. : БИНОМ. Лаборатория знаний, 2012.

5

6

ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА

распределения как «субъекта» теории вероятностей (тема 2). Далее идет набор параметрических формул для моментов и других численных характеристик семейства распределений (тема 3) и приводится описание специфических аналитических свойств семейства, включая характеризационные свойства (тема 4) и всевозможные (асимптотические) аппроксимации (тема 5). Затем обсуждаются вычислительные методы и наличие необходимых таблиц или номограмм для численного расчета характеристик семейства (тема 6), говорится о родственных семействах и о возможных обобщениях данного семейства (тема 7), подробно описывается процедура статистических выводов на основе как полной, так и цензурированной независимой выборки (тема 8). Как дань наступившей компьютерной эре приводятся алгоритмы порождения случайных величин из рассматриваемого семейства распределений, а также сообщаются результаты решения статистических проблем на основе компьютерного моделирования (тема 9). И, наконец, весьма содержательный раздел главы под названием «Приложения» связан с реальным опытом использования соответствующего семейства в реальных задачах (тема 10). Необходимо отметить, что материал справочника излагается на принципе самодостаточности. В первой главе первого тома приводятся необходимые общие сведения из математического анализа, теории вероятностей, математической статистики и компьютерного моделирования. Глава 2 тома 1 и гл. 12 тома 2, по существу, являются кратким учебным пособием по теории и систематике распределений случайных величин. К таковым же кратким учебным пособиям можно отнести содержание гл. 8 и 9 тома 1, в которых излагаются способы построения новых семейств распределений на основе метода смешивания распределений и метода суммирования «случайного числа случайных величин». В гл. 11 тома 1 и гл. 33 тома 3 приводятся сведения о свойствах ряда распределений, стоящих особняком от принятой в трехтомнике классификации семейств распределений. Отметим, что в третьем томе излагаются сведения о семействах распределений экстремальных значений, логистических, Лапласа, бета, равномерных, распределений продолжительности жизни. Своеобразным учебным пособием служат главы, посвященные свойствам семейства распределений для функций от независимых гауссовых случайных величин. В частности, речь идет о распределениях коэффициента корреляции, центральных и нецентральных распределений Стьюдента и Фишера, нецентрального χ -квадрат распределения. Возвращаясь к проблемам процесса обучения стохастическим дисциплинам и их приложениям, отметим, что данное издание для преподавателей окажется весьма полезным в качестве источника разнообразных и готовых к непосредственному использованию примеров на лекциях и тем для практикумов и спецкурсов. Для студентов и аспирантов — это наиболее простой из класса доступных источников конкретных вероятностно-статистических знаний, необходимых для выполнения учебных заданий и проведения самостоятельных научных исследований. Несомненно, что фактом издания трехтомника издательство «БИНОМ. Лаборатория знаний» внесло весомый вклад в материальное обеспечение развития российской науки и ее приложений. Чепурин Е. В. доцент, к. ф.-м. н., зам. декана механико-математического факультета МГУ имени М. В. Ломоносова по математико-экономической специализации

Посвящается: Реджине Эландт—Джонсон, Розали Коц, Колин Катлер и Саре Балакришнан

Предисловие

Замечания из предисловия к новому изданию справочника Непрерывные одномерные распределения, ч. 1 в полной мере относятся также и к настоящему тому. Данное второе издание отличается от первого в следующих отношениях • Глава «Распределения экстремальных значений», которая была завершающей в оригинальном издании «Непрерывные одномерные распределение, ч. 1», теперь появляется как первая в данном томе • Глава «Квадратические формы» отложена для проектируемого тома, посвященного Непрерывным многомерным распределениям. • Завершающие разделы главы «Разнообразные распределения» были радикально переработаны и сокращены. Ряд тем были изложены подробнее, а на других темах был сделан значительно меньший акцент • Объем каждой из глав существенно увеличен (в среднем, вдвое). Число ссылок увеличено почти втрое. • Для того чтобы отобразить последние разработки по тематике тома, авторы вынуждены были, иногда без особой охоты, включать описания многочисленных результатов, связанных с аппроксимациями. Несмотря на то, что часто эти аппроксимации с вычислительной точки зрения весьма изобретательны, их практическая ценность в век высокопроизводительных компьютеров существенно снижается. • С другой стороны, мы были рады включить в том многочисленные примеры реального использования семейств распределений (таких как, логистическое, Лапласа, бета, F, и нецентральные хи-квадрат, F и t) в новых разнообразных областях приложений науки, бизнеса и технологии. Мы приветствуем этот тренд, связанный с проникновением более тонких стохастических моделей во все области человеческой деятельности. С момента публикации нового издания справочника Непрерывные одномерные распределения, ч. 1 вышли в свет шестое издание кенделловского Современного курса статистики, первого тома Теорий распределений Стьюарта А. и Орда Дж. К., которые содержат ряд деталей по теории одномерных и многомерных распределений. Хотя это было уже после выхода первого тома, мы попытались скоординировать материал, представленный в данном томе (в подходящих местах) с результатами, представленными Стьюартом 7

8

ПРЕДИСЛОВИЕ

и Ордом. Приносим наши искренние признания профессору Кейт Орд за представленные нам копии страниц доказательств, для того чтобы облегчить процесс достижения объявленной выше цели. Мы с благодарностью отмечаем огромное число замечаний, полученных от наших коллег из статистического и инженерного сообщества и связанных с опечатками и упущениями, допущенными в первом издании данного тома. Это было очень ценно для нас при подготовке нового издания. Мы выражаем свою благодарность за неоценимую помощь Миссис Лизе Брукс (университет Северной Каролины) и Миссис Дебби Искоэ (Гамильтон, Канада) за их искусную перепечатку рукописи. Мы благодарим также библиотекарей университетов Северной Калифорнии, Мэриленда и университета Мак Мастера за их помощь при библиотечных розысках. Особую благодарность мы выражаем миссис Кейт Роач и миссис Ширли Томас из издательства John Wiley & Sons за их искренние усилия по обеспечению высокого качества данного издания. Мы признательны также мисс Дане Эндрюс за редактирование столь объемной рукописи. В данном томе с любезного разрешения Institute of Mathematical Statistics, the American Statistical Association, the Biometrika Trustees, the Institute of Electrical and Electronics Engineering, Marcel Dekker, Inc., the Royal Statistical Society, the Australian Statistical Society, the Statistical Society of Canada, the Biometric Society, North Holland, Gordon and Breach Science Publishers, а также редакторов журналов Naval Research Logistics Quarterly, Water Resources Research, Soochow Journal of Mathematics, Journal of the Operational Research Society, Sankhy¯a, Decision Sciences, Mathematical and Computer Modelling, International Statistical Review, and Oxford Bulletin of Economics and Statistics воспроизведены ранее опубликованные таблицы и рисунки.

ГЛАВА 22

Распределение экстремальных значений

1.

Историческая справка

Изучение свойств распределений экстремальных значений в течение долгого времени находилось несколько в стороне от основных направлений статистической теории распределений. Дело в том, что на ранней стадии создания статистической теории основное внимание уделялось проблемам подгонки кривых распределения, и лишь значительно позже — развитию теории статистического вывода. В настоящее время теория распределения экстремальных значений является составной частью многих естественнонаучных дисциплин. Упомянем в связи с этим изучение таких явлений как ливни, ураганы, наводнения, загрязнение атмосферы и коррозия, а также тонкие математические результаты, касающиеся точечных случайных процессов и регулярно меняющихся функций. Распределениями экстремальных значений первоначально интересовались абстрактные вероятностники, да специалисты в прикладных областях — инженеры и гидрологи. Только с недавних пор эти распределения вошли в сферу существенных интересов специалистов по статистике. Хронологически первые сведения о существовании семейства распределенных экстремальных значений связаны с работой 1709 г. Николая Бернулли, где обсуждается распределение координаты точки, наиболее удаленной от начала отсчета, из n точек, случайно расположенных на отрезке длины t. См. об этом также в книге Gumbel (1958). Теория распределений экстремальных значений по запросам астрономии восходит, по-видимому, к решению задачи об отбраковке и использовании резко уклоняющихся наблюденных значений. Ранние статьи Fuller (1914) и Griffith (1920), посвященные этой теме, весьма специальны как по постановке прикладных задач, так и по примененным математическим методам. Начало систематического изучения теории можно, вероятно, отнести к статье Bortkiewicz (1922), где изучается размах выборки из нормальной популяции. Об этом уже говорилось в гл. 13 и, как там было отмечено, дальнейшие результаты последовали достаточно быстро. С современной точки зрения следует указать на важность статьи Bortkiewicz (1922), поскольку в ней впервые ясно сформулирована проблема нахождения распределения наибольшего значения в последовательности случайных величин. Буквально через год von Mises (1923) вычислил значение математического ожидания, а Dodd (1923) вычислил медиану распределения и обсудил проблемы, возникающие для 9

10

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

негауссовских порождающих распределений. Очень близко к вопросам, рассматриваемым в настоящей главе, примыкает результат Fr´echet (1927), нашедшего асимптотическое распределение наибольших значений. В следующем году появилась работа Fisher and Tippet (1928), независимо получивших близкие результаты для одой и той же проблемы. Еще Fr´echet (1927) выделил один из классов предельных распределений наибольшей из порядковых статистик. Fisher and Tippet (1928) показали, что распределение экстремальных значений принадлежит одному из трех возможных типов. Еще раньше Tippett (1925) изучил поведение функции распределения и моментов наибольшего выборочного значения при возрастании объема выборки из нормального распределения. Von Mises (1936) нашел простые достаточные условия слабой сходимости функции распределения наибольшего из значений независимых нормальных случайных величин к каждому из трех типов распределений, ранее указанных в статье Fisher and Tippet (1928). Через семь лет Гнеденко (1943) опубликовал фундаментальное исследование по теории распределений экстремальных значений и установил необходимые и достаточные условия слабой сходимости функции распределения экстремальных значений к соответствующим предельным функциям. Усовершенствованное изложение результатов Б. В. Гнеденко содержится в статье de Haan (1970). Классическая статья Гнеденко (1943) приведена полностью в первом томе книги Основные достижения статистики (Breakthroughs in Statistics) и снабжена предисловием R. L. Smith с анализом влияния результатов Б. В. Гнеденко на дальнейшее развитие теории распределений экстремальных значений. За теоретическими исследованиями 20-х — середины 30-х гг. в 30-х и в 40-х гг. XX в. последовал целый ряд работ, связанных с приложениями распределений экстремальных значений. Сюда относятся исследования продолжительности человеческой жизни, интенсивности радиоактивного излучения [Gumbel (1937a, b)], прочности материалов [Weibull (1939)], наводнений [Gumbel (1941, 1944, 1945, 1949a] и [Rantz and Riggs (1949)]. Сейсмические явления исследуются в статье Nordquist (1945), ливневые осадки — в работе Potter (1949). Существенный вклад в прикладные исследования, связанные с распределениями экстремальных значений, принадлежат Гумбелю. Большинство полученных им прикладных результатов приводится в монографии Gumbel (1958), которая является расширенным вариантом брошюры Gumbel (1954). Многочисленные приложения распределений экстремальных значений приводятся также в п. 14 настоящей главы. Библиография в конце главы насчитывает около 350 названий. Столь значительное число работ, однако, составляет лишь небольшую часть от общего числа публикаций, связанных с заявленной темой. Даже библиография в монографии Gumbel (1958), не включающая публикаций последних 35 лет, содержит гораздо больше ссылок. Столь большое число работ свидетельствует не только об актуальности и практической важности тематики, но также об отсутствии координации усилий исследователей, что зачастую приводит к повторному (и даже многократному) переоткрытию известных результатов, появляющихся в разных изданиях.

11

2. ВВЕДЕНИЕ

2.

Введение

К семейству распределений экстремальных значений обычно относят следующие три типа семейств: Тип 1: Тип 2:

Pr[X  x] = exp {−e−(x−ξ )/θ }. ⎧ 0, x < ξ, ⎪ ⎨   −k Pr[X  x] = x−ξ ⎪ , x  ξ. ⎩exp −

(22.1)

(22.2)

θ

Тип 3:

⎧   k ⎪ ξ −x ⎨ exp − , x < ξ, Pr[X  x] = θ ⎪ ⎩ 1, x  ξ.

(22.3)

Здесь ξ , θ > 0 и k > 0 — параметры. Распределения, получающиеся при замене случайной величины X на −X, также относятся к распределениям экстремальных значений. Из приведенных трех семейств чаще всего в качестве распределения экстремальных значений упоминается первое. Некоторые авторы даже считают (22.1) единственным таким распределением. Учитывая это, а также то, что распределения (22.2) и (22.3) приводятся к типу 1 с помощью простых преобразований Z = log(X − ξ ) и Z = − log(ξ − X) соответственно, мы в этой главе будем, большей частью, рассматривать свойства первого семейства. Заметим также, что распределение типа 3 после перехода от X к −X будет семейством распределений Вейбулла. Эти распределения изучаются в гл. 21, так что здесь нет надобности заниматься ими в деталях. Конечно, типы 1 и 2 также тесно связаны с распределениями Вейбулла, это объясняется приведенными соотношениями между Z и X. Распределения типа 1 иногда называют логвейбулловскими распределениями, см. например, в работах White (1964, 1969). Распределения первого семейства иногда также называют дважды экспоненциальными, что объясняется формулой (22.1). Однако мы не используем этот термин, чтобы избежать путаницы с распределением Лапласа (гл. 24), тоже, хотя и редко, называемым дважды экспоненциальным. Термин «экстремальные значения» в названии семейства распределения объясняется тем, что такие распределения получаются как предельные при n → ∞ наибольшего значения из n независимых одинаково распределенных случайных величин (см. п. 3). Замена X на −X приведет к распределению наименьшего значения. Уже сказано, что они тоже относятся к распределениям экстремальных значений, поэтому нет смысла разбирать их отдельно.

12

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Хотя распределения связаны с экстремальными значениями, следует иметь в виду два обстоятельства: (1) они не описывают всех экстремальных значений (например, для конечного числа случайных величин или выборок конечного объема) и (2) их можно использовать как обычные распределения безотносительно к свойству экстремальности. В связи с последним замечанием отметим, что распределения типа 1 аппроксимируются распределением Вейбулла при больших значениях его параметра c, см. формулу (21.3). Кроме того, если X имеет распределение

типа 1, то Z = exp −(X − ξ )/θ распределено по показательному закону с плотностью pZ (z) = e−z , 0  z. О терминологии. Распределение типа 2 называют также распределением типа Фреше, типа 3 — распределением типа Вейбулла, типа 1 — распределением типа Гумбеля. Как уже отмечено, распределения типа Фреше и типа Вейбулла получаются одно из другого при изменении знака случайной величины. К типу 1 принадлежит используемое в демографии распределение!типа Гомперца, впервые упомянутое в 1825 году и применявшееся в течение почти ста лет до появления работ Фреше и Типпета, обнаруживших связь распределений Гомперца с семейством распределений экстремальных значений. Этот факт, однако, не часто упоминается в литературе. Подробнее мы обсудим это в п. 8. Распределения (22.1)–(22.3) появились в литературе независимо друг от друга. Однако они являются представителями одного и того же более общего семейства функций распределения −α

Pr[X  x] = e−{1+[(x−ξ )/θ ]/α }

−∞ < α < ∞,

,

1+

1 x−ξ > 0, α θ

θ > 0.

(22.4)

Если α > 0, то (22.4) совпадает с (22.2). Если α < 0, то (22.4) совпадает с (22.3). Наконец, если α → ∞ или α → −∞, то (22.4) стремится к распределению типа 1. Поэтому распределение (22.4) можно считать обобщением распределения экстремальных значений. Иногда его называют распределением фон Мизеса или распределением фон Мизеса—Дженкинса. Подробнее об этом распределении см. в п. 15. Достаточно полный обзор распределений экстремальных значений приведен в работе Mann and Singpurwalla (1982). Аналогичное исследование распределения Гумбеля содержится в работе Tiago de Oliveira (1983).

3.

Предельные распределения экстремумов

Распределения экстремальных значений получаются как предельные распределения наибольшего (наименьшего) из значений независимых одинаково распределенных непрерывных случайных величин при бесконечном увеличении их числа или, что то же самое, наибольшего (наименьшего) выборочного значения при бесконечном увеличении объема выборки из непрерывного распределения.

13

3. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМУМОВ

Чтобы получить невырожденное предельное распределение, следует «уменьшать» наибольшее выборочное значение, вводя линейное преобразование с коэффициентами, зависящими от объема выборки. Это аналогично нормировке (например, как в формулировке центральной предельной теоремы; см.гл. 13 п. 2), однако, вообще говоря, не ограничиваются только последовательностями линейных преобразований. Пусть X1 , X2 , . . . , Xn — независимые одинаково распределенные случайные величины с общей плотностью j = 1, 2, . . . , n.

pXj (x) = f (x),

Тогда функция распределения случайной величины Xn = max(X1 , X2 , . . . , Xn ) имеет вид (22.5) FXn (x) = [F(x)]n , x

где F(x) =

f (t)dt. −∞

Ясно, что для любого фиксированного x при стремлении n к бесконечности 1, если F(x) = 1, lim FXn (x) = n→∞ 0, если F(x) < 1. Даже если получается собственное распределение, оно «тривиально» и не представляет интереса. Чтобы получить содержательный результат, мы должны найти предельное распределение последовательности преобразованных, в некотором смысле «уменьшенных» значений, таких как {an Xn + bn }, где an и bn могут зависеть от n, но не от x. Чтобы различать F(x) и функцию распределения наибольшего значения преобразованной («уменьшенной») случайной величины, обозначим последнюю G(x). Если имеется Nn величин: X1 , X2 , . . . , XNn , то наибольшая из них есть также наибольшая из N величин:

 max X(j−1)n+1 , X(j−1)n+2 , . . . , Xjn , j = 1, 2, . . . , N. Следовательно, функция G(x) должна удовлетворять уравнению [G(x)]N = G (aN x + bN ) .

(22.6)

Это уравнение выведено в статьях Fr´echet (1927) и Fisher and Tippet (1928). Его иногда называют постулатом стабильности. Распределения типа 1 получаются при aN = 1; распределения типов 2 и 3 — при aN = 1. В этом последнем случае x = aN x + bN ⇔ x = bN (1 − aN )−1 ,

 и из (22.6) следует, что G bN (1 − aN )−1 должно быть равно 0 или 1. Тип 2 соответствует значению 1, тип 3 — значению 0. Рассмотрим более подробно случай aN = 1, соответствующий типу 1. В этом случае уравнение (22.6) принимает вид [G(x)]N = G (x + bN ) .

(22.7)

14

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Так как G (x + bN ) также должно удовлетворять (22.6), то [G(x)]NM = [G (x + bN )]M = G(x + bN + bM ).

(22.8)

[G(x)]NM = G(x + bNM ),

(22.9)

В силу (22.6) поэтому

bN + bM = bNM ,

следовательно,

bN = θ log N,

где θ — константа.

(22.10)

Дважды логарифмируя почленно равенство (22.7), учитывая, что G  1 и используя выражение (22.10) для bN , записываем: log N + log{− log G(x)} = log{− log G(x + θ log N)}. Положим

(22.11)

h(x) = log {− log G(x)} .

При увеличении аргумента θ log N величина h(x) убывает на log N. Следовательно, x (22.12) h(x) = h(0) − . θ

Поскольку h(x) убывает по x, то θ > 0. Из (22.12) получаем:     x − θ h(0) x−ξ − log G(x) = exp − = exp − , θ

θ

где обозначено ξ = θ log(− log G(x)). Таким образом,   G(x) = exp −e−(x−ξ )/θ , что совпадает с (22.1). Мы опускаем вывод распределений типов 2 и 3, отсылая читателя к работам Galambos (1978, 1987). В большой статье Гнеденко (1943) установлена связь между свойствами исходного распределения [F(x) в наших обозначениях] и типом предельного распределения. Найденные Б. В. Гнеденко условия относятся к поведению F(x) при больших (малых) x, если речь идет о наибольших (наименьших) значениях случайных величин. Оказалось, что при одном и том же исходном распределении наибольшее и наименьшее значения могут иметь предельные распределения, относящиеся к разным типам. Приведем резюме результатов Б. В. Гнеденко. Распределение типа 1. Определим Xα равенством F(Xα ) = α . Условие сходимости к распределению типа 1: 



= e−y . lim n 1 − F X1−n−1 + y X1−(ne)−1 − X1−n−1 n→∞

(22.13)

Условие сходимости к распределению типа 2: lim

x→∞

1 − F(x) = ck , 1 − F(cx)

c > 0,

k > 0.

(22.14)

15

3. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМУМОВ

Условие сходимости к распределению типа 3: lim

x→0−

1 − F(cx + ω ) = ck , 1 − F(x + ω )

c > 0,

k > 0,

(22.15)

где F(ω ) = 1, F(x) < 1 при x < ω . Б. В. Гнеденко доказал также, что приведенные условия являются необходимыми и достаточными и что не существует иных распределений, удовлетворяющих постулату стабильности. Другая интерпретация этих условий приводится в работе Clough and Kotz (1965). Они рассмотрели специальную систему массового обслуживания, в которой возникают распределения экстремальных значений. Среди распределений, удовлетворяющих условию сходимости к типу 1 (22.13), назовем нормальное, экспоненциальное и логистическое. Условию сходимости к типу 2 (22.14) удовлетворяет распределение Коши. Сходимость к типу 3 имеет место для распределений, сосредоточенных на ограниченной сверху части числовой оси. Результаты Б. В. Гнеденко обобщались разными авторами. Н. В. Смирнов исследовал предельное поведение порядковых статистик как фиксированного, так и возрастающего порядков. В статье Смирнов (1952) полностью классифицированы предельные типы и области их притяжения при исследовании поведения максимального члена последовательности. Предположение об одинаковом распределении случайных величин заменено более слабым в статье Juncosa (1949). Watson (1954) исследовал наибольший член стационарной последовательности случайных величин с зависимостью от каждой из m предыдущих. При слабых ограничениях предельные распределения те же, что и в случае независимости. В статье Berman (1962) изучены наборы перестановочных случайных величин и выборки случайного объема. В работе Harris (1970) классические результаты распространяются на одну из моделей теории надежности: последовательную систему заменяемых элементов. Weinstein (1973) обобщил основополагающий результат Б. В. Гнеденко, рассмотрев асимптотику распределения экспоненциального типа, если ν порождающей функцией распределения является V(x) = 1 − e−x , x  0. Он показал, что    −u u 1/ν xνn + = e−e , ν > 0, lim V n n→∞

dn

тогда и только тогда, когда     u 1/ν xνn + = e−u , lim n 1 − V dn

n→∞

где

V(xn ) = 1 − 1n ,   1 V xn + c1 = 1 − ne , n

dn =

cn ν |xn |ν −1 ν

,

xν ≡ |x| sgn(x).

ν > 0,

16

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Результат Б. В. Гнеденко получается при ν = 1. В работе Jeruchim (1976) содержится предупреждение, что в прикладных исследованиях следует внимательно отнестись к оценке параметра ν . Выполнение необходимых и достаточных условий (22.13)–(22.15) не всегда легко установить. В этих случаях могут оказаться полезными достаточные условия, найденные фон Мизесом для абсолютно непрерывных распределений в статье von Mises (1936). Для распределения типа 1. Если функция r(x) = f (x)/[1 − F(x)] отлична от нуля и дифференцируема в точке F −1 (1) (или при достаточно больших x при F −1 (x) = ∞), то достаточным условием сходимости к распределению типа 1 является   d 1 lim = 0. (22.16) x→F−1 (1)−0

dx

r(x)

Для сходимости к распределению типа 2 достаточно выполнения неравенства r(x) > 0 при всех достаточно больших x и существования предела lim xr(x) = α ,

x→∞

α > 0.

(22.17)

Достаточным условием сходимости к распределению типа 3 является выполнение неравенства F −1 (1) < ∞ и существование предела  −1  F (1) − x r(x) = α , α > 0. (22.18) lim x→F−1 (1)−0

В статье de Haan (1976) приводится простое доказательство этих условий. Напомним, что функция r(x) = f (x)/[1 − F(x)], входящая в (22.16)–(22.18), есть интенсивность отказа, называемая также функцией риска (см. гл. 1 и п. B2). Выбор (не однозначный) нормировочных констант aN и bN > 0 зависит от типа предельного распределения. Наиболее подходящие значения aN и bN > 0 даются следующими формулами. Тип 1.   1 aN = F −1 1 − , N     1 1 bN = F −1 1 − − F −1 1 − . (22.19) Ne

Тип 2.

N

aN = 0,

  1 . bN = F −1 1 −

(22.20)

N

Тип 3.

aN = F −1 (1) ,

  1 . bN = F −1 (1) − F −1 1 − N

(22.21)

Аналогичные результаты для предельных распределений наименьших значений последовательностей случайных величин получаются очевидными преобразованиями.

17

3. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМУМОВ

Перечислим несколько, по нашему мнению, удачных книг, где изучаются разные аспекты теории экстремальных значений и статистические приложения. В книгах David (1981) и Arnold, Balakrishnan and Nagaraja (1992) приводится компактное изложение асимптотической теории распределений экстремальных значений. В работах Galambos (1978, 1987), Resnik (1987) и Leadbetter, Lindgren and Rootz´en (1983) излагаются уточнения и развитие теории. В книге Reiss (1988) обсуждаются различные вопросы, связанные со скоростью сходимости распределений экстремальных значений и порядковых статистик к предельным распределениям. Castillo (1988) развивает результаты, полученные в работе Gumbel (1958) и излагает статистические аспекты теории экстремальных значений. В работе Harter (1978) приводится аннотированная библиография по терии распределений экстремальных значений. Обозначим FX (x; ξ , θ ) функцию распределения выборочного минимума, принадлежащую к типу 1 распределений экстремальных значений: (x−ξ )/θ

FX (x; ξ , θ ) = 1 − e−e

,

θ > 0,

ξ ∈ R.

Пусть, далее, GX (x; a, b, c) — трехпараметрическое распределение Вейбулла: 0, x < c, a GX (x; a, b, c) = 1 − e−[(x−c)/b] , x  c, где a, b > 0, c ∈ R. Davidovich (1992) получил оценки разности между двумя функциями распределения. Он, в частности, показал, что ⎧ −a e , x < c, ⎪ ⎪ ⎨ −2   b FX x; b + c, − GX (x; a, b, c) < 2e , c  x < c + 2b, a−2 a ⎪ ⎪ ⎩ a−2a e , x  c + 2b. Отсюда видно, что если a → ∞, b → ∞ и c → −∞ так, что b+c → d, |d| < ∞ b и → f , 0 < f < ∞, то приведенное распределение Вейбулла равномерно a

аппроксимирует распределение минимальных значений для ξ = d, θ = f . Нетрудно показать, что если независимые случайные величины Y1 , Y2 , . . . одинаково показательно распределены (см. гл. 19, п. 1): Pr[Y  y] = 1 − e−y ,

y > 0,

(22.22)

и L имеет усеченное в нуле распределение Пуассона (см. гл. 4, п. 10): Pr[L = l] = то случайная величина

(eλ − 1)−1 λ l , l!

l = 1, 2, . . .,

(22.23)

X = max(Y1 , Y2 , . . . , Yl )

имеет распределение, относящееся к распределениям экстремальных значений: функция распределения случайной величины X равна



 −1

 = c exp −λ e−x . (22.24) exp λ 1 − e−x Pr[X  x] = eλ − 1

18

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Подобным же образом распределение Фреше получается с помощью распределений Парето (см. гл. 20), а распределение Вейбулла — из степенного распределения (гл. 20). В статье Sibuya (1967) предложен датчик псевдослучайных чисел, порождающий распределение экстремальных значений, и основанный на соотнощениях (22.22) и (22.23), приводящих к равенству (22.24).

4.

Функции распределения и моменты

В этом пункте рассматривается только распределение типа 1, определенное формулой (22.1). Из этой формулы находится плотность   pX (x) = θ −1 e−(x−ξ )/θ exp −e(x−ξ )/θ . (22.25) Если ξ = 0 и θ = 1 или, что то же самое, рассматривается Y = (X − ξ )/θ , то получается стандартная форма 

(22.26) pY (y) = exp −y − e−y .

В п. 1 отмечено, что случайная величина Z = exp −(X − ξ )/θ = e−Y имеет экспоненциальное распределение: pZ (z) = e−z , Следовательно,

z  0.

 

E et(X−ξ )/θ = E Z −t = Γ(1 − t)

при t < 1. Заменив t на θ t, получаем производящую функцию моментов случайной величины X:

(22.27) E etX = etξ Γ(1 − θ t), θ |t| < 1. Производящая функция семиинвариантов для X имеет вид ψ (t) = ξ t + log Γ(1 − θ t).

(22.28)

Семиинварианты случайной величины X таковы: κ1 (X) = E[X] = ξ − θψ (1) = ξ + γθ ≈ ξ + 0.57722θ ,

(22.29)

где γ — постоянная Эйлера, κr (X) = (−θ )r ψ (r−1) (1),

r  2.

(22.30)

В частности, σ 2 = var(X) =

1 2 2 π θ ≈ 1.64493θ 2, 6

σ = Std. dev. (X) ≈ 1.28255θ .

(22.31) (22.31)

19

4. ФУНКЦИИ РАСПРЕДЕЛЕНИЯ И МОМЕНТЫ



РИС. 22.1. Стандартная плотность распределения типа 1: pY (y) = e−y exp −e−y

Асимметрия и эксцесс равны соответственно α32 (X) = β1 (X) ≈ 1.29857

и

α4 (X) = β2 (X) = 5.4.

(22.32)

Константы ξ и θ суть параметры сдвига и масштаба соответственно. Графики плотностей (22.25) имеют одну и ту же форму. Рассматриваемое распределение унимодально. Мода находится в точке x = ξ , абсциссы точек перегиба суть  √  1 x = ξ ± θ log (3 + 5) ≈ ξ ± 0.96242θ . (22.33) 2

При 0 < p < 1 непосредственно из (22.1) получается p-квантиль, определяемая равенством F(xp ) = p: (22.34) Xp = ξ − θ log(− log p). Отсюда находим нижнюю квартиль X0.25 , медиану X0.5 и верхнюю квартиль X0.75: (22.35) X0.25 = ξ − θ log(log 4) ≈ ξ − 0.32663θ , (22.36) X0.5 = ξ − θ log(log 2) ≈ ξ + 0.36661θ , (22.37) X0.75 = ξ − θ log(− log 0.75) ≈ ξ + 1.24590θ . Формула (22.34) позволяет находить квантили с помощью карманного калькулятора. Б´oльшая часть стандартного распределения (22.26) сосредоточена в интервале (−2; 7). Для распределения (22.1) вероятность попадания в интервал (ξ −2θ ; ξ +7θ ) равна 0.998. Таким образом, 99.8% распределения сосредоточено в интервале (μ − 2.0099σ ; μ + 5.0078σ ), где μ — математическое ожидание, σ — стандартное отклонение. Более детально свойства распределения описаны в статье Lehman (1963). График плотности стандартного распределения (22.26) приводится на рис. 22.1. Форма этой кривой напоминает логнормальную плотность при 2 eσ = 1.1325 (в обозначениях гл. 14). Значения β 1 и β 2 этой логнормальной плотности равны 1.300 и 5.398 соответственно [ср. с (22.32)]. В табл. 22.1 сравниваются значения соответствующих стандартных функций распределения. Таблица 22.2 содержит процентили стандартного распределения с нулевым математическим ожиданием и единичной дисперсией, что отвечает

20

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.1 Сравнение стандартных функций распределения F(x) x

Распределение экстремальных значений типа 1 a

Логарифмически нормальное распределение b

−2.0

0.00068

0.00022

−1.5

0.02140

0.01959

−1.0

0.1321

0.1342

−0.5

0.3443

0.3471

0.5704 0.7440 0.8558 0.92237 0.95774 0.97752 0.98810 0.99371 0.99668

0.5700 0.7423 0.8546 0.92096 0.95792 0.97730 0.98837 0.99389 0.99677

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 a F(x) b F(x)

= exp[− exp(−1.28524x − 0.57722)]. 1  u(x) 2 = √ −∞ exp(−u /2)du, где u(x) = 6.5277 lg(x + 2.74721) − 2.68853. 2π

ТАБЛИЦА 22.2 Процентили стандартизированного распределения экстремальных значений типа 1 α

Процентиль

α

Процентиль

0.0005

−2.0325

0.75

0.5214

0.0001

−1.9569

0.9

1.3046

0.0025

−1.8460

0.95

1.8658

0.005

−1.7501

0.975

2.4163

0.01

−1.6408

0.99

3.1367

0.025

−1.4678

0.995

3.6791

0.05

−1.3055

0.9975

4.2205

0.1

−1.1004

0.999

4.9355

0.25

−0.7074

0.9995

5.4761

0.5

−0.1643

21

5. ПОРЯДКОВЫЕ СТАТИСТИКИ

√ значению θ = 6/π = 0.77970 и значению ξ = −γθ = −0.45006. По этой таблице отчетливо прослеживается положительная асимметрия. В статьях Canfield (1975b) и Canfield and Borgman (1975) обсуждаемые распределения использованы как модель времени до первого отказа в задачах теории надежности.

5.

Порядковые статистики

Пусть Y1  Y2  · · ·  Yn — упорядоченные значения n независимых случайных величин, каждая из которых имеет стандартное распределение (22.26) экстремальных значений типа 1 (порядковые статистики, если говорить о выборке объема n). Плотность распределения Yr , 1  r  n, дается формулой 

pYr (y) =

−y n! e−e (r − 1)!(n − r)!

r−1   −y n−r −y 1 − e−e e−y e−e =

n−r  n! = (−1)j (r − 1)!(n − r)!



j=0

n−r j



−y

e−y−(j+r)e ,

−∞ < y < ∞.

(22.38)

Следуя статье Lieblein (1953), из (22.38) можно выразить k-й момент величины Yr в следующем виде:   k E Y r =

n−r  n! (−1)j (r − 1)!(n − r)! j=0



n−r j

 gk (r + j),

(22.39)

где ∞ 

gk (c) =

k −y−ce−y

ye

∞ 

dy = (−1)

−∞

k

(log u)k e−cu du (замена u = e−y ).

−∞

Если k — неотрицательное целое, то gk (c) дается формулой  ∞    k k    k d t−1 −cu  k d −t  gk (c) = (−1) k u e du = (−1) k Γ(t)c  . dt dt  t=1 0

(22.40)

t=1

Из последней формулы получаются g1 (·) и g2 (·), входящие в выражения первых двух моментов порядковых статистик: Γ (1)

Γ(1)

+ c log c = 1c (γ + log c),  2  g2 (c) = 1 π + (γ + log c)2 ,

g1 (c) = − c

c

где γ — постоянная Эйлера.

6

(22.41) (22.42)

22

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Продолжая аналогично, можно вывести формулу для математического ожидания произведения Yr Ys (1  r < s  n): E[Yr Ys ] = ×

n! × (r − 1)!(s − r − 1)!(n − s)! n−s s−r−1   i=0

 i+j

(−1)

j=0



s+r−1 i

n−s j

 ×

× φ (r + i, s − r − i + j),

(22.43)

где функция φ — это двойной интеграл ∞ 

y

φ (t, u) =

y

y

xy ex−te ey−ue dx dy,

t, u > 0.

(22.44)

−∞ −∞

Lieblein (1953) получил явную формулу для φ (t, u) в терминах функции Спенса, подробно табулированной в книгах Newman (1982) и Abramovitz and Stegun (1965). Математические ожидания и дисперсии порядковых статистик для выборок объема до 20 получены в работе White (1969); см. также Lieblein and Salzer (1957) и Milord (1964). Ковариации порядковых статистик для выборок объема не больше 6 табулированы в работах Lieblein (1953, 1962) и Lieblein and Zelen (1956). Интересно отметить, что дисперсия порядковой статистики наибольшего порядка не зависит от объема выборки и равна π 2 /6.  Другое выражение для математического ожидания Yn−r+1 выведено в статьях Kimball (1946a, 1949): r−1   

 n j E Yn−r+1 = γ + (−1)j Δ log n. j=1

j

(22.45)

Здесь Δi — прямая разность i-го порядка (см. гл. 1, п. A3). Balakrishnan and Chan (1992a) составили таблицы средних, дисперсий и ковариаций всех порядковых статистик для n = 1 (1) 15 (5) 30. Хотя эти таблицы составлены для распределения случайной величины −Y, соответствующие значения для порядковых статистик величины Y легко пересчитываются: 

E[Yi ] = −E[(−Y)n−i+1 ] и cov(Yi , Yj ) = cov (−Y)n−j+1 , (−Y)n−i+1 . Те же авторы, Balakrishnan and Chan (1992c) составили таблицы для всех объемов выборки до 30 включительно. Другие аспекты свойств порядковых статистик распределений экстремального типа и их моментов рассмотрены в работах Mahmoud and Ragab (1975) и Provasi (1987). В последней работе получены приближенные выражения для средних, дисперсий и ковариаций порядковых статистик. В табл. 22.3 приведены средние и дисперсии порядковых статистик для выборки объема до 10. Ковариации порядковых статистик содержатся в табл. 22.4.

23

5. ПОРЯДКОВЫЕ СТАТИСТИКИ

ТАБЛИЦА 22.3 Средние и дисперсии порядковых статистик выборки из стандартного распределения экстремальных значений n

r

Среднее

Дисперсия

n

r

Среднее

Дисперсия

1

1

0.57722

1.64493

8

1

−0.90212

0.19956

2

1

−0.11593

0.68403

8

2

−0.45279

0.18355

2

2

1.27036

1.64493

8

2

−0.10288

0.19837

3

1

−0.40361

0.44850

8

4

0.23121

0.23166

3

2

0.45943

0.65852

8

5

0.58818

0.29005

3

3

1.67583

1.64493

8

6

1.01107

0.39840

4

1

−0.57351

0.34402

8

7

1.58841

0.64642

4

2

0.10608

0.41553

8

8

2.65666

1.64693

4

3

0.81278

0.65180

9

1

−0.94934

0.18395

4

4

1.96351

1.64493

9

2

−0.52438

0.16390

5

1

−0.69017

0.28486

9

3

−0.20220

0.17158

5

2

−0.10689

0.30850

9

4

0.09575

0.19275

5

3

0.42555

0.40598

9

5

0.40053

0.22869

5

4

1.07094

0.64907

9

6

0.73829

0.28844

5

5

2.18665

1.64493

9

7

1.14745

0.39758

6

1

−0.77729

0.24658

9

8

1.71439

0.64609

6

2

−0.25453

0.24855

9

9

2.77444

1.64493

6

3

0.18839

0.29762

10

1

−0.98987

0.17143

6

4

0.66272

0.40186

10

2

−0.58456

0.14879

6

5

1.27505

0.64770

10

3

−0.28369

0.15192

6

6

2.36898

1.64493

10

4

−0.01204

0.16581

7

1

−0.84596

0.21964

10

5

0.25745

0.18958

7

2

−0.36531

0.21021

10

6

0.54361

0.22686

7

3

0.02240

0.23701

10

7

0.86808

0.28739

7

4

0.40969

0.29271

10

8

1.26718

0.39702

7

5

0.85248

0.39969

10

9

1.82620

0.64586

7

6

1.44407

0.64691

10

10

2.87980

1.64493

7

7

2.52313

1.64493

24

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.4 Ковариации порядковых статистик распределения экстремальных значений n

r

s

Ковариация

n

r

s

Ковариация

n

r

s

Ковариация

2 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7

1 1 1 2 1 1 1 2 2 3 1 1 1 1 2 2 2 3 3 4 1 1 1 1 1 2 2 2 2 3 3 3 4 4 5 1 1 1 1

2 2 3 3 2 3 4 3 4 4 2 3 4 5 3 4 5 4 5 5 2 3 4 5 6 3 4 5 6 4 5 6 5 6 6 2 3 4 5

0.48045 0.30137 0.24376 0.54629 0.22455 0.17903 0.15389 0.33721 0.29271 0.57432 0.18203 0.14359 0.12258 0.10901 0.24677 0.21227 0.18967 0.35267 0.31716 0.58992 0.15497 0.12122 0.10292 0.09116 0.08285 0.19671 0.16806 0.14945 0.13619 0.25617 0.22888 0.20925 0.36146 0.33205 0.59986 0.13618 0.10578 0.08941 0.07893

7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8

1 1 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4

6 7 3 4 5 6 7 4 5 6 7 5 6 7 6 7 7 2 3 4 5 6 7 8 3 4 5 6 7 8 4 5 6 7 8 5 6 7 8

0.07155 0.06601 0.16497 0.14020 0.12419 0.11283 0.10427 0.20262 0.18017 0.16412 0.15195 0.26155 0.23906 0.22190 0.36717 0.34211 0.60675 0.12233 0.09447 0.07953 0.07001 0.06332 0.05832 0.05440 0.14306 0.12103 0.10686 0.09685 0.08931 0.08340 0.16868 0.14941 0.13570 0.12534 0.11719 0.20599 0.18759 0.17362 0.16256

8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9

5 5 5 6 6 7 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 5 5 5 5 6 6 6

6 7 8 7 8 8 2 3 4 5 6 7 8 9 3 4 5 6 7 8 9 4 5 6 7 8 9 5 6 7 8 9 6 7 8 9 7 8 9

0.26509 0.24600 0.23081 0.37119 0.34937 0.61182 0.11167 0.08580 0.07199 0.06322 0.05706 0.05246 0.04887 0.04597 0.12700 0.10703 0.09424 0.08522 0.07846 0.07315 0.06886 0.14525 0.12825 0.11620 0.10712 0.09998 0.09419 0.17074 0.15503 0.14315 0.13377 0.12615 0.20823 0.19267 0.18033 0.17027 0.26763 0.25105 0.23745

25

6. РЕКОРДНЫЕ ЗНАЧЕНИЯ

ТАБЛИЦА 22.4 (окончание) n

r

s

Ковариация

n

r

s

Ковариация

n

r

s

Ковариация

9 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10

7 7 8 1 1 1 1 1 1 1 1 1 2 2 2 2

8 9 9 2 3 4 5 6 7 8 9 10 3 4 5 6

0.37418 0.35488 0.61569 0.10319 0.07893 0.06603 0.05785 0.05213 0.04786 0.04453 0.04184 0.03962 0.11417 0.09635 0.08463 0.07639

10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10

2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4

7 8 9 10 4 5 6 7 8 9 10 5 6 7 8 9

0.07021 0.06538 0.06148 0.05824 0.12812 0.11282 0.10200 0.09387 0.08749 0.08232 0.07803 0.14641 0.13262 0.12221 0.11403 0.10738

10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10

4 5 5 5 5 5 6 6 6 6 7 7 7 8 8 9

10 6 7 8 9 10 7 8 9 10 8 9 10 9 10 10

0.10185 0.17211 0.15888 0.14842 0.13991 0.13282 0.20986 0.19637 0.18536 0.17615 0.26954 0.25489 0.24260 037650 0.35919 0.61876

6.

Рекордные значения

Пусть Y1 , Y2 ,. . . — последовательность независимых одинаково распределенных случайных величин, имеющих распределение типа 1, определенное формулой (22.26) и пусть YL(1) = Y1 , YL(2) , . . . — соответствующие наименьшие или нижние рекордные значения: L(1) = 1, L(n) = min {j : j > L(n − 1), Yj < YL(n−1) } для n = 1, 2, . . . {YL(n) }∞ n=1 — это последовательность нижних рекордных значений. Плотность распределения случайной величины YL(n) при n  1 равна pYL(n) (y) =

−y 1 1 n−1 {− log FY (y)} pY (y) = e−ny e−e , −∞ < y < ∞. (n − 1)! (n − 1)!

(22.46) Это — плотность логарифмического гамма распределения с параметром κ = n (см. п. 16 или гл. 17, п. 8.7). Таким образом, n−1 

1 , E YL(n) = γ − i=1

i

n−1  π2 

1 var YL(n) = − , 2

6

i

i=1

n = 1, 2, . . . .

(22.47)

Совместная плотность распределения YL(m) и YL(n) , 1  m < n равна pYL(m) ,Y(n) (y1, y2 ) =

1 m−1 pY (y1 ) {− log FY (y1 )} × (m − 1)!(n − m − 1)! FY (y1 ) n−m−1

pY (y2 ) = × {− log FY (y2 ) + log FY (y1 )}

−y n−m−1 −y −e−y2 1 −my1 −y e e 2e , e 2 −e 1 = (m − 1)!(n − m − 1)!

−∞ < y2 < y1 < ∞.

(22.48)

26

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Запишем совместную плотность (22.48) величин YL(m) и YL(n) , 1  m < n в виде pYL(m) ,YL(n) (y1, y2 ) =

n−m−1 (n − 1)! e−m(y1 −y2 ) 1 − e−(y1 −y2 ) × (m − 1)!(n − m − 1)! −y 1 e−ny2 e−e 2 , −∞ < y2 < y1 < ∞. (22.49) × (n − 1)!

Последняя формула показывает, что YL(m) − YL(n) и YL(n) для 1  m < n — независимые случайные величины. Отсюда следует, что n−1 

 π2 

1 − . cov YL(m) , YL(n) = var YL(n) = 2

6

i=1

(22.50)

i

Эти свойства аналогичны свойствам порядковых статистик в случае стандартного показательного распределения (гл. 19, п. 6). Из (22.49) следует, что YL(m) −YL(n) распределено так же, как (n−m)-я порядковая статистика Zn−m : n−1 в выборке объема n−1 из стандартной показательной популяции. В частности, d если m = 1, то YL(1) − YL(n) = Y1 − YL(n) = Zn−1:n−1 . Используя известные результаты (гл. 19, п. 6):



E Zn−1:n−1 =

n−1  1 i=1

i

,

 var Zn−1:n−1

=

n−1  1 i=1

i2

,

(22.51)

получаем среднее и дисперсию величины YL(n) , даваемые формулой (22.47). Ahsanullah (1990, 1991) использовал эти выражения для вывода процедуры оценивания параметров сдвига и масштаба ξ и θ распределения типа 1 в параметризации (22.25), основанной на первых n наблюдаемых рекордных значениях: XL(1) , XL(2) , . . . , XL(n) . Для стандартного распределения типа 1 в форме (22.26) запишем следующее соотношение: pY (y) = FY (y) {− log FY (y)} , −∞ < y < ∞

(22.52)

Использовав эту формулу, Balakrishnan, Ahsanullah and Chan (1992) вывели несколько рекуррентных соотношений для моментов и моментов произведений нижних рекордных значений. Например, при n  1 и r = 0, 1, 2, . . . из (22.52) следует: ∞ 

r 1 n−1 E YL(n) = yr {− log FY (y)} pY (y)dy = (n − 1)!

=

1 (n − 1)!

−∞ ∞  n

yr {− log FY (y)} FY (y)dy. −∞

27

6. РЕКОРДНЫЕ ЗНАЧЕНИЯ

Интегрирование по частям дает: ⎡ ∞ 

r 1 n−1 ⎣ yr+1 {− log FY (y)} pY (y) dy − n E YL(n) = (n − 1)!(r + 1)! ∞ 

−∞



yr+1 {− log FY (y)} pY (y) dy⎦ = n

− −∞

r+1  n  r+1 = E YL(n) − E YL(n+1) , r+1 или, что то же самое,

r+1

r+1 r + 1 r E YL(n+1) E YL(n) = E YL(n) −

для n  1,

n

r = 0, 1, . . . .

(22.53)

Повторное применение рекуррентного соотношения (22.53) в той же работе Balakrishnan, Ahsanullah and Chan (1992) дает:

n r 

r+1

r+1 E YL(i) = E YL(n) − (r + 1) E YL(n+1) i=1



для n = 1, 2, . . . , r = 0, 1, 2, . . . .

i

(22.54) Из этой формулы легко получаются выражения (22.47) для математического ожидания и дисперсии YL(n) . В той же статье Balakrishnan, Ahsanullah and Chan (1992) аналогичным образом получены соотношения для моментов произведений:

r+s+1 r + 1 r

r+1 s s YL(m+1) = E YL(m+1) E YL(m) YL(m+1) + , m  1; r,s = 0,1,2, ... , (22.55) E YL(m) m

r+1 s

r+1 r+1 r s s E YL(m) + , 1  m  n − 2; r,s = 0,1,2, ... , YL(n) = E YL(m+1) YL(n) E YL(m) YL(n) m

r+s+1

r+1 s + (r + 1) E YL(m) YL(n) = E YL(n)

  n−1 E Y r Y s  L(i) L(n) i

i=m

(22.57)

r+s+1−i r+1 E YL(m+1) 

r+1 s YL(m+1) = (r + 1)(i) , E YL(m) i



, 1  m  n − 1; r,s = 0,1,2, ... ,





i=0

(22.56)

m

m  1; r,s = 0,1,2, ... ,

(22.58)



r+1−i s r+1 E YL(m+1) YL(n)  r+1 s (i) (r + 1) , 1  m  n − 2, r,s = 0,1,2, ... . E YL(m) YL(n) = i



i=0

m

(22.59)

В последних формулах обозначено 1, i = 0, (i) (k) = k(k − 1) · · · (k − i + 1), i  1. Пусть Xi: j есть i-й член вариационного ряда, полученного по случайной выборке объема j, если функция распределения генеральной совокупности

28

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

есть F(·). Если функция распределения нормированной величины (Xi: j − aj )/bj при j → ∞ слабо сходится к невырожденной функции распределения G(·) при некотором выборе констант aj и bj , то, как показал Nagaraja (1982),  − aj )/bj , 1  i  n, сходится совместное распределение величин (Xj−i+1:j к распределению случайных величин XL(n) , 1  i  n. Как уже отмечено в п. 3, функция G(·) должна принадлежать к одному из трех типов распределений экстремальных значений. Вследствие этого [Nagaraja (1988)], некоторые статистические методы, основанные на асимптотической теории экстремальных членов вариационного ряда, аналогичны методам, основанным на рекордных значениях выборки из распределения экстремальных значений. В частности, как показал Nagaraja (1984), асимптотический линейный прогноз экстремальных значений вариационного ряда аналогичен асимптотическому линейному прогнозу предстоящих рекордных значений при выборке из распределения F(·). Как представляется, эффективность оценок параметров функции распределения F(·), основанных на k наибольших членах вариационного ряда (см. работу [Weissman (1978)]), совпадает с эффективностью оценок, основанных на рекордных значениях для трех типов распределений экстремальных значений. Smith (1988) подробно обсуждает вопросы прогноза рекордных значений методом максимального правдоподобия. Ballerini and Resnik (1985, 1987a) изучили верхние рекордные значения, связанные с линейной регрессионной моделью Zn = Xn + cn, n = 1, 2, . . . , c > 0, где {Xn } — последовательность независимых одинаково распределенных случайных величин с плотностью (22.25), т. е. с плотностью распределения типа 1. Они называют такую конструкцию моделью Гумбеля с линейным сносом рекордных значений. Для этого случая Ballerini and Resnik (1987b) установили независимость при любых n случайных величин и

Mn + max{Z1 , . . . , Zn } 1, если рекордным является n-е значение, In = I{Zn >Mn−1 } = 0 в противном случае.

(22.60)

(дополнительные сведения см. в п. 8). В статье Balakrishnan, Balasubramanian and Panchapakesan (1955) обсуждаются рекордные значения δ -уровня для распределений типа 1. В этой модели новое значение случайной величины считается рекордным, если оно меньше предыдущих не менее, чем на δ .

7.

Таблицы, датчики псевдослучайных чисел и вероятностная бумага

В книге Gumbel (1953) приводятся следующие таблицы. 1. Таблица значений стандартной функции распределения exp(−e−y ) и зна  −y с семью десятичными знаками для чений плотности exp −y − e y = −3 (0.1) − 2.4 (0.05) 0.00 (0.1) 4.0 (0.2) 8.0 (0.5) 17.0.

7. ТАБЛИЦЫ, ДАТЧИКИ ПСЕВДОСЛУЧАЙНЫХ ЧИСЕЛ И ВЕРОЯТНОСТНАЯ БУМАГА

29

2. Таблица обратной функции распределения (т. е. квантилей) y = = − log(− log F) с пятью десятичными знаками для F = 0.0001 (0.0001) 0.0050 (0.001) 0.988 (0.0001) 0.9994 (0.00001) 0.99999. Аналогичные таблицы с четырьмя десятичными знаками содержатся в работе Owen (1962) для значений F = 0.0001 (0.0001) 0.0010 (0.0010) 0.0100 (0.005) 0.100 (0.010) 0.90 (0.005) 0.990 (0.01) 0.999 (0.0001) 1 − 10−4 (1) 7 , 1 − 1/2 · 10−4 (1) 7 . Заметный интерес к значениям F, весьма близким к 1, как в таблицах Gumbel (1953), так и в работе Owen (1962), объясняется, возможно, происхождением распределения, хотя вряд ли можно говорить о практической применимости таких далеких хвостов распределения. В книге Gumbel (1953) содержатся таблицы, связанные с распределением размаха (см. п. 16), и таблицы плотности в зависимости от функции распределения (p = −F log F) с пятью десятичными знаками для F = 0.0001 (0.00001) 0.0100 (0.001) 0.999. Lieblein and Zelen (1957) опубликовали таблицу математических ожиданий (с семью десятичными знаками) m наибольших из n независимых случайных величин, имеющих стандартное распределение типа 1 (22.6). Таблицы составлены для m = 1 (1) min(26, n);

n = 1 (1) 10 (5) 60 (10) 100.

Те же авторы, Lieblein—Zelen (1956), составили таблицы дисперсий и ковариаций (также с семью десятичными знаками) для совокупности 2, 3, 4, 5 и 6 независимых случайных величин, распределенных по типу 1. Эти значения приведены также в работе Lieblein (1962). Аналогичные таблицы для наименьших значений из n случайных величин, имеющих распределение типа 1, приводит Mann (1968b) для n  25. White (1963) расширил эти таблицы (также с семью десятичными знаками), включив средние и дисперсии всех порядковых статистик для выборок объема 1 (1) 50 (5) 100. Более обширные таблицы средних, дисперсий и ковариаций порядковых статистик для выборок объема до 30 приводятся в работе Balakrishnan and Chan (1992a, c). Таблицы коэффициентов для построения наилучших линейных оценок параметров ξ и θ , а также дисперсии и ковариации этих оценок составлены в работах Balakrishnan and Chan (1992b, d) как для полных, так и цензурированных второго типа выборок объема до 30 включительно. Аналогичные таблицы для построения наилучших линейных инвариантных оценок параметров ξ и σ составлены в работах Mann(1967, 1968a, b) и Mann, Shafer and Singpurwalla (1974). Из (22.1) следует, что − log (− log Pr[X < x]) =

x−ξ . θ

(22.61)

30

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Определим наблюденное значение накопленной относительной частоты Fx как отношение числа выборочных значений, не превосходящих x, к объему выборки. Если построить график функции − log(− log Fx ) от x, то в силу (22.61) должна получиться приближенно прямая с угловым коэффициентом θ −1 , пересекающая ось абсцисс в точке x = ξ . Используя бумагу с дважды логарифмической шкалой − log(− log Fx ) по оси ординат, можно избежать вычислений с логарифмами. Такая бумага для построения графиков носит название вероятностной бумаги для распределений экстремальных значений. Практически часто используется графическая бумага, где ось x направлена по вертикали, что удобно для практических расчетов, а на горизонтальной оси значение − log(− log Fx ) получается как (1 − Fx )−1 ; это предложено в работах Gumbel (1949a) и Kimball (1960). Бумагу такого типа называют вероятностной бумагой распределения экстремумов. Goldstein (1963) составил таблицы псевдослучайных чисел (с тремя десятичными знаками), представляющих собой выборку объема 500 из распределения типа 1, а также по три выборки объема 500 каждая из распределений типа 2 и 3 [k−1 = 0.2, 0.5, 0.8 в (22.14) и (22.15)]. Разумеется, псевдослучайные числа, имеющие стандартное распределение типа 1, можно получить с помощью обычного метода обращения функции распределения и подходящего датчика равномерно распределенных чисел (см. гл. 26). Можно также использовать датчик псевдослучайных экспоненциально распределенных чисел (гл. 19) и указанную в п. 3 связь распределений экстремальных значений с показательным распределением. Последнее описано в работе Sibuya (1967). Landwehr, Matalas and Wallis (1979) отдают предпочтение использованию датчика Льюиса—Гудмена—Миллера (Lewis—Goodman—Miller) равномерно распределенных чисел. Эти же авторы разработали последовательный алгоритм получения зависимых псевдослучайных чисел, распределенных по закону Гумбеля. Пусть zi = ρz zi−1 + δi

1 − ρz2

— цепь Маркова, где ρz — сериальный коэффициент корреляции первого порядка, а δi — стандартные нормально распределенные величины, не зависящие от zi−1 . Величины δi моделируются с помощью датчика Бокса—Миллера, а zi вычисляются в соответствии с приведенным выше рекуррентным уравнением. Тогда сериально зависимые псевдослучайные числа Xi , имеющие распределение Гумбеля, получаются по формуле Xi = ξ − θ log{− log Φ(zi )}, где Φ — стандартная нормальная функция распределения.

8.

Характеризационные теоремы

Мы уже упомянули в п. 2, что случайная величина X имеет распределение X/θ типа 1 тогда и только тогда, когда eX распределено по закону Вейбулла

или e  имеет экспоненциальное распределение, или, что то же самое, exp (X − ξ )/θ

31

8. ХАРАКТЕРИЗАЦИОННЫЕ ТЕОРЕМЫ

имеет стандартное экспоненциальное распределение. Ясно, что в силу приведенных отношений некоторые характеризационные свойства показательного распределения должны с естественными изменениями распространяться на распределение экстремальных значений типа 1. Dubey (1966) доказал, что Yn = min (X1 , X2 , . . . , Xn ) имеет распределение типа 1 в том и только том случае, если случайные величины X1 , X2 , . . . , Xn имеют распределение типа 1. Характеризационные теоремы для всех трех типов распределений экстремальных значений в терминах «полного перемешивания» случайных величин вывел Sethuraman (1965). Пусть X и Y независимы, а Z — такая случайная величина, что условное распределение Z при условии Z = Y совпадает с условным распределением Z при условии Z = X [так будет, например, при Z = min(X, Y)]. Выполнение такого условия называют перемешенностью первых двух случайных величин по отношению к третьей. Sethuraman (1965) показал, что если любые две из случайных величин X, Y и Z перемешены по отношению к третьей, и распределения случайных величин Y и Z совпадают с распределениями случайных величин a1 X + b1 и a2 X + b2 соответственно, причем (a1 , b1 ) = (a2 , b2 ), то распределение X есть одно из распределений экстремальных значений (наименьшего значения). При этом предполагается, что Pr[X > Y] > 0, Pr[Y > X] > 0 и т. д. Значения a1 , a2 , b1 , b2 определяют тип распределения. Gompertz (1825) построил вероятностную модель продолжительности жизни. По его гипотезе среднее истощение человеческих возможностей избежать смерти таково, что в конце равных бесконечно малых интервалов времени он теряет равные доли от оставшихся возможностей противостоять кончине, которые он имел вначале этих интервалов. Эта гипотеза привела Гомперца к выражению интенсивности смертности в виде r(x) = Bcx ,

x > 0, B > 0, c  1.

Решение соответствующего дифференциального уравнения приводит к функции доживания вида x (22.62) 1 − F(x) = e−B(c −1)/log c , x  0. Легко видеть, что последнее выражение — это усеченное в нуле распределение типа 1, включающее экспоненциальное распределение как предельный случай при c = 1. Известно (гл. 19, п. 8), что экспоненциальное распределение характеризуется свойством отсутствия памяти: Pr[X  x + y|X  x] = Pr[X  y] для всех x, y  0.

(22.63)

Обобщение этого характеризационного свойства для распределения Гомперца предложено в статье Kaminsky (1982): Pr[X  x + y|X  x] = {Pr[X  y]}

h(x)

x, y  0.

(22.64)

Распределение Гомперца (22.62) получается отсюда при h(x) = cx при c  1. Существование нескольких характеризационных свойств распределения типа 1 в рамках теории распределений экстремальных значений не является неожиданностью. Однако самое главное и важное свойство состоит

32

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

в том, что распределение типа 1 является единственным устойчивым распределением максимального значения, имеющим ненулевую плотность на всей действительной оси, см., например, теорему 1.4.1 в книге Leadbetter, Lindgren and Rootz´en (1983). Кроме характеризационных теорем, имеющих самостоятельный интерес, доказано несколько результатов, характеризующих область притяжения распределения типа 1. Работа Haan (1970) содержит весьма полную информацию об этом, а также об аналогичных результатах, связанных с распределениями типа 2 и 3. В п. 6 мы обсуждали модель Гумбеля линейного сдвига рекордных значений. Там говорилось, что случайные величины Mn и In независимы для любого n. Ballarini (1987) доказал, что независимость Mn и In для любого n > 0 и c > 0 является необходимым и достаточным условием принадлежности случайных величин Xi к первому типу распределений экстремальных значений. Tikhov (1991) нашел характеризационное свойство распределения экстремальных значений, определяемое количеством информации, связанной с оценкой максимального правдоподобия, полученной по многократно цензурированной выборке.

9.

Статистические оценки

Пусть X1 , X2 , . . . , Xn — случайная выборка объема n из распределения типа 1 (22.25). В работе Downton (1966) показано, что по теореме Рао—Крамера нижние границы дисперсий несмещенных оценок параметров ξ и θ даются формулами   1 + 6(1 − γ )2 π −2 θ 2 n−1 = 1.10867θ 2n−1 и 6π 2 θ 2 n−1 = 0.60793θ 2n−1 (22.65) соответственно. Мы уже неоднократно упоминали в этой главе и в гл. 21, что если Z имеет распределение Вейбулла с плотностью  c−1 c c z − ξ0 e−[(z−ξ0 )/β ] , z  ξ0 , (22.66) pZ (z) = β

β

то log(Z − ξ0 ) имеет распределение типа 1. Следовательно, при известном ξ0 методы оценивания параметров распределения экстремальных значений типа 1 применимы для параметров β и c распределения Вейбулла (22.66). Обратно, при известном ξ0 методы оценивания β и c распределения Вейбулла применимы для получения оценок параметров ξ и θ распределения типа 1.

9.1.

Метод моментов

Пусть X и S — выборочные среднее и среднее квадратическое отклонение. Тогда из (22.19) и (22.31) легко выводятся оценки для θ и для ξ : != θ



6 S π

и

!. ξ! = X − γ θ

(22.67)

33

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

Tiago de Oliveira (1963) показал, что  γ2 π " θ2 π2 ! var(ξ ) = n + 4 (β2 − 1) − √ γ β1 , 6 6

2 var(θ!) = θ (β2 − 1) ,

4n

(22.68) (22.69)

где β1 и β2 — асимметрия и эксцесс, определенные формулами (22.32). Подставив их, получаем: 2 var(ξ!) = 1.16780 n

2 var(θ!) = 1.1nθ .

и

(22.70)

В той же работе рассматривается совместное распределение X и S. Сравнивая дисперсии (22.70) с границами Рао—Крамера, легко установить, что эффективность оценки ξ!, полученной методом моментов, приблизительно равна 95%, в то время, как эффективность оценки θ! равна приблизительно  √ ! √ ! √ n-состоятельны, т. е. n ξ −ξ и n θ −θ 55%. Оценки ξ! и θ! ограничены по вероятности. Tiago de Oliveira (1963) показал, что совместное распределение ξ! и θ! асимптотически нормально с вектором средних (ξ , θ ), дисперсиями вида (22.70) и коэффициентом корреляции  β1 − 3γ (β2 − 1)/2π /6 ρξ!,θ! =   "  √  1/2 = 0.123. π 2 /6 + γ 2 (β2 − 1)/4 − π γ β1 / 6 (β2 − 1) π2

"

(22.71)

Используя асимптотически нормальные распределения оценок (ξ!, θ!) можно построить асимптотические доверительные области для (ξ , θ ). Christopeit (1994) недавно показал, что метод моментов дает состоятельные оценки параметров распределений экстремальных значений и применим, в качестве иллюстрации, для оценки магнитуды землетрясений в среднем течении Рейна.

9.2.

Простые линейные оценки

При оценивании параметров ξ и θ методом максимального правдоподобия получаются уравнения, решение которых не выражается в явном виде и, следовательно, требует применения итерационных численных методов. Kimball (1956) предложил модификацию уравнения для θ (использующую уравнение для ξ ), допускающую явное решение. Уравнение для θ#, имеющее вид $n −Xi /θ# # = X − i=1 Xi e θ , (22.72) $n

−Xi /θ# i=1 e

используется совместно с уравнением относительно ξ#:  n  # 1 −X / θ # log . ξ# = −θ e i n

i=1

(22.73)

34

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

С учетом последнего (22.72) записывается в виде n n   1 1 −(Xi −ξ#)/θ# # #X (Xi ), θ =X− Xi e =X+ n Xi log F n i=1

(22.74)

i=1

#X (Xi ) — оценка функции распределения. Заменив в (22.74) log F #X (Xi ) где F #X (Xi ), Kimball (1956) вывел упрощенную линейную ожидаемым значением log F оценку для θ : n n    1  #∗ = X + 1 θ X , (22.75) i n j i=1

j=i

которая, в свою очередь, заменяется на

  n  i − 1/2 1 ∗  # θ =X+ Xi log . n n + 1/2

i=1

(22.76)

Оценки (22.75) и (22.76) представляют собой функции порядковых статистик и, следовательно, их смещения и средние квадратические ошибки определяются без труда через средние, дисперсии и ковариации порядковых статистик, приведенные в табл. 22.3 и 22.4. Линейная оценка (22.76) является смещенной, и Kimball (1956) составил таблицу поправочных множителей, исключающих смещение. Он показал, что при n  10 оценку θ∗

1 + 2.3n−1

(22.77)

можно с хорошим приближением считать несмещенной. Упрощенная оценка параметра ξ теперь получается в виде: Оценка ξ = X − γ × (Оценку θ ).

(22.78)

В силу линейности приведенной оценки θ естественно сравнить ее с наилучшей линейной несмещенной оценкой этого параметра и с ее приближенным выражением, предложенным в работах Blom (1957) и Weiss (1961). Downton (1966) приводит несколько подобных сравнений. Он рассматривает распределение типа 1 для минимума с функцией распределения вида (x−t)/θ 1−e−e , и результаты (с небольшими изменениями) применимы к распределению типа 1 с функцией распределения в форме (22.1). Все его результаты даны в терминах эффективностей, т. е. отношений величин, определяемых соотношениями (22.65), к соответствующим дисперсиям рассматриваемых оценок. Для каждого θ параметр ξ оценивается по формуле (22.78). Таблицы 22.5 и 22.6, взятые из работы Downton (1966), содержат эффективность разных оценок ξ и θ . Для малых n использование асимптотических формул не дает хорошей точности, хотя приводимые таблицы дают представление об относительной эффективности и поведении рассматриваемых оценок. Таблица 22.5 показывает, что значения параметра ξ можно оценить довольно точно, используя простые линейные функции порядковых статистик. В то же время, как видно из табл. 22.6, использование простых линейных функций порядковых

35

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

ТАБЛИЦА 22.5 Эффективность линейных несмещенных оценок ξ распределения экстремальных значений n

2

3

4

5

6



Наилучшая линейная оценка Аппроксимация Блома (Blom) Аппроксимация Вайсса (Weiss) Аппроксимация Кимбалла (Kimball)

84.05 84.05 84.05 84.05

91.73 91.72 91.73 91.71

94.45 94.37 94.41 94.45

95.82 95.68 95.74 95.82

96.65 96.45 96.53 96.63

100.0 100.0 — —

Замечание: эффективность приводится в процентах.

ТАБЛИЦА 22.6 Эффективность линейных несмещенных оценок масштабного параметра θ распределения экстремальных значений n

2

3

4

5

6



Наилучшая линейная оценка Аппроксимация Блома (Blom) Аппроксимация Вайсса (Weiss) Аппроксимация Кимбалла (Kimball)

42.70 42.70 42.70 42.70

58.79 57.47 58.00 57.32

67.46 65.39 66.09 65.04

72.96 70.47 71.04 69.88

76.78 74.07 74.47 73.25

100.0 100.0 — —

Замечание: эффективность приводится в процентах.

статистик при оценке масштабного θ приводит к неудовлетворительным результатам. Для экстремального распределения минимального значения типа 1 с (x−ξ )/θ на основе использования функцией распределения FX (x) = 1 − e−e  цензурированной по типу II справа выборки X1 , X2 , . . . , Xn−s (напомним, что  Xi = max(X1 , . . . , Xi )) Bain (1979) предложил простую несмещенную оценку для параметра масштаба θ . Затем в статье Engelhardt and Bain (1973) оценка была преобразована к виду # #= θ

n−s 

1

|Xr − Xi |,

(22.79)

n−s 1 E |Yr − Yi |, n

(22.80)

nkn−s,n

где kn−s,n =

i=1

i=1



а Yi = Xi − ξ /θ — порядковые статистики выборки из стандартного распределения экстремальных значений типа 1 для минимального значения, и r = n−s r=n r = n−1 r = [0.892n] + 1

для для для для

n − s  0.9n, n − s = n, n  15, n − s = n, 16  n  24, n − s = n, n  25.

36

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Используя таблицы средних значений, упомянутые в п. 5, Bain (1972) нашел n−s = 0.1 (0.1) 1.0 точные значения kn−s,n для n = 5, 15, 20, 30, 60, 100, ∞ для n при целых n − s. Engelhardt and Bain (1973) приводят точные значения kn,n для n = 2 (1) 35 (5) 100 и для n = 39, 49, 59, ∞. Mann and Fertig (1975), также рассчитали точные значения kn−s,n для n = 25 (5) 60 и (n − s)/n = 0.1 (0.1) 1.0 при целых n − s. Следует отметить, что значения kn,n , приведенные в работе Mann and Fertig (1975) несколько отличаются от значений, вычисленных в работе Engelhardt and Bain (1973) для n > 40. Это объясняется некоторыми различиями в выборе r. # Параметр θ является параметром масштаба, θ# — несмещенная оценка θ , поэтому возможно улучшение оценки за счет уменьшения среднего квадратического отклонения (более подробно см. в п. 9.3). Повышение эффективности становится заметным, если цензурирование справа достаточно велико. Bain (1972) заметил, что если (n − s)/n не превышает 0.5, то # var(θ#) ≈ θ 2 /(nkn−s,n). Следовательно, оценка n−s # 

  # θ 1 Xn−s − Xi = 1 + 1/(nkn−s,n ) 1 + nkn−s,n

(22.81)

i=1

имеет меньшую среднеквадратическую ошибку, чем # θ , если (n − 3)/n  0.5. Поэтому используемая оценка получается из равенства n−s #  # θ 1 = |Xr − Xi | 1 + ln−s,n nkn−s,n (1 + ln−s,n )

(22.82)

i=1

и имеет среднеквадратическую ошибку θ 2 ln−s,n /(1 + ln−s,n ); здесь ln−s,n = # = var(θ#/θ ). Значения ln−s,n табулированы в статьях Engelhardt and Bain (1973) и Mann and Fertig (1975). Таблицы, составленные в Bain (1972) и Engelhardt and # Bain (1973), показывают, что оценка θ# в (22.79) имеет высокую эффективность. Например, при (n − s)/n  0.7 асимптотическая эффективность составляет не менее 97.7% относительно границы Рао—Крамера. # Оценку θ# (22.79) можно использовать для получения простой линейной несмещенной оценки для ξ с помощью соотношения между моментами: Xr = E[Xr ] = ξ + θ E[Yr ].

(22.83)

Тогда оценка для ξ дается формулой # # #. ξ# = Xr − E[Yr ]θ

(22.84)

# # С помощью оценок θ# и ξ# (22.79) и (22.84) соответственно, получается линейная несмещенная оценка p-квантили ξp в виде # # # # log(− log(1 − p)), ξ#p = ξ# + θ

0 < p < 1.

(22.85)

37

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

В упомянутых работах также построены доверительные интервалы для # #. Bain (1972) # и ξ# ξ и θ , основанные на линейных несмещенных оценках θ # выяснил, что распределение величины 2nkn−s,nθ#/θ аппроксимируется центри2 рованным распределением χ с 2nkn−s,n степенями свободы, если (n−s)/n 0.5 и n  20. Mann and Fertig (1975) показали, что при n  20 распределение величины

# 2θ#/θ близко к распределению χ 2 с 2/ln−s,n степенями свободы. ln−s,n

Интересно, что такая близость имеет место при всех (n − s)/n ∈ (0; 1]. Эти приближения получаются с помощью отмеченного в работе van Mountfort (1970) нижеследующего свойства статистик  Xi+1 − Xi   E[Yi+1 ] − E[Yi ] θ

Zi = 

,

i = 1, 2, . . . , n − 1 :

все они имеют распределения, мало отличающиеся от показательного со средним, равным 1, а дисперсия их приближенно равна 1. При этом ковариации величин Zi близки к нулю [см. также Pyke (1965)]. Mann and Fertig (1975) также отметили, что при n − s  0.90n n−s  n−s−1 #   # Xn−s − Xi θ 1 1  = = 2Zi {E[Yi+1 ] − E[Yi ]} θ nkn−s,n θ 2nkn−s,n i=1

i=1

с хорошим приближением можно рассматривать как взвешенную сумму независимых случайных величин, распределенных по закону χ 2 . Соответственно, аппроксимации, рассмотренные в гл. 18, могут оказаться полезны и при оценивании θ .

9.3.

Наилучшие линейные несмещенные (инвариантные) оценки

   Пусть Xr+1  Xr+2  . . .  Xn−s — цензурированная с двух сторон выборка (тип II цензурирования), полученная из независимой выборки объема n: удалены r наименьших и s наибольших выборочных значений. Введем обозначения:

T

   , Xr+2 , . . . , Xn−s , X = Xr+1 1 = (1, 1, . . . , 1)T1×(n−r−s) ,

T    μ = E[Yr+1 ], E[Yr+2 ], . . . , E[Yn−s ] ,

 Σ = cov(Yi , Yj ) , r + 1  i, j  n − s, где E[Yi ] и cov(Yi , Yj ) определены в п. 5. Минимизируя дисперсию, равную (X − ξ 1 − θμ μ )T Σ −1 (X − ξ 1 − θμ μ) ,

38

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

получаем наилучшие линейные несмещенные оценки (НЛНО) параметров ξ и θ [см. Balakrishnan и Cohen (1991), pp. 80–81]: ⎧ ⎫ n−s ⎨ T −1 T −1 T −1 T −1 ⎬  μ Σ μ 1 Σ − μ Σ 1μ Σ ∗ ξ =  ai Xi , (22.86) X= ⎩ μ T Σ −1μ  1T Σ −1 1 − μ T Σ −1 12 ⎭ i=r+1 ⎫ ⎧ n−s ⎬ ⎨  T −1 T −1 T −1 T −1 1 Σ μ Σ − 1 Σ μ1 Σ ∗ X= θ =  bi Xi . (22.87) ⎩ μ T Σ −1μ  1T Σ −1 1 − μ T Σ −1 12 ⎭ μ Σ

μ

μ Σ

Σ

i=r+1

Дисперсии и ковариации этих оценок даются формулами

  θ 2 μ T Σ −1μ 2 var(ξ ∗ ) =     2 = θ V1 , T −1 T −1 T −1 μ Σ μ 1 Σ 1 − μ Σ 1   θ 2 1T Σ −1 1 ∗ 2 var(θ ) =     2 = θ V2 , μ T Σ −1μ 1T Σ −1 1 − μ T Σ −1 1   θ 2 μ T Σ −1 1 2 cov(ξ ∗ , θ ∗ ) =     2 = θ V3 . T −1 T −1 T −1 μ Σ μ 1 Σ 1 − μ Σ 1

(22.88)

(22.89)

(22.90)

Lieblein (1962) рассчитал таблицы коэффициентов ai и bi в (22.86) и (22.87), а также значения дисперсий и ковариации по формулам (22.88)–(22.90) для n от 1 до 6. White (1964) расширил таблицы, доведя объем выборки до 20. Mann (1967) довела этот объем до 25. Balakrishnan and Chan (1992a, d) сделали расчеты для n  30 как для случая полной, так и усеченной выборки. В качестве примера приводится табл. 22.7, содержащая коэффициенты ai и bi для n = 2 (1) 10 в случае полной выборки (r = s = 0). Множители V1 , V2 и V3 в выражениях дисперсий и коэффициентов вариации приведены в табл. 22.8 Hassanein (1964) рассмотрел возможность использования приближенных наилучших линейных несмещенных оценок и привел таблицы коэффициентов при порядковых статистиках для цензурированных выборок при n = 2 (1) 10 (5) 25. Заметим, что эти оценки имеют наименьшую дисперсию в классе линейных несмещенных оценок. В работе Mann (1969) расширен класс линейных оценок и выведен улучшенный вариант, минимизирующий среднеквадратическую ошибку оценки. В частности, при рассмотрении наилучших линейных несмещенных оценок (ЛНО) θ ∗ и η∗ = c1 ξ + c2 θ ∗ для параметров θ и η = c1 ξ + c2 θ были получены их дисперсии θ 2 V2 и θ 2 V4 , где V4 = c21 V1 + c22 V2 + 2c1 c2 V3 , и ковариацию θ 2 V5 , где V5 = c1 V3 +c2 V2 . В той же работе Mann (1969) показано, что единственными линейными оценками ξ и θ , минимизирующими средние квадратические отклонения, являются θ ∗∗ =

θ∗ 1 + V2

и

η∗∗ = η∗ −

V5 θ ∗. 1 + V2

(22.91)

39

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

ТАБЛИЦА 22.7 Коэффициенты наилучших несмещенных линейных оценок ξ и θ для полной выборки n

i

ai

2 2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 7 7

1 2 1 2 3 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 1 2 3 4 5 6 7

0.91637 0.08363 0.65632 0.25571 0.08797 0.51100 0.26394 0.15368 0.07138 0.41893 0.24628 0.16761 0.10882 0.05835 0.35545 0.22549 0.16562 0.12105 0.08352 0.04887 0.30901 0.20626 0.15859 0.12322 0.09375 0.06733 0.04184

bi

−0.72135 0.72135 −0.63054 0.25382 0.37473 −0.55862 0.08590 0.22392 0.24880 −0.50313 0.00653 0.13045 0.18166 0.18448 −0.45927 −0.03599 0.07320 0.12672 0.14953 0.14581 −0.42370 −0.06070 0.03619 0.08734 0.11487 0.12586 0.12014

n

i

ai

8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10

0.27354 0.18943 0.15020 0.12117 0.09714 0.07590 0.05613 0.03649 0.24554 0.17488 0.14179 0.11736 0.09722 0.07957 0.06340 0.04796 0.03229 0.22287 0.16231 0.13385 0.11287 0.09564 0.08062 0.06699 0.05419 0.04175 0.02893

Среднеквадратические ошибки этих оценок равны   V2 V5 θ2 и θ 2 V4 − 1 + V2

1 + V2

bi

−0.39419 −0.07577 0.01112 0.05893 0.08716 0.10273 0.10807 0.10194 −0.36924 −0.08520 −0.00649 0.03798 0.06557 0.08265 0.09197 0.09437 0.08839 −0.34783 −0.09116 −0.01921 0.02218 0.04867 0.06606 0.07702 0.08277 0.08355 0.07794

(22.92)

соответственно. Эти оценки названы в работе Mann (1969) наилучшими линейными инвариантными оценками (НЛИО). Они особенно полезны в случае, если речь идет об очень малой или сильно цензурированной выборке. Ясно, наилучшая линейная оценка ξ получится при c1 = 1 и c2 = 0. Аналогично, наилучшая линейная оценка p-квантиля ξp можно получить из (22.91), положив c2 = 1 и c2 = − log(− log p).

40

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.8 Значения V1 , V2 и V3 для наилучших линейных несмещенных оценок ξ и θ по полной выборке n

V1

V2

V3

2 3 4 5 6 7 8 9 10

0.65955 0.40286 0.29346 0.23140 0.19117 0.16293 0.14198 0.12582 0.11297

0.71186 0.34471 0.22528 0.16665 0.13196 0.10910 0.09292 0.08088 0.07157

−0.06432 0.02477 0.03469 0.03399 0.03137 0.02860 0.02608 0.02388 0.02198

Запишем наилучшие линейные инвариантные оценки ξ и θ в виде ξ ∗∗ =

n−s 

a∗i Xi

и

θ ∗∗ =

i=r+1

n−s 

b∗i Xi

(22.93)

i=r+1

и обозначим их средние квадратические отклонения (СКО)



 СКО ξ ∗∗ = θ 2 W1 и СКО θ ∗∗ = θ 2 W2 .

(22.94)

Mann (1967a, b) и Mann, Shafer and Singpurwalla (1974) составили необходимые таблицы для различных вариантов усечения. Таблица 22.9 содержит a∗i и b∗i для n = 2 (1) 10 для полной выборки (т. е. при r = s = 0). Соответствующие множители W1 и W2 в выражениях среднеквадратических отклонений (22.94) приведены в табл. 22.10. Сравнение табл. 22.8 и 22.10 показывает, что выигрыш невелик в том, что касается оценок ξ , тогда как заметный выигрыш получается при оценке θ , особенно при малых n. В статье McCool (1965) обсуждается построение хороших приближений линейных несмещенных оценок на основании НЛНО для малых выборок.

9.4.

Асимптотически наилучшие линейные несмещенные оценки

Johns and Lieberman (1966) табулировали приближенные значения весовых коэффициентов (короче, весов) в выражениях НЛИО параметров ξ и θ , основанные на первых n − s порядковых статистиках по выборкам объемов n = 10, 15, 20, 30, 50 и 100 и для четырех значений s для каждого n. Авторы также привели формулы весов асимптотически оптимальных линейных оценок в случае выборки, цензурированные по типу II. Напомним, что точные таблицы весов для НЛИО приведены в работах Mann (1967a, b) для выборок объема не более 25 и s = 0 (1) n − 2.

41

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

ТАБЛИЦА 22.9 Коэффициенты для вычисления наилучших линейных инвариантных оценок ξ и θ по полной выборке n

i

a∗i

2 2 3 3 3 4 4 4 4 5 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 7 7

1 2 1 2 3 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 1 2 3 4 5 6 7

0.88927 0.11073 0.66794 0.25100 0.08106 0.52681 0.26151 0.14734 0.06434 0.43359 0.24603 0.16381 0.10353 0.05298 0.36818 0.22649 0.16359 0.11754 0.07938 0.04483 0.31993 0.20783 0.15766 0.12097 0.09079 0.06409 0.03874

b∗i

−0.42138 0.42138 −0.46890 0.19024 0.27867 −0.45591 0.07011 0.18275 0.20305 0.43126 − 0.00560 0.11182 0.15571 0.15813 −0.40573 −0.03180 0.06467 0.11195 0.13210 0.12881 −0.38202 −0.05472 0.03263 0.07875 0.10357 0.11348 0.10832

n

i

a∗i

8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10

0.28294 0.19124 0.14993 0.11977 0.09506 0.07345 0.05355 0.03405 0.25370 0.17676 0.14193 0.11652 0.09577 0.07774 0.06137 0.04587 0.03034 0.23000 0.16418 0.13424 0.11241 0.09464 0.07926 0.06541 0.05250 0.04003 0.02733

b∗i

−0.36068 −0.06933 0.01018 0.05392 0.07975 0.9399 0.09889 0.09327 0.34161 − 0.07883 − 0.00600 − 0.03514 0.06067 0.07647 0.08508 0.08731 0.08178 −0.32460 −0.08507 −0.01793 0.02070 0.04542 0.06165 0.07188 0.07724 0.07797 0.07273

В некоторых работах рассматриваются оптимальные оценки параметров ξ и θ , основанные на k выбранных порядковых статистиках. Метод впервые предложении в статьях Ogawa (1951, 1952) и развит в работах нескольких авторов. Пусть разбиение выборки на спейсы определяется числами 0 < λ1 < λ2 < · · · < λk < 1 и λ0 = 0, λk+1 = 1. Обозначим Xn i : n , где ni = [nλi ]+1, выборочную квантиль порядка λi . Задача состоит в оптимальном выборе чисел λi , i = 1, . . . , k, при построении оценок по значениям Xn i : n . Можно показать, что асимптотические дисперсии и ковариация НЛИО ξ!∗

42

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.10 Значения W1 и W2 для наилучших линейных инвариантных оценок ξ и θ по полной выборке n

W1

W2

2 3 4 5 6 7 8 9 10

0.65713 0.40241 0.29248 0.23040 0.19030 0.16219 0.14136 0.12530 0.11252

0.14584 0.25635 0.18386 0.14284 0.11658 0.09836 0.08502 0.07482 0.06679

и θ!∗ , основанные на k выбранных порядковых статистиках, таковы:   θ2 K22 · , (22.95) var ξ!∗ = 2 n

  θ2 var θ!∗ = · n

K11 K22 − K12 K11 2 K11 K22 − K12

  θ2 cov ξ!∗ , θ!∗ = − · n

,

(22.96)

K12 . 2 K11 K22 − K12

(22.97)

В этих формулах K11 =

k+1  {pY (Gi ) − pY (Gi−1 )}2 i=1

K12 =

λi − λi−1

(22.98)

k+1  {pY (Gi ) − pY (Gi−1 )} {Gi pY (Gi ) − Gi−1 pY (Gi−1 )}

λi − λi−1

i=1

K22 =

,

k+1  {Gi pY (Gi ) − Gi−1 pY (Gi−1 )}2 i=1

λi − λi−1

,

,

(22.99)

(22.100)

где Gi = FY−1 (λi ) и pY (G0 ) = pY (Gk+1 ) = Gk+1 pY (Gk+1 ) = 0. Требуется найти 0 < λ1 < λ2 < · · · < λk < 1, оптимизирующие приведенные функции, включающие K11 , K22 и K12 . Это даст k наилучших порядковых статистик для получения наилучших линейных несмещенных оценок параметров ξ и θ . Численные результаты приводят Hassanein (1965, 1968, 1969, 1972) и Chen and Kabir (1969). Методы проверки гипотез, основанные на этих оценках, рассматриваются в статьях Chan and Mead (1972a, b) и Chan, Cheng and Mead (1972). Метод оценивания α -квантили, определенной равенством Xα = ξ − θ log(− log α ), 0 < α < 1, основанный на k порядковых статистиках, выбранных наилучшим образом, детально рассмотрен в работах Hassanein, Saleh and Brown (1984, 1986) и Hassanein and Saleh (1992).

43

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

ТАБЛИЦА 22.11 Оптимальный набор спейсингов для построения асимптотически наилучшей линейной несмещенной оценки ξ при известном θ для k = 1 (1) 10

1 2 3 4 5 6 7 8 9 10

λ1

λ2

λ3

λ4

λ5

λ6

λ7

0.2032 0.0734 0.0345 0.0190 0.0115 0.0075 0.0052 0.0037 0.0027 0.0021

0.3615 0.1701 0.0933 0.0566 0.0369 0.0254 0.0182 0.0135 0.0103

0.4705 0.2581 0.1566 0.1021 0.0703 0.0504 0.0374 0.0285

0.5486 0.3329 0.2171 0.1494 0.1071 0.0794 0.0605

0.6069 0.3958 0.2723 0.1953 0.1448 0.1103

0.6521 0.4487 0.3218 0.2386 0.1818

λ8

λ9

λ10

0.6880 0.4935 0.7173 0.3659 0.5319 0.7415 0.2788 0.4052 0.5650 0.7619

Пример оптимального набора спейсингов (λ1 , λ2 , . . . , λk ), максимизирующего K11 в (22.98), представляет табл. 22.11 для k = 1 (1) 10. Табличные значения дают оптимальный выбор квантилей в выборке объема n для получения асимптотически наилучшей линейной оценки ξ при известном θ . Дисперсия соответствующей оценки имеет вид   θ2 . (22.101) var ξ!∗ = nK11

Более подробные таблицы содержатся в статьях, упомянутых выше. Проверка гипотез о параметрах ξi из l популяций, имеющих распределение экстремальных значений, основанная на асимптотически наилучших линейных несмещенных оценках, рассмотрена в работе Hassanein and Saleh (1992).

9.5.

Линейные оценки с полиномиальными коэффициентами

Пусть X1 , X2 , . . . , Xn — упорядоченная выборка, т. е. вариационный ряд из распределения экстремальных значений типа 1 в форме (22.25). Downton (1966) рассмотрел оценки вида ξ∗ =

p 

(k + 1)αk

k=0

 k=0

где

m

(r)

=

i

i=1

p

θ∗ =

n  (i − 1)(k) X 

(k + 1)βk

n(k+1)

n  (i − 1)(k) X  i

i=1

n(k+1)

,

(22.102)

,

(22.103)

1, если r = 0, m(m − 1) · · · (m − r + 1), если r = 1, 2, . . .

44

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.12 Эффективность линейных несмещенных оценок ξ с линейными и с квадратичными коэффициентами (%) 2

3

4

5

6

7

84.05 84.05

91.18 91.73

93.83 94.42

95.21 95.79

96.07 96.60

99.63 99.87

n

Линейные коэффициенты Квадратичные коэффициенты

Введем обозначения: α = (α0 , α1 , . . . , αp )T , β = (β0 , β1 , . . . , βp )T ,

1 = (1, 1, . . . , 1)T1×(p+1) ,

T    μ = E[Y1:1 ], E[Y2:2 ], . . . , E[Yp+1:p+1 ] ,

 Σ = (Σk,l ) (p+1)×(p+1) , где

( Σk,l = cov (k + 1)

n  (i − 1)(k) Y  i

i=1

n(k+1)

, (l + 1)

n  (i − 1)(l) Y  i

i=1

n(l+1)

) ,

0  k,

l  p. (22.104)

Используя метод наименьших квадратов, Downton (1966) вывел коэффициенты наилучших линейных несмещенных оценок ξ∗ и θ∗ с полиномиальными коэффициентами вида (22.102) и (22.103):  T  −1 1 −1 −1 [α β ] = Σ [1 μ ] [1 μ ] (22.105) T Σ μ

и матрицей ковариаций оценок ξ∗ и θ∗ :    T  −1 var(ξ∗ ) cov(ξ∗ , θ∗ ) 1 −1 Σ μ = θ2 [1 ] . T var(θ∗ )

μ

(22.106)

Подробнее можно прочитать об этом в книге Balakrishnan and Cohen (1991, pp. 109–113). Downton (1966) изучил эффективность этих оценок и сравнил их с некоторыми другими оценками. Например, эффективность оценок параметров ξ и θ с линейными коэффициентами и квадратичными коэффициентами приведена в табл. 22.12 и 22.13 (имеет смысл сравнить их с табл. 22.5 и 22.6). Как и другие оценки, линейные оценки ξ∗ и θ∗ можно использовать для оценивания величины c1 ξ +c2 θ величиной c1 ξ∗ +c2 θ∗ ; можно доказать, что это — наилучшая несмещенная оценка с полиномиальными коэффициентами. Такая величина может иметь самостоятельный интерес, в частности, при оценке p-процентилей или квантилей, даваемых формулой (22.24), распределения экстремальных значений типа 1 (22.25). Естественно, что наилучшая линейная

45

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

ТАБЛИЦА 22.13 Эффективность линейных несмещенных оценок θ с линейными и с квадратичными коэффициентами (%) 2

3

4

5

6

7

42.70 42.70

54.56 58.78

60.13 67.14

63.37 72.26

65.48 75.71

75.55 93.64

n

Линейные коэффициенты Квадратичные коэффициенты

несмещенная оценка с полиномиальными коэффициентами есть ξp∗ = ξ∗ − θ∗ log(− log p),

0 < p < 1.

(22.107)

Относительная эффективность оценки (22.107) по сравнению с нижней границей Рао—Крамера рассматривается в работе Downton (1966).

9.6.

Оценки максимального правдоподобия

Оценки ξ# и # θ максимального правдоподобия (ОМП) по выборке X1 , X2 , . . . , Xn удовлетворяют уравнениям n 

# #

e−(Xi −ξ )/θ = n,

(22.108)

i=1

n     # # Xi − ξ# 1 − e−(Xi −ξ )/θ = nθ#.

(22.109)

i=1

Асимптотические дисперсии оценок ξ# и θ# совпадают с нижними границами Рао—Крамера (22.65). Асимптотический коэффициент корреляции ξ# и # θ равен  −1/2 π2 ≈ 0.313. (22.110) 1+ 2 6(1 − γ )

Запишем (22.108) в виде

( # # log ξ = −θ

n 1  −Xi /θ# e n

) .

(22.111)

i=1

Подставив это в (22.109), получаем уравнение для θ#: $n

−Xi /θ#

# = X − i=1 Xi e θ $n −Xi /θ# .

(22.112)

i=1 e

Уравнение (22.112) решается методом итераций, после чего ξ# определяется по уравнению (22.111). Если θ# велико по сравнению со всеми Xi -ми, то правая часть (22.112) аппроксимируется величиной  n − 1 S2 X 1− · . (22.113) n

#X θ

46

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Это же можно использовать при выборе начального приближения решения (22.112). Асимптотический доверительный интервал на уровне значимости α определяется формулой   2   2   # # #−θ 2 ξ# − ξ ξ −ξ θ−θ π θ 2 − 2(1 − γ ) + (1 − γ )2  − log α , + θ

или



θ

ξ# − ξ θ

θ



2 − 0.84556

# ξ −ξ θ

θ

6



#−θ θ θ



 + 1.82367

#−θ θ θ

n

2 −

2 log α . n

Последние формулы определяют эллипсы на плоскости (ξ , θ ). Асимптотическая дисперсия оценки # ξ#p = ξ# − log(log p)θ p-процентили распределения равна   6 θ2 1 + 2 {1 − γ − log(− log p)}2 . n

π

Tiago de Oliveira (1972) показал, что наилучший точечный прогноз максимального из m наблюдений в следующей независимой от данной выборке имеет вид # #, ξ = (γ + log m)θ а асимптотическая дисперсия этой оценки равна   6 2 θ2 {1 + log m} 1 + . 2 n π

Если известен масштабный параметр θ , то оценка максимального правдоподобия параметра ξ получается из (22.108) в виде  n  1 −Xi /θ # . (22.114) ξ|θ = −θ log e n

i=1

Эта оценка является смещенной. Kimball (1956) показал, что при известном θ  

1 1 E ξ#|θ = ξ + θ γ + log n − 1 − − · · · − , (22.115) 2 n−1 2  π 1 1 − 12 − 2 − · · · − . (22.116) var(ξ#|θ ) = θ 2 2 6

2

(n − 1)

# Оценка ξ#|θ является смещенной оценкой для ξ , а e−ξ|θ /θ — несмещенная оценка величины e−ξ /θ . Объяснение в том, что e−X/θ имеет экспоненциальное распределение со средним e−ξ /θ . Следовательно, доверительные интервалы для этой величины и, таким образом, для ξ при известном θ можно построить методами гл. 19, п. 7. Рассмотрим выборку, подверженную двустороннему цензурированию    , Xr+2 , . . . , Xn−s . Для такой цензурированной выборки типа II, а именно Xr+1

47

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

логарифм функции правдоподобия принимает вид log L = log n! − log r! − log s! −

n−s 

Yi



i=r+1

n−s 



e−Yi − (n − r − s) log θ +

i=r+1

    + r log FY (Yr+1 ) + s log 1 − FY (Yn−s ) , (22.117)

 где Yi = Xi − ξ /θ — порядковая статистика из стандартного распределения экстремальных значений типа 1 с плотностью (22.6), FY (y) — соответствующая функция распределения. Из (22.117) получаем уравнения максимального правдоподобия для ξ и θ : * + n−s    pY (Yn−s ) pY (Yr+1 ) ∂ log L 1 −Yi n−r−s− = 0, (22.118) = e −r +s   ∂ξ

θ

∂ log L = ∂θ * 1 = θ

n−s 

FY (Yr+1 )

i=r+1

Yi



i=r+1

n−s 

 Yi e−Yi

− (n − r − s)−

 rYr+1

i=r+1

1 − FY (Yn−s )

  pY (Yn−s ) pY (Yr+1 )  + sY n−s   FY (Yr+1 ) 1 − FY (Yn−s )

 =

(22.119)

= 0.

Harter and Moore (1968a) и Harter (1970) обсуждают численное решение этих уравнений. Оценку максимального правдоподобия параметра ξ при известном θ по выборке, цензурированной справа, рассматривали Harter and Moore (1967). Асимптотическая матрица ковариаций ОМП ξ# и θ#, определяемых уравнениями (22.118) и (22.119), приводится в работе Harter (1970). Эта матрица равна   θ 2 V11 V12 , (22.120) n

V12

V22



 где (Vij ) — матрица, обратная к матрице (V ij ) с элементами V 11 = 1 − q1 − q2 + q1 log q1 − (1 − q2 ) log(1 − q2 ), V 22 = −(1 − q1 − q2 ) − 2 {Γ (1; − log q1 ) − Γ (1; − log(1 − q2 ))} − − Γ (2; − log q1 ) − Γ (2; − log(1 − q2 )) + + 2 {Γ (2; − log q1 ) − Γ (2; − log(1 − q2 ))} − − q1 log q1 log(− log q1 ) {2 + log(− log q1 )} + + (1 − q2 ) log(1 − q2 ) log {− log(1 − q2 )} ×   log {− log(1 − q2 )} , × 2 + log {− log(1 − q2 )} + log(1 − q2 ) q2

V

12

=V

21

=



= −Γ (2; − log q1 ) + Γ (2; − log(1 − q2 )) + q1 log(q1 ) log(− log q1 ) − − (1 − q2 ) log(1 − q2 ) log {− log(1 − q2 )} −   1 − 1 log2 (1 − q2 ) log {− log(1 − q2 )} . − q2

48

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

∞ В последних трех формулах обозначено: q1 =r/n, q2 =s/n, Γ(p; α )= 0 e−t tp−1 dt,   dΓ(u; α )  d2 Γ(u; α )  Γ (p; α ) = и Γ (p; α ) =   . Harter (1970) табулировал 2 du

u=p

u=p

du

величины V11 , V12 и V22 для q1 =0.0 (0.1) 0.9 и q2 =0.0 (0.1) (0.9−q1). Escobar and Mecker

 (1986) рассматривают определение информационной матрицы Фишера V ij по цензурированной выборке. В работе Phien (1991) обсуждаются другие свойства ОМП параметров ξ и θ по цензурированным выборкам. В этой работе широко используется моделирование для изучения влияния цензурирования выборки по типу I на ОМП параметров и квантилей распределения Гумбеля. Основные выводы: (1) небольшое цензурирование справа уменьшает смещение оценок параметров, тогда как цензурирование слева и двустороннее цензурирование полезны в широком уровне диапазоне цензурирования; (2) смещение оценок параметров и квантилей малы; (3) в случае полной выборки ОМП смещение оценки параметра ξ получаются, в среднем, с избытком (с положительным смещением), а смещение ОМП параметра θ — с небольшим недостатком; (4) цензурирование выборки приводит к увеличению дисперсии оценок. Phien (1991) рассматривает ОМП параметров по дважды цензурированной слева по типу I выборке. Конкретно, пусть функция распределения есть −(x−ξ )/θ

FX (x) = e−e

,

Xr и Xs — точки цензурирования выборки слева и справа, причем отброшены r наименьших и s наибольших выборочных значений. Функция правдоподобия пропорциональна s , r s {FX (Xl )} pX (Xi ) {1 − FX (Xr )} . i=r+1

Заметим, что здесь r и s — случайные величины, а Xl и Xr фиксированы. Логарифм функции правдоподобия равен log L = const. −(n − r − s) log θ −

n−s  

 Yi + e−Yi − rd + s log q,

i=r+1

где d=e

−Yl

, −Yr

q = 1 − e−e

,

X −ξ Yl = l , θ X −ξ Yr = r , θ Xi − ξ Yi = . θ

ОМП параметров ξ и θ удовлетворяют уравнениям: ∂ log L G =− =0 ∂θ θ

и

∂ log L H = − = 0, ∂ξ θ

49

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

где G = P + Pl + Pr и H = Q + Ql + Qr , n−s n−s   Yi + Yi e−Yi , P= n−r−s− i=r+1

Pl = rdYl , Pr =

Q = −(n − r − s) +

i=r+1

n−s 

e−Yi ,

i=r+1

Ql = rd,

seYr (1 − q)Yr , q

Qr =

se−Yr (1 − q) . q

Phien (1991) рекомендует решать приведенные уравнения методом Ньютона. Posner (1965) применил теорию распределений экстремальных значений к задачам передачи информации; он рассмотрел ОМП параметров ξ и θ по полной выборке и установил некоторые асимптотические свойства. Однако Gumbel and Mustafi (1966) обнаружили, что асимптотические результаты не применимы к выборкам объема n = 30, рассмотренным в статье Posner (1965), и показали, что в этих случаях модифицированный метод моментов дает лучшие результаты. Другой подход использован в статье Balakrishnan and Varadan (1991). Авторы заменили уравнения правдоподобия подходящими линейными уравнениями и вывели приближенные оценки ξ и θ . Они получили эти оценки для распределения экстремальных значений типа 1 для минимальных значений, и мы здесь для удобства приводим именно эти оценки. (Оценки для максимальных значений получаются заменой r на s, а также ξ на −ξ  и Xi на −Xn−i+1 ). Уравнения правдоподобия для рассматриваемого случая имеют вид: * + n−s     pY (Yn−s ) pY (Yr+1 ) pY (Yi ) ∂ log L 1 r = 0, (22.121) =− −s +    ∂ξ

θ

∂ log L 1 =− ∂θ θ

*

FY (Yr+1 )

n−r−s+

1 − FY (Yn−s )

 rYr+1

i=r+1

pY (Yi )

n−s    pY (Yn−s ) pY (Yr+1 ) p (Y  )  − sY + Yi Y i n−s   FY (Yr+1 ) 1 − FY (Yn−s ) pY (Yi )

+ = 0,

i=r+1

(22.122) где Yi = (Xi − ξ )/θ , pY (y) = ey e−e и FY (y) = 1 − e−e . Разложив функции в (22.121) и (22.122) в ряд Тэйлора в окрестности точки F −1 (pi ) = log(− log qi ), i где pi = 1 − qi = , получаем приближенные соотношения: y

y

n+1

  pY (Yn−s ) pY (Yr+1 ) pY (Yi )    ≈ γ − δ Y , ≈ α − β Y , ≈ 1 − αn−s + βn−s Yn−s , i i r+1 i    FY (Yr+1 ) pY (Yi ) 1 − FY (Yn−s )

(22.123)

где

qr+1 q log qr+1 {1 − log(− log qr+1 )} + r+1 (log qr+1 )2 log(− log qr+1 ), pr+1 p2r+1   q 1 δ = r+1 log qr+1 1 + log qr+1 , pr+1 pr+1

γ =−

αi = 1 + log qi {1 − log(− log qi )} ,

βi = − log qi .

Подставив приведенные выше приближенные выражения в (22.121) и (22.122) и решив полученные уравнения, Balakrishnan and Varadan (1991) получили

50

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.14 Сравнение смещения и среднеквадратической ошибки (СКО) разных оценок параметров ξ и θ для n = 10 и n = 20 и цензурирования справа (r = 0) n = 10 0

s=

1

n = 20 2

3

0

1

2

3

4

# Смещение(ξ#)/θ −0.085 −0.089 −0.103 −0.125 −0.042 −0.043 −0.043 −0.046 −0.049 # СКО(ξ#)/θ 2 0.123 0.129 0.143 0.171 0.058 0.059 0.061 0.063 0.066 # Смещение(ξ )/θ −0.04 −0.05 −0.08 −0.11 −0.02 — −0.02 — −0.04 2 # СКО(ξ )/θ 0.114 0.122 0.137 0.166 0.056 — 0.060 — 0.066 var(ξ ∗ )/θ 2 СКО(ξ

∗∗

0.113

0.120

0.134

0.162

0.056



0.059



0.065

)/θ 0.113 0.120 0.134 0.161 0.056 — 0.059 — 0.065 # Смещение(θ#)/θ −0.066 −0.073 −0.085 −0.100 −0.033 −0.035 −0.035 −0.038 −0.041 # СКО(θ#)/θ 2 0.067 0.082 0.098 0.116 0.032 0.036 0.040 0.044 0.048 # Смещение(θ )/θ −0.07 −0.08 −0.10 −0.12 −0.04 — −0.04 — −0.05 2 # СКО(θ )/θ 0.063 0.077 0.094 0.113 0.033 — 0.042 — 0.050 2

var(θ ∗ )/θ 2 СКО(θ

∗∗

)/θ

2

0.072

0.088

0.107

0.132

0.033



0.041



0.050

0.067

0.081

0.197

0.117

0.032



0.039



0.047

Замечание: (ξ ∗ , θ ∗ ) — наилучшие линейные несмещенные оценки, (ξ ∗∗ , θ ∗∗ ) — наилучшие # # линейные инвариантные оценки, (ξ#, θ#) — ОМП, (ξ#, # θ ) — приближенные ОМП.

приближения ОМП для ξ и θ в виде # # #B ξ# = A − θ где

и



2 # # = −C + C + 4AD , θ

2(n − r − s)

(22.124)

  n−s 1   + sβn−s Xn−s + βi Xi , rδ Xr+1 A= m i=r+1  n−s  1 rγ − s(1 − αn−s ) + αi , B= m i=r+1 n−s C = rγ X  r+1 − s(1 − αn−s )X  n−s + αi X  i − mAB, i=r+1 n−s 2 2 2 D = rδ X  r+1 + sβn−s X  n−s + βi X  i − mA2 , i=r+1 n−s m = rδ + sβn−s + βi . i=r+1

Используя моделирование, Balakrishnan and Varadan (1991) установили, что их оценки столь же эффективны, как и оценки максимального правдоподобия, наилучшие несмещенные и наилучшие линейные инвариантные оценки даже для малых выборок, объема порядка 10. Таблица 22.14 содержит смещения и среднеквадратические отклонения для различных оценок ξ и θ для n = 10

51

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

и 20, для r = 0 и некоторых s. Аналогичные результаты уже упоминались в гл. 13 и 14. В работах Balakrishnan, Gupta and Panchapakesan (1992) и Fei, Kong and Tang (1994) обсуждается аналогичный подход к оценкам по многомерным выборкам, цензурированным по типу II.

9.7.

Метод условных распределений

Метод условных распределений параметров сдвига и масштаба, предложенный впервые в работе Fisher (1934) и детально изложенный в книге Lawless (1982), применен к распределению экстремальных значений в работах Lawless (1973, 1978) и Viveros and Balakrishnan (1994). Эти работы касаются распределения (x−ξ )/θ экстремальных значений типа 1 с функцией распределения вида 1 − e−e для минимальных значений.  Пусть X1  X2  · · ·  Xn−s — цензурированная справапо типу II выборка.

 дается формулой Многомерная плотность величины X = X1 , X2 , . . . , Xn−s pX (x; ξ , θ ) =

n−s      s n! , xi − ξ xi − ξ p , 1 − F Y Y θ θ s!θ n−s

(22.125)

i=1

где FY (·) — функция распределения, pY (·) — плотность стандартного распределения экстремальных значений типа 1 для минимальных значений: y

y

FY (y) = 1 − e−e и pY (y) = ey e−e .

(22.126)

Параметры сдвига и масштаба входят в совместную плотность (22.125) таким образом, что, как нетрудно

 заметить,  совместная плотность нормированных − ξ /θ функционально не зависит от ξ и θ . величин X1 − ξ /θ , . . . , Xn−s # — оценки максимального правдоподобия параметров ξ и θ Пусть ξ# и θ (или некоторые эквивариантные оценки, типа НЛНО или НЛИО), которые совместно максимизируют совместную плотность (22.125). Тогда Z1 = (ξ −ξ#)/θ# и Z2 = θ#/θ являются центральными функциями: в выражения их совместной  #, i = 1, 2, . . . , n−s, ξ /θ плотности не входят явно ни ξ , ни θ . Если Ai = Xi − # то A = A1 , A2 , . . . , An−s является подчиненной статистикой, и оценки величин ξ и θ могут быть основаны на совместном распределении Z1 и Z2 при условии, что наблюдаемое значение вектора A есть a. 

Заметим, что xi − ξ# /θ# = ai z2 +z1 z2 ; поэтому совместное распределение Z1 и Z2 при условии наблюдаемого множества a получается из (22.125) в виде p(z1 , z2 |a) = C(a)zn−s−1 2

n−s ,

s

pY (ai z2 + z1 z2 ) {1 − FY (ai z2 + z1 z2 )} =

i=1

=

e(n−s)z1 z2 +sa z2 e C(a)zn−s−1 2 −∞ < z1 < ∞,



n−s $

eai z2 +z1 z2 −sean−s z2 +z1 z2

i=1

0  z2 < ∞,

, (22.127)

52

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

$n−s где C(a) — нормировочная константа и sa = i=1 ai . Из (22.127) Lawless (1973, 1978) с помощью алгебраических преобразований и численного интегрирования нашел маргинальные условные плотности p(z1 |a) и p(z2 |a), по которым можно оценить параметры ξ и θ . Условные оценки других параметров, таких, например, как p-квантиль Xp также можно получить, используя (22.127). Например, для вычисления #p = ξ# + θ#F −1 (p) можно оценки максимального правдоподобия для Xp в виде X Y 

использовать центральную функцию Z3 = Xp − ξ# /θ# = FY−1 (p)/Z2 − Z1 . Преобразуя (22.127), можно найти совместное распределение Z2 и Z3 , после чего маргинальное условное распределение Z3 получается интегрированием. Тогда оценивается p-квантиль Xp . Lawless (1973, 1978) заметил, что толерантные границы и доверительные интервалы с заданной надежностью, а также прогнозируемые интервалы можно выводить с помощью метода условных распределений. В работе Viveros and Balakrishnan (1994) рассмотрен аналогичный метод условного оценивания при прогрессивно цензурированных второго типа выборочных данных. Метод предусматривает, что одно или несколько выживших выборочных значений могут быть удалены (или, прогрессивно цензурированы) до момента окончания эксперимента на выживание. Способы оценивания для полной выборки или цензурированной справа по типу II являются частными случаями этой общей схемы.

9.8.

Метод вероятностно взвешенных моментов

В работе Landwehr, Matalas и Wallis (1979) предложен метод оценки ξ и θ , основанный на вероятностно взвешенных моментах параметров

M(k) = E X (1 − F(X))k , k = 0, 1, 2, . . . . Несмещенной оценкой M(k) является  ⎫ ⎧  n−i ⎪ ⎪ ⎪ ⎪ n ⎨ ⎬  k 1 # (k) = Xi  M  ⎪, k = 0, 1, 2, . . . . n ⎪ ⎪ i=1 ⎩ n−1 ⎪ ⎭ k

# (0) и M # (1) Приравнивая выражения M(0) и M(1) выборочным величинам M и решая полученные уравнения, получаем оценки для ξ и θ . Landwehr, Matalas and Wallis (1979) нашли эти оценки: # # # = M(0) − 2M(1) θ log 2

и

# (0) − γ θ#. ξ# = M

Авторы сравнили смещение и среднеквадратическую ошибку (СКО) этих оценок с соответствующими характеристиками оценок по методу моментов и оценок максимального правдоподобия, приведенными в п. 9.6. Проведенный ими большой объем моделирования показывает, что по эффективности приведенные простые оценки сравнимы с оценками максимального правдоподобия. Смещение, СКО и относительная эффективность оценок, предложенных

53

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

ТАБЛИЦА 22.15 Смещение, среднее квадратическое отклонение (СКО) и относительная эффективность оценок параметров ξ и θ методом моментов (М), методом взвешенных моментов (ВМ) и методом максимального правдоподобия (МП) по полной выборке объема n θ

Метод

n

М ВМ МП М ВМ МП М ВМ МП М ВМ МП М ВМ МП М ВМ МП

5

9

19

29

49

99

ξ

Смещение

СКО

Относительная эффективность

0.18 0.15 0.00 0.11 0.09 0.00 0.05 0.04 0.00 0.04 0.03 0.00 0.02 0.02 0.00 0.01 0.01 0.00

0.37 0.34 0.44 0.30 0.26 0.21 0.22 0.18 0.21 0.18 0.15 0.17 0.14 0.11 0.13 0.10 0.08 0.09

0.83 1 0.74 0.74 1 0.76 0.66 1 0.76 0.63 1 0.77 0.60 1 0.77 0.57 1 0.76

Смещение

−0.10 −0.08 0.01 −0.06 −0.04 0.00 −0.03 −0.02 0.00 −0.02 −0.01 0.00 −0.01 0.00 0.00 −0.01 0.00 0.00

СКО

Относительная эффективность

0.49 0.49 0.48 0.36 0.36 0.36 0.25 0.24 0.24 0.20 0.20 0.20 0.15 0.15 0.15 0.11 0.11 0.11

0.97 1 1.05 0.96 1 1.03 0.97 1 1.02 0.96 1 1.00 0.96 1 1.00 0.96 1 1.00

в статье Landwehr, Matalas and Wallis (1979), приведены для некоторых n в табл. 22.15. Те же авторы приводят сравнение оценок, полученных указанными тремя методами p-квантилей (p = 0.001; 0.01; 0.02; 0.05; 0.10; 0.25; 0.50, 0.75; 0.90; 0.95, 0.98; 0.99; 0.999) для выборок объема n = 5; 9; 19; 29; 49, 99; 999.

9.9.

Оценки при блокировании данных

В статьях Weissman (1978), Huesler and Schuepbach (1986), Huesler and Tiago de Oliveira (1988) и некоторых других работах изучаются оценки в схеме блокировки данных. Пусть выборочные значения суть Xij , i = 1, 2, . . . , n, j = 1, 2, . . . , k (k можно рассматривать, например, как число периодов времени или число  групп, организованных по другому признаку). Обозначим Yj = max Xij , i  n . Считаем, что Xij таковы, что при большом n распределение величины Yj близко к распределению Гумбеля: −(y−ξn )/θ

Pr[Yj  y] = e−e

.

54

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Если θ известно (не ограничивая общности, можно считать θ = 1), то Xij — независимые одинаково распределенные случайные величины с функцией распределения −x+ξ Pr[Xij  x] = e−e , −y+ξ +log n

Pr[Yj  y] = e−e

.

В приведенных формулах ξn = ξ + log n. Huesler and Tiago de Oliveira (1988) вывели оценку максимального правдоподобия по выборке Y1 , Y2 , . . . ,Yn :  k  1 −Y ξ#A = ξ#n − log n = − log e i − log n. k

Для этой оценки

i=1

 

 1 1 + + O k−4 , E ξ#A = ξ + 2 2k

12k

а среднеквадратическая ошибка  

 1 3 1 СКО # ξA = + 2 + 3 + O k−4 . k

4k

4k

√  Распределение k ξ#A − ξ сходится к стандартному нормальному распределению при k → ∞ Weissman (1978) предложил оценку, основанную на k наибольших из всех N = nk значений Xij . Обозначим их Z1 : N  Z2 : N  · · ·  Zk : N . Предложенная оценка есть + *  k 1  −Zi : N −Zk : N # , ξB = − log e + (N − k)e k

i=1

и она совпадает с оценкой максимального правдоподобия для параметра ξ цензурированной выборки из распределения экстремальных значений. Другая оценка, полученная в статье Weissman (1978): ξ#C = Zk : N − log n,

связана с асимптотическими свойствами при n → ∞. Huesler and Tiago de Oliveira (1988) заметили, что все три оценки имеют одно и то же

 асимптотическое распределение (при n → ∞) и что n ξ#B − ξ#C = Op (1). В случае двух неизвестных параметров имеем # log n ξ#A = ξ#n − θ

и θ#A = θ#,

# — оценки максимального правдоподобия ξn и θ . Здесь где ξ#n и θ

−(x−ξ )/θ Pr Xij  x = e−e ,

−(y−ξ −θ log n)/θ (y−ξn )/θ Pr Yj  y = e−e = e−e ,

55

9. СТАТИСТИЧЕСКИЕ ОЦЕНКИ

где ξn = ξ + θ log n. Коэффициент корреляции между ξ#A и θ#A стремится к −1 при n → ∞. Оценки по k наибольшим значениям Z1 : N  Z2 : N  · · ·  Zk : N при фиксированных n и k совпадают с ОМП ξ#B и θ#B по выборке, цензурированной слева. Асимптотически   #B = Z k − Zk : N + Op log n , θ n   # #B log n + Op 1 , ξB = Zk : N − θ n

$k

где Z k = (1/k) i=1 Zi : n . Коэффициент корреляции между ξ#B и θ#B также медленно сходится к −1 при n → ∞. Huesler and Tiago Oliveira (1988) показали,   что эффективность по Рао—  de  # # # # Крамеру оценки ξB , θB относительно ξA , θA , определяемая равенством eff (B, A) ≡

det (ΣA ) , det (ΣB )

где ΣA и ΣB — асимптотические матрицы ковариаций соответственно, удовлетворяет соотношению eff (B, A) →

6 π2

ξ#A , # θA



и

#B ξ#B , θ



= 0.6079 при k → ∞.

Более тщательный анализ показывает, что метод A не всегда эффективнее метода B. Huesler and Tiago de Oliveira (1988) приводят множество числовых примеров, когда метод B более эффективен. Авторы делают вывод, что оценка p-квантили максимума в блоке по методу A лучше, чем по методу B при p  0.9, и что метод A значительно превосходит метод B при k  15.

9.10. Обзор других исследований Методы и результаты, рассмотренные в пп. 9.1–9.9, далеко не исчерпывают всех результатов по оценкам параметров. Имеется много других работ, посвященных оцениванию параметров распределений экстремальных значений. В этих работах предлагаются новые методы, модифицируются уже известные, приводятся различные вычислительные алгоритмы, обсуждаются последовательные методы статистической оценки, регрессионный анализ выборки из распределения экстремальных значений и т. д. Перечислим важные и интересные результаты. В работах Engelhardt (1975) и Engelhardt and Bain (1977) обсуждается возможность дальнейшего упрощения оценок параметров и соответствующих алгоритмов. Singh (1975) сравнил применение различных оценок. Meeker and Nelson (1975) предложили оптимально ускоренный метод проверки гипотез о параметрах, этому также посвящена статья Nelson and Meeker (1978). Lawless and Mann (1976) описывают проверку однородности параметров масштаба θi в k выборках из распределения экстремальных значений. В статье Smith (1977) обсуждается построение доверительных интервалов для

56

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

параметров. Durrant (1978) построил номограмму для расчета доверительных границ квантилей нормального распределения и изучил ее применимость к распределению экстремальных значений. Простой критерий значимости рассматривается в статье Tsujitani, Ohta and Kase (1979). Ashour and El-Adl (1980) исследовали байесовский подход к оценке параметров. Cheng and Iles (1983, 1988) построили доверительные границы для функции распределения. Простые оценки параметров ξ и θ , основанные на цензурированной выборке приводятся в статье Schuepbach and Huesler (1983). Свойства бутстреповских доверительных интервалов для параметров в зависимости от уровня цензурирования выборки изучаются в статье Robinson (1983). Stone and Rosen (1984) рассматривают графические методы оценивания. Работа Keating (1984) посвящена оценкам процентилей и функции надежности. В интересной статье Smith and Weissman (1985) рассматривается оценка максимального правдоподобия для нижнего хвоста распределения. Сравнение доверительных интервалов, рассчитанных различными методами, приводят Chao and Hwang (1986). В работе Welsh (1987), посвященной использованию эмпирических функций распределения и характеристической функции для оценки параметров, распределение экстремальных значений рассматривается как частный случай. Singh (1987) оценивает параметры распределения типа 1, используя m наибольших значений. Метод взвешенных наименьших квадратов ¨ uk (1987). Schneider and Weissfeld (1989) обсужрассматривается в работе Ostr¨ дают интервальные оценки на основе цензурированных данных. Ahmed (1989) рассматривает проблему выбора популяции с наименьшим значением ξi цензурирования из нескольких, имеющих распределение экстремальных значений. Achcar (1991) предложил свой вариант репараметризации при изучении распределения экстремальных значений. Hooda, Singh and Singh (1991) обсуждают оценки параметров распределения Гумбеля дважды цензурированной по выборке. Doganoksoy и Schmee (1991) сравнивают приближенные доверительные интервалы для коэффициентов линейной регрессии при цензурировании выборки по типу I. Построение доверительной полосы для линии регрессии по случайно цензурированной выборке приводят Abdelhafez and Thomas (1991).

10.

Толерантные границы и интервалы

Рассматривается полная или цензурированная по типу II выборка из распределения экстремальных значений. Нижняя толерантная граница ξ# + kL θ# уровня α для (1 − γ )-й доли распределения удовлетворяет уравнению

(22.128) Pr Pr[X  ξ# + kL θ#]  1 − γ = α . Аналогично, соответствующий множитель kU для верхней границы получается из уравнения

Pr Pr[X  ξ# + kL θ#]  1 − γ = α . (22.129) Константы kL и kU назовем нижним и верхним толерантными коэффициентами соответственно.

57

10. ТОЛЕРАНТНЫЕ ГРАНИЦЫ И ИНТЕРВАЛЫ

Для распределения экстремальных значений типа 1 для минимальных значений с функцией распределения (x−ξ )/θ

FX (x) = 1 − e−e

уравнения (22.128) и (22.129) принимают вид   # # ξ −ξ θ Pr + kL  log[− log(1 − γ )] = α , 

θ

θ

(22.130)



# # ξ −ξ θ Pr + kU  log(− log γ )] = α . θ θ

Переписав последние равенства в виде   # θ ξ −ξ log[− log(1 − γ )] −  kL = α , Pr # θ

θ



# θ ξ −ξ log(− log γ ) −  kU Pr # θ θ

(22.131)

(22.132)

 = α,

(22.133)

замечаем, что kL и kU являются соответственно верхней и нижней 100α -процентными точками распределения центральных величин P1 =

θ ξ# − ξ log[− log(1 − γ )] − # θ θ

и P2 =

θ ξ# − ξ log(− log γ ) − # θ θ

(22.134)

соответственно. Распределения этих двух величин не выражаются в явном виде, поэтому для вычисления процентных точек требуется применение метода Монте-Карло или каких-либо других приближенных методов. Mann и Fertig (1973) использовали наилучшие линейные инвариантные оценки для составления таблиц толерантных множителей для выборки, цензурированной справа по типу II при n = 3 (1) 25 и n − s = 3 (1) n, где s — номер наименьшего выборочного значения, удаленного из выборки; этому же посвящена книга Mann, Shafer and Singpurwalla (1974). Thoman, Bain and Antle (1970) рассчитали таблицы для определения толерантных границ по выборке объема до 120. Billman, Antle and Bain (1972) приводят таблицы для определения толерантных границ по полной выборке объема n = 40 (20) 120 с отбрасыванием 50% и 75% наибольших выборочных значений. В статье Johns and Lieberman (1966) опубликованы подробные таблицы, которые можно использовать для расчета толерантных интервалов по выборкам объема 10, 20, 30, 50 и 100, цензурированных справа по типу II, для четырех вариантов усечения при каждом n. Используя упрощенные линейные оценки, полученные в статьях Bain (1972) (см. п. 9.2), Mann, Shafer and Singpurwalla (1974) вывели приближенные выражения толерантных интервалов, основанные на F-аппроксимации. F-аппроксимация весьма эффективна и заслуживает специального упоминания. В книге Mann, Shafer and Singpurwalla (1974, p. 249) используется # # упрощенная линейная оценка θ# параметра θ и связанная с ней оценка ξ#

58

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

параметра ξ . Показано, что приближенная 100α %-я доверительная граница квантили Xγ есть  # # # Cn−s,n (1 − F1−α ) + F1−α log(− log γ ) , ξ# + θ (22.135) ln−s,n

где Bn−s,n , Cn−s,n и ln−s,n — константы, зависящие от s и n, F1−α — верхняя (1 − α )-процентная точка F-распределения с числами степеней свободы d1 =

2 {log(− log γ ) + Cn−s,n /ln−s,n }2 2 Bn−s,n − Cn−s,n /ln−s,n

,

d2 =

2 . ln−s,n

(22.136)

В той же книге Mann, Shafer and Singpurwalla (1974, p. 250) показано, что F-аппроксимацию можно использовать также с наилучшими линейными несмещенными оценками ξ ∗ и θ ∗ (см. п. 9.3). Там показано также, что такая аппроксимация подходит даже в случае малой выборки с большим уровнем цензурирования. Величины Bn−s,n , Cn−s,n и ln−s,n , зависящие от средних, дисперсий и ковариаций порядковых статистик выборки из распределения типа 1 для минимума, табулированы в той же книге для некоторых n и s. Другой вариант F-аппроксимации предложен в работе Lawless (1975) для нижней доверительной границы квантили Xγ . Автор основывается на том, что # # если цензурирование достаточно заметно, то оценки ξ# и θ# почти совпадают с оценками максимального правдоподобия ξ# и θ#; конкретно, # # θ = θ# 1 + ln−s,n

и

C # # # = ξ#. ξ# − n−s,n θ 1 + ln−s,n

(22.137)

Это в точности те же преобразования, что и описанные в п. 9.3 преобразования наилучших линейных несмещенных оценок к наилучшим линейным инвариантным оценкам. Используя (22.137) и ОМП ξ# и # θ , Lawless (1975) вывел доверительную границу для квантили Xγ при доверительной вероятности α в виде   Cn−s,n # # ξ + θ Cn−s,n + (1 + ln−s,n ) − (1 − F1−α ) + F1−α log(− log γ ) . (22.138) ln−s,n

Такая F-аппроксимация оказывается довольно точна во многих случаях. Lawless (1975) заметил, что   1 θ log(− log γ ) − (ξ# − ξ ) (22.139) Zγ = θ

является центральной величиной, поскольку Zγ = {log(− log γ )/Z2 } − Z1 , где Z1 = (ξ# − ξ )/θ# и Z2 = θ#/θ — центральные величины, введенные ранее, и это может быть использовано при построении толерантных границ. Например,  

Pr Zγ  zγ ,α = α ⇒ Pr zγ ,α θ# + # ξ  Xγ = α , (22.140) и, следовательно, zγ ,α θ# + ξ# дает нижнюю α -доверительную границу для Xγ . Таким образом, квантили распределения случайной величины Zγ дают верхние

59

10. ТОЛЕРАНТНЫЕ ГРАНИЦЫ И ИНТЕРВАЛЫ

ТАБЛИЦА 22.16 Сравнение точных толерантных границ и их F-аппроксимаций n

n−s

60 60 60 60 60 40 40 40 40 40 40 25 25 25

54 42 30 18 6 36 28 20 12 8 4 20 10 5

γ = 0.95

γ = 0.95

zγ ,0.95

F-аппроксимация

zγ ,0.95

F-аппроксимация

−3.76 −3.85 −3.99 −4.19 −4.69 −4.01 −4.12 −4.34 −4.68 −5.02 −5.96 −4.50 −5.22 −6.54

−3.79 −3.88 −4.01 −4.23 −4.83 −4.02 −4.16 −4.35 −4.72 −5.11 −5.99 −4.52 −5.28 −6.62

−2.88 −2.93 −3.00 −3.08 −3.09 −3.09 −3.13 −3.26 −3.40 −3.49 −3.53 −3.44 −3.83 −4.33

−2.91 −2.96 −3.03 −3.13 −3.38 −3.06 −3.17 −3.28 −3.46 −3.60 −3.74 −3.47 −3.89 −4.47

оценки толерантных границ [см. определение опорной величины P2 в (22.134)]. В табл. 22.16, заимствованной из статьи Lawless (1975), сравниваются точные толерантные границы, определенные с помощью Zγ (22.139) при α = 0.95, и соответствующие F-аппроксимации. В статье Mann and Fertig (1977) выведены поправки к асимптотически наилучшим линейным несмещенным оценкам параметров ξ и θ , полученным в работе Hassanein (1972), рассчитанным по k оптимальным образом выбранным квантилям вариационного ряда (см. п. 9.4) в случае малых выборок. Авторы составили таблицы поправочных коэффициентов по полной выборке для n = 20 (1) 40. Эти таблицы позволяют вычислить наилучшие линейные несмещенные оценки или наилучшие инвариантные несмещенные оценки, основанные на фиксированном множестве порядковых статистик. Таблицы также можно использовать для приближенного определения доверительных границ для Xγ и связанных с ними толерантных интервалов на основании вышеописанных аппроксимаций. Мы уже говорили в п. 9.7 о методах оценки с использованием условных распределений. Lawless (1975) показал, что условное распределение хвоста распределения Zγ (22.139) дается формулой ∞ 

Pr[Zγ  z|a] = (n − s − 1)!Cn−s (a) 0

$n−s

tn−s−2 et i=1 ai Γh(t,z) (n − s) n−s dt, (22.141) $ n−s ai t an−s t Γ(n − s) e + se i=1

60

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

где Γb (p) — неполная гамма-функция: b Γb (p) =

e−x xp−1 dx,

0

h(t, z) = − log γ · e

−tz

 n−s 

0  b < ∞, e

ai t

+ se

an−s t

.

(22.142)

i=1

Вычисление интеграла (22.142) требует применения численных методов. Нормировочная константа Cn−s (a) определяется численно по условию Pr[Zγ  −∞|a] = 1, при этом h(t, z) = ∞ и, следовательно, Γh(t,z) (n − s) = Γ∞ (n − s) = Γ(n − s). Тогда получаем: ⎡ ⎤−1 ∞ $  n−s−2 t n−s ai i=1 t e (22.143) Cn−s (a) = ⎣(n − s − 1)! $ n−s dt⎦ . 0

n−s ai t i=1 e

+ sean−s t

Вычисления квантилей Zγ по формуле (22.141) позволяет вычислить толерантные границы методом, описанным выше. В статье Gerish, Struck and Wilke (1991) предпринят иной подход к построению односторонних толерантных множителей для точных распределений экстремальных значений. Подход основан на связи распределений экстремальных значений с порождающим нормальным распределением. Авторы установили, что построение односторонних толерантных множителей, основанное на асимптотических распределениях экстремальных значений, не является удовлетворительным для точного распределения экстремальных значений.

11.

Границы и интервалы предсказания

Пусть ξ# и θ# — оценки максимального правдоподобия, полученные по выборке объема n из распределения экстремальных значений типа 1 для максимума; о них говорится в п. 9.6. Пусть, далее, Z— независимое от этой выборки наблюдение из того же распределения. Antle and Rademaker (1972) показали, что для построения интервала предсказания для Z можно использовать центральную величину T1 =

Z − ξ# . # θ

(22.144)

Авторы рассчитали таблицу процентных точек t1,γ распределения T1 для некоторых n и γ и методом Монте-Карло определили значения, приведенные в табл. 22.17. Нерегулярное поведение величин t1,γ значений в табл. 22.17, особенно при n = 100, по-видимому, объясняется выборочным разбросом. По значениям t1,γ #t1,γ . верхняя 100γ %-я граница предсказания для Z получается в виде # ξ +θ Другой подход предпринят в работе Engelhardt and Bain (1979). Авторы использовали упрощенные линейные оценки для ξ и θ , описанные в п. 9.2,

61

11. ГРАНИЦЫ И ИНТЕРВАЛЫ ПРЕДСКАЗАНИЯ

γ -Процентные точки t1,γ

ТАБЛИЦА 22.17 распределения случайной величины T1 (22.144) γ

n

10 20 30 40 50 60 70 100 ∞

0.90 2.64 2.41 2.33 2.30 2.29 2.26 2.26 2.24 2.25

0.95 3.59 3.24 3.06 3.00 2.98 2.97 2.98 2.96 2.97

0.975 4.51 4.04 3.89 3.81 3.79 3.74 3.72 3.66 3.68

0.98 4.88 4.26 4.14 4.04 3.99 3.99 3.94 3.90 3.90

0.99 6.00 5.12 4.90 4.79 4.69 4.70 4.66 4.68 4.60

0.995 6.18 5.86 5.68 5.56 5.53 5.46 5.38 5.30

при построении интервалов предсказания для Z1 в предстоящей выборке объема m из распределения экстремальных значений типа 1 для минимума на основе цензурированной справа по типу II выборки объема n − s. Обозначив # # # ξ и # θ упрощенные линейные оценки параметров ξ и θ , полученные по цензурированной выборке объема n − s, Engelhardt and Bain (1979) ввели центральную величину T2 =

# ξ# − Z1 . # # θ

(22.145)

# # Если t2,γ есть γ -квантиль распределения T2 , то, очевидно, что ξ# − θ#t2,γ есть  нижняя 100γ %-я граница предсказания для Z1 . Engelhardt and Bain приводят также следующую хорошую аппроксимацию для t2,γ . Записав   Z − ξ , (22.146) Pr[T2 < t] = Pr W(t) < 1 θ

где W(t) = Bain (1977)]:

# # ξ# − ξ tθ# − , θ θ

они используют асимптотику [Engelhardt and W(t) → log

kχ 2 (l) l

 ,

(22.147)

Где k(t) и l(t) выбираются из условия, чтобы обе части (22.147) имели одинаковые средние и дисперсии. Учитывая, что # #  #  # # # ξ# − ξ θ ξ# − ξ θ ν = var (W(t)) = var , + 2t2 var − 2t cov , θ

θ

θ

θ

они вывели подходящие аппроксимации для l и k в виде l = (8ν + 12)/(ν 2 + 6ν )

(22.148)

62

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

(заметим, что l не зависит от t) и  15l2 + 5l + 6 . k = exp −l + 3

(22.149)

15l + 6l

 Поскольку (Z1 − ξ )/θ → log χ 2 (2)/2m независимо от W(t), то, используя (22.146) и (22.147), получаем: Pr[T2 < t] = Pr[mk < F(2, l],

(22.150)

где F(2, l) — центральное F-распределение с (2, l) степенями свободы. Ис l −2/l γ − l , получаем простое пользуя точное выражение F1−γ (2, l) = 2 приближение для t2,γ , как значение t, при котором   2mk −l/2 γ = 1+ . (22.151) l

Границы или интервалы предсказания для Zj (2  j  m) найдены в более поздней статье Engelhardt and Bain (1979) на основе центральной величины T3 =

# ξ# − Zj . # # θ

Независимо от W(t) имеет место асимптотика    j  Zj − ξ χi2 (2) → exp θ

i=1

2(m − i + 1)

(22.152)

,

(22.153)

где χ12 (2), . . . , χj2 (2) независимы. Применив весьма хорошую аппроксимацию распределения линейной комбинации величин, распределенных по закону хиквадрат (см. аппроксимацию Патнайка (Patnaik) в гл. 18), записываем:    Z −ξ cχ 2 (ν ) exp j , (22.154) приближаем посредством θ

где c=

j  i=1



ν

1 ≈ log(m + 0.5) − log(m − j + 0.5), m−i+1 $j i=1

ν=2

$j i=1

1 m−i+1

2

1



(m − i + 1)2

{log(m + 0.5) − log(m − j + 0.5)}2 1 1 − m − j + 0.5 m + 0.5

.

# # Теперь нижняя 100γ %-я граница предсказания для Zi дается в виде ξ# − θ#t3,γ , где t3,γ — приближенное значение t, определяемое равенством F1−γ (ν , l) = k/c. Fertig, Meyer, and Mann (1980) использовали инвариантные оценки ξ ∗∗ и θ ∗∗ , описанные в п. 9.3 для предсказания величины Z1 в последующей выборке объема m. Они ввели центральную величину S1 =

ξ ∗∗ − Z1 . θ ∗∗

(22.155)

63

11. ГРАНИЦЫ И ИНТЕРВАЛЫ ПРЕДСКАЗАНИЯ

ТАБЛИЦА 22.18 Процентные точки распределения случайной величины S1 = (ξ − Z1 )/θ ∗∗ для выборки объема n, цензурированной справа по типу II до объема n − s ∗∗

n

5

n−s

3 5 10 3 5 10 15 3 5 10 15

γ

0.02 0.05 0.10 0.25 −9.67 −5.20 −3.04 −0.97 −2.68 −1.77 −1.17 −0.39 −15.94 −8.87 −5.27 −1.91 −4.41 −2.91 −1.88 −0.68 −1.76 −1.32 −0.96 −0.36 −21.17 −11.36 −6.80 −2.60 −5.72 −3.62 −2.36 −0.92 −2.16 −1.56 −1.10 −0.41 −1.62 −1.25 −0.92 −0.34

0.40 0.50 0.60 0.75 0.90 −0.09 0.37 0.85 1.85 4.37 0.14 0.51 0.92 1.74 3.39 −0.56 0.02 0.55 1.43 3.22 −0.04 0.35 0.74 1.52 3.03 0.12 0.43 0.79 1.48 2.69 −0.97 −0.26 0.33 1.20 2.81 −0.17 0.24 0.64 1.35 2.76 0.06 0.39 0.73 1.39 2.63 0.10 0.42 0.73 1.37 2.52

0.95 0.98 6.74 11.68 4.78 6.99 5.25 6.89 4.30 6.38 3.68 5.02 4.43 7.59 4.00 5.96 3.59 5.00 3.41 4.53

Пусть s1,γ есть 100γ -процентиль распределения S1 ; тогда 100γ %-я нижняя граница предсказания для Z1 равна ξ ∗∗ − s1,γ θ ∗∗ . Можно также получить 100γ %-ю верхнюю границу предсказания, заменив s1,γ на s1,1−γ . Используя моделирование методом Монте-Карло, Fertig, Meyer and Mann (1980) нашли значения s1,γ для различных n, n − s и γ при m = 1. Часть этих значений приведена в табл. 22.18. В книге Mann, Schefer and Singpurwalla (1974) подтверждается, что F-аппроксимация распределения статистики S1 (22.155) является удовлетворительной только для большой будущей выборки и умеренных доверительных уровней. Mann (1976) исследовала условия практической применимости указанной аппроксимации. В статье Mann and Saunders (1969) разобраны случаи n = 2 и 3. Fertig, Meyer and Mann (1980) предложили и оценили точность алгоритма, распространяющего алгоритм, использованный ранее в работе Fertig and Mann (1978), для аппроксимации распределения S1 распределением максимального значения в выборке из распределения Стьюдента в качестве альтернативы F-аппроксимации. Engelhardt and Bain (1982) продолжили исследование проблемы предсказания и предложили два упрощенных алгоритма аппроксимации процентных точек статистики T2 , определенной в (22.145). Вычисление приближенного значения t2,γ по формуле (22.151) требует применения численных итеративных методов. Engelhardt and Bain (1982) предложили две простые аппроксимации: −t+ν (t)/(2g)

Pr[T2 < t] ≈ e−me где 5+

g = 1+

1 log m 2

n−s −t

,

(22.156)

,

Pr[T2 < t] ≈ eme .

(22.157)

64

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Заметим, что аппроксимации, определяемые соотношениями (22.150) и (22.156), сходятся к (22.157) при n → ∞ и (n − s)/n → p > 0. Удобство приближенных формул (22.156) и (22.157) в том, что из них t2,γ находится явно. Например, приравнивая правую часть (22.156) значению γ и решая получившееся квадратное уравнение   ν (t) 1 −t + = log − m log γ , 2g

получаем явно приближенное значение t2,γ в виде 1/2   t2,γ = (A + B) − (A + B)2 − C + 2A log − 1 log γ , m где     # # g A=  ,  # var θ#/θ

# cov ξ#/θ , # θ /θ

B=

  # var θ#/θ

,

(22.158)

var ξ#/θ

C=

 .  # var θ#/θ

Предельная форма (22.157) также дает явное приближенное выражение для t2,γ :   1 (22.159) t2,γ = − log − m log γ . В работе Engelhardt and Bain (1982) обсуждается точность таких приближений. Pandey and Upadhyay (1986) рассмотрели применение предварительных пробных оценок для приближенного нахождения границ предсказания для распределения Вейбулла и это распространяется на распределение экстремальных значений типа 1 обычным логарифмическим преобразованием. В работе Abdelhafez and Thomas (1990) выводятся приближенные значения границ предсказания для распределения Вейбулла и распределения экстремальных значений с помощью регрессионных моделей.

12.

Выбросы и устойчивость

Для распределения типа 1 для минимума в работе Mann (1982) предложено три статистики, лежащие в основе критериев, для k верхних выбросов в выборке. Эти статистики суть θn∗∗ , (22.160) V = ∗∗ θn−k

Q= W=

 Xn − Xn−k , ∗∗ θn−k

  Xn−k+1 − Xn−k , ∗∗ θn−k

(22.161) (22.162)

∗∗ — наилучшие линейные инвариантные оценки θ (подробности где θn∗∗ и θn−k см. в п. 9.3), основанные на полной выборке объема n и на выборке n − k наименьших порядковых статистик соответственно. Точные распределения тестовых статистик (22.160)–(22.162) не найдены, поэтому в той же работе методом Монте-Карло определены критические значения и составлены некоторые таблицы. Более того, несмотря на эмпирический характер исследования, автором показано, что статистика W в (22.162) определяет мощный тест для выявления верхних выбросов в модели с уклонениями сдвигового характера.

65

13. ВЕРОЯТНОСТНЫЕ ГРАФИКИ

В статье Fung and Paul (1985) приводятся результаты глубокого экспериментального исследования для сравнения нескольких методов выявления выбросов. Кроме уже упомянутых, они рассмотрели следующие пять статистик, лежащих в основе критериев: 2 /Sn2 , (22.163) G = Sn−k 2 где Sn−k — сумма квадратов отклонений наименьших n − k порядковых статистик, Sn2 — сумма квадратов отклонений по всем n наблюдениям, R1 = R2 = R3 =

L=

 Xn − Xn−k

Xn − X1  Xn − Xn−k Xn − X2  Xn − Xn−k

,

(22.164)

,

(22.165)

,

(22.166)

Xn − X3 n−1 $   (Xi+1 − Xi )/(E[Yi+1 ] − E[Yi ])

i=n−k−1 n−1 $ i=1

 (Xi+1

 − Xi )/(E[Yi+1 ] − E[Yi ])

.

(22.167)

Fung and Paul (1985) рассмотрели также симметричный случай, получающийся  заменой Xi на Xn−i+1 для отделения k нижних выбросов в выборке. Методом Монте-Карло авторы рассчитали соответствующие критические значения. Они сравнили эти статистики по их сложности и по мощности критериев при выявлении k = 1, 2, 3 выбросов. Для верхних выбросов они использовали все восемь статистик, определяющих критерии отсева, и только пять последних статистик для нижних выбросов. В обстоятельном эмпирическом исследовании Fung and Paul (1985) разобраны случаи выборки, загрязненной выбросами как для модели с фиксированным параметром сдвига, так и для загрязненной выбросами выборки в модели с коррекцией параметра сдвига, изученной в статье Mann (1982). В этой модели загрязнения тест W, предложенный в работе Mann, менее эффективен по сравнению с другими. Алгоритм тестирования, основанный на статистике L (22.167), оказался наилучшим в случае верхних выбросов, а в случае нижних выбросов наилучшим оказался тест, основанный на статистике G (22.163). Статистика R1 (22.164) также является хорошей основой для тестирования в общем случае. Используя совместное распределение порядковых статистик, Fung and Paul (1986) вывели явные формулы для вычисления критических значений статистик R1 , R2 и R3 и их аналогов для нижних выбросов для проверки наличия k = 1 и k = 2 выбросов.

13.

Вероятностные графики, проверка адекватности модели и возможные модификации

Прикладное значение и важность распределений экстремальных значений объясняет появление большого числа публикаций, посвященных проверке гипотезы о том, что выборка взята из соответствующего распределения.

66

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

В этом пункте мы приведем короткий обзор этих исследований. Многие критерии согласия, разработанные для распределений экстремальных значений, приводятся в книге D’Agostino and Stephens (1986). Один из простейших критериев согласия, который можно назвать статистикой «коэффициента корреляции», относится к распределению экстремальных значений типа 1. Критерий основан на вычислении моментов произведений выборочных порядковых статистик и сравнения их с ожидаемыми значениями. Поскольку E[Xi ] = ξ + θ E[Yi ], можно также использовать корреляцию между порядковыми статистиками Xi и ожидаемыми значениями стандартизированных порядковых статистик E[Yi ] для распределений экстремальных значений типа 1. Понятно, что большие значения (близкие к 1) этих коэффициентов корреляции будут подтверждать гипотезу о возможности описания выборочных данных распределением экстремальных значений типа 1. Такой тест разобран в работе Smith and Bain (1976), где приведены таблицы критических точек; там же приведены таблицы для случая выборки, цензурированной по типу II. Более подробные таблицы критических точек распределения величины n(1 − R2 ), где R — выборочный коэффициент корреляции, предложен в работе Stephens (1986). Выбор автором статистики критерия в форме n(1−R2 ) допускает удобную интерполяцию в этих таблицах. Более того, его таблицы позволяют применить тест даже в случае выборки, цензурированной с двух сторон по типу II. Kinnison (1989) рассмотрел тот же критерий, основанный на коэффициенте корреляции для распределения экстремальных значений типа 1 и составил таблицы сглаженных значений процентных точек коэффициента корреляции r в случае полной выборки объема n = 5 (5) 30 (10) 100, 200. Он использовал приближенную формулу 

 E[Yi ] ≈ − log − log i/(n + 1) при вычислении выборочного коэффициента корреляции. Lockhart and Spinelli (1990) заметили, что использование точных значений E[Yi ] или даже аппроксимации Блома (Blom): E[Yi ] = − log {− log[(i − 0.25)/(n + 0.25)]} может увеличить мощность критерия. Однако, как своевременно показали Lockhart and Spinelli (1990), такой алгебраически простой критерий имеет довольно низкую мощность. В работе McLaren and Lockhart (1987) показано, что мощность критерия, основанного на статистике коэффициента корреляции при возрастании n стремится к нулю по сравнению с мощностью стандартных критериев, таких как критерий Колмогорова—Смирнова, Крамера и фон Мизеса или Андерсона—Дарлинга. Stephens (1977) предложил критерий согласия, основанный на эмпирическом распределении статистик W 2 , U 2 и A2 , определяемых формулами   2i − 1 2 1 W2 = + 12n , (22.168) FX (Xi ) − 2n i  2 FX (Xi ) − 1 , (22.169) U2 = W 2 − n 1 n

i

A2 = − 1n

 i

2

 (2i − 1) log FX (Xi ) − log {1 − FX (Xn−i+1 )} − n.

(22.170)

67

13. ВЕРОЯТНОСТНЫЕ ГРАФИКИ

ТАБЛИЦА 22.19 Процентные точки модифицированных статистик W , U , и A2 2

Статистика

Случай a

W2

0 1 2 3 0 1 2 3 0 1 2 3

U2

A2

2

Верхние процентные точки, α 0.75 0.90 0.95 0.975 0.99 (W 2 − 0.4/n + 0.6/n2 )(1.0 + 1.0/n) — 0.347 0.461 0.581 0.743 2 W (1 + 0.16/n) 0.116 0.175 0.222 0.271 0.338 Отсутствует 0.186 0.320 0.431 0.547 0.705 √ W 2 (1 + 0.2/ n) 0.073 0.102 0.124 0.146 0.175 (U 2 − 0.1/n + 0.1/n2 )(1.0 + 0.8/n) — 0.152 0.187 0.221 0.267 2 U (1 + 0.16/n) 0.090 0.129 0.159 0.189 0.230 √ U 2 (1 + 0.15/ 2n) 0.086 0.123 0.152 0.181 0.220 √ U 2 (1 + 0.2/ n) 0.070 0.097 0.117 0.138 0.165 Отсутствует — 1.933 2.492 3.070 3.857 A2 (1 + 0.3/n) 0.736 1.062 1.321 1.591 1.959 Отсутствует 1.060 1.725 2.277 2.854 3.640 √ A2 (1 + 0.2/ n) 0.474 0.637 0.757 0.877 1.038 Модификация

a В случае 0 известны оба параметра, ξ и θ ; в случае 1 ξ неизвестно, а θ известно; в случае 2 ξ известно, а θ неизвестно; в случае 3 параметры ξ и θ неизвестны.

Stephens приводит асимптотические значения процентных точек этих статистик для трех случаев: один или оба параметра ξ и θ оцениваются по выборке с помощью метода максимального правдоподобия. В работе Stephens (1977) также приводятся небольшие модификации этих статистик, направленные на применимость рассчитанных асимптотических процентных точек в случае выборки малого объема; асимптотические процентные точки приведены в табл. 22.19. Аналогичный подход предпринят в работе Chandra, Singpurwalla and Stephens (1981), где рассмотрены статистики D+ , D− и D Колмогорова—Смирнова и статистика Куипера (Kuiper) V, определяемые формулами:   i D+ = max − FX (Xi ) , (22.171) i n  i−1 , (22.172) D− = max FX (Xi ) − i

D = max(D+ , D− ), V = D + + D− .

n

(22.173) (22.174)

Авторы вычислили процентные точки этих статистик для трех случаев, когда один или оба параметра ξ и θ определяются по выборке методом максимального правдоподобия. Процентные точки указанных четырех статистик в случае, если оба параметра ξ и θ неизвестны, заимствованные из работы Chandra, Singpurwalla and Stephens (1981), приведены в табл. 22.20 для n = 10, 20, 50 и ∞. Часто в качестве вспомогательного средства при оценивании достоверности свойств статистического распределения используют графические методы; по

68

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Процентные точки статистик



+

nD ,





nD ,



ТАБЛИЦА 22.20 √ nD, nV при неизвестных ξ и θ

Односторонний уровень значимости α Статистика

√ + nD

√ − nD

√ nD

√ nV

n

0.10

0.05

0.025

0.01

10 20 50 ∞ 10 20 50 ∞ 10 20 50 ∞ 10 20 50 ∞

0.685 0.710 0.727 0.733 0.700 0.715 0.724 0.733 0.760 0.779 0.790 0.803 1.287 1.323 1.344 1.372

0.755 0.780 0.796 0.808 0.766 0.785 0.796 0.808 0.819 0.843 0.856 0.874 1.381 1.428 1.453 1.477

0.842 0.859 0.870 0.877 0.814 0.843 0.860 0.877 0.880 0.907 0.922 0.939 1.459 1.509 1.538 1.557

0.897 0.926 0.940 0.957 0.892 0.926 0.944 0.957 0.944 0.973 0.988 1.007 1.535 1.600 1.639 1.671

существу, корреляционный критерий основан на графическом построении. К сожалению, различие дисперсий различных точек графика затрудняет интерпретацию графиков. Устойчивый вероятностный график предложен в работе Michael (1984). Он предложил строить график 1/2   Xi − ξ 2 (22.175) Si = arcsin FX π

θ

как функцию аргумента 

ri =

2 i − 0.5 arcsin π n

1/2

.

Это позволяет обойти проблему различия разбросов, поскольку все Si в (22.175) имеют близкие дисперсии, так как асимптотическая дисперсия √ i nSi равна 1/π 2 независимо от q при n → ∞ и → q. Статистикой критерия, n используемой для построения критерия согласия на основе устойчивого графика, является DSP = max |ri − Si |. (22.176) i

Kimber (1985) вычислил критические точки статистики DSP для некоторых n; эти значения приведены в табл. 22.21. Lokhart, O’Reilly and Stephens (1986b) рассмотрели двусторонне цен   , Xr+1 , . . . , Xn−s из распределения зурированную по типу II выборку Xr+1

69

13. ВЕРОЯТНОСТНЫЕ ГРАФИКИ

ТАБЛИЦА 22.21 Критические значения статистики DSP α

n

3 4 5 6 8 10 14 20 30 40 60 80 100

0.50

0.25

0.10

0.05

0.01

0.085 0.096 0.097 0.098 0.096 0.094 0.088 0.082 0.073 0.066 0.059 0.052 0.047

0.109 0.119 0.122 0.124 0.119 0.115 0.107 0.098 0.087 0.079 0.069 0.062 0.056

0.137 0.144 0.148 0.148 0.142 0.136 0.127 0.116 0.103 0.093 0.081 0.072 0.066

0.154 0.167 0.167 0.165 0.157 0.150 0.139 0.127 0.113 0.103 0.089 0.080 0.073

0.167 0.209 0.201 0.201 0.186 0.176 0.163 0.149 0.134 0.132 0.107 0.096 0.089

экстремальных значений типа 1 для минимума. Они сравнили три критерия, основанные на нормированных величинах Zi =

 Xi+1 − Xi ,  E[Yi+1 ] − E[Y1 ]

i = r + 1, r + 2, . . . , n − s − 1,

(22.177)

где Yi — порядковая статистика стандартного распределения. При этом воз ] − E[Yi ], табулированные в работе Mann, можно использовать значения E[Yi+1 Scheuer and Fertig (1973) для n = 3 (1) 25, и значения, даваемые приближенными формулами Блома (Blom) для б´oльших объемов выборки. Пусть Zi∗

$i

= $j=r+1 i+1 j=r+1

Zj Zj

,

i = r, . . . , n − s − 2.

(22.178)

Lokhart, O’Reilly and Stephens (1986b) сосредоточились на анализе статистики Андерсона—Дарлинга (Anderson—Darling) *n−s−2 +  

 1 2 ∗ ∗ (2i − 1) log Zi + log 1 − Zn−s−1−i A − (n − r − s − 2) − n−r−s−2

i=r+1

(22.179) и сравнили ее поведение с S-статистикой, предложенной в работе Mann, Scheuer and Fertig (1973) [см. также Mann, Scheuer and Fertig (1971)] ∗ и статистикой Z , предложенной Tiku and Singh (1981). Здесь T = 1 − Zt∗ ,

70

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

где t=

⎧ ⎨r + n − r − s ,

2 ⎩r + n − r − s − 1 , 2 ∗

Z =

если n − r − s четно, если n − r − s нечетно,

n−s−2  1 Zi∗ . n−r−s−2

(22.180)

(22.181)

i=r+1

Сравнив три указанных теста, Lokhart, O’Reilly and Stephens (1986b) рекомендовали использовать статистику A2 . Они также обнаружили, что критерий на ∗ основе статистики Z хотя и имеет часто хорошую мощность, может иногда оказаться неэффективным. Подробное обсуждение критериев, основанных на нормированных величинах, содержится также в статье Lokhart, O’Reilly and Stephens (1986a). Tsujitani, Ohta and Kase (1980) предложили критерий, основанный на выборочной энтропии. Используя моделирование Монте-Карло, они нашли критические точки для некоторых объемов выборки и показали, что свойства такого теста сравнимы с упомянутыми выше. ¨ urk (1986) рассмотрел W-тест Шапиро—Уилка (Shapiro—Wilk) и методом Ozt¨ Монте-Карло нашел некоторые процентные точки. Основная трудность при использовании W-теста состоит в необходимости вычислить ковариационную ¨ urk (1986) матрицу порядковых статистик. Чтобы обойти эту трудность, Ozt¨ использовал приближенные значения, полученные с помощью обобщенного лямбда-распределения. Модификация статистики W предложена в работе ¨ urk and Korukoˇglu (1986), где в качестве статистики использовано Ozt¨ отношение двух линейных оценок параметра θ . Методом Монте-Карло авторы нашли процентные точки этой статистики и методом эмпирического сравнения показали, что предложенный критерий имеет довольно высокую мощность. В работе Aly and Shayib (1992) использованы упрощенные линейные оценки ξ# и θ# параметров ξ и θ , предложенные в работе Kimball (см. п. 9.2). Авторы предложили использовать статистику  n   2        Xi − ξ# i i i 1− log 1 − − log − log 1 − Mn = − i=1

# θ

n+1

n+1

n+1

(22.182) для проверки гипотезы о распределении экстремальных значений типа 1 для минимума. Методом Монте-Карло они нашли критические точки Mn для некоторых объемов выборки. Эти значения приведены в табл. 22.22. Aly and Shayib (1992) сравнили мощность предложенного ими критерия с другими, включая критерий на основе статистики A2 (22.179), рассмотренный в работах Lockhart, O’Reilly and Stephens (1986b). Краткий анализ мощности критериев показывает, что, по-видимому, мощность критерия на основе статистики Mn превосходит мощность критерия на основе статистики A2 для асимметричных распределений (например, для логарифмического распределения Вейбулла и для логарифмического хи-квадрат распределения). Однако для симметричных распределений, таких как нормальное или логистическое, мощность

71

14. ПРИЛОЖЕНИЯ

ТАБЛИЦА 22.22 Критические точки статистики Mn α

n

6 7 8 9 10 11 12 13 14 15 16 17 18

α

n

0.10

0.05

0.01

1.857 1.577 1.418 1.282 1.176 1.109 1.053 1.002 0.969 0.956 0.935 0.912 0.869

2.803 2.108 1.827 1.586 1.419 1.350 1.260 1.194 1.162 1.142 1.108 1.065 1.044

7.814 4.513 2.991 2.436 2.166 1.953 1.810 1.675 1.666 1.571 1.528 1.514 1.453

19 20 25 30 35 40 45 50 60 70 80 90 100

0.10

0.05

0.01

0.892 0.851 0.803 0.763 0.743 0.723 0.698 0.681 0.648 0.627 0.619 0.588 0.599

1.081 1.011 0.944 0.902 0.866 0.855 0.832 0.806 0.769 0.745 0.722 0.717 0.716

1.499 1.388 1.273 1.251 1.189 1.186 1.098 1.085 1.071 1.038 1.030 1.031 0.998

критерия на основе статистики A2 представляется значительно большей, чем мощность критерия на основе статистики Mn . В работе Tiago de Oliveira (1981) обсуждается проблема различения вариантов распределений экстремальных значений. Vogel (1986) провел дальнейшее изучение вероятностного графического метода и связанного с ним критерия, основанного на коэффициенте корреляции. Cohen (1986, 1988) детально рассмотрел случай большой выборки для наилучшего сглаживания распределения экстремальных значений. Mann and Fertig (1975) предложили критерий согласия для двухпараметрического распределения Вейбулла (т. е. распределения экстремальных значений типа 1 для максимума) в случае, когда альтернативным является трехпараметрическое распределение Вейбулла (гл. 21). В работе Aitkin and Clayton (1980) решается задача сглаживания распределения экстремальных значений для сложно цензурированной выборки данных о выживаемости с применением компьютерного программного пакета GLIM.

14.

Приложения

Само определение распределений экстремальных значений показывает, что они должны играть существенную роль при решении многих прикладных задач. В пп. 1 и 2 уже упоминалась роль работ Гумбеля 1940–50 гг., в которых впервые опубликованы интересные приложения распределений экстремальных значений и показана необходимость разработки надежных статистических методов анализа. Чтобы читатель мог составить представление о разнообразных приложениях, осуществленных в течение многих лет и о порядке появления подобных приложений, мы резюмируем прикладные работы в хронологическом порядке.

72

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Первой работой, посвященной приложению распределения экстремальных значений к описанию модели наводнений явилась статья Fuller (1914). Griffit (1920) обсуждает применимость этих распределений для моделирования процесса разрушений и деформаций твердых тел. В работах Gumbel (1937a, b) распределение экстремальных значений применяется при изучении радиоактивного распада и продолжительности жизни человека. Использование этих распределений при изучении проблем разрушения твердых тел предпринято в работе Weibull (1939). В этой области Вейбулл убедительно обосновал применимость обратного распределения типа 3, хорошо известного сейчас как распределение Вейбулла; это распределение подробно описано в гл. 21. Gumbel (1941) рассмотрел применение обсуждаемых здесь распределений при изучении характеристик наводнений. В последующих работах он продолжил обсуждение возможности предсказаний разрушительных наводнений, уровней подъема воды и предсказания наводнений [Gumbel (1944, 1945, 1959a)]. В работе [Frenkel and Kontorova (1943)] изучается степень хрупкости кристаллов. Nordquist (1945) применил распределение экстремальных значений к изучению силы землетрясений. Velz (1947) использовал такие распределения при моделировании выживаемости микроорганизмов в условиях самоочищения и уменьшения загрязненности. Большая роль распределений экстремальных значений при изучении диэлектрических свойств бумажных конденсаторов отмечена в работе Epstein and Brooks (1948). Rantz and Riggs (1949) проиллюстрировали применимость распределений экстремальных значений к изучению силы и частоты наводнений в бассейне реки Columbia на основе измерений, опубликованных Геологическим обзором США. Интересный и свежий подход использован в работе Press (1949) при изучении возникающих нагрузок при ураганах. Potter (1949) использовал распределения экстремальных значений при изучении данных о выпадении осадков, а также для разработки критериев нормальности выпадения объема осадков по частотным характеристикам для малого числа бассейнов рек. Weibull (1949) еще раз подчеркнул значение распределений экстремальных значений для описания усталостных разрушений твердых тел, причем снова отстаивал преимущества распределения Вейбулла по сравнению с распределением экстремальных значений типа 1. Так называемый метод Гумбеля успешно применяется как к явлениям регулярного характера (например, температура или давление), так и к спонтанно происходящим событиям (осадки, ветер). Однако, как заметил Jenkinson (1955), ряд недостатков метода возникают при асимптотической аппроксимации. Thom (1954) отметил, что сильный разброс во времени выборочных наблюдений экстремумов затрудняет изучение процессов выпадения осадков. Он показал, как оценить параметры пуассоновских процессов по ежегодным наблюдениям интенсивности осадков в одно и то же время в некоторой фиксированной области. Методы анализа экстремальных гидрологических явлений мало изменились со времени публикации Gumbel (1941) по асимптотической теории применительно к потокам стекающей воды. В основе такого подхода лежат предположения о том, что распределение экстремумов внутри последовательных интервалов остается постоянным и что наблюдаемые экстремальные значения можно считать независимыми выборочными значениями

14. ПРИЛОЖЕНИЯ

73

из однородной популяции. В работах Gumbel (1954, 1958) содержится обзор статистических аспектов теории распределений экстремальных значений и некоторых практических приложений. Эти работы вместе с более поздними [Gumbel (1962a, b)] позволяют более глубоко изучить распределения экстремальных значений. Thom (1954) применил эти распределения к изучению частоты максимальной силы ветра. В интересной статье Aziz (1955) теория экстремальных значений применяется к анализу глубины залегания алюминия. В работе Kimball (1955) хорошо объясняются различные стороны практического применения теории экстремальных значений и разбираются аспекты сопутствующих статистических проблем. Jenkinson (1955) применил распределения экстремальных значений для моделирования ежегодных максимумов и минимумов при исследовании метеорологических явлений. Lieblein и Zelen (1956) подробно изучили методы, основанные на распределениях экстремальных значений, и применили их к анализу распределения времени до отказа крепежного материала штолен. Eldredge (1957) изучил применение теории экстремальных значений к анализу роста очагов коррозии на основе данных обследований внутреннего размера трубопровода нефтяных скважин. В работе King (1959) приводится обзор применений распределений экстремальных значений в теории надежности. В статьях Canfield (1975) и Canfield and Borgman (1975) приведен анализ применений различных статистических моделей времени наработки на отказ в теории надежности и получены рекомендации о применении в первую очередь распределения экстремальных значений типа 1. В п. 3 упомянута работа Clough and Kotz (1965). В ней содержится интересная интерпретация условий (22.13)–(22.15), приводящая к специфической модели массового обслуживания и ее приложений к теории экстремальных значений. Posner (1965) описывает приложение теории к технике связи; об этом также говорится в комментарии Gumbel and Mustafi (1966) по поводу статьи Познера. В серии публикаций Simiu and Filliben (1975, 1976) и Simiu, Bietry and Filliben (1978) описан широкий круг применений распределений экстремальных значений к статистическому анализу экстремальных значений скорости ветров. Shen, Bryson and Ochoa (1980) применили распределения экстремальных значений к задаче предсказания наводнений. Wanabe and Kitagawa (1980) исследовали возможность оценки значений максимальной мощности землетрясений в Японии. Okubo and Narita (1980), следуя методам статей Simiu and Filliben (1975, 1976), применили распределения экстремальных значений для моделирования ураганов в Японии. Аналогичный метод применили Wantz and Sinclair (1981) для анализа ураганных ветров в административном округе Бонневилль (Bonneville). Metcalfe and Mawdsley (1981) применили распределения экстремальных значений для предсказания экстремально низких стоков при расчете водохранилища. Возможности применения теории экстремальных значений для расчета региональных ирригационных сетей показана в работе Greis and Wood (1981). Roldan-Canas, Garcia-Guzman and Losada-Villasante (1982) построили вероятностную модель появления смерчей на основе распределений экстремальных значений. Приложения этих распределений к анализу распределений максимальных осадков содержится в работе Rasheed, Aldabagh and Ramamoorthy (1983). Интересное приложение в области селекции лошадей и предсказания результатов соревнования рас-

74

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

смотрено в статье Henery (1984). В то время как Pericchi and Rodriguez-Iturbe (1985) использовали модель распределения экстремальных значений при статистическом анализе наводнений, Burton and Makropoulos (1985) проанализировали сейсмические риски в странах тихоокеанского бассейна. Авторы использовали распределение экстремальных значений типа 1 для анализа интенсивности высвобождающейся при этом энергии. Двухкомпонентное распределение экстремальных значений и применение к задачам о наводнениях предложено в работе Rossi, Fiorentino and Versace (1986). Обсуждение результатов этой статьи содержится в работе Beran, Hosking and Arnell (1986) и затем Rossi (1986), а продолжение дискуссии — в статье Rossi (1987). Тема анализа частоты наводнений с применением распределения экстремальных значений типа 1 продолжена в работах Smith (1987), Jain and Singh (1987) и Ahmad, Sinclair and Spurr (1988). Achcar, Bolfarine and Pericchi (1987) рассмотрели возможность преобразовать данные о выживании так, чтобы свести задачу к применению распределения экстремальных значений типа 1. Nissan (1988) показал применимость распределения типа 1 к оценке распределения страховых премий. Роль статистического анализа экстремальных значений в проблемах климата подробно обсуждается в статье Buishand (1989). Cockrum, Larson and Taylor (1990) и Taylor (1991) использовали распределения экстремальных значений при построении модели свойств материала к воспламенению и исследования ее методом статистического моделирования. Wiggins (1991) показал возможность анализа проблем теории запасов с использованием моделей экстремальных значений. Смесь распределений экстремальных значений использовали Fahmi and Abbasi (1991) при исследовании магнитуды землетрясений в Ираке и прилегающих регионах. Tawn (1992) изучал высоту приливов; Hall (1992) продолжил изучение частоты наводнений. Bai, Jakeman and McAleer (1992) показали интересную возможность оценки верхних процентных точек в проблеме контроля данных об окружающей среде. Hopke and Paatero (1992) рассмотрели оценки экстремальных размеров частиц, рассеянных в воздухе, в частности, оценки размеров аэрозольных частиц и связанные с этим экологические задачи. Kanda (1993) опубликовал обзор работ по изучению наиболее интенсивных сдвигов земных пластов, связанных с землетрясениями, а также скорости ветра и загрузки супермаркетов. Goka (1993) применил рассматриваемые распределения при моделировании ускоренных испытаний танталовых конденсаторов, предназначенных для космических исследований, а также при обработке орбитальных данных о воздействии радиации на интегральные блоки памяти. Rajan (1993) подчеркнул важность теории распределений экстремальных значений при обработке экспериментов со значительными отклонениями от среднего в физике композиционных материалов. Некоторые из его примеров показали отклонение от классического закона Маллинса—фон Неймана для роста двумерных частиц, причем отклонения наблюдались в случае экстремальных размеров частиц и были связаны со значительными изменениями свойств материалов. Также в работе отмечена роль экстремальных значений размеров микроотверстий синтетических мембран. Scarf and Laycock (1993) и Shibata (1993) обнару-

15. ОБОБЩЕННЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

75

жили применимость теории экстремальных значений при изучении коррозии. Приложения к страхованию рассмотрены в статье Teugels and Beirlant (1993). Завершая этот раздел, отметим, что существует множество других прикладных задач, где применяются распределения экстремальных значений. Об этом можно прочитать в книгах и обзорах, приведенных в списке литературы.

15.

Обобщенные распределения экстремальных значений

Функция распределения обобщенного распределения экстремальных значений дается формулой ⎧ 1/γ ⎨e−{1−γ (x−ξ )/θ } , −∞ < x  ξ + θ /γ , если γ > 0, если γ < 0, (22.183) FX (x) = ξ + θ /γ  x < ∞, ⎩ −e−(x−ξ )/θ e , −∞ < x < ∞, если γ = 0. Как уже отмечено в п. 2, это распределение включает распределение типа 2, определенное формулой (22.2), при γ > 0, типа 3 при γ < 0 и распределение типа 1, определенное формулой (22.1), при γ = 0. Распределение (22.183) называют распределением экстремальных значений фон Мизеса или распределением фон Мизеса—Дженкинсона. Jenkinson (1995) применил это распределение для анализа экстремальных значений некоторых метеорологических показателей. Плотность распределения равна ⎧   x − ξ (1/γ )−1 ⎪ −{1−γ (x−ξ )/θ }1/γ 1 ⎪ e · γ , 1 − ⎪ ⎪ θ θ ⎪ ⎨ если γ > 0, (22.184) −∞ < x  ξ + θ /γ , pX (x) = ⎪ ⎪ ξ + θ /γ  x < ∞, если γ < 0, ⎪ ⎪ ⎪ ⎩ −e−(x−ξ )/θ 1 −(x−ξ )/θ ·θe , −∞ < x < ∞, если γ = 0. e Функция распределения стандартной формы обобщенного распределения экстремальных значений есть ⎧ −(1−γ y)1/γ ⎪ , −∞ < y  1/γ , если γ > 0, ⎨e если γ < 0, FY (y) = 1/γ  y < ∞, (22.185) ⎪ ⎩ −e−y e , −∞ < x < ∞, если γ = 0, а плотность равна ⎧ −(1−γ y)1/γ ⎪ (1 − γ y)(1/γ )−1 , −∞ < y  1/γ , если γ > 0, ⎨e если γ < 0, pY (y) = 1/γ  y < ∞, (22.186) ⎪ ⎩ −e−y −y e e , −∞ < x < ∞, если γ = 0. Maritz and Munro (1967) изучили порядковые статистики обобщенного распределения экстремальных значений и составили таблицы средних значений порядковых статистик для выборки объема от 5 до 10 при значениях параметра формы γ = −0.10 (0.05) 0.40. Авторы также рассмотрели оценки всех

76

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

трех параметров ξ , θ и γ этого распределения с использованием порядковых статистик. Из (22.185) и (22.186) получается характеризационное дифференциальное уравнение (1 − γ y)pY (y) = −FY (y) log FY (y). (22.187) Balakrishnan, Chan and Ahsanullah (1993) использовали дифференциальное уравнение (22.187) для установления ряда рекуррентных соотношений для моментов нижних рекордных значений и моментов произведений этих величин. В частности, пусть YL(1) ≡ 1, YL(2) . . . — нижние рекордные значения, порождаемые последовательностью {Y} н.о.р. случайных величин с обобщенным распределением экстремальных значений вида (22.185). Тогда, действуя тем же способом, как это объяснено в разд. 6, и используя дифференциальное уравнение (22.187) Balakrishnan, Chan and Ahsanullah (1993) получили следующие соотношения: 

r+1  r+1 r γ (r + 1) r+1 E YL(n+1) E YL(n) , = 1+ − E YL(n) n



r+1 s E YL(m) YL(m+1) =

r+1 s YL(n) = E YL(m)

m = 1, 2, . . . ; r, s = 0, 1, . . . , 

r

r+1  1 s s (r + 1)E YL(m) + mE YL(m+1) , YL(n) YL(n) r, s = 0, 1, . . . ,



r

r

r s+1 s+1 s = {1 + γ (s + 1)} E YL(m) + (s + 1)E YL(m) + E YL(m) YL(m+2) YL(m+1) YL(m+1)  r+s+1

r  s+1 + m E YL(m+1) − E YL(m+1) YL(m+2) , r s+1 YL(n+1) E YL(m)



(22.189)

m + γ (r + 1)

1  m  n − 2;



(22.188)

1 m + γ (r + 1)





n

n = 1, 2, . . . ; r = 0, 1, . . . , 

r

r+s+1  s (r + 1)E YL(m) + mE YL(m+1) , YL(m+1)

(22.190)

m = 1, 2, . . . ; r, s = 0, 1, . . . , (22.191)



1 r s+1 r s YL(n) YL(n) = {n − m + γ (s + 1)} E YL(m) − (s + 1)E YL(m) + n−m

r

 s+1 r s+1 + mE YL(m+1) YL(n) YL(n+1) − E YL(m+1) , 

1  m  n − 2;

r, s = 0, 1, . . .

(22.192)

Используя эти рекуррентные формулы, Balakrishnan, Chan and Ahsanullah (1993) установили, что 

 1

γ для n  1, E YL(n) − E YL(n+1) = 1 + n n

  m cov YL(m) , YL(m+1) = var YL(m+1) для m  1,

 cov YL(m) , YL(n) = где r(i) =

m+γ

 (n − 1)(n−m) var YL(n) (n−m) (n − 1 + γ )

1, если r(r − 1) · · · (r − i + 1), если

для 1  m  n − 2, i = 0, i = 1, 2, . . . .

77

15. ОБОБЩЕННЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Теми же авторами выведены рекуррентные соотношения для моментов произведений, включающие более двух рекордных значений. Если параметр формы γ → 0, то формулы (22.188)–(22.192) превращаются в формулы, приведенные в п. 6 для распределения экстремальных значений типа 1. Ahsanullah and Holland (1994) рассмотрели оценки параметров сдвига и масштаба для распределения экстремальных значений при известном γ , основанные на рекордных значениях. ОМП параметров ξ , θ и γ обсуждаются несколькими авторами, в том числе Jenkinson (1969), Prescott and Walden (1980, 1983), Hoskins (1985) и Macleod (1989). Элементы информационной матрицы Фишера, полученные по выборке объема n из обобщенноего распределения экстремальных значений, выведены в работе Prescott and Walden (1980):   ∂ 2 log L n = 2 p, E − ∂ξ 2 θ   ∂ 2 log L n E − = 2 2 {1 − 2Γ(2 − γ ) + p} , 2 ∂θ   θ γ 2    ∂ 2 log L n π 1 2 2q p E − + 1 − 0.5772157 − + + 2 , = 2 6 γ γ ∂γ 2 γ γ   ∂ 2 log L n E − = 2 {p − Γ(2 − γ )} , ∂ξ ∂θ θ γ     ∂ 2 log L n p E − = q+ , ∂ξ ∂γ θγ γ     ∂ 2 log L n 1 − Γ(2 − γ ) p E − −q− = 2 1 − 0.57772157 − , ∂θ ∂γ

где

γ

θγ

p = (1 − γ )2 Γ(1 − 2γ ),

γ

  1−γ . q = Γ(2 − γ ) ψ (1 − γ ) − γ

Условия регулярности выполняются при γ < 12 , и в этом случае асимптотиче-

ское поведение дисперсий и ковариаций оценок максимального правдоподобия дается элементами обратной информационной матрицы Фишера с приведенными выше элементами. Hoskins (1985) составил программу MLEGE на языке ФОРТРАН, которая обеспечивает вычисление ОМП параметров ξ , θ и γ методом Ньютона—Рафсона и матрицы ковариаций оценок этих параметров с помощью приведенных формул. В статье Macleod (1983) отмечается, что если начальное приближение для параметра γ формы распределения равно 0, то алгоритм Хоскинга приводит к делению на нуль и аварийной остановке вычислений. Там же предложены уточнения алгоритма Хоскинга. Hosking, Wallis and Wood (1985) применили вероятностно взвешенные моменты для оценки параметров ξ , θ и γ . Используются моменты

(22.193) βr = E X{F(X)}r , r = 0, 1, 2, . . . , и выборочные величины n  (i − 1)(r)  br = 1n X , r = 0, 1, 2, . . . , (22.194) (r) i i=1

(n − 1)

78

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

являющиеся несмещенными оценками βk (см. п. 9). Вместо этого можно использовать упрощенные оценки n

1 # βr pi,n = pri,n Xi , (22.195) n i=0

где pi,n — не зависящая от распределения оценка значения F(Xi ), в качестве которой можно взять i−a pi,n = n , 0 < a < 1, i−a

или

pi,n = n + 1 − 2a , − 12 < a < 12 . Для обобщенного распределения экстремальных значений Hosking, Wallis and Wood (1985) доказали, что    Γ(1 + γ ) βr = 1 ξ + θ 1 − (22.196) , γ > −1, γ = 0. γ r+1 γ (1 + r)

Они использовали эту формулу для вывода соотношений #0 = β0 = ξ + θ {1 − Γ(1 + γ )} , β γ

#0 = 2β1 − β0 = θ Γ(1 + γ )(1 − 2−γ ) 2β#1 − β γ #2 − β#0 3β 3β − β0 1 − 3−γ = 2 = . #1 − β#0 2β1 − β0 1 − 2−γ 2β

(22.197) (22.198) (22.199)

Решение уравнения (22.199) относительно γ требует итерационных методов, поэтому Hosking, Wallis and Wood (1985) предложили приближенную оценку # γ = 7.8590c + 2.9554c2, (22.200) где # −β #0 2β log 2 c= 1 − . #2 − β #0 3β

log 3

Вычислив γ# по формуле (22.200), легко затем по формулам (22.198) и (22.199) получить оценки параметров θ и ξ в виде 

#= θ

 #1 − β#0 # 2β γ

#

Γ(1 + # γ )(1 − 2−γ )

,

#0 + θ# {Γ(1 + # # ξ =β γ ) − 1} . # γ

(22.201) (22.202)

Обычными методами Hosking, Wallis and Wood (1985) показали, что матрица T  #, # ξ, θ γ дается формулой ковариаций вектора оценок # ⎛

1⎝ n

θ 2 w11

θ 2 w12 θ 2 w22



θ w13 θ w23 ⎠ , w33

(22.203)

где величины wij зависят только от γ . Величины wij при различных значениях параметра формы γ приведены в табл. 22.23. Асимптотическая эффективность каждой из оценок, полученных методом взвешенных моментов,

79

15. ОБОБЩЕННЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

ТАБЛИЦА 22.23 Множители wij асимптотической матрицы ковариаций оценок, полученных методом вероятностно взвешенных моментов параметров обобщенного распределения экстремальных значений γ −0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3 0.4

w11 1.6637 1.4153 1.3322 1.2915 1.2686 1.2551 1.2474 1.2438 1.2433

w12 1.3355 0.8912 0.6727 0.5104 0.3704 0.2411 0.1177 −0.0023 −0.1205

w13 1.1405 0.5640 0.3926 0.3245 0.2992 0.2966 0.3081 0.3297 0.3592

w22 1.8461 1.2574 1.0013 0.8440 0.7390 0.6708 0.6330 0.6223 0.6368

w23 1.1628 0.4442 0.2697 0.2240 0.2247 0.2447 0.2728 0.3033 0.3329

w33 2.9092 1.4090 0.9139 0.6815 0.5633 0.5103 0.5021 0.5294 0.5880

и интегральная эффективность (определяемая детерминантом матрицы ковариаций) показана на рис. 22.2, также заимствованном из работы Hosking, Wallis and Wood (1985). Wang (1990) определил частично вероятностно взвешенные оценки и рассмотрел оценки параметров обобщенного распределения экстремальных значений, основанные на цензурированной выборке. Prescott and Walden (1983) рассмотрели обобщенное распределение экстремальных значений (22.183) и вывели оценки максимального правдоподобия параметров ξ , θ и γ по цен  зурированной с двух сторон по типу II выборке Xr+1 , . . . , Xn−s , т. е. в случае, когда r наименьших и s наибольших выборочных значений удалены из выборки объема n. Они также получили выражения для асимптотической матрицы ковариаций ОМП. Smith (1984) изучил вероятностные характеризационные свойства обобщенных моделей экстремальных значений. Hosking (1984) рассмотрел проверку равенства нулю параметра формы γ обобщенного распределения экстремальных значений по выборочным данным. Некоторые критерии согласия для обобщенного распределения экстремальных значений изучены в работе Choudhury, Stedinger and Lu (1991). Полезные замечания о модели превышения пороговых значений в работе Davison and Smith (1990) позволяют более отчетливо представить происхождение таких распределений. Предположив, что по байесовским оценкам и по ОМП получается правдоподобный прогноз, Davison (1986) применил их к предсказанию экстремумов в выборке с использованием обобщенного распределения экстремальных значений. Как уже отмечалось в п. 2, распределение Гомперца [Gompertz (1825)] продолжительности жизни получается на основе перехода к специальной параметризации и усечения в нуле распределения экстремальных значений типа 1. Это распределение хорошо согласуется с данными клинических испытаний для популяций старших возрастов и полезны при составлении таблиц дожития [Stephens (1977)].

80

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

РИС. 22.2. Асимптотическая эффективность оценок параметров обобщенного распределения экстремальных значений методом вероятностно взвешенных моментов. Обоγ; ----- ----- ----- θ#; --- --- --- --- ξ#; - - - - - - интегральная значения на чертеже: ---------------------- # эффективность (отношение детерминанта асимптотической матрицы ковариаций оценок, полученных методом максимального правдоподобия, к детерминанту матрицы ковариаций оценок, полученных методом вероятностно взвешенных моментов)

Разные авторы используют различные формы записи функции распределения Гомперца. Garg, Raja Rao and Redmond (1970) определяют ее в виде функции интенсивности отказа (интенсивности смертности) r(t) = Keα t ,

t  0.

Она, в свою очередь, приводит к функции выживания αt

−1)/α

,

t  0,

αt

−1)/α

,

t  0.

1 − F(t) = e−K(e и плотности

p(t) = Keα t e−K(e

(22.204)

В самой работе Gompertz (1825) определено преобразование y(t) = = K(eα t − 1)/α , которое преобразует случайную величину T в случайную величину y(T), распределенную по экспоненциальному закону со средним 1. Ahuja (1971) использует классическое определение функции распределения экстремальных значений первого типа в виде −t/μ

F(t) = e−ρe

, −∞ < t < ∞.

(22.205)

Более общая форма приводится в работе Ahuja and Nash (1967); она получается с помощью дополнительного параметра формы φ . Соответствующая плотность равна  φ −t/μ 1 p(t; ρ, μ , φ ) = ρe−t/μ e−ρe , −∞ < t < ∞. (22.206) μ Γ(φ )

81

15. ОБОБЩЕННЫЕ РАСПРЕДЕЛЕНИЯ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Семиинварианты распределения (22.205) суть κ1 = μ (γ + log ρ),

κ2 =

π2μ2 , 6

κ3 ≈ 2.404μ 3

независимо от сомножителя e−ρ [Revfeim (1984b)]. Garg, Raja Rao and Redmond (1970) обнаружили следующее свойство распределения Гомперца в параметризации (22.204). Если перенести начало координат в точку t0 (т. е. положить t = t − t0 при t  0), то плотность сохраняет свой вид: 



α t

p(t ) = K  eα t e−K (e −1)/α , t  0,  α t0 где K = Ke = r(t0 ) есть интенсивность отказа в точке t0 . Это означает, что усечение распределения Гомперца в точке t0 и смещение начала в t0 оставляет распределение неизменным, за исключением константы K, переходящей в K. Garg, Raja Rao and Redmond (1970) исследовали свойства ОМП параметров распределения Гомперца по цензурированной выборке и сгруппированным данным. Пусть, к примеру, промежуток [0, tm ) разбит на m частей: [0, t1 ), [t1 , t2 ), . . . , [tm−1 , tm ). Пусть для i = 1, 2, . . . , m n — число наблюдаемых индивидуумов в выборке, di — наблюдаемое число индивидуумов, убывших (умерших) в промежутке [ti−1 , ti ), si — наблюденное число индивидуумов, доживших до момента ti и потерянных или выбывших для дальнейшего процесса обследования для i = 1, 2, . . . m. Логарифмическая функция правдоподобия равна log L = const +D log K + α T − K Q(α ), α где T=

m 

d i τi ,

D=

i=1

m 

di ,

i=1

m   αt

  si e i − 1 + di eατi − 1 . Q(α ) = i=1

Отсюда получается ОМП коэффициента K: # = Dα# , K #) Q(α

а решение уравнения T+

D Q (α ) −D =0 α Q(a)

(22.207) (22.208)

дает ОМП для α . Итеративное решение (22.208) можно получить методом Ньютона. В качестве начального приближения α0 можно выбрать оценку α методом наименьших квадратов, используя числовые значения интенсивности смертности r(t) для каждого t и минимизируя величину  2 {log r(t) − log K − α t} . (22.209) i

После этого ОМП для K получается по формуле (22.207). Численные результаты эксперимента по определению воздействия рациона на выживание

82

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

мышей, сообщенные в Garg, Raja Rao и Redmond (1970), показывают, что рассматриваемое распределение хорошо описывает смертность мышей в каждой из пяти испытуемых групп. Кроме того, оказалось, что при использовании оценок максимального правдоподобия согласие значительно лучше, чем при использовании оценок по методу наименьших квадратов. Ahuja (1972) рассмотрел обобщенную плотность Гомперца в форме (22.206). Он установил, что если независимые случайные величины X и Y имеют распределение Гомперца с плотностями pX (t1 ; ρ1 , μ , φ ) и

pY (t2 ; ρ2 , μ , φ ),

(22.210)

то условная плотность X при условии Z = X − Y = z также является обобщенной плотностью Гомперца

 p t; ρ1 + ρ2 ez/μ , μ , φ + θ . Это свойство сродни модели катастроф, включающей биномиальное распределение и распределение Пуассона, а также свойству нормальных распределений (см. гл. 4, п. 13). Характеристическая функция обобщенного распределения Гомперца (22.206) равна ψ (u; ρ, μ , φ ) = eiμ u

Γ(φ − iμ u) . Γ(φ )

(22.211)

Следовательно, характеристическая функция разности двух независимых случайных величин с распределениями Гомперца с параметрами (ρ1 , μ , φ ) и (ρ2 , μ , φ ) имеет вид  iμ u ρ Γ(φ − iμ u)Γ(θ + iμ u) ψZ (u) = 1 . (22.212) ρ2

Γ(φ )Γ(θ )

Если Z — случайная величина, характеристическая функция которой дается формулой (22.212), то Z имеет обобщенное логистическое распределение (см. гл. 23) с плотностью pZ (z; ρ, μ , φ , θ ) =

1 (ρe−z/μ )φ · , −∞ < z < ∞. μ B(φ , θ ) (1 + ρe−z/μ )φ +θ

(22.213)

Scarf (1992) рассмотрел четырехпараметрическое обобщенное распределение экстремальных значений и изучил свойства ОМП и оценок, получаемых методом вероятностно взвешенных моментов. Он заметил, что в некоторых прикладных задачах данные об экстремумах по наблюдениям пар (Xi , ti ), i = 1, 2, . . . , n, где Xi — наблюдение в момент ti — не зависит от величины Xj , наблюдаемой в момент tj . Одно из таких приложений получено при исследовании коррозии металлов; там Xi — глубина наибольшего проникновения коррозии относительно поверхности металла, помещенного в агрессивную среду на время t. Для этой модели Scarf (1992) предложил четырехпараметрическую форму обобщенного распределения экстремальных значений в виде FX,t (x) = e{1−γ [(xt

−β

−ξ )/θ ]}1/γ

,

γ xt−β < ξγ + θ ,

θ , β > 0.

В дальнейшем Scarf изучил методы оценки параметров ξ , θ , γ и β .

(22.214)

16. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

16.

83

Другие распределения, связанные с распределением экстремальных значений

Уже отмечалась связь между тремя типами распределений экстремальных значений. Как показано в предыдущем пункте, стандартное распределение типа 1 является промежуточной формой между распределениями типа 2 и типа 3 (распределения Вейбулла). Кроме того, как говорилось в п. 9 (а также в гл. 21), логарифмическое преобразование случайной величины, подчиненной распределению Вейбулла, приводит к распределению экстремальных значений типа 1. Аналогично, если Y имеет стандартное распределение экстремальных значений типа 1 с плотностью (22.26), то e−Y распределено по стандартному показательному закону, и об этом сказано в п. 4. Несколько неожиданным оказывается соотношение между логистическим распределением и распределением типа 1. Если две независимые случайные величины имеют одинаковые распределения типа 1, то их разность имеет логистическое распределение [Gumbel (1961)]. Gumbel (1962c, d) также изучил распределения произведения и частного независимых случайных величин, имеющих распределения экстремальных значений. Таблицы распределения максимального отношения, равного отношению наибольшего значения к наименьшему, взятому с противоположным знаком, т. е. Xn /(−X1 ), опубликованы в статье Gumbel and Pickands (1967). Предельные распределения второго, третьего и т. д. элементов вариационного ряда, вплоть до наибольшего (наименьшего) значения также могут рассматриваться как распределения экстремальных значений. Gumbel (1958) сформулировал условия, подобные тем, что приводят к распределению экстремальных значений типа 1, сходимости r-го наибольшего значения  Yn−r+1 = (Xn−r+1 − ξ )/θ к стандартному распределению с плотностью  pYn−r+1 (y) = rr [(r − 1)!]−1 exp[−ry − re−y ].

(22.215)

Процентные точки порядка 100α % этого распределения приведены в работе Gumbel (1958) с пятью десятичными знаками для r = 1 (1) 15 (5) 50 и α = 0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95, 0.975, 0.99, 0.995. Производящая функция моментов распределения (22.215) равна rt Γ(r − t) . Γ(r)

Производящая функция семиинвариантов равна t log r + log Γ(r − 1) − log Γ(r), так что семиинварианты даются формулами κ1 = log r − ψ (r);

κs = (−1)r ψ (s−1) (r),

s  2.

(22.216)

Предельное распределение (22.215), соответствующее фиксированному значению r, отличается от распределений, получающихся при изменении r в зависимости от n (обычно так, что r/n близко к постоянной), или от распределений, получающихся при постоянном r но при изменении аргумента.

84

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Например, если xn определено уравнением FX (xn ) = 1 − w/n, где w фиксировано, а FX (x) — функция распределения случайной величины, то, как показал Borgman (1961), w  −1 lim Pr[Xn−r+1  xn ] = 1 − [(r − 1)!] tr−1 e−t dt. (22.217) n→∞

0 2 > 2w]. Правая часть этого равенства в терминах распределения χ 2 равна Pr[χ2r Асимптотическое распределение размаха также, естественно, связано с распределением экстремальных значений. Если наибольшее и наименьшее значения имеют в пределе распределения типа 1, то, как показано в статье Gumbel (1947), предельная функция распределения размаха R равна   (22.218) Pr[R  r] = 2e−r/2 K1 2e−r/2 , r > 0   с плотностью pR (r) = 2e−r K0 2e−r/2 , r > 0,

где K0 и K1 — модифицированные бесселевы функции второго рода нулевого и первого порядков соответственно. Гумбель приводит значения E[R] = 2γ = 1.15443,

Медиана = 0.92860,

а также var(R) =

Мода = 0.50637,

π2 = 3.2899. 3

В статье Gumbel (1949b) приведены таблицы Pr[R  r] и pR (r) с семью десятичными знаками для r = −4.6 (0.1) − 3.3 (0.05) 11.00 (0.5) 20.0 и квантилей Rα с четырьмя десятичными знаками для α = 0.0002 (0.0001) 0.0010 (0.001) 0.010 (0.01) 0.95 (0.001) 0.998 и с тремя десятичными знаками для α = 0.001 0.999(0.0001) 0.9999. Особый вид обобщенных и составных распределений экстремальных значений типа 1 построил Dubey (1969). Он ввел дополнительный параметр τ , определив функцию распределения равенством    x−ξ . (22.219) Pr[X  x] = exp −τθ exp − θ

В силу соотношения

    x−ξ x − ξ τθ exp − = exp − , θ

θ



где ξ = ξ + θ log τθ , случайная величина X имеет обычное распределение типа 1. Такое обобщение, однако, является только промежуточным этапом в конструировании смешанного распределения экстремальных значений типа 1, которое можно определить как «Обобщенное» распределение типа 1 (ξ , θ , τ ) Λ Gamma (p, β ). τ

Здесь предполагается, что τ имеет распределение с плотностью pτ (t) =

β p p−1 −β t t e , Γ(p)

t > 0,

p > 0,

β > 0.

16. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

85

Результирующее составное распределение имеет функцию распределения βp Pr[X  x] = Γ(p)

∞ 

    x−ξ tp−1 exp −t β + θ exp − dt = θ

0

−p   x−ξ . = 1 + θβ −1 exp −

(22.220)

θ

Заметим, что это распределение, отличное от обобщенного логистического распределения, введенного в работе Ahuja and Nash (1967), также можно рассматривать как обобщенное логистическое распределение [См. Hald (1952) и гл. 23 п. 10]. В гл. 23 оно названо обобщенным логистическим распределением типа 1. Рассмотрев функцию распределения    x−ξ Pr[X  x] = 1 − exp −τθ exp − (22.221) θ

и использовав аналогичное гамма смешивание, Balakrishnan and Leung (1988a) получили функцию распределения   −p x−ξ . (22.222) Pr[X  x] = 1 − e−ρ(x−ξ )/θ θβ −1 + exp − θ

Это распределение в гл. 23 названо обобщенным логистическим распределением типа II. Там же отмечено, что обобщенные логистические распределения получаются одно из другого изменением знака случайной величины. Продолжая аналогично, Balakrishnan and Leung (1988a) рассмотрели гаммаэкспоненциальную плотность      κ κ (x − ξ ) κ (x − ξ ) τ pX (x|τ ) = exp −τ exp − , exp − θ θ θ Γ(κ ) (22.223) −∞ < x < ∞, κ > 0, θ > 0, и смешали ее посредством гамма распределения параметра τ . В результате смешивания получается плотность ∞ 

pX (x) =

(x−ξ )/θ

e−te

e−κ (x−ξ )/θ

0

βp e−κ (x−ξ )/θ = θ Γ(p)Γ(κ )

tκ β p p−1 −β t t e dt = θ Γ(κ ) Γ(p)

∞ 

e

  −t β +e−(x−ξ )/θ κ +ρ −1

t

dt =

0

 κ β −1 exp{−(x − ξ )/θ } 1 , =   θβ (κ , ρ) 1 + β −1 exp{−(x − ξ )/θ } κ +p

−∞ < x < ∞,

κ > 0,

p > 0,

θ > 0.

(22.224)

Плотность (22.224) в гл. 23 названа обобщенной логистической плотностью типа III.

86

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Стандартная логарифмическая гамма-плотность pY (y) =

y 1 e−κ y−e , −∞ < y < ∞, Γ(κ )

κ >0

(22.225)

может рассматриваться как плотность обобщенного распределения экстремальных значений типа 1. В частности, если Y имеет плотность (22.225), то при κ = 1 случайная величина −Y распределена с обычной плотностью распределения экстремальных значений типа 1. Отметим еще, что при целых κ (22.225) превращается в (22.215). Функция распределения, соответствующая плотности (22.225), равна −∞ < y < ∞,

FY (y) = Iey (κ ),

κ > 0,

где It (κ ) — нормированная неполная гамма-функция: t 1 It (κ ) = e−z zκ −1 dz, 0 < t < ∞,

(22.226)

κ > 0.

Γ(κ )

0

Для целых κ отсюда получаем (см. гл. 17): −y

1 − FY (y) = e−e

κ −1 iy  e

i=0

i!

,

−∞ < y < ∞,

κ = 1, 2, . . . .

(22.227)

Производящая функция моментов распределения с плотностью (22.225) равна

Γ(κ + t) ; E etY = Γ(κ )

отсюда

E[Y] = ψ (κ ) и var(Y) = ψ  (κ ).

(22.228) 1

Приняв во внимание, что для больших κ ψ (κ ) ∼ log κ и ψ  (κ ) ∼ , κ Prentice (1974) предложил изменить параметры логарифмической гамма-плотности, записав ее в виде p∗Y (y) =

√ κ κ −1/2 √κ y−κ ey/ k e , Γ(κ )

−∞ < y < ∞,

κ > 0,

(22.229)

и эта функция стремится к нормальной плотности при κ → ∞. Вводя параметры сдвига ξ и масштаба θ для плотности (22.225), получаем трехпараметрическую логарифмическую гамма-плотность в виде pX (x) =

(x−ξ )/θ 1 eκ (x−ξ )/θ e−e , θ Γ(κ )

κ > 0,

θ > 0.

(22.230)

Это — очевидное обобщение плотности распределения типа 1 (22.25). В статьях Lawless (1980, 1982) показано удобство использования трехпараметрической логарифмической гамма-плотности (22.230) в качестве модели дожития и для получения оценок параметров методом максимального правдоподобия, об этом также см. в работе Prentice (1974). Balakrishnan and Chan (1994a, b, c, d) изучили порядковые статистики этого распределения, наилучшие линейные несмещенные оценки, асимптотически наилучшие линейные несмещенные оценки и оценки максимального правдоподобия параметров по полной выборке и по выборке, цензурированной по типу II. Young and Bakir (1987)

16. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

87

рассмотрели регрессионную модель для логарифмического гамма-распределения. Lawless (1980) и DiCiccio (1987) проанализировали алгоритмы исследования обобщенного гамма-распределения (подробности см. в гл. 17). В работе Mihram (1975) это распределение названо обобщенным распределением экстремальных значений и рассмотрены такие свойства этого распределения как замкнутость относительно линейных преобразований, изменение и сохранение формы плотности и т. д. Также рассмотрены свойства оценок, связанные с достаточностью, эффективностью и т. д. В некоторых прикладных работах рассматривается двухпараметрическая смесь распределений экстремальных значений с плотностью pX (x) =

α −(x−ξ )/θ ∗ −e−(x−ξ )/θ 1 − α −(x−ξ ∗ )/θ ∗ −e(x−ξ ∗ )/θ ∗ e e + ∗ e e , θ θ

−∞ < x < ∞,

0 < α < 1,

θ ∗ > 0.

(22.231)

−∞ < x < ∞,

(22.232)

θ > 0,

Функция распределения, равная (x−ξ )/θ

FX (x) = α e−e

(x−ξ ∗ )/θ ∗

+ (1 − α )e−e

,

также встречается в некоторых прикладных работах. Производящая функция моментов этого распределения имеет вид: ∗

MX (t) = α etξ Γ(1 − θ t) + (1 − α )etξ Γ(1 − θ ∗ t),

|t| max(θ , θ ∗) < 1.

(22.233)

Среднее значение и дисперсия даются формулами E[X] = {α (ξ − ξ ∗ ) + ξ ∗ } + γ {α (θ − θ ∗ ) + θ ∗ } ,   2 π2 2 var(X) = αθ 2 + (1 − α )θ ∗ + α (1 − α ) {(ξ − ξ ∗ ) + γ (θ − θ ∗ )} . 6

(22.234) (22.235)

Rossi, Fiorentino and Versace (1986) использовали двухкомпонентное распределение экстремальных значений для анализа частоты наводнений; обсуждение этих проблем также содержится в работах Hosking and Arnell (1986) и Rossi (1986). Revfeim (1984a) рассмотрел альтернативную параметризацию распределения экстремальных значений типа 1 и предложил расширенное семейство таких распределений типа 1. Конкретно, рассмотрим события пуассоновского процесса интенсивности ρ. Если размер каждого из событий не зависит от других событий и имеет функцию распределения G(x), то функция распределения события максимального размера на единичном временн´oм промежутке равна F(x) =

e−ρ{1−G(x)} − e−ρ . 1 − e−ρ

(22.236)

Если ρ велико, то e−ρ пренебрежимо мало. В случае экспоненциального распределения, т. е. если G(x) = 1 − e−x/μ , x  0, из (22.236) при больших ρ получается −x/μ , (22.237) F(x) = e−ρe что с точностью до обозначений параметров совпадает с распределением экстремальных значений для максимума (22.1) [Revfeim (1984b)]. Об этом

88

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

также см. в работах Revfeim (1984c) и Revfeim and Hessel (1984). Выбрав в качестве G(x) гамма-распределение, т. е. G(x) = 1 − e−x/μ

p−1  (x/μ )i

i!

i=0

,

Revfeim (1984a) получил из (22.236) расширенное семейство распределений экстремальных значений типа 1 с функцией распределения  p−1  (x/μ )i −x/μ . (22.238) F(x) = exp −ρe i!

i=0

При ρ = 1 это распределение превращается в распределение типа 1 (22.237). Свойства моментов распределения (22.237) для p > 1 рассмотрены в статье Revfeim (1984a). Revfeim и Hessel (1984) применили распределение (22.237) к модели экстремальных порывов ветра. Zelenhasic (1970) использовал распределение (22.237) при изучении разливов рек. Среднее значение этого распределения равно E[X] ≈ μ a(log ρ + b), где a и b зависят от параметра формы гамма-распределения. При p = 8 (наиболее подходящее значение при моделировании порывов ветра) a = 1.58, b = 6.00. При p = 4 величины a и b равны соответственно 1.31 и 3.55, при p = 2 получаются a = 1.13, b = 1.82. Заметим, что при p = 1 a = 1 и b = γ . Оценки максимального правдоподобия параметров μ и ρ даются формулами   X 1 S#1 #= μ ρ= , (22.239) 1+ и # S#0

p

где S0 =

p−1  Z i=0

i

i!

Zi =

,

S1 =

S#0

Zp , p!

n 1  −xj /μ e n j=1

S2 =

Zp+1 , p!

 i xj μ

.

# можно найти методом итераций, в котором следующее значение μ Оценку μ получается делением текущего значения на 1 + D, где D=

S0 + S1 − XS0 /pμ . S2 + X[(S0 /p) − S1 ]/μ

Общая формула k-го момента распределения (22.228) имеет вид ρ E{X ] = μ Γ(p) k

1

k

(− log y)p+k−1 e−py

$p−1 i=0

(− log y)i /i!

dy,

где y = e−x/μ . (22.240)

0

Последнюю величину трудно оценить, даже используя численные методы, особенно при больших p и k из-за особенности в точке y = 0.

СПИСОК ЛИТЕРАТУРЫ

89

Список литературы Abbasi, J. N. Al, and Fahmi, K. J. (1991). GEMPAK: A FORTRAN-77 program for calculating Gumbel’s first, third, and mixture upper earthquake magnitude distributions employing maximum likelihood estimation, Computers & Geosciences, 17, 271–290. Abdelhafez, M. E. M., and Thomas, D. R. (1990). Approximate prediction limits for the Weibull and extreme value regression models, Egyptian Statistical Journal, 34, 408–419. Abdelhafez, M. E. M„ and Thomas, D. R. (1991). Bootstrap confidence bands for the Weibull and extreme value regression models with randomly censored data, Egyptian Statistical Journal, 35, 95–109. Abramowitz, M., and Stegun, I. A. (eds.) (1965). Handbook of Mathematical Functions with Formulas, Graphs and Mathematical Tables, New York: Dover 1) . Achcar, J. A. (1991). A useful reparametrization for the extreme value distribution, Computational Statistics Quarterly, 6, 113–125. Achcar, J. A., Bolfarine, H., and Pericchi, L. R. (1987). Transformation of survival data to an extreme value distribution, The Statistician, 36, 229–234. Ahmad, M. I., Sinclair, C. D., and Spurr, B. D. (1988). Assessment of flood frequency models using empirical distribution function statistics, Water Resources Research, 24, 1323–1328. Ahmed, E. (1989). On the probability of selecting extreme value populations with the smallest location parameters, The Statistician, 38, 191–195. Ahsanullah, M. (1990). Estimation of the parameters of the Gumbel distribution based on the m record values, Computational Statistics Quarterly, 5, 231–239. Ahsanullah, M. (1991). Inference and prediction problems of the Gumbel distribution based on record values, Pakistan Journal of Statistics, Series B, 7, 53–62. Ahsanullah, M., and Holland, B. (1994). On the use of record values to estimate the location and scale parameters of the generalized extreme value distribution, Sankhy¯a, Series B (to appear). Ahuja, J. C. (1972). On certain properties of the generalized Gompertz distribution, Sankhy¯a, Series B, 34, 541–544. Ahuja, J. C., and Nash, S. W. (1967). The generalized Gompertz-Verhulst family of distributions, Sankhy¯a, Series A, 29, 141–156. Aitkin, M., and Clayton, D. (1980). The fitting of exponential, Weibull and extreme value distributions to complex censored survival data using GLIM, Applied Statistics, 29, 156–163. Aly, E.-E. A. A., and Shayib, M. A. (1992). On some goodness-of-fit tests for the normal, logistic and extreme-value distributions, Communications in Statistics — Theory and Methods, 21, 1297–1308. Antle, C. E., and Rademaker, F. (1972). An upper confidence limit on the maximum of m future observations from a type I extreme value distribution, Biometrika, 59, 475–477. Correction, 68, 738. Arnold, B. C., Balakrishnan, N., and Nagaraja, H. N. (1992). A First Course in Order Statistics, New York: Wiley. Ashour, S. K., and El-Adl, Y. M. (1980). Bayesian estimation of the parameters of the extreme value distribution, Egyptian Statistical Journal, 24/2, 140–152. Aziz, P. M. (1955). Application of the statistical theory of extreme values to the analysis of maximum pit depth data for aluminum, Corrosion, 12, 495–506. Bai, J., Jakeman, A. J., and McAleer, M. (1992). On the use of extreme value distributions for predicting the upper percentiles of environmental quality data, Mathematics and Computers in Simulation, 33, 483–488. 1) Абрамовиц

М., Стиган И. Справочник по специальным функциям. — М.: Наука, 1979.

90

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Bain, L. J. (1972). Inferences based on censored sampling from the Weibull or extreme-value distribution, Technometrics, 14, 693–702. Bain, L. J., and Antle, C. E. (1967). Estimation of parameters in the Weibull distribution, Technometrics, 9, 621–627. Bain, L. J., and Engelhardt, M. (1991). Statistical Analysis of Reliability and Life-testing Models. New York: Dekker. Balakrishnan, N., Ahsanullah, M., and Chan, P. S. (1992). Relations for single and product moments of record values from Gumbel distribution, Statistics & Probability Letters, 15, 223–227. Balakrishnan, N., Balasubramanian, K., and Panchapakesan, S. (1994). δ -exceedance records, Submitted for publication. Balakrishnan, N., and Chan, P. S. (1992a). Order statistics from extreme value distribution, I: Tables of means, variances and covariances, Communications in Statistics— Simulation and Computation, 21, 1199–1217. Balakrishnan, N., and Chan, P. S. (1992b). Order statistics from extreme value distribution, II: Best linear unbiased estimates and some other uses, Communications in Statistics— Simulation and Computation, 21, 1219–1246. Balakrishnan, N., and Chan, P. S. (1992c). Extended tables of means, variances and covariances of order statistics from the extreme value distribution for sample sizes up to 30, Report, Department of Mathematics and Statistics, McMaster University, Hamilton, Canada. Balakrishnan, N., and Chan, P. S. (1992d). Extended tables of best linear unbiased estimates from complete and Type-II censored samples from the extreme value distribution for sample sizes up to 30, Report, Department of Mathematics and Statistics, McMaster University, Hamilton, Canada. Balakrishnan, N., and Chan, P. S. (1994a). Log-gamma order statistics and linear estimation of parameters, Computational Statistics & Data Analysis (to appear). Balakrishnan, N., and Chan, P. S. (1994b). Asymptotic best linear unbiased estimation for log-gamma distribution, Sankhy¯a, Series B (to appear). Balakrishnan, N., and Chan, P. S. (1994c). Maximum likelihood estimation for the loggamma distribution under Type-II censored samples and associated inference, In Recent Advances in Life-testing and Reliability (ed., N. Balakrishnan), Boca Raton, FL: CRC Press, pp. 409–437. Balakrishnan, N., and Chan, P. S. (1994d). Maximum likelihood estimation for the threeparameter log-gamma distribution, In Recent Advances in Life-testing and Reliability (ed., N. Balakrishnan), Boca Raton, FL: CRC Press, pp. 439–453. Balakrishnan, N., Chan, P. S., and Ahsanullah, M. (1993). Recurrence relations for moments of record values from generalized extreme value distribution, Communications in Statistics— Theory and Methods, 22, 1471–1482. Balakrishnan, N„ and Cohen, A. C. (1991). Order Statistics and Inference: Estimation Methods, San Diego, CA: Academic Press. Balakrishnan, N., Gupta, S. S., and Panchapakesan, S. (1992). Estimation of the location and scale parameters of the extreme value distribution based on multiply Type-II censored samples, Technical Report, Department of Statistics, Purdue University, West Lafayette, IN. Balakrishnan, N., and Leung, M. Y. (1988). Order statistics from the Type I generalized logistic distribution, Communications in Statistics— Simulation and Computation, 17, 25–50. Balakrishnan, N., and Varadan, J. (1991). Approximate MLEs for the location and scale parameters of the extreme value distribution with censoring, IEEE Transactions on Reliability, 40, 146–151.

СПИСОК ЛИТЕРАТУРЫ

91

Ballerini, R. (1987). Another characterization of the type I extreme value distribution, Statistics & Probability Letters, 5, 83–85. Ballerini, R., and Resnick, S. I. (1985). Records from improving populations, Journal of Applied Probability, 22, 487–502. Ballerini, R., and Resnick, S. I. (1987a). Records in the presence of a linear trend, Advances in Applied Probability, 19, 801–828. Ballerini, R., and Resnick, S. I. (1987b). Embedding sequences of successive maxima in extremal processes, with applications, Journal of Applied Probability, 24, 827–837. Beran, M., Hosking, J. R. M., and Arnell, N. (1986). Comment on «Two-component extreme value distribution for flood frequency analysis» by Fabio Rossi, Mauro Fiorentino, Pasquale Versace, Water Resources Research, 22, 263–266. Berman, S. M. (1962). Limiting distribution of the maximum term in sequences of dependent random variables, Annals of Mathematical Statistics, 33, 894–908. Billman, B. R., Antle, C. E., and Bain, L. J. (1972). Statistical inference from censored Weibull samples, Technometrics, 14, 831–840. Black, C. M., Durham, S. D., and Padgett, W. J. (1990). Parameter estimation for a new distribution for the strength of brittle fibers: A simulation study, Communications in Statistics— Simulation and Computation, 19, 809–825. Blom, G. (1958). Statistical Estimates and Transformed Beta-Variables, Stockholm: Almquist and Wiksell. Borgman, L. E. (1961). The frequency distribution of near extreme, Journal of Geophysical Research, 66, 3295–3307. Bortkiewicz, L., von (1922). Variationsbreite und mittlerer Fehler, Sitzungsberichte der Berliner Mathematischen Gesellschaft, 21, 3–11. Buishand, T. A. (1989). Statistics of extremes in climatology, Statistica Neerlandica, 43, 1–30. Burton, P. W., and Makropoulos, K. C. (1985). Seismic risk of circum-Pacific earthquakes: II. Extreme values using Gumbel’s third distribution and the relationship with strain energy release, Pure and Applied Geophysics, 123, 849–866. Canfield, R. V. (1975). The Type-I extreme-value distribution in reliability, IEEE Transactions on Reliability, 24, 229–236. Canfield, R. V., and Borgman, L. E. (1975). Some distributions of time to failure for reliability applications, Technometrics, 17, 263–268. Castillo, E. (1988). Extreme Value Theory in Engineering, San Diego, CA: Academic Press. Chan, L. K., Cheng, S. W. H., and Mead, E. R. (1972). An optimum t-test for the scale parameter of an extreme-value distribution, Naval Research Logistics Quarterly, 19, 715–723. Chan, L. K., and Kabir, A. B. M. L. (1969). Optimum quantiles for the linear estimation of the parameters of the extreme-value distribution in complete and censored samples, Naval Research Logistics Quarterly, 16, 381–404. Chan, L. K., and Mead, E. R. (1971a). Linear estimation of the parameters of the extreme-value distribution based on suitably chosen order statistics, IEEE Transactions on Reliability, R-20, 74–83. Chan, L. K., and Mead, E. R. (1971b). Tables to facilitate calculation of an asymptotically optimal t-test for equality of location parameters of a certain extreme-value distributions, IEEE Transactions on Reliability, R-20, 235–243. Chandra, M., Singpurwalla, N. D., and Stephens, M. A. (1981). Kolmogorov statistics for tests of fit for the extreme-value and Weibull distribution, Journal of the American Statistical Association, 76, 729–731.

92

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Chao, A., and Hwang, S.-J. (1986). Comparison of confidence intervals for the parameters of the Weibull and extreme value distributions, IEEE Transactions on Reliability, 35, 111–113. Cheng, R. C. H., and Iles, T. C. (1983). Confidence bands for cumulative distribution functions of continuous random variables, Technometrics, 25, 77–86. Cheng, R. C. H., and Iles, T. C. (1988). One-sided confidence bands for cumulative distribution functions, Technometrics, 30, 155–159. Chiou, P. (1988). Shrinkage estimation of scale parameter of the extreme-value distribution, IEEE Transactions on Reliability, 37, 370–374. Chowdhury, J. U., Stedinger, J. R., and Lu, L.-H. (1991). Goodness-of-fit tests for regional generalized extreme value flood distributions, Water Resources Research, 27, 1765–1776. Christopeit, N. (1994). Estimating parameters of an extreme value distribution by the method of moments, Journal of Statistical Planning and Inference, 41, 173–186. Clough, D. J., and Kotz, S. (1965). Extreme value distributions with a special queueing model application, CORS Journal, 3, 96–109. Cockrum, M. B., Larson, R. K., and Taylor, R. W. (1990). Distribution modeling and simulation studies in product flammability testing, ASA Proceedings of Business and Economic Statistics Section, 387–391. Coelho, D. P., and Gil, T. P. (1963). Studies on extreme double exponential distribution. I. The location parameter, Revista da Faculdade de Ciencias de Lisboa, 10, 37–46. Cohen, J. P. (1986). Large sample theory for fitting an approximating Gumbel model to maxima, Sankhy¯a, Series A, 48, 372–392. Cohen, J. P. (1988). Fitting extreme value distributions to maxima, Sankhy¯a, Series A, 50, 74–97. D’Agostino, R. B., and Stephens, M. A. (eds.) (1986). Goodness-of-fit Techniques, New York: Dekker. Daniels, H. E. (1942). A property of the distribution of extremes, Biometrika, 32, 194–195. David, H. A. (1981). Order Statistics, 2d ed., New York: Wiley 1) . Davidovich, M. I. (1992). On convergence of the Weibull-Gnedenko distribution to the extreme value distribution, Vestnik Akademii Nauk Belaruss, Ser. Mat.-Fiz., No. 1, Minsk, 103–106. Davison, A. C. (1986). Approximate predictive likelihood, Biometrika, 73, 323–332. Davison, A. C., and Smith, R. L. (1990). Models for exceedances over high thresholds (with comments), Journal of the Royal Statistical Society, Series B, 52, 393–442. de Haan, L. (1970). On Regular Variation and Its Application to the Weak Convergence of Sample Extremes, Amsterdam: Mathematical Centre Tract 32, Mathematisch Centrum. de Haan, L. (1976). Sample extremes: An elementary introduction, Statistica Neerlandica, 30, 161–172. Dekkers, A. L. M., and de Haan, L. (1989). On the estimation of the extreme-value index and large quantile estimation. Annals of Statistics, 17, 1795–1832. Dekkers, A. L. M„ Einmahl, J. H. J., and de Haan, L. (1989). A moment estimator for the index of an extreme-value distribution, Annals of Statistics, 17, 1833–1855. DiCiccio, T. J. (1987). Approximate inference for the generalized gamma distribution, Technometrics, 29, 32–39. Divakar, S. (1975). A note on Karlin’s admissibility result for extreme value density, Journal of the Indian Statistical Association, 13, 67–69. Dodd, E. L. (1923). The greatest and least variate under general laws of error, Transactions of the American Mathematical Society, 25, 525–539. Doganoksoy, N., and Schmee, J. (1991). Comparisons of approximate confidence intervals for the smallest extreme value distribution simple linear regression model under time censoring, Communications in Statistics— Simulation and Computation, 20, 1085–1113. 1) Дэйвид

Г. Порядковые статистики. — М.: Наука, 1979. — 336 с.

СПИСОК ЛИТЕРАТУРЫ

93

Downton, F. (1966). Linear estimates of parameters in the extreme value distribution, Technometrics, 8, 3–17. Dubey, S. D. (1966). Characterization theorems for several distributions and their applications, Journal of Industrial Mathematics, 16, 1–22. Dubey, S. D. (1969). A new derivation of the logistic distribution, Naval Research Logistics Quarterly, 16, 37–40. Durrant, N. F. (1978). A nomogram for confidence limits on quantiles of the normal distribution with application to extreme value distributions, Journal of Quality Technology, 10, 155–158. Eldredge, G. G. (1957). Analysis of corrosion pitting by extreme value statistics and its application to oil well tubing caliper surveys, Corrosion, 13, 51–76. Engelhardt, M. (1975). On simple estimation of the parameters of the Weibull or extremevalue distribution, Technometrics, 17, 369–374. Engelhardt, M., and Bain, L. J. (1973). Some complete and censored results for the Weibull or extreme-value distribution, Technometrics, 15, 541–549. Engelhardt, M., and Bain, L. J. (1977). Simplified statistical procedures for the Weibull or extreme-value distribution, Technometrics, 19, 323–332. Engelhardt, M., and Bain, L. J. (1979). Prediction limits and two-sample problems with complete or censored Weibull data, Technometrics, 21, 233–238. Engelhardt, M., and Bain, L. J. (1982). On prediction limits for samples from a Weibull or extreme-value distribution, Technometrics, 24, 147–150. Epstein, B. (1948). Application to the theory of extreme values in fracture problems, Journal of the American Statistical Association, 43, 403–412. Epstein, B. (1958). The exponential distribution and its role in life testing, Industrial Quality Control, 15, 5–9. Epstein, B. (1960). Elements of the theory of extreme values, Technometrics, 2, 27–41. Epstein, B., and Brooks, H. (1948). The theory of extreme values and its implications in the study of the dielectric strength of paper capacitors, Journal of Applied Physics, 19, 544–550. Escobar, L. A., and Meeker, W. Q., Jr. (1986). Elements of the Fisher information matrix for the smallest extreme value distribution and censored data, Applied Statistics, 35, 80–86. Fahmi, K. J., and Abbasi, J. N. Al. (1991). Application of a mixture distribution of extreme values to earthquake magnitudes in Iraq and conterminous regions, Geophysical Journal of the Royal Astronomical Society, 107, 209–217. Fei, H., Kong, F., and Tang, Y. (1994). Estimations for two-parameter Weibull distributions and extreme-value distributions under multiple Type-II censoring, Preprint. Fertig, K. W„ and Mann, N. R. (1978). An accurate approximation to the sample distribution of the Studentized extreme value statistic, Technometrics, 22, 83–97. Fertig, K. W„ Meyer, M. E., and Mann, N. R. (1980). On constructing prediction intervals for samples from a Weibull or extreme value distribution, Technometrics, 22, 567–573. Fisher, R. A. (1934). Two new properties of mathematical likelihood, Proceedings of the Royal Society, Series A, 144, 285–307. Fisher, R. A., and Tippett, L. H. C. (1928). Limiting forms of the frequency distribution of the largest or smallest member of a sample, Proceedings of the Cambridge Philosophical Society, 24, 180–190. Fr´echct, M. (1927). Sur la loi dc probabilit´e de I’ecart maximum, Annales de la Soci´et´e Polonaise de Math´ematique, Cracovie, 6, 93–116. Freimer, M., Kollia, G., Mudholkar, G. S., and Lin, C. T. (1989). Extremes, extreme spacings and outliers in the Tukey and Weibull families, Communications in Statistics— Theory and Methods, 18, 4261–4274.

94

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Frenkel, J. I., and Kontorova, T. A. (1943). A statistical theory of the brittle strength of crystals, Journal of Physics, USSR, 7, 108–114. Fuller, W. E. (1914). Flood flows, Transactions of the American Society of Civil Engineers, 77, 564. Fung, K. Y., and Paul, S. R. (1985). Comparisons of outlier detection procedures in Weibull or extreme-value distribution, Communications in Statistics— Simulation and Computation, 14, 895–917. Galambos, J. (1978). The Asymptotic Theory of Extreme Order Statistics, New York: Wiley. Galambos, J. (1981). Failure time distributions: Estimates and asymptotic results, In Statistical Distributions in Scientific Work, Volume 5 (eds., C. Taillie, G. P. Patil, and B. A. Baldessari), Dordrecht: Reidel, pp. 309–317. Galambos, J. (1982). A statistical test for extreme value distributions, In Nonparametric Statistical Inference (eds., B. V. Gnedenko, M. L. Puri, and I. Vincze), Amsterdam: North-Holland, pp. 221–230. Galambos, J. (1987). The Asymptotic Theory of Extreme Order Statistics, 2d ed., Malabar, FL: Krieger. Garg, M. L., Raja Rao, B., and Redmond, C. K. (1970). Maximum-likelihood estimation of the parameters of the Gompertz survival function. Applied Statistics, 19, 152–160. Geffroy, J. (1958). Contribution a la th´eorie des valeurs extrˆemes, Publications de l’Institut de Statistique de l’Universit´e de Paris, 7, No. 3/4, 37–121. Geffroy, J. (1959). Contribution a la th´eorie des valeurs extrˆemes, II, Publications de l’Institut de Statistique de l’Universit´e de Paris, 8, No. 1. 3–65. Gerisch, W„ Struck, W., and Wilke, B. (1991). One-sided Monte Carlo tolerance limit factors for the exact extreme-value distributions from a normal parent distributional, Computational Statistics Quarterly, 6, 241–261. Gnedenko, B. (1943). Sur la distribution limite du terme maximum d’une s´erie al´eatoire, Annals of Mathematics, 44, 423–453 1) . Goka, T. (1993). Application of extreme-value theory to reliability physics of electronic parts and to on-orbit single event phenomena, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithcrsburg, MD. Goldstein, N. (1963). Random numbers from the extreme value distributions, Publications de l’Institut de Statistique de l’Universit´e de Paris, 12, 137–158. Gompertz, B. (1825). On the nature of the function expressive of the law of human mortality, Philosophical Transactions of the Royal Society of London, Series A, 115, 513–580. Greenwood, J. A., Landwehr, J. M., Matalas, N. C., and Wallis, J. R. (1979). Probability weighted moments: Definition and relation to parameters of several distributions expressible in inverse form, Water Resources Research, 15, 1049–1054. Greis, N. P., and Wood, E. F. (1981). Regional flood frequency estimation and network design, Water Resources Research, 17, 1167–1177. Griffith, A. A. (1920). The phenomena of rupture and flow in solids, Philosophical Transactions of the Royal Society of London, Series A, 221, 163–198. Gumbel, E. J. (1935). Les valeurs extrˆemes des distributions statistiques, Annates de l’Institut Henri Poincar´e, 4, 115–158. Gumbel, E. J. (1937a). Les intervalles extrˆemes entre les e´ missions radioactives, Journal de Physique et de Radium, 8, 446–452. Gumbel, E. J. (1937b). La dur´ee extrˆeme de la vie humaine, Actualit´es Scientifiques et Industrielies, Paris: Hermann et Cie. 1) Русское

изложение содержится в докторской диссертации Б. В. Гнеденко.

СПИСОК ЛИТЕРАТУРЫ

95

Gumbel, E. J. (1941). The return period of flood flows, Annals of Mathematical Statistics, 12, 163–190. Gumbel, E. J. (1944). On the plotting of flood discharges, Transactions of the American Geophysical Union, 25, 699–719. Gumbel, E. J. (1945). Floods estimated by probability methods, Engineering News-Record, 134, 97–101. Gumbel, E. J. (1947). The distribution of the range, Annals of Mathematical Statistics, 18, 384–412. Gumbel, E. J. (1949a). The Statistical Forecast of Floods, Bulletin No. 15, 1–21, Ohio Water Resources Board, Columbus. Gumbel, E. J. (1949b). Probability tables for the range, Biometrika, 36, 142–148. Gumbel, E. J. (1953). Introduction, In Probability Tables for the Analysis of Extreme-Value Data, National Bureau of Standards, Applied Mathematics Series, vol. 22, Washington, DC: GPO. Gumbel, E. J. (1954). Statistical Theory of Extreme Values and Some Practical Applications, National Bureau of Standards, Applied Mathematics Series, vol. 33, Washington, DC: GOP. Gumbel, E. J. (1958). Statistics of Extremes, New York: Columbia University Press 1) . Gumbel, E. J. (1960). Distributions des valeurs extrˆemes en plusieurs dimensions, Publications de l’Institut de Statistique de l’Universit´e de Paris, 9, 171–173. Gumbel, E. J. (1961). Sommes et diff´erences de valeurs extrˆemes independentes, Comptes Rendus de l’Acad´emie des Sciences, Paris, 253, 2838–2839. Gumbel, E. J. (1962a). Statistical estimation of the endurance limit— An application of extreme-value theory, In Contributions to Order Statistics (eds., A. E. Sarhan and B. G. Greenberg), New York: Wiley, pp. 406–431 2) . Gumbel, E. J. (1962b). Statistical theory of extreme values (main results), In Contributions to Order Statistics (eds., A. E. Sarhan and B. G. Greenberg), New York: Wiley, ch. 6 2) . Gumbel, E. J. (1962c). Produits et quotients de deux plus grandes valeurs ind´ependantes, Comptes Rendus de l’Acad´emie des Sciences, Paris, 254, 2132–2134. Gumbel, E. J. (1962d). Produits et quotients de deux plus petites valeurs ind´ependantes. Publications de l’Institut de Statistique de l’Universite de Paris, 11, 191–193. Gumbel, E. J. (1965). A quick estimation of the parameters in Fr´echet’s distribution, Review of the International Statistical Institute, 33, 349–363. Gumbel, E. J., and Mustafi, C. K. (1966) Comments to: Edward C. Posner, «The application of extreme value theory to error free communication», Technometrics, 8, 363–366. Gumbel, E. J., and Pickands, J. (1967). Probability tables for the extremal quotient, Annals of Mathematical Statistics, 38, 1541–1551. Hald, A. (1952). Statistical Theory with Engineering Applications, New York: Wiley 3) . Hall, M. J. (1992). Problems of handling messy field data for engineering decisionmaking: More on flood frequency analysis, The Mathematical Scientist, 17, 78–88. Harris, B. (1970). An application of extreme value theory to reliability theory, Annals of Mathematical Statistics, 41, 1456–1465. Harter, H. L. (1970). Order Statistics and Their Use in Testing and Estimation, vol. 2, Washington, DC: GPO. Harter, H. L. (1978). A bibliography of extreme-value theory, International Statistical Review, 46, 279–306. Harter, H. L., and Moore, A. H. (1967). A note on estimation from a type 1 extreme-value distribution, Technometrics, 9, 325–331. 1) Гумбель

Э. Статистика экстремальных значений. — М.: Мир, 1965. перевод см. в сборнике: Сархан А. Э., Гринберг Б. Г. Введение в теорию порядковых статистик. — М.: Статистика, 1970. — 414 с. 3) Хальд А. Математическая статистика с техническими приложениями. — М.: ИЛ, 1956. 2) Русский

96

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Harter, H. L., and Moore, A. H. (1968a). Maximum likelihood estimation, from doubly censored samples, of the parameters of the first asymptotic distribution of extreme values, Journal of the American Statistical Association, 63, 889–901. Harter, H. L., and Moore, A. H. (1968b). Conditional maximum-likelihood estimators, from singly censored samples, of the scale parameters of Type-II extreme-value distributions, Technometrics, 10, 349–359. Hasofer, A. M., and Wang, Z. (1992). A test for extreme value domain of attraction, Journal of the American Statistical Association, 87, 171–177. Hassanein, K. M. (1965). Estimation of the parameters of the extreme value distribution by order statistics, National Bureau of Standards, Institute of Applied Technology, Project No. 2776-M. Hassanein, K. M. (1968). Analysis of extreme-value data by sample quantiles for very large samples, Journal of the American Statistical Association, 63, 877–888. Hassanein, K. M. (1969). Estimation of the parameters of the extreme value distribution by use of two or three order statistics, Biometrika, 56, 429–436. Hassanein, K. M. (1972). Simultaneous estimation of the parameters of the extreme value distribution by sample quantiles, Technometrics, 14, 63–70. Hassanein, K. M., and Saleh, A. K. Md. E. (1992). Testing equality of locations and quantiles of several extreme-value distributions by use of few order statistics of samples from extreme-value and Weibull distributions, In Order Statistics and Nonparametrics: Theory and Applications (eds., P. K. Sen and I. A. Salama), Amsterdam: North-Holland, pp. 115–132. Hassanein, K. M., Saleh, A. K. Md. E., and Brown, E. F. (1984). Quantile estimates in complete and censored samples from extreme-value and Weibull distributions, IEEE Transactions on Reliability, 33, 370–373. Hassanein, K. M., Saleh, A. K. Md. E., and Brown, E. F. (1986). Estimation and testing of quantiles of the extreme-value distribution, Journal of Statistical Planning and Inference, 14, 389–400. Henery, R. J. (1984). An extreme-value model for predicting the results of horse races, Applied Statistics, 33, 125–133. Hooda, B. K., Singh, N. P., and Singh, U. (1990). Estimates of the parameters of Type-II extreme value distribution from censored samples, Communications in Statistics— Theory and Methods, 19, 3093–3110. Hooda, B. K„ Singh, N. P., and Singh, U. (1991). Estimation of Gumbel distribution parameters of m-th maxima from doubly censored sample, Statistica, 51, 339–352. Hoopke, P. K., and Paatero, P. (1993). Extreme value estimation applied to aerosol size distributions and related environmental problems, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithersburg, MD. Hosking, J. R. M. (1984). Testing whether the shape parameter is zero in the generalized extreme-value distribution, Biometrika, 71, 367–374. Hosking, J. R. M. (1985). Maximum-likelihood estimation of the parameters of the generalized extreme-value distribution, Applied Statistics, 34, 301–310. Hosking, J. R. M., Wallis, J. R., and Wood, E. F. (1985). Estimation of the generalized extreme-value distribution by the method of probability-weighted moments, Technometrics, 27, 251–261. Huesler, J., and Schuepbach, M. (1986). On simple block estimators for the parameters of the extreme-value distribution, Communications in Statistics— Simulation and Computation, 15, 61–76. Huesler, J., and Tiago de Oliveira, J. (1988). The usage of the largest observations for parameter and quantile estimation for the Gumbel distribution: An efficiency analysis, Publications of Institute of Statistics, University of Paris IV, 33(1), 41–56.

СПИСОК ЛИТЕРАТУРЫ

97

Irwin, J. O. (1942). The distribution of the logarithm of survival times when the true law is exponential, Journal of Hygiene, Cambridge, 42, 328–333. Jain, D., and Singh, V. P. (1987). Estimating parameters of EV1 distribution for flood frequency analysis, Water Resources Research, 23, 59–71. Jenkinson, A. F. (1955). The frequency distribution of the annual maximum (or minimum) values of meteorological elements, Quarterly Journal of the Royal Meteorological Society, 81, 158–171. Jenkinson, A. F. (1969). Statistics of Extremes, Technical Note No. 98, Geneva: World Meteorological Office. Jeruchim, M. C. (1976). On the estimation of error probability using generalized extreme value theory, IEEE Transactions on Information Theory, IT-22, 108–110. Joe, H. (1987). Estimation of quantiles of the maximum of N observations, Biometrika, 74, 347–354. Johns, M. V., Jr., and Lieberman, G. J. (1966). An exact asymptotically efficient confidence bound for reliability in the case of the Weibull distribution, Technometrics, 8, 135–175. Juncosa, M. L. (1949). On the distribution of the minimum in a sequence of mutually independent random variables, Duke Mathematical Journal, 16, 609–618. Kaminsky, K. S. (1982). A characterization of the Gompertz distribution and a discrete analog, Preprint. Kanda, J. (1993). Application of an empirical extreme value distribution to load models, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithersburg, MD. Kao, J. H. K. (1958). Computer methods for estimating Weibull parameters in reliability studies, IRE Transactions on Reliability and Quality Control, 13, 15–22. Keating, J. P. (1984). A note on estimation of percentiles and reliability in the extreme-value distribution, Statistics & Probability Letters, 2, 143–146. Kimball, B. F. (1946a). Sufficient statistical estimation functions for the parameters of the distribution of maximum values, Annals of Mathematical Statistics, 17, 299–309. Kimball, B. F. (1946b). Assignment of frequencies to a completely ordered set of sample data, Transactions of the American Geophysical Union, 27, 843–846. (Discussion in 28 [1947], 951–953.) Kimball, B. F. (1949). An approximation to the sampling variance of an estimated maximum value of given frequency based on fit of doubly exponential distribution of maximum values, Annals of Mathematical Statistics, 20, 110–113. Kimball, B. F. (1955). Practical applications of the theory of extreme values, Journal of the American Statistical Association, 50, 517–528. (Correction: 50, 1332.) Kimball, B. F. (1956). The bias in certain estimates of the extreme-value distribution, Annals of Mathematical Statistics, 27, 758–767. Kimball, B. F. (1960). On the choice of plotting positions on probability paper, Journal of the American Statistical Association, 55, 546–560. Kimber, A. C. (1985). Tests for the exponential, Weibull and Gumbel distributions based on the standardized probability plot, Biometrika, 72, 661–663. King, J. R. (1959). Summary of extreme-value theory and its relation to reliability analysis, Proceedings of the 12th Annual Conference of the American Society for Quality Control, 13, 163–167. Kinnison, R. (1989). Correlation coefficient goodness-of-fit test for the extreme-value distribution. The American Statistician, 43, 98–100. Kinnison, R. (1990). Replies to «Comment on ’Correlation coefficient goodness-of-fit test for the extreme-value distribution», The American Statistician, 44, 61; 44, 260. Kotz, S., and Johnson, N. L. (eds.) (1991). Breakthroughs in Statistics vol. 1, New York: Springer-Verlag.

98

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Landwehr, J. M., Matalas, N. C., and Wallis, J. R. (1979). Probability weighted moments compared with some traditional techniques in estimating Gumbel parameters and quantiles, Water Resources Research, 15, 1055–1064. Landwehr, J. M., Matalas, N. C., and Wallis, J. R. (1980). Quantile estimation with more or less floodlike distributions, Water Resources Research, 16, 547–555. Lawless, J. F. (1973). On the estimation of safe life when the underlying life distribution is Weibull, Technometrics, 15, 857–865. Lawless, J. F. (1975). Construction of tolerance bounds for the extreme-value and Weibull distributions, Technometrics, 17, 255–262. Lawless, J. F. (1978). Confidence interval estimation for the Weibull and extreme value distributions (with discussion), Technometrics, 20, 355–368. Lawless, J. F. (1980). Inference in the generalized gamma and log-gamma distribution, Technometrics, 22, 67–82. Lawless, J. F. (1982). Statistical Models & Methods for Lifetime Data, New York: Wiley. Lawless, J. F., and Mann, N. R. (1976). Tests for homogeneity of extreme value scale parameters, Communications in Statistics— Theory and Methods, 1, 389–405. Leadbetter, M. R., Lindgren, G., and Rootz´en, H. (1983). Extremes and Related Properties of Random Sequences and Processes, New York: Springer: Verlag. Lehman, E. H. (1963). Shapes, moments and estimators of the Weibull distribution, Transactions of the IEEE on Reliability, 12, 32–38. Lieblein, J. (1953). On the exact evaluation of the variances and covariances of order statistics in samples from the extreme-value distribution, Annals of Mathematical Statistics, 24, 282–287. Lieblein, J. (1954). A new method of analyzing extreme-value data, National Advisory Committee on Aeronautics, Technical Note No. 3053, Washington, DC. Lieblein, J. (1962). Extreme-value distribution, In Contributions to Order Statistics (eds., A. E. Sarhan and B. G. Greenberg), New York: Wiley, pp. 397–406. Lieblein, J., and Salzer, H. E. (1957). Table of the first moment of ranked extremes, Journal of Research of the National Bureau of Standards, 59, 203–206. Lieblein, J., and Zelen, M. (1956). Statistical investigation of the fatigue life of deep-grove ball bearings, Journal of Research of the National Bureau of Standards, 57, 273–316. Lockhart, R. A., O’Reilly, F. J., and Stephens, M. A. (1986a). Tests of fit based on normalized spacings, Journal of the Royal Statistical Society, Series B, 48, 344–352. Lockhart, R. A., O’Reilly, F. J., and Stephens, M. A. (1986b). Tests for the extreme value and Weibull distributions based on normalized spacings, Naval Research Logistics Quarterly, 33, 413–421. Lockhart, R. A., and Spinelli, J. J. (1990). Comment on «Correlation coefficient goodnessof-fit test for the extreme-value distribution», The American Statistician, 44, 259–260. Looney, S. W. (1990). Comment on «Correlation coefficient goodness-of-fit test for the extreme-value distribution», The American Statistician, 44, 61. Macleod, A. J. (1989). Comment on «Maximum-likelihood estimation of the parameters of the generalized extreme-value distribution», Applied Statistics, 38, 198–199. Mahmoud, M. W., and Ragab, A. (1975). On order statistics in samples drawn from the extreme value distributions, Mathematische Operationsforschung und Statistik, Series Statistics, 6, 809–816. Mann, N. R. (1967a). Results on Location and Scale Parameter Estimation with Application to the Extreme-Value Distribution, Report ARL67-0023, Aerospace Research Laboratories, Wright-Patterson Air Force Base, Dayton, OH. Mann, N. R. (1967b). Tables for obtaining the best linear invariant estimates of the parameters of the Weibull distribution, Technometrics, 9, 629–645. Mann, N. R. (1968a). Point and interval estimation procedures for the two-parameter Weibull and extreme-value distributions, Technometrics, 10, 231–256.

СПИСОК ЛИТЕРАТУРЫ

99

Mann, N. R. (1968b). Results on Statistical Estimation and Hypothesis Testing with Application to the Weibull and Extreme Value Distributions, Report ARL 68-0068, Aerospace Research Laboratories, Wright-Patterson Air Force Base, Dayton, OH. Mann, N. R. (1969). Optimum estimators for linear functions of location and scale parameters, Annals of Mathematical Statistics, 40, 2149–2155. Mann, N. R. (1976). Warranty periods for production lots based on fatigue-test data, Engineering Fracture Mechanics, 8, 123–130. Mann, N. R. (1982). Optimal outlier tests for a Weibull model— to identify process changes or predict failure times, Studies in the Management Sciences, 19, 261–270. Mann, N. R., and Fertig, K. W. (1973). Tables for obtaining Weibull confidence bounds and tolerance bounds based on best linear invariant estimates of parameters of the extreme-value distribution, Technometrics, 15, 87–102. Mann, N. R., and Fertig, K. W. (1975). Simplified efficient point and interval estimators for Weibull parameters, Technometrics, 17, 361–368. Mann, N. R., and Fertig, K. W. (1977). Efficient unbiased quantile estimators for moderatesize complete samples from extreme-value and Weibull distributions; Confidence bounds and tolerance and prediction intervals, Technometrics, 19, 87–94. Mann, N. R., Fertig, K. W„ and Scheuer, E. M. (1971). Confidence and tolerance bounds and a new goodness of fit test for the two-parameter Weibull or extreme value distribution with tables for censored samples of size 3(1)25, Aerospace Research Laboratories Report No. 71-0077, Wright-Patterson Air Force Base, Dayton, OH. Mann, N. R., and Saunders, S. C. (1969). On evaluation of warranty assurance when life has a Weibull distribution, Biometrika, 56, 615–625. Mann, N. R., Schafer, R. E„ and Singpurwalla, N. D. (1974). Methods for Statistical Analysis of Reliability and Life Data, New York: Wiley. Mann, N. R., Scheuer, E. M., and Fertig, K. W. (1973). A new goodness-of-fit test for the two-parameter Weibull or extreme-value distribution with unknown parameters, Communications in Statistics, 2, 383–400. Mann, N. R., and Singpurwalla, N. D. (1982). Extreme-value distributions, In Encyclopedia of Statistical Sciences, vol. 2 (eds., S. Kotz, N. L. Johnson, and C. B. Read), New York: Wiley, pp. 606–613. Maritz, J. S., and Munro, A. H. (1967). On the use of the generalized extreme-value distribution in estimating extreme percentiles, Biometrics, 23, 79–103. Massonie, J. P. (1966). Estimation de l’exposant d’une fonction de distribution tronquee, Comptes Rendus de l’Academie des Sciences, Paris, 262, 350–352. McCool, J. I. (1965). The construction of good linear unbiased estimates from the best linear estimates for a smaller sample size, Technometrics, 7, 543–552. McCord, J. R. (1964). On asymptotic moments of extreme statistics, Annals of Mathematical Statistics, 35, 1738–1745. McLaren, C. G., and Lockhart, R. A. (1987). On the asymptotic efficiency of certain correlation tests of fit, Canadian Journal of Statistics, 15, 159–167. Meeker, W. Q., and Nelson, W. (1975). Optimum accelerated life-tests for the Weibull and extreme value distributions, IEEE Transactions on Reliability, 24, 321–332. Metcalfe, A. V., and Mawdsley, J. A. (1981). Estimation of extreme low flows for pumped storage reservoir design. Water Resources Research, 17, 1715–1721. Michael, J. R. (1983). The stabilized probability plot, Biometrika, 70, 11–17. Mihram, G. A. (1975). A generalized extreme-value density, South African Statistical Journal, 9, 153–162. Miller, I., and Freund, J. (1965). Probability and Statistics for Engineers, Englewood Cliffs, NJ: Prentice-Hall. ¨ Mises, R., von (1923). Uber die Variationsbreite einer Beobachtungsrcihe, Sitzungsberichte der Berliner Mathematischen Gesellschaft, 22, 3–8.

100

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Mises, R., von (1936). La distribution de la grande de n valeurs, Review Mathematique Union Interbalcanique, 1, 141–160. Reproduced in Selected Papers of Richard von Mises, II, American Mathematical Society (1964), pp. 271–294, Providence, RI. Moore, A. H., and Harter, H. L. (1966). Point and interval estimation, from one order statistic, of the location parameter of an extreme value distribution with known scale parameter, and of the scale parameter of a Weibull distribution with the known shape parameters, Transactions of the IEEE on Reliability, 15, 120–126. Moore, A. H., and Harter, H. L. (1967). Onc-order-statistic conditional estimators of shape parameters of limited and Pareto distributions and scale parameters of Type II asymptotic distributions of smallest and largest values, Transactions of the IEEE on Reliability, 16, 100–103. Mustafi, C. K. (1963). Estimation of parameters of the extreme value distribution with limited type of primary probability distribution, Bulletin of the Calcutta Statistical Association, 12, 47–54. Nagaraja, H. N. (1982). Record values and extreme value distributions, Journal of Applied Probability, 19, 233–239. Nagaraja, H. N. (1984). Asymptotic linear prediction of extreme order statistics, Annals of the Institute of Statistical Mathematics, 36, 289–299. Nagaraja, H. N. (1988). Record values and related statistics— A review, Communications in Statistics— Theory and Methods, 17, 2223–2238. Nelson, W., and Meeker, W. Q. (1978). Theory for optimum accelerated censored life tests for Weibull and extreme value distributions, Technometrics, 20, 171–178. Newman, F. W. (1892). The Higher Trigonometry, Superrationals of Second Order, Cambridge: Cambridge University Press. Nissan, E. (1988). Extreme value distribution in estimation of insurance premiums, ASA Proceedings of Business and Economic Statistics Section, 562–566. Nordquist, J. M. (1945). Theory of largest values, applied to earthquake magnitudes, Transactions of the American Geophysical Union, 26, 29–31. Ogawa, J. (1951). Contributions to the theory of systematic statistics, I, Osaka Mathematical Journal, 3, 175–213. Ogawa, J. (1952). Contributions to the theory of systematic statistics, II, Osaka Mathematical Journal, 4, 41–61. Okubo, T., and Narita, N. (1980). On the distribution of extreme winds expected in Japan, National Bureau of Standards Special Publication, 560–1, 12 pp. Oiler, J. M. (1987). Information metric for extreme value and logistic probability distributions, Sankhy¯a, Series A, 49, 17–23. Owen, D. B. (1962). Handbook of Statistical Tables, Reading, MA: Addison-Wesley 1) . ¨ urk, A. (1986). On the W test for the extreme value distribution, Biometrika, 73, Ozt¨ 738–740. ¨ urk, A. (1987). Weighted least squares estimation of location and scale parameters, Ozt¨ American Journal of Mathematical and Management Sciences, 7, 113–129. ¨ urk, A., and Korukoˇglu, S. (1988). A new test for the extreme value distribution, Ozt¨ Communications in Statistics— Simulation and Computation, 17, 1375–1393. Pandey, M., and Upadhyay, S. K. (1986). Approximate prediction limit for Weibull failure based on preliminary test estimator, Communications in Statistics— Theory and Methods, 15, 241–250. Pannullo, J. E., Li, D., and Haimes, Y. Y. (1993). Posterior analysis in assessing risk of extreme events: A conjugate family approach, Proceedings of IEEE International Conference on Systems, Man, and Cybernetics, vol. 1, pp. 477–482.

1) Оуэн

Д. Сборник статистических таблиц. — М.: АН СССР, 1966. — 568 с.

СПИСОК ЛИТЕРАТУРЫ

101

Paul, S. R„ and Fung, K. Y. (1986). Critical values for Dixon type test statistics for testing outliers in Weibull or extreme value distributions, Communications in Statistics— Simulation and Compulation, 15, 277–283. Pericchi, L. P., and Rodriguez-Iturbe, I. (1985). On the statistical analysis of floods, In A Celebration of Statistics: The ISI Centenary Volume (eds., A. C. Atkinson and S. E. Fienberg), New York: Springer-Verlag, pp. 511–541. Phien, H. N. (1991). Maximum likelihood estimation for the Gumbel distribution from censored samples, In The Frontiers of Statistical Computation, Simulation, and Modeling, vol. 1 (eds., P. R. Nelson, E. J. Dudewicz, A. Oztiirk, and E. C. van der Meulen), Syracuse, NY: American Sciences Press, pp. 271–287. Posner, E. C. (1965). The application of extreme-value theory to error-free communication. Technometrics, 7, 517–529. Potter, W. D. (1949). Normalcy tests of precipitation and frequency studies of runoff on small watersheds, U. S. Department of Agriculture Technical Bulletin, No. 985, Washington, DC: GPO. Prentice, R. L. (1974). A log gamma model and its maximum likelihood estimation, Biometrika, 61, 539–544. Prescott, P. and Walden, A. T. (1980). Maximum likelihood estimation of the parameters of the generalized extreme-value distribution, Biometrika, 67, 723–724. Prescott, P., and Walden, A. T. (1983). Maximum likelihood estimation of the parameters of the three-parameter generalized extreme-value distribution from censored samples, Journal of Statistical Computation and Simulation, 16, 241–250. Press, H. (1949). The application of the statistical theory of extreme value to gust-load problems, National Advisory Committee on Aeronautics, Technical Note No. 1926, Washington, DC. Provasi, C. (1987). Exact and approximate means and covariances of order statistics of the standardized extreme value distribution (I type), Rivista Di Statistica Applicata, 20, 287–295. (In Italian.) Pyke, R. (1965). Spacings (with discussion), Journal of the Royal Statistical Society, Series B, 27, 395–449. Rajan, K. (1993). Extreme value theory and its applications in microstructural sciences, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithersburg, MD. Rantz, S. F., and Riggs, H. C. (1949). Magnitude and frequency of floods in the Columbia River Basin, U. S. Geological Survey, Water Supply Paper 1080, 317–476. Rasheed, H., Aldabagh, A. S., and Ramamoorthy, M. V. (1983). Rainfall analysis by power transformation, Journal of Climate and Applied Meteorology, 22, 1411–1415. Reiss, R. D. (1989). Approximate Distributions of Order Statistics: With Applications to Nonparametric Statistics, Berlin: Springer-Verlag. Resnick, S. I. (1987). Extreme Values, Regular Variation, and Point Processes, New York: Springer-Verlag. Revfcim, K. J. A. (1984a). The cumulants of an extended family of type I extreme value distributions, Sankhy¯a, Series B, 46, 281–284. Revfeim, K. J. A. (1984b). Generating mechanisms of, and parameter estimators for, the extreme value distribution, Australian Journal of Statistics, 26, 151–159. Revfeim, K. J. A. (1984c). The analysis of maximum wind gusts by direction, New Zealand Journal of Science, 27, 365–367. Revfeim, K. J. A., and Hessell, J. W. D. (1984). More realistic distributions for extreme wind gusts, Quarterly Journal of the Royal Meteorological Society, 110, 505–514. Robinson, J. A. (1983). Bootstrap confidence intervals in location-scale models with progressive censoring, Technometrics, 25, 179–187.

102

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Roldan-Canas, J., Garcia-Guzman, A., and Losada-Villasante, A. (1982). A stochastic model for wind occurrence, Journal of Applied Meteorology, 21, 740–744. Rossi, F. (1986). Reply to «Comment on ‘Two-component extreme value distribution for flood frequency analysis’», Water Resources Research, 22, 267–269. Rossi, F., Fiorentino, M., and Versace, P. (1986). Two-component extreme value distribution for flood frequency analysis, Water Resources Research, 22. Scarf, P. A. (1992). Estimation for a four parameter generalized extreme value distribution, Communications in Statistics— Theory and Methods, 21, 2185–2201. Scarf, P. A., and Laycock, P. J. (1993). Applications of extreme value theory in corrosion engineering, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithersburg, MD. Schneider, H., and Weissfeld, L. A. (1989). Interval estimation based on censored samples from the Weibull distribution, Journal of Quality Technology, 21, 179–186. Schuepbach, M., and Huesler, J. (1983). Simple estimators for the parameters of the extreme-value distribution based on censored data, Technometrics, 25, 189–192. Sen, P. K. (1961). A note on the large-sample behaviour of extreme sample values from distribution with finite end-points, Bulletin of the Calcutta Statistical Association, 10, 106–115. Sethuraman, J. (1965). On a characterization of the three limiting types of the extreme, Sankhy¯a, Series A, 27, 357–364. Shen, H. W., Bryson, M. C., and Ochoa, I. D. (1980). Effect of tail behaviour assumptions on flood predictions, Water Resources Research, 16, 361–364. Shibata, T. (1993). Application of extreme value statistics to corrosion, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithersburg, MD. Sibuya, M. (1967). On exponential and other random variable generators, Annals of the Institute of Statistical Mathematics, 13, 231–237. Simiu, E., Bietry, J., and Filliben, J. J. (1978). Sampling errors in estimation of extreme winds, Journal of the Structural Division of the National Bureau of Standards, 104, 491–501. Simiu, E., and Filliben, J. J. (1975). Statistical analysis of extreme winds, National Bureau of Standards Technical Note, 868, 52 pp. Simiu, E., and Filliben, J. J. (1976). Probability distributions of extreme wind speeds, Journal of the Structural Division of the National Bureau of Standards, 102, 1861–1877. Singh, N. P. (1987). Estimation of Gumbel distribution parameters by joint distribution of m extremes, Calcutta Statistical Association Bulletin, 36, 101–104. Singh, R. (1975). Some admissible estimators in extreme value densities, Canadian Mathematical Bulletin, 18, 105–110. Smirnov, N. V. (1952). Limit distributions for the terms of a variational series, Transactions of the American Mathematical Society, Sec. 1, No. 67 (English translation) 1) . Smith, J. A. (1987). Estimating the upper tail of flood frequency distributions, Water Resources Research, 23, 1657–1666. Smith, R. L. (1985). Maximum likelihood estimation in a class of nonregular cases, Biometrika, 72, 67–90. Smith, R. L. (1988). Forecasting records by maximum likelihood, Journal of the American Statistical Association, 83, 331–338. Smith, R. L., and Weissman, I. (1985). Maximum likelihood estimation of the lower tail of a probability distribution, Journal of the Royal Statistical Society, Series B, 47, 285–298. 1) Смирнов

Н.В. Предельные законы распределения для членов вариационного ряда // Тр. МИАН СССР. — Т. 25. — М.–Л.: Изд-во АН СССР, 1949. — с. 3–60.

СПИСОК ЛИТЕРАТУРЫ

103

Smith, R. M. (1977). Some results on interval estimation for the two parameter Weibull or extreme-value distribution, Communications in Statistics— Theory and Methods, 2, 1311–1322. Smith, R. M., and Bain, L. J. (1976). Correlation type of goodness-of-fit statistics with censored sampling, Communications in Statistics— Theory and Methods, 5, 119–132. Smith, T. E. (1984). A choice probability haracterization of generalized extreme value models, Applied Mathematics and Computation, 14, 35–62. Stephens, M. A. (1977). Goodness of fit for the extreme value distribution, Biometrika, 64, 583–588. Stephens, M. A. (1986). Tests based on regression and correlation, In Goodness-of-fit Techniques (eds., R. B. D’Agostino and M. A. Stephens), New York: Dekker, Ch. 5. Stone, G. C., and Rosen, H. (1984). Some graphical techniques for estimating Weibull confidence intervals, IEEE Transactions on Reliability, 33, 362–369. Tawn, J. A. (1992). Estimating probabilities of extreme sea-levels. Applied Statistics, 41, 77–93. Taylor, J. M. (1983). Comparisons of certain distribution functions, Mathematische Operationsforschung und Statistik, Series Statistics, 14, 397–408. Taylor, R. W. (1991). The development of burn time models to simulate product fiammability testing, ASA Proceedings of Business and Economic Statistics Section, 339–344. Teugels, J. L., and Beirlant, J. (1993). Extremes in insurance, Paper presented at the Conference on Extreme Value Theory and Its Applications, May 2–7, 1993, National Institute of Standards, Gaithersburg, MD. Thom, H. C. S. (1954). Frequency of maximum wind speeds, Proceedings of the American Society of Civil Engineers, 80, 104–114. Thoman, D. R., Bain, L. J., and Antle, C. E. (1970). Reliability and tolerance limits in the Weibull distribution, Technometrics, 12, 363–371. Tiago de Oliveira, J. (1963). Decision results for the parameters of the extreme value (Gumbel) distribution based on the mean and the standard deviation, Trabajos de Estad´ıstica, 14, 61–81. Tiago de Oliveira, J. (1972). Statistics for Gumbel and Fr´echet distributions, In Structural Safety and Reliability (ed., A. Frcudenthal), New York: Pergamon, pp. 94–105. Tiago de Oliveira, J. (1981). Statistical choice of univariate extreme models, In Statistical Distributions in Scientific Work, vol. 6 (eds., C. Taillie, G. P. Patil, and B. A. Baldessari), Dordrecht: Reidel, pp. 367–387. Tiago de Oliveira, J. (1983). Gumbel distribution, In Encyclopedia of Statistical Sciences, vol. 3 (eds., S. Kotz, N. L. Johnson, and C. B. Read), New York: Wiley, pp. 552–558. Tikhov, M. S. (1991). On reduction of test duration in the case of censoring, Theory of Probability and Its Applications, 36, 629–633 1) . Tiku, M. L., and Singh, M. (1981). Testing the two parameter Weibull distribution, Communications in Statistics— Theory and Methods, 10, 907–918. Tiku, M. L., Tan, W. Y., and Balakrishnan, N. (1986). Robust Inference, New York: Dekker. Tippett, L. H. C. (1925). On the extreme individuals and the range of samples taken from a normal population, Biometrika, 17, 364–387. Tsujitani, M., Ohta, H., and Kase, S. (1979). A preliminary test of significance for the extreme-value distribution, Bulletin of University of Osaka Prefecture, Section A, 27, 187–193. Tsujitani, M., Ohta, H., and Kase, S. (1980). Goodness-of-fit test for extreme-value distribution, IEEE Transactions on Reliability, 29, 151–153. 1) Тихов М.С.

О сокращении длительности испытаний при цензурировании выборки // Теория вероятности и ее применение. — Т. 36, вып. 3. — М., 1991. — С. 626–629.

104

ГЛАВА 22. РАСПРЕДЕЛЕНИЕ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ

Uzg¨oren, N. T. (1954). The asymptotic development of the distribution of the extreme values of a sample, Studies in Mathematics and Mechanics, presented to R. von Mises, San Diego, CA: Academic Press, pp. 346–353. van Montfort, M. A. J. (1970). On testing that the distribution of extreme is of type I when Type-II is the alternative, Journal of Hydrology, 11, 421–427. Velz, C. J. (1947). Factors influencing self-purification and their relation to pollution abatement, Sewage Works Journal, 19, 629–644. Viveros, R., and Balakrishnan, N. (1994). Interval estimation of parameters of life from progressively censored data, Technometrics, 36, 84–91. Vogel, R. M. (1986). The probability plot correlation coefficient test for the normal, lognormal, and Gumbel distributional hypotheses, Water Resources Research, 22, 587–590. Wang, Q. J. (1990). Estimation of the GEV distribution from censored samples by method of partial probability weighted moments, Journal of Hydrology, 120, 103–114. Wantz, J. W., and Sinclair, R. E. (1981). Distribution of extreme winds in the Bonneville power administration service area, Journal of Applied Meteorology, 20, 1400–1411. Watabe, M., and Kitagawa, Y. (1980). Expectancy of maximum earthquake motions in Japan, National Bureau of Standards Special Publication, 560–10, 8 pp. Watson, G. S. (1954). Extreme values in samples from m-dependent stationary stochastic processes, Annals of Mathematical Statistics, 25, 798–800. Weibull, W. (1939). The phenomenon of rupture in solids, Ingenior Vetenskaps Akademiens Handlingar, 153, 2. Weibull, W. (1949). A statistical representation of fatigue failures in solids, Kunglig Tekniska H¨ogskolans Handlingar, 27. Weinstein, S. B. (1973). Theory and application of some classical and generalized asymptotic distributions of extreme values, IEEE Transactions on Information Theory, IT-19, 148–154. Weiss, L. (1961). On the estimation of scale parameters, Naval Research Logistics Quarterly, 8, 245–256. Weissman, I. (1978). Estimation of parameters and large quantiles based on the k largest observations, Journal of the American Statistical Association, 73, 812–815. Welsh, A. H. (1986). On the use of the empirical distribution and characteristic function to estimate parameters of regular variation, Australian Journal of Statistics, 28, 173–181. White, J. S. (1964). Least-square unbiased censored linear estimation for the log Weibull (extreme value) distribution, Journal of Industrial Mathematics, 14, 21–60. White, J. S. (1969). The moments of log-Weibull order statistics, Technometrics, 11, 373–386. Wiggins, J. B. (1991). Empirical tests of the bias and efficiency of the extreme-value variance estimator for common stocks, Journal of Business of the University of Chicago, 64, 417–432. Winer, P. (1963). The estimation of the parameters of the iterated exponential distribution from singly censored samples, Biometrics, 19, 460–464. Young, D. H., and Bakir, S. T. (1987). Bias correction for a generalized log-gamma regression model, Technometrics, 29, 183–191. Zelenhasic, E. (1970). Theoretical probability distributions for flood peaks, Hydrology Paper No. 42, Colorado State University, Fort Collins.

ГЛАВА 23

Логистическое распределение

1.

Исторические замечания и происхождение

Одно из первых применений логистической функции, интерпретируемой как модель кривой роста, относится к работам Verhlust (1838, 1845). Логистическая кривая широко используется в работах по экономической демографии с конца XIX в. С течением лет логистическая функция находит также множество других приложений. Pearl and Reed (1920, 1924), Pearl, Reed and Kish (1940) и Schultz (1930) описали логистическую модель роста человеческих и других биологических популяций. Schultz (1930) и Oliver (1964) использовали логистическую функцию для описания данных о продуктивности сельскохозяйственных культур. Некоторые авторы, включая Pearl (1940), Berkson (1944, 1951, 1953) и Finney (1947, 1952) обсуждают применимость логистической функции при описании результатов биологических экспериментов. Несколько весьма интересных приложений логистической функции содержатся в работах по обработке данных на безотказность [Plackett (1959)], анализу распределения доходов [Fisk (1959)] и по моделированию процесса распространения нововведений [Oliver (1969)]. Логистическая функция и логистическое распределение находят множество других приложений. Их сводка содержится в книге Balakrishnan (1992). Имея в виду энциклопедический характер нашей книги, мы в дальнейшем будем опускать некоторые детали выводов и утверждений, связанных с рассматриваемым распределением. Интересующегося читателя мы отсылаем за подробностями и дальнейшими ссылками к упомянутой книге Балакришнана. Использование логистической функции как кривой роста основано на дифференциальном уравнении dF = c[F(x) − A] · [B − F(x)], dx

(23.1)

где F — логистическая функция, x — переменная, c > 0, B > A — константы. Это уравнение можно интерпретировать следующим образом: интенсивность роста пропорциональна произведению превышения начального значения A и разности между максимальным (предельным) значением B и текущим значением. Решение (23.1) есть F(x) =

BDex/c + A Dex/c + 1

105

,

(23.2)

106

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

где D — константа. F(x) → A при x → −∞ и F(x) → B при x → ∞ (если D = 0). Функция F(x) представляет собой превышение начального (асимптотического) значения A по направлению к верхнему значению B. Чтобы F(x) была функцией распределения, полагаем A = 0, B = 1; в этом случае (23.2) принимает вид  −1 Dex/c = 1 + D−1 e−x/c . (23.3) F(x) = x/c De

+1

Это — логистическая функция распределения. В следующем пункте мы переобозначим c = β и D = e−α /β . Одним из приложений уравнения (23.1) является модель автокатализа. Такой термин обозначает химическую реакцию, в которой катализатор M разлагает составляющую G на два вещества: J и K, причем J само по себе является катализатором реакции. Если M0 , G0 — начальные концентрации M и G соответственно, y — суммарная концентрация J и K в момент t, то закон изменения массы y есть dy = c1 M0 (G0 − y) + c2 y(G0 − y). dt

Здесь c1 и c2 — «постоянные катализа» для G и J соответственно. Правую часть последней формулы можно записать в виде       c1 c1 c1 G0 + M 0 − y + M 0 , c2 y + M0 c2

c2

c2

(23.4)

(23.5)

т. е. в форме (23.1), где F(x) и x заменены на (y+c1 M0 /c2 ) и t соответственно; при этом c = c2 , A = 0, B = G0 + c1 M0 /c2 . Логистическое распределение появляется при решении статистической задачи о предельном распределении среднего арифметического наибольшего и наименьшего выборочных значений в выборке объема n при n → ∞. Этот результат получил Gumbel (1944). В работах Gumbel and Keeney (1950) и Gumbel and Pickands (1967) показано, что логистическое распределение возникает при подходящей нормировке как распределение отношения максимального к минимальному выборочному значению (см. также гл. 22). В работе Talacko (1956) показано, что логистическое распределение возни$r Xj кает как предельное при r → ∞ распределение случайной величины j=1 , j

где Xj — независимые случайные величины, имеющие распределение экстремальных значений типа 1 (гл. 22). Dubey (1969) показал, что логистическое распределение является смесью распределений экстремальных значений:   x−α , η, β > 0; Pr[X  x|η] = 1 − exp −ηβ exp − β

(эта формула получается, если в (22.1) положить θ = α + β log(ηβ )), где η — случайная величина, имеющая показательное распределение с плотностью pη (y) = β e−β y ,

y > 0.

107

2. ОПРЕДЕЛЕНИЯ

При этом Pr[X  x] = ∞ 

=1−β



    −1 x−α x−α exp −β y 1 + exp − dy = 1 + exp − β

β

0

является логистической функцией распределения, рассматриваемой в следующем пункте. Более детальное описание содержится в книге Balakrishnan (1992).

2.

Определения

Проще всего задать логистическое распределение с помощью функции распределения:   −1 x−α F(x) = 1 − 1 + exp = β

−1   x−α = = 1 + exp − β     1 1 x−α = 1 + th , 2

2

β > 0.

β

(23.6)

Ясно, что (23.6) определяет собственную функцию распределения, т. е. lim FX (x) = 0,

x→−∞

lim FX (x) = 1.

x→∞

Плотность получается дифференцированием и равна      −2 x−α x−α −1 = exp 1 + exp p(x) = β β



−1



β

    −2 x−α x−α = exp − 1 + exp −

= (4β )−1 sech2

β

 1 2

x−α β

β

 .

(23.7)

Такое распределение можно назвать секанс гиперболическим квадрат распределением. Функция (23.6) чаще всего используется для представления функций роста (при этом x имеет смысл времени). Мы, в первую очередь, рассматриваем ее как функцию распределения (при этом не исключается ситуация, когда сама случайная величина имеет размерность времени). Понятно, что методы подгонки функции роста с помощью логистической функции применимы для анализа логистической функции распределения (см., например, Erkelens (1968) и Balakrishnan (1992, гл. 13)).

108

3.

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Производящая функция моментов

Преобразование Y = (X − α )/β дает случайную величину с плотностью   1 1 y , (23.8) pY (y) = e−y (1 + e−y )−2 = sec h2 4

2

получающейся из (23.7). Функция распределения случайной величины Y имеет вид

−1 . (23.9) FY (y) = 1 + e−y Равенства (23.8) и (23.9) определяют стандартное логистическое распределение. Отметим, что это — не единственная стандартизованная форма. Выражения (23.13) и (23.14), где параметрами выступают среднее и среднее квадратическое отклонение, также можно назвать стандартными. Производящая функция моментов распределения с плотностью (23.8) представляется в следующем виде: ∞   

2

θY = MY (θ ) = E e e−(1−θ )y 1 + e−y dy = замена ξ = (ey + 1)−1 −∞

1

= ξ −θ (1 − ξ )θ dξ = B(1 − θ , 1 + θ ) = πθ cosec πθ .

(23.10)

0

Характеристическая функция E eitY равна π t cosec π t. Моменты случайной величины Y можно найти, используя (23.10), или непосредственно интегрированием с помощью (23.8). Используем интегрирование: ∞ ∞    ∞



r r −y −y −2 1+e dy = 2 yr (−1)j−1 je−jy dy = E |Y| = 2 y e 0

0

j=0

⎧ ∞ ⎨ 2Γ(r + 1) $ (−1)j−1 j−r , r > 0, = 

j=1 ⎩ 2Γ(r + 1) 1 − 2−(r−1) ζ (r), r > 1,

(23.11)

$ −r — дзета функция Римана (см. гл. 1). где ζ (r) = ∞ j=1 j Семиинварианты четного порядка даются формулой κr = 6(2r −1)Br , где Br есть r-е число Бернулли (см. гл. 1). Семиинварианты нечетного порядка равны нулю в силу симметрии плотности относительно нуля. Полагая в (23.11) r = 2 и r = 4, находим  

 π2

2 π2 −1 , = var(Y) = E Y = 2 · 2 1 − 2 6 3  4  π

7 4 μ4 (Y) = 2 · 24 1 − 2−3 π . = 90

15

Коэффициенты асимметрии и эксцесса равны соответственно " β1 = α3 = 0´ и β2 = α4 = 4.2.

109

4. СВОЙСТВА

Среднее отклонение E|Y − EY| равно 2 для логистического распределения

$∞ j=1

(−1)j−1 j−1 = 2 ln 2.Следовательно, √

2 3 ln 2 Среднее отклонение = 0.764. = Стандартное отклонение π Возвращаясь к первоначально определенному распределению (23.6) и учитывая, что X = α + β Y, получаем:

E[X] = α ,

var(X) = β 2 π 2 /3. (23.12)  √  Отсюда находим коэффициент вариации βπ / α 3 . Эксцесс и асимметрия, а также отношение среднего отклонения к стандартному отклонению одинаковы для X и Y. Функцию распределения X можно записать в стандартной форме   FX (x) = 1 + exp −

π (x − ξ ) √ σ 3

−1

,

(23.13)

где параметрами являются E[X] = ξ и var(X) = σ 2 . Соответствующая плотность    −2 π π (x − ξ ) π (x − ξ ) √ √ pX (x) = √ exp − . (23.14) · 1 + exp − σ 3

σ 3

σ 3

Производящая функция информации (математическое ожидание (u − 1)-й степени плотности) для (23.8) есть ∞ ∞    y u

 −2u

−u e −uy −y 1+e e dy = 1 + e−y e dy = TY (u) = y 1+e

−∞

−∞

1 = ξ u−1 (1 − ξ )u−1 dξ = B(u, u) =

[Γ(u)]2 . Γ(2u)

(23.15)

0

Энтропия равна −TY (1) =

4.

−2Γ(1)Γ (1) 2[Γ(1)]2 Γ (2) + = 2 (ψ (2) − ψ (1)) = 2. Γ(2) Γ(2)

Свойства

Gumbel (1961) отметил свойства: pY (y) = FY (y) [1 − FY (y)] 

и y = ln

(23.16)



FY (y) , 1 − FY (y)

(23.17)

где pY (y) и FY (y) определены формулами (23.8) и (23.9). Обратная функция для (23.9), т.е функция квантилей, дающая γ -квантиль распределения (23.9) дается формулой   α + β log

γ 1−γ

,

110

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

а аналог этой функции для дополнительной функции распределения 1 − FY (y) (т. е. для функции дожития) есть   1−γ α + β log . γ

Отсюда следует, что логистическая функция распределения есть функция распределения случайной величины  −V    U e α + β log , или α + β log −V 1−U

1−e

где U имеет равномерное распределение на (0; 1), а V имеет стандартное экспоненциальное распределение. Простота соотношений между y, pY и FY (y) упрощает некоторые задачи анализа логистического распределения. Кроме того, форма логистического распределения близка к форме нормального распределения, что позволяет в подходящих случаях заменить нормальное распределение логистическим с допустимой погрешностью. Хотя, конечно, такую замену следует делать с определенной осторожностью и с учетом различия распределений. Рисунок 23.1 иллюстрирует различие между стандартной нормаль2 1 x e−u /2 du и логистической ной функции распределения G1 (x) = √ −∞ 2π √  −1

, а именно, на рис. 23.1 показана разность G2 = 1 + exp −π x/ 3 G2 (x) − G1 (x). Оба распределения симметричны относительно нуля, поэтому графики приведены только для неотрицательных значений аргумента. Как видно по графику, наибольшая величина разности G2 (x) − G1 (x) равна приблизительно 0.0228 при x = 0.7. Этот максимум может быть уменьшен до величины, не превосходящей 0.01, если изменить масштабный параметр у G2 , а именно, если вместо G1 (x) в качестве аппроксимации G2 (x) использона рис. 23.1. Volodin (1994) выяснил, что вать G1 (16x/15). Это также показано √ √ масштабный параметр величины π / 3.41 вместо 15π /(16 3) дает лучшую аппроксимацию с наибольшей абсолютной погрешностью 0.0094825 вместо 0.0095321. Он также вычислил значение масштабного параметра 1.7017456, которое обеспечивает наилучшую аппроксимацию с наибольшей абсолютной погрешностью 0.0094573. Заметим, что несмотря на близость формы нормальной и логистической функций распределения, значение β2 , равное для логистического распределения 4.2, значительно отличается от соответствующего значения, равного 3, для нормального распределения. Такое различие объясняется относительно тяжелым хвостом логистического распределения, и это заметно отражается на величине 4-го центрального момента, но меньше сказывается на значениях функции распределения. Отметим еще, что точки перегиба стандартной нормальной плотности имеют абсциссы x = ±1, рас√   логистического

√а для пределения соответствующие значения суть x = ± 3/π ln 2 + 3 ≈ ±0.53. Плотность логистического распределения имеет более острую вершину, чем нормальное распределение; это отмечает Chew (1968). Легко показать, что для логистического распределения функция интенсивности пропорциональна функции распределения. Во многом именно это характеризационное

111

4. СВОЙСТВА

РИС. 23.1. Сравнение логистической и нормальной функций распределения

свойство объясняет широкое применение логистического распределения как модели кривой роста. Приняв во внимание, что для логистического распределения β2 = 4.2. Mudholkar and George (1978) обнаружили, что логистическое распределение хорошо аппроксимируется t-распределением Стьюдента с 9 степенями свободы. Аналогичное рассуждение применили George and Ojo (1980), а также George, El-Saidi and Singh (1986) для аппроксимации t-распределения Стьюдента с v степенями свободы обобщенным логистическим распределением (см. п. 10). Обозначим e(x) ожидаемое остаточное время жизни при условии, что возраст равен x. Эта функция дается формулой ∞ 

e(x) = E[X − x|X > x] =

x

{1 − FX (t)}dt 1 − FX (x)

для x  0. Ahmed and Abdul-Rahman (1993) показали, что     e(x) = β 1 + e(x−α )/β log 1 + e−(x−α )/β , и эта форма характеризует распределение (23.6). Они также нашли несколько эквивалентных условных математических ожиданий. Выражение функции распределения суммы n независимых случайных величин, имеющих одинаковые логистические распределения, получено в статье Goel (1975). Там используется метод обращения преобразования Лапласа свертки функций типа Пойа, разработанный в работах Shoenberg (1953) и Hirschman and Widder (1955). Goel (1975) составил таблицы функции распределения суммы n независимых случайных величин, имеющих одинаковые логистические распределения, для n = 2 (1) 12, x = 0 (0.01) 3.99

112

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

и для n = 13 (1) 15, x = 1.20 (0.01) 3.99. Он также приводит таблицу квантилей для n = 2 (1) 15 и α = 0.90, 0.95, 0.975, 0.99 и 0.995. George and Mudholkar (1983), в свою очередь, вывели выражение функции распределения суммы n независимых величин, имеющих одинаковые логистические распределения, непосредственным обращением характеристической функции. Выражения содержат сомножитель (1 − ex )−k , k = 1, 2, . . . , n, что приводит к проблеме с точностью вычислений при x, близких к нулю и больших n. George and Mudholkar (1983) показали, что стандартизованное t-распределение Стьюдента является хорошим приближением свертки n логистических распределений. Авторы сравнили три аппроксимации: (1) стандартная нормальная аппроксимация; (2) аппроксимация рядами Эджворта до порядка n−1 и (3) аппроксимация t-распределением Стьюдента с числом степеней свободы ν = 5n + 4, полученным приравниваем эксцессов. Из перечисленных вариантов третий дает весьма хорошее приближение. Gupta and Han (1992) применили разложение в ряды Эджворта и Корниша—Фишера до членов порядка n−3 (см. гл. 12) для получения распределения нормированных средних √  n X−ξ , σ

Tn =

где Xi — независимые одинаково распределенные случайные величины, определенные функциями (23.12) и (23.14). Эти разложения имеют вид       1 1 6 1 1 48 35 6 2 · H3 (t) + 2 · H5 (t) + H7 (t) + FTn (t) = Φ(t) − φ (t) n 4! 5 6! 7 8! 5 n   3   1 1 432 210 48 6 5775 6 · H7 (t) + · · H9 (t) + · H11 (t) + O n−7/2 , + 3 n

8!

5

10!

7

5

12!

5

  1 1 6 3 Uα − 3Uα + Tn (Uα ) = Uα + · n 4! 5   35  6 2  1 1 48 5 3 5 3 · · Uα − 10Uα + 15Uα + −9Uα + 72Uα − 87Uα + + 2 6! 7 8! 5 n   1 1 432 7 Uα − 21Uα5 + 10Uα3 − 105Uα + + 3 · 8! 5 n  210 48 6 + −15Uα7 + 255Uα5 − 1035Uα3 − 855Uα + · · 10! 5 5 5775 + · 12!

 3 6 5

243Uα7



3537Uα5

+

12177Uα3

− 8667Uα





  + O n−7/2 ,

где φ (·) и Φ(·) — стандартная нормальная плотность и функция распределения соответственно, Uα − α -квантиль стандартного нормального распределения, Hj (t) — полиномы Эрмита, определенные в гл. 1. Gupta and Han (1992) сравнили эту аппроксимацию с описанной в предыдущем абзаце. Они отметили, что она заметно лучше, чем даже стьюдентова t-аппроксимация, предложенная в работе George and Mudholkar (1983). Сравне-

113

5. ПОРЯДКОВЫЕ СТАТИСТИКИ

ТАБЛИЦА 23.1 Сравнение четырех аппроксимаций распределения нормированного значения T3 по выборке объема три из логистической популяции t

FT3 (t) − Φ(t)

FT3 (t)

FT3 (t) − A1 (t)

FT3 (t) − A2 (t)

FT3 (t) − A3 (t)

0.05 0.5209 0.0010 0.0000 0.0001 0.0000 0.15 0.5625 0.0029 0.0000 0.0003 0.0000 0.25 0.6033 0.0046 0.0008 0.0005 0.0000 0.45 0.6809 0.0073 −0.0017 0.0007 0.0001 0.65 0.7506 0.0084 −0.0007 0.0007 0.0000 0.85 0.8106 0.0083 −0.0006 0.0007 0.0000 1.00 0.8486 0.0073 −0.0008 0.0004 0.0000 1.20 0.8903 0.0054 −0.0007 0.0002 0.0000 1.45 0.9291 0.0026 −0.0004 0.0000 0.0000 1.75 0.9598 −0.0001 0.0001 −0.0002 0.0000 2.50 0.9918 −0.0020 0.0004 0.0002 0.0000 3.00 0.9975 −0.0012 0.0001 0.0001 0.0000 Замечание. FT3 (t) — точное значение функции распределения нормированной случайны величины T3 , приводимое в [Goel (1975)]; Φ(t) — стандартная нормальная функция распределения; A1 (t) — аппроксимация рядом Эджворта до членов порядка n−1 ; A2 (t) — нормированная функция t-распределения Стьюдента с 19 степенями свободы; A3 (t) — аппроксимация рядом Эджворта до членов порядка n−3 .

ние числовых результатов приводится в табл. 23.1, заимствованной из работы Gupta and Han (1992) для n = 3. Таблица 23.1 показывает, что разложение в ряд Эджворта до членов порядка n−3 , приведенное в работе Gupta and Han (1992), дает более точное приближение, чем другие, и дает максимальную погрешность около 0.0001 во всем диапазоне значений.

5.

Порядковые статистики

Пусть Y1  Y2  · · ·  Yn — вариационный ряд, полученный по выборке объема n из стандартного логистического распределения (23.8), (23.9). Плотность величины Yr , 1  r  n, есть pYr (y) =

n! r−1 n−r {FY (y)} {1 − FY (y)} pY (Y), −∞ < y < ∞. (r − 1)!(n − r)!

(23.18)

Отсюда получается производящая функция моментов для Yr в виде:   E eθ Yr = MYr (θ ) = =

n! (r − 1)!(n − r)!

∞ 

−∞

e−(n−r+1)+θ y  n+1 dy = 1 + e−y

B(r + θ , n − r + 1 − θ ) Γ(r + θ )Γ(n − r + 1 − θ ) = . B(r, n − r + 1) Γ(r)Γ(n − r + 1)

(23.19)

114

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Другие выражения производящей функции моментов Yr с использованием чисел Бернулли и чисел Стирлинга первого рода получили Gupta and Shah (1965). Из (23.19) получаем:

E Yr = ψ (r) − ψ (n − r + 1), (23.20) var(Yr ) = ψ  (r) + ψ  (n − r + 1),

(23.21)

где ψ (·) и ψ  (·) — полигамма функции порядка 2 и 3 соответственно (см. гл. 1). Из (23.19) получается производящая функция семиинвариантов для Yr : KYr (θ ) = log MYr (θ ) = = log Γ(r + θ ) + log Γ(n − r + 1 + θ ) − log Γ(r) − log Γ(n − r + 1).

(23.22)

Отсюда находим k-й семиинвариант для Yr κk (Yr ) = ψ (k−1) (r) + (−1)k ψ (k−1) (n − r + 1),  κk (Yr ) = (−1)k κ (k−1) (Yn−r+1 ),

где ψ (k−1) (θ ) =

dk dθ k

(23.23) (23.23)

log Γ(θ ) — полигамма функция. Выражения первых четырех

семиинвариантов приводят Plackett (1958) и Gumbel (1958). Используя совместную плотность распределения Xr и Xs (1  r < s  n) и применяя аналогичные рассуждения, можно вывести производящие функ

ции моментов Xr и Xs и E Xr Xs . Об этом см., например, в работах Gupta, Qureishi and Shah (1967) и Gupta and Balakrishnan (1992). George and Mudholkar (1981a, b, 1982) получили характеризационные свойства, основанные на порядковых статистиках. Они заметили, что характеристическая функция порядковой статистики Yr есть  n−r  r−1   ,   iθ , iθ iθ Yr = 1− φYr (θ ) = E e φY (θ ), 1+ j=1

j

k=1

k

где φY (θ ) есть характеристическая функция логистического распределе$n−r $r−1 ния (23.8). По этой формуле легко заметить, что Yr + k=1 E1k − j=1 E2j имеет стандартное логистическое распределение (23.8); здесь Eij — независимые показательно распределенные случайные величины с плотностью pEij (x) = je−jx ,

x  0,

j = 1, 2, . . . ,

i = 1, 2.

Другие характеризационные теоремы подобного типа для логистического распределения и распределения Лапласа содержатся в работах George and Mudholkar (1981a, b, 1982), George and Rousseau (1987) и Voorn (1987); полный обзор этих свойств приводится в работе George and Devidas (1992). Используя характеризационное дифференциальное уравнение (21.36), Shah (1966, 1970) вывел следующие соотношения для моментов порядковых статистик и математических ожиданий их произведений (для удобства записи

115

5. ПОРЯДКОВЫЕ СТАТИСТИКИ

используется обозначение Yr : n вместо Yr ):

i+1 i + 1 i

(23.24) E Y1i+1 E Y1 : n , n  1, : n+1 = E Y1 : n − n

i+1

i+1 (i + 1)(n + 1) i E Yr+1 E Yr : n , 1  r  n, (23.25) : n−1 = E Yr : n+1 + r(n − r + 1)

2 E [Yr : n+1 Yr+1 : n+1 ] = E Yr : n+1  

n+1 1 E [Yr : n ] , E [Yr : n Yr+1 : n ] − E Yr2: n − + n−r+1



2 Yr+2 : n+1

n−r



1  r  n − 1,

(23.26)

+  

2 1 n+1 + + E E [Yr : n Yr+1 : n ] − E Yr+1 , [Y ] r+1 : n :n

E [Yr+1 : n+1 Yr+2 : n+1 ] = E

r+1

r

1  r  n − 1, (23.27)





E [Yr : n+1 Ys : n+1 ] = E Yr : n+1 Ys−1 : n+1 + 

n+1 + E [Yr : n Ys : n ] − E Yr : n Ys−1 : n − n−s+2



1 E [Yr : n ] , n−s+1

1  r < s  n; s − r  2, (23.28) E [Yr+1 : n+1 Ys+1 : n+1 ] = E [Yr+2 : n+1 Ys+1 : n+1 ] +   n+1 1 E [Yr : n Ys : n ] − E [Yr+1 : n Ys : n ] − E [Ys : n ] , + r+1

r

1  r < s  n;

s − r  2.

(23.29)

Shah (1966, 1970) доказал, что эта система рекуррентных соотношений полна в том смысле, что она позволяет вычислить все моменты и моменты произведений порядковых статистик по известным моментам Y. Работа Birnbaum and Dudman (1963) посвящена сравнению распределений порядковых статистик нормального и логистического распределений. Gupta and Shah (1965) вывели распределение размаха выборки из логистического распределения и сравнили с аналогичными характеристиками нормального распределения для 2 и 3 случайных величин. Malik (1980) изучил распределение разностей Yn−r:n − Yr+1:n для r = 0, 1, 2, . . . , (n − 1)/2. Tarter and Clark (1965) описали свойства медианы. Plackett (1958) использовал выражение (23.23) для семиинвариантов при выводе приближенных формул для моментов порядковых статистик в виде рядов применительно к произвольным непрерывным распределениям. Kamps (1991) рассматривает класс распределений, удовлетворяющих дифференциальному уравнению d −1 1 F (u) = up (1 − u)q−p−1 du a

на (0; 1),

и приводит некоторые характеризационные теоремы, связанные с моментами порядковых статистик. Логистическое распределение является, очевидно, частным случаем при p = q = −1. Развитие этих результатов содержится в статье Kamps and Mattner (1993).

116

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Плотность распределения размаха выборки, т. е. величины W = Yn − Y1 равна √ 1      π Γ(n) w −(n− 2 ) 1 1 1 w F 1 + ch , w > 0, , ; n + ; 1 − ch pW (w) =   √ 1 2 2Γ n + 2

2

2 2

2

2

(23.30)

где F(a, b; c; x) = 1 +

ab x a(a + 1)b(b + 1) x2 · + · +··· c 1! c(c + 1) 2!

— гипергеометрическая функция. Shah (1965) приводит совместной плотности W и полусуммы 

выражение крайних значений M = Y1 + Yn /2:   w n−2 n(n − 1) sh 2 pM,W (m, w) =  ,  w n 4 ch m + sh 2

w > 0, −∞ < m < ∞.

(23.31)

Balakrishnan and Josi (1983a) рассмотрели усеченное логистическое распределение с плотностью ⎧ −y 1−Q 1−Q ⎨ 1 · e  при − log  y  log , −y 2 1 − 2Q Q Q 1+e (23.32) pY (y) = ⎩ 0 в противном случае, и соответствующей функцией распределения   1 1 1−Q 1−Q − Q , − log  y  log , FY (y) = −y 1 − 2Q

1+e

Q

Q

(23.33)

где Q определяет доли усечения слева и справа стандартной логистической плотности (23.8). Они получили рекуррентные соотношения для моментов и моментов произведений порядковых статистик; эти формулы обобщают результаты статей Shah (1966, 1970), представленные формулами (23.24)–(23.29). Статья Balakrishnan and Kocherlakota (1986) обобщает результаты Balakrishnan and Josi (1983a) на случай асимметричного усечения логистической плотности, а именно, рассмотрена плотность ⎧ y 1−Q P ⎪ ⎨ 1 ·  e 2 при log  y  log , P−Q Q 1 − P (23.34) pY (y) = 1 + e−y ⎪ ⎩ 0 в противном случае, где Q и 1 − P задают доли усечения слева и справа стандартной логистической плотности (23.8). Tarter (1966) получил для этого случая выражения моментов и моментов произведений порядковых статистик. В статьях Braswell and Mandors и Braswell and Pewitt (1973) рассматривается несимметрично

117

6. ОЦЕНКИ ПАРАМЕТРОВ

усеченное логистическое распределение (названное там распределением типа FRPDF — finite range probability distribution function) 1) и приводятся некоторые результаты, связанные с оценками параметров сдвига и масштаба для этого распределения. Для более подробного знакомства со свойствами порядковых статистик логистического распределения и анализом формы этого распределения мы отсылаем читателя к работе Gupta and Balakrishnan (1992).

6.

Оценки параметров

# параметров ξ и σ в (23.14), Оценки максимального правдоподобия ξ# и σ основанные на независимых в совокупности значениях X1 , X2 , . . . , Xn , удовлетворяют уравнениям  +−1 *   n π Xi − ξ# 1 1 √ 1 + exp = , (23.35) n

# 3 σ

i=1

 

 1 − exp π Xi − ξ# n   Xi − ξ# 1 n i=1

2

 1 √   # 3 σ

√ 3

 1 √   = π .   # # 3 1 + exp π Xi − ξ σ

# σ

Асимптотические дисперсии при больших n даются формулами     9 n var ξ# ≈ σ 2 ≈ 0.91189σ 2, 2

 # ≈ n var σ



π

9

(23.36)

(23.37)

 σ 2 ≈ 0.69932σ 2.

3 + π2

(23.38)

Решение уравнений (23.35) и (23.36) требует применения численных методов и вычислительной техники. Используя близость логистического распределения и нормального распре# можно деления, в качестве начального приближения для вычисления ξ# и σ взять величины 2 3 n n 31  2 1 X= Xi и 4 Xi − X n

i=1

n

i=1

соответственно, являющиеся оценками максимума правдоподобия для нормального распределения. Дальнейшее уточнение решений (23.35) и (23.36) можно проводить, например, методом Ньютона—Рафсона. Если же доступна только цензурированная по второму типу   выборка Xr+1 , . . . , Xn−s , где исключены r наименьших и s наибольших выборочных значений из распределения (23.14), то 1) Распределение

с конечным носителем. — Прим. ред.

118

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

оценки ниям

ξ#

# σ

и

(n − r − s) − r −2

параметров

1 n−s  #  e−π (Xi −ξ ) (σ# i=r+1

√ 3) √ 1 # 3) −π (Xi −ξ#) (σ



1+e

3 −r − (n − r − s) π



+s



1

 # e−π (Xr+1 −ξ ) (σ# 3) 1 √  # 1 + e−π (Xr+1 −ξ ) (σ# 3)

 Xn−s − ξ# # σ





 Xr+1 − ξ# # σ

и



+s





σ

удовлетворяют

уравне-



1

1

 # 1 + e−π (Xn−s −ξ ) (σ#



3)

− (23.39)

= 0, 1



 # e−π (Xr+1 −ξ ) (σ# 3) 1 √  # 1 + e−π (Xr+1 −ξ ) (σ# 3)

 +



1 

ξ

#

1



+

1 + e−π (Xn−s −ξ ) (σ# 3) 1 √     n−s n−s    #  Xi − ξ#  Xi − ξ# e−π (Xi −ξ ) (σ# 3) −2 = 0. + 1 √  # # # σ σ 1 + e−π (Xi −ξ ) (σ# 3) i=r+1 i=r+1

(23.40)

При r = s = 0 эти уравнения совпадают с (23.35) и (23.36). Система (23.39) и (23.40) также решается численными методами. Harter and Moore (1967) использовали моделирование методом МонтеКарло и решали уравнения правдоподобия численными методами для опре# для деления смещения, дисперсии и условных дисперсий оценок ξ# и σ выборок объема n = 10 и n = 20 и различных вариантов цензурирования. # для разТаблица асимптотических значений дисперсий и ковариации ξ# и σ личных вариантов цензурирования pr = r/n и ps = s/n приводится в работе Harter and Moore (1967), см. также Harter (1970) и Balakrishnan (1992). Bain et al. (1992) построили интервальные оценки параметров ξ и σ для цензурированной по второму типу выборки. В этой работе на основе метода статистического моделирования вычислены процентные точки центральных  √ ξ# − ξ √ # σ n и −1 n. Авторы также приводят табслучайных величин # σ σ лицы величины нижнего толерантного коэффициента tγ , необходимые для построения нижней толерантной границы уровня γ Δ-й доли распределения при доверительной вероятности γ . Нижняя толерантная граница L(X) имеет вид: #. (23.41) L(X) = ξ# − tγ σ Здесь Δ определяется формулой Pr {1 − FX (L(X); ξ ; σ )  Δ} = γ .

(23.42)

В таблицах содержатся значения tγ для различных соотношений γ и Δ и различных объемов выборки для цензурирования справа (т. е. при r = 0). В силу симметрии логистического распределения толерантный коэффициент tγ применим также для определения U(X) — верхней толерантной границы для Δ-ой доли распределения при доверительной вероятности γ : #. U(X) = ξ# + tγ σ

(23.43)

119

6. ОЦЕНКИ ПАРАМЕТРОВ

В той же работе показано, как можно использовать значения tγ для вычисления 100γ %-й доверительной границы функции надежности RX (t) = 1 − FX (t; ξ , σ ). В работе Lawless (1972) рассматриваются методы условных оценок параметров сдвига и масштаба ξ и σ в (23.14). Plackett (1958) применил асимптотическую линеаризацию выражений в уравнениях максимального правдоподобия (23.35) и (23.36). Он приводит коэффициенты линейных разложений # , которые мало отличаются от наилучших линейных несмеоценок ξ# и σ щенных оценок параметров нормального распределения даже для выборок, объема не больше 10. Иной метод приближенной линеаризации предложил Tiku (1968). Fisk (1961) описывает получение оценок максимального правдоподобия для сгруппированных или цензурированных данных; также об этом см. в работе Hassanein and Sebaugh (1973). Простейшими оценками параметров ξ и σ могут служить выборочное √ среднее m1 и выборочное среднее квадратическое отклонение m2 . Асимп√  тотическая эффективность оценки m1 равна 91.2%, а m2 равна 87.4%.  Gupta, Qureishi √ and Shah (1967) показали, что эффективность m1 в качестве оценки ξ и m2 как оценки σ для малых выборок больше, чем асимптотическая эффективность. Эти оценки, однако, менее эффективны (примерно √ на 10% для m1 и в большей мере для m2 ), чем наилучшие линейные несмещенные оценки. Разработано несколько методов подбора параметров логистических кривых. Описание таких методов можно найти в работах Erkelens (1968), Oliver (1964), Pearl (1940), Rasor (1949), Silverstone (1957), Will (1936). D’Agostino and Massaro (1992), Tsokos and DiCroce (1992). Многие из этих методов являются эвристическими и не основаны на точных вероятностных соображениях. Однако они полезны для быстрого получения оценок параметров. При этом выбор функции распределения проще, чем подбор параметров логистической кривой общего вида, так как в первом случае нет надобности подбирать параметры A и B в уравнении (23.1). Из (23.13) следует, что ожидаемое значение частоты fx = число выборочных значений, меньших x, равно √  −1

 . 1 + exp −π (x − ξ )/(σ 3)

n x , где n x — n

Один из методов подбора кривой состоит в построении графика log fx /(1 − fx ) в зависимости от x, и затем в сглаживании (хотя бы и «на глазок») прямой линией   fx log =# a+# bx (23.44) 1 − fx

по имеющимся данным. Сравнение коэффициентов в (23.44) и выражения   E (fx ) π (23.45) = √ (−ξ + x) log 1 − E (fx )

приводит к оценкам

π # b 3

#= √ , σ

σ 3

# a # ξ =− . # b

120

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Возможны различные модификации этих оценок, например, с помощью уточнения коэффициентов прямой или поправок для уменьшения смещения, но приведенные формулы дают быстрый, удобный и эффективный метод. Подобные методы, предусматривающие уточнение кривой и требующие расчета верхних и нижних границ или асимптот, не столь удобны [Oliver (1964)]. Если доступны лишь относительные частоты, полученные по сгруппированным данным, то следует применять специально разработанные методы. Несмотря на простоту функционального вида плотности порядковых статистик выборки из логистического распределения, для матрицы ковариаций не найдено простой формулы, как, например, для показательного или равномерного распределений. Поэтому задача построения наилучших несмещенных оценок параметров ξ и σ напоминает аналогичную задачу для нормального распределения, и предпочтительно использовать числовые расчеты и таблицы, а не аналитические методы. Gupta, Qureishi and Shah (1967) показали, что эффективность [относительно нижних границ Рао—Крамера, определенных формулами (23.37) и (23.38)] наилучшей линейной несмещенной оценки ξ достигает 95% при n = 5 и 98% при n = 25; для σ соответствующее возрастание идет от 80% до 90%. Существуют явные приближенные выражения [Gupta and Gnanadesikan (1996)] наилучших линейных несмещенных оценок, зависящих от фиксированных k порядковых статистик Xn 1 , Xn 2 , . . . , Xn k , 1  n1 < n2 < · · · < nk  n в выборке X1 , X2 , . . . , Xn объема n из распределения с плотностью (23.14). Эти формулы должны давать хорошие результаты для больших n, при этом n1 /n и nk /n не должны быть слишком близкими к «0» и «1» соответственно. Формулы получаются с помощью аппроксимаций в ситуации больших выборок математических ожиданий, дисперсий и ковариаций порядковых статистик, [см., например, Ogawa (1951)]. Первой из таких приближенных формул является оценка параметра сдвига ξ при известном σ : ξ∗ =

k+1        n n n 1  n ni n 1 − i − i−1 1 − i Xn i − i−1 1 − i−1 Xn i−1 − σ K3 , K1 n n n n n n i=1

(23.46) где K1 =

k−1   n

i

i=1

n



ni−1 n

 2 n n 1 − i − i−1 , n

n

k+1    n n K3 = 1 − i − i−1 × i=1



n × i n

n

n

      ni−1 ni−1 ni−1 /n ni ni /n − 1− log 1− log n

1 − ni /n

n

n

1 − ni−1 /n

и, по определению, Xn 0 = Xn k+1 = 0. Заметим, что коэффициенты в выражении для ξ ∗ зависят только от отношений ni /n.

121

6. ОЦЕНКИ ПАРАМЕТРОВ

σ2

Дисперсия ξ ∗ приближенно равна K −1 . При фиксированном k эта n 1 дисперсия минимальна, если n1 , n2 , . . . , nk выбраны так, чтобы K1 было макni симальным. Такой максимум достигается при ni = (практически берется k+1 ближайшее целое). При указанных ni получаем оценку ξ ∗∗ =

k  6 i(k + 1 − i)Xn i k(k + 1)(k + 2)

(23.47)

i=1

с дисперсией var (ξ ∗∗ ) =

9 π2

·

2 σ (k + 1) · . n k(k + 2)

Нижняя граница в неравенстве Рао—Крамера для несмещенной оценки ξ есть

9 2

·

σ2 . Относительная эффективность оценки ξ ∗∗ приближенно равна n

π (k + 1)2 . Она возрастает от 75% при k = 1 до 100% при возрастании k. (Если k(k + 2)

k = 1, то ξ ∗∗ есть выборочная медиана.) Заметим, что оценка (23.47) получена методом, развитым в работе Blom (1956). Она также получается из оценки, полученной в статье Jung (1956) с помощью множителя, устраняющего смещение. Оценка σ при известном ξ дается формулой σ2 =

где

Y − ξ K3 , K2

(23.48)

 k+1       ni−1 ni−1 ni ni ni /n − Y= 1− log 1− log 1 − ni /n n n

  

   ni /n 1 − ni /n Xni − ni−1 /n 1 − ni−1 /n Xni −1 × , ni /n − ni−1 /n i=1

K2 =

k+1  i=1

n

n

ni /n 1 − ni−1 /n

 ×

1

 (ni /n)(1 − ni /n) log {(ni /n)(1 − ni /n)} − (ni /n) − ni−1 /n

2 −(ni−1 /n)(1 − ni−1 /n) log {(ni−1 /n)(1 − ni−1 /n)} σ2

Приближенное значение дисперсии этой оценки равно K −1 . n 2 Gupta and Gnanadesikan (1996) приводят детальное сравнение оценок σ при неизвестном ξ , полученных методами, разработанными в статьях Blom (1956, 1958) и Jung (1956). Авторы выяснили, что оценки имеют высокую эффективность. В табл. 23.2, заимствованной$из Gupta and Waknis (1965),   ai Xn−i+1 − Xi , выведенную приводятся значения ai , входящие в формулу в работе Jung (1956) и модифицированную так, чтобы исключить смещение оценки параметра σ . Общая задача максимизации K2 и, таким образом, минимизации var(σ ∗) весьма сложна. Однако, если используется только два выборочных значения, то близкая к минимальной var (σ ∗) ≈ 1.0227σ 2/n получается при n1 ≈ 0.103n и n2 ≈ 0.897n. Нижняя граница дисперсии несмещенной оценки по нера-

122

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

венству Рао—Крамера равна

9 σ2 · . Относительная эффективность (при 2 n 3+π

указанном выборе n1 и n2 ) оценки

σ ∗ = 0.4192 Xn 1 + Xn 2 составляет около 68.38%. Интересно отметить, что получение улучшенной оценки потребовало бы четырех выборочных значений. Если оба параметра ξ и σ неизвестны, то близкие к наилучшим линейные оценки, полученные тем же методом суть: # ∗ = Δ−1 (−K3 X + K1 Y) , ξ#∗ = Δ−1 (K2 X − K3 Y) , σ (23.49) где

Δ = K1 K2 − K32 , k+1         n n n n ni n X= 1 − i − i−1 1 − i Xn i − i−1 1 − i−1 Xn i−1 ; n

i=1

n

n

n

n

n

величины K1 , K2 , K3 и Y определяются формулами (23.46) и (23.48). В работах Simpson (1967), Hassanein (1969, 1974), Chan (1969), Chan, Chan and Mead (1971, 1972), Chan and Cheng (1972, 1974) и Cheng (1975) рассматривается задача оптимального линейного оценивания ξ и σ для логистического распределения. Все эти исследования резюмировал Cheng (1992), который также привел необходимые таблицы. Saleh, Hassanein and Ali (1992) рассмотрели оптимальные линейные оценки квантилей логистического распределения, основанные на порядковых статистиках, и составили соответствующие таблицы; аналогичное исследование содержится в работе Ali and Umbach (1989) для симметрично усеченного логистического распределения. В книге Balakrishnan (1992) приводятся также линейные оценки с полиномиальными коэффициентами, впервые исследованные в статье Downton (1966). Простые линейные оценки ξ и σ , основанные на полусумме крайних зна-

ТАБЛИЦА 23.2 в линейной оценке Коэффициенты при (n − i + 1)-й порядковой статистике σ (по методу Jung (1956)), модифицированной для устранения смещения  Xn−i+1

i

n

5 6 8 10 15 20 25

1 0.3538 0.2907 0.2125 0.1663 0.1062 0.0774 0.0605

2 0.2038 0.2024 0.1767 0.1503 0.1048 0.0787 0.0625

3 0 0.0715 0.1147 0.1170 0.0955 0.0758 0.0618

4

5

6

Дисперсия

7

8

9

10

11

12

13

σ2

0.1706 0.1372 0.0396 0.0985 0.0737 0.0251 0.0769 0.0813 0.0636 0.0436 0.0222 0 0.0496 0.0700 0.0622 0.0528 0.0422 0.0307 0.0187 0.0063 0.0366 0.0592 0.0553 0.0504 0.0445 0.0381 0.0381 0.0236 0.0159 0.0080 0 0.0293

Замечание. При вычислении использована та же приближенная ковариационная матрица, что и в методе Blom’а.

123

7. РЕКОРДНЫЕ ЗНАЧЕНИЯ

чений и на размахе выборки, предложены в работе Raghunandanan and Srinivasan (1970). Построение доверительных интервалов для ξ и σ описано в статье Antle, Klimko and Harkness (1970), использовавших метод Монте-Карло для получения ширины доверительных интервалов. Schafer and Sheffield (1973), а также Bain et al. (1992) продолжили эти исследования, причем в последней работе рассматриваются также выборки, цензурированные по типу II. Howlder and Weiss (1989) применили байесовские оценки функции надежности Rx (t), используя методы Lindley and Tierney и Kadane. Эти авторы использовали квадратичную функцию потерь и логарифм квадратичной функции потерь. В сообщении Aguirre and Nikulin (1983) обсуждается критерий согласия хи-квадрат при проверке гипотезы о логистическом распределении. Iqbal (1993) получил асимптотические разложения доверительных границ для параметров логистического распределения.

7.

Рекордные значения

Пусть YU(1) , YU(2) , YU(3) , . . . — верхние рекордные значения последовательности {Yi } независимых случайных величин, имеющих одинаковое логистическое распределение (23.59). Плотность n-го рекордного значения YU(n) равна pYU(n) (y) =

1 {− log (1 − FY (y))}n−1 pY (y), (n − 1)!

−∞ < y < ∞.

(23.50)

Совместная плотность YU(m) и YU(n) (1  m  n) есть 

m−1 1 pY (y1 ) − log 1 − FY (y1 ) pYU(m) ,YU(n) (y1 , y2 ) = · × (m − 1)!(n − m − 1)! 1 − FY (y1 ) 

n−m−1 

pY (y2 ), −∞ < y1 < y2 < ∞. × − log 1 − FY (y2 ) + log 1 − FY (y2 ) (23.51) Используя эти формулы, Balakrishnan, Ahsanullah and Chan (1994) изучили свойства моментов рекордных значений. Математическое ожидание n-го рекордного значения, n = 1, 2, . . ., равно

E YU(n) =

∞ 

ypYU(n) (y)dy = −∞

1 =

1

FY−1 (u)

1 n−1 {− log(1 − u)} du = (n − 1)!

0

1 n−1 (log u) {− log(1 − u)} du + (n − 1)!

0

1

1 n {− log(1 − u)} du = n − Sn , (n − 1)!

0

(23.52) где Sn =

∞  k=1

1 , n = 1, 2, . . . . k(k + 1)n

(23.53)

124

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Используя тот факт, что S1 = 1 и Sn+1 − Sn = 1 − ζ (n + 1), где ζ (·) — дзетафункция Римана, Balakrishnan, Ashanullah and Chan (1994) установили, что





E YU(1) = 0, E YU(n+1) = E YU(n) + ζ (n + 1), n  1. (23.54) Аналогично они вывели формулы для дисперсий и ковариаций верхних рекордных значений:

 var YU(n) = 2nζ (n + 1) − n − Sn2 + 2Tn , n  1, (23.55)

 cov YU(m) , YU(n) = m {ζ (m + 1) + ζ (n + 1) − 1} − Sm Sn + ∞ ∞   1 1 + 1  m < n, (23.56) m, n−m k=1

k(k + 1)

l=1

l(l + 1 + k)

где Sn определено формулой (23.53), и ∞   1 1 Tn = + ···+ n 1+ l=2

l(l + 1)

2



1 , l−1

n  1.

(23.57)

По формулам (23.55)–(23.57) Balakrishnan, Ahsanullah and Chan (1994) табулировали средние, дисперсии и ковариации верхних рекордных значений YU(n) для n  10. В силу симметрии логистического распределения эти таблицы можно использовать для вычисления средних (изменив знак), дисперсий и ковариаций нижних рекордных значений YL(n) . Эти же авторы использовали свои таблицы для получения наилучших линейных несмещенных оценок параметров сдвига и масштаба α и β в (23.6), основанных на первых n рекордных значениях. Таблицы коэффициентов этих наилучших несмещенных линейных оценок также приведены для n  10. В той же работе рассмотрена задача построения прогнозируемого интервала предсказания рекордных значений и задача проверки гипотезы о ложности того, что текущее значение является рекордным.

8.

Таблицы

Значения стандартной плотности pY (y) (23.8) и соответствующей функции распределения FY (y) (23.9) содержатся в сборнике таблиц Owen (1962). Каждая из функций табулирована с четырьмя десятичными знаками для y = 0 (0.01) 1.00 (0.05) 3.00. В силу симметрии таблицы составлены только для положительных y. Обратные таблицы содержат значения y и pY (y), соответствующие значениям функции распределения FY (y) = 0.5 (0.1) 0.90 (0.05) 0.99 (0.001)0.999 (0.0001) 0.9999 и некоторым значениям FY (y), б´oльшим 0.9999 до 0.999999999. Finney (1947, 1952) составил таблицы для логит-анализа. Таблицы вклюF чают преобразование y = log . Сокращенный вариант таких таблиц 1−F приведен в работе Berkson (1953). Аналогичные таблицы (табл. XI и XII) приводят Fisher and Yates (1957). Таблицы α -квантилей (100α %-х точек) распределений порядковых статистик для α = 0.50, 0.75, 0.90, 0.95, 0.975, 0.99 до n = 10, а также

8. ТАБЛИЦЫ

125

для максимального и для центрального члена вариационного ряда от 11 до 25 составлены в статье Gupta and Shah (1965). Там также содержатся значения функции распределения размаха W выборки объема n = 2 и 3 для w = 0.2 (0.2) 1.0 (0.5) 4.0. Таблицы средних значений и стандартных отклонений порядковых статистик приводятся в работе Birnbaum and Dudman (1963) для объемов выборки n = 1 (1) 10, 15, 20, 25 и нескольких порядковых статистик при n = 100. Таблицы ковариаций порядковых статистик для малых выборок (объема до 10) составлены в статье Shah (1966). Gupta, Qureishi and Shah (1967) расширили эти таблицы, доведя объем выборки до 25. Затем Balakrishnan and Malik (1994) довели объем выборки до 50 (значения приводятся с десятью значащими цифрами). Для симметрично усеченного логистического распределения (23.22) Balakrishnan and Joshi (1983b) составили таблицы средних, дисперсий и ковариаций порядковых статистик для объемов выборки до 10 включительно и для коэффициента усечения Q = 0.01, 0.05 (0.05) 0.20. Таблицы асимптотических значений дисперсий и ковариаций оценок максимального правдоподобия параметров ξ и σ в (23.14) приводятся в статье Harter and Moore (1967), в книге Harter (1970) для различных вариантов цензурирования выборки слева и справа. Gupta, Qureishi and Shah (1967) табулировали коэффициенты наилучших линейных несмещенных оценок ξ и σ при n = 2 (1) 5 (5) 25 и некоторых б´oльших n. Balakrishnan (1991) приводит более подробные таблицы, включающие объемы выборки 2 (1) 25 (5) 40 и всевозможные варианты цензурирования выборки. В работе Cheng (1992) содержатся таблицы наилучшего выбора k порядковых статистик и соответствующие коэффициенты и асимптотические дисперсии наилучших линейных несмещенных оценок параметров ξ и σ . Аналогичные таблицы для асимптотически наилучших линейных несмещенных оценок квантилей логистического распределения (построенных по k оптимально выбранным порядковым статистикам) приводятся в работе Saleh, Hassanein and Ali (1992). Таблицы процентных точек для центральных функций, основанных на оценках максимального правдоподобия параметров ξ и σ приводятся в работе Bain et al. (1992). С помощью этих таблиц можно построить доверительные границы для ξ и σ по полной выборке или по выборке, цензурированной по типу II. В этой же работе содержатся таблицы толерантных коэффициентов, позволяющих рассчитать верхние и нижние толерантные границы, а также нижние доверительные границы для функции надежности для полной выборки и для цензурированной по типу II. Таблицы толерантных коэффициентов с использованием наилучших линейных несмещенных для ξ и σ построены в статье Hall (1975). Balakrishnan and Fung (1992) распространили эти таблицы на случай односторонних толерантных границ для выборок объема до 40 включительно; таблицы также пригодны для построения двусторонних толерантных интервалов. D’Agostino and Massaro (1992) приводят таблицы критических значений для проверки гипотезы о логистическом распределении; об этом также см. в сборнике D’Agostino and Stephens (1986). В сообщении Balakrishnan et al. (1991) составлены таблицы средних, дисперсий и ковариаций порядковых статистик логистического распределения при

126

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

наличии одного выброса по сдвигу или по параметру масштаба. Эти таблицы использованы в книге Balakrishnan (1992) для изучения качеств различных линейных оценок параметров сдвига и масштаба логистической популяции.

9.

Приложения

Мы уже упомянули некоторые из важных приложений логистической кривой или логистического распределения. Сюда включаются модели роста и замена логистическим нормального распределения. По-видимому с недавних пор (см. работы Berkson (1944, 1951, 1955, 1957)) логистическое распределение стало использоваться при анализе квантованных откликов. Этот тип анализа уже описан в гл. 13 в связи с использованием нормального распределения в пробит-анализе. Если используется логистическое распределение вместо нормального для представления допустимости распределения популяции, то удобней применять логарифмические величины, называемые логитами, вместо пробитов. Логит Y связан с соответствующей вероятностью P формулой −1

, P = 1 + eY 

т. е. Y = log



P . 1−P

Если Pi = Di /n — наблюдаемая частота гибели при дозировке xi , i = 1, . . . , k, то вычисленные наблюдаемые логиты равны Yi = log α и β в равенстве

Pi . Оценки констант 1 − Pi

−1 P = 1 + e−(α +β x основываются на k независимых биномиальных частотах Pi или, что то же самое, на k независимых логитах Yi . Оценки максимального правдоподобия # параметров α и β соответственно удовлетворяют уравнениям # и β α k  i=1

где

k      #i = 0 = #i , ni Pi − P ni xi Pi − P

(23.58)

i=1

#i = 1 + exp {− (α + β xi )} −1 . P Итеративный метод решения этих уравнений связан с подгонкой взвешенной регрессии Yi на xi . Эта регрессивная линия строится точно так же, как в пробит-анализе. Некоторое упрощение вычислений состоит в том, что вес наблюдения, соответствующего Pi , равен Pi (1 − Pi ), и это проще, чем соответствующая формула в пробит-анализе. В силу сходства формы нормальной и логистической кривой естественно ожидать, что результаты пробит= и логит-анализа будут, как правило, весьма близки. Finney (1947) отмечает хорошее согласие при оценке медианы предполагаемого распределения. Факторный анализ при 2n факторах, основанный на логистической форме остаточной дисперсии, предпринят в работе Dyko and Patterson (1952);

127

10. ОБОБЩЕНИЯ

более общий случай предположения о линейных зависимостях рассмотрен в статье Grizzle (1961). Reiersøl (1961) приводит сравнение многочисленных результатов, основанных на логистическом распределении. Перечислим некоторые другие приложения. Pearl and Reed (1929) описали применение логистического распределения при обработке физико-химических измерений. Birnbaum and Dudman (1963), Lord (1965), Sanathanan (1974) и Formann (1982) описывают психологические модели, Aitchison and Shen (1980) — геологические. Vieira and Hoffman (1977) применили логистическое распределение для моделирования прироста веса коров Хольстейнской породы, Glasbey (1979) моделировал прирост веса молодых бычков Айширской породы. Leach (1981) и Oliver (1982) приводят логистическую модель роста человеческой популяции. Применение логистической дискриминантной кривой в задачах медицинской диагностики впервые предложено в работах Cox (1966) и Day and Kerridge (1967) и позже развито в статьях Anderson (1972, 1973, 1974). Wijesinha et al. (1983) и Begg and Gray (1984) применили модель многомерной логистической регрессии к изучению популяции пациентов с различными вариантами диагноза. Breslow and Powers (1978) использовали логистический регрессионный анализ для сравнения априорных и апостериорных данных по детской онкологии, приводимых Kneate (1971) в отчете о результатах Оксфордской программы исследования детской онкологии. Johnson (1985) применил логистическую регрессию для оценки времени жизни пациентов, больных лейкемией. McCullagh (1977) рассматривал статистики, основанные на разности отношений, применительно к анализу профессиональной болезни легких у шахтеров в угольных шахтах. Greenland (1985) применил обобщенную логистическую модель к анализу зависимости хронических респираторных заболеваний от курения и от возрастных изменений и к оценке значимости этих факторов. В работе Bonney (1986) логистическая регрессионная модель используется для сопоставления целей и методологии изучения эпидемиологического и генетического факторов в развитии наследственных болезней и анализа других дихотомических признаков. Kay and Little (1986) с помощью логистической регрессионной модели анализируют статистические данные по гемолитическому уремическому синдрому, полученные по заболеваниям детей. Логистическое распределение, логистические модели роста и логистический регрессионный анализ находят многочисленные другие применения. Интересующегося читателя мы отсылаем к часто упоминавшейся уже книге Balakrishnan (1992).

10.

Обобщения

В литературе описано несколько вариантов обобщения логистического распределения. Обобщенным логистическим распределением типа I назовем распределение, определяемое функцией распределения FY (y) =

1 , −∞ < y < ∞, (1 + e−y )α

α > 0.

(23.59)

128

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Стандартная логистическая функция распределения получается при α = 1. Dubey (1969) заметил, что, если Y имеет при фиксированном η > 0 распреде−y ление экстремальных значений (гл. 22) с плотностью ηe−y e−ηe , то при случайном η, имеющем гамма-распределение с плотностью pη (z) = e−η zα −1 /Γ(α ), α > 0, случайная величина Y имеет обобщенное логистическое распределение типа I. В дальнейшем в этом пункте мы будем писать просто распределение типа I (затем также типа II и т. д.). Zelterman (1987a, b) включил параметры сдвига и масштаба и рассмотрел получившееся трехпараметрическое распределение. В его статье обсуждаются методы оценки параметров. Balakrishnan and Leung (1988a) и Zelterman (1989) изучили порядковые статистики этого распределения, а в статье Balakrishnan and Leung (1988b) составлены таблицы средних, дисперсий и ковариаций порядковых статистик при различных α . Используя данные таблицы, Balakrishnan and Leung (1988b) также получили наилучшие линейные несмещенные оценки параметров масштаба и сдвига при известном α и составили соответствующие таблицы. Gerstenkorn (1992) рассмотрел задачу оценивания параметра α . Распределение типа I, задаваемое формулой (23.59), имеет отрицательную асимметрию, если 0 < α < 1, и положительную, если α > 1. Ahuja and Nash (1967) установили, что, если Y имеет обобщенное логистическое распределение (23.59), то распределение случайной величины −α Y близко к показательному распределению при α , близких к нулю, а распределение величины Y − ln α при больших α близко к распределению экстремальных −y значений e−e (см. гл. 22). Функция распределения обобщенного логистического распределения типа II есть FY (y) = 1 −

e−α y , (1 + e−y )α

−∞ < y < ∞,

α > 0.

(23.60)

Нетрудно видеть, что, если Y имеет распределение типа I, то −Y имеет обобщенное логистическое распределение типа II. Следовательно, асимметрия распределения (23.60) положительна при 0 < α < 1 и отрицательна при α > 1. Обобщенное логистическое распределение типа III задается плотностью pY (y) =

1 e−α y · , B(α , α ) (1 + e−y )2α

−∞ < y < ∞,

α > 0.

(23.61)

Стандартное логистическое распределение соответствует случаю α = 1. Ясно, что при любом α плотность (23.61) симметрична относительно нуля. Davidson (1980) вывел производящую функцию моментов ∞ 

θ y 1 e−(α −θ )y Γ(α − θ )Γ(α + θ ) E e = dy = , −α < θ < α . (23.62) −y 2α 2 B(α , α )

−∞

(1 + e

)

[Γ(α )]

Отсюда получаются среднее, дисперсия, асимметрия и эксцесс: " ψ  (α ) E[Y] = 0, var(Y) = 2ψ  (α ), β1 (Y) = 0, β2 (Y) = 3 +  2 . 2 ψ  (α )

(23.63)

129

10. ОБОБЩЕНИЯ

Обобщенное логистическое распределение типа III имеет более тяжелый хвост, чем нормальное распределение. При больших значениях параметра α " распределение величины 2/α Y близко к нормальному. Gumbel (1944) показал, что распределение типа III является предель 1 Xα : n + Xn−α +1 : n ным для среднего арифметического порядковых статистик 2 по выборке из симметричного распределения. Davidson (1980) заметил, что разность двух независимых случайных величин, имеющих распределение экстремальных значений, имеет распределение типа III. Cutler (1992) выяснил, что распределение типа III получается при использовании статистик, основанных на k ближайших к фиксированному числу выборочных значениях. В работах George and Ojo (1980) и George, El-Saidi and Singh (1986) изучена аппроксимация t-распределения Стьюдента с ν степенями свободы распределением (23.61). В частности, сравнивая эксцесс в формулах (23.63) с соответствующей характеристикой распределения Стьюдента (см. гл. 28), авторы рекомендуют использовать значение α = (ν − 3.25)/5.5 в распределении типа III для наилучшей аппроксимации. Обобщенное логистическое распределение типа IV, определяемое плотностью pY (y) =

1 e−qy · p+q , B(p, q) 1 + e−y

−∞ < y < ∞,

p, q > 0,

(23.64)

изучено в работах Prentice (1976) и Kalbfleisch and Prentice (1980). Легко видеть, что распределения типов I–III являются частными случаями этого распределения. Кроме того, плотность (23.64) типа IV является плотностью случайной величины − ln Z, где qZ/p имеет центральное F-распределение с (2p, 2q) степенями свободы (см. гл. 27). Интересно, что, если Y имеет распределение с плотностью (23.64), то −Y имеет такое же распределение, но с заменой p на q и q — на p. Производящая функция моментов Y равна ∞ 

θ y 1 e−(q−θ )y Γ(p + θ )Γ(q − θ ) , −p < θ < q, (23.65) E e =  p+q dy = B(p, q)

−∞

1 + e−y

Γ(p)Γ(q)

откуда получаем моменты: E[Y] = ψ (p) − ψ (q),

" ψ  (p) − ψ  (q) β1 (Y) =  3/2 ,   ψ (p) + ψ (q)

var(Y) = ψ  (p) + ψ  (q), ψ  (p) + ψ  (q) 2 . ψ  (p) + ψ  (q)

β2 (Y) = 3 + 

(23.66)

Третья из формул (23.66) показывает, что асимметрия распределения типа IV положительна при p > q и отрицательна при p < q; при p = q плотность симметрична и превращается в плотность типа III. George and Ojo (1980) и George and Singh (1986) получили разложение в ряды первых четырех семиинвариантов Y. Prentice (1976) предложил использовать распределение типа IV при моделировании дихотомических ответов как альтернативу обычной логистической модели. В книге Kalbfleich and Prentice (1980) рассматривается применение

130

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

четырехпараметрического распределения типа (23.65) (с включением параметров сдвига и масштаба) к анализу данных о дожитии. Там также показано, что распределение типа IV стремится к логнормальному при p → ∞ и к распределению Вейбулла при p = 1 и q → ∞; об этом также см. в работе Farewell and Prentice (1977). В работе McDonald (1991) распределение типа IV названо экспоненциальным обобщением бета-распределения второго типа (exponential generalized beta of the second type, EGB2)). Все приведенные обобщения логистического распределения являются частными случаями широкого класса распределений, введенного в работе Perks (1932); Perks — британский актуарий — интересовался, в первую очередь, построением общей функции, описывающей таблицы смертности, однако его формулы находят более широкое применение. Плотность обобщенного распределения, предложенного в статье Perks (1932), имеет вид отношения $m

pY (y) = $j=0 m

aj e−jθ y

−jθ y j=0 bj e

,

(23.67)

где aj , bj , θ — действительные параметры. Между ними должны существовать соотношения, обеспечивающие выполнение условий ∞ 

pY (y)  0

и

pY (y)dy = 1. −∞

За счет изменения масштаба всегда можно выбрать θ = 1; кроме того, pY (y) не меняется при умножении всех aj и bj на одну и ту же константу, отличную от нуля. Особый интерес имеет подсемейство симметричных распределений, получающееся при m = 1, m = 2, a0 = 0, b0 = b2 . Тогда (23.67) превращается в плотность a1 e−y

pY (y) =

b0 + b1 e−y + b0 e−2y

=

c1 , ey + c2 + e−y

где c1 =

a1 , b0

c2 =

b1 . b

(23.68)

положительности pY (y) при всех y есть c2  −2, а условие При c1 > 0 условие ∞ нормировки −∞ pY (y)dy = 1 требует исключить значение c2 = −2; при всех c2 > −2 (23.68) может являться плотностью распределения. Логистическое распределение получается при c2 = 2. Еще одно семейство обобщенных логистических распределений рассмотрено в работах Hoskins (1989, 1991). Функция распределения этого семейства дается формулой 1

FY (y) =

1 + (1 − ky)

1/k

,

y

1 k

при k > 0,

y

1 k

при k < 0,

(23.69)

а плотность равна (1 − ky) k −1 1

pY (y) = 

1 + (1 − ky)

1/k

2 ,

y

1 k

при k > 0,

y

1 k

при k < 0. (23.70)

131

10. ОБОБЩЕНИЯ

Эта плотность превращается в стандартную логистическую плотность (23.8) при k → 0. Из (23.70) следует, что, если Y имеет такую плотность с параметром k > 0, то −Y имеет такую же плотность с параметром −k < 0. Используем (23.69), чтобы найти r-й начальный момент Y: 1 1   r  −1 

r 1 1−u k FY (u) du = du = E Y = r · 1− k

0

=

u

0

r 1  (−1)i kr i=0

    r r r 1  B(1 − ki, 1 + ki) = r (−1)i Γ(1 + ki)Γ(1 − ki), i i k i=0   1 1 r∈ − , . (23.71) k

k

Используя характеризационное дифференциальное уравнение (1 − ky)pY (y) = FY (y) {1 − FY (y)} ,

(23.72)

Balakrishnan and Sandhu (1994a) вывели несколько рекуррентных соотношений для моментов и моментов произведений порядковых статистик. В статье приведены следующие соотношения:  k(i + 1)  i+1 i + 1 i

E Y1:n , E Y1:i+1n+1 = 1 + E Y1: n − n

n

n  1;

i = 0,1, ... ,

i+1

i+1 (i + 1)(n + 1)  i

 E Yr+1: n+1 = E Yr: n+1 + E Yr: n − kE Yr:i+1n ,

(23.72a)

r(n − r + 1)

1  r  n; i = 0,1, ... , (23.72b)  

n+1 k r 2 E [Yr: n+1 Yr+1: n+1 ] = 1+ E [Yr: n Yr+1: n ] − E Yr+1: n+1 − n−r+1 n−r n+1  1 E [Yr: n ] , − (23.72c) n−r

n+1 × E [Yr: n+1 Ys: n+1 ] = E Yr: n+1 Ys−1: n+1 + n−s+2   

k 1 × 1+ E [Yr: n Ys: n ] − E Yr: n Ys−1: n − E [Yr: n ] , n−s+1

n+1 E [Yr+1: n+1 Yr+2: n+1 ] = r+1



1  r < s  n; 

n−s+1

s − r  2, 

(23.72d) 

1 k n−r 2 E [Yr+1: n ] + 1 − E [Yr: n Yr+1: n ] − E Yr+1: n+1 , r r n+1

1  r  n − 1, (23.72e) E [Yr+1: n+1 Ys+1: n+1 ] = E [Yr+2: n+1 Ys+1: n+1 ] +     n+1 1 k E [Ys: n ] + 1 − E [Yr: n Ys: n ] − E[Yr+1: n Ys: n ] , + r+1

r

r

1  r < s  n; s − r  2, (23.72f )  

2 E [Yr: n+1 Yr+2: n+1 ] = E [Yr: n+1 Yr+1: n+1 ] − r E [Yr+1: n+1 Yr+2: n+1 ] − E Yr+1: n+1 + +

n+1 {E [Yr: n ] − kE [Yr: n Yr+1: n ]}, n−r

1  r  n − 1,

(23.72g)

132

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

E [Yr: n+1 Ys+1: n+1 ] = E [Yr: n+1 Ys: n+1 ] − r {E [Yr+1: n+1 Ys+1: n+1 ] − E[Yr+1: n+1 Ys: n+1 ]} + s−r n+1 {E [Yr: n ] − kE [Yr: n Ys: n ]}, + (n − s + 1)(s − r)



1  r < s  n;

s − r  2.

(23.72h)

При k → 0 эти рекуррентные соотношения превращаются в формулы (23.24)–(23.29), выведенные в работах Shah (1966, 1970). Hosking (1989, 1991) включил параметры сдвига и масштаба в распределение (23.69) и сравнил оценки всех трех параметров методом моментов и методом максимального правдоподобия. Другие свойства этого распределения содержатся в работах Chen and Balakrishnan (1994). Balakrishnan and Sandhu (1994a) нашли наилучшие линейные несмещенные оценки трех параметров. В статье Balakrishnan and Sandhu (1994b) рассмотрено усеченное распределение с функцией распределения FY (y) =

1 ,  (P − Q) 1 + (1 − ky)1/k

Q1  y  P1 

1 , k

k > 0,

и плотностью (1 − ky) k −1 2 ,  1/k (P − Q) 1 + (1 − ky) 1

p(y) =

Q1  y  P1 

1 , k

k

k где Q1 = 1− (1 − Q)/Q /k, P1 = 1− (1 − P)/P /k; здесь Q > 0 и 1−P > 0 — точки усечения слева и справа соответственно в обобщенном логистическом распределении (23.69). Характеризационное дифференциальное уравнение есть (1 − ky)p(y) = F(y) {1 − (P − Q)F(y)} . Используя последнее уравнение, Balakrishnan and Sandhu (1994b) вывели рекуррентные соотношения для моментов и моментов произведений порядковых статистик.

11.

Распределения, связанные с логистическим

Talacko (1956) изучил секанс гиперболическое распределение, которое получается из (23.68) при c2 = 0: c

1

pY (y) = y 1 −y = c1 sech y. (23.73) 2 e +e ∞ По условию нормировки −∞ pY (y)dy = 1 определяется c1 = 2/π , т. е. pY (y) = π −1 sech y.

(23.74)

Функция распределения FY (y) =

1 1 −1 + th (sh y). 2 π

(23.75)

133

11. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С ЛОГИСТИЧЕСКИМ

Заметим, что, если Y имеет такое распределение, то eY имеет распределение Коши на положительной полуоси (гл. 16). Распределение суммы n независимых случайных величин с плотностью (23.74) рассматривал Baten (1934). Вернемся ненадолго к более общей форме, т. е. к распределению (23.68). Его характеристическая функция равна [Talacko (1956)] π

cos−1 (c2 /2)

·

  sh t cos−1 (c2 /2) sh tπ π · ch−1 (c2 /2)

при − 2 < c2 < 0,

  sin t ch−1 (c2 /2)

0 < c2  2,

при c2 > 2.

sh tπ

(23.76) (23.77)

Логистическое распределение получится в предельном случае при c2 → 2.

 Значения cos−1 c2 /2 находятся в отрезке от 0 до π . Характеристическая функция распределения (23.74) есть sech(π t/2) и r-й абсолютный момент относительно нуля равен vr

r 4 = E |Y| =

∞ 

ye

π

=

∞ 4 (−1)j π j=0

r −y

0 ∞ 

1+e

 −2y −1

yr e−(2j+1)y dy =

4 dy = π

∞   ∞

(−1)j yr e−(2j+1)y dy =

0 j=0



 4 Γ(r + 1) (−1)j (2j + 1)−(r+1) . π

(23.78)

j=0

0

4

2π 3

π2

π4

· = , μ4 (Y) = , Среднее значение Y равно нулю; var(Y) = π 32 4 3 β2 (Y) = α4 (Y) = 5. Среднее отклонение равно 4c/π , где c = 0.916 — число Каталана. Для этого распределения 8c Среднее отклонение = 0.742. = Стандартное отклонение π 2

Harkness and Harkness (1968) исследовали свойства класса распределений с характеристической функцией (sech θ t)ρ ,

ρ > 0,

θ > 0,

которое они назвали обобщенным секанс гиперболическим распределением. Для целых ρ — это распределение суммы независимых одинаково распределенных случайных величин, имеющих секанс гиперболическое распределение. В работе показано, что для четного ρ = 2n плотность равна   n−1  2  4n−1 x πx , x 2 pX (x) = cosech +j , (23.79) 2 2 2θ

(2n − 1)!2θ

j=1



а для нечетных ρ = 2 + 1  2n−1  n  2    2 x πx , x 1 2 sech + j− . pX (x) = 2 (2n)!θ



j=1



2

(23.80)

134

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Fisk (1962) показал, что распределение Парето (гл. 20) можно рассматривать как одно из распределений, связанных с логистическим распределением для  некоторых экстремальных значений случайных величин. Подстановка  eY =

T t0

n

в (23.9) при n > 0, t0 > 0 дает:  n

Pr[T < t] = Pr

T t0

 n 
t] = t0

t0

и, в первом приближении, Pr[T > t] ∝ t−n . ∞ Пусть {Dj }j=1 — последовательность независимых случайных величин, имеющих двойное показательное распределение (гл. 24) с плотностью pDj (d) =

j −j|d| e , −∞ < d < ∞, 2

j = 1, 2, . . . .

$∞ Тогда j=1 Dj имеет стандартное логистическое распределение с плотностью (23.8). Так как разность двух независимых показательно распределенных случайных величин с $ одинаковым параметром имеет двойное показа ∞ тельное распределение, то j=1 E1j − E2j имеет стандартное логистическое распределение (23.8); здесь Eij — независимые случайные величины, имеющие показательное распределение с плотностью pEij (x) = je−jx ,

x  0,

j = 1, 2, . . . ,

i = 1, 2.

Приведенные два представления заодно показывают, что логистическое распределение является безгранично делимым. Galambos and Kotz (1979) обнаружили интересное характеризационное свойство, касающееся показательного и логистического распределений. Пусть X — непрерывная случайная величина с функцией распределения GX (x) симметричной относительно нуля. Условие GX (x) = FY (λ x), где F(·) — стандартная логистическая функция распределения (23.9), является необходимым и достаточным для выполнения равенства Pr[X > −x|X < x] = 1 − e−λ x ,

x > 0.

Baringhaus (1980) вывел характеризационное свойство, связывающее геометрическое и логистическое распределения: пусть Z1 , Z2 , . . . — независимые одинаково распределенные величины с ненулевой функцией распределения G(z) и пусть N — положительная целочисленная случайная величина, не зависящая от последовательности Z1 , Z2 , . . . , и ρ — производящая функция N. Пусть, далее, G(z) симметрична относительно нуля, γ — действительная функция аргумента θ ∈ (0, 1). Равенство ρ (θ G(z)) = G (z + γ (θ )) , ρ (θ )

−∞ < z < ∞,

135

11. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С ЛОГИСТИЧЕСКИМ

имеет место тогда и только тогда, когда G(z) = FY (az) для некоторого a > 0, F(·) — стандартная логистическая функция распределения (23.9), ρ — производящая функция геометрического распределения. Позже Voorn (1987) обобщил этот результат. Balakrishnan (1985) рассмотрел логистическое распределение, суженное на положительную полуось и названное им полулогистическим. Соответствующая плотность равна pX (x) = 

2e−x 1 + e−x

2 ,

x  0,

(23.81)

а функция распределения — FX (x) =

1 − e−x , 1 + e−x

x  0.

(23.82)

В той же работе Balakrishnan (1985) предложил использовать это распределение как модель распределения времени жизни. Там же выведены рекуррентные соотношения для моментов и моментов произведений порядковых статистик. Balakrishnan and Puthenpura (1986) получили наилучшие линейные несмещенные оценки параметров сдвига и масштаба двухпараметрического полулогистического распределения и составили соответствующие таблицы. Balakrishnan and Wong (1991), рассмотрев цензурированные по типу II выборки, нашли приближенные выражения оценок максимального правдоподобия для обоих параметров. В статье Balakrishnan and Chan (1992) рассмотрено полулогистичекое распределение с параметром масштаба и приведено сравнение различных методов оценки параметра масштаба. По аналогии с обобщенным логистическим распределением (23.69) Balakrishnan and Sandhu (1994c) определили обобщенное полулогистическое распределение функцией распределения 1 − (1 − kx)1/k

FX (x) =

1 + (1 − kx)1/k

,

0x

1 , k

k > 0.

(23.83)

Его плотность равна −1

2(1 − kx)(1/k)

pX (x) = 

1 + (1 − kx)1/k

2 ,

0x

1 , k

k > 0.

(23.84)

Это семейство включает полулогистическое распределение (23.82), получающееся при k → 0. Balakrishnan and Sandhu (1994c) рассмотрели различные свойства этого распределения и вывели рекуррентные соотношения для моментов и моментов произведений порядковых статистик; результаты обобщают формулы статьи Balakrishnan (1985). В дальнейшем исследование было продолжено в работе Balakrishnan and Sandhu (1994d), где рассмотрен случай усеченного варианта распределения (23.84) с плотностью p(x) =

2(1 − kx)(1/k)−1 2 ,  P 1 + (1 − kx)1/k

0  x  P1 ,

k > 0,

136

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

где 1 − P (0 < P  1) — пропорция усечения справа обобщенной полулоги   1−P k 1 стической плотности (23.84), а P1 = 1− . k

1+p

Подобно преобразованию нормальных распределений (см. гл. 12, п. 4.3) Tadikamalla and Johnson (1982a) ввели три типа распределения, связанные с логистическим. Пусть Y имеет распределение (23.8). Рассматриваются следующие три представления: Y = γ + δ log X, X > 0 (система LL ) ,   X , 0 < X < 1 (система LB ) , Y = γ + δ log

(23.85)

Y = γ + δ sh−1 X,

(23.87)

1−X

−∞ < X < ∞

(система LU ) .

(23.86)

Семейство распределений случайных величин X, определенное равенством (23.85) называют логарифмически логистическим, или, короче, логлогистическим распределением; оно впервые изучалось в работе Shah and Dave (1963). Плотность этого распределения равна pX (x) = 

δ eγ xδ −1 2 , 1 + eγ xδ

x  0,

δ > 0.

(23.88)

Оно принадлежит семейству Берра (Burr) типа XII (см. гл. 12, п. 4.5). Dubey (1966) назвал его экспоненциальным распределением Вейбулла (Вейбулл-экспоненциальным) и применил для сглаживания данных о разорениях в деловой сфере. Плотность (23.88) унимодальна; при δ  1 мода x = 0 (зер  1/δ δ −1 . e−δ кально отраженная J форма), а при δ > 1 мода равна x = δ +1 Функция распределения равна FX (x) =

1 −γ −δ

1+e

x

,

x  0,

δ > 0.

Начальный момент порядка r дается формулой

rπ rπ E X r = e−rγ /δ cosec , r = 1, 2, . . . . δ

δ

(23.89)

(23.90)

Johnson and Tadikamalla (1992) рассмотрели варианты применения четырехпараметрического логарифмически логистического распределения. Shoukri, Mian and Tracy (1988) изучили взвешенные оценки методом моментов трехпараметрического распределения и сравнили с оценками максимального правдоподобия. Наилучшие линейные несмещенные оценки параметров сдвига и масштаба при известном значении параметра δ , т. е. параметра формы, выведены в статье Balakrishnan, Malik and Puthenpura (1987). Приближенные формулы для наилучших линейных несмещенных оценок параметров сдвига и масштаба по полной выборке, а также по выборке, цензурированной справа и по выборке, цензурированной с двух сторон по типу II, приведены в статье Ragab and Green (1987). Ali and Khan (1987) и Balakrishnan and Malik (1987) вывели рекуррентные соотношения для моментов и моментов произведений порядковых статистик по полной и по цензурированной выборке из лог-логистического распределения.

137

11. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С ЛОГИСТИЧЕСКИМ

Плотность распределения X в представлении LB -системы преобразований (23.86) равна pX (x) = eγ 

xδ −1 (1 − x)δ −1 2 , (1 − x)δ + eγ xδ

0 < x < 1.

(23.91)

Плотность унимодальна при δ > 1, а при δ < 1 имеет единственную антимоду; соответствующие значения x ∈ (0, 1) удовлетворяют уравнению   δ − 1 + 2x 1 − x δ eγ = . δ + 1 − 2x

x

δ При δ > 1 мода x ≶ 1/2 в соответствии с неравенством γ ≶ 0. Если  1−δ плотность имеет U-образную форму с антимодой в интервале 2   1 1+δ при γ > 0. Функция распределения равна при γ < 0 и в , 2

< 1,  ,

1 2

2

1

0 < x < 1.

(23.92)

1  −r

r E X = du 1 + eγ /δ (1 − u)1/δ u−1/δ

(23.93)

FX (x) =

−γ

1+e



x/(1 − x)

−δ ,

Начальный момент порядка r равен

0

и требует при вычислении применения численного интегрирования. Johnson and Tadikamalla (1992) рассмотрели методы подгонки этого семейства распределений. Плотность случайной величины X, соответствующей LU -системе преобразований (23.87), дается формулой pX (x) = √

γ

δe

x2 + 1

·

 √ δ x + x2 + 1

 √ δ 2 , 2 1+e x+ x +1

−∞ < x < ∞;

(23.94)

γ

функция распределения равна Fx (x) =

1 −γ −sh−1 x

1+e

,

−∞ < x < ∞.

(23.95)

Плотность (23.94) унимодальна, и мода x удовлетворяет уравнению   √  x δ 1 − eγ x + x2 + 1 = √ . x2 + 1

Начальные моменты при r < δ записываются в виде суммы:   r

1  r −(r−2i)γ /δ π π E Xr = r (−1)i (r − 2i) · cosec(r − 2i) . e i 2 δ δ

(23.96)

i=0

Если r  δ , то E [X r ] бесконечно. Tadikamalla " and Johnson (1986b) составили таблицы δ и γ /δ , соответствующие значениям β1 (X) и β2 (X) при различных

138

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

РИС. 23.2. Области плоскости (β1 , β2 ), соответствующие семействам распределений LU , LL и LB

значениях среднего и стандартного отклонения случайной величины X. За подробностями мы отсылаем к работе Johnson and Tadikamalla (1992). Области (β1 , β2 ), соответствующие каждому из трех преобразований логистического распределения, показаны на рис. 23.2. Shah (1963) рассмотрел смеси двух логистических распределений. За подробностями мы вновь отсылаем читателя к книге Balakrishnan (1992).

Список литературы Aguirre, N., and Nikulin, M. (1993). Chi-squared goodness-of-fit test for the family of logistic distributions, Report, Institute of Stochastics, University of Bordeaux, France. Ahmed, A. N., and Abdul-Rahman, A. A. (1993). On characterization of the normal, one sided normal, lognormal and logistic distributions via conditional expectations, Pakistan Journal of Statistics, Series B, 9, 19–30. Ahuja, J. C., and Nash, S. W. (1967). The generalized Gompertz-Verhulst family of distributions, Sankhy¯a, Series A, 29, 141–156.

СПИСОК ЛИТЕРАТУРЫ

139

Aitchison, J., and Shen, S. M. (1980). Logistic-normal distributions: Some properties and uses, Biometrika, 67, 261–272. Ali, M. Masoom, and Khan, A. H. (1987). On order statistics from the log-logistic distribution, Journal of Statistical Planning and Inference, 17, 103–108. Ali, M. Masoom, and Umbach, D. (1989). Estimation of quantiles of symmetrically truncated logistic distribution using a few optimally selected order statistics, Journal of Information and Optimization Sciences, 10, 303–307. Anderson, J. A. (1972).Separate sample logistic discrimination, Biometrika, 59, 19–35. Anderson, J. A. (1973). Logistic discrimination with medical applications, In Discriminant Analysis and Applications (ed., T. Cacoullos), San Diego, CA: Academic Press, pp. 1–15. Anderson, J. A. (1974). Diagnosis by logistic discriminant function: Further practical problems and results, Applied Statistics, 23, 397–404. Antle, C. E., Klimko, L., and Harkness, W. (1970). Confidence intervals for the parameters of the logistic distribution, Biometrika, 57, 397–402. Bain, L. J., Balakrishnan, N., Eastman, J. A., Engelhardt, M., and Antle, C. E. (1992). Reliability estimation based on MLEs for complete and censored samples, Chapter 5 of Balakrishnan, N. (1992). Balakrishnan, N. (1985). Order statistics from the half logistic distribution, Journal of Statistical Computation and Simulation, 20, 287–309. Balakrishnan, N. (1991). Best linear unbiased estimates of the location and scale parameters of logistic distribution for complete and censored samples of sizes 2(1)25(5)40, Report, McMaster University, Hamilton, Ontario, Canada. Balakrishnan, N. (ed.) (1992). Handbook of the Logistic Distribution, New York: Dekker. Balakrishnan, N., Ahsanullah, M., and Chan, P. S. (1994). On logistic record values and associated inference, Journal of Applied Statistical Science (to appear). Balakrishnan, N., and Chan, P. S. (1992). Estimation for the scaled half logistic distribution under Type II censoring. Computational Statistics & Data Analysis, 13, 123–141. Balakrishnan, N., Chan, P. S., Ho, K. L., and Lo, K. K. (1991). Means, variances and covariances of logistic order statistics in the presence of an outlier, Report, McMaster University, Hamilton, Ontario, Canada. Balakrishnan, N., and Fung, K. Y. (1992). Tolerance limits and sampling plans based on censored samples, Chapter 14 of Balakrishnan, N. (1992). Balakrishnan, N., and Joshi, P. C. (1983a). Single and product moments of order statistics from symmetrically truncated logistic distribution, Demonstratio Mathematica, 16, 833–841. Balakrishnan, N., and Joshi, P. C. (1983b). Means, variances, and covariances of order statistics from symmetrically truncated logistic distribution, Journal of Statistical Research, 17, 56–61. Balakrishnan, N., and Kocherlakota, S. (1986). On the moments of order statistics from the doubly truncated logistic distribution, Journal of Statistical Planning and Inference, 13, 117–129. Balakrishnan, N., and Leung, M. Y. (1988a). Order statistics from the Type I generalized logistic distribution, Communications in Statistics— Simulation and Computation, 17, 25–50. Balakrishnan, N., and Leung, M. Y. (1988b). Means, variances and covariances of order statistics, BLUE’s for the Type I generalized logistic distribution, and some applications. Communications in Statistics— Simulation and Computation, 17, 51–84. Balakrishnan, N., and Malik, H. J. (1987). Moments of order statistics from truncated log-logistic distribution. Journal of Statistical Planning and Inference, 17, 251–267.

140

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Balakrishnan, N., and Malik, H. J. (1994). Means, variances and covariances of logistic order statistics for sample sizes up to fifty, Selected Tables in Mathematical Statistics (to appear). Balakrishnan, N., Malik, H. J., and Puthenpura, S. (1987). Best linear unbiased estimation of location and scale parameters of the log-logistic distribution, Communications in Statistics— Theory and Methods, 16, 3477–3495. Balakrishnan, N., and Puthenpura, S. (1986). Best linear unbiased estimators of location and scale parameters of the half logistic distribution, Journal of Statistical Computation and Simulation, 25, 193–204. Balakrishnan, N., and Sandhu, R. A. (1994a). Recurrence relations for single and product moments of order statistics from a generalized logistic distribution, Report, McMaster University, Hamilton, Canada. Balakrishnan, N., and Sandhu, R. A. (1994b). Relationships for moments of order statistics from a truncated generalized logistic distribution, Report, McMaster University, Hamilton, Canada. Balakrishnan, N., and Sandhu, R. A. (1994c). Order statistics from a generalized half logistic distribution, Report, McMaster University, Hamilton, Canada. Balakrishnan, N., and Sandhu, R. A. (1994d). Recurrence relations for single and product moments of order statistics from a truncated generalized half logistic distribution, Report, McMaster University, Hamilton, Canada. Balakrishnan, N., and Wong, K. H. T. (1991). Approximate MLEs for the location and scale parameters of the half-logistic distribution under Type-II right-censoring, IEEE Transactions on Reliability, 40, 140–145. Baringhaus, L. (1980). Eine simultane Charakterisierung der geometrischen Verteilung und der logistchen Verteilung, Metrika, 27, 237–242. Baten, W. D. (1934). The probability law for the sum of n independent variables, each subject to the law (1/(2h))sech(π x/(2h)), Bulletin of the American Mathematical Society, 40, 284–290. Begg, C. B., and Gray, R. (1984). Calculation of polychotomous logistic regression parameters using individualized regressions, Biometrika, 71, 11–18. Berkson, J. (1944). Application of the logistic function to bio-assay, Journal of the American Statistical Association, 39, 357–365. Berkson, J. (1951). Why I prefer logits to probits, Biometrics, 1, 327–339. Berkson, J. (1953). A statistically precise and relatively simple method of estimating the bio-assay and quantal response, based on the logistic function, Journal of the American Statistical Association, 48, 565–599. Berkson, J. (1955). Maximum likelihood and minimum χ 2 estimates of the logistic function, Journal of the American Statistical Association, 50, 130–162. Berkson, J. (1957). Tables for the maximum likelihood estimates of the logistic function, Biometrics, 13, 28–34. Birnbaum, A., and Dudman, J. (1963). Logistic order statistics, Annals of Mathematical Statistics, 34, 658–663. Blom, G. (1956). On linear estimates with nearly minimum variances, Arkiv f¨or Matematik, 3, 365–369. Blom, G. (1958). Statistical Estimates and Transformed Beta Variables, New York: Wiley. Bonney, G. E. (1986). Regressive logistic models for familial disease and other binary traits, Biometrics, 42, 611–625. Bowman, K. O., and Shenton, L. R. (1981). Explicit accurate approximations for fitting the parameters of LU , In Statistical Distributions in Scientific Work, vol. 5 (eds., C. Taillie, G. P. Patil, and B. A. Baldessari), Dordrecht: Reidel, pp. 231–240.

СПИСОК ЛИТЕРАТУРЫ

141

Braswell, R. N., and Manders, C. F.-M. (1970a). A new finite range probability distribution function (FRPDF) with parameters-Nomogram and tables, Reports in Statistical Applied Research, JUSE, 17, 67–76. Braswell, R. N., and Manders, C. F.-M. (1970b). On testing and application of a new finite range probability distribution function, Reports in Statistical Applied Research, JUSE, 17, 77–83. Braswell, R. N., and Pewitt, T. C. (1973). Generalizations of the finite range probability distribution function of Braswell and Manders, Reports in Statistical Applied Research, JUSE, 20, 18–28. Breslow, N., and Powers, W. (1978). Are there two logistic regressions for retrospective studies? Biometrics, 34, 100–105. Chan, L. K. (1969). Linear quantile estimates of the location and scale parameters of the logistic distribution, Statistische Hefte, 10, 277–282. Chan, L. K., Chan, N. N., and Mead, E. R. (1971). Best linear unbiased estimates of the parameters of the logistic distribution based on selected order statistics, Journal of the American Statistical Association, 66, 889–892. Chan, L. K., Chan, N. N., and Mead, E. R. (1973). Tables for the best linear unbiased estimate based on selected order statistics from the normal, logistic, Cauchy and double exponential distributions. Mathematics of Computation, 27, 445–446. Chan, L. K., and Cheng, S. W. (1972). Optimum spacing for the asymptotically best linear estimate of the location parameter of the logistic distribution when samples are complete or censored, Statistische Hefte, 13, 41–57. Chan, L. K., and Cheng, S. W. (1974). An algorithm for determining the asymptotically best linear estimate of the mean from multiply censored logistic data, Journal of the American Statistical Association, 69, 1027–1030. Chen, G., and Balakrishnan, N. (1994). The infeasibility of probability weighted moments estimation of some generalized distributions, In Recent Adrances in Life-testing and Reliability (ed., N. Balakrishnan), Boca Raton, FL: CRC Press, pp. 565–573. Cheng, S. W. (1975). A unified approach to choosing optimum quantiles for the ABLE’s, Journal of the American Statistical Association, 70, 155–159. Cheng, S. W. (1992). Linear estimation based on selected order statistics, Section 4.3 of Balakrishnan, N. (1992). Chew, V. (1968). Some useful alternatives to the normal distribution, The American Statistician, 22, 22–24. Cox, D. R. (1966). Some procedures connected with the logistic qualitative response curve, In Research Papers in Statistics (ed., F. N. David), New York: Wiley, pp. 55–71. Cutler, C. D. (1992). kth nearest neighbors and the generalized logistic distribution, Section 18.2 of Balakrishnan, N. (1992). D’Agostino, R. B., and Massaro, J. M. (1992). Goodness-of-fit tests, Chapter 13 of Balakrishnan, N. (1992). D’Agostino, R. B., and Stephens, M. A. (eds.) (1986). Goodness-of-fit Techniques, New York: Dekker. Davidson, R. R. (1980). Some properties of a family of generalized logistic distributions, In Statistical Climatology, Developments in Atmospheric Science, vol. 13 (eds., S. Ikeda et al.), Amsterdam: Elsevier. Day, N. E., and Kerridge, D. F. (1967). A general maximum likelihood discriminant, Biometrics, 23, 313–323. Downton, F. (1966). Linear estimates with polynomial coefficients, Biometrika, 53, 129–141. Dubey, S. D. (1966). Transformation for estimation of parameters, Journal of the Indian Statistical Association, 4, 109–124.

142

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Dubey, S. D. (1969). A new derivation of the logistic distribution, Natal Research Logistics Quarterly, 16, 37–40. Dyke, G. V., and Patterson, H. D. (1952). Analysis of factorial arrangements when the data are proportions, Biometrics, 8, 1–12. Erkelens, J. (1968). A method of calculation for the logistic curve, Statistica Neerlandica, 22, 213–217. (In Dutch.) Farewell, V. T., and Prentice, R. L. (1977). A study of distributional shape in life testing, Technometrics, 19, 69–76. Finney, D. J. (1947). The principles of biological assay, Journal of the Royal Statistical Society, Series B, 9, 46–91. Finney, D. J. (1952). Statistical Method in Biological Assay, New York: Hafner. Fisher, R. A., and Yates, F. (1957). Statistical Tables for Biological, Agricultural and Medical Research, 5th ed., London: Oliver and Boyd; New York: Hafner. Fisk, P. R. (1961a). Estimation of location and scale parameters in a truncated grouped sech square distribution, Journal of the American Statistical Association, 56, 692–702. Fisk, P. R. (1961b). The graduation of income distributions, Econometrica, 29, 171–185. Formann, A. K. (1982). Linear logistic latent class analysis, Biometrical Journal, 24, 171–190. Galambos, J., and Kotz, S. (1978). Characterizations of Probability Distributions, Lecture Notes in Mathematics, No. 675, Berlin: Springer-Verlag. George, E. O., and Devidas, M. (1992). Some related distributions, Chapter 10 of Balakrishnan, N. (1992). George, E. O., El-Saidi, M., and Singh, K. (1986). A generalized logistic approximation of the Student t distribution, Communications in Statistics— Simulation and Computation, 15, 1199–1208. George, E. O., and Mudholkar, G. S. (1981a). A characterization of the logistic distribution by sample median, Annals of the Institute of Statistical Mathematics, 33, 125–129. George, E. O., and Mudholkar, G. S. (1981b). Some relationships between the logistic and the exponential distributions, In Statistical Distributions in Scientific Work, vol. 4, (eds., C. Taillie, G. P. Patil, and B. A. Baldessari), Dordrecht: Reidel, pp. 401–409. George, E. O., and Mudholkar, G. S. (1982). On the logistic and exponential laws, Sankhy¯a, Series A, 44, 291–293. George, E. O., and Mudholkar, G. S. (1983). On the convolution of logistic random variables, Metrika, 30, 1–13. George, E. O., and Ojo, M. O. (1980). On a generalization of the logistic distribution, Annals of the Institute of Statistical Mathematics, 32, 161–169. George, E. O., and Rousseau, C. C. (1987). On the logistic midrange, Annals of the Institute of Statistical Mathematics, 39, 627–635. George, E. O., and Singh, K. (1987). An approximation of F distribution by binomial probabilities, Statistics & Probability Letters, 5, 169–173. Gerstenkorn, T. (1992). Estimation of a parameter of the logistic distribution, Transactions of the Eleventh Prague Conference on Information Theory, Statistical Decision Functions, Random Proesses, Prague: Academia Publishing House of the Czechoslovak Academy of Sciences, pp. 441–448. Glasbey, C. A. (1979). Correlated residuals in non-linear regression applied to growth data, Applied Statistics, 28, 251–259. Goel, P. K. (1975). On the distribution of standardized mean of samples from the logistic population, Sankhy¯a, Series B, 36, 165–172. Greenland, S. (1985). An application of logistic models to the analysis of ordinal responses, Biometrical Journal, 27, 189–197.

СПИСОК ЛИТЕРАТУРЫ

143

Grizzle, J. E. (1961). A new method for testing hypotheses and estimating parameters for the logistic model, Biometrics, 17, 372–385. Gumbel, E. J. (1944). Ranges and midranges, Annals of Mathematical Statistics, 15, 414–422. Gumbel, E. J. (1958). Statistics of Extremes, New York: Columbia University Press 1) . Gumbel, E. J. (1961). Bivariate logistic distributions, Journal of the American Statistical Association, 56, 335–349. Gumbel, E. J., and Keeney, R. D. (1950). The extremal quotient, Annals of Mathematical Statistics, 21, 523–538. Gumbel, E. J., and Pickands, J. (1967). Probability tables for the extreme quotient, Annals of Mathematical Statistics, 38, 1441–1451. Gupta, S. S., and Balakrishnan, N. (1992). Logistic order statistics and their properties, Chapter 2 of Balakrishnan, N. (1992). Gupta, S. S., and Gnanadesikan, M. (1966). Estimation of the parameters of the logistic distribution, Biometrika, 53, 565–570. Gupta, S. S., and Han, S. (1992). Selection and ranking procedures for logistic populations, In Order Statistics and Nonparametrics: Theory and Applications (eds., P. K. Sen and I. A. Salama), Amsterdam: Elsevier, pp. 377–404. Gupta, S. S., Oureishi, A. S„ and Shah, B. K. (1967). Best linear unbiased estimators of the parameters of the logistic distribution using order statistics, Technometrics, 9, 43–56. Gupta, S. S., and Shah, B. K. (1965). Exact moments and percentage points of the order statistics and the distribution of the range from the logistic distribution, Annals of Mathematical Statistics, 36, 907–920. Gupta, S. S., and Waknis, M. N. (1965). Estimation of the parameters of the logistic distribution, Technical Report No. 15, Department of Statistics, Purdue University, West Lafayette, IN. Hall, I. J. (1975). One-sided tolerance limits for a logistic distribution based on censored samples. Biometrics, 31, 873–879. Harkness, W. L., and Harkness, M. L. (1968). Generalized hyperbolic secant distributions, Journal of the American Statistical Association, 63, 329–337. Harter, H. L. (1970). Order Statistics and Their Use in Testing and Estimation, vol. 2, Washington, DC: GPO. Harter, H. L., and Moore, A. H. (1967). Maximum-likelihood estimation, from censored samples, of the parameters of a logistic distribution, Journal of the American Statistical Association, 62, 675–683. Hassanein, K. M. (1969). Estimation of the parameters of the logistic distribution by sample quantiles, Biometrika, 56, 684–687. Hassanein, K. M. (1974). Linear estimation of the parameters of the logistic distribution by selected order statistics for very large samples, Statistische Hefte, 15, 65–70. Hassanein, K. M., and Sebaugh, J. L. (1973). Estimation of the parameters of the logistic distribution from grouped samples, Skandinavisk Aktuarietidskrift, 56, 1–10. Hirschman, I. I., and Widder, D. V. (1955). The Convolution Transform, Princeton, NJ: Princeton University Press. Hosking, J. R. M. (1986). The theory of probability weighted moments, IBM Research Report PC12210.

1) Хальд

лит., 1956.

А. Математическая статистика с техническими приложениями. — М.: Изд. иностр.

144

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Hosking, J. R. M. (1990). L-moments: Analysis and estimation of distributions using linear combinations of order statistics, Journal of the Royal Statistical Society, Series B, 52, 105–124. Howlader, H. A., and Weiss, G. (1989). Bayes estimators of the reliability of the logistic distribution, Communications in Statistics— Theory and Methods, 18, 245–259. Iqbal, M. (1993). Asymptotic expansions for confidence limits for the parameters of the logistic distribution, Pakistan Journal of Statistics, Series A, 9, 63–73. Johnson, N. L., and Tadikamalla, P. R. (1992). Translated families of distributions, Chapter 8 of Balakrishnan, N. (1992). Johnson, W. (1985). Influence measures for logistic regression: Another point of view, Biometrika, 72, 59–65. Jung, J. (1956). On linear estimates defined by a continuous weight function, Arkiv f¨or Matematik, 3, 199–209. Kalbfleisch, J. D., and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data, New York: Wiley. Kamps, U. (1991). A general recurrence relation for moments of order statistics in a class of probability distributions and characterizations, Metrika, 38, 215–225. Kamps, U., and Mattner, L. (1993). An identity for expectations of functions of order statistics, Metrika, 40, 361–365. Kay, R., and Little, S. (1986). Assessing the fit of the logistic model: A case study of children with Haemolytic Uraemic Syndrome, Applied Statistics, 35, 16–30. Kjelsberg, M. O. (1962). Estimation of the parameters of the logistic distribution under truncation and censoring, Ph. D. dissertation, University of Minnesota, Minneapolis. Kneale, G. W. (1971). Problems arising in estimating from retrospective study data the latent period of juvenile cancers initiated by obstetric radiography, Biometrics, 27, 563–590. Kong, F., and Fei, H. (1994). Limit theorem for the maximum likelihood estimators under multiple Type II censoring, Communications in Statistics— Theory and Methods (to appear). Lawless, J. F. (1972). Conditional confidence interval procedures for the location and scale parameters of the Cauchy and logistic distributions, Biometrika, 59, 377–386. Leach, D. (1981). Re-evaluation of the logistic curve for human populations, Journal of the Royal Statistical Society, Series A, 144, 94–103. Lord, F. M. (1965). A note on the normal ogive or logistic curve in item analysis, Psychometrika, 30, 371–372. Malik, H. J. (1980). Exact formula for the cumulative distribution function of the quasi-range from the logistic distribution, Communications in Statistics— Theory and Methods, 9, 1527–1534. McCullagh, P. (1977). A logistic model for paired comparisons with ordered categorical data, Biometrika, 64, 449–453. McDonald, J. B. (1991). Parametric models for partially adaptive estimation with skewed and leptokurtic residuals, Economics Letters, 37, 273–278. Mudholkar, G. S., and George, E. O. (1978). A remark on the shape of the logistic distribution, Biometrika, 65, 667–668. Ogawa, J. (1951). Contributions to the theory of systematic statistics, I, Osaka Journal of Mathematics, 3, 175–213. Oliver, F. R. (1964). Methods of estimating the logistic growth function, Applied Statistics, 13, 57–66. Oliver, F. R. (1969). Another generalisation of the logistic growth function, Econometrica, 37, 144–147.

СПИСОК ЛИТЕРАТУРЫ

145

Oliver, F. R. (1982). Notes on the logistic curve for human populations, Journal of the Royal Statistical Society, Series A, 145, 359–363. Owen, D. B. (1962). Handbook of Statistical Tables, Reading, MA: Addison-Wesley 1) . Pearl, R. (1940). Medical Biometry and Statistics, Philadelphia: Saunders. Pearl, R„ and Reed, L. J. (1920). On the rate of growth of the population of the United States since 1970 and its mathematical representation, Proceedings of the National Academy of Sciences, 6, 275–288. Pearl, R., and Reed, L. J. (1924). Studies in Human Biology, Baltimore: Williams and Wilkins. Pearl, R., Reed, L. J., and Kish, J. F. (1940). The logistic curve and the census count of 1940. Science, 92, 486–488. Perks, W. F. (1932). On some experiments in the graduation of mortality statistics, Journal of the Institute of Actuaries, 58, 12–57. Plackett, R. L. (1958). Linear estimation from censored data, Annals of Mathematical Statistics, 29, 131–142. Plackett, R. L. (1959). The analysis of life-test data, Technometrics, 1, 9–19. Prentice, R. L. (1976). A generalization of the probit and logit methods for dose response curves, Biometrics, 32, 761–768. Ragab, A., and Green, J. (1987). Estimation of the parameters of the log-logistic distribution based on order statistics, American Journal of Mathematical and Management Sciences, 7, 307–323. Raghunandanan, K., and Srinivasan, R. (1970). Simplified estimation of parameters in a logistic distribution, Biometrika, 57, 677–678. Rasor, E. A. (1949). The fitting of logistic curves by means of a nomograph, Journal of the American Statistical Association, 44, 548–553. Reed, L. J., and Berkson, J. (1929). The application of the logistic function to experimental data, Journal of Physical Chemistry, 33, 760–779. Reiersøl, O. (1961). Linear and non-linear multiple comparisons in logit analysis, Biometrika, 48, 359–365. Saleh, A. K. Md. E., Hassanein, K. M., and Ali, M. Masoom (1992). Estimation of quantiles using selected order statistics, Section 4.4 of Balakrishnan, N. (1992). Sanathanan, L. (1974). Some properties of the logistic model for dichotomous response, Journal of the American Statistical Association, 69, 744–749. Schafer, R. E., and Sheffield, T. S. (1973). Inferences on the parameters of the logistic distribution, Biometrics, 29, 445–455. Schocnbcrg, I. J. (1953). On P´olya frequency functions and their Laplace transformations, Journal d’Analyse Mathematique, 1, 331–374. Schultz, H. (1930). The standard error of a forecast from a curve, Journal of the American Statistical Association, 25, 139–185. Shah, B. K. (1963). A note on method of moments applied to a mixture of two logistic populations, Journal of the M. S. University of Baroda (Science Number), 12, 21–22. Shah, B. K. (1965). Distribution of midrange and semirange from logistic population, Journal of the Indian Statistical Association, 3, 185–188. Shah, B. K. (1966). On the bivariate moments of order statistics from a logistic distribution, Annals of Mathematical Statistics, 37, 1002–1010. Shah, B. K. (1970). Note on moments of a logistic order statistics, Annals of Mathematical Statistics, 41, 2151–2152. Shah, B. K., and Dave, P. H. (1963). A note on log-logistic distribution. Journal of the M. S. University of Baroda (Science Number), 12, 15–20. 1) Оуэн

Д. Сборник статистических таблиц. — М.: АН СССР, 1966. — 568 с.

146

ГЛАВА 23. ЛОГИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ

Shoukri, M. M., Mian, I. U. H., and Tracy, D. S. (1988). Sampling properties of estimates of the log-logistic distribution, with application to Canadian precipitation data, Canadian Journal of Statistics, 16, 223–226. Silverstone, H. (1957). Estimating the logistic curve, Journal of the American Statistical Association, 52, 567–577. Simpson, J. S. (1967). Simultaneous linear estimation of the mean and standard deviation of the normal and logistic distributions by the use of selected order statistics from doubly censored samples, M. Sc. thesis, Air Force Institute of Technology, Wright-Patterson Air Force Base, OH. Tadikamalla, P. R., and Johnson, N. L. (1982a). Systems of frequency curves generated by transformation of logistic variables, Biometrika, 69, 461–465. Tadikamalla, P. R., and Johnson, N. L. (1982b). Tables to facilitate fitting LU distribution, Communications in Statistics— Simulation and Computation, 11, 249–271. Talacko, J. (1956). Perks’ distributions and their role in the theory of Wiener’s stochastic variables, Trabajos de Estadistica, 7, 159–174. Tarter, M. E. (1965). Order statistics moment and product moment relationships for the truncated logistic and other distributions, Manuscript, University of Michigan, Ann Arbor. Tarter, M. E. (1966). Exact moments and product moments of the order statistics from the truncated logistic distribution, Journal of the American Statistical Association, 61, 514–525. Tarter, M. E., and Clark, V. A. (1965). Properties of the median and other order statistics of logistic variates, Annals of Mathematical Statistics, 36, 1779–1786. Tiku, M. L. (1968). Estimating the parameters of normal and logistic distributions from censored samples, Australian Journal of Statistics, 10, 64–74. Tsokos, C. P., and DiCroce, P. S. (1992). Applications in health and social sciences, Chapter 17 of Balakrishnan, N. (1992). Verhulst, P. J. (1838). Notice sur la loi que la population suit dans sons accroissement, Corr. Math. et Physique, 10, 113–121. Verhulst, P. J. (1845). Recherches math´ematiques sur la loi d’accroissement de la population, Acad´emie de Bruxelles, 18, 1–38. Vieira, S., and Hoffmann, R. (1977). Comparison of the logistic and the Gompertz growth function considering additive and multiplicative error terms, Applied Statistics, 26, 143–148. Volodin, N. (1994). Personal communication. Voorn, W. J. (1987). Characterization of the logistic and log-logistic distributions by extreme value related stability with random sample sizes, Journal of Applied Probability, 24, 838–851. Wijesinha, A., Begg, C. B., Funkenstein, H. H„ and McNeil, B. J. (1983). Methodology for the differential diagnosis of a complex data set: A case study using data from routine CT-scan examinations, Medical Decision Making, 3, 133–154. Zelterman, D. (1987a). Parameter estimation in the generalized logistic distribution, Computational Statistics & Data Analysis, 5, 177–184. Zelterman, D. (1987b). Estimation of percentage points by simulation, Computational Statistics & Data Analysis, 5, 107–125. Zelterman, D. (1989). Order statistics of the generalized logistic distribution. Computational Statistics & Data Analysis, 7, 69–77. Zelterman, D. and Balakrishnan, N. (1992). Univariate generalized distributions, Chapter 9 of Balakrishnan, N. (1992).

ГЛАВА 24

Распределение Лапласа (двойное показательное распределение) 1.

Определения, происхождение и исторические замечания

Двойное экспоненциальное или показательное распределение введено Лапласом [Pierre Laplace (1774)] как распределение, для которого максимум функции правдоподобия достигается при значении параметра сдвига, равном медиане наблюденных значений в случае нечетного числа независимых одинаково распределенных случайных наблюдений. Этот факт и описание распределения, упоминаемого часто как первый закон Лапласа, приведен в фундаментальной статье Лапласа, посвященной применению симметричных распределений к описанию ошибок измерений. Плотность распределения Лапласа определяется формулой pX (x) =

1 −|x−θ |/φ e , 2φ

−∞ < x < ∞,

φ > 0.

(24.1)

Такая же плотность получается как плотность разности двух независимых случайных величин, одинаково распределенных по экспоненциальному закону. В той же статье Laplace (1774) приводит следующий факт. Если потребовать, чтобы максимум функции правдоподобия достигался не в медиане, а в точке, совпадающей со средним арифметическим, то приходим к нормальному распределению (гл. 13). Этот результат называют вторым законом Лапласа. Stigler (1975) описывает в хронологическом порядке существенные результаты, полученные Лапласом, и влияние их на развитие теории вероятностей. Распределение Лапласа (24.1) называют по разному. Один из наиболее распространенных терминов — двойное показательное (или экспоненциальное) распределение. Такое название иногда применяли к распределению экстремальных значений (см. гл. 22). В настоящее время терминологическое отличие в том, что распределение Лапласа называют двойным показательным распределением, а распределение экстремальных значений — дважды экспоненциальным. Greenwood, Olkin and Savage (1962) называют распределение Лапласа показательным распределением с двумя хвостами. Феллер [Feller(1966)] использует термин двустороннее показательное распределение; Weida (1935) упоминает это распределение как первый закон ошибок Пуассона. Yellott (1977) нашел хорошо объяснимое отношение между аксиомой выбора Люса (Luce), теорией Тэрстоуна (Thurstone) сравнительных выво147

148

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

дов и двойным экспоненциальным распределением. В книге Ord (1983) содержится небольшой обзор наиболее важных исследований этого распределения.

2.

Моменты, производящие функции и свойства

Стандартная форма плотности получается из (24.1) при θ = 0 и φ = 1: pX (x) =

1 −|x| e . 2

(24.2)

Такую плотность иногда называют первым законом ошибок Пуассона. Характеристическая функция этой плотности равна −1

1

1 E eitX = (1 + it)−1 + (1 − it)−1 = 1 + t2 . (24.3) 2

2

Интересно отметить, что (24.2) и (24.3) в свою очередь являются характеристической функций и плотностью распределения Коши соответственно (гл. 16). −1

Производящая функция моментов есть 1 − t2 . Производящая функция семиинвариантов равна (24.4) − log(1 − t2 ); отсюда получаем семиинвариант порядка r: 0, если r нечетно, κr (X) = 2(r − 1)!, если r четно. Центральный момент порядка r равен 0, если r нечетно, μr (X) = r!, если r четно.

(24.5)

(24.6)

Takano (1988) рассмотрел представление характеристической функции распределения Лапласа в d-мерном евклидовом пространстве (включая случай d = 1). Распределение (24.2) симметрично относительно нуля. Коэффициенты асимметрии и эксцесса суть " β1 = 0, β2 = 6. (24.7) Равенство β2 = 6 показывает более медленную скорость убывания хвоста распределения по сравнению с нормальным. Среднее отклонение равно

ν1 = E |X| = 1. (24.8) Таким образом, для распределения Лапласа Среднее отклонение 1 = √ ≈ 0.707. Стандартное отклонение 2

(24.9)

149

2. МОМЕНТЫ, ПРОИЗВОДЯЩИЕ ФУНКЦИИ И СВОЙСТВА

РИС. 24.1. Плотность распределения Лапласа

Для более общего распределения с плотностью (24.1) величины (24.7) и отношение средних те же, что и для стандартной√плотности (24.2). Среднее значение и стандартное отклонение равны θ и φ 2 соответственно. Информационная производящая функция равна ∞ (2φ )−u exp {−u|x − φ |/φ } dx = (2φ )1−u u−1 . (24.10) −∞

Энтропия распределения равна 1 + log(2φ ). Плотность (24.1) имеет максимум в точке θ , причем в этой точке плотность имеет точку возврата. Форма плотности показана на рис. 24.1. Функция распределения равна   ⎧1 θ −x , x  θ, ⎨ exp − 2 φ   (24.11) FX (x) = ⎩1 − 1 exp − θ − x , x  θ . φ

2

Верхняя и нижняя квартили равны θ ∓ φ log 2 ≈ θ ∓ 0.693φ . Плотность, записанная в терминах среднего ξ и стандартного отклонения σ имеет вид  √   √ −1 2|x − ξ | exp − . (24.12) pX (x) = σ 2 σ

Верхняя и нижняя квартили суть ξ ∓ σ · 2−1/2 log 2 ≈ ξ ∓ 0.490σ . Для нормального распределения соответствующие значения равны ξ ± 0.674σ . Разность отражает «островершинность» плотности распределения Лапласа. На хвостах распределений разность квантилей имеет обратный знак √ того, что

из-за плотность распределения Лапласа убывает со скоростью exp − 2 |x − ξ |/σ , тогда как нормальная плотность убывает со скоростью  (x − ξ )2 exp − . 2 2σ

Например, верхняя и нижняя 1%-е точки распределения Лапласа суть ξ ± 2.722σ , для нормального распределения эти точки равны ξ ± 2.326σ . Плотность распределения Лапласа (24.2) при θ = 0 совпадает с плотностью разности V1 − V2 независимых одинаково распределенных случайных величин V1 и V2 , имеющих экспоненциальное распределение с параметром φ . Для вычисления значений плотности и функции распределения Лапласа достаточно обычных таблиц показательной функции. Balanda (1987) сравнивает эксцесс распределения Лапласа и распределения Коши. Для распределения Лапласа β2 = 6, а для распределения Коши эксцесс

150

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

бесконечен, и Balanda (1987) делает вывод о неадекватности сравнения распределений по соответствующим моментам, так как они не являются доминирующими характеристиками: плотность распределения Лапласа имеет острый пик, а плотность Коши — тяжелый хвост. Эти свойства отмечают Horn (1983) и Rosenberg and Gasko (1983). Упорядочение по моментам невозможно, так как все моменты распределения Коши бесконечны (см. гл. 16); Balanda (1987) исследует эксцесс, сравнивая эксцессы, упорядоченные вдоль линии, введенной в работе van Zwet (1964). Заметим, что при θ = 0 плотность распределения среднего арифметического X равна  j −nvx  n−1  dn−1 n e (n/φ )e−n|x|/φ  2j (2n − j − 2)!  nx   pX (x) = n = 2n−1 n..    n−1 φ (n − 1)! dv

(1 + φ v)

v=φ −1

2

(n − 1)!

j=0

j!(n − j − 1)!

φ

(24.13) Распределения среднего арифметического и ряда других статистик в случае двойного показательного распределения рассматривали многие авторы. В их числе Hausdorff (1901), Craig (1932), Weida (1935) и Sassa (1968). Плотность распределения среднеарифметического X в форме (24.13) была использована в работе Balakrishnan and Kocherlakota (1986) при исследовании влияния уклонения от нормальности на свойства X — контрольных карт как суммирующих статистик при оценке истинных вероятностей ложной (α ) и справедливой (1 − β ) тревог. В этой работе показано, что не требуется модифицировать контрольные карты для распределения Лапласа, когда α и 1 − β близки к значениям, соответствующим аналогичным для нормального распределения. Sansing (1976) рассмотрел t-статистики в случае распределения Лапласа. Gallo (1979) получил распределение t-статистики и выборочные распределения суммы и суммы модулей случайных величин, имеющих двойное показательное распределение. Dobrogowski (1976) и Findeisen (1982) изучили некоторые другие свойства распределения Лапласа.

3.

Порядковые статистики

Простота явной формулы (24.11) для FX (x) влечет за собой простоту явных формул для порядковых статистик величин, имеющих распределение Лапласа или связанных с ними. Пусть X1  X2  · · ·  Xn — упорядоченная последовательность, соответствующая множеству X1 , X2 , . . . , Xn n независимых случайных величин, имеющих плотность распределения (24.1) (Xr есть r-е по порядку возрастания значение среди X1 , X2 , . . . , Xn ). Тогда плотность распределения Xr есть ⎧     (r+1)(θ −x) ⎪ n! 1 1 −(θ −x)/φ n−r ⎪ при x θ , 1− e · exp − ⎨ (r−1)!(n−r)! 2φ 2 φ   pXr (x)=  r−1 (n−r+1)(x− θ ) ⎪ n! 1 1 −(x−θ )/φ ⎪ · exp − при x θ . 1− e ⎩ (r−1)!(n−r)! 2φ

2

φ

(24.14)

151

3. ПОРЯДКОВЫЕ СТАТИСТИКИ

Момент порядка s относительно θ равен ⎡   n−r 

 n − r −(r+j+1) n!Γ(s + 1) ⎣(−1)s 2 E (Xr − θ )s = φ s (−1)j (r + j)−(s+1) + j (r − 1)!(n − r)! j=0 ⎤   r−1  r − 1 −(n−r+2+j) 2 (−1)j (n − r + 1 + j)−(s+1) ⎦ . (24.15) + j j=0

В частности, если n нечетно, то распределение медианы получится по формуле (24.14) при r = (n + 1)/2. Оно симметрично относительно θ ; математическое ожидание медианы равно θ , дисперсия дается формулой 

(n−1)/2   3   4φ 2 n! n−1 1 (−1)j j! − j ! · 2j+(n+1)/2 (n + 1) + j [(n − 1)/2]! 2 2

−1 . (24.16)

j=0

При любом n математическое ожидание наибольшего из X1 , X2 , . . . , Xn равно ⎡ ⎤   n−1  n − 1 −(j+2) 2 (24.17) (−1)j (j + 1)−2 − 2−(n+1) n−2 ⎦ . E[Xn ] = θ + φ n ⎣ j j=0

Ожидаемое значение наименьшего из X1 , X2 , . . . , Xn по симметрии равно 2θ − E[Xn ], а ожидаемое значение размаха W = Xn − X1 есть ⎡ ⎤   n−1  n − 1 −(j+2) E[W] = 2φ n ⎣ (−1)j (j + 1)−2 − 2−(n+1) n−2 ⎦ = an φ . (24.18) 2 j j=0

Edwards (1948) приводит значения a4 = 2.7708, a5 = 3.1771. Edwards также приводит функции распределения размаха при n = 4 и 5. При n = 4 FW (w) = 1 +

15 −w 1 3 e − 3e−2w + e−3w − we−w (4 + e−w ), 8 8 4

w  0;

(24.19)

при n = 5 77 −w 57 −2w 1 1 −4w 5 e − e − e−3w − e − we−w (4 + 3e−w ), 12 8 4 24 4

w0 (24.20) Другой интересный способ вывода моментов порядковых статистик для двойного экспоненциального распределения приводит Govindaranjulu (1963). Его метод, применимый к произвольному симметричному распределению, состоит в следующем. Пусть X1  X2  · · ·  Xn — порядковые статистики выборки объема n из симметричного распределения (не ограничивая общности, можно считать распределение симметричным относительно нуля) с функцией распределения FX (x). Пусть, далее, Y1 : n  Y2 : n  · · ·  Yn : n — порядковые статистики, полученные по случайной выборке объема n из распределения |X| с функцией распределения GY (y) = 2FX (x) − 1, y  0. Govindaranjulu (1963) FW (w) = 1 +

152

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

вывел соотношения:  r−1 r−1    n k 



k n k E Y  r−i:n−i + (−1)k E Y  i−r+1:i , E X r = 2−n i i i=0

1  r  n,

i=0

и для 1  r < s  n r−1   

 n  E Xr Xs = 2−n − Ys−i:n−i E Yr−i:n−i i

(24.21)

i=0

s−1   r−1     



 n n  − Yi−r+1:i E Ys−i:n−i + . E Yi−r+1:i E Yi−s+1:i i i i=r

(24.22)

i=s

Если FX (x) — стандартная функция распределения двойного экспоненциального распределения, то GY (y) — стандартная функция показательного распределения. Используя (24.21) и (24.22) и явные выражения для средних, дисперсий и ковариаций порядковых статистик экспоненциального распределения (см. гл. 18), получаем:  r−1 n  n 



n −n E Xr = 2 S (r − i, n − i) − S (i − r + 1, i) , 1  r  n, i 1 i 1 i=r i=0 (24.23)  r−1 n  n  n

S2 (r − i, n − i) − S (i − r + 1, i) , 1  r  n, E X  r2 = 2−n i i 2 i=r i=0 (24.24)  r−1  n

S3 (r − i, s − i, n − i) − E Xr Xs = 2−n i

i=0

− +

s−1  i=r n  i=s

n i

n i

S1 (i − r + 1, i)S1 (s − i, n − i) + 

S3 (i − s + 1, i − r + 1, i) ,

1  r < s  n.

(24.25)

В последних формулах при 1  r  n S1 (r, n) =

n  1 i=n−r+1

i

а для 1  r < s  n S3 (r, s, n) =

,

S2 (r, n) =

n  1 i=n−r+1

n  1 i=n−r+1

i2

i2

+ (S1 (r, n))2 ,

+ S1 (r, n) · S1 (s, n).

Используя (24.23)–(24.25), Govindaranjulu (1966) табулировал средние, дисперсии и ковариации порядковых статистик стандартного двойного экспоненциального распределения для выборок объемов n  20. В работе Balakrishnan, Govindaranjulu and Balasubramanian (1993) авторы приводят остроумную вероятностную интерпретацию формул (24.21) и (24.22) и применяют ее для вывода некоторых обобщений.

153

4. О СТАТИСТИЧЕСКИХ ВЫВОДАХ

Формулы (24.21) и (24.22), выведенные Govindaranjulu, обобщил Balakrishnan (1988). Он рассмотрел случай, когда среди n случайных величин имеется n − 1 имеющих одинаковые распределения Лапласа и один выброс, распределение которого также симметрично, но его параметр масштаба отличен от остальных. Эти результаты, вместе с явными представлениями для моментов порядковых статистик и моментов их произведений из работы Barnett and Lewis (1994) для показательной модели с единственным выбросом (порожденным изменением масштабного параметра), были использованы в статье Balakrishnan and Ambagaspitiya (1988) для изучения проблем робастности различных линейных оценок параметров θ и φ распределения Лапласа в форме (24.1). Результаты Balakrishnan (1988) для случая одного выброса (масштабного характера) в выборке из распределения Лапласа обобщены в статье Balakrishnan (1989) для порядковых статистик X1 , X2 , . . . Xn , порожденных n независимыми случайными величинами, имеющими различные распределения Лапласа. Akahira and Takeuchi (1990) рассмотрели потерю информации, связанную с рассмотрением порядковых статистик двойного показательного распределения, и связанные с ними проблемы точечного оценивания параметров θ и φ (см. п. 4). Lien, Balakrishnan and Balasubramanian (1992) получили моменты порядковых статистик усеченного с двух сторон распределения Лапласа с плотностью pX (x) =

1 e−|x| , 2(1 − P − Q)

log(2Q)  x  − log(2P),

(24.26)

где P и Q — доли усечения слева и справа стандартной плотности Лапласа (24.2). Моменты порядковых статистик использованы для получения наилучших линейных несмещенных оценок параметров сдвига и масштаба усеченного распределения Лапласа. Авторы вывели соотношения между порядковыми статистиками для смеси без перекрытий, из которых как частный случай получаются результаты для дважды усеченного распределения Лапласа (24.26). Khan and Khan (1987) вывели соотношения для моментов порядковых статистик для усеченного с двух сторон распределения Лапласа в форме (24.26).

4.

О статистических выводах

4.1.

Оценки максимального правдоподобия

Пусть X1 , X2 , . . . , Xn — наблюденные значения n независимых случайных величин, распределенных с плотностью (24.1). Логарифм функции правдоподобия имеет вид n  −1 −n log(2φ ) − φ |Xj − θ |. (24.27) j=1

$n Независимо от параметра φ величина θ#, минимизирующая j=1 |Xj − θ | по θ , является оценкой максимального правдоподобия (ОМП) параметра θ . Если n нечетно, то θ# определяется однозначно и равно медиане значений X1 , X2 , . . . , Xn . Это утверждение получено в работе Keynes (1911), который предположил, что оно является характеризационным свойством распределения Лапласа (что соответствует действительности). Если n четно, то θ# можно

154

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

  1 1 взять произвольно между порядковыми статистиками порядка n и n+1 2 2 из множества X1 , X2 , . . . , Xn . Обычно используется среднее арифметическое указанных порядковых статистик, и оно является несмещенной оценкой θ (как, впрочем, и медиана в случае нечетного n). Если φ неизвестно (как и θ ), то ОМП параметра φ есть n      (24.28) n−1 Xj − θ#, j=1

где θ# есть ОМП параметра θ . Если θ известно, но φ неизвестно (обычно θ = 0), то оценкой максимального правдоподобия для φ является n  −1 |Xj − θ |. (24.29) n j=1

О распределении медианы говорилось в п. 24.3. Медиана есть несмещенная оценка максимального правдоподобия θ , однако не является оценкой с минимальной дисперсией. Для малых объемов выборки n можно построить несмещенные оценки с меньшей дисперсией, чем у медианы, см., например, табл. 24.1. Norton and Hombas (1986) описали вычислительные аспекты нахождения ОМП. Balakrishnan and Cutler (1994) вывели в явном виде ОМП параметров θ и φ по выборке, симметрично цензурированной по типу II. Конкретно, пусть     Xr+2  · · ·  Xn−r — симметрично цензурированнная выборка из полной Xr+1 выборки объема n, где r наименьших и r наибольших значений ненаблюдаемы. Функция правдоподобия по цензурированной выборке есть n−r   r , n!

  FX (Xr+1 ) (1 − FX (Xn−r ) L(θ , φ ) = pX (Xi ), (24.30) 2 (r!)

i=r+1

где pX (x) и FX (x) даются формулами (24.1) и (24.11). Если θ лежит в про  , Xn−r ], то функция правдоподобия записывается в виде: межутке [Xr+1 n−r     n! −r   Xi − θ   (24.31) L(θ , φ ) = n 2 n−2r exp (Xn−r − Xr+1 ) −   . φ

2 (r!) φ

i=r+1

φ

Отсюда следует, что «суженная» ОМП параметра θ есть  Xm+1 , n = 2m + 1, # (24.32) θ=  произвольное значение из [Xm , Xm+1 ], n = 2m.  Если θ < Xr+1 , функция правдоподобия (24.30) принимает форму   r $    n! 1 −(Xr+1 −θ )/φ 1 −(Xn−r −θ )/φ − n−r i=r+1 (Xi −θ )/φ . e e e L(θ , φ ) = 1 − 2 n−2r (r!) (2φ )

2

2

(24.33)  , то Можно показать, что она монотонно возрастает по θ . Если θ > Xn−r функция правдоподобия (24.30) принимает форму   r $n−r    n! 1 (Xr+1 1 (Xn−r −θ )/φ −θ )/φ 1 − e e e− i=r+1 (θ −Xi )/φ L(θ , φ ) = 2 n−2r 2 2 (r!) (2φ ) (24.34) и монотонно убывает по θ .

155

4. О СТАТИСТИЧЕСКИХ ВЫВОДАХ

Приведенные формулы показывают, что «суженная» ОМП (24.32) для θ аналогична ОМП, получаемой по полной выборке. Теперь, подставляя θ# в (24.30) и максимизируя полученную функцию L(θ#, φ ) по φ , находим ОМП для φ . Для n = 2m + 1 получается: *2m+1−r + m   1   #= φ Xi − Xi + r{X2m+1−r − Xr+1 } . (24.35) 2m + 1 − 2r

i=m+2

i=r+1

Для n = 2m 1 #= φ 2m − 2r

*2m−r  i=m+1

Xi −

m 

+   Xi + r{X2m−r − Xr+1 } .

(24.36)

i=r+1

Balakrishnan and Cutler (1994) исследовали смещение и эффективность этих оценок по сравнению с наилучшими линейными несмещенными оценками, найденными в работе Govindaranjulu (1966) и приводимыми ниже. Balakrishnan and Cutler (1994) приводят также ОМП параметров θ и φ по выборке, цензурированной справа по типу II.

4.2.

Наилучшие линейные несмещенные оценки

   Пусть Xr+1  Xr+2  · · ·  Xn−s — цензурированная с двух сторон по типу II выборка, полученная по полной выборке объема n отбрасыванием r наименьших и s наибольших значений. Обозначим μi , σii и σij средние, дисперсии и ковариации порядковых статистик по выборке из распределения Лапласа, даваемые формулами (24.23)–(24.25). Обозначим, далее    X = (Xr+1 , Xr+2 , . . . , Xn−s )T ,

μ = (μr+1 , μr+2 , . . . , μn−s )T ,

1 = (1, 1, . . . , 1)T(n−r−s)×1 ,

 Σ = (σij ) i,j=r+1, ... ,n−s . Наилучшие линейные несмещенные оценки параметров θ и φ по выборке, цензурированной с двух сторон по типу II, приведены в работе David (1981) и в книге Balakrishnan and Cohen (1991, pp. 80–82): ⎫ ⎧ n−s ⎨ T −1 T −1  T −1 T −1 ⎬ μ Σ μ 1 Σ − μ Σ 1μ Σ ∗ X= θ =  ai Xi , (24.37) ⎩ μ T Σ −1μ  1T Σ −1 1 − μ T Σ −1 12 ⎭ μ Σ

φ∗ =

⎧ ⎨

μ

μ Σ

Σ

i=r+1

⎫ ⎬

n−s  − 1 Σ μ1 Σ bi Xi . X = ⎩ μ T Σ −1μ  1T Σ −1 1 − μ T Σ −1 12 ⎭ i=r+1 T −1

1 Σ

T −1

1μ Σ

T −1

T −1

(24.38)

156

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

Дисперсии и ковариации этих оценок суть  var(θ ∗ ) = φ 2  var(φ ∗ ) = φ 2

μ T Σ −1μ

T −1  T −1  T −1 2 μ Σ μ 1 Σ 1 − μ Σ 1

1T Σ −1 1

= φ 2 V1 ,

(24.39)

= φ 2 V2 ,

(24.40)



T −1  T −1  T −1 2 μ Σ μ 1 Σ 1 − μ Σ 1

 cov(θ ∗ , φ ∗ ) = −φ 2



μ T Σ −1 1

T −1  T −1  T −1 2 μ Σ μ 1 Σ 1 − μ Σ 1

= −φ 2 V3 .

(24.41)

В случае, если доступна симметрично цензурированная по типу II выборка (т. е. r = s), cov(θ ∗ , φ ∗ ), даваемая формулой (24.41), обращается в нуль, так как μ T Σ −1 1 = 0. Также в этом случае коэффициент при Xi в выражении (24.37)  для θ ∗ совпадает с коэффициентом при Xn−i+1 ; коэффициент при Xi в вы , ражении (24.38) для φ ∗ совпадает по модулю с коэффициентом при Xn−i+1 но противоположен по знаку. Govindaranjulu (1966) приводит таблицы коэффициентов ai и bi , а также значения V1 , V2 и V3 для выборок объема до 20 и для всех возможных r = s. Balakrishnan, Chandramouleeswaran and Ambagaspitiya (1994) составили аналогичные таблицы для выборок объема до 20 при r = 0 и s = 0 (1) n − 2. Таблица 24.1, заимствованная из работы Govindaranjulu (1966) содержит коэффициенты оценок θ ∗ и φ ∗ для выборок объема n = 2 (1) 10 и r = s = 0 (1) [(n − 2)/2]. В последнем столбце приведены значения var(θ ∗ )/φ 2 и var(φ ∗ )/φ 2. Sarhan (1954) сравнил дисперсии наилучшей линейной оценки θ , меди  и X(n+2)/2 , аны, определенной для четного n как среднее арифметическое Xn/2 выборочного среднего и полусуммы крайних значений. Все они являются несмещенными оценками θ . В табл. 24.2 приведены эффективности (отношение дисперсий, выраженное в процентах) последних трех оценок, относительно первой. На рис. 24.2, a—c эти же значения показаны графически. Немонотонность на рис. 24.2, c связана с различием определения медианы для четных и нечетных n. $ Заметим, что оценка n−1 |Xi − θ | параметра φ при известном θ распре$   −1 2 −1 # делена как (2n) φχ2n. Распределение n Xi − θ , где θ# — медиана, изучено в статье Karst and Polowy (1963). В табл. 24.3 приведены коэффициенты наилучших линейных несмещен√ ных оценок среднего θ и стандартного отклонения σ = φ 2, а также значения var(θ ∗ )/σ 2 и var(σ ∗ )/σ 2 для n = 3, 4 и 5 и цензурирования справа: r = 0, s = 1 (1) n − 2; значения заимствованы из работы Sarhan (1954). Как мы уже упомянули, Balakrishnan, Chandramouleeswaran and Ambagaspitiya (1994) рассчитали расширенный вариант таблиц до n = 20. При известном φ доверительные границы для θ можно получить на основе распределения медианы θ#. Если известно θ , то доверительные $nграницы для φ можно получить, используя тот факт, что распределение n−1 j=1 |Xj − θ | сов-

157

4. О СТАТИСТИЧЕСКИХ ВЫВОДАХ

ТАБЛИЦА 24.1 Коэффициенты наилучших линейных несмещенных оценок параметров сдвига (θ ∗ ) и масштаба (φ ∗ ) и дисперсии этих оценок Коэффициенты n

r

Xn

2

0 θ φ 0 θ φ 0 θ φ 1 θ φ 0 θ φ 1 θ φ 0 θ φ 1 θ φ 2 θ φ 0 θ φ 1 θ φ 2 θ φ 0 θ φ 1 θ φ 2 θ φ 3 θ φ 0 θ φ 1 θ φ 2 θ φ 3 θ φ 0 θ φ 1 θ φ 2 θ φ 3 θ φ 4 θ φ

0.5000 0.6667 0.1481 0.4444 0.0473 0.3077

3 4 4 5 5 6 6 6 7 7 7 8 8 8 8 9 9 9 9 10 10 10 10 10

0.0166 0.2331 0.0063 0.1876

 Xn−1

0.7037 0.0000 0.4527 0.2145 0.5000 1.4545 0.2213 0.2264 0.2378 0.8727 0.1006 0.1943 0.1069 0.6135

 Xn−2

0.5241 0.0000 0.5244 0.0000 0.3931 0.1132 0.3931 0.1824 0.5000 2.2857 0.2386 0.1439 0.2386 0.2104 0.2862 1.3061 0.1316 0.1391 0.1316 0.1910 0.1533 0.1977

0.0025 0.1572

0.0455 0.1631 0.0480 0.4677

0.0010 0.1355

0.0208 0.1391 0.0219 0.3767

0.0004 0.1191

0.0097 0.1211 0.0101 0.3153

0.0698 0.1251 0.0698 0.1643 0.0799 0.7023

0.0002 0.1063

0.0046 0.1074 0.0047 0.2714

0.0364 0.1110 0.0364 0.1410 0.0412 0.5665

 Xn−3

0.4267 0.0000 0.4267 0.0000 0.4276 0.0000 0.3465 0.0718 0.3465 0.0987 0.3467 0.1605 0.5000 0.3411 0.2374 0.1013 0.2374 0.1331 0.2374 0.1955 0.3166 1.7451 0.1478 0.1061 0.1478 0.1347 0.1478 0.1854 0.1887 1.1218

 Xn−4

Дисперсии

0.3654 0.0000 0.3654 0.0000 0.3655 0.0000 0.3668 0.0000 0.3110 0.0504 0.3310 0.0640 0.3110 0.0881 0.3113 0.1448 0.5000 4.0125

1.0000 0.7778 0.5895 0.4321 0.4155 0.2986 0.4201 0.8512 0.3169 0.2290 0.3174 0.4387 0.2548 0.1858 0.2548 0.2996 0.2609 0.8866 0.2122 0.1565 0.2122 0.2288 0.2134 0.4468 0.1814 0.1351 0.1814 0.1858 0.1816 0.3020 0.1873 0.9078 0.1581 0.1190 0.1581 0.1562 0.1581 0.2295 0.1596 0.4534 0.1399 0.1062 0.1399 0.1350 0.1399 0.1857 0.1403 0.3044 0.1452 0.9220

158

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

РИС. 24.2. Эффективность среднего арифметического, полусуммы крайних значений и медианы для различных распределений 1

2 2 падает с распределением φχ2n (символ χ2n означает xu-квадрат случайную 2n величину с 2n степенями свободы). Границы 100(1 − α )%-го доверительного интервала суть    n n    Xj − θ  Xj − θ  2 и 2 . (24.42) 2 2 j=1

χ2n,1−α /2

j=1

χ2n,α /2

Если ни θ , ни φ не известны, то для построения доверительных интервалов для θ и φ можно использовать распределения величин n    #−θ θ  −1 #.   X (24.43) и φ − θ  j $n   j=1 Xj

− θ#

j=1

Эти величины являются центральными для оценки параметров θ и φ соответственно. Bain and Engelhardt (1973) вывели точные распределения для n = 3 и n = 5 и нашли приближенные распределения для б´ольших n. Эти авТАБЛИЦА 24.2 Эффективность в процентах различных оценок θ относительно наилучшей линейной несмещенной оценки Оценка

Среднее арифметическое Полусумма крайних значений Медиана

Объем выборки 2

3

4

5

100.0 100.0 100.0

88.43 67.90 92.27

82.80 49.65 98.90

79.21 38.29 90.23

Замечание: Chu and Hotelling (1955) выяснили, что дисперсия медианы меньше дисперсии среднего арифметического при всех n  7.

159

4. О СТАТИСТИЧЕСКИХ ВЫВОДАХ

ТАБЛИЦА 24.3 Коэффициенты наилучших линейных √ несмещенных оценок среднего значения (θ ) и стандартного отклонения (σ = φ 2) для усеченной выборки с удаленными s наибольшими значениями Коэффициенты

n

s

Параметр

X1

X2

3

1

4

1

θ σ θ σ θ σ θ σ θ σ θ σ

−0.3300 −1.3578 0.0662 −0.7332 0.0000 −1.2563 0.0114 −0.4331 −0.6649 −0.6655 −0.5641 −1.3925

1.3000 1.3578 0.3333 −0.2129 1.0000 1.2563 0.2163 −0.4191 0.1666 −0.6233 1.5641 1.3925

2 5

1 2 3

X3

X4

0.6004 0.9461

0.5243 0.0037 0.8998 1.2889

0.2479 0.8484

Дисперсия ×σ −2

Относительная эффективность a

0.1860 0.3339 0.3335 0.9457 0.1586 0.3097 0.1724 0.4634 1.2743 2.8481

98.23 89.42 62.29 31.58 99.88 73.88 91.85 49.37 2.24 8.03

a Относительная эффективность измерена отношением дисперсии наилучшей линейной несмещенной оценки по полной выборке к аналогичному показателю для усеченной выборки и выражена в процентах.

торы также привели асимптотические распределения центральных величин и нашли мощность соответствующих критериев проверки гипотез. В работе Balakrishnan, Chandramouleeswaran and Ambagaspitiya (1994) для случая полной выборки и для выборки, центрированной по типу II, использованы оценки θ ∗ и φ ∗ , даваемые формулами (24.37) и (24.38), и дисперсии этих оценок (24.39) и (24.40). Авторы рассмотрели три центральные величины; θ∗ − θ √ , φ V1

θ∗ − θ √ φ ∗ V1

и

 φ ∗ /φ − 1 √ V2

(24.44)

для построения статистических выводов о θ при известном φ , о θ при неизвестном φ и о φ при неизвестном θ соответственно. В работе рассчитаны некоторые процентные точки распределений всех трех центральных величин для выборок объема до 20 включительно при различных вариантах цензурирования. В статье Balakrishnan, Chandramouleeswaran and Govindarajulu (1994) анализируется точность аппроксимаций на основе разложения Эджворта распределений центральных величин (24.44). Опираясь на таблицы коэффициентов наилучших линейных несмещенных оценок, приведенных в работе Govindarajulu (1966), Srinivasan and Wharton (1982) получили односторонние и двусторонние границы функции распределения FX (x). Эти границы строятся на основе статистик типа статистик Колмогорова—Смирнова. Например, двусторонняя граница для FX (x; θ , φ )

160

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

ТАБЛИЦА 24.4 статистики Ln , полученные на основе моделирования

Процентные точки lα n

5 6 7 8 9 10 11 12

α 0.80

0.85

0.90

0.95

0.99

0.31 0.29 0.26 0.25 0.23 0.22 0.21 0.20

0.35 0.32 0.29 0.27 0.26 0.24 0.23 0.22

0.39 0.35 0.33 0.31 0.29 0.27 0.26 0.25

0.45 0.41 0.38 0.36 0.34 0.32 0.31 0.30

0.56 0.52 0.48 0.46 0.44 0.41 0.39 0.38

Процентные точки n

5 6 7 8 9 10 11 12

lα+

статистики

L+n ,

α 0.80

0.85

0.90

0.95

0.99

0.23 0.21 0.19 0.18 0.16 0.16 0.15 0.14

0.27 0.24 0.22 0.21 0.19 0.18 0.17 0.17

0.31 0.29 0.26 0.25 0.23 0.22 0.21 0.20

0.38 0.35 0.32 0.31 0.28 0.27 0.26 0.25

0.51 0.47 0.44 0.42 0.39 0.38 0.36 0.34

n

13 14 15 16 17 18 19 20

α 0.80

0.85

0.90

0.95

0.99

0.19 0.18 0.18 0.17 0.16 0.16 0.16 0.15

0.22 0.21 0.20 0.19 0.18 0.18 0.18 0.17

0.24 0.23 0.22 0.22 0.21 0.20 0.20 0.19

0.28 0.27 0.26 0.25 0.24 0.24 0.23 0.23

0.36 0.34 0.33 0.32 0.31 0.31 0.31 0.29

ТАБЛИЦА 24.5 полученные на основе моделирования n

13 14 15 16 17 18 19 20

α 0.80

0.85

0.90

0.95

0.99

0.13 0.13 0.12 0.12 0.12 0.12 0.11 0.11

0.16 0.15 0.14 0.14 0.14 0.14 0.13 0.13

0.19 0.18 0.18 0.17 0.17 0.17 0.16 0.15

0.24 0.23 0.22 0.21 0.21 0.21 0.20 0.19

0.34 0.32 0.30 0.29 0.28 0.28 0.27 0.26

определяется величиной Ln =

sup

−∞ 0.9648,  + 0.225X[(0.30536 ξ +0.69494)n]+1

при 0.6670  ξ  0.9648,

(24.49)

где zξ — квантиль стандартного распределения Лапласа (24.2). Авторы привели некоторые значения асимптотической эффективности этих оценок отно-

164

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

ТАБЛИЦА 24.8 Оптимальные спейсинги {λ i }, соответствующие коэффициенты {bi } и асимптотическая относительная эффективность АОЭ(φ ∗∗ ) асимптотически наилучшей линейной несмещенной оценки φ ∗∗ k

λ1

1

2

3

4

5

0.079297

0.101594

0.033422

0.036723

0.016452

0.164490

0.180735

0.080968

0.890440

0.819265

0.223999

0.963277

0.810958 −0.038492

λ2

0.898406

λ3 λ4 λ5

0.961589 −0.543063

b1 b2

−0.313750

−0.091528

−0.089540

0.313750

−0.267216

−0.261596

−0.112454

0.299908

0.261596

−0.221847

b3

0.089540

b4

0.262269 0.089868

b5 АОЭ(φ ∗∗ )

0.292036

0.647609

0.730316

0.820263

0.854828

k λ1

6 0.017277

7 0.008980

8 0.009478

9 0.005620

10 0.005752

λ2

0.085029

0.044197

0.046645

0.027661

0.028311

λ3

0.235233

0.122269

0.129043

0.076523

0.078322

λ4

0.764767

0.259890

0.274288

0.162653

0.166477

λ5

0.914971

0.763397

0.725712

0.266500

0.303472

λ6

0.982723

0.914475

0.870957

0.720691

0.696528

0.982622

0.953355

0.868595

0.833523

0.990522

0.952501

0.921678

λ7 λ8 λ9

0.990349

λ10

0.971689 0.994248

b1

−0.038779

−0.019766

−0.020451

−0.011994

−0.012141

b2

−0.113294

−0.057748

−0.059746

−0.035044

−0.035472

b3

−0.223845

−0.114094

−0.118045

−0.069236

−0.070084

b4

0.223845

−0.192711

−0.195351

−0.114579

−0.115982

b5

0.113294

0.224331

0.195351

−0.171350

−0.173167

b6

0.038779

0.111746

0.118045

0.197019

0.173167

0.038250

0.059746 0.020451

0.118894 0.060176

0.115982 0.070084

0.020597

0.035472

b7 b8 b9

0.012141

b10 АОЭ(φ

∗∗

)

0.891047

0.908654

0.926909

0.937134

0.947572

165

4. О СТАТИСТИЧЕСКИХ ВЫВОДАХ

 сительно X[n ξ ]+1 . Например, для ξ = 0.1, 0.2, 0.4 и 0.5 асимптотическая эффективность составляет 122%, 128%, 147% и 100% соответственно. Дальнейшее обсуждение этой задачи можно найти в работе Saleh, Ali and Umbach (1983). Umbach Ali and Saleh (1984) рассмотрели метод проверки гипотез с использованием АНЛНО, основанный на оптимальных спейсингах.

4.5.

Условные выводы

Kappeman (1975) рассмотрел условные доверительные границы для параметров θ и φ ; этому же вопросу посвящена заметка Edwards (1974). Пусть θ# и φ# суть ОМП параметров θ и φ , т. е. θ# — выборочная медиана, φ# определяется формулой (24.48). Пусть далее ai =

Xi − θ# , # φ

i = 1, 2, . . . , n

(24.50)

— подобные статистики (только n − 2 из которых независимы). Условная совместная плотность распределения при условии фиксированного значения подобных статистик имеет вид    n−2 n   # # # 1 φ φ θ − θ  (24.51) exp − + ai  . p(θ#, φ#|a) = K · 2  φ

φ

φ

# φ

i=1



Определим центральные величины для θ и φ равенствами U = θ# − θ /φ# и V = φ /φ# соответственно. Условная относительно подобных статистик плотность U и V получается из (24.51) и равна pU,V (u, v|a) = K  vn−1 e−v

$n

i=1

|u+ai |

,

(24.52)



где K — нормировочная константа, n−1  1 K = ; Bn (a1 , a2 , . . . , an )c(θ#) 2Γ(ν − 1)

здесь c(t) =

n 

|ai − t|

(24.53) (24.54)

i=1

и Bn (a1 , a2, ... , an) = ⎧ −1/(n−1) n−1 n  ⎪  # ⎪ c( θ ) 1 ⎪ ⎪ , ⎪ ⎪ (2i − n)(n + 2 − 2i) ⎪ ⎪ i=1 c(ai ) ⎪ ⎪ ⎧ ⎪ ⎪ ⎪ ⎨ ⎪  1

⎨ 1 + + (n − 1) a(n/2)+1 − an/2 = # ⎩ 2c(θ ) 2 ⎪ ⎪ ⎫−1/(n−1) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪   n ⎪ n−1 ⎬  ⎪ #) ⎪ c( θ 1 ⎪ ⎪ + ⎪ ⎪ c(ai ) (2i − n)(n + 2 − 2i) ⎪ ⎪ ⎪ i=1 ⎩ ⎭ i = n/2,n/2+1

при нечетном n,

при четном n. (24.55)

166

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

ТАБЛИЦА 24.9 Сравнение ожидаемой длины 100(1 − α )%-х условных и безусловных доверительных интервалов для θ при φ = 1 1−α

0.90

0.95

0.98

n

Условный

Безусловный

Условный

Безусловный

Условный

Безусловный

3 5 9 15 33

3.532 2.113 1.375 0.997 0.631

3.641 2.273 1.498 1.061 0.682

4.740 2.575 1.698 1.214 0.761

4.975 2.912 1.949 1.326 0.830

7.495 3.542 2.119 1.484 0.917

7.649 3.787 2.316 1.525 0.942

Uthoff (1973) вычислил константу K  , которая важна при разработке наиболее мощного относительно фиксированных параметров сдвига и масштаба критерия нормальности, если альтернативной является гипотеза о двойном показательном распределении. Из (24.52) получается маргинальная условная плотность U:  n −n  |u + ai | . (24.56) pU (u|a) = K  Γ(n) i=1

Отсюда 100(1 − α   )%-й доверительный интервал для θ получается в виде # − u2 φ#, θ# − u1 φ# , где u1 и u2 — константы, определяемые условием: θ Pr[U < u1 |a] = Pr[U  u2 |a] = α /2. Маргинальная условная плотность V также получается из (24.52), откуда также определяется вероятность Γ (n − 1; v2 c(a1 )) − Γ (n − 1; v1 c(a1 ))  Pr[v1 < V < v2 |a] = K + n−1 n (c(a1 ))

+

n−1  i=1



(2i − n) (c(ai ))n−1



n−1  Γ (n − 1; v2 c(ai+1 )) − Γ (n − 1; v1 c(ai+1 )) i=1

+

Γ (n − 1; v2 c(ai )) − Γ (n − 1; v1 c(ai ))

(2i − n) (c(ai+1 ))n−1

Γ (n − 1; v2 c(an )) − Γ (n − 1; v1 c(an ))

n (c(an ))n−1

+

 ,

(24.57)

z где Γ(n − 1; z) = 0 e−t tn−2 dt, 0 < z < ∞ — неполная гамма-функция. Услов  ный доверительный интервал для φ имеет вид φ#/v2 , φ#/v1 , где v1 и v2 определяются условием P[v1 < V < v2 |a] = 1 − α , где P[v1 < V < v2 |a] дается формулой (24.57) Grice, Bain and Engelhardt (1978) сравнили условные доверительные интервалы для θ , получающиеся из (24.56), и безусловные, основанные

5. ТОЛЕРАНТНЫЕ ГРАНИЦЫ И ИНТЕРВАЛЫ ПРЕДСКАЗАНИЯ

167

на ОМП, получающихся из (24.53). Используя моделирование методом МонтеКарло, авторы заметили, что условные границы несколько лучше, т. е. дают более узкие интервалы, и что согласие улучшается при возрастании n. Примеры длин условных и безусловных доверительных интервалов для некоторых значений объема выборки и значений 1− α приведены в табл. 24.9, заимствованной из Grice, Bain and Engelhardt (1978).

4.6.

Другие исследования

В статье Assabadi (1985) рассматривается несмещенная оценка φ с минимальной дисперсией и построение точного доверительного интервала на основе этой оценки. Harter, Moore and Curry (1979) предложили вариант адаптивных робастных оценок параметров сдвига и масштаба для симметричных распределений и исследовали их свойства в случае распределения Лапласа. Joshi (1984) приводит разложение байесовского риска в предположении о распределении Лапласа. В статьях Ramsey (1971) и Schlittgen (1979) рассматриваются мощность непараметрических критериев для параметра сдвига в случае малой выборки из популяции, имеющей двойное показательное распределение. Awad and Fayoumi (1985) оценили Pr[X < Y], если X и Y распределены по закону Лапласа. Patel (1986), изучая конечные смеси, рассматривает, в частности, случай двойного показательного распределения. В работе Yen and Moore (1988) предложен модифицированный критерий согласия для проверки гипотезы о распределении Лапласа по данной выборке. Damsleth and El-Shaarawi (1989) исследовали авторегрессионную модель скользящих средних с двойным показательным распределением шума. Shamma, Amin and Shamma (1991) рассмотрели процедуру управления при использовании взвешенных скользящих средних с двойным показательным распределением при переменных выборочных интервалах. Ulrich and Chen (1987) рассмотрели двумерное распределение Лапласа и его обобщения. В статье Efron(1986) рассматриваются семейства двойных показательных распределений и их применение к анализу обобщенной линейной регрессии. Hwang and Chen (1986) нашли улучшенные доверительные области для коэффициентов линейной модели со сферически симметричными ошибками. Другие заслуживающие внимания исследования, связанные с распределением Лапласа, содержатся в работах Brown and Resnick (1977), Hall and Joiner (1983), Loh (1984), Parker (1988) и Davis and Resnick (1988).

5.

Толерантные границы и интервалы предсказания

Bain and Engelhardt (1973) приводят приближенные значения толерантных границ, полученные по полной выборке и основанные на ОМП для параметров θ и φ , описанных в п. 24.4.1. Функцию L(X1 , . . . , Xn ) называют нижней

168

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

односторонней (β , γ ) толерантной границей, если   ∞ pX (x)dx  β = γ . Pr

(24.58)

L

Взяв L(X1 , . . . , Xn ) = θ# − β φ#, kβ = log{2(1 − β )} и ξβ = θ + kβ φ , получаем: FX (ξβ ) = 1 − β и   ∞   pX (x)dx  β = Pr θ# − bθ# < θ + kβ φ = Pr L       #−θ # θ φ b − b < kβ = Pr Un < kβ = γβ ; (24.59) = Pr φ

φ

n

здесь P1 = n(θ# − θ )/φ и P2 = nφ#/φ — центральные величины для θ и φ , Un (c) = P1 − cP2 . Таким образом, L(X1 , . . . , Xn ) = θ# − β φ# есть искомая нижняя (β , γ ) толерантная граница, и искомая вероятность может быть получена при подходящем выборе b. При фиксированных β и γ Bain and Engelhardt (1973) использовали аппроксимацию √      n(kβ − b) b √ Pr Un (24.60) =γ < kβ ≈ Φ n

1 + b2

для вывода приближенного равенства 

  1 2 1/2 −nk , + z n 1 + k b≈ γ β β 2 n − zγ

(24.61)

где zγ — квантиль уровня γ стандартного нормального распределения. В силу симметрии распределения Лапласа U(X1 , . . . , Xn ) = θ# + bφ# является верхней (β , γ ) толерантной границей. Таким образом, верхняя (α , β ) толерантная граница может быть построена с использованием приближенной формулы (24.61) для множителя b. Kappenman (1977) применил метод, использованный в п. 24.4.5 при построении условных доверительных интервалов. При таком подходе интервал (θ# − bφ#, ∞) дает нижнюю толерантную границу уровня γ для β  0.5; здесь  −1/(n−1) c(ah ) 1 p(n − 2h) kβ (n−2h) −n+1 + + (c(ah )) , (24.62) e b = −ah −  n − 2h

n − 2h

K Γ(n − 1)

где kβ = log (2(1 − β )), ai — подобные статистики (24.50), c(t) определено формулой (24.54), K  — нормировочная константа (24.53), h — наибольшее положительное целое ( 2), при котором    h−1  1 1 1 1  + −  1 − γ , (24.63) K Γ(n − 1) n−1 n−1 n−1 n (c(a1 ))

i=1

n − 2i

(c(ai+1 ))

(c(ai ))

и, наконец, p — разность между 1 − γ и значением левой части (24.63). Величину h можно находить, полагая последовательно h = 2, 3,. . . в (24.63) или методом проб и ошибок.

5. ТОЛЕРАНТНЫЕ ГРАНИЦЫ И ИНТЕРВАЛЫ ПРЕДСКАЗАНИЯ

169

В силу симметрии распределения Лапласа, верхняя условная (β , γ ) толерантная граница получается заменой b в (24.62) на −b, далее заменой 1 − γ в (24.63) на γ и p — на разность между γ и левой частью вновь получившейся формулы (24.63). Тогда верхний (β , γ ) толерантный интервал есть (−∞, θ# − bφ#). Shyu and Owen (1986a, b, 1987) продолжили исследование одно- и двусторонних толерантных границ и составили необходимые таблицы для толерантных множителей. Во всех вышеупомянутых работах рассматривались полные выборки. Balakrishnan and Chandramouleeswaran (1994a) использовали наилучшие линейные несмещенные оценки (НЛНО) θ и φ (описанные в п. 4.2) для построения нижней и верхней толерантных границ по выборкам, цензурированным по типу II. Авторы построили нижнюю (β , γ ) толерантную границу в виде L(X1 , . . . , Xn ) = θ ∗ − bφ ∗ и составили подробные таблицы толерантного множителя b для n = 5 (1) 10, 12, 15, 20 и уровней цензурирования справа s = 0(1)[n/2], β = 0.500 (0.025) 0.975 и γ = 0.75, 0.85, 0.90, 0.95, 0.98, 0.99 и 0.995. Как и выше, в силу симметрии распределения Лапласа таблицы позволяют определять верхнюю (β , γ ) толерантную границу в виде U(X1 , . . . , Xn ) = θ ∗ + bφ ∗ . Balakrishnan and Chandramouleeswaran (1994a) использовали НЛНО θ ∗ и φ ∗ для построения функции надежности в точке t ⎧ ∗ ∗ ⎨ 1 − 1 e(t−θ )/φ , t  φ ∗ , R∗X (t) = 1 − FX (1; θ ∗, φ ∗ ) = 1 2 ∗ ∗ (24.64) ⎩ e−(t−θ )/φ , t  φ ∗ . 2

Они рассмотрели смещение и дисперсию этих оценок как в случае полной выборки, так и выборки, цензурированной справа по типу II при различных t. Авторы отмечают, что эта оценка имеет пренебрежимо малое смещение при всех значениях функции надежности даже для малых выборок, начиная от n = 5. Показано также, как таблицы толерантного множителя b могут быть использованы для получения нижней 100γ %-й доверительной границы для функции надежности RX (t). Balakrishnan and Chandramouleeswaran (1994b) использовали НЛНО для θ и φ , полученные по выборке, цензурированной справа по типу II,  для построения интервалов предсказания. Пусть X1  X2  · · ·  Xn−s — доступные значения цензурированной выборки, а наибольшие s значений  и Xn выборки неизвестны. Авторы основывают предсказание величин Xn−s+1 на центральных величинах Q1 =

  Xn−s+1 − Xn−s ∗ φ

и

Q2 =

 Xn − Xn−s ∗ φ

(24.65)

соответственно. Balakrishnan and Chandramouleeswaran (1994b) составили необходимые таблицы процентных точек Q1 и Q2 , использовав метод Монте-Карло при различных n и s. Они также рассмотрели предсказание будущих m наблюдений, в частности, Y1 и Ym , использовав центральные величины Y − θ∗ Y − θ∗ и Q4 = m ∗ . (24.66) Q3 = 1 ∗ φ

φ

170

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

В упомянутой выше статье приводятся необходимые таблицы процентных точек величин Q3 и Q4 . Ling (1977) и Ling and Lim (1978) применили байесовский подход к решению проблемы предсказания.

6.

Распределения, связанные с распределением Лапласа

Если плотность распределения величины X имеет плотность (24.1), то |X − θ | 1 φχ22 , распределено по показательному закону, а именно, как величина 2

(χ22 — хи-крадрат с двумя степенями свободы). В частности, если θ = 0, то такое распределение имеет |X|. Поэтому, если X1 , X2 , . . . , Xn — независимые случайные величины с плотностью (24.1) при θ = 0, то распределение любой статистики, зависящей только от |X1 |, |X2 |, . . . , |Xn |, выводится из совместного распределения множества независимых хи-квадрат случайных величин. Например, |X1 |/|X2 | имеет F-распределение с числом степеней свободы 2, 2 (см. гл. 27). Интересная связь между нормальным распределением и распределением Лапласа установлена в работе Nyquist, Rice and Riordan (1954). Авторы показали, что, если U1 , U2 , U3 и U4 — независимые случайные величины, имеющие стандартное нормальное распределение, то плотность величины   U1 U2   = U1 U4 − U2 U3  D= U3 U4  имеет вид (24.1) с θ = 0 и φ = 2. Заметим здесь, что U1 U4 −U2 U3 и U1 U4 +U2 U3 имеют одно и тоже распределение. [В случае ненулевых математических ожиданий величин U получаются более сложные распределения, рассмотренные в статье Nicholson (1958).] Missiakoulis and Darton (1985) и Mantel (1987) приводят дополнительные соображения в связи с приведенными результатами. Mantel and Pasternack (1966) привели эвристическое доказательство того, что Y = U1 U4 + U2 U3 распределено по закону Лапласа; см. также статью Mantel (1969). Несложное доказательство этого факта, использующее характеристические функции, приведено в работе Mantel (1970). Во-первых, характеристическая функция Y равна



2

E eitY = E eit(U1 U4 +U2 U3 ) = E eitU1 U4 , (24.67)

itU U так как U1 U4 и U2 U3 независимы и одинаково распределены. Далее E e 1 4 определяется в два этапа. Условное математическое ожидание

2 2 E eitU1 U4 |U4 = e−U4 t /2 , (24.68) так как U1 имеет стандартное нормальное распределение N(0, 1) (см. гл. 13). Далее, безусловное математическое ожидание  

2 2 1 E eitU1 U4 = E e−U4 t /2 = √ , (24.69) 1 + t2

171

6. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЛАПЛАСА

так как U42 есть χ12 (гл. 18). По формулам (24.69) и (24.67) получаем:

E eitY =

1 , 1 + t2

что совпадает с характеристической функцией (24.3), и это доказывает двойное показательное распределение Y. Два взаимно обратных преобразования Фурье: 1 2

∞ 

exp(itx − |x|)dx = (1 + t2 )−1 ,

−∞

π

−1

∞ 

(1 + t2 )−1 exp(itx)dx = e−|x|

−∞

иллюстрируют формальную связь между характеристиками распределений Коши и Лапласа, см. также (24.2), (24.3) и гл. 16. Преобразованная форма распределения Лапласа обсуждается в статье Johnson (1954). Он рассмотрел (по аналогии с логнормальными SU и SB преобразованиями, см. гл. 14 и 12) распределение случайной величины Y (δ > 0) такой, что ⎧ (система случайных величин SL ), ⎪ ⎪γ + δ log Y ⎨ Y (система случайных величин SU ), X = γ + δ Arsh   ⎪ Y ⎪ ⎩γ + δ log (система случайных величин SB ), 1−Y

распределено по закону Лапласа (24.2). Точки (β1 , β2 ), отвечающие системе случайных величин SL , лежат на линии, определяемой параметрическими уравнениями β1 (Y) = β2 (Y) =

4(δ 2 − 4)(15δ 4 + 7δ 2 + 2)2 δ 2 (δ 2 − 9)2 (2δ 2 + 1)3

,

δ > 3,

3(δ 2 − 4)(8δ 8 + 212δ 6 + 95δ 4 + 33δ 2 + 12) , δ 2 (δ 2 − 9)(δ 2 − 16)(2δ 2 + 1)2

(24.70) δ > 4.

(24.71)

Точки (β1 , β2 ), отвечающие системе случайных величин SU , лежат ниже этой линии (т. е. фиксированному β1 соответствует большее значение β2 ). Для системы случайных величин S B соответствующая точка лежит выше. Указанные преобразования охватывают весь диапазон значений (β1 , β2 ). Как для S L , так и для S U r-й момент бесконечен при r  δ . Преобразование S L определяет так называемое логарифмическое распределение Лапласа (аналог логнормального и логарифмически логистического распределений). Kotz, Johnson and Read (1985) приводят небольшой обзор подобных преобразований распределений. В работе Uppuluri (1981) обсуждаются некоторые свойства этого семейства распределений.

172

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

Иногда рассматривают асимметричное распределение Лапласа с плотностью   ⎧ |x − θ | −1 ⎪ ⎪ , x  0, ⎨ (2φ1 ) exp − φ 1   (24.72) pX (x) = ⎪ ⎪ ⎩ (2φ2 )−1 exp − |x − θ | , x < 0, φ2

где φ1 = φ2 и φ1 , φ2 > 0 [см., например, McGill (1962)]. Lingappaiah (1988), называющий это распределение раздвоенным двойным показательным распределением, рассматривает некоторые его свойства. Другой вариант асимметричного распределения Лапласа определяется плотностью   ⎧ |x − θ | −1 ⎪ ⎪ , x  0, ⎨ pφ exp − φ   pX (x) = (24.73) ⎪ |x − θ| ⎪ −1 ⎩ (1 − p)φ exp − , x < 0, φ

0< p < 1. Holla and Bhattacharya (1968) использовали это распределение как смешивающее распределение для среднего значения нормального распределения. Характеристическая функция получающегося смешанного нормального распределения есть  

−1 1 1 + t2 φ 2 {1 + (2p − 1)itφ } exp itθ − t2 σ 2 , (24.74) 2

где σ — дисперсия смешанного нормального распределения. Плотность этого распределения равна     √ −1 2 2  π 1 3 1 φ 2π eσ /(2φ ) pe−(y−θ )/φ − S1 M ; ; − S12 + 2 2 2 2    π 1 3 1 (24.75) +(1 − p)e(y−θ )/φ − S2 M ; − S22 2 2 2 2 где  2

Sj = (σ /φ ) + (−1)j

x−θ φ

,

j = 1, 2,

а M(·) — вырожденная гипергеометрическая функция (гл. 1). 1 получается распределение: В частном случае p = 2

Нормальное (ξ , σ )

5

Лапласа (θ , φ ).

ξ

Это распределение симметрично, среднее равно θ . Дисперсия равна σ 2 + 2φ 2 , эксцесс α4 (≡ β2 ) равен

−2 . 3 + 12φ 4 σ 2 + 2φ 2 Holla and Bhattacharya (1968) получили распределение суммы n независимых случайных величин с таким распределением. Они также вывели формулу

173

6. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЛАПЛАСА

для функции распределения (аргумента y):         y−θ 1 σ 2 / 2φ 2 y−θ 1 1 σ 2 / 2φ 2 sh × F(y) = Φ − e + √ e σ 2 σ 2 2π      1 3 1 1 3 1 × e(y−θ )/φ S2 M ; ; − S22 − e(y−θ )/φ S1 M ; ; − S12 . (24.76) 2 2

2

2 2

2

Из смешанных распределений Лапласа отметим два. Первое 5 Лапласа (θ , φ ) Нормальное (ξ , σ ) θ

с плотностью распределения  (   )      2 1 1 σ x−ξ σ x−ξ exp Φ − exp + pX (x) = 2φ

2

φ

σ

φ

φ

     x−ξ σ x−ξ exp , (24.77) + Φ − − σ

φ

x 1 где Φ(x) = (2π )−1/2 −∞ exp(− t2 )dt. Второе 2 5 Гамма (α , β ) Лапласа (θ , φ )

φ

φ −1

(гамма-распределение описано в гл. 17). Плотность распределения смеси равна

−(α +1) 1 . (24.78) pX (x) = αβ 1 + |x − θ |β 2

Соотношение между распределением (24.78) и распределением Лапласа в некотором смысле подобно соотношению между распределением Пирсона типа VII и нормальным распределением (гл. 28). Заметим, к примеру, что, 1 если β →0, и α → ∞ так, что αβ = 1, то pX (x) → exp(−|x − θ |). 2 Распределение (24.78) симметрично относительно θ . Моменты порядка, большего α , не существуют. При четном r < α r   r μr = αβ r (−1)j (24.79) (α + j − r)−1 . j=0

j

В частности, дисперсия равна

и

σ2 =

2β 2 , (α − 1)(α − 2)

α > 2,

(24.80)

β2 =

6(α − 1)(α − 2) , (α − 3)(α − 4)

α > 4.

(24.81)

Среднее отклонение ν1 =

β ; α −1

таким образом Среднее отклонение = Стандартное отклонение

(24.82) 6

2(α − 2) . α−1

174

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

Функция распределения имеет весьма простой вид: ⎧1 ⎨ {1 + |x − θ |β }−α , x  θ, FX (x) = 2 ⎩ 1 − 1 {1 + |x − θ |β }−α , x  θ. 2

Subbotin (1923) в довольно широких предположениях относительно «распределения ошибок» вывел класс плотностей *  2/δ +  −1  1 1  x − θ  (δ /2)+1 −1 , δ , φ > 0, (24.83) pX (x) = 2 Γ δ +1 φ exp −   2

2

φ

см. также работу Frech´et (1924), цитируемую Субботиным. Класс распределений (24.83) включает распределение Лапласа (δ = 2), нормальное (δ = 1) и как предельный случай при δ → 0, — равномерное распределение. Центральный момент порядка r равен ⎧ ⎨ 0 при нечетном r,  r rδ /2 (24.84) μr = ⎩ φ 2 Γ (r + 1)δ /2 при четном r. Γ(δ /2)

Дисперсия и среднее отклонение даются формулами σ2 =

и ν1 =

2δ Γ(3δ /2) 2 φ Γ(δ /2)

(24.85)

2δ /2 Γ(δ ) φ. Γ(δ /2)

(24.86)

Следовательно, Среднее отклонение Γ(δ ) . = Стандартное отклонение Γ(δ /2)Γ(3δ /2) 1/2 Далее, β2 =

Γ(5δ /2)Γ(δ /2)

2 . Γ(3δ /2)

(24.87)

(24.88)

Некоторые значения отношения (24.87) и β2 приведены в табл. 24.10. Функция распределения, соответствующая плотности (24.83) выражается через неполную гамма-функцию. Оценки максимального правдоподобия параметров распределения рассмотрены в работах Diananda (1949) и Turner (1960). Семейства распределений (24.78) и (24.83) использованы в работе Box and Tiao (1962) как априорное распределение при байесовском подходе к нескольким статистическим задачам. Распределение дает удобную альтернативу нормальному распределению в случае приемлемости допущения о симметрии, следовательно, может использоваться при анализе устойчивости. Например, Tiao and Lund (1970) рассматривают линейную оценку с минимальной дисперсией для анализа устойчивости оценки параметра смещения распределения (24.83). Авторы также рассматривают свойства порядковых статистик из этого распределения. Jakuszenkov (1979) рассмотрел случай

175

6. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЛАПЛАСА

ТАБЛИЦА 24.10 Отношение среднего отклонения к стандартному отклонению и β2 для распределения Субботина δ

Среднее отклонение Стандартное отклонение

β2

0 (равномерное) 0.25 0.5 0.75 1 (нормальное) 1.5 2 (Лапласа) 3 4 5

0.866 0.858 0.841 0.815 0.798 0.757 0.707 0.623 0.548 0.481

1.800 1.923 2.188 2.548 3.000 4.222 6.000 12.257 25.200 51.951

θ = 0 и при известном δ получил оценку дисперсии распределения (24.83), пропорциональную φ 2 . Sharma (1984) получил улучшенный вариант этой оценки. Zeckhauser and Thompson (1970) изучили линейную регрессионную модель с ошибками, имеющими распределение Субботина (24.83). Конкретно, авторы исследовали модель

yi = a + bxi + ei ,

i = 1, 2, . . . , n,

где (xi , yi ) — заданные пары наблюдений, и ошибки — н. о. р. случайные величины с плотностью (24.83) при θ = 0. Параметрами модели являются a, b, φ , и δ . Функция правдоподобия по полной выборке равна 2/δ

L(a, b, φ , δ ) = ce−S/φ где S=

n 

,

2/δ

|yi − a − bxi |

.

i=1

По этим формулам видно, что параметр φ не влияет на оценки параметров линии регрессии и что ОМП параметра φ есть  δ /2 # = 2S φ . nδ

В той же работе Zeckhauser and Thompson (1970) рассмотрели ОМП параметров a, b и δ . Krysicki (1966) приводит формулы для оценок параметров смеси двух распределений Лапласа при θ = 0. Sr´odka (1966) изучает распределение в случае, если φ −1 имеет гамма-распределение (определенное в гл. 17). Kanji (1985) и Jones and McLachlan (1990) рассмотрели смесь распределения Лапласа и нормального распределения, плотность которого равна pX (x; θ , φ , σ , p) =

p −|(x−θ )/φ | 1 − p −(x−θ )2 /2σ 2 e +√ e , 2φ 2πσ

−∞ < x < ∞,

(24.89)

176

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

и применили ее для сглаживания данных о розе ветров. ОМП параметров распределения (24.89) рассмотрены в работе Scallan (1992). Отраженное гамма-распределение с плотностью    x − θ α −1 −|(x−θ )/φ | 1   pX (x) = e , −∞ < x < ∞, α , φ > 0, (24.90)   2φ Γ(α )

φ

введенное Borghi (1965), дает распределение Лапласа в частном случае α = 1. Kantam and Narasimham (1991), рассматривая наилучшие линейные несмещенные оценки и некоторые другие линейные оценки θ , заметили, что, в отличие от распределения Лапласа, медиана не является эффективной оценкой θ при больших α . Harvey (1967) определил более общую форму отраженного распределения Лапласа (24.1). В отличие от (24.90), обобщенная плотность, введенная в работе Harvey, вообще говоря, не обращается в нуль при x = θ . Двойное распределение Вейбулла, введенное в работе Balakrishnan and Kocherlakota (1985), имеет плотность  c−1 c c  x − θ  pX (x) = e−|(x−θ )/φ | , −∞ < x < ∞, c, φ > 0 (24.91)   2φ

φ

и является семейством симметричных распределений, превращающимся в распределение Лапласа, если положить параметр формы c = 1. Balakrishnan and Kocherlakota (1985) и Dattatreya Rao and Narasimham (1989) получили НЛНО параметров θ и φ при известном c, в случае полной выборки и цензурированной выборки по типу II соответственно. Vasudeva Rao, Dattareya Rao and Narasimham (1991) в предположении, что параметр θ известен, предложили оптимальные оценки для φ , основанные на значениях |Xi − θ | [Заметим, что ОМП параметра φ для распределения Лапласа являются линейной формой от |Xi − θ |]. Интересное соотношение между логистическим распределением и распределением Лапласа выведено в работе George and Rousseau (1987), в которой рассматривается распределение полусуммы крайних значений выборки из логистического распределения (см. гл. 23). В рамках изучения асимметричных нормальных распределений (см. гл. 12 и 13), введенных Azzalini (1985), Balakrishnan and Ambagaspitiya (1994) рассмотрели асимметричное распределение Лапласа с плотностью 2pX (x)FX (λ x),

(24.92)

где pX (x) — двухпараметрическая плотность Лапласа (24.1), FX (·) — соответствующая функция распределения (24.11). Balakrishnan and Ambagaspitiya (1994) изучили некоторые свойства этого распределения, которое превращается в распределение Лапласа при λ = 0 и в двухпараметрическое показательное распределение при λ → ∞. Авторы также рассмотрели порядковые статистики из этого распределения и получили НЛНО параметров θ и φ при известном λ . Распределение с характеристической функцией −1

ϕX (t) = 1 + |t|α , −∞ < t < ∞, 0 < α  2, (24.93)

177

6. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАСПРЕДЕЛЕНИЕМ ЛАПЛАСА

называется α -распределением Лапласа, так как при α = 2 превращается в характеристическую функцию распределения Лапласа. Как показали Линник и Лаха (Linnik and Laha), распределение является унимодальным, см., например, Lukacs (1970). Pillai (1985) ввел более широкий класс распределений, названных им полу-α -распределениями Лапласа и включающий, в частности, α -распределение Лапласа. Пусть φ (t) — характеристическая функция, не обращающаяся в нуль, определенная формулой φX (t) = (1 + f (t))−1 .

(24.94)

Из свойств характеристической функции следует непрерывность f (t) и равенство f (0) = 0. Функция распределения f в (24.94) называется полу-α лапласовской, если f (t) удовлетворяет уравнению 0 < b < 1,

f (t) = af (bt),

(24.95)

где a является единственным решением уравнения abα = 1,

0 < α  2.

(24.96)

Числа b и α называются порядком и показателем полу-α -распределения Лапласа соответственно. Pillai (1985) доказал следующее характеризационное свойство этого распределения: «чтобы F(x) было функцией распределения величины X, имеющей полуα -распределение Лапласа порядка b необходимо и достаточно, чтобы F(x) удовлетворяло уравнению F(x) = pF1 (x) + (1 − p)F2 (x)

(24.97)

для некоторого p ∈ (0, 1); здесь F1 (x) — функция распределения bX и F2 (x) = F ∗ F1 (x).» Здесь F ∗ F1 свертка функций F и F1 . Другие свойства этого распределения обсуждаются в работах Pillai (1985) и Divanji 1988). Распределение, характеристическая функция которого, дается формулой (24.93), еще называют распределением Линника [см., например, Devroye (1990)]. Используя тот факт, что при α  1 функция φX (t) есть характеристическая функция Пойа, Devroye (1986) предложил простой алгоритм получения псевдослучайных чисел, распределенных по этому закону. В дальнейшем Devroye (1990) разработал алгоритм, применимый при всех α , основанный на следующем факте. Пусть Sα — симметричная устойчивая α случайная величина с характеристической функцией e−|t| и Vβ — независимая от нее случайная величина с плотностью β

e−v

, Γ 1 + 1/β

v > 0. β /α

Тогда характеристическая функция случайной величины X = Sα Vβ  

α β φX (t) = E eitX = E e−|t| Vβ =

1 Γ(1 + 1/β )

∞ 

β

e−v

−|t|α vβ

равна

−1/β

dv = 1 + |t|α .

0

(24.98)

178

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

При β = 1 (24.98) превращается в характеристическую функцию распределения 1/α Линника (24.93). Этот факт не только показывает, что Sα V1 имеет характеристическую функцию (24.93), где V1 — показательная случайная величина, но является наиболее кратким доказательством «характеричности» функции 24.93. Lin (1994) исследовал некоторые ее свойства, такие как разложимость в произведение аналогичных функций, и доказал две характеризационные теоремы. Kotz and Ostrovskii (1994) представили распределение Линника в виде смеси. Конкретно, пусть Xα и Xβ — случайные величины, имеющие распределение Линника (24.93) с параметрами α и β соответственно (0 < α < β  2) и Yαβ — неотрицательная случайная величина, не зависящая от Xβ , с плотностью   β πα sα −1 g(s; α , β ) = sin , 0 < s < ∞. (24.99) · 2α α π

β

1+s

+ 2s cos(πα /β )

Kotz and Ostrovskii (1994) показали, что d

Xα = Xβ Xαβ

(24.100)

Из этого представления легко следует безграничная делимость смеси распределений Линника по параметру α и параметру масштаба. Kotz and Ostrovski and Hayfavi (1994) получили сходящиеся асимптотические разложения плотности распределения Линника. Вид плотности существенно зависит от числового значения α . Например, при α = 1 p1 (x) =

7.

∞ 1 1 1 1 Γ (2k + 1) 2k (cos x) · log + sin |x| + (−1)k 2 x . π |x| 2 π Γ (2k + 1) k=1

(24.101)

Приложения

В п. 2 уже говорилось, что распределение Лапласа, имеющее более тяжелый хвост по сравнению с нормальным, часто используется как альтернатива нормальному в анализе робастности, см., например, Andrews et al. (1972) и Hoaglin, Mosteller and Tukey (1985). Кроме того, распределение Лапласа находит и собственные приложения. Manly (1976) приводит примеры подгонки функций, основанного на двойном экспоненциальном распределении. Easterling (1978) рассмотрел модель контроля работоспособности парового генератора на основе откликов с ошибками измерений, распределенными по закону Лапласа. Hsu (1979) рассмотрел использование распределений с тяжелыми хвостами применительно к анализу ошибок навигации и подтвердил применимость распределения Лапласа. Применение двойного показательного распределения для моделирования экстремальных значений силы ветра в Японии обсуждается в работе Okubo and Narita (1980). Как уже упомянуто в предыдущем пункте, смесь распределения Лапласа и нормального распределения (24.89) использована в работах Kanji (1985) и Jones and McLachlan (1990). Bagchi, Hayya and

СПИСОК ЛИТЕРАТУРЫ

179

Ord (1983) применили распределение Лапласа при моделировании спроса во время лидерства при медленном изменении процесса. Dadi and Marks (1987) рассмотрели свойства индикатора относительной эффективности при наличии лапласовского шума. Некоторые другие приложения распределения Лапласа упомянуты в пп. 4 и 6.

Список литературы Ahsnaullah, M., and Rahim, M. A. (1973). Simplified estimates of the parameters of the double exponential distribution based on optimum order statistics from a middle-censored sample, Naval Research Logistics Quarterly, 20, 745–751. Akahira, M. (1987). Second order asymptotic comparison of estimators of a common parameter in the double exponential case, Annals of the Institute of Statistical Mathematics, 39, 25–36. Akahira, M. (1990). Second order asymptotic comparison of the discretized likelihood estimator with asymptotically efficient estimators in the double exponential case, Metron, 48, 5–17. Akahira, M., and Takeuchi, K. (1990). Loss of information associated with the order statistics and related estimators in the double exponential distribution case, Australian Journal of Statistics, 32, 281–291. Akahira, M., and Takeuchi, K. (1993). Second order asymptotic bound for the variance of estimators for the double exponential distribution, In Statistical Science & Data Analysis (ed., K. Matusita et al.), Amsterdam, Netherlands: VSP Publishers, pp. 375–382. Ali, M. Masoom, Umbach, D., and Hassanein, K. M. (1981). Estimation of quantiles of exponential and double exponential distributions based on two order statistics, Communications in Statistics— Theory and Methods, 10, 1921–1932. Andrews, D. F., Bickel, P. J., Hampel, F. R., Huber, P. J., Rogers, W. H., and Tukey, J. W. (1972). Robust Estimates of Location, Princeton, NJ: Princeton University Press. Asrabadi, B. R. (1985). The exact confidence interval for the scale parameter and the MVUE of the Laplace distribution, Communications in Statistics— Theory and Methods, 14, 713–733. Awad, A. M., and Fayoumi, M. (1985). Estimation of P(Y < X) in case of the double exponential distribution, Proceedings of 7th Conference on Probability Theory, Brasor, Romania, 527–531. Azzalini, A. (1985). A class of distributions which includes the normal ones, Scandinavian Journal of Statistics, 12, 171–178. Bagchi, U., Hayya, J. C., and Ord, J. K. (1983). The Hermite distribution as a model of demand during lead time for slow-moving items, Decision Sciences, 14, 447–466. Bain, L. J., and Engelhardt, M. (1973). Interval estimation for the two-parameter double exponential distribution, Technometrics, 15, 875–887. Balakrishnan, N. (1988). Recurrence relations among moments of order statistics from two related outlier models, Biometrical Journal, 30, 741–746. Balakrishnan, N. (1989). Recurrence relations among moments of order statistics from two related sets of independent and non-identically distributed random variables, Annals of the Institute of Statistical Mathematics, 41, 323–329. Balakrishnan, N., and Ambagaspitiya, R. S. (1988). Relationships among moments of order statistics in samples from two related outlier models and some applications, Communications in Statistics— Theory and Methods, 17, 2327–2341. Balakrishnan, N., and Ambagaspitiya, R. S. (1994). On skew-Laplace distributions, Report, McMaster University, Hamilton, Ontario, Canada.

180

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

Balakrishnan, N„ and Chandramouleeswaran, M. P. (1994a). Reliability estimation and tolerance limits for Laplace distribution based on censored samples, Report, McMaster University, Hamilton, Ontario, Canada. Balakrishnan, N., and Chandramouleeswaran, M. P. (1994b). Prediction intervals for Laplace distribution based on censored samples, Report, McMaster University, Hamilton. Ontario. Canada. Balakrishnan, N., Chandramouleeswaran, M. P., and Ambagaspitiya, R. S. (1994). BLUE’s of location and scale parameters of Laplace distribution based on Type-II censored samples and associated inference, Report, McMaster University, Hamilton, Ontario, Canada. Balakrishnan, N.. Chandramouleeswaran, M. P., and Govindarajulu, Z. (1994). Inference on parameters of the Laplace distribution based on Type-II censored samples using Edgeworth approximation, Report, McMaster University, Hamilton, Ontario, Canada. Balakrishnan, N., and Cohen, A. C. (1991). Order Statistics and Inference: Estimation Methods, San Diego, CA: Academic Press. Balakrishnan, N., and Cutler, C. D. (1994). Maximum likelihood estimation of the Laplace parameters based on Type-II censored samples, In H. A. David Festschrift Volume (eds, D. F. Morrison, H. N. Nagaraja, and P. K. Sen), New York: Springer-Verlag (to appear). Balakrishnan, N., Govindarajulu, Z., and Balasubramanian, K. (1993). Relationships between moments of two related sets of order statistics and some extensions, Annals of the Institute of Statistical Mathematics, 45, 243–247. Balakrishnan, N., and Kocherlakota, S. (1985). On the double Weibull distribution: Order statistics and estimation, Sankhy¯a, Series B, 47, 161–178. Balakrishnan, N., and Kocherlakota, S. (1986). Effects of nonnormality on X charts: Single assignable cause model, Sankhy¯a, Series B, 48, 439–444. Balanda, K. P. (1987). Kurtosis comparisons of the Cauchy and double exponential distributions, Communications in Statistics— Theory and Methods, 16, 579–592. Barnett, V., and Lewis, T. (1994). Outliers in Statistical Data, 3d ed., Chichester, England: Wiley. Borghi, O. (1965). Sobre una distributi´on de frecuencias, Trahajos de Estadistica, 16, 171–192. Box, G. E. P., and Tiao, G. C. (1962). A further look at robustness via Bayes’s theorem, Biometrika, 49, 419–432. Brown, B. M., and Resnick, S. I. (1977). Extreme values of independent stochastic processes, Journal of Applied Probability, 14, 732–739. Chan, L. K, and Chan, N. N. (1969). Estimates of the parameters of the double exponential distribution based on selected order statistics, Bulletin of the Institute of Statistical Research and Training, 3, 21–40. Cheng, S. W. (1978). Linear quantile estimation of parameters of the double exponential distribution, Soochow Journal of Mathematics, 4, 39–50. Chu, J. T., and Hotelling, H. (1955). The moments of the sample median. Annals of Mathematical Statistics, 26, 593–606. Craig, A. T. (1932). On the distribution of certain statistics, American Journal of Mathematics, 54, 353–366. Dadi, M. I., and Marks, R. J., II (1987). Detector relative efficiencies in the presence of Laplace noise, IEEE Transactions on Aerospace and Electronic Systems, 23, 568–582. Damsleth, E., and El-Shaarawi, A. H. (1989). ARMA models with double-exponentially distributed noise, Journal of the Royal Statistical Society, Series B, 51, 61–69. Dattatreya Rao, A. V., and Narasimham, V. L. (1989). Linear estimation in double Weibull distribution, Sankhy¯a, Series B, 51, 24–64.

СПИСОК ЛИТЕРАТУРЫ

181

David, H. A. (1981). Order Statistics, 2d ed., New York: Wiley 1) . Davis, R., and Resnick, S. I. (1988). Extremes of moving averages of random variables from the domain of attraction of the double exponential distribution, Stochastic Processes, 30, 41–68. Devroye, L. (1986). Non-uniform Random Variate Generation, New York: Springer- Verlag. Devroye, L. (1990). A note on Linnik’s distribution, Statistics & Probability Letters, 9, 305–306. Diananda, P. H. (1949). Note on some properties of maximum likelihood estimates, Proceedings of the Cambridge Philosophical Society, 45, 536–544. Divanji, G. (1988). On semi α -Laplace distributions, Journal of the Indian Statistical Association, 26, 31–38. Dobrogowski, A. (1976). A property of the double exponential distribution, Matematyka Stosowana, Polskie Towarzystwo Matematycznego, 6, 49–52. (In Polish.) Dwinas, S. (1948). A deduction of the Laplace-Gauss law of errors, Revista Matem´atica Hispano-Americana, 8(4), 12–18. (In Spanish.) Easterling, R. G. (1978). Exponential responses with double exponential measurement error— A model for steam generator inspection, Proceedings of the DOE Statistical Symposium, U.S. Department of Energy, pp. 90–110. Edwards, A. W. F. (1974). Letter to the Editor, Technometrics, 16, 641–642. Edwards, L. (1948). The use of normal significance limits when the parent population is of Laplace form, Journal of the Institute of Actuaries Students’ Society, 8, 87–99. Efron, B. (1986). Double exponential families and their use in generalized linear regression, Journal of the American Statistical Association, 81, 709–721. Farison, J. B. (1965). On calculating moments for some common probability laws, IEEE Transactions on Information Theory, 11, 586–589. Feller, W. (1966). An Introduction to Probability Theory and Its Applications, vol. 2, New York: Wiley 2) . Findeisen, P. (1981). Characterization of the bilateral exponential distribution, Metrika, 29, 95–102. (In German.) Fr´echet, M. (1924). Sur la loi des erreurs d’observation, Matematicheskii Sbornik, 32, 1–8 3) . Fr´echet, M. (1928). Sur l’hypothese de l’additivite des erreurs partielles, Bulletin des Sciences et Mathematiques, Paris, 63, 203–206. Gallo, F. (1979). On the Laplace first law: Sample distribution of the sum of values and the sum of absolute values of the errors; distribution of the related T, Statistica, 39, 443–454. George, E. O., and Rousseau, C. C. (1987). On the logistic midrange, Annals of the Institute of Statistical Mathematics, 39, 627–635. Govindarajulu, Z. (1963). Relationships among moments of order statistics in samples from two related populations, Technometrics, 5, 514–518. Govindarajulu, Z. (1966). Best linear estimates under symmetric censoring of the parameters of a double exponential population, Journal of the American Statistical Association, 61, 248–258. (Correction: 71, 255.) Greenwood, J. A., Olkin, I., and Savage, I. R. (1962). Index to Annals of Mathematical Statistics, Volumes 1–31, 1930–1960. University of Minnesota, Minneapolis St. Paul: North Central Publishing. 1) Дэйвид

Г. Порядковые статистики. — М.: Наука, 1979. — 336 с. В. Введение в теорию вероятностей и ее приложения. — Т. 2. — М.: Мир, 1984. 3) Фреше М. О законе ошибок наблюдений // Математический сборник. — Т. 32. — 1924. — С. 5–8. 2) Феллер

182

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

Grice, J. V., Bain, L. J., and Engelhardt, M. (1978). Comparison of conditional and unconditional confidence intervals for the double exponential distribution, Communications in Statistics— Simulation and Computation, 7, 515–524. Hall, D. L., and Joiner, B. L. (1983). Asymptotic relative efficiencies of R-estimators of location, Communications in Statistics— Theory and Methods, 12, 739–763. Harter, H. L., Moore, A. H., and Curry, T. F. (1979). Adaptive robust estimation of location and scale parameters of symmetric populations, Communications in Statistics— Theory and Methods, 8, 1473–1492. Harvey, H. (1967). A Family of Averages in Statistics, Morrisville, PA: Annals Press. Hausdorff, F. (1901). Beitrage zur Wahrscheinlichkeitsrechnung, Verhandlungen der Konigliche Sachsischen Gesellschaft der Wissenschaften, Leipzig, MathematischPhysische Classe, 53, 152–178. Hoaglin, D. C„ Mosteller, F., and Tukey, J. W. (eds.) (1983). Understanding Robust and Exploratory Data Analysis, New York: Wiley. Holla, M. S., and Bhattacharya, S. K. (1968). On a compound Gaussian distribution, Annals of the Institute of Statistical Mathematics, 20, 331–336. Hombas, V. C. (1986). The double exponential distribution: Using calculus to find a maximum likelihood estimator, The American Statistician, 40, 178. Horn, P. S. (1983). A measure of pcakedness, The American Statistician, 37, 55–56. Hsu, D. A. (1979). Long-tailed distributions for position errors in navigation, Applied Statistics, 28, 62–72. Hwang, J. T., and Chen, J. (1986). Improved confidence sets for the coefficients of a linear model with spherically symmetric errors, Annals of Statistics, 14, 444–460. Iliescu, D. V., and Voda, V. Gh. (1973). Proportion-p estimators for certain distribution, Statistica, 33, 309–321. Jakuszenkow, H. (1979). Estimation of the variance in the generalized Laplace distribution with quadratic loss function, Demonstratio Mathematica, 12, 581–591. Johnson, N. L. (1954). Systems of frequency curves derived from the first law of Laplace, Trabajos de Estad´ıstica, 5, 283–291. Jones, P. N., and McLachlan, G. J. (1990). Laplace-normal mixtures fitted to wind shear data, Journal of Applied Statistics, 17, 271–276. Joshi, S. N. (1984). Expansion of Bayes risk in the case of double exponential family, Sankhy¯a, Series A, 46, 64–74. Kacki, K., and Krysicki, W. (1967). Die Parameterschatzung einer Mischung von zwei Laplaceschen Verteilungen (im allgemeinen Fall), Roczniki Polskiego Towarzystwa Matematycznego, Seria I: Prace Matematyczne, 11, 23–31. Kanji, G. K. (1985). A mixture model for wind shear data, Journal of Applied Statistics, 12, 49–58. Kantam, R. R. L., and Narasimham, V. L. (1991). Linear estimation in reflected gamma distribution, Sankhy¯a, Series B, 53, 25–47. Kappenman, R. F. (1975). Conditional confidence intervals for double exponential distribution parameters, Technometrics, 17, 233–236. Kappenman, R. F. (1977). Tolerance intervals for the double exponential distribution, Journal of the American Statistical Association, 72, 908–909. Karst, O. J., and Polowy, H. (1963). Sampling properties of the median of a Laplace distribution, American Mathematical Monthly, 70, 628–636. Keynes, J. M. (1911). The principal averages and the laws of error which lead to them, Journal of the Royal Statistical Society, Series A, 74, 322–328. Khan, A. H., and Khan, R. V. (1987). Relations among moments of order statistics in samples from doubly truncated Laplace and exponential distributions, Journal of Statistical Research, 21, 35–44.

СПИСОК ЛИТЕРАТУРЫ

183

Kotz, S., Johnson, N. L., and Read, C. B. (1985). Log-Laplace distribution, In Encyclopedia of Statistical Sciences, vol. 5 (eds., S. Kotz, N. L. Johnson, and C. B. Read), New York: Wiley, pp. 133–134. Kotz, S., and Ostrovskii, I. (1994). A mixture representation of the Linnik distribution, Statistics & Probability Letters (to appear). Kotz, S., Ostrovskii, I., and Hayfavi, A. (1994). Analytic and asymptotic properties of Linnik’s probability densities, Submitted for publication. Krysicki, W. (1966). Zastosowani metody momentow do estymacji paramctrow mieszaniny dwoch rozklad´ow Laplace’a, Zeszyty Naukowe Politechniki L´odzkiej, 59, 5–13. Laplace, P. S. (1774). Memoirc sur la probabilit´e des causes par les evenemens, M´emoires de Math´ematique et de Physique, 6, 621–656. Lien, D. H. D., Balakrishnan, N., and Balasubramanian, K. (1992). Moments of order statistics from a non-overlapping mixture model with applications to truncated Laplace distribution, Communications in Statistics— Theory and Methods, 21, 1909–1928. Lin, G. D. (1994). Characterizations of the Laplace and related distributions via geometric compound, Sankhy¯a, Series A, 56, 1–9. Lin, P. K. H., Richards, D. O., Long, D. R., Myers, M. D„ and Taylor, J. A. (1983). Tables for computing shortest confidence intervals involving the F-distribution, Communications in Statistics— Simulation and Computation, 12, 711–725. Ling, K. D. (1977). Bayesian predictive distribution for sample from double exponential distribution, Nanta Mathematica, 10, 13–19. Ling, K. D., and Lim, S. K. (1978). On Bayesian predictive distribution for samples from double exponential distribution based on grouped data, Nanta Mathematica, 11, 192–201. Lingappaiah, G. S. (1988). On two-piece double exponential distributions, Journal of the Korean Statistical Society, 17, 46–55. Loh, W.-Y. (1984). Random quotients and robust estimation, Communications in Statistcs— Theory and Methods, 13, 2757–2769. Lukacs, E. (1970). Characteristic Functions, Second edition, London: Griffin. Manly, B. F. J. (1976). Some examples of double exponential fitness functions, Heredity, 36, 229–234. Mantel, N. (1969). More light bulb statistics, The American Statistician, 23, 21–23. Mantel, N. (1970). A characteristic function exercise, The American Statistician, 24(4), 50. Mantel, N. (1987). The Laplace distribution and 2 by 2 unit normal determinants, The American Statistician, 41, 88. Mantel, N., and Pasternack, B. S. (1966). Light bulb statistics, Journal of the American Statistical Association, 61, 633–639. McGill, W. J. (1962). Random fluctuations of response rate, Psychometrika, 27, 3–17. Missiakoulis, S., and Darton, R. (1985). The distribution of 2 by 2 unit normal determinants, The American Statistician, 39, 241. Nicholson, W. L. (1958). On the distribution of 2 × 2 random normal determinants, Annals of Mathematical Statistics, 29, 575–580. Norton, R. M. (1984). The double exponential distribution: Using Calculus to find a maximum likelihood estimator, The American Statistician, 38, 135–136. Nyquist, H., Rice, S. O., and Riordan, J. (1954). The distribution of random determinants, Quarterly of Applied Mathematics, 42, 97–104. Ogawa, J. (1951). Contribution to the theory of systematic statistics, I, Osaka Mathematical Journal, 3, 175–213. Okubo, T., and Narita, N. (1980). On the distribution of extreme winds expected in Japan, National Bureau of Standards Special Publication 560–1, 12 pp.

184

ГЛАВА 24. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА (ДВОЙНОЕ ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ)

Ord, J. K. (1983). Laplace distribution, In Encyclopedia of Statistical Sciences, vol. 4 (eds., S. Kotz, N. L. Johnson, and C. B. Read), New York: Wiley, pp. 473–475. Parker, I. (1988). Transformations and influential observations in minimum sum of absolute errors regression, Technometrics, 30, 215–220. Patel, S. R. (1986). On estimation of finite mixtures of distributions, Journal of the Indian Statistical Association, 24, 53–63. Pillai, R. N. (1985). Semi-α -Laplace distributions, Communications in Statistics— Theory and Methods, 14, 991–1000. Raghunandanan, K, and Srinivasan, R. (1971). Simplified estimation of parameters in a double exponential distribution, Technometrics, 13, 689–691. Ramsey, F. L. (1971). Small sample power functions for nonparametric tests of location in the double exponential family, Journal of the American Statistical Association, 66, 149–151. (Correction, 72, 703.) Rosenberger, J. L., and Gasko, M. (1983). Comparing location estimators: Trimmed means, medians and trimean, In Understanding Robust and Exploratory Data Analysis, (eds., D. C. Hoaglin, F. Mosteller, and J. W. Tukey), New York: Wiley, pp. 297–338. Saleh, A. K. Md. E., Ali, M. Masoom, and Umbach, D. (1983). Estimating the quantile function of a location-scale family of distributions based on few selected order statistics, Journal of Statistical Planning and Inference, 8, 75–86. Sansing, R. C. (1976). The t-statistic for a double exponential distribution, SIAM Journal of Applied Mathematics, 31, 634–645. Sarhan, A. E. (1954). Estimation of the mean and standard deviation by order statistics, Part I, Annals of Mathematical Statistics, 25, 317–328. Sarhan, A. E. (1955). Ibid., Part III, Annals of Mathematical Statistics, 26, 576–592. Sassa, H. (1968). The probability density of a certain statistic in one sample from the double exponential population, Bulletin, Tokyo Gakugei University, 19, 85–89. (In Japanese.) Scallan, A. J. (1992). Maximum likelihood estimation for a normal/Laplace mixture distribution, The Statistician, 41, 227–231. Schlittgcn, R. (1979). The median test and inhomogeneity of slopes, Biomedical Journal, 21, 287–292. Shamma, S. E., Amin, R. W., and Shamma, A. K. (1991). A double exponentially weighted moving average control procedure with variable sampling intervals, Communications in Statistics— Simulation and Computation, 20, 511–528. Sharma, D. (1984). On estimating the variance of a generalized Laplace distribution, Metrika, 31, 85–88. Shyu, J.-C., and Owen, D. B. (1986a). One-sided tolerance intervals for the twoparameter double exponential distribution, Communications in Statistics— Simulation and Computation, 15, 101–119. Shyu, J.-C., and Owen, D. B. (1986b). Two sided tolerance intervals for the twoparameter double exponential distribution, Communications in Statistics— Simulation and Computation, 15, 479–495. Shyu, J.-C., and Owen, D. B. (1987). β -expectation tolerance intervals for the double exponential distribution, Communications in Statistics— Simulation and Computation, 16, 129–239. Smith, J. H. (1947). Estimation of linear functions of cell proportions, Annals of Mathematical Statistics, 18, 231–254. Srinivasan, R., and Wharton, R. M. (1982). Confidence bands for the Laplace distribution. Journal of Statistical Computation and Simulation, 14, 89–99. ´ odka, T. (1964). Estymatory i przcdzialy ufnosci odchylenia standardowego w rozkladzie Sr´ Laplace’a, Zeszyty Naukowe Politechniki L´odzkiej, 57, 5–9.

СПИСОК ЛИТЕРАТУРЫ

185

´ odka, T. (1966). Zlozcnie rozkladu Laplace’a z pewnym uogolnionym rozkladcm gamma, Sr´ Maxwella i Wcibulla, Zeszyty Naukowe Politechniki Lodzkiej, 59, 21–28. Stigler, S. M. (1975). Napoleonic statistics: The work of Laplace, Biometrika, 62, 503–517. Subbotin, M. T. (1923). On the law of frequency of errors, Mathematicheskii Sbornik, 31, 296–301. Sugiura, N., and Naing, M. T. (1989). Improved estimators for the location of double exponential distribution, Communications in Statistics— Theory and Methods, 18, 541–554. Takano, K. (1988). On the Levy representation of the characteristic function of the probability distribution ce−|x| dx, Bulletin of the Faculty of Science, Ibaraki University, 20, 61–65. Tiao, G. C., and Lund, D. R. (1970). The use of OLUMV estimators in inference robustness studies of the location parameter of a class of symmetric distributions, Journal of the American Statistical Association, 65, 370–386. Turner, M. C. (1960). On heuristic estimation methods, Biometrics, 16, 299–301. Ulrich, G., and Chen, C.-C. (1987). A bivariate double exponential distribution and its generalization, ASA Proceedings on Statistical Computing, 127–129. Umbach, D., Ali, M. Masoom, and Saleh, A. K. Md. E. (1984). Hypothesis testing for the double exponential distribution based on optimal spacing, Soochow Journal of Mathematics, 10, 133–143. Uppuluri, V. R. R. (1981). Some properties of the log-Laplace distribution, In Statistical Distributions in Scientific Work, vol. 4, (eds., G. P. Patil, C. Taillie and B. Baldessari), Dordrecht: Reidel, pp. 105–110. Uthoff, V. A. (1973). The most powerful scale and location invariance test of the normal versus the double exponential, Annals of Statistics, 1, 170–174. van Zwet, W. R. (1964). Convex Transformations of Random Variables, Amsterdam: Mathematical Centre Tracts 7, Mathematisch Centrum. Vasudeva Rao, A., Dattatreya Rao, A. V., and Narasimham, V. L. (1991). Optimum linear unbiased estimation of the scale parameter by absolute values of order statistics in the double exponential and the double Weibull distributions, Communications in Statistics— Simulation and Computation, 20, 1139–1158. Weida, F. M. (1935). On certain distribution functions when the law of the universe is Poisson’s first law of error, Annals of Mathematical Statistics, 6, 102–110. Wilson, E. B. (1923). First and second law of errors, Journal of the American Statistical Association, 18, 841–851. Yellott, J. I. (1977). The relationship between Luce’s choice axiom, Thurstone’s theory of comparative judgment, and the double exponential distribution, Journal of Mathematical Psychology, 15, 109–144. Yen, V. C., and Moore, A. H. (1988). Modified goodness-of-fit test for the Laplace distribution. Communications in Statistics— Simulation and Computation, 17, 275–281. Zeckhauser, R., and Thompson, M. (1970). Linear regression with non-normal error terms, Review of Economics and Statistics, 52, 280–286.

ГЛАВА 25

Бета-распределение

1.

Определения

Семейство бета-распределений образуется распределениями с плотностью вида pY (y) =

(y − a)p−1 (b − y)q−1 1 , B(p, q) (b − a)p+q−1

a  y  b,

(25.1)

где p > 0, q > 0. Соответствующие распределения будут обозначаться бета (p, q). Эти распределения принадлежат к семейству распределений Пирсона типа I или типа II (см.гл. 12, п. 4.1). Если q = 1, то распределение называют степенным. Преобразование Y −a X= b−a

приводит к плотности pX (x) =

1 xp−1 (1 − x)q−1 , B(p, q)

0  x  1,

(25.2)

что называют стандартной плотностью бета-распределения с параметрами p и q. Ниже в этой главе, в основном, используется именно эта форма. Стандартная степенн´aя плотность равна pX (x) = pxp−1 ,

0  x  1.

(25.2)

Harter (1978) ввел семейство нормированных симметричных бета-распределений с плотностью + * " " p−1

Γ(2p) , − 2p + 1  x  2p + 1. pX (x) = 2p + 1 − x2

√ 2p−1 Γ2 (p) 2 2p + 1

(25.3)

Легко видеть, что E [X] = 0, var(X) = 1. В этой же статье автор приводит явные выражения функции распределения для p = 1.5 (0.5) 4.0. В простейшем случае при p = 2 √   √ √ 3 5 1 1 5x − x3 + , − 5  x  5. (25.4) FX (x) = 100

3

2

186

187

2. ГЕНЕЗИС БЕТА-РАСПРЕДЕЛЕНИЯ

Плотность симметричного бета-распределения с параметром p, средним μ и стандартным отклонением σ равна    p−1 Γ(2p) x−μ 2 2p + 1 − , pX (x) =

√ 2p−1 σ

σ (Γ(p))2 2 2p + 1

"

" μ − σ 2p + 1  x  μ + σ 2p + 1. (25.5) Функция распределения, равная интегралу от плотности (25.2) от 0 до x, есть нормированная неполная бета-функция, обозначаемая Ix (p, q): x 1 tp−1 (1 − t)q−1 dt. (25.6) Ix (p, q) = B(p, q)

0

Термин «нормированная», отличающий (25.6) от неполной бета-функции x (25.7a) Bx (p, q) = t p−1 (1 − t)q−1 dt, 0

зачастую опускается. Свойства функции Ix (p, q) приведены в гл. 1, п. A5 и в гл. 3, п. 6. Dutka (1981) приводит подробную историю возникновения функций Bx (p, q) и Ix (p, q), начиная от упоминания этой функции в письме Исаака Ньютона Генри Ольденбергу, написанном в 1676 г. Формулу (25.7a) можно записать в виде (25.7b) Bx (p, q) = p−1 xp (1 − x)q 2 F1 (p + q, 1; p + 1; x), где 2 F1 (·) — гипергеометрическая функция Гаусса, определенная формулой (1.104) в гл. 1.

2.

Генезис бета-распределения и модели порождения бета-распределенных случайных величин

В теории распределений, связанных с нормальным, бета-распределение 

получается как распределение случайной величины V 2 = X12 / X12 + X22 , где X12 и X22 — независимы и распределены по закону χ 2 с числом степеней свободы ν1 и ν2 соответственно (см. гл. 18). Распределение V 2 является стандартным бета-распределением с параметрами p = ν1 /2 и q = ν2 /2. В более общем случае величина Y = W1 /(W1 + W2 ) имеет стандартное бета-распределение с параметрами p1 и p2 , если Wj имеет гамма-распределение с параметрами (pj , β ), j = 1, 2 при любом β > 0 (см. гл. 17). Заметим, что V 2 и X12 + X22 независимы. Приведем более общую конструкцию. Если X12 , X22 , . . . , Xk2 независимы в совокупности и Xj2 имеет распределение χ 2 с νj степенями свободы, j = 1, 2, . . . , k (см. гл. 18), то величины V12 =

X12 X12 + X22

,

V22 =

X12 + X22 X12 + X22 + X32

, ... ,

2 Vk−1 =

2 X12 + · · · + Xk−1

X12 + · · · + Xk2

188

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

независимы в совокупности и Vj2 имеет бета-распределение с параметрами j 1$ 1 νi и q = νj+1 . В указанных условиях произведение любого числа p= 2

2

i=1

подряд идущих Vj2 также имеет бета-распределение [см. Jambunathan (1954), а также п. 8 настоящей главы]. Это свойство сохраняется при любых положительных (а не только целых) νj . Kotlarski (1962) получил общие условия, при которых произведение независимых случайных величин имеет бета-распределение. В частном случае, при p = q = 1/2 бета-распределение превращается √ 2 в распределение арксинуса: Pr [X  x] = arcsin x, 0  x < 1. Оно возниπ кает в теории случайных блужданий. Рассмотрим частицу, блуждающую по целочисленной решетке, совершая равновероятно скачки на 1 влево или вправо в каждую единицу времени. Считаем, что начальное положение частицы — начало отсчета. Пусть T2n — число попаданий частицы на промежуток [0; 2n] за первые 2n шагов. Тогда    2k 2n − 2k −2n Pr [T2n = 2k] = 2 , k = 0, 1, . . . , n. n−k

k

Отношение T2n /(2n) есть доля времени, проводимая на положительной полуоси (включая нуль). При неограниченном увеличении n предельное распределение T2n /(2n) стремится к распределению арксинуса:  x  √ 1 2 lim Pr [T2n = 2k] = t−1/2 (1 − t)−1/2 dt = arcsin x. (25.8) n→∞

knx

π

π

0

1

называют иногда Стандартные бета-распределения с p + q = 1 и p = 2 обобщенным распределением арксинуса, об этом более подробно говорится в п. 7. Бета-распределение можно получить также как предельное распределение собственных значений случайных матриц. Пусть An — симметрическая n × n-матрица, элементы aij которой — независимые случайные величины. Пусть aij при i = j имеют одинаковые распределения, а элементы aii также имеют одинаковые распределения, но отличные от распределения aij при i = j. Оба типа распределений считаем симметричными относительно нуля, имеющими дисперсию σ 2 и конечные моменты всех порядков. В статье Wigner (1958) показано, что при сформулированных условиях для нормиро1 ванной матрицы √ An доля собственных значений, меньших x, стремится 2σ n к пределу x " 2 1 − t2 dt π

−1

при n → ∞. Эта формула является частным случаем (25.1) при a = −1, b = 1, p = q = 3/2. Arnold (1967) доказал, что результат сохраняется при более слабых ограничениях на распределение элементов aij .

189

2. ГЕНЕЗИС БЕТА-РАСПРЕДЕЛЕНИЯ

ТАБЛИЦА 25.1

Фактические и номинальные значения β2 p

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

Фактическое значение β2 1.287 1.315 1.348 1.388 1.438 1.500 1.580 1.687 1.831 2.019 2.143 Номинальное 1.320 1.345 1.374 1.408 1.449 1.500 1.563 1.645 1.754 1.909 2.143 значение β2

  1 1 Класс распределений, включающих бета , и бета (2, 2), получается 2 2 следующим образом. Пусть X — равномерно распределена на (0; 1) (т. е. ее распределение есть бета(1, 1)). По реализации X1 этой случайной величины возьмем один из промежутков (0, X1 ) или (X1 , 1), выбирая с вероятностью p более длинный из них, и с вероятностью 1 − p — более короткий. Обозначим выбранный интервал (L1 , U1 ); затем рассмотрим реализацию X2 случайной величины, равномерно распределенной на (L1 , U1 ) и выберем более длинный или более короткий из интервалов (L1 , X2 ) и (X2 , U1 ) с вероятностью p и 1 − p соответственно. Продолжив аналогично, выбираем в качестве (Ln+1 , Un+1 ) более длинный или более короткий из промежутков (Ln , Xn+1 ) и (Xn+1 , Un ) с вероятностью p и 1 − p соответственно. Понятно, что при n → ∞ длина n-го промежутка, равная (Un − Ln ), стремится к нулю с вероятностью 1 и, следовательно, существует предельное значение Yp , к которому стремятся Ln и Un .   1 1 [Chen, Liu and Zame (1981)], , Распределение Y1/2 есть бета 2 2 а Y1 распределено по закону beta(2, 2) [Chen, Goodman and Zame (1984)]. Естественно ожидать, что распределение Yp близко, хотя и не совпадает, к бета-распределению для p, отличных от 1/2 и 1. Johnson and Kotz (1994) показали, что

 7 − 6p var Yp = (25.9) и

2(11 − 6p)

 3(11 − 6p)(151 − 204p + 60p2 ) β2 Yp = . 2 (7 − 6p) (79 − 30p)

(25.10)

Если бы Yp было распределено по закону бета(α , α ), то приведенное значение var(Yp ) получилось бы при α = 2(7 − 6p)−1 , и тогда получилось бы «номинальное» значение β2 = 3(11 − 6p)(25 − 18p)−1 .

(25.11)

В табл. 25.1 сравниваются реальные и «номинальные» значения для некоторых p. Близость фактических и «номинальных»  значений подтверждает предполо жение, что бета 2(7 − 6p)−1 , 2(7 − 6p)−1 является хорошей аппроксимацией распределения случайной величины Yp . O’Connor, Hook and O’ Connor (1985) приходят к тому же выводу на основании результатов моделирования. Другая процедура, приводящая в пределе к бета-распределению, описана в статье Kennedy (1988). Автор рассматривает независимые случайные

190

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

величины Zn1 , . . . , Znk , распределенные равномерно на (Ln , Un ), а интервал (Ln+1 , Un+1 ) выбирается как (Ln , max(Zn1 , . . . , Znk )), (min(Zn1 , . . . , Znk ), Un ) или (min(Zn1 , . . . , Znk ), max(Zn1 , . . . , Znk )) с вероятностями p, q, r соответственно (p + q + r = 1). Kennedy (1988) доказал, что, если начальный интервал есть (0; 1), то общий предел Ln и Un , к которому они сходятся с вероятностью 1, имеет распределение бета (k(p + r), k(p + r)) на (0; 1). Если в качестве начального интервала взять (A, B), то получится распределение бета (k(p + r), k(p + r)) на (A, B). Другое доказательство этого факта, основанное на вычислении моментов, приводится в статье Johnson and Kotz (1993). Еще один алгоритм, приводящий к бета-распределению, основан на упорядочивании равномерно распределенных случайных величин (гл. 26). Пусть Y1 , Y2 , . . . , Yn — независимые случайные величины, распределенные равномерно на (0; 1), т. е. pYi (y) = 1,

0  y  1.

(25.12)

Пусть, далее, значения этих случайных величин, расположенные в порядке возрастания, суть Y1  Y2  . . .  Yn . Мы называем их порядковыми статистиками. Тогда s-я порядковая статистика Ys имеет бета-распределение: −1

pYs (y) = [B(s, n − s + 1)]

ys−1 (1 − y)n−s ,

0  y  1.

(25.13)

Fox (1963) проверил возможность построить датчик случайных чисел, имеющих бета-распределение, имея датчик равномерно распределенных чисел. Его метод годится только для целых n и n − s. Метод, подходящий для дробных n и n − s, сконструировал J¨ohnk (1964). Он показал, что, если X и Y — независимые случайные величины со стандартным равномерным распределением, то условное распределение X 1/n при условии, что X 1/n + Y 1/r  1, является бета-распределением с параметрами n и r + 1, а условное распределение Y 1/r есть бета-распределение с параметрами n + 1 и r. Алгоритм включает вычисление X 1/n и Y 1/r , что может оказаться затруднительным. Если n и/или r велико, то, как отмечено в статье Pekh and Marchenko (1992), для слишком малого числа пар (X, Y) будет 1/n 1/r 1/n 1/r + Y  1. Действительно, Pr X + Y  1 < выполняться условие X     1 1 1/n 1/r −n −r < 1 − Pr X > · Pr Y > < 2 + 2 , поэтому, если min(n, r)  11, 2 2

1/n 1/r то Pr X + Y  1 < 0.001. B´ankˇovi (1964) нашел возможность обойти эту трудность, если оба числа, n и r рациональны. Пусть целые числа a1 , a2 , . . . , aM и b1 , b2 , . . . , bN таковы, что n=

M  j=1

a−1 j ,

r=

N 

b−1 j .

j=1

Тогда, если X1 , X2 , . . . , XM , Y1 , Y2 , . . . , YN независимы имеют

a1 aи aM 2 , X , . . . , XM стандартное равномерное распределение, то max X 1 2   и max Y1b1 , Y2b2 , . . . , YNbN распределены так же, как X 1/n и Y 1/r соответственно.

191

2. ГЕНЕЗИС БЕТА-РАСПРЕДЕЛЕНИЯ

Если n или r иррациональны, можно взять рациональное приближение с достаточной точностью. B´ankˇovi (1964) исследовал влияние такой аппроксимации на возможность порождения бета-распределенных случайных величин. Метод GR (gamma-ratio) основан на том, что, если Y и Z — независимые случайные величины, имеющие гамма-распределение с параметрами формы p и q соответственно (см. начало настоящего пункта), то X = Y/(Y + Z) распределено по закону бета (p, q). Датчики бета-распределенных случайных чисел, основанные на алгоритмах принятия/отклонения («да-нет»-алгоритмах) изучались в работах Ahrens and Dieter (1974), Atkinson and Pearce (1976) и других авторов. Ahrens and Dieter (1974) рекомендуют метод, развитый в статье Forsythe (1972) и предложенный первоначально для датчика нормальных случайных чисел. Chen (1978) предложил модифицированный алгоритм получения бета-распределенного случайного числа X, названный им модифицированным алгоритмом BA для случая p, q > 0. Приведем основные шаги алгоритма. Модифицированный алгоритм BA. Основные шаги.

 Начало. Полагаем α = p + q. Если min(p, q)  1, то β = max p−1 , q−1 , иначе полагаем " β = (α − 2)/(2pq − α ). Полагаем γ = p + β −1 . Шаг 1. Получаем независимые случайные числа U1 и U2 , равномерно U

1 и W = peV . распределенные на (0; 1), и полагаем V = β log 1 − U 1  

 α + γ V − 1.3862944 < log U12 U2 , то вернуться Шаг 2. Если α log

q+W

к шагу 1. Шаг 3. Полагаем X = W/(q + W). Приведенный алгоритм является достаточно быстрым при p и q б´oльших 0.5. Более сложные алгоритмы (BB) и (BC), также приведенные в работе Chen (1978), работают при любых p и q > 0 и обеспечивают большее быстродействие. Приведем один из них. Алгоритм BB. Случай min (p0 , q0 ) > 1. Основные шаги. Начало. Полагаем p = min(p0 , q0 ), q = max(p0 , q0 ); 6 α−2 α = p + q, β = ; γ = p + β −1 . 2pq − α

Шаг 1. Порождаем независимые случайные числа

U1 и U2 , равномерно распределенные на (0; 1), и полагаем V = β log U1 /(1 − U1 ) , W = peV , Z = U12 U2 , R = γ V−1 − 1.3862944, S = p + R − W. Шаг 2. Если S + 2.609438  5Z, то перейти к шагу 5. Шаг 3. Полагаем T = log Z. Если S  T, перейти к шагу 5. α < T, перейти к шагу 1. Шаг 4. Если R + α log q+W

Шаг 5. Если p = p0 , то полагаем X = W/(q + W), иначе полагаем X = q/(q + W).

192

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Schmeiser and Shalaby (1980) разработали три точных метода, приспособленных для случая min(p, q) > 1, что соответствует алгоритму BB [Chen (1978)]. Один из алгоритмов есть небольшая модификация алгоритма, описанного в статье Ahrens and Dieter (1974) и названного BNM. Все методы используют абсциссы точек перегиба плотности бета-распределения, даваемые формулой x=

(p − 1) ± [(p − 1)(q − 1)]/(p + q − 3)1/2 , p+q−2

если эти точки действительны и лежат между нулем и единицей. Детальное сравнение алгоритмов, предпринятое в статье Schmeiser and Shalaby (1980), показало, что алгоритм BB обладает наибольшим быстродействием для выраженно асимметричных распределений, а алгоритм BNM — для симметричных распределений с тяжелыми хвостами. Алгоритм BB является наилучшим для следующих значений параметров: p = 1.01 q = 1.01, 1.50, 2.00, 5.00, 10.00, 100.00 p = 1.50 q = 1.50, 2.00, 5.00, 10.00, 100.00 p = 2.00 q = 2.00 p = 5.00 q = 5.00 p = 10.00 q = 10.00 p = 100.00 q = 100.00 В работе Devroye (1986) приводится обзор методов получения случайных чисел, подчиненных бета-распределению.

3.

Свойства

Если X имеет стандартное бета-распределение (25.2), то r-й начальный момент равен B(p + r, q) Γ(p + r)Γ(p + q) μr = = . (25.14) B(p, q)

При целом r μr =

p[r] (p + q)[r]

Γ(p)Γ(p + q + r)

, где y[r] = y(y + 1) . . . (y + r − 1) — возрастающий

факториал. В частности, E[X] =

p , p+q

(25.15a) −2

−1

var(X) = pq(p + q) (p + q + 1) , (25.15b) " " −1 −1 −1 −1 α3 (X) = β1 (X) = 2(q − p) p + q + (pq) · (p + q + 2) , (25.15c) α4 (X) = β2 (X) =   = 3(p + q + 1) 2(p + q)2 + pq(p + q − 6) · [pq(p + q + 2)(p + q + 3)]−1 , (25.15d)

−1 −1 E X = (p + q − 1)(p − 1) , (25.15e)

−1 −1 = (p + q − 1)(q − 1) . (25.15f ) E (1 − X) Недавно в статье Pham-Gia (1994) найдены простые границы для var(X). В частности, показано, что var(X) < 1/4 и, если плотность унимодальна, т. е.

193

3. СВОЙСТВА

p > 1 и q > 1, то var(X) < 1/12. Если X имеет U-образную плотность, т. е. p < 1 и q < 1, то var(X) > 1/12. Пусть λ = (p + q)−1 и θ = p(p + q)−1 . Имеет место рекуррентное соотношение между центральными моментами стандартного бета-распределения [M¨uhlbach (1972)]: s    sλ s λ j (1 − θ )j j! μs+1 = − μs + θ μs−j . (25.16) 1 + sλ

j

j=1

···

(1 + sλ )

Здесь μ0 = 1, μ1 = E[X − E[X]] = 0, μ2 =

(1 + [s − j]λ )

λθ (1 − θ ) 2λ 2 θ (1 − θ ) , μ3 = (1 − 2θ ). (1 + λ ) (1 + λ )(1 + 2λ )

Производящая функция моментов равна вырожденной гипергеометрической функции (см. гл. 1, формула (1.121)):

(25.17) E etX = M(p; p + q; t) и, естественно, характеристическая функция равна M(p; p + q; it). Производящая функция моментов случайной величины − log X, где X имеет стандартное бета-распределение, есть

B(p − t, q) , (25.17) M(t) = E exp(−t log X) = B(p, q)

и соответствующая производящая функция семиинвариантов K(t) = log

Γ(p + q) Γ(p + q − t) − log . Γ(p) Γ(p − t)

При целом q семиинварианты выражаются формулой κr = (r − 1)!

q−1 

(p + j)−r ,

r = 1, 2, . . . ,

(25.17)

j=0

в общем случае



κr = (−1)r ψ (r−1) (p) − ψ (r−1) (p + q) , (25.17) 

где ψ (r−1) (x) = dr /dxr log Γ(x) — так называемая (r + 1)-гамма-функция (см. гл. 1, п. A2). Среднее отклонение случайной величины X равно

 pp qq 2 δ1 (X) = E |X − E[X]| = . (25.18a) p+q+1 B(p, q) (p + q)

При p = q эта формула упрощается: −1

δ!1 (X) = B(p, p)p22p .

(25.18b)

Авторы благодарны доктору T. Pham-Gia, заметившему ошибку в выражении для δ1 (X) в предыдущем издании, см. также Pham-Gia and Turkkan (1992). Если p и q велики, то использование формулы Стирлинга для гаммафункции приводит к следующему приближенному выражению среднего отклонения: 6   2pq 1 1 1 1 −1 · q 1 + (p + q)−1 − p−1 − . (25.19) π (p + q)

p+q

12

12

12

194

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

В этом случае

6   Среднее отклонение 2 7 1 −1 1 (p + q)−1 − p − q−1 . 1+ ≈ Стандартное отклонение π 12 12 12 Среднее отклонение относительно медианы m равно  2mp (1 − m)q 1 = 2 var(X) mp (1 − m)q . (25.20) (p + q)B(p, q)

B(p + 1, q + 1)

Если p > 1 и q > 1, то pX (x) → 0 при x → 0 и при x → 1. Если 0 < p < 1, то pX (x) → ∞ при x → 0, а если при этом 0 < q < 1, то pX (x) → ∞ при x → 1. Если p = 1(q = 1), то pX (x) имеет ненулевой предел при x → 0 (x → 1). Если p > 1 и q > 1, то плотность унимодальна и мода находится в точке x=

p−1 . Если p < 1 и q < 1, то имеется антимода (минимальное значеp+q−2

ние плотности) в той же точке. О таких плотностях говорят, что они имеют U-форму бета-распределения. Если (p − 1)(q − 1)  0, плотность не имеет ни моды, ни антимоды при 0 < x < 1. В этом случае говорят о форме J или обратной форме J плотности бета-распределения (плотности типа I). Peleg and Normand (1986) предложили репараметризацию, положив am = p − 1, m = q − 1, чтобы мода оказалась в точке a/(1 + a) независимо от m. Они назвали полученное распределение модифицированным, хотя оно фактически не отличается от обычного ничем, кроме обозначений. Если p = q, то плотность симметрична относительно точки x = 1/2. При положительных p и q точки перегиба плотности суть 6 p−1 1 (p − 1)(q − 1) ± , (25.21) p+q−2

p+q−2

p+q−3

причем они действительны и лежат в промежутке от 0 до 1. Как и для семейства Пирсона, эти точки равноудалены от modes. Среднее значение p/(p+q) зависят только от отношения p/q. Если увеличивать p и q, сохраняя это отношение, то дисперсия убывает и центрированная плотность сходится к стандартной нормальной. Некоторые из перечисленных свойств плотности бета-распределения иллюстрируются на рис. 25.1, a, b. Заметим, что замена p на q, а q на p приводит к зеркальному отражению 1 кривой относительно прямой x = 2 Кривая Лоренца (см. гл. 12, формула (12.16)) определена координатами [Ix (p, q), Ix (p + 1, q)] . Индекс Джини (Gini, гл. 12, формула (12.19)) равен 2B(2p, 2q) . p[B(p, q)]2

4.

(25.22)

Оценивание параметров

Обсуждение оценок параметров бета-распределения восходит к классической статье Пирсона [Pearson K. (1895)], где впервые применен метод моментов.

4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ

РИС. 25.1. Плотности бета-распределения

195

196

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Рис. 25.1 (продолжение). Плотности бета-распределения

Непосредственное решение уравнений максимального правдоподобия (МП) для бета-распределения затруднительно. В работах Koshal (1933, 1935) предприняты попытки найти оценки максимального правдоподобия (ОМП) четырехпараметрического бета-распределения методом последовательных приближений с использованием начальных значений, полученных методом моментов. Оценки всех четырех параметров распределения (25.1) можно получать, приравнивая выборочные и генеральные моменты первых четырех порядков. Приведем формулы для a, b, p и q через среднее μ1 и центральные моменты μ2 , μ3 и μ4 [Elderton and Johnson (1969)]. Пусть r= Тогда 1 p, q = r 2

6 (β2 − β1 − 1) . 6 + 3β1 − 2β2

 −1 2 1 ± (r + 2) β1 {(r + 2) β1 + 16(r + 1)} ,

где p ≶ q в соответствии с α3 =

" β1 ≷ 0. Также имеем:

p−1 мода(Y) − a = , q−1 b − мода(Y)

где мода (Y) = a + (b − a)(p − 1))/(p + q − 2) и 1√ " μ2 (r + 2)2 β2 + 16(r + 1). b−a= 2

(25.23)

(25.24)

(25.25)

197

4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ

При известных a и b использование двух первых моментов дает: μ1 = a + (b − a)p/(p + q),

μ2 = (b − a)2 pq(p + q)−2 (p + q + 1)−1 .

Отсюда μ1 − a p = , b−a p+q μ2

(b − a)

2

=

(25.26)

  p p 1−

p+q

p+q

1 , p+q+1

(25.27)

и тогда p+q=



(μ1 − a)/(b − a) 1 − (μ1 − a)/(b − a)

 p=

(μ2 /(b − a)2 )

μ1 − a b−a

2   μ1 − a 1− b−a

− 1,

−1

μ2

(b − a)2



(25.28) μ1 − a . b−a

(25.29)

Существование, состоятельность, асимптотическая нормальность и эффективность корней уравнений правдоподобия обычно доказывается в условиях, сформулированных в работах Cram´er (1946) или Kulldorff (1957). Эти условия, в частности, требуют, чтобы существовало тэйлоровское разложение логарифма функции правдоподобия в некоторой окрестности реальных значений параметров. При оценке концевых значений (a или b) четырехпараметрического распределения нет фиксированной окрестности, в которой существовало бы разложение по формуле Тэйлора. Whitby (1971) показал, что, если параметры формы (p или q) велики, обычно больше двух, то условия разложимости по формуле Тэйлора могут быть ослаблены. Достаточно существования стягивающейся последовательности окрестностей для выполнения обычных асимптотических свойств при нормировке величиной n1/2 . Если a и b известны и Y1 , Y2 , . . . , Yn — независимые случайные величины с одинаковым распределением (25.1), то ОМП # p и # q параметров p и q соответственно удовлетворяют уравнениям ψ (# p) − ψ (# p+# q) = ψ (# q) − ψ (# p+# q) =

n Y − a 1 log j , n b−a

1 n

j=1 n 

log

j=1

b − Y  j , b−a

(25.30a)

(25.30b)

где ψ (·) — пси-функция (см. гл. 1, формула (1.37)). Условия Крамера и Кулдорфа в этом случае выполнены. Уравнения (25.30a) и (25.30b) следует решать численными методами. Если # pи# q не слишком малы, то можно использовать приближенную формулу   1 . ψ (t) ≈ log t − 2

198

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Тогда приближенные значения и (25.30b):

# p − 1/2 # q − 1/2 и , полученные из (25.30a) # p+# q − 1/2 # p+# q − 1/2

 1/n  7 1 1 − nj=1 (b − Yj )/(b − a) 2 # p≈ 1/n 7n 1/n , 7 1 − nj=1 (Yj − a)/(b − a) − j=1 (b − Yj )/(b − a)  1/n  7 1 1 − nj=1 (Yj − a)/(b − a) 2 # q≈  1/n , 1/n 7n

7 1 − nj=1 (Yj − a)/(b − a) − j=1 b − Yj /(b − a)

(25.31a)

(25.31b)

можно взять в качестве первого приближения для p и q. С этими начальными приближениями решение (25.30a) и (25.30b) получаются методом итераций. Gnanadesikan, Pinkham and Hughes (1967) получили точные численные решения для нескольких частных случаев. √ √ p и n# q при n → ∞ Асимптотическая матрица ковариаций величин n# дается формулой  



  −1 ψ  (q) − ψ  (p + q) ψ  (p + q)    . ψ (p)ψ (q) − ψ (p + q) ψ (p) + ψ (q) ψ  (p + q) ψ  (p) − ψ  (p + q) (25.32) Используя упомянутые аппроксимации для ψ  (·) при больших p и q, получаем: q) ≈ q(2q − 1)n−1 , var (# p) ≈ p(2p − 1)n−1 , var (#

  1 − 2p−1 1 − 2q−1 . corr(# p, # q) ≈

(25.33)

Короткие сообщения Fielitz and Myers (1975, 1976) и Romesburg (1976) посвящены обсуждению преимуществ и недостатков метода моментов и метода максимального правдоподобия при оценке p и q. Трудности метода ОМП связаны, главным образом, с разработкой вычислительных алгоритмов максимизации функции правдоподобия. Метод Ньютона—Рафсона чрезвычайно чувствителен к выбору начальных приближений ! p и! q и не гарантирует сходимость. Fielitz and Myers (1976) отметили, что для проблемы обработки выборочных данных, рассмотренной в работе Gnanadesikan, Pinkham and Hughes (1967), метод моментов дает более близкие к истинным значениям оценки p и q по сравнению с методом максимального правдоподобия. Возможно, что это объясняется погрешностями численных методов вычисления ОМП. Beckman and Tietjen (1978) показали, что уравнения (25.30a) и (25.30b) сводятся к одному уравнению относительно # q:   −1

ψ (# q) − ψ ψ q) + # q − log G2 = 0, (25.34a) log G1 − log G2 + ψ (# где G1 =

n   , Yj − a 1/n j=1

b−a

,

G2 =

n   , b − Yj 1/n j=1

b−a

.

Вычислив оценку # q с помощью (25.34a), можно найти оценку # p параметра p по формуле

# p = ψ −1 log G1 − log G2 + ψ (# q) , (25.34b)

199

4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ

Lau and Lau(1991) провели детальный анализ методов выбора начальных приближений pe , qe для оценки параметров p и q соответственно. В диапазоне G1 + G2 = GT  0.95 они рекомендуют  "  log pe = −3.929 + 10.523G2 − 3.026G31 + 1.757 exp G2 G1 (25.35a) и

" log qe = −3.895+1.222 G2 −6.9056G31 +39.057G21G31 +1.5318 exp (GT ) . (25.35b)

При 0.95  GT  0.999 они предлагают величины " 

log pe = 110706.79 + 3.0842 G1 + 110934.01GT + 6.3908 exp G1 G22 − −233851.3GT + 45300.7 exp (GT ) (25.35c) и log qe = 113753.4 − 2.1G21 + 113979.94 log GT + + 2.154G1G62 − 240149.9GT + 46500.7 exp (GT ) .

(25.35d)

Авторы также изучили выборочное распределение ОМП # p и $ # q и составили pe m−p таблицу выборочных отклонений: d = 100%, где m = . Расчеты p

K

проводились по выборке объема K = 1000 для каждого из значений параметров n = 30, 60, 100; p = q = 2, 6, 10, 20, 40. Оценивались также относительные отклонения выборочной асимметрии a1 = цесса b =

K

−1 $

(pe − m)4 S4

, где S2 =

K −1

$

(pe − m)3 S3

и выборочного экс-

1 $ (pe − m)2 . Приведем фрагмент этих K

таблиц для p = q = 10. n = d a1 b2

30 11.1% 1.17 5.6

100 3.1% 0.59 3.7

В той же статье приводится алгоритм оценки доверительного интервала для pe с использованием метода, предложенного в работах Bowman and Shenton (1979a, 1978b) для вычисления процентных точек распределений семейства Пирсона. Если параметры a и b неизвестны, то для получения ОМП параметров a, b, p и q можно использовать итеративные алгоритмы с начальными приближениями (25.31a) и (25.31b), задавая пробные значения (a, b) и подбирая затем такие пары, которые позволяют получить по возможности большие значения функции правдоподобия. Carnahan (1989) детально исследовал ОМП для четырехпараметрического бета-распределения. К равенствам (25.31a) и (25.31b) он добавил уравнения правдоподобия вида  n  1 ∂ log L p+q−1 1  b−a · = − =0 (25.31c) n(p − 1)

∂a

p−1

n

i=1

Yi − a

200 и

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

n 1 ∂ log L p+q−1 1 − · = − n(q − 1) ∂b q−1 n i=1



b−a b − Yi

 = 0.

(25.31d)

Заметим, что эти уравнения по существу аналогичны выражениям, получаемым методом моментов с использованием выборочных гармонических средних



−1 −1 E (Y − a)−1 и E (b − Y)−1 , приравниваемых соответствующим теоретическим значениям (см. п. 2). К сожалению, функция правдоподобия для рассматриваемого распределения не ограничена, глобальный максимум равен бесконечности, и поэтому значения a, «близкие» к Y1 и b — «близкие» к Yn , должны быть исключены. Возможно существование локального максимума, который трудно найти по малой выборке и который затрудняет применение численных алгоритмов максимизации функции правдоподобия. Оценки максимального правдоподобия обладают обычными свойствами асимптотической нормальности и несмещенности и дисперсиями, равными нижней границе Рао—Крамера при условии, что min(p, q) > 2. В то же время, численный анализ, проведенный в работе Carnahan (1989), показывает, что малое смещение и близость дисперсий к границам Рао—Крамера достигается только в случае очень больших выборок (n  500). В статье рекомендуется использовать наименьшее и наибольшее выборочные значения для улучшения оценок концов интервала. Информационная матрица, по которой получаются асимптотические дисперсии и ковариации ОМП в регулярном случае, т. е. min(p, q) > 2 равна ⎞ ⎛ q(p + q − 1) p+q−1 q 1 − (p − 1)(b − a) b−a ⎟ ⎜ (p − 2)(b − a)2 (b − a)2 ⎟ ⎜ p+q−1 p(p + q − 1) 1 p ⎟ ⎜ − ⎟ ⎜ b−a (q − 1)(b − a) ⎟ . (b − a)2 (q − 2)(b − a)2 I = n⎜ ⎟ ⎜ q 1    ⎟ ⎜ − ψ (p + q) + ψ (p) − ψ (p + q) ⎟ ⎜ (p − 1)(b − a) b−a ⎠ ⎝ 1 p    − − −ψ (p + q) ψ (p + q) + ψ (q) b−a

(q − 1)(b − a)

(25.36) Элементы главной диагонали матрицы I−1 дают асимптотические дисперсии оценок. Не имея явного выражения обратной матрицы, Carnahan (1989), приводит численные результаты. AbouRizk, Halpin and Wilson (1993) (см. также AbouRizk, Halpin and Wilson (1991)) использовали собственную программу «Beta Fit» для сравнения некоторых методов оценивания параметров четырехпараметрического бета-распределения (25.1) (они называют его обобщенным бета-распределением). Рассматриваются следующие методы. 1. Метод моментов. Можно использовать первые четыре момента и, во-вторых, как предложено в статье Riggs (1989), можно использовать два первых момента и взять a = Y1 , b = Yn . 2. Совместный метод моментов. Он состоит в минимизации (невзвешенной) суммы квадратов разностей между выборочными √ и теоретиче"  скими моментами: средним, дисперсией, асимметрией b1 и β1

201

4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ

и эксцессом (b2 и β2 ) при условии, что a < Y1 , b > Yn ; возможны и другие ограничения, например, a > 0 и b > 0. 3. Метод максимального правдоподобия. Максимум функции правдоподобия ищется при фиксированных a и b, см. (25.30). Авторы не рассматривают проблему изменчивости параметров a и b. 4. Регрессионный метод [Swain, Venkataraman and Wilson (1968)]. Используются порядковые статистики и соотношения, приведенные в гл. 12, формула (12.20):



 j j(n − j + 1) , var Fy Yj = , E FY Yj = 2 n+1

(n + 1) (n + 2)



 j(n − k + 1) cov FY Yj , FY Yk = , 2 (n + 1) (n + 2)

j < k.

Рассмотрены два варианта минимизации суммы квадратов n   2  j wj FY Yj − n+1

j=1

по переменным a, b, p, q. Вариант 1. wj = 1 при всех j (простая сумма квадратов).  −1 Вариант 2. wj = var FY Yj , j = 1, . . . , n (диагонально-взвешенная сумма квадратов). В обоих случаях возможны ограничения a < Y1 , b > Yn (a > 0 и b > 0), как и в приведенном выше методе 3. Dishon and Weiss (1980) провели сравнение оценок МП и метода моментов для стандартного бета-распределения (25.2), т. е. при a = 0 и b = 1. ОМП # p и # q в этом случае являются решением системы уравнений   1 1 , (25.37a) ψ (# p+# q + 2) − ψ (# p + 1) = log n Xi   1 1 log ψ (# p+# q + 2) − ψ (# q + 1) = . (25.37b) 1 − Xi

n

Эти оценки сравниваются с оценками по методу моментов ! p= ! q=

  !1 − μ !1 μ !2 μ

− 1,

!  − (! μ μ  )2

2  1   !1 μ !1 − μ !2 1−μ !2 − (! μ μ1 )2

(25.38a) − 1,

(25.38b)

!1 и μ !2 — оценки 1-го и 2-го моментов соответственно. где μ Результаты иллюстрирует табл. 25.2. Для каждой пары p и q и для каждого n = 25, 50 и 100 авторы получили 100 выборок объема 1000 и находили оценки # p и # q и ! p и ! q по приведенным формулам. Ошибки оценок, полученных обоими методами, имели в основном одинаковые знаки. Авторы определили степень различия формулой 2 $100 # pj − p 2 , pj − p j=1 !

Rp = $j=1 100

202

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

где # pj — оценки МП, ! pj — оценки методом моментов в j-й реализации и аналогично Rq . Авторы разработали специальную программу расчета ψ (z), использующую разложение ψ (1 + z) = −γ +

∞  n=1

z , n(n + z)

z = −1, −2, , . . . ,

и формулу суммирования Эйлера—Маклорена, где γ = 0.57722. . . — постоянная Эйлера, определенная в гл. 1 формулой (1.19). Таблица 25.2 показывает, что при небольших n ОМП, как правило (кроме случая p = q) более точны, чем оценки методом моментов. На рис. 25.2, заимствованном из статьи Kottes and Lau (1987), видно, что если p и q малы или их разность велика, то метод моментов (ММ) дает оценки с дисперсией, превосходящей дисперсии оценок МП на 25% и больше. Это как раз те ситуации, когда есть основания сглаживать эмпирическое распределение бета-распределением. Часто при этом параметры a и b или один из них можно считать известными. Если доступны только r наименьших выборочных значений X1 , X2 , . . . , Xr , то уравнения правдоподобия записываются в виде ⎡1 ⎤ )1/r + *( r    , r r ∂ = ψ (# log Xj p) − ψ (# p +# q) − 1 − log ⎣ t#p−1 (1 − t)#q−1 dt⎦, n

*( r log n

n

j=1

r ,

)1/r + (1 − Xj )

∂# p

Xr

(25.39a) ⎡1 ⎤    r ∂ = ψ (# q) − ψ (# p +# q) − 1 − log ⎣ t#p−1 (1 − t)#q−1 dt⎦ n

j=1

∂# q

Xr

(25.39b) [Gnanadesikan, Piukham and Huges (1967)]. Fang and Yuan (1990) применили последовательные алгоритмы численной оптимизации (SNTO), предложенные ранее в статье Fang and Wang (1989) для получения ОМП стандартного бета-распределения. Метод обладает тем преимуществом перед методом Ньютона—Рафсона, что не требует унимодальности или дифференцируемости функции правдоподобия, а только ее непрерывности, и, кроме того, не чувствителен к выбору начального приближения. По данным, приведенным в работе Gnanadesikan, Piukham and Huges (1967) метод дает более точные оценки, чем обсуждаемый там же метод моментов. Если один из параметров p или q задан, то уравнения сильно упрощаются. В частности, для стандартного степенн´oго распределения, получающегося при q = 1, оценкой МП параметра p является * +−1 n  −1 # p= n log Xj , (25.40) j=1

203

4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ

ТАБЛИЦА 25.2 Сравнение ОМП и оценок методом моментов для одномерного бета-распределения. Каждая строка получена по 100 независимым выборкам Значения параметров

Объем выборки

p

q

— 1/2

— 1/2

−1/2

1

1

1

−1/2

5

5

1

5

5

10

5

−1/2

100

1

100

50

100

100

100

aN

n

25 50 100 25 50 100 25 50 100 25 50 100 25 50 100 25 50 100 25 50 100 25 50 100 25 50 100 25 50 100 25 50 100

Na p

q

58 58 53 64 70 62 42 48 51 75 66 61 57 57 55 44 41 58 54 57 51 64 70 76 56 70 62 53 55 50 57 43 57

56 64 57 61 57 56 44 51 50 66 63 59 56 59 51 46 42 63 58 58 59 67 67 68 61 70 64 54 56 50 55 47 57

Rp

Rq

0.935 0.911 0.805 0.793 0.765 0.646 1.020 1.004 0.962 0.663 0.564 0.728 0.984 0.932 0.961 1.007 1.017 0.980 1.000 0.996 0.984 0.806 0.777 0.693 0.915 0.837 0.914 0.996 0.992 1.000 0.999 1.000 1.000

0.888 0.799 0.847 0.802 0.953 0.829 1.020 0.977 0.975 0.778 0.706 0.758 0.984 0.912 0.940 1.000 1.021 0.970 0.996 0.989 0.981 0.852 0.840 0.801 0.889 0.833 0.896 0.996 0.993 1.000 0.999 1.000 1.000

равно числу случаев, в которых ОМП ближе к истинным значениям p и q, чем оценки методом моментов.

204

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

РИС. 25.2. Сравнение дисперсий оценок МП и оценок, полученных методом моментов

причем

n var # p ≈ p2 . Оценка методом моментов в этом случае дается формулой

−1 ! p=X 1−X , и для нее

n var ! p ≈ p(p + 1)2 (p + 2)−1 .

(25.41)

(25.42) (25.43)

var(# p) p(p + 2) Заметим, что ≈ . Это показывает, что асимптотически отноvar(! p) (p + 1)2

сительная эффективность ! p возрастает с увеличением p: при p = 1 она составляет 75% и стремится к 100% при p → ∞; при p → 0 относительная эффективность оценки ! p стремится к 0. Более подробно о степенн´oм распределении см. в гл. 20, п. 8. Guenther (1967) рассмотрел частный случай спепенн´oго распределения с плотностью pXj (x) = pxp−1 ,

0 < x < 1,

j = 1,

... ,

n.

(25.44)

Он показал, что несмещенной оценкой с наименьшей дисперсией для p явля−1 $ n ется величина −(n − 1) log X . Ее дисперсия равна p2 (n − 2)−1 , тогда j j=1 как нижняя граница Рао—Крамера (гл. 1, п. B15) равна p2 n−1 .

205

4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ

В прикладных работах по исследованию операций, в частности, при анализе сети PERT, часто эвристически полагают, что стандартное отклонение должно составлять 1/6 от диапазона значений случайной величины. Тогда для стандартного распределения бета(p, q), сосредоточенного на (0; 1), принимают, что 1 σ (X) = , (25.45) 6

или, в общем случае (25.1) σ (X) =

1 (b − a). 6

(25.46)

Такие предположения используются при сглаживании бета-распределением со значением a∗ , равным минимальному выборочному значению, b∗ , равным максимальному значению, и наивероятнейшему значению m∗ , что обосновывается инженерной практикой. Эти величины используются как оценки параметров a, b и m=a+

p−1 (b − a) p+q−2

[min(p, q) > 1]

(25.47)

соответственно [Hillier and Lieberman (1980)]. Оценки p∗ и q∗ параметров p и q можно найти из системы уравнений p∗ q∗ 1 = (ср. с (25.46)),

∗  ∗ 2 ∗ ∗ 36 p +q (p + q + 1)

(25.48a)

p∗ − 1 m∗ − a∗ = ∗ (ср. с (25.47)). ∗ p +q −2 b − a∗

(25.48b)



Возможно, более естественным будет использовать выборочное среднее X, приравняв его математическому ожиданию, что приводит к равенству p∗ X − a∗ ∗ = ∗ p +q b − a∗

(25.48c)



вместо (25.48b). Представляется, что имеет смысл использовать уравнение типа (25.48c), но выразив X через оценки m∗ , a∗ , b∗ . Тогда уравнение 

∗   1 4(m∗ − a∗ ) 1 ∗ ∗ b − a∗ = a∗ + 4m + b∗ − 5a∗ a + ∗ ∗ +1 6

приводит к

b −a

6

p∗ 1 = ∗ p + q∗ 6

4

m∗ − a∗ +1 b∗ − a∗

 .

(25.48d)

Из (25.48b), (25.48c) или (25.48d) величина p∗ + q∗ выражается явно через p∗ , a∗ и b∗ . Подставляя это выражение в (25.48a), мы получим уравнение относительно p∗ . Например, используя (25.48c), получаем: p∗ + q∗ = и

p∗ q∗

∗ 2 = p + q∗



b∗ − a∗ ∗ p X − a∗

X − a∗ b∗ − a∗

  X − a∗ 1− ∗ . ∗ b −a

206

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

В этом случае (25.48a) дает:   ∗  X − a∗ X − a∗ 1 b − a∗ ∗ 1− ∗ = ∗ ∗ ∗ ∗ p +1 , b −a

т. е. p∗ =

b −a

X − a∗ b∗ − a∗

36

X−a

   X − a∗ X − a∗ 36 · ∗ 1 − − 1 . ∗ ∗ ∗ b −a

b −a

(25.49)

Используя (25.48d), также приходим к явному выражению для p∗ , а (25.48b) приводит к кубическому уравнению относительно p∗ . Farnum and Stanton (1987) провели критический анализ точности допущения, что для стандартного распределения бета(p, q) имеет место приближенное равенство 1 Среднее значение ≈ {4(мода) + 1} , 6 что равносильно равенству   p 1 4(p − 1) ≈ +1 , (25.50) p+q

p+q−2

6

в предположении, что выполнено (25.48a). Они выяснили, что такая аппроксимация дает относительную погрешность не более 0.02, если мода лежит в промежутке (0.13; 0.87). Авторы также предложили улучшенные аппроксимации: 2

,

2 + (мода)−1

−1

{3 − 2(мода)}

если мода < 0.13, ,

если мода > 0.87.

(25.51a) (25.51b)

Moitra (1990) предложил "

принять допущение относительно асимметрии, измеряемой величиной E (X − E[X])3  вместо параметра формы β1 , кото√

3 рый был бы равен 6 6E X − E[X} , если σ (X) = 1/6. Автор заметил, что обычные допущения записываются в виде a + b + k(мода) , (25.52a) E[X] = k+2

σ (X) = c

−1

(b − a),

(25.52b)

где k = 4, c = 6. Он выяснил, что c = 6 не является «оптимальным» для k, отличных от 4 и 5, и что k = 4 не является оптимальным для c = 6. В той же статье Moitra (1990) приводятся следующие рекомендации. Если известно или есть основания предполагать, что асимметрия велика, то следует ожидать, что p заключено между 2 и 3 и имеет смысл положить p = 2.5. Если асимметрия предполагается средней, то ожидаемое значение p лежит между 3 и 4 и можно взять p = 3.5. Если же асимметрия мала, то берется p = 4.5. Автор также приводит «наилучшие» комбинации значений k и c, показанные в табл. 25.3, и анализирует применимость треугольного распределения (гл. 26, п. 9), для которого E[X] =

1 (a + b + m). 3

(25.53)

207

5. ПРИЛОЖЕНИЯ

ТАБЛИЦА 25.3 Наилучшие комбинации значений k и c k

c 1

3 4 5 6 7 8

2

3

Наилучшая

Хорошая Хорошая

4

5

Наилучшая Хорошая

Наилучшая

6

Наилучшая

Наилучшая Наилучшая

В случае a = 0, b = 1 1 (1 + m), 3  1 1 − m + m2 . [σ (X)]2 = 16

E[X] =

(25.54a) (25.54b)

Значение σ (X) изменяется от 0.25 при m = 0 или 1 до 0.22 при m = 0.5. Эти значения близки друг другу, но несколько больше обычного эвристического значения, равного 1/6. Полагая k = 1 и c = 4 или 4.5, можно оценивать параметры с помощью треугольного распределения. Удобство такого алгоритма в том, что, привлекая треугольное распределение, мы устраняем необходимость дальнейших предположений и необходимость в дополнительной информации. Однако, как показывает табл. 25.3, выбор k = 2 (вместо k = 1) в случае c = 4 или 4.5 может оказаться более подходящим.

5.

Приложения

Рисунки 25.1, a и b показывают, что формы плотности бета-распределения весьма различны. Такое разнообразие позволяет использовать эти распределения как приближения многих плотностей и, следовательно, для моделирования широкого круга прикладных процессов, см., например, Morgan and Henrion (1990). Бета-распределение принадлежит к наиболее часто используемым в качестве математических моделей. Обычно диапазон значений (a, b) этих распределений известен, и сглаживание удобно провести, приравнивая первые два теоретических и эмпирических момента. В этом случае не применяется метод максимального правдоподобия, и поэтому не рассматриваются вопросы, связанные с асимптотической эффективностью. Важным примером использования бета-распределения является аппроксимация распределений некоторых статистик критериев, использующих отношение правдоподобия. Обычно диапазон значений отношения правдоподобия есть интервал (0; 1) и для любой монотонной функции отношения правдоподобия он может быть выбран исходя из данной информации. Если отношение

208

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

правдоподобия строится по n независимым одинаково распределенным случайным величинам, то его распределение часто удается аппроксимировать, предположив, что (отношение правдоподобия)2/n имеет бета-распределение с параметрами a = 0, b = 1. Использование показателя степени 2/n оправдывается теоремой Уилкса (Wilks), согласно которой при довольно слабых ограничениях величина 2 n

− log(отношения правдоподобия) асимптотически при n → ∞ распределена по закону χ 2 (об этом см. также в гл. 29, п. 9, где обсуждаются разные аспекты). Разумеется, можно взять любой показатель степени c, и подбор c наряду с параметрами p и q может, наверное, улучшить выбор бета-распределения при использовании такого алгоритма. Последнее равносильно сглаживанию обобщенным бетараспределением, рассматриваемым в п. 25.7. Benedetti (1956) установил, что распределение типа I (см. с. 193 данной главы) дает хорошее приближение (при подборе параметров по двум моментам) биномиальных вероятностей. Пусть N и ω — параметры биномиального распределения. Тогда приближенное значение суммы биномиальных вероятностей до r − 1 включительно равно I r−1 ((N − 1)ω , (N − 1)(1 − ω )) 2

(25.55a)

и близко к точному значению I1−ω (N − r + 1, r).

(25.55b)

Об этом см. также в гл. 3, формула (3.34). Числовые примеры, приведенные в статье Benedetti (1956), а также в статье Johnson (1960), показывают, что за исключением «хвостов», т. е. для вероятностей от 0.05 до 0.95 практически хорошая аппроксимация получается при N  50 и 0.1  ω  0.9. Долгое время было распространено использование бета-распределения в качестве априорного при оценке биномиальных вероятностей (см. гл. 6, п. 2.2). При таком подходе не возникает громоздких расчетов и часто бетараспределение упоминается как «естественное» априорное распределение для параметра p биномиального распределения, причем апостериорное распределение имеет ту же форму, что и априорное. Представляется, что такой подход вряд ли имеет сколько-либо обоснованные аргументы в его пользу. Впервые это высказано в замечании Barnard (1957) к статье Horsnell (1957). Совсем недавно аналогичное замечание сделал Ganter (1990) по поводу статьи Hart (1957). Shaw (1991) предложил использовать бета-распределение в качестве априорного, чтобы уменьшить число испытаний в процедуре контроля надежности, однако тоже без предварительного анализа справедливости принятых предположений. Имеется, в то же время, несколько работ, где уделяется внимание выбору априорного распределения. Например, Chaloner and Duncan (1983) описывают метод «установки» значения параметров априорного бета-распределения, хотя сам выбор априорного распределения остается

209

5. ПРИЛОЖЕНИЯ

без строгого обоснования. В работе Palm-Gia (1994) изучается информация о потерях или выгодах при изменениях обратного значения апостериорной дисперсии. В частности, показано, что отношение апостериорных средних значений апостериорных дисперсий для двух бета-распределений дает подходящий критерий, согласующийся со многими байесовскими результатами, и вносит некоторую определенность в то, что касается определения наименее информативного априорного бета-распределения. В последние годы бета-распределение применяется во многих прикладных исследованиях: при моделировании ряда гидрологических величин [Janardan and Padnamanabhan (1986)], при оценке распределения логарифма размера аэрозольных частиц [Bunz et al. (1987), Van Dingenan, Raes and Vanmarcke (1987)], времени активности сети PERT [Golenko-Ginzburg (1988)], ошибок при измерении форм [Yang, Li and Li (1988)], при анализе данных о повреждении изоляции в фотоэлектронных системах [Rahman, Khallat and Salameh (1988)], отношении пористость/пустота в почве [HarropWilliams (1989)], фазовых искажений в информационных системах [Andersen, Lauritzen and Thommesen (1990); Lauritzen, Thommesen and Andersen (1990)], проводимости сетчатых структур [Haynes and Yau (1990)], параметров, влияющих на репродуктивную способность коров [McNally (1990)], при исследовании соотношения размеров родителей и потомков у Escherchia coli [Koppes and Grover (1992)], степени очистки вымыванием от инертного газа [Meyer, Groebe and Thews (1990)], интенсивности рассеяния в моделях разрушения [Yamazaki (1990)], пропорции составляющих газовых смесей [Agrawal and Yang (1991)], интенсивности отражения морской поверхности [Delignon, Garello and Hillion (1991)], распространении солнечной радиации в атмосфере и связанные с этим индексы [Graham and Hollands (1990), Milyutin and Yaromenko (1991)], при сравнении мощности и помех сигналов радаров [Maffett and Wackerman (1991), Sopel’nik and Lerchenko (1991)], при использовании акустических методов оценки формы осколков [Sukvittayawong and Inasaki (1991)], при исследовании городского трафика [Ressel (1991)], продолжительности конструкторских работ [AbouRizk and Halpin (1992), AbouRizk, Halpin and Wilson (1991)], размеров частиц [Boss (1992a, b), Popplewell and Peleg (1992)], абсорбции газа [Karavias and Myers (1992)], износа инструментов [Wang and Dornfeld (1992)]. Wiley, Herschokoru and Padiau (1989) разработали модель оценки вероятности передачи вируса ВИЧ при сексуальном контакте носителя и восприимчивого партнера. Пусть β — вероятность передачи вируса при единичном контакте. Авторы модели рассматривают каждый контакт как независимое испытание с вероятностью инфицирования, равной β . Если пара имеет n сексуальных контактов, то вероятность события T, состоящего в заражении, равна Pr(T|β ) = 1 − (1 − β )n . Изучая различия в популяции таких пар, авторы рассматривали β как случайную величину, имеющую бета-распределение с плотностью p(β ) =

Γ(a + b) a−1 β (1 − β )b−1 , Γ(a)Γ(b)

0 < β < 1.

210

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Маргинальное распределение события T дается формулой n−1 , b+j 

Pr(T) = E Pr(T|β ) = 1 − . j=0

a+b+j

Использовав данные о числе контактов и восприимчивости к инфицированию, авторы применили метод максимального правдоподобия. Их оценки показали, что реальная неоднородность весьма велика. Thompson (1990) описывает применение бета-распределения в стохастическом анализе информативности результатов, получаемых «экспертной системой». В работе Treacy et al. (1991) усеченное бета-распределение используется при рассмотрении допусков в механических системах. Бетараспределение используется во многих областях исследования операций. Moitra (1990) приводит несколько примеров применения бета-распределения в анализе рисков стратегического планирования, финансовом и маркетинговом анализе, в инженерных системах статистического моделирования и теории принятия решений. Pham and Turkkan (1994) рассмотрели распределение суммы двух независимых бета-распределенных случайных величин и применили его к изучению устойчивости систем с бета-распределением времени жизни компонентов. Они нашли точный алгоритм расчета надежности при известных параметрах бета-распределений и упростили известные приближенные методы расчета надежности.

6.

Аппроксимации и таблицы

6.1.

Аппроксимации

Некоторые приближения нормированной неполной бета-функции Ix (p, q) описаны в п. 6.1 гл. 3. Для удобства ряд ссылок повторяется в литературе к настоящей главе, а именно, Aroian (1941, 1950), Cadwell (1952), Hartley and Fitch (1951), Nair (1948), Pearson and Pearson (1935), Thomson (1947), Wise (1950, 1960). Здесь мы приведем дополнения, появившиеся после выхода первого издания тома «Дискретные распределения». Сперва приведем одну из нескольких аппроксимаций, предложенных в работах Peizer and Pratt (1968) и Pratt (1968). Для неполной нормированной бета-функции их аппроксимация имеет вид Ix (p, q) ≈ Φ(z), где d  z =   1 q − − n(1 − x)   2



2 1 + (6n)−1

      1/2 1 q − 1/2 1 p − 1/2 , q− + p− log log 2

n(1 − x)

2

nx

(25.56) n = p + q — 1. Величина d определяется формулами:   1 1 d =q− − n+ (1 − x) 3

3

(вариант 1)

211

6. АППРОКСИМАЦИИ И ТАБЛИЦЫ

или d =q−





1 1 1 − n+ (1 − x) + 3 3 5

  x q



1 − x x − 1/2 + . p p+q

(вариант 2)

Для варианта 2 получаются более точные результаты. При таком d ошибка определения Ix (p, q) меньше 0.001 при p, q  2 и меньше 0.01 при p, q  1. Диапазоны относительной ошибки даются неравенством ⎧ ⎪ ⎨ 0.01 при p, q  3 и 0.2  R  5.0, |Φ(z) − Ix (p, q)| < 0.02 при p, q  1.75 и 0.125  R  8, (25.57) Ix (p, q) ⎪ ⎩ 0.03 при p, q  1.5 и 0.1  R  10, где

 q − (1/2) x  . p − (1/2) (1 − x)

R=

Mudholkar and Chaubey (1976) сравнивают аппроксимации Патнайка (Patnaik), Пирсона (Pearson) и Санкарана (Sankaran) для Ix (p, q), основанные на распределении величины − log X, где X имеет стандартное бета-распределение. Имеем:

Ix (p, q) = Pr − log X > − log x . Семиинвариант порядка r величины − log X равен   κr (− log X) = (−1)r ψ (r−1) (p) − ψ (r−1) (p + q) ,

(25.58)

см. (25.17). 1. Аппроксимация Патнайка. − log X заменяется величиной cχν2 , где c и ν выбираются из условия равенства двух первых моментов: c=

1 ψ  (p) − ψ  (p + q) , 2 ψ (p + q) − ψ (p)

Тогда

ν=

2 {ψ (p + q) − ψ (p)}2 . ψ  (p) − ψ  (p + q)

  − log x Ix (p, q) ≈ Pr χν2  .

(25.59a)

c

Используя приближение Вильсона—Хилферти см. гл. 18, формула (18.26)), записываем

(Wilson—Hilferty,

Ix (p, q) ≈ 1 − Φ(z), где

 z=

− log x cν

1/3

(25.59b)

   −1/2 2 2 − 1− . 9ν



2. Аппроксимация Пирсона. − log X заменяется величиной c χν2 + b, где c , ν  и b выбираются из условия равенства первых трех моментов. Получается формула (25.59a), где c и ν заменяются на c и ν  соответственно, и − log x заменяется на −(log x + b).

212

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

3. Аппроксимация Санкарана. Определим h так, чтобы главный член

h разложения третьего семиинварианта (− log X)/κ1 обратился в нуль. h

Это значение равно h = 1 − κ1 κ3 /(3κ22). Величина (− log X)/κ1 заменяется нормальной случайной величиной со средним μ =1−

и дисперсией σ2 =

hκ3 6κ1 κ2

h2 κ2 κ12

.

Тогда в (25.59b) получаем z=

{(1 − log x)/κ1 }h − μ . σ

(25.60)

Приведем теперь более общий подход к аппроксимации. Рассмотрим стандартное распределение бета(kn, ln), фиксируем k и l и полагаем n → ∞. Известно, что плотность стандартного бета-распределения стремится к стандартной нормальной плотности N(0, 1). Kr´olikowska (1966) изучила поведение главного члена модуля разности стандартной бета-плотности и плотности стандартного нормального распределения при n → ∞. Она выяснила, что этот член имеет порядок n−1/2 , кроме случая k = l, когда этот порядок равен n−1 . Volodin (1970) получил приближенную формулу  qx p Ix (p, q) ≈ F (1, 1; 2 + q; x) , (25.61) 2 F1 (1, 1; 1 + p; 1 − x) + 2 2 1 p+q

1+q

где 2 F1 (a, b; c; x) — гипергеометрическая функция (гл. 1, п. A6). Эта формула весьма точна при малых p и q. Вывод формулы (25.61) основан на том, что характеристическая функция случайной величины   X , (25.62) W = (p + q) log 1−X

где X имеет распределение (25.1), равна Γ (1 + p + [p + q]it) Γ (1 + q − [p + q]it) . {1 + it(p + q)/p} {1 − it(p + q)/q}/{Γ(1 + p)Γ(1 + q)}

(25.63)

Отсюда видно, что W можно рассматривать как сумму трех независимых случайных величин: W1 , W2 и W3 , где W1 и W2 экспоненциально распределены (гл. 19) с параметрами p/(p + q) и q/(p + q), а W3 имеет стандартное распределение бета(p+1, q+1). Тогда (25.61) получается заменой W3 случайной величиной, распределенной равномерно на (0; 1). Если W3 пренебрежимо мала в этом представлении, а это получается, если q мало по сравнению с p, то получается приближенная формула ⎧  p x 1 ⎪ ⎨ q при 0  x  , p+q 1−x 2   (25.64) Ix (p, q) ≈ Jx (p, q) = 1−x q 1 ⎪ ⎩1 − p при  x  1. p+q

x

2

213

6. АППРОКСИМАЦИИ И ТАБЛИЦЫ

Она также дает хорошее приближение для малых p и q. Конкретно, если p + q < 1, то  1+q  2 p π p(p + q) max |Ix (p, q) − Jx (p, q)|  (p + q) − 1   p(p + q). exp 1+q 24 1+q 0x1 (25.65) Molina (1932) вывел следующую аппроксимацию неполной бета-функции: Ix (p, q) ≈

6    Aj z q+j j=0

где

j!

N

D(q + j, z),

(25.66)

1 1 q − , z = −N log x, 2 2 1 1 A1 = A3 = A5 = 0, A2 = (q − 1), A4 = (q − 1)(5q − 7), 12 240 1 (q − 1)(35q2 − 112q + 93), A6 = 4032

N =p+

A0 = 1,

1 D(a, b) =

ta−1 e−bt dt = b−a Γb (a).

0

Здесь Γb (a) — неполная гамма-функция, определенная в гл. 1, п. A5, (см. также приложение в книге Gnanadesikan, Pinkham and Hughes (1967), где приводятся детали вычислительных алгоритмов). Woods and Posten (1968) составили компьютерную программу, основанную на разложении вида ∞  θ bj sin(jθ ), (25.67) Ix (p, q) = 1 − − π

где

j=1

θ = arccos(2x − 1),

b1 = 2π −1 (p − q)(p + q)−1 ,   b2 = π −1 (p + q)−1 (p + q + 1)−1 2(p − q)2 − (p + q)(p + q − 1) , (j + 2)bj+2 = (j + p + q − 1)−1 {2(p − q)(j + 1)bj+1 + (j + 1 − p − q)jbj } . Они выяснили, что при достаточно больших m можно ограничиться частичной суммой, оканчивающейся bm , с ошибкой, меньшей 1 −1 m |bm | {min(p, q)} , если p = q, 2 1 m |bm | p−1 , если p = q и m четно. 2

В нескольких простых случаях можно записать явные формулы для коэффициентов bj .   j 1 7 2i − 1 − 2p Случай 1. p = q: b2j−1 = 0, b2j = . jπ i=1 2i − 1 + 2p   j 2 7 2p − 2i + 1 . Случай 2. q=1/2: bj = jπ

i=1

2p + 2i − 1

214

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Если дробные части p и q одинаковы и равны 1/2, то bj = 0 для j  p + q. Преимущество описанного метода в том, что величину N 

bj sin(jθ )

j=0

можно оценить, не используя тригонометрических функций, величиной 2u1 (x − x2 )1/2 , где x =

1 (1 + cos θ ), а u1 определяется обратной рекурсией: 2

uj = bj + 2(2x − 1)uj+1 − uj+2

для j = N, N − 1, . . . , 1,

Kalinin (1968) получил разложение −1 p−1

[B(p, q)]

x

(1 − x)

q−1

−1/2

= (pq)

(p + q)

3/2

φ (y) exp

uN+1 = uN+2 = 0.

*μ −1 

+ Wj p

−(1/4)j

+ Rμ ,

j=1

(25.68) где



−1  p −1 1/2 y = (p + q) p + q x− ,

  Rμ = O p−(1/2)μ ,

p+q

√ −1   1 φ (y) = 2π exp − y2 , 2  j/2 * j/2  j/2 + j y p p q − − Wj = j



yj+2 j+2



p p+q



p p+q

q

(j/2)+1 * j/2

W2k y2k+2 − 2k + 2

p+q

p q

y2k = 2k



k+1 * k p q

 j/2+1 −

p p+q

+

q p

при нечетном j,

k * k

 k+1 + q p

p

p q

+

 k + +

B + k+1 k(k + 1)

q p

*

− p p+q

 k

k −

p q

+ −1 .

Kalinin (1968) получил аналогичные, но более громоздкие разложения плотностей гамма-, F- и t-распределений. Мы не приводим их из-за сложности. Frankl and Maehara (1990) получили неравенства для хвоста стандартного 1 1 распределения бета(p, q). Пусть μ = E [X] = p/(p + q) и пусть aε = ε − ε 2 . 2 2 Тогда имеют место неравенства

−1/2 exp (pε aε ) (25.69a) Pr |X − μ | > εμ < 2a−1 ε (2π qμ ) и

Pr |X − μ | > εμ < 2 (ε aε )−1 log (2q) .

(25.69b)

215

6. АППРОКСИМАЦИИ И ТАБЛИЦЫ

6.2.

Таблицы

Первое издание 1934 г. таблиц Пирсона (K. Pearson) содержит таблицы Ix (p, q) с семью десятичными знаками для p, q = 0.5 (0.5) 11.0 (1) 50 для

pq

и

x = 0.00 (0.01) 1.00.

Второе издание книги Pearson (1968) содержит, кроме того, значения Ix (p, q) с семью десятичными знаками для p = 11.5 (1.0) 14.5 при q = 0.5 и x = 0.00 (0.01) 1.00, и с восемью десятичными знаками для p = 0.5 (0.5) 11.0 (1) 16; q = 0.5, x = 0.988 (0.0005) 0.9985, 0.9988 (0.001) 0.9999, а также для q = 1.0 (0.5) 3.0, x = 0.988 (0.001) 0.999. Значения с семью десятичными знаками приводятся также для x = 0.975 и 0.985. Составление таблиц продолжили Osborn and Madey (1968). Эти таблицы охватывают значения p, q в той области, где затруднена интерполяция таблиц Пирсона. Значения Bx (p, q) и Ix (p, q) приведены с пятью значащими цифрами для p, q = 0.50 (0.05) 2.00; x = 0.10 (0.01) 1.00. Авторы использовали формулу   1−q (1 − q)(2 − q) 2 p 1 + x+ x + ··· Bx (p, q) = x p

для 0 < x 

p+1

2!(p + 2)

(25.70a)

1 и 2

Bx (p, q) = B0.5 (p, q) +

1 − wq (1 − p)(1 − wq+1 ) (1 − p)(2 − p)(1 − wq+2 ) + + + ··· , q2q 1!(q + 1)2q 2!(q + 2)2q+2

(25.70b)

1

где w = 2(1 − x) и < x < 1. 2 Процентные точки бета-распределения табулированы в работах Thompson (1941), Clark (1953), Harter (1964) и Vogler (1964). Thompson приводит значения X(P; p; q), где IX(P;p;q) (p, q) = P, с пятью десятичными знаками для p = 0.5 (0.5) 15.0 20, 30, 60, q = 0.5 (0.5) 5.0, 6, 7.5, 10, 12, 15, 20, 30, 60, P = 0.50, 0.25, 0.10, 0.05, 0.025, 0.01, 0.005. Эти таблицы включены в книгу Pearson and Hartley (1954), третье издание которой в 1966 г. дополнено значениями при P = 0.0025 и 0.001, вычисленными в статье Amos (1963). Harter (1964) приводит значения X(P; p; q) с семью значащими цифрами для p, q = 1 (1) 40; P = 0.0001, 0.0005, 0.001, 0.005, 0.01, 0.025, 0.05, 0.1 (0.1) 0.5. Vogler (1964) дает значения X(P; p; q), а также B(p, q), с шестью значащими цифрами для p = 0.50 (0.05) 1.00, 1.1, 1.25 (0.25) 2.50 (0.5) 5.0, 6, 7.5, 10, 12, 15, 20, 30, 60; q = 0.5 (0.5) 5.0, 6, 7.5, 10, 12, 15, 20, 30, 60; P = 0.0001, 0.001, 0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5.

216

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Bouver and Bargmann (1975) использовали разложение в цепную дробь   1 c1 d1 c2 d2 −1 ··· , (25.71) Ix (p, q) = {B(p, q)} p−1 xp (1 − x)q 1− 1+ 1− 1+ 1−

где cj =

(p + j − 1)(p + q + j − 1)x , (p + 2j − 2)(p + 2j − 1)

dj =

j(q − j) . (p + 2j − 1)(p + 2j)

Эту формулу первым применил Aroian (1941, 1950). На нее ссылаются Abramovitz and Stegun (1964), Boardmann (1975), Tretter and Waltzer (1979) и Kennedy and Gentle (1980). Bouver and Bargman (1975) рекомендуют применять эту формулу в весьма широком диапазоне значений p и q: от 10−8 до 70 000, отмечая, что наилучшие приближения получаются при p или q (или оба) меньше 1. Детальное обсуждение содержится в статье Posten (1986). В работе Kennedy and Gentle (1980) в качестве альтернативы для вычисления Ix (p, q) предлагается использование подпрограммы IMSL (1977), основанной на результатах статьи Bosten and Battiste (1974). Для вычисления Ix (p, q) при малых p и/или q могут быть использованы рекуррентные соотношения, подобные равенству (1.95) гл. 1. Другие полезные соотношения суть Ix (p + 1, q) = Ix (p, q) − {pB(p, q)} Ix (p, q + 1) = Ix (p, q) + {qB(p, q)}

−1 p

x (1 − x)q ,

(25.72a)

−1 p

x (1 − x)q .

(25.72b)

Комбинируя (25.72a) и (25.72b), получаем  −1  −1 p+1 q x (1 − x)q − p−1 xp (1 − x)q+1 . (25.73) Ix (p+1, q+1) = Ix (p, q)+{B(p, q)} Это отмечено в работах Soper (1921) и Gleissner (1984). Bosten and Battiste (1974) используют (25.73) и приводят дальнейшее описание компьютерного алгоритма. Об этом также пишет Lee (1989, 1992a, b). При q < 1 непосредственное разложение (1 − x)−(1−q) и почленное интегрирование приводит к формуле  j ∞ ∞  1  (1 − q)[j] xp+j xp  , xj −1 1 − qi = , (25.74) Ix (p, q) = B(p, q)

j!

j=0

p+j

B(p, q)

где (1 − q)[j] = (1 − q)(2 − q) · · · (j − q);

j=0

i=1

p+j

(1 − q)[0] = 1. Формула

[q] ∞  1 (1 − q∗ )[j] xj xp (1 − x)q  q(j) + (1 − x)−j , Ix (p, q) = pB(p, q) p+j j! qB(p, q) (p + q)(j) j=0

где q∗ =

(25.75)

j=1



1, q − [q]

при целом q, в остальных случаях,

и a(j) = a(a − 1) . . . (a − j + 1), предложена в работе Ludwig (1963) и приспособлена для компьютерных расчетов в статье Bosten and Battiste (1974).

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С БЕТА-РАСПРЕДЕЛЕНИЕМ

217

Majumber and Bhattacharjee (1973a, b) последовательно применяя (25.72a), получили формулу Ix (p + j + t, q − 1) = Ix (p, q) − {pB(p, q)}−1 xp (1 − x)q−j ×    q−1 x q−2 x q−j+1 x × 1+ 1+ × 1+ p+1 1−x p+2 1−x p+j−1 1−x      q−j p+q+t−2 × 1+ x 1 + ... 1 + x ··· (25.76) p+j

p+j+t−1

Lee (1992a) сравнил время вычислений для следующих алгоритмов: • Arojan (1941, 1950) с использованием цепных дробей, формула (25.71); • Bosten and Battiste (1974), формула (25.75); • Lee (1989, 1992a, b), формула (25.73); • Majumber and Bhattacharjee (1973b), формула (25.76). Выяснилось, что последний алгоритм наиболее экономен в смысле затрат машинного времени (тесты проводились на IBM 3090, VM/CMS) по сравнению с остальными тремя алгоритмами. Однако Lee (1992a) отмечает, что формула (25.75) в той форме, как она реализована в пакете IMSL (1985), более приемлема.

7.

Распределения, связанные с бета-распределением

В п. 25.3 рассмотрено распределение − log X, где X имеет стандартное распределение бета(p, q). Goldfarb and Gentry (1979), а также Barrett, Normand and Peleg (1991) подтвердили возможность заменить логарифмическим бетараспределением логнормальное распределение, когда сглаживаемые данные принадлежат распределению, имеющему как положительную, так и отрицательную асимметрию. Как показывает название, Y имеет логарифмическое бета-распределение, если log Y имеет бета-распределение, т. е. Y распределено как eX , где X — бета-распределенная случайная величина. Носитель распределения Y — конечный интервал положительной полуоси: 0 < η1  Y  η2 . Тогда X распределено по закону бета(p, q) на промежутке (η1 , η2 ] а (log Y − η1 )/(η2 − η1 ) = U имеет стандартное распределение бета(p, q). Моменты Y выражаются формулой μr (Y)

erη1 = B(p, q)

1 up−1 (1 − u)q−1 exp {r(η2 − η1 )u} du = 0

(25.77) = erη1 1 F1 (p; p + q; r(η2 − η1 )) , где 1 F 1 (·) — вырожденная гипергеометрическая функция (см. гл. 1, формула (1.125)). Логарифмическое бета-распределение рассматривается также в работах Bunz et al. (1987), Chang et al. (1988), Han et al. (1989) and Runyan et al. (1988).

218

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Если X имеет бета-распределение (25.2), то плотность случайной величины T= равна pT (t) =

1 B(p, q)



t 1+t

p−1 

1 1+t

q−1

X 1−X

(25.78)

tp−1 1 1 = , B(p, q) (1 + t)p+q (1 + t)2

t > 0; (25.79)

она является стандартной формой плотности семейства VI распределений Пирсона и называется иногда распределением бета штрих [Keeping (1962)]. Его также называют бета-распределением второго рода (в отличие от обычного бета-распределения, называемого распределением первого рода). Это распределение и его обобщения рассматриваются в гл. 27, п. 6 в связи с F-распределением. Соотношение между распределением типа VI и бета-распределениями используются в гл. 27, чтобы выразить функцию распределения центрального F-распределения через неполную бета-функцию. Несложное преобразование позволяет получить «вейбулловское» бетараспределение, рассмотрев случайную величину Z, для которой Z c при некотором c имеет стандартное бета-распределение. Легко выписываются моменты, а именно   μr (Z) = E[Z r ] − E (Z c )r/c , следовательно, μr (Z) является моментом порядка r/c бета-распределения. Если X имеет степенн´oе распределение (п. 25.1), то X −1 имеет распределение Парето (гл. 20). Смешанное бета-распределение можно получить рандомизацией одного или более параметров p, q, a и b в формуле (25.1). Такие распределения, однако, редко появляются в прикладных работах. Непрерывные распределения p и q обычно приводят к аналитическим трудностям, связанным с тем, что в формулы (25.1) или (25.2) входит B(p, q). Интерес может представить случай целых положительных p и q с фиксированной суммой: p + q = s > 2. Если p имеет дискретное равномерное распределение со значениями 1, 2, . . . , (s − 1), то плотность X при условии, что p = s, имеет вид   (s − 1)

$s−2

p−1=0

pX (x|s) =

s − 2 p−1 (1 − x)s−2−(p−1) x p−1 s−1

= 1,

(25.80)

т. е. получается равномерное распределение (гл. 26). Отсюда следует, что при любом распределении суммы p + q смешанное распределение будет равномерным, если условное распределение p при фиксированном p + q является дискретным равномерным распределением. В работе Lingappaiah (1988) рассмотрено преобразование сдвига, переводящее стандартное распределение бета(p, q) в стандартное распределение бета(p − 1, q). Roy, Roy and Ali (1993) рассмотрели биномиальную смесь бета-распределений (первого рода) с плотностью n    n r x(a/2)+r−1 (1 − x)(b/2)−1 pX (x|n, p, a, b) = p (1 − p)n−r , 0 < x < 1. r=0

r

B ((a/2) + r, b/2)

219

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С БЕТА-РАСПРЕДЕЛЕНИЕМ

Начальный момент порядка k равен

  n    b)/2 + r n r k n−r Γ (a/2) + r + k Γ (a +

. p (1 − p) E[X ] = r=0

Γ (a + b)/2 + r + k Γ (a/2) + r

r

Отсюда находим среднее и дисперсию: n    n r E[X] = p (1 − p)n−r (a + 2r)/(a + b + 2r) r=0

r

и var(X) =

n    n r p (1 − p)n−r

r

r=0

(a + 2r)(a + 2r + 2) − (a + b + 2r)(a + b + 2r + 2)

 −

n    n r=0

r

2 pr (1 − p)n−r

(a + 2r) (a + b + 2r)

.

Аналогично вводится биномиальная смесь бета-распределений второго рода с плотностью n    (a/2) + r − 1 n r , 0 < x < ∞. pX (x|n, p, a, b) = p (1 − p)n−r  ((a+b)/2)+r r=0

r

B (a/2) + r, (b/2) (1 + x)

Начальный момент порядка k равен n             a b a b n r k E[X ] = +r+k Γ −k / Γ +r Γ p (1 − p)n−r Γ . r

r=0

2

2

2

2

Отсюда получаем среднее и дисперсию: E[X] = (a + 2np)/(b − 2) и var(X) =

4 p {2(na + nb − 2) + np(2na − b − 4n)} 2a(a + b − 2) + . (b − 2)2 (b − 4) (b − a)2 (b − 4)

Johnson (1949) рассмотрел случайную величину log[X/(1 − X)], где X имеет распределение (25.2). Производящая функция моментов величины log[X/(1 − X)] равна

B(p + t, q − t) Γ(p + t)Γ(q − t) E X t (1 − X)−t = = (25.81) B(p, q)

Γ(p)Γ(q)

(ср. с (25.63)). Отсюда получается r-й семиинвариант: κr = ψ (r−1) (p) + (−1)r ψ (r−1) (q) 

(25.82)



(ср. с (25.17) и (25.17) в п. 25.3). Использование приближений для производных от гамма-функции для больших p и q дает: β1 ≈ p−1 + q−1 − 4(p + q)−1 , β2 ≈ 3 + 2p−1 + 2q−1 − 6(p + q)−1 .

(25.83)

220

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Эти формулы подобны приближенным формулам для моментных отношений случайной величины X, получаемым из (25.15c) и (25.15d): 

β1 (X) ≈ 4 p−1 + q−1 − 16 (p + q)−1 , (25.84) 

−1 −1 −1 − 30 (p + q) . β2 (X) ≈ 3 + 6 p + q Ratnaparkhi and Mosimann (1990) составили таблицы β1 и β2 для всех комбинаций параметров p, q = 0.1 (0.2) 0.5, 1, 3, 5 (5) 20 и дополнительно для q = 25. Мы уже отмечали в п. 25.2, что бета-распределение есть распределение частного X1 /(X1 + X2 ), где X1 и X2 — независимые случайные величины, распределенные по закону хи-квадрат. Если одна или обе величины X1 и X2 имеют нецентральное хи-квадрат распределение (гл. 29), то распределение отношения в работах Hodges (1955) и Seber (1963) названо нецентральным бета-распределением. Эти распределения связаны с простым или двойным нецентральным F-распределением (мы более подробно рассмотрим это в гл. 30) так же, как бета-распределения связаны с центральными F-распределениями (см. выше в этом пункте). Pham-Gia and Duong (1989) рассмотрели трехпараметрическое бета-распределение [G3B(α1 , α2 ; λ )] с плотностью pY (y|α1 , α2 ; λ ) =

λ α1 yα1 −1 (1 − y)a2 −1 , B(α1 , α2 )[1 − (1 − λ )y]α1 +α2

0  y  1;

α1 ,

α2 ,

λ > 0,

(25.85)

которое является распределением частного X1 /(X1 + X2 ), где Xi , i = 1, 2 — независимые случайные величины, имеющие гамма-распределение с параметрами (αi , βi ), λ = β1 / β2 . При λ = 1 получается стандартное бета-распределение. Если Y распределено по закону G3B(α1 , α2 ; λ ), то (1−Y) имеет распределение G3B(α2 , α1 ; λ −1 ); такое свойство аналогично свойству стандартного бетараспределения. Libby and Novick (1982) изучили многомерный вариант такого распределения и его использование для сглаживания функции полезности. Chen and Novick (1984) применили такие распределения в качестве априорных при выборочном анализе биномиальных моделей. Включение параметра λ дает возможность рассмотреть более богатое множество форм распределений по сравнению со стандартным бета-распределением. Например, G3B(α1 , α2 ; λ ) может в зависимости от λ иметь как положительную, так и отрицательную асимметрию. В общем случае при 0 < λ < 1 плотность G3B(α1 , α2 ; λ ) меньше соответствующей плотности стандартного бета-распределения в окрестности нуля, пересекает последнюю −1  в точке y0 = 1 − λ α1 /(α1 +α2 ) − (1 − λ )−1 и затем остается больше стандартной бета-плотности. При λ > 1 ситуация обратна с той же самой точкой пересечения. На рис. 25.3 показаны плотности G3B для некоторых α1 , α2 и λ . Видно, что G3B(α1 , α2 ; λ ) и G3B(α2 , α1 ; λ −1 ) симметричны относительно y = 0.5. При α1 = α2 = 1/2 и λ = 2.5 плотность G3B имеет форму U с антимодой

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С БЕТА-РАСПРЕДЕЛЕНИЕМ

221

РИС. 25.3. Плотности обобщенного бета-распределения pY (y|α1 , α2 ; λ ). (ср. с рис. 25.1, a, b)

   2 1 1 1 в точке y0 = для бета , y0 = . Аналогично G3B(1, 1; 2.5) строго 3 2 2 2 убывает, тогда как бета(1, 1) есть равномерное распределение. Плотность G3B(3, 0.5; 0.8) имеет форму J, как и бета(3, 0.5), но пересекает последнюю в точке, близкой к y0 = 0.8704. Volodin (1994) рассмотрел случайную величину X с обобщенным бетараспределеним. Функция распределения случайной величины X равна 1 FX (x) = B(α , β + γ )

x

zα −1 (x − z)β (1 − z)γ −1 dz,

0

и соответствующая плотность равна β pX (x) = B(α , β + γ )

x

zα −1 (x − z)β −1 (1 − z)γ −1 dz;

0

k-й начальный момент равен E[X k ] =

k    β k B(α + k − i, β + γ + i) . i B(α , β + γ ) β +i i=0

222

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

РИС. 25.4. Гауссовы гипергеометрические плотности px (x|2, k, 3.2), k = 1, 2, 3, 5

Если определить Y = 1 − X, то 1 FY (y) = 1 − B(α + β , γ )

1

zγ −1 (z − y)β (1 − z)α −1 dz,

y

β pY (y) = B(α + β , γ )

1

zγ −1 (z − y)β −1 (1 − z)α −1 dz,

y

E[Y k ] =

β B(α + β + k, γ )B(k + 1, β ). B(α + β , γ )

Заметим, что при β = 0 приведенное распределение превращается в бетараспределение. Другое обобщение предложено в работе Armero and Bayarri (1994). Они рассмотрели маргинальное априорное и апостериорное распределения параметра нагрузки ρ в системе массового обслуживания M|M|1, т. е. параметра геометрического распределения Pr[N = n|ρ] = (1 − ρ) ρn , n = 0, 1, 2, . . . . Случайная величина X имеет гауссово гипергеометрическое распределение с параметрами α , β , γ и z(α > 0, β > 0), если соответствующая плотность распределения равна pX (x|α , β , γ , z) = Cxα −1 (1 − x)β −1 /(1 + zx)γ ,

0  x  1,

где C — нормировочная константа: C−1 =

Γ(α )Γ(β ) F(γ , α ; α + β ; −z). Γ(α + β )

Здесь F — гауссова гипергеометрическая функция (см. гл. 1). Начальный момент порядка k случайной величины X равен E[X k ] =

B(k + α , β ) F(γ , α + k; α + β + k; −z) · . B(α , β ) F(γ , α ; α + β ; −z)

Приведенное гауссово гипергеометрическое распределение превращается в бета(α , β ), если γ и z обращаются в нуль. Примеры графиков плотности этого распределения показаны на рис. 25.4.

223

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С БЕТА-РАСПРЕДЕЛЕНИЕМ

Распределение арксинуса (25.8) изучалось несколькими авторами, в том числе в работах Norton (1975, 1978), Shantaram (1981) и Arnold and Groeneveld (1980). Плотность и центральные моменты выражаются формулами pU (u) = и



(1 − u2 )−1/2 , −1  u  1 π

  2j 2j 1 μ2j = , j = 1, 2, 3, . . . . j 2 Для распределения с плотностью   ⎧ 1 2 , |x| < ⎪  , ⎪ b ⎪ 6 2 ⎨ 2 − x2 , b = 0 pU (u|b) = π b ⎪ ⎪   ⎪ ⎩ 2  0, |x|    ,

(25.86)

(25.87)

b

Norton (1975) вывел формулу μ2j = b−2j

  2j , j

и эти моменты полностью задают распределение. Если U и V — независимые случайные величины с одинаковыми равномерными распределениями на (−π , π ), то sin U, sin 2U, − cos 2U, − cos 2U, sin(U + V) и sin(U − V) имеют распределение арксинуса. Следующие характеризационные свойства распределения арксинуса основаны на том, что в силу конечности носителя оно определяется своими моментами. 1. Если X — симметричная случайная величина, то X 2 и (1+X)/2 одинаково распределены тогда и только тогда, когда X распределено по закону арксинуса (25.8). 2. Если X — симметричная случайная величина и X 2 и 1 − X 2 одинаково √ распределены, то X и 2X 1 − X 2 имеют одинаковые распределения тогда и только тогда, когда X распределено по закону арксинуса (25.8). 3. Если X1 и X2 — симметричные независимые одинаково распределенные случайные величины и Xi2 , и 1 − Xi2 одинаково распределены, то X12 − X22 , и X1 X2 одинаково распределены тогда и только тогда, когда Xi распределено по закону арксинуса (25.8). Характеризационное свойство 1 можно сформулировать в терминах симметричного случайного блуждания. Пусть W — доля времени, проводимого случайным блужданием на положительной полуоси. Из (25.8) следует, что X − 2W − 1 имеет плотность (25.1). Seller (1966) заметил, что для W более вероятно быть ближе к 0 или к 1, чем к 1/2. В то же время, из того, что   1 2 и W X 2 и W = (1 + X)/2 одинаково распределены, следует, что 4 W − 2 имеют одинаковые распределения. Таким образом, при t ∈ (0, 1)    1 1√  t . (25.88) Pr[W  1 − t] = Pr W −   2

2

224

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Например, Pr[W  0.01] = Pr[W  0.99] = Pr[0.45  W  0.55]. Santaram (1981) доказал, что, если X и Y — независимые одинаково распределенные случайные величины, то X + Y и XY одинаково распределены тогда и только тогда, когда X имеет распределение арксинуса или одно из класса дискретных распределений, содержащего две вырожденные случайные величины и для каждого K  2 имеет единственную дискретную случайную величину, чей носитель состоит из K точечных вероятностных масс. Ранее подобный результат получил Norton (1978). Patel and Khatri (1978) изучили бета-распределение Лагранжа с функцией распределения FT (t|n, α , β , r) = 1 −

r−1  j=0





n n + βj (α t)j (1 − α t)n+β j−j j n + βj

(25.89)

и плотностью pT (t|n, α , β , r) =

r−1  j=0





n + βj n α (α t)j (1 − α t)n+β j−j−1 , j n + βj

0  α t  1. (25.90)

При β = 1 получается pT (t|n, a, 1, r) =

α (α t)r−1 (1 − α t)n−1 . B(n, r)

(25.91)

К этому распределению приводят следующие соображения. Число событий рекуррентного потока с бета-распределением интервалов между событиями имеет отрицательное биномиальное распределение (см. гл. 5). Рассмотрим поток, для которого число событий за время t  0 распределено по обобщенному отрицательному биномиальному распределению (GNB-поток): Pr[X = x|n, α , t] =

n Γ(n + β x) (α t)x (1 − α t)n+β x−x , x! Γ(n + β x − x + 1)

x = 0, 1, . . . (25.92)

[Jain and Consul (1971), гл. 6, п. 1], где 0  α t  1. Тогда функция распределения времени T до появления r-го события GNB-потока дается формулой (25.89). Patel and Khatri (1978) нашли моменты этого распределения, в частности E[T] =

r−1 n  1 , α (n + β x)(n + β x + 1)

(25.93a)

x=0

r−1 2 2  x(n − β ) − 2 E[T ] = E[T] + 2 . nα (n + β x)(n + β x + 1)(n + β x + 2) α x=0 2

(25.93b)

Легко видеть, что E[T] убывает с возрастанием β . Авторы также приводят графические иллюстрации для распределения (25.89). В работе Fosam and Sapatinas (1994) получены некоторые характеризационные свойства, основанные на анализе регрессии для распределения Парето и степенн´oго распределения. Результаты получены с помощью бетараспределений, с которыми связаны распределения, рассмотренные авторами.

225

8. ПРОИЗВЕДЕНИЯ, ЧАСТНЫЕ И РАЗНОСТИ

8.

Произведения, частные и разности независимых случайных величин, имеющих бета-распределение

Первые результаты, касающиеся произведения случайных величин, имеющих бета-распределение, получены Kotlarski (1962). С тех пор в этом направлении опубликовано не так уж много работ. Приведем некоторые примеры. Плотность произведения k независимых случайных величин, распределенных по законам бета(pi , qi ), i = 1, 2, . . . , k, имеет конечный ранг изменений, от 0 до 1, поэтому распределение определено своими моментами. При k = 2 моменты величины Y = X1 X2 равны μr =

Γ (p1 + r) Γ (p1 + q1 ) Γ (p2 + r) Γ (p2 + q2 ) · , Γ (p1 ) Γ (p1 + q1 + r) Γ (p2 ) Γ (p2 + q2 + r)

r = 1, 2, . . . ,

(25.94a)

и, чтобы Y имело бета-распределение, необходимо и достаточно, чтобы μr =

Γ(p + r)Γ(p + q) для всех r. Γ(p)Γ(p + q + r)

(25.94b)

Сокращение в формуле (25.94a) приведет к (25.94b), если p1 = p2 + q2 или p2 = p1 + q1 . В первом случае в (25.94b) p = p2 , q = q1 + q2 ; во втором случае 7k p = p1 , q = q1 + q2 . В общем случае r-й момент величины Y = i=1 Xi равен μr (Y) =

 k , Γ (pi + r) Γ (pi + qi ) , i=1

Γ (pi ) Γ (pi + qi + r)

r = 1, 2, . . . ,

(25.95a)

и Y имеет стандартное распределение бета(p, q) тогда и только тогда, когда выполнено (25.94b), а оно имеет место, если pi = p +

i−1 

qi ,

где полагаем

j=1

0 

qi = 0.

j=1

Тогда μr (Y) =



Γ(p + r)Γ(p + q1 ) Γ(p)Γ(p + q1 + r)



× =

  Γ(p + q1 + r)Γ(p + q1 + q2 ) · Γ(p + q1 )Γ(p + q1 + q2 + r)

Γ(p + q1 + . . . + qk−1 + r)Γ(p + q1 + . . . + qk ) Γ(p + q1 + . . . + qk−1 )Γ(p + q1 + . . . + qk + r)

Γ(p + r)Γ(p + q1 + . . . + qk ) , Γ(p)Γ(p + q1 + . . . + qk + r)

× ···×



= (25.95b)

 $  k и Y имеет стандартное распределение бета p, i=1 qi . В работе Fan (1991) приведен другой вывод этого утверждения.

226

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

Используя преобразование Меллина (гл. 1, формула (1.166)), Steece (1976) нашел плотность случайной величины Y = X1 X2 : pY (y) = =

Γ (p1 + q1 ) Γ (p2 + q2 ) p1 −1 y (1 − y)q1+q2 −1 2 F1 (q2 , p1 − p2 + q1 ; q1 + q2 ; 1 − y) = Γ (p1 ) Γ (p2 ) Γ (q1 + q2 )

∞  Γ (p1 + q1 ) Γ (p2 + q2 ) Γ (q2 + n) Γ (p1 − p2 + q1 + n) p1 −1 y (1 − y)q1+q2 +n−1 , Γ (p1 ) Γ (p2 ) Γ (q2 ) Γ (p1 − p2 + q1 ) n!Γ (q1 + q2 + n) n=0

(25.96a) где 2 F1 (·) гауссова гипергеометрическая функция, определенная в гл. 1, п. A6. Функция распределения величины Y равна ∞  Γ (p1 + q1 ) Γ (p2 + q2 ) Γ (q2 + n) Γ (p1 − p2 + q1 + n) Iy (p1 , q1 + q2 + n) , FY (y) = Γ (p1 ) Γ (p2 ) Γ (p1 − p2 + q1 ) n!Γ (p1 + q1 + q2 + n) n=0

(25.96b) где Iy (·) — нормированная неполная гамма-функция, определенная формулой (1.91) в гл. 1. Заметим, что иная формула получается при замене (p1 , q1 ) на (p2 , q2 ), а (p2 , q2 ) — на (p1 , q1 ). Об этом также см. в статье Fan (1991). Явные формулы для распределений произведения и частного независимых случайных величин, имеющих стандартное распределение бета(p, q) выводятся непосредственно, хотя и громоздко, если один из параметров (или оба) — целый. Dennis (1994) получил в замкнутом виде выражения (включающие ряды) для функции распределения и плотности произведения k независимых бета-распределенных величин с действительными параметрами pi , qi , i = 1, . . . , k. Автор приводит пример вычисления по найденным выражениям распределения произведения трех независимых бета-распределенных величин. Совместная плотность случайных величин X1 и X2 равна pX1 ,X2 (x1 , x2 ) = {B(p1 , q1 )B(p2 , q2 )}−1 × × xp11 −1 xp22 −1 (1 − x1 )q1 −1 (1 − x2 )q2 −1 ,

0 < x1 , x2 < 1. (25.97)

При целых q1 , q2 (25.97) принимает вид pX1 ,X2 (x1 , x2 ) = {B(p1 , q1 )B(p2 , q2 )}

−1

×

q1 −1 q2 −1

×

 t1 =0 t2 =0

(−1)t1 +t2





q1 − 1 t1



q2 − 1 p1 +t1 −1 p2 +t2 −1 x2 . x1 t2

Для вычисления функций распределения величин V = X1 X2 и W = X1 /X2 нам понадобятся интегралы от произведений xc11 xc22 по областям x1 x2  v,

227

8. ПРОИЗВЕДЕНИЯ, ЧАСТНЫЕ И РАЗНОСТИ

x1 /x2  w соответственно. Выпишем эти интегралы. ⎧ (c1 + 1) vc2 +1 − (c2 + 1) vc1 +1 ⎪ ⎪  ⎨ (c + 1) (c + 1) (c − c ) , 1 2 1 2 J1 (c1 , c2 ) = xc11 xc11 dx1 dx2 = c+1 ⎪ v x1 x2 v ⎪ ⎩ {1 − (c + 1) log v} , 2 (c + 1)

Jw∗ (c1 , c2 ) =

 x2 /x1 w

xc11 xc22 dx1 dx2 =

⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩

c1 = c2 , c1 = c2 = c; (25.98a)

c2 +1

w , (c2 + 1) (c1 + c2 + 1)

w < 1,

1 w−c1 −1 − . (c1 + 1) (c2 + 1) (c2 + 1) (c1 + c2 + 1)

w > 1. (25.98b)

Теперь FV (v) =

q1 −1 q2 −1  1 = (−1)t1 +t2 B (p1 , q1 ) B (p2 , q2 )



t1 =0 t2 =0



q2 − 1 Jv (p1 + t1 − 1, p2 + t2 − 1) , t2

(25.99a)

FW (v) =

q1 −1 q2 −1  1 = (−1)t1 +t2 B (p1 , q1 ) B (p2 , q2 )





q1 − 1 t1

t1 =0 t2 =0

Заметим, что



q1 − 1 t1



q2 − 1 ∗ Jw (p1 + t1 − 1, p2 + t2 − 1) . t2

(25.99b)

⎧ c2 v − vc1 ⎪ ⎨ ,

dJv (c1 , c2 ) c1 − c2 = c dv ⎪ ⎩ − v log v, c+1 ⎧ wc2 ⎪ , ⎨ c1 + c2 + 2 dJw∗ (c1 , c2 ) = −c1 −2 dw ⎪ ⎩ w , c1 + c2 + 2

если c1 = c2 , (25.100a) если c1 = c2 = c, если w < 1, (25.100b) если w > 1.

В случае целых pi и qi для всех i = 1, . . . , k в книге Springer (1978) 7k приводится формула плотности распределения величины Y = i=1 Xi : pY (y) =

m g i −1  i=1

j=0

Kij ydi −1 (− log y)gi −j−1 . (gi − 1 − j)!j!

(25.101)

Здесь di — число различных целых в объединенном множестве чисел ph − 1,

ph ,

ph + 1, . . . ,

ph + qh − 2

для h = 1, 2, . . . , k,

gi — число вхождений i-го числа в это объединенное множество, m — число различных gi . Заметим, к примеру, что, если в h-м подмножестве имеется $m $k qh чисел, то i=1 gi di = h=1 qh . Константы Kij определяются рекуррентным

228

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

РИС. 25.5. Плотность распределения произведения трех бета-распределенных величин

соотношением Kij =

j−1 m  

j − 1

(−1)s+1

s=0 t=1

Ki0 =

s

s!gt

(dt − di )s+1

m 

Ki,j−1−s ,

j > 0,

(25.102)

(dt − di )−gt .

t=1 t=i

Например, пусть k = 3, p1 = 9, q1 = 3, p2 = 8, q2 = 3, p3 = 4, q3 = 2. Объединенное множество целых чисел есть 8, 9, 10; 7, 8, 9; 3, 4. Число вхождений этих целых в объединенное множество: g1 = 1 для 3, 4, 7 и 10, g2 = 2 для 8 и 9. Следовательно, m = 2, d1 = 4, d2 = 2, K10 = (2 − 4)−2 =

1 , 4

K20 = (4 − 2)−1 =

1 , 2

K21

  0 · 0! · 1 0 1 =− K20 = − . 4−2 4

Соответствующая плотность равна pY (y) =

3960 3 y − 1980y4 + 99000y7 + (374220 + 356400 log y)y8 − 7 198000 10 y . (25.103a) − (443520 − 237600 log y)y9 − 7

Ее график показан на рис. 25.5. Pederzoli (1985), используя факторизацию нормированных гамма-функций, получил следующее выражение этой плотности  k  k −1 ∞ k ∞ , ,   (1 − qi )[ri ]  B(pi , qi ) ··· ah yph +rh −1 , 0 < y < 1, pY (y) = i=1

r1 =0

где ah =

rk =0 j=1

k ,

j=1

ri !

pi − pj + qi − qh

h=1

−1

(25.103b)

229

8. ПРОИЗВЕДЕНИЯ, ЧАСТНЫЕ И РАЗНОСТИ

и a[m] = a(a + 1) . . . (a + m − 1) в предположении, что pj + si = pi + sj при любых i = j и неотрицательных целых si . Величины pi и qi не обязательно должны быть целыми, но должны быть положительны. Если pi и qi — целые положительные, то (25.103b) принимает вид  k −1 q −1 q −1  k 1 k ,    pY (y) = B (pi , qi ) ··· (−1)r1 +···+rk · ah yph +rh −1 . (25.103c) i=1

r1 =0

rk =0

h=1

Tang and Gupta (1984) получили следующую формулу:  k ∞ ,  Γ pj + qj

 pY (y) = ar,k (1 − y)r , ypk −1 (1 − y)f (k)−1 Γ qj

j=1

где f (k) =

$k j=1

(25.103d)

r=0

qj и ar,k удовлетворяют рекуррентному соотношению

r [s] Γ (f (k − 1) + r)  pk + qk − pk−1 ar−s,k−1 , ar,k = Γ (f (k) + r)

a0,1 =

s=0

1 . Γ (q1 )

При k = 2 получается формула (25.96a), приведенная в статье Steece (1976). Fan (1991) предложил аппроксимацию распределения величины Y стандартным бета-распределением с параметрами

−1 −1

, q = (1 − S)(S − T) T − S2 , p = S T − S2 где S=

 k  , pi i=1

pi + qi

и

T=

k , i=1



pi (pi + 1) . (pi + qi ) (pi + qi + 1)

Такая аппроксимация основана на совпадении среднего и дисперсии. Автор сравнил первые 10 моментов точного и приближенного распределений для большого диапазона значений параметров и получил довольно близкие совпадения. Например, при k = 3, (p1 , p2 , p3 ) = (778, 43, 23) и (q1 , q2 , q3) = (567, 57, 12) восьмой момент приближенного распределения равен 0.10554 · 10−5 , а точное значение равно 0.103925 · 10−5 . Pham-Gia and Turkkan (1993) изучили распределения величины D = X1 −X2 . Ее плотность равна ⎧ q1 +q2 −1 ⎪ (1 − d)p2 +q1 −1 × ⎪ B(p2 , q1 )d ⎪ ⎪ ⎪ 1 ⎪ ⎪ × F1 (q1 , p1 + p2 + q1 + q2 − 2, 1 − p1 ; p2 + q1 ; 1 − d, 1 − d2 ) ⎪ ⎪ A ⎪ ⎪ ⎨ для 0  d  1, pD (d) = ⎪ B(p1 , q2 )(−d)q1 +q2 −1 (1 + d)p1 +q2 −1 × ⎪ ⎪ ⎪ ⎪ ⎪ 1 ⎪ × F1 (q2 , 1 − p2 , p1 + p2 + q1 + q2 − p1 + q2 ; 1 − d2 , 1 + d) ⎪ ⎪ A ⎪ ⎪ ⎩ для − 1  d  0, (25.103e)

230

ГЛАВА 25. БЕТА-РАСПРЕДЕЛЕНИЕ

РИС. 25.6. Плотности распределений разностей независимых бета-распределенных случайных величин

где A = B(p1 , q1 )B(p2 , q2 ) и F1 (a, b1 , b2 ; c; x1 , x2 ) =

∞ [i+j] ∞   a i=0 j=0

c[i+j]

[j]

·

j

i b[i] 1 b2 x1 x2 i!j!

— первая гипергеометрическая функция Аппеля двух переменных; здесь a[b] = a(a + 1) . . . (a + b − 1), ряды сходятся при |x1 | < 1 и |x2 | < 1. Форма распределения сильно меняется в зависимости от (pi , qi ), i = 1, 2.Несколько графиков показано на рис. 25.6, a, b, заимствованных из статьи Pham-Gia and Turkkan (1993). В статье Pham and Turkkan (1994) авторы получили выражения для плотности распределения суммы двух случайных величин, имеющих бетараспределение. Пусть X1 и X2 — независимые случайные величины, имеющие бета-распределение с параметрами (p1 , q1 ) и (p2 , q2 ) соответственно. Тогда плотность суммы S = X1 + X2 равна pS (s)=   ⎧ s ∗ p1 +p2 −1 q1 −1 ⎪ B (p , q ; p , q )s (1−s) F , 1−q , 1−q ; p +p ; , s , p ⎪ 1 1 2 2 1 2 1 2 1 2 ⎪ s−1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ 0s 0, (26.1) pY (y) = 0, y∈ / [a − h, a + h]. Мы обозначаем это распределение как U(a − h, a + h). На рис. 26.1, b показана функция распределения ⎧ y < a − h, ⎪ ⎨ 0, −1 (26.2) FY (y) = (2h) (y − a + h), a − h  y < a + h, ⎪ ⎩ 1, y > a + h. Плотность (26.1) можно записать в виде pY (y) = (β − α )−1 ,

α  y  β.

(26.1)

Стандартные формы получаются при α = 0, при α = 0, β = 1 (единичная стандартная плотность) или α = −1/2, β = 1/2. Далее обычно будем использовать параметризацию (26.1).

РИС. 26.1.

(a) Плотность равномерного распределения. (b) Функция равномерного распределения

240

241

2. ПРОИСХОЖДЕНИЕ

Интервал (α , β ) легко преобразуется в интервал (a − h, a + h): α = a − h, β = a + h. Аналогично, интервал (a − h, a + h) перейдет в (α , β ), если положить a = 1/2(α + β ), h = 1/2(β − α ). Равномерное распределение на (0, θ ) обозначаем U(0, θ ); его плотность имеет вид 1 , 0  z  θ, pZ (z) = θ 0, z∈ / [0, θ ]. 2h

Линейное преобразование Y = a − h + Z переводит U(0, θ ) в равномерное θ распределение на (a − h, a + h). Можно также рассмотреть равномерное распределение на интервале (a, a + θ ) с плотностью 1 , a  x  a + θ, pX (x) = θ 0, z∈ / [a, a + θ ]. Стандартизированное равномерное распределение с нулевым средним и единичным стандартным отклонением имеет плотность √ √ 1 pU (u) = √ , − 3  u  3. (26.3) 2 3

В дальнейшем мы называем стандартным равномерное распределение на (0; 1) с плотностью (26.4) pR (r) = 1, 0  r  1. Если R равномерно распределено на (0; 1), то √ U = 3(2R − 1) имеет стандартизированное равномерное распределение.

2.

Происхождение 1

Равномерное распределение (26.1) при a = 0 и h = 10−k часто используют 2 как распределение ошибки округления табличных значений с k десятичными знаками. Если округление выполняется в двоичной системе счисления, следует взять h = 2−(k+1) . Nagaev and Mukhin (1966) изучили условия, при которых ожидаемое распределение ошибок округления является равномерным. В частности, они случайные величины с харакпоказали, что, если X1 , X2 . . . — независимые теристическими функциями E eitXj = φj (t), то при a > 0 для существования предела ⎫ ⎧ ⎡ ⎤ n n ⎬ ⎨  Xj ⎦ x  x = , 0  x < a, Xj − a ⎣ lim Pr n→∞ a ⎭ a ⎩ j=1

j=1

необходимо и достаточно, чтобы n   , 2π k φj =0 j=1

a

при k = ±1, ±2, . . . .

242

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

  $n Xj В приведенных выражениях означает целую часть величины j=1 a  : $n $n Xj $n Xj $ есть ошибка округления величины nj=1 Xj j=1 a , т. е. j=1 Xj −a  j=1 a   7n 2π k в единицах a. Условие = 0 выполняется, если величины Xj j=1 φj  a 2π k  одинаково распределены и φj  < ηk < 1 для бесконечного множества a индексов j и некоторых ηk < 1. Holewijn (1969) показал, что, если lim n−1

n→∞

n 

φj (2π k) = 0,

k = 1, 2, . . . ,

j=1

то последовательность дробных частей равномерно распределена почти наверное, т. е. почти все величины {Xj − [Xj ]} имеют равномерные распределения. Равномерное распределение возникает также в результате интегрального вероятностного преобразования [Quesenberry (1986)]. Если X — непрерывная случайная величина и Pr[X  x] = F(x), то F(X) имеет распределение (26.1) с a = h = 1/2 или, что то же самое, (26.4). Этот результат, на который впервые обратил внимание Фишер [Fisher (1932)], находит разнообразные применения [см., например, Durbin(1961), Pearson (1938), Stephens (1966)] в некоторых методах комбинирования результатов статистического тестирования (см. п. 9).

3.

Исторические замечания

Равномерное распределение является настолько естественной моделью, что его упоминание в литературе встречается чаще, чем можно было бы ожидать. Например, использование этого распределения содержится уже в работах Байеса [(Bayes (1767)] и Лапласа [Laplace (1812)]. Определенный интерес в публикациях также проявляется к распределению суммы независимых случайных величин, имеющих одинаковые равномерные распределения. В статье Seal (1950) приводится обширная библиография по этому предмету (см. также п. 26.9).

4.

Производящие функции, моменты и порядковые статистики

Среднее значение случайной величины Y с плотностью (26.1) равно a. Распределение симметрично, поэтому центральные моменты нечетного порядка равны нулю. При четном r центральный момент порядка r равен μr (Y) = (r + 1)−1 hr . (26.5) " Отсюда получается var(Y) = (1/3)h2, β1 = α3 = 0 и β2 = α4 = 1.8. Математическое ожидание стандартного равномерного распределения (26.4) равно 1/2, дисперсия равна 1/12; это соответствует h = 1/2.

4. ПРОИЗВОДЯЩИЕ ФУНКЦИИ, МОМЕНТЫ И ПОРЯДКОВЫЕ СТАТИСТИКИ

243

Формула (26.5) дает значение абсолютного центрального момента для всех положительных r. В частности, среднее отклонение равно h/2. Следовательно, для этого распределения √

Среднее отклонение 3 = 0.866. (26.6) = Стандартное отклонение 2

iY = eita {sin th/th}. Производящая Характеристическая функция равна E e  

tY 1 = eta {sh(th)/th} = (th)−1 et(a+h) − et(a−h) . функция моментов равна E e 2 Семиинварианты суть ⎧ при нечетном r > 1, ⎨ κ1 = a, κr = 0 r−1 r (26.7) ⎩ κr = 2 h B r при четном r. r

Здесь Br есть r-е число Бернулли, см. гл. 1, п. А9. Информационная производящая функция [(u − 1)-й частотный момент] равна (26.8) T(u) = (2h)1−u . Энтропия равна −T  (1) = log(2h). Характеристическую функцию распределения U(0; 1) можно записать в виде ∞ eit − 1  (it)j φX (t) = = . (26.9) it

j=0

(j + 1)!

 Производящая функция моментов этой случайной величины есть et − 1 /t. В более общем случае, производящая функция моментов равномерного распределения на (0; θ ) равна eθ t − 1 sh(θ t/2) = eθ t/2 . θt θ t/2

(Отметим, что Haigt (1961) приводит ошибочное выражение.) Для равномерного распределения на (a, a + θ ) кривая Лоренца имеет вид  

 ; θ L(u) = au + θ u2/2 , a+ 2

а индекс Гини равен θ {3(θ + 2a)}. Плотности распределений порядковых статистик X1  X2  · · ·  Xn случайной выборки объема n из равномерного распределения (26.1) получается из общей формулы [гл. 12, формула (12.14)], которая дает: pX1 , ... ,

Xn (x1 ,

... ,

xn ) = n!(2h)−n ,

a − h  x1  · · ·  xn  a + h, (26.10a)

а для стандартного равномерного распределения (a = h = 1/2) pX1 , ... ,

Xn (x1 ,

... ,

Плотность распределения pXj (x) =

xn ) = n!, Xj ,

0  x1  · · ·  xn  1.

(26.10b)

соответствующая (26.10b), равна

n! xj−1 (1 − x)n−j , (j − 1)!(n − j)!

0  x  1.

(26.11a)

244

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Это является стандартной плотностью распределения бета(j, n − j + 1) (см гл. 25, формула (25.2)) Плотность совместного распределения Xi и Xj есть pXi ,Xj (xi , xj ) =

j−i−1 n−j n! xi−1 xj − xi , 1 − xj (i − 1)!(j − i − 1)!(n − j)! i 0  xi  xj  1.

(26.11b)

Выпишем моменты. s i[r] (n − j + 1)[s]

r = E X  i 1 − Xj , [r+s] (n + 1)

Отсюда

где a[b] = a(a + 1) . . . (a + b − 1). (26.11c)

E Xi = (n + 1)−1 i, var(Xi ) = (n + 1)−2 (n + 2)−1 i(n + 1 − i),

  cov Xi , Xj = (n + 1)−2 (n + 2)−1 i(n + 1 − j).

Используя совместное распределение наименьшей и наибольшей порядковых статистик (т. е. X1 и Xn ), можно найти плотность распределения размаха W = Xn − X1 в виде pW (w) = n(n − 1)wn−2 (1 − w),

0 < w < 1,

(26.12)

т. е. W имеет распределение бета(n − 1, 2). Распределение отношения Wij = Xi /Xj , i < j, выводится из (26.11b) и в точности совпадает с распределением i-й порядковой статистики в выборке объема j − 1 из стандартного равномерного распределения; оно дается формулой (26.11a), в которой n заменяется на j − 1, а j — на i, что дает стандартное распределение бета (i, j − i). Распределение произведения Yij = Xi Xj , i < j, в выборке объема n из равномерного распределения на (0; 1) выводится из (26.11b). Соответствующая плотность равна: ⎧ n−j    ⎪ n! 1 ⎪ (j/2)−1 j−i k n − j k/2 ⎪ y (1 − y) (−1) y × ⎪ ⎪ k ⎨ 2 (i − 1)!(n − j)! (j − i)! k=0   pY (y) = 1 ⎪ ⎪ × 2 F1 j − i, (j + k) − i + 1; j − i + 1; 1 − y , если 0 < y < 1, ⎪ ⎪ 2 ⎪ ⎩ 0 в противном случае. (26.13a) При i = 1 и j = n имеем:    1 ny(n/2)−1 (1 − y)n−1 2 F1 n − 1, n − 1; n; 1 − y , если 0 < y < 1, pY (y) = 2 0 в противном случае, (26.13b) где функция 2 F1 определена в гл. 1, п. A6.

245

5. ХАРАКТЕРИЗАЦИОННЫЕ СВОЙСТВА

5.

Характеризационные свойства

Характеризационные свойства равномерного распределения часто служат полезным инструментом для выбора статистик при построении критериев согласия, для моделирования сложных статистических алгоритмов и для проверки качества датчиков псевдослучайных чисел. Многие характеризационные свойства равномерного распределения могут быть выведены из соответствующих свойств экспоненциального распределения (гл. 19), так как монотонное преобразование X = e−Y случайной величины Y, распределенной по экспоненциальному закону, дает величину, равномерно распределенную на (0; 1). Например, Hamdan (1972) доказал, что распределение величины X является равномерным на (0;1) тогда и только тогда, когда

E − log(1 − X)|X > y = − log(1 − y) + 1 для y ∈ [0; 1). (26.14a) Pusz (1988) приводит характеризационные свойства типа

E h(X)|X  x = g(x),

(26.14b)

где h(·) и g(·) — некоторые известные функции. Чтобы величина X имела равномерное распределение на (0; 1) необходимо и достаточно, чтобы для любого α ∈ (0; 1)

1 y−a , y ∈ (0; 1) (26.14c) E X −a |X < y = 1−α

[ср. с характеризацией экспоненциального распределения (гл. 9, п. 8), связанной со свойствами условных математических ожиданий; дальнейшие результаты см. в работе Galambos and Kotz (1988)]. Существует несколько характеризационных теорем в многомерных пространствах, когда распределение является равномерным в некоторой сфере [Brown, Cartwright and Eagleson (1986)]. Herer (1993) вывел следующую теорему. Пусть X — действительная случайная величина, множество значений которой ограничено. X имеет равномерное распределение (непрерывное или дискретное) тогда и только

1 тогда, когда для любых a < b из области значений E X|a  X  b = (a + b) 2 при Pr[a  X  b] > 0. Аналогичный результат получили Das Gupta, Goswami and Rao (1993); мы ниже еще раз обратимся к этой работе. Фактически Ouyang (1993) (см. ниже), Herer (1993) и Das Gupta, Goswami and Rao (1993) независимо друг от друга получили одно и тоже характеризационное свойство. Широкое распространение получили характеризации, основанные на свойствах корреляций порядковых статистик. Terrell (1983), Abdelhamid (1985) и некоторые другие авторы доказали следующее свойство. Пусть X1  X2 — порядковые статистики выборки объема 2 из непрерывного распределения с конечной дисперсией. Тогда коэффициент корреляции между X1 и X2 не превосходит 1/2, причем равенство достигается тогда и только тогда, когда распределение генеральной совокупности является равномерным. Papathanasiou (1990) показал, что для выборки объема 2 имеет место неравен 1

ство cov X1 , X2  var(X), причем равенство достигается в том и только том 2

246

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

случае, когда выборка извлечена из равномерно распределенной популяции; об этом также пишет Ma (1992). Balakrishnan and Balasubramanian (1993) выяснили, что эти характеристические теоремы равносильны свойству, осно1/2

1 ванному на неравенстве E X2 − E(X)  var(X) , полученному в работах 3 Hartley and David (1954) и Gumbel (1954). Sz´ekely and M´ori (1985) обобщили результат Террела; они показали, что  1/2

 r(n + 1 − s) corr Xr , Xs  , 1  r < s  n, (26.15) s(n + 1 − r)

и равенство достигается только для выборки из равномерного распределения. Доказательства в статьях Terrell (1983), Abdelhamid (1985) и Sz´ekely and M´ori (1985) различны, но основаны на неравенстве Коши—Шварца. Приведенные характеризационные свойства показывают, что порядковые статистики выборки из равномерного распределения наиболее коррелированны. Saleh (1976) при выводе характеризационной теоремы использовал свойства ожидаемого расстояния между последовательными порядковыми статистиками. Аналогичные идеи неявно содержатся в книге Cox and Lewis (1966). Теорема устанавливает, что при определенных условиях на значения ξ свойство G(u) = infx [x : F(x) > u] и при конечности среднего   σ σ σ     , i = 1, 2, . . . , n, где Vi = Xi − Xi−1 X0 = ξ − ; Xn+1 =ξ+ E [Vi ] = n+1 2 2  σ σ характеризует равномерное распределение на ξ − , ξ + . Приложения 2 2 этого свойства оказались полезными для некоторых задач теории массового обслуживания. Huang, Arnold and Ghosh (1979) рассмотрели супераддитивную непрерывную функцию F(·) (удовлетворяющую неравенству F(x + y)  F(x) + F(y) для всех x, y и x + y в области определения F). Функция F(·) является функцией равномерного распределения, если распределения V1 и Vk совпадают при некотором k = 2, . . . , n. Если заменить супераддитивность ограниченностью носителя, абсолютной непрерывностью и монотонностью плотности, то характеризационное свойство равномерного распределения сохраняется [Ahsanullah (1989)]. Можно сравнить это с характеризационным свойством экспоненциального распределения, приведенным в гл. 19, п. 8, справедливым при более ограничительных условиях. Заметим, что для распределения n Бернулли с вероятностью успеха распределения V1 и V2 совпадают, так n+1 что некоторое условие гладкости на F является существенным. Shimizu and Huang (1983) доказали, что в классе абсолютно непрерывных распределений равномерное распределение на (0; θ ) характеризуется свойством d

X2 − X1 = X1 .

(26.16)

Lin (1986) установил, что для выборки объема 2 из любого распределения с конечным вторым моментом   2 4  E[X 2 ], (26.17) E X2 3

247

5. ХАРАКТЕРИЗАЦИОННЫЕ СВОЙСТВА

причем равенство имеет место тогда и только тогда, когда F вырождена (с единичным скачком при x = 0) или является равномерной функцией  1 распределения на [0; c], где c = 3E[X 2 ] 2 > 0. [В доказательстве используется явное выражение E X2 в терминах F −1 (·): 1

 E X2 = F −1 (t)2tdt, 0

а также неравенство Коши—Шварца]. Lukacs (1979) получил характеризацию равномерного распределения на [−1; 1], состоящую в том, что математические ожидания величин S=

n n 

3  4 1 2Xj Xk − 4Xj Xk − 6Xj2 Xk2 + Xj2 n(n − 1) n

(26.18a)

n n 

4  1

3  1 Xj Xk − 2Xj2 Xk3 + 2Xj − Xj n(n − 1) n

(26.18b)

j=k

и T=

j=1

j=1

j=k

не зависят от X1 + · · · + Xn . Доказательство включает в себя решение довольно трудного дифференциального уравнения относительно характеристической функции. Das Gupta, Goswami and Rao (1993) показали, что из справедливости равенства 

1   X1 + Xn = 1 Pr E X1 |X1 , Xn = (26.19) 2

для некоторого n  3 следует, что распределение X или является равномерным, или дискретным равномерным с равноотстоящими значениями (см. гл. 6, п. 10.1). Идея доказательства в том, что приведенные свойства условного математического ожидания определяют структуру носителя исследуемого распределения. Теперь мы приведем характеризационные свойства, основанные на неравенствах между моментами и так называемых неравенствах Чернова (Chernoff), являющихся вариантами 1-го неравенства Чебышёва. Эти свойства получены в работе Sumitra and Kumar (1990). Если X имеет абсолютно непрерывное распределение на [−1; 1] и симметричную унимодальную плотность с модой в нуле, то ⎧  ⎫ ⎨ E [g(X)]2 ⎬ 

2   8π −2 E |X| ,  (26.20) E X  sup  2 g ⎩ E [g (X)] ⎭ где верхняя грань берется по четным выпуклым функциям g(·) на [−1; 1] таким, что g(0) = 0. Верхняя грань достигается тогда и только тогда, когда X имеет равномерное распределение на [−1; 1]. Как и для многих других характеризационных свойств, в доказательстве неравенства (26.20) используется неравенство Коши—Шварца.

248

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Характеризационные свойства, используемые при построении критерия согласия, получили Seshadri and Shuster (1971) в неопубликованной работе. Утверждается, что при некоторых условиях регулярности необходимым и достаточным условием того, что независимые одинаково распределенные случайные величины Y1 и Y2 имеют равномерные распределения на [0; θ ] при некотором θ > 0, является равномерное распределение случайной величины T = min(Y1 , Y1 )/max(Y1 , Y1 ) на (0; 1). Kotz (1974) приводит различные детали. Интересные характеризационные теоремы связаны со свойством, приведенным в книге Feller (1966): если X1 и X2 независимы, обе принимают значения на (0; 1) и X1 имеет равномерное распределение на (0; 1), то дробная часть величины X1 + X2 , а именно, Z = X1 + X2 − [X1 + X2 ] ([a] — целая часть a) также имеет равномерное распределение на (0; 1) тогда и только тогда, когда X2 равномерно распределено на (0; 1). Stapleton (963) обсуждает аналогичную задачу в более абстрактной постановке. Arnold and Meeden (1976) заметили, что в приведенных условиях X1 и Z также независимы. Goldman (1968) установил следующее свойство. Пусть X1 и X2 — независимые одинаково распределенные случайные величины и Z = (X1 + X2 ) mod 1. Если X1 и Z имеют одинаковые распределения, то X1 равномерно распределено на (0; 1) распределение на   или имеет дискретное равномерное множестве значений 0, m−1 , 2m−1 , . . . , (m − 1)m−1 при некотором m. Другая версия этого результата, находящая приложения в исследовании операций, такова. Если X1 и X2 — независимые случайные величины со значениями на (0; 1) с одинаковой функцией распределения F, то (X1 + X2 ) mod 1 имеет ту же функцию распределения F тогда и только тогда, когда X1 (и X2 ) имеет равномерное распределение на (0; 1) (или дискретное равномерное распределение, определенное функцией F). Arnold and Meeden (1976) получили аналогичный результат. Driscoll (1978) обобщил этот результат на случай, когда X1 и X2 — независимые величины, плотность распределения которых отлична от нуля на конечном промежутке [a, b], и X1 + X2 − a для 2a  X1 + X2  a + b, Z= (26.21) X1 + X2 − b для a + b < X1 + X1  2b (при a = 0, b = 1 получаем Z = (X1 + X2 ) mod 1). Этот факт может служить примером трех случайных величин, попарно независимых, но зависимых в совокупности. Пусть X — непрерывная случайная величина со значениями в [a; b].

Ouyang (1993) показал, что E X|X > c = (b + c)/2 для a < c < b тогда и только тогда, когда X имеет равномерное распределение. Ouyang (1993) установил также, что для n случайных величин усло  вие E Xk+1 − Xk |Xk = c = (b − c)/(n + k + 1) для некоторого 1  k < n и a < c < b также характеризует равномерное распределение. Из этого последнего утверждения следуют многие характеризационные свойства такого типа, появившиеся в предшествующей литературе. Несколько иное свойство, полезное при составлении датчиков случайных чисел получено в работе Deng and George (1992). Приведем резюме их результата. Пусть U и V — независимые случайные величины со значениями в (0; 1),

249

6. ОЦЕНКИ ПАРАМЕТРОВ

имеющие непрерывные плотности. Тогда утверждения (26.22a)–(26.22d) равносильны: U ∼ U(0; 1),   U 1−U , ∼ U(0; 1) и не зависит от V, W1 = min V 1−V   Δ 1−Δ W2 = min , ∼ U(0; 1) и не зависит от V, 1−V

V

(26.22a) (26.22b) (26.22c)

где Δ = I(V>U) — индикатор события V > U, W3 = (U + V) mod 1 ∼ U(0; 1) и не зависит от V.

(26.22d)

Этот результат дает частичное решение проблемы определения семейства функций g, для которых равномерность распределения U и V влечет (а также следует из) равномерность распределения g(U, V), если U и V независимы и имеют плотности, отличные от нуля на (0; 1). Это позволяет конструировать методы улучшения датчиков случайных чисел, делая распределение случайных чисел более близким к равномерному.

6.

Оценки параметров

Рассматриваем, как обычно, случайную выборку объема n как множество независимых случайных величин Y1 , Y2 , . . . , Yn , одинаково распределенных с плотностью (26.1). На отрезке a − h  min(Y1 , , . . . , Yn )  max(Y1 , , . . . , Yn )  a + h функция правдоподобия равна (2h)−n . Максимум этой функции тем больше, чем меньше h. Иными словами, оценка максимального правдоподобия (ОМП) параметра h равна 1

# h= (26.23) Размах выборки (Y1 , Y2 , , . . . , Yn ) . 2

Тогда ОМП параметра a равна # a=

1 [min (Y1 , Y2 , . . . , Yn ) + max (Y1 , Y2 , . . . , Yn )] = midrange(Y1 , . . . , Yn ) 1) . 2

(26.24) Наилучшими линейными несмещенными оценками h и a являются h и # a (26.25a) (n + 1)(n − 1)−1# соответственно. Дисперсии этих оценок равны соответственно (26.25b) 2h2(n − 1)−1 (n + 2)−1 и 2h2(n + 1)−1 (n + 2)−1 . Оценки # a и # h не коррелированны, но зависимы. Действительно, совместная плотность равна  n−1 n−2 2 n(n−1)h , 0  h  h, 0  a −a−h  a −a+h  2h. p#a,#h (a , h ) = h (26.26) 1) Midrange — полуранг. — Прим.

ред.

250

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Плотность маргинального распределения # h дается формулой  n−1 2 p#h (h ) = 2 n(n − 1)hn−2 (h − h ), 0  h < h;

(26.27)

плотность маргинального распределения # a равна n−2   n−1  2 1 1  n − a − a −  , a − h  a  a + h. p#a (a ) = 2

(26.28)

h

h

2

2

Функции распределения Pr[# h < H] и Pr[# a < A] без труда получаются интегри! рованием приведенных плотностей. Среднее арифметическое Y и медиана Y также являются несмещенными оценками параметра a.   Carlton (1946) выяснил, что

! var Y var (# a) 6n 3n и . При

 =

 = (n + 1)(n + 2) n+2 var Y var Y

! возрастании n отношение var(# a)/var(Y) стремится к нулю, а var(Y)/var(Y) стремится к 3. Следовательно, эффективность оценки a средним значением Y равна нулю, а эффективность оценки медианой составляет 1/3 от эффективности Y. (Предельное распределение # a не является нормальным, поэтому, строго говоря, обсуждение эффективности не совсем корректно). Заметим, что обсуждаемые оценки являются функциями порядковых статистик, реально — наименьшего и наибольшего значений. Теория порядковых статистик для выборки из равномерного распределения (см. п. 26.4) довольно проста. Это приводит к обилию методов оценивания, базирующихся на различных комбинациях порядковых статистик. Некоторые из методов рассматриваются в следующем пункте. ОМП стандартного отклонения в√случае равномерного распределения равна √ размаху выборки, деленному на 2 3 (или полуразмаху, деленному на 3):  1 # = √ Yn − Y1 , σ 2 3

которая является также адаптивной робастной оценкой [Harter (1978)]. Если нижняя граница a−h известна, то оценки требует величина 2h. Такая ситуация получается для непрерывного варианта задачи Шрёдингера, о которой сообщаем согласно Geary (1944). Задача состоит в оценке натурального N, если имеется независимая выборка объема n, каждый элемент которой равновероятно принимает значения от 1 до N. В непрерывной модели Geary (1944) N рассматривается как положительный параметр, а наблюдаемыми являются значения Yi — равномерно распределенные случайные величины с плотностью pYi (y) = N −1 , 1

1

0  y  N;

(26.29)

см. (26.1), где a = N, h = N. 2 2 Johnson (1950) рассмотрел четыре оценки числа N, каждая из которых зависит только от Yn = max(Y1 , Y2 , . . . , Yn ). 1. Оценка Y  n , являющаяся ОМП. 2. Оценка с наименьшим среднеквадратическим отклонением:   # N = (n + 2)Y n /(n + 1).

251

6. ОЦЕНКИ ПАРАМЕТРОВ

ТАБЛИЦА 26.1 # и N #  Сравнение N n

Отношение средних квадратических ошибок

Показатель близости

1 2 3 4 5 10 20 ∞

1.333 1.029 1.001 1.002 1.008 1.036 1.061 1.094

0.571 0.530 0.505 0.509 0.519 0.542 0.556 0.571

0. Аналогично, для стандартного двумерного нормального распределения с плотностью   pX1 ,X2 (x1 , x2 ) = 21π exp – 12 x21 + x22 ордината pX1 ,X2 (x1 , x2 ), рассматриваемая как случайная величина, имеет рав  1 номерное распределение на 0; 2π , и это дает интуитивную интерпретацию метода Бокса—Мюллера (Box—Muller) получения нормальных случайных чисел (гл. 13, п. 9). Ко времени написания настоящей книги предположение о справедливости обобщения этого факта на общий многомерный случай не доказано.

9.

Распределения, связанные с равномерным

В гл. 25 уже отмечено, что равномерное распределение является частным случаем бета-распределения. Если X равномерно распределено на (0; 1] [с плотностью (26.4)], то Z = − log X распределено по экспоненциальному закону (гл. 19): (26.47) pZ (z) = e−z , z > 0. Обратно, если Z ∗ распределено по экспоненциальному закону, то X = e−Z∗ имеет стандартное равномерное распределение. Таким образом, Z имеет

257

9. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАВНОМЕРНЫМ

распределение χ 2 с двумя степенями свободы (гл. 18). Этот факт используется при разработке методов комбинирования тестов. Fisher (1932) предложил проверять полученные в результате испытаний независимые случайные $k значения Z1 , Z2 , . . . , Zk совместно, сравнивая распределение i=1 Zi с рас2 пределением χ с 2k степенями свободы. [См. также Quesenberry (1986).] 7k Распределение i=1 Xi легко выводится из того, что его логарифм распределен как −

1 2 χ 2 2k

$n Распределение Sn = i=1 Xi , где X1 , X2 , . . . , Xn независимы и равномерно распределены на (0; 1), можно найти, последовательно применяя обычную операцию свертки. В результате получается распределение Ирвина—Хала [Irwin (1932), Hall (1932)]: ⎧ k    ⎪ ⎪ 1 n ⎨ (−1)j (s − j)n−1 , если k  s  k + 1, 0  k  n − 1, j (n − 1)! pSn (s) = j=0 ⎪ ⎪ ⎩ 0 в противном случае. (26.48) Для более общего распределения U(0; a) плотность Sn равна ⎧ k    ⎪ ⎪ 1 s j n ⎨ (−1) (s − aj)n−1, если k   k + 1, 0  k  n − 1, j (n − 1)!an a pSn (s) = j=0 ⎪ ⎪ ⎩ 0 в противном случае. (26.49) Среднее значение прямоугольных распределений определяется как среднее арифметическое T = Sn /n, где Sn распределено с плотностью (26.48). Плотность распределения T равна pT (t) =

[tn]     nn j n−j n (−1)j , t− j (n − 1)! n

0  t  1.

(26.50)

j=0

Она известна еще как плотность Бэйтса [Bates (1955)]. Это распределение иногда смешивают с распределением Ирвина—Хала. В упомянутой уже работе (см. п. 26.3) Seal (1950) содержится история исследований этих распределений. 1 При n = 2 распределение величины X 2 = S2 является так называемым 2 симметричным треугольным распределением: ⎧ x−a+h ⎪ , a − h  x  a, ⎨ h2 (26.51) pX 2 (x) = ⎪ ⎩a + h − x , a  x  a + h, 2 h

или в равносильной форме, pX2 (x) =

h − |x − a| , h2

a − h  x  a + h.

(26.51)

258

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

РИС. 26.3. Плотность треугольного распределения

Стандартное треугольное распределение [см. Ayyangar (1941)] имеет (после линейного преобразования) плотность вида ⎧ 2x ⎨ , 0  x  H, H (26.52) pX (x) = ⎩ 2(1 − x) , H  x  1. 1−H

График этой плотности, показанный на рис. 26.3, объясняет название «треугольное». Если H = 1/2, то распределение симметрично. Schmidt (1934) называет «зубцом» (tine) форму плотности симметричного треугольного распределения. Момент порядка r относительно H равен 



2 (−1)r Hr+1 + (1 − H)r+1

r = μ (X) = E (X − H) . H r (r + 1)(r + 2)

(26.53)

Математическое ожидание равно H +H μ1 (X) =

1 (1 + H), 3

(26.54)

− [H μ1 (X)]2 =

 1 1 − H + H2 . 18

(26.55)

дисперсия равна H μ2 (X)

Медиана равна

6 ⎧ 1 ⎪ ⎨1 − 2 (1 − H), 6 ⎪ ⎩ 1 H, 2

H

1 , 2

H

1 . 2

Среднее отклонение равно ⎧ 2 ⎨ (1 − H)−1 (2 − H)3 , 81 ⎩ 2 H −1 (1 + h)3 , 81

1 , 2 1 H . 2

H

(26.56)

Отношение среднего отклонения к стандартному отклонению иллюстрируется следующей таблицей: H Отношение

0.5 0.816

0.6 0.820

0.7 0.827

0.8 0.833

0.9 0.837

259

9. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАВНОМЕРНЫМ

Если параметры aj и hj распределения величин Xj различны при разных j, то распределение суммы Sn гораздо сложней. Tach (1958) приводит таблицы функции распределения (с пятью десятичными знаками) Sn при $n n = 2, 3 и 4 в случае aj = 0 и различных hj , удовлетворяющих условию j=1 hj = 1. Barrow and Smith (1979) приводят компактную формулу для функции распределения линейной функции независимых случайных величин, равномерно распределенных на (0; 1). Подробное исследование распределения ошибок округления (т. е., по существу, линейной  комбинации независимых величин, 1 1 равномерно распределенных на − , , см. п. 26.2) проведено в работе 2 2 Mitra and Banerjee (1971). Их вывод основан на формуле объема пересечения полупространства с n-мерным гиперкубом и включает также элементы теории сплайнов. Формула Barrow and Smith (1979) основана на соотношении + * n  αi Xi  w = Pr i=1

1 = α1

1 *(

1

w−

··· 0

n 

)n

0



αi x i

i=2

( w − α1 −

n 

)n +

+

dx2 · · · dxn ,

αi x i

i=2

+

(26.57a) где

(x)k+ =

при x  0, при x < 0,

xk 0

и w — действительное число. (26.57a) приводится к виду * n + $  (sgn v) (w − α · v)n 7n Pr αi Xi  w = v∈C , n!

i=1

i=1 αi

(26.57b)

где C есть n-мерный куб {x ∈ Rn ; 0  xi  1, i = 1, . . . , n};$суммирование m ведется по всем 2n вершинам куба C, и sgn v = (−1)m , m = i=1 vi . Mitra and Banerjee (1971) получили формулу [ранее подобный результат получен в статье Lowan and Laderman (1939)] для функции распределения величины n  ρn = (−1)s ωs Rs , s=0

где плотность случайной величины Rs равна  1 1 1 при −  x  , pRs (x) = 2 2 0 в противном случае. 1

(26.58)

Заметим, что преобразование Ts = (−1)s Rs + имеет распределение U(0; 1). 2 Функция распределения ρn записывается в интегральной форме   (26.59a) Pr [ρn  x] = · · · dt0 dt1 . . . dtn , D

260

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

где область D определена неравенствами 0  ti  1 и неравенством ω0 t0 + ω1 t1 + · · · + ωn tn  x + 2n−1 .

Интеграл в (26.59a) напоминает интеграл Дирихле, когда область интегрирования определена неравенствами 0  ts , s = 0, 1, . . . , n и t0 + · · · + tn  1. Авторы использовали интеграл Дирихле и получили: 

1 $n ω −Ω 2 i=0 i (n + 1)!ω0 ω1 · · · ωn

$

Pr [ρn  x] =

s0 +s1 +···+sn s (−1)

при −

n n 1 1 ωi  x  ωi . 2 2 i=1

Здесь Ω=

n+1

x+

n 

(26.59b)

i=1

si ωi  x +

i=1

n 1 ωi , 2 i=0

и для каждого i суммирование ведется по si = 1, 2. Моменты четных порядков равны  (2ν )! 7n ω hi

2ν −2ν i=0 i 7n , E ρn = 2 i=0 (hi

(26.60)

+ 1)!

где суммирование распространяется на целые значения h0 , h1 , . . . , hn , $четные n для которых выполнено равенство h = 2ν . Все моменты нечетного i i=0 $n 2 ω порядка равны нулю. Дисперсия равна i=0 i /12, эксцесс равен ( n )( n )−2  κ4 6  4 2 β2 − 3 = 2 = − ωi ωi , κ2

5

i=1

i=1

и он отрицателен, что говорит о пологости формы плотности. Таким образом плотность является более плоской в окрестности медианы, чем стандартная нормальная плотность. Для малых x плотность асимптотически равна ⎧ ( )−1/2 )−1 ⎫ ( n n ⎨ ⎬   6 ωi2 exp − 6 ωi2 x2 . (26.61) pρn (x) = π ⎩ ⎭ i=0

i=0

Формула Mitra and Banerjee равносильна формуле Barrow and Smith (1979), выведенной по инициативе H. O. Hartley. Совместное распределение разностей последовательных порядковых статистик выборки из стандартного равномерного распределения является распределением Дирихле (гл. 40). Пусть Y1  Y2  · · ·  Yn , как определено   в начале п. 7, и Vi = Yi − Yi−1 , i = 1, . . . , n + 1, Y0 = a − h, Yn+1 = a + h; тогда pV1 , ... ,Vn (v1 , . . . , vn ) = n!(2h)−n ,

0  vi ,

n  i=1

vi  2h.

(26.62)

261

9. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАВНОМЕРНЫМ

Полагая h = 1/2, что соответствует единичному диапазону значений, имеем: pV1 , ... ,Vn (v1 , . . . , vn ) = n!,

0  vi ,

n 

vi  1

(26.63)

i=1

[ср. с (26.10a) и (26.10b)]. Более содержательно природу этого совместного распределения можно объяснить, заметив, что (26.63) получается как распределение величины W

Vi = $n+1i j=1

Wj

,

i = 1, 2, . . . , n + 1,

где W1 , W2 , . . . , Wn+1 — независимые в совокупности случайные величины, 2 распределенные    по закону χ с двумя степенями свободы. Тогда

одинаково    Yn−s+1 − Ys / Yn−r+1 − Yr при s > r имеют бета-распределение с параметрами n − 2s + 1, 2(s − r) (см. гл. 25, п. 2). Критерий такого типа предложен в работе David and Johnson (1956) при проверке гипотез о значении эксцесса; авторы также используют вероятностные интегральные преобразования. Другой пример, показывающий, что размах Yn − Y1 имеет значение, равное $ n i=2 Vi , состоит в том, что размах имеет бета-распределение с параметрами n − 1 и 2, что видно из (26.22); см. также (26.27). Распределение отношения U размахов, вычисленных по выборкам объемов n и n из распределения (26.1) с одинаковыми значениями h, изучено в статьях Rider (1951, 1963). Плотность распределения этого отношения (n — объем выборки для числителя) равна  ⎧    ⎨ C (n + n )un −2 − (n + n − 2)un −1 , 0  u  1,   (26.64) pU (u) = ⎩ C (n + n )u−n − (n + n − 2)u−n −1 , 1  u, где C =

n (n − 1)n (n − 1) (n + n )(n + n − 1)(n + n − 2)

. Rider (1951) приводит таблицы верхних

10-, 5- и 1-процентных точек. Более подробные таблицы приводятся в статье Rider (1963). Murty (1955) изучил распределение отношения V наибольших значений в двух независимых выборках из U(0; 2h). Он показал, что ⎧    nn ⎪ ⎨   vn −1 при 0  v  1, n +n pV (v) = (26.65)   ⎪ ⎩ n n v−n −1 при v  1,   n +n



где n — объем той выборки, где наибольшее выборочное значение является б´oльшим из двух. В статье приведены таблицы верхних 5%-х точек распре деления max V, V −1 для n , n = 2 (1) 20. Последние два результата можно использовать для проверки совпадения двух равномерных распределений в том, что касается интервала значений (во втором случае при известном значении левой границы интервала). Критерий, предложенный Hyrenius (1953), использует «пересечение диапазонов». Пусть

262

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

L и L — наименьшие наблюденные выборочные значения в двух выборках, а U  и U  — наибольшие (для определенности считаем L  L ). Тогда смещенные размахи суть U  − L и U  − L . Для отношения V = Hyrenius (1953) вывел плотность распределения в виде ⎧  (n − 1)n n −1 ⎪ v при 0  v  1, ⎨   n +n −1 pV (v) =   ⎪ ⎩ (n − 1)n v−n при v  1.  

U  − L U  − L

(26.66)

n +n −1

L − L , равную V плюс отношение U  − U 

Он также рассмотрел величину T = размахов двух выборок.

9.1.

Смесь двух равномерных распределений

Смеси равномерных распределений играют определенную роль при обработке данных. Такие смеси являются инструментом построения гистограмм по экспериментальным данным без оценки составляющих распределений. В работе Gupta and Miyawaki (1978) изучена проблема оценки смеси двух равномерных распределений, имеющих плотность pY (y) = pf1 (y, β ) + (1 − p)f2 (y, β ), где f1 (y, β ) =

f2 (y, β ) =

⎧ ⎨1

при 0 < y < β ,

β

⎩ 0 ⎧ ⎨ 1 ⎩

(26.67)

в противном случае,

1−β

при β < y < 1, в противном случае.

0

Смесь не превращается в одно равномерное распределение, если p = β . Начальный момент порядка k распределения (26.67) равен μk = p

βk 1 − βk 1 +q · , k+1 1−β k+1

q = 1 − p.

(26.68)

Рассматривая значения Y1 , . . . , Yn как независимые случайные величины с распределением (26.67) при известном β , можно использовать оценку параметра p методом моментов (ММ): где Y = n

−1

$n i=1

! p = 1 − β − 2Y,

(26.69)

Yi . Это — несмещенная оценка, и ее дисперсия равна   4 β2 q 2 σ = + (8 − 6q − β ) . (26.70) π

12

6

Обозначим n(β ) число значений Y, не превосходящих β . Оценка максимального правдоподобия (ОМП) равна n(β ) , (26.71) # p= n

263

9. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАВНОМЕРНЫМ

и она является состоятельной несмещенной оценкой с минимальной дисперсией. При известном p состоятельная несмещенная оценка методом моментов для β есть ! = 2Y − q. β (26.72)

  , где Yr < p < Yr+1 , а именно ОМП параметра β лежит в промежутке Yr , Yr+1 ⎧ n−r   r  ⎪ Yr+1 1 − Yr ⎪Y  , ⎪ если > , ⎨r  Yr 1 − Yr+1 #= (26.73) β   r  n−r  ⎪ ⎪ Y 1 − Y  r r+1 ⎪Y , ⎩ если < , r+1   1 − Yr+1

Yr

 где r определено неравенствамиYr < p < Yr+1 . Авторам не известны # ! публикации по сравнению оценок β и β . В общем случае при неизвестных p и β оценки методом моментов имеют вид: ⎛ 2 ⎞ ( ) 4M1 − 3M2 ! q ⎜ ⎟ = ⎝ 2M1 − 1 ⎠ , (26.74) !

3M2 − 2M1 2M1 − 1

β

$n где Mr = n−1 i=1 Yir . Эти оценки состоятельны и асимптотически не смещены. Gupta and Miyawaki (1978) нашли выражения асимптотической матрицы  !q ковариаций совместного распределения ! и доказали его асимптотическую β

нормальность. # предлагается следующий итеративный Для вычисления ОМП # p и β алгоритм. Вычисляются ! p = 1−! q и β!, как указано выше. Затем вычисляется β# по формуле (26.73). Затем определяется # p как число выборочных значений # Y, меньших β /n [т. е. по формуле (26.71)]. После этого снова вычисляется β# #. по формуле (26.73). Процесс повторяется до стабилизации значений # p и β Авторам не известны работы по сравнению ОМП и оценок ММ в общем случае. Roy, Roy and Ali (1993) рассмотрели биномиальную смесь равномерных распределений на (0; a) с плотностью pX (x|n, p, a) =

n    n r=0

r

pr (1 − p)n−r (r + 1)

xr ar+1

,

0 < x < a.

Начальный момент порядка k равен n   

n r E X k = ak p (1 − p)n−r r=0

r

r+1 . r+k+1

264

9.2.

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Другие распределения, связанные с равномерным

Из распределений, происходящих от равномерного, упомянем здесь пять следующих. 1. Стьюдентово отношение t (гл. 28), когда случайные величины X1 , . . . , Xn , из которых оно составлено, независимы и имеют одинаковые равномерные распределения. Rider (1929) показал, что для n = 2 плотность −2 1 1 + |t| . Perlo (1933) получил распределение при распределения равна 2 n = 3. Siddiqui (1964) записал распределение в общем виде и вывел некоторые неравенства для функции распределения. 2. Различные распределения, получающиеся при построении тестов, различающих распределения с использованием вероятностных интегральных преобразований. Pearson (1938) показал, что, если Y имеет распределение (26.1) при a = h, то такое же распределение имеют величины 2h − Y, 2|Y − h| и другие. Durbin (1961) рассмотрел разности V1 , V2 , . . . , Vn+1 , где 1   , Y0 = 0, Yn+1 = 1. Он показал, что при h = упорядоченная Vj = Yj − Yj−1 2    последовательность V1 , V2 , . . . , Vn имеет совместную плотность pV1 ,V2 , ... ,Vn (y1 , y2 , . . . , yn ) = (n + 1)!n!,

0  y1  · · ·

 yn ,

n 

yi  1.

i=1

(26.75) Пусть, далее,

 Gj = (n + 2 − j) Vj − Vj−1



[преобразование, введенное Sukhatme (1937)]. Тогда pG1 , ... ,Gn (g1 , g2 , . . . , gn ) = n!,

gi  0,

n 

gi  1.

(26.76)

i=1

Отсюда следует, что совместное распределение величин n  Gj , r = 1, . . . , n, Wr =

(26.77)

j=1

совпадает с совместным распределением исходного набора Yr , так что каждая из величин W  имеет распределение, совпадающее с распределением соответствующего Yr . Durbin приводит множество ссылок на работы по «случайному разбиению интервала», в том числе, связанных с равномерным распределением. Упомянем более поздние работы о разбиении интервала: Chen, Liu and Zame (1981), Chen, Goodman and Zame (1984), Van Assche (1987), Johnson and Kotz (1990); см. также гл. 25, где обсуждаются эти вопросы. 3. Распределение отношения равномерно распределенной случайной величины Y к независимой нормальной случайной величине Z изучено в работе Broadbent (1954). Расчеты облегчаются благодаря тому, что, например, при a = 0 в (26.1) имеет место равенство ∞  

pZ (z)FY (Kz)dz Y  K(> 0)|Z > 0 = Pr Y  KZ|Z > 0 = 0 ∞ . (26.78) Pr Z

0

pZ (z)dz

265

9. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С РАВНОМЕРНЫМ

РИС. 26.4. Связь между равномерным распределением θ центрального угла и распределением Коши

4. Существует связь между равномерным распределением центрального угла в полукруге и распределением Коши (гл. 16) на прямой. Если θ (рис. 26.4) имеет равномерное распределение с плотностью pθ (t) = π −1 , −

π π t , 2 2

(26.79)

то плотность распределения случайной величины X = PQ(OP⊥PQ) равна pX (x) = π −1

d x 1 1 arctg = · , dx |OP| π |OP| 1 + x/|OP|2

(26.80)

т. е. X распределено по закону Коши с параметром |OP|. Cowan (1980) приводит следующий результат. Пусть W и Z имеют распределение гамма(α , 1) и бета(a, α − a) соответственно. Тогда WZ имеет распределение гамма(a, 1). Возьмем α = 2, a = 1, так что WZ распределено по стандартному показательному закону, а Z имеет стандартное равномерное распределение. Учитываем, что а) Поскольку W имеет распределение гамма(2, 1), то W = W1 + W2 , где W1 и W2 — независимые случайные величины, распределенные по стандартному показательному закону. b) Поэтому Xi = exp(−Wi ), i = 1, 2, независимы и имеют стандартные равномерные распределения, как и случайная величина exp(−WZ) = = exp {−(W1 + W2 )Z} = (X1 X2 )Z . Таким образом, получается интересный результат: если X1 , X2 и Z независимы в совокупности и имеют стандартные равномерные распределения, то (X1 X2 )Z имеет стандартное равномерное распределение. Другое доказательство приводят Zhao-Guo and Hong-Zhi (1980), использующие характеристическую функцию, Scott (1980), использующий моменты распределений, и Westcott (1980), использующий пуассоновский процесс. Westcott также получил следующее обобщение. Пусть ( n )Z , Xi , Yn = i=1

где X1 , . . . , Xn — независимые в совокупности случайные величины, имеющие стандартные нормальные распределения. Тогда плотность распределения Yn = − log Wn равна ∞   Γ (n − 1) 1 tn−2 e−t dt = (n − 1)−1 1 − y , (26.81) pYn (x) = (n − 1)!

Γ(n − 1)

y

где Γy (n − 1)/Γ(n − 1) — нормированная неполная гамма-функция (см. гл. 1, п. A5).

266

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

5. Proctor (1987) ввел обобщенные равномерные распределения с функцией распределения h

FX (x) = 1 − {1 − k(x − a)c } ,

k, c, h > 0;

a  x  a + k−1/c .

(26.82)

Эти распределения аналогичны распределению Бёрра (Burr) типа XII (см. гл. 12, п. 4.5) с функцией распределения вида FX (x) = 1 − (1 + xc )−k ,

x > 0.

(26.83)

Распределение (26.83) охватывает область изменения (β1 , β2 ), не охватываемую распределением (26.82).

10.

Приложения

Равномерное распределение часто используется в практических целях для иллюстрации теоретического материала в процессе преподавания или в учебной литературе. Chu (1957) и Leone (1961) использовали равномерное распределение при выборочном определении диапазона значений измеряемой величины. Anderson (1942) дает один из первых примеров использования для стратифицирования выборки. Leven (1952) и другие авторы применяют равномерное распределение при определении функции мощности критериев случайности. Naus (1966) использует равномерное распределение для сравнении мощности критериев неслучайности кластеризации. Многочисленные приложения связаны с непараметрическими тестами типа теста Колмогорова—Смирнова. Распределение Ирвина—Хала (Irvin—Hall) и Бэйтса (Bates) (см. п. 29.9) находят применения при изучении моделей несчастных случаев [см., например, Haight (1965)]. Несколько физических приложений содержится в книге Feller (1966).

10.1. Поправки группировки Использование равномерного распределения в качестве распределения ошибок округления, а также в связи с вероятностным интегральным преобразованием уже упомянуты в пп. 26.2 и 26.9. Это распределение играет главную роль при выводе поправок Шеппарда (1907) для уточнения выборочных моментов с учетом группировки. Пусть X имеет плотность pX (x). Пусть, далее, наблюдаемым является не ! из множества {a + jh}, где j — значение X, а ближайшее к X значение X целое (положительное, отрицательное или нуль). Тогда   ! = α + jh = Pr X

α +(j+1/2)h 

pX (x)dx.

(26.84)

α +(j−1/2)h

Ищется «усредненное» соотношение между функциями распределения случай! Если предположить, что X − X ! равномерно распределено ных величин X и X.

267

10. ПРИЛОЖЕНИЯ

на

  1 1 − h; h , то 2

2

! = X + Y, X

где Y имеет равномерное распределение с плотностью pY (x) = h−1 , −

1 1 h  y  h. 2 2

В силу независимости X и Y ! = κr (X) + κr (Y). κr (X) Используя (26.7), находим

! κ1 (X) = κ1 (X), ! − 1 h2 , κ2 (X) = κ2 (X)

(26.85)

12

! κ3 (X) = κ3 (X),

! + 1 h4 . κ4 (X) = κ4 (X) 120

! − h2 μ2 (X)/2 ! Из последнего равенства следует, что μ4 (X) = μ4 (X) + 7h4 /240.

10.2. Оценка времени жизни Мы приведем здесь распределение статистики, основанной на r наименьших из n независимых наблюдений из равномерного распределения. В терминологии теории надежности эта статистика включает три частных случая: (1) сумма r наименьших времен отказа, (2) общее наблюденное время работы до r-го отказа и (3) сумма всех n времен отказа. Статистика определяется формулой (n) = t1 + t2 + · · · + tr + (m − r)tr , Tr,m

(26.86)

где ti есть i-е по возрастанию наблюдаемое значение времени до отказа и m > r − 1, причем не обязательно целое. В случае m = n эта статистика имеет смысл общего наблюдаемого времени жизни в схеме измерения времени жизни без замен. Представленные ниже результаты получены в работе Gupta and Sobel (1958). (n) даются формулами Плотность и функция распределения Tr,m (n,n) pTr,m (n) (t) = A r−1,m (m − t),

FTr,m (n) (t) = 1 −

1 A(n,n+1) (m − t) n + 1 r−1,m

(26.87a) (26.87b)

соответственно, где 0  t  m, и    r − 1 (m − 1 − t)n−1 n (m − t)n−1 (n,n) · − +··· . Ar−1,m (m − t) = 1 (r − 1)! mn−r+1 (m − 1)n−r+1 Из этих выражений получаются, в частности, функции распределения для (n) (n) (n) (n) , 2. Tr,n , 3. Tn,n . Среднее и дисперсия Tr,m следующих случаев: 1. Tr,m равны

(n) r(2m − r + 1) = E Tr,m , (26.88a) (2n + 1)

268 и

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

(n)  r(n − r + 1)(2m − r + 1)2 r(r + 1)(r − 1) = var Tr,m + . 2

(26.88b)

12(n + 1)(n + 2)

4(n + 1) (n + 2)

(n) асимптотически нормально при r = λ n, m = γ n, Распределение статистики Tr,m 0 < λ  1, где λ  γ < ∞ фиксированы, и n → ∞. Другое применение статистик, основанных на r наименьших наблюдениях, для тестирования продолжительности жизни приводится в статье Epstein (1948).

10.3. Приложения к исследованию трафика Allan (1966) использовал равномерное распределение при построении модели распределения трафика вдоль прямолинейной дороги. Дорога разбивается на интервалы длины h и предполагается, что в каждом интервале с вероятностью p находится автомобиль и с вероятностью q интервал свободен. Модель предполагает, что в одном интервале не может находиться более одного автомобиля и что длина автомобиля равна нулю. Еще одно предположение состоит в том, что положение автомобиля внутри интервала имеет равномерное распределение. Рисунок 26.5 иллюстрирует тот факт, что расстояние от автомобиля A до идущего непосредственно перед ним автомобиля B распределено как L = hY + X1 + X2 , где Y — число пустых интервалов между A и B — имеет геометрическое распределение (гл. 5, п. 2): Pr[Y = y] = qy p,

y = 0, 1, . . . ,

а X1 и X2 — независимые случайные величины (не зависящие также и от Y), и каждая имеет плотность распределения pX (x) = h−1 ,

0  x  h.

Плотность распределения S = X1 + X2 равна

 pS (s) = h−2 h − |s − h| ,

0  s  2h

[ср. с (26.51)]. Плотность T = hY + S равна ⎧ −2 ⎨ ph t, 0  t  h,  ph−2 qk−1 [(k + 1)h − t] + qk (1 − kh) = pT (t) = ⎩ = pqk−1 h−2 {(1 + kp)h − pt} , kh  t  (k + 1)h,

(26.89)

(26.90) k  1.

Allan называет это распределение биномиально-равномерным (binomialuniform). Не следует путать его с бета-биномиальным распределением,

РИС. 26.5. Расстояние от автомобиля A до идущего впереди автомобиля B

269

10. ПРИЛОЖЕНИЯ

РИС. 26.6. Биномиально-равномерное распределение (Allan (1966))

рассматриваемым в гл. 8, п. 3.3. График плотности (26.90) — ломаная линия. Рисунок 26.6 заимствован из статьи Allan (1966), содержащей несколько примеров. Предположение о независимости Y, X1 и X2 позволяет найти моменты T. Семиинвариант порядка r равен κr (T) = hr κr (Y) + 2κr (X1 ).

Отсюда находим

E[T] = hp−1 ,  2 

1 q + p2 , var(T) = hp−1 6  −3/2 " 1 β1 (T) = q(1 + q) q + p2 , 6   −2 1 4 1 β2 (T) = 3 + 6q2 + qp2 − p . q + p2 60

6

(26.91a) (26.91b) (26.91c) (26.91d)

Allan (1966) также нашел распределение суммы независимых случайных величин, распределенных по биномиально-равномерному закону и рассчитал таблицы функции распределения с четырьмя десятичными знаками для p = 0.4 (0.1) 0.9, t/h = 0.5 (0.5) 25, n = 1 (1) 20. Приложения к теории массового обслуживания с равномерным распределением времени ожидания приведены в работах Height (1958, 1960).

270

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

10.4. Приложения к статистическому тестированию и моделированию Мы уже говорили о вероятностных интегральных преобразованиях (конец п. 26.2) и их использовании в построении алгоритмов комбинирования результатов применения критериев значимости [см. (26.77) и начало п. 26.9]. Применение равномерного распределения при моделировании распределения ошибок округления описано в п. 26.2.

11.

Генераторы случайных чисел

Методы получения равномерно распределенных случайных чисел играют важную роль во многих приложениях метода Монте-Карло и в моделировании вообще. Датчики равномерно распределенных случайных чисел облегчают получение псевдослучайных чисел, имеющих различные непрерывные распределения. В литературе описаны различные датчики. Наиболее распространенным является «мультипликативный конгруэнтный метод», который использует формулу

 (26.92) xi = cxi−1 mod 231 − 1 . Для начала работы датчик требует задания «корневого» или начального значения x0 . Каждое из xi нормируется таким образом, чтобы попасть в интервал (0; 1). Если множитель c является примитивным корнем по модулю с 231 − 1 (который является простым числом), то максимальный период датчика (26.92) равен 231 − 2. Решетчатое распределение, порождаемое генератором (26.92), основанным на сравнениях, можно тестировать методом Marsaglia (1972) для решетчатых распределений или спектральным методом, разработанным Coveyou and MacPherson (1967). Fishman and Moore (1982) провели эмпирический анализ для различных множителей. Качество датчиков оценено положительно как с помощью теста для решетчатых распределений, так и спектрального метода. В то же время качество датчиков было различным при тестировании получаемых последовательностей на «похожесть» на выборки из равномерного распределения. Возможные значения c суть 16807, 37204094 и 950706376. Первое обеспечивает наибольшее быстродействие, тогда как последнее, по наблюдению Fishman and Moore (1982), дает наилучшее качество. Описанный метод построения датчика является универсальным в том смысле, что при фиксированном начальном значении дает одну и ту же последовательность на любом компьютере при любой конфигурации системы. Learmonth and Lewis (1973) разработали вариант приведенного датчика «с перемешиванием». По этой схеме первые 128 случайных чисел, полученных по методу (26.92), записывают в некоторую таблицу. Затем для каждого получаемого числа xi берутся младшие биты, образующие случайное целое I от 1 до 128. I-е число из таблицы выбирается в качестве псевдослучайного, а xi (после нормировки к диапазону от 0 до 1) занимает I-е место в таблице. Книги

271

11. ГЕНЕРАТОРЫ СЛУЧАЙНЫХ ЧИСЕЛ

Kennedy and Gentle (1980) и Devroye (1986) содержат глубокие обсуждения других методов моделирования равномерного, а также других распределений. В ряде статистических задач ключевую роль играют порядковые статистики из равномерно распределенной популяции. Компьютерное моделирование порядковых статистик позволяет оценивать качество статистических процедур на основе метода Монте-Карло. Простой и прямой путь моделирования порядковых статистик состоит в том, чтобы получить выборку псевдослучайных значений из равномерного распределения (вышеописанным методом) и затем упорядочить ее, применив один из алгоритмов быстрой сортировки. Такой метод, конечно, является затратным по времени и по ресурсам. Довольно много работ посвящено улучшению такого общего подхода и получению более эффективных алгоритмов генерирования порядковых статистик из равномерного распределения. Schucany (1972) предложил метод моделирования порядковых статистик из равномерного распределения, использующий то, что Xi (в выборке объема n) имеет распределение бета(i, n − i + 1) (см. п. 26.4). Например, наибольшее 1/n выборочное значение Xn можно получить как u1 , где u1 — равномерно распре1/n 1/(n−1)  = u1 u2 , деленное случайное число в интервале (0; 1). Аналогично Xn−1 где u2 — другое, не зависящее от u1 равномерно распределенное случайное  число в интервале (0; 1). Аналогично, Xn−i+1 получается по формуле  Xn−i+1 = u1 u2

1/n 1/(n−1)

1/(n−i+1)

· · · ui

.

(26.93)

Это называют методом спуска, и он позволяет исключить задачу сортировки. Lurie and Hartley (1972) опубликовали аналогичный метод получения порядковых статистик из равномерного распределения, начинающийся с получения наименьшей порядковой статистики. Его можно назвать методом подъема. На основе эмпирического анализа Lurie and Mason (1973) обнаружили, что метод спуска несколько быстрее метода подъема. Romberg and Tadikamalla (1978) и Horn and Schlipf (1986) описали алгоритм получения порядковых статистик из средней части вариационного ряда. Lurie and Hartley (1972) приводят другой, довольно интересный алгоритм получения порядковых статистик из равномерного распределения. Алгоритм основан на том, что, если Y1 , Y2 , . . . , Yn+1 независимы и имеют стандартное экспоненциальное распределение, то Y1 Y2 Y , , ... , n , Z Z Z  . Таким где Z = Y1 + Y2 + · · · + Yn+1 , распределены как X1 , X2 − X1 , . . . , Xn − Xn−1 образом порядковые статистики из равномерного распределения получаются по формуле Y + Y + · · · + Yi Xi = 1 2 , (26.94) Y1 + Y2 + · · · + Yn+1 или, что то же самое, $ i

j=1 Xi = $n+1 j=1

log Uj

log Uj

,

(26.94)

272

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

где U1 , U2 , . . . , Un+1 — равномерно распределенные случайные числа на (0; 1). Такой экспоненциальный метод требует меньшего числа операций, но на одно равномерно распределенное число больше, чем в методе спуска. В недавней работе Balakrishnan and Sandhu (1995) предложен простой и эффективный метод моделирования выборки, последовательно цензурированой по типу II из равномерного распределения на (0; 1). По этому алгоритму n случайных величин испытываются на выживание. После первого отказа R1 случайно выбранных из оставшихся значений удаляется из выборки. После второго отказа удаляется R2 случайно выбранных из оставшихся значений и т. д.; после m-го (последнего) отказа удаляется Rm из оставшихся значений; таким образом, n = m+(R1 +R2 +· · ·+ Rm ). Пусть X(1) , X(2) , . . . , X(m) — последовательно цензурированная выборка из равномерного распределения на (0; 1) и Yi =

1 − X(m−i+1) , 1 − X(m−i)

i = 1, 2, . . . , m − 1,

Ym = 1 − X(1) .

(26.95)

Balakrishnan and Sandhu (1995) доказали, что i+Rm +Rm−1 +···+Rm−i+1

Ui = Yi

,

i = 1, 2, . . . , m,

(26.96)

независимы и имеют одинаковые равномерные распределения на (0; 1). Предложенный авторами алгоритм моделирования усеченной выборки основан на этом результате. Все приведенные алгоритмы получения порядковых статистик из равномерного распределения можно использовать для получения порядковых статистик из других непрерывных распределений с помощью метода обращения функции распределения (так как при этом сохраняется порядок); об этом также см. в работе Gerotidis and Smith (1982).

Список литературы Abdelhamid, S. N. (1985). On a characterization of rectangular distributions, Statistics & Probability Letters, 3, 235–238. Ahsanullah, M. (1989). On characterizations of the uniform distribution based on functions of order statistics, Aligarh Journal of Statistics, 9, 1–6. Ali, M. M. (1975). Tail distribution of ‘Student’s’ ratio for t  n − 1 in samples of size n from rectangular distribution, Journal of Statistical Research, 9, 11–24. Ali, M. M. (1976). Tail distribution of ‘Student’s ratio for t  (n − 2)/2 in samples of size n from rectangular distribution, Journal of Statistical Research, 10, 43–71. Allan, R. R. (1966). Extension of the binomial model of traffic flow to the continuous case, Proceedings of the Third Conference of the Australian Road Research Board, 3, 276–316. Anderson, P. H. (1942). Distributions in stratified sampling, Annals of Mathematical Statistics, 13, 42–52. Arnold, B. C., and Meeden, G. (1976). A characterization of the uniform distribution based on summation modulo one with application to fractional backlogs, Australian Journal of Statistics, 18, 173–175. Ayyangar, A. A. K. (1941). The triangular distribution, Mathematics Student, 9, 85–87.

СПИСОК ЛИТЕРАТУРЫ

273

Balakrishnan, N., and Balasubramanian, K. (1993). Equivalence of Hartley-David-Gumbel and Papathanasiou bounds and some further remarks, Statistics & Probability Letters, 16, 39–41. Balakrishnan, N., and Sandhu, R. A. (1995). A simple simulational algorithm for generating progressive Type-II censored samples, The American Statistician (to appear). Barrow, D. L., and Smith, P. W. (1979). Spline notation applied to a volume problem, American Mathematical Monthly, 86, 50–51. Bates, G. E. (1955). Joint distributions of time intervals for the occurrence of successive accidents in a generalized Polya scheme, Annals of Mathematical Statistics, 26, 705–720. Bayes, T. (1763). An essay towards solving a problem in the Doctrine of Chances, Philosophical Transactions of the Royal Society of London, 53, 370–418. Bhate, D. H. (1951). A note on the significance level of the distribution of the means of a rectangular population. Bulletin of the Calcutta Statistical Association, 3, 172–173. Broadbent, S. R. (1954). The quotient of a rectangular or triangular and a general variate, Biometrika, 41, 330–337. Brown, T. C., Cartwright, O. I., and Eagleson, G. K. (1986). Correlations and characterizations of the uniform distribution, Australian Journal of Statistics, 28, 89–96. Buss, O. L., Jr. (1972). A Supplement to Haight’s «Index to the Distributions of Mathematical Statistics», M. Sc. thesis, Air Force Institute of Technology, Wright-Patterson Air Force Base, Dayton, OH, GSA/MA/72–2. Carlton, A. G. (1946). Estimating the parameters of a rectangular distribution, Annals of Mathematical Statistics, 17, 355–358. Chen, R., Goodman, R., and Zame, A. (1984). On the limiting distribution of two random sequences, Journal of Multivariate Analysis, 14, 221–230. Chen, R., Lin, E., and Zame, A. (1981). Another arc sine law, Sankhy¯a, Series A, 43, 371–383. Chu, J. T. (1957). Some uses of quasi-ranges, Annals of Mathematical Statistics, 28, 173–180. Clark, C. E. (1966). Random Numbers in Uniform and Normal Distribution, San Francisco: Chandler. Constantine, G. (ed.) (1980). Problem Corner, DMS Newsletter, 66, 2. (CSIRO, Glen Osmond, South Australia). Coveyou, R. R., and MacPherson, R. D. (1967). Fourier analysis of uniform random number generators, Journal of the Association for Computing Machinery, 14, 100–119. Cowan, R. (1980). A letter, In Constantine (1980). Cox, D. R., and Lewis, P. A. W. (1966). The Statistical Analysis of Series of Events, London: Methuen 1) . Das Gupta, S., Goswami, A., and Rao, B. V. (1993). On a characterization of uniform distributions, Journal of Multivariate Analysis, 44, 102–114. David, F. N., and Johnson, N. L. (1956). Some tests of significance with ordered variables, Journal of the Royal Statistical Society, Series B, 18, 1–20; Discussion, 20–31. Deng, L.-Y., and George, E. O. (1992). Some characterizations of the uniform distribution with application to random number generation, Manuscript, Department of Mathematical Sciences, Memphis State University, Memphis, TN. Devroye, L. (1986). Non-uniform Random Variate Generation, New York: Springer-Verlag. Driscoll, M. F. (1978). On pairwise and mutual independence characterizations of rectangular distributions, Journal of the American Statistical Association, 73, 432–433. Durbin, J. (1961). Some methods of constructing exact tests, Biometrika, 48, 41–55. 1) Кокс Д.,

Льюис П. Статистический анализ последовательностей событий. — М.: Мир, 1969.

274

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Eisenhart, C., Deming, L. S., and Martin, C. S. (1963). Tables describing small-sample properties of the mean, median, standard deviation, and other statistics in sampling from various distributions, U. S. National Bureau of Standards, Technical Note 191. Eltessi, A., and Pal, N. (1992). Estimation of the smallest and the largest of two uniform scale parameters, Communications in Statistics— Theory and Methods, 21, 2185–2201. Epstein, B. (1948). Some applications of the Mellin transform in statistics, Annals of Mathematical Statistics, 19, 370–379. Fan, D.-Y. (1991). On a property of the order statistics of the uniform distribution, Communications in Statistics— Theory and Methods, 20, 1903–1909. Feller, W. (1966). An Introduction to Probability Theory and Its Applications, Vol. 2, New York: Wiley 1) . Fisher, R. A. (1932). Statistical Methods for Research Workers, 4th ed., Edinburgh: Oliver & Boyd. Fishman, G. S., and Moore, L. R. (1982). A statistical evaluation of multiplicative congruential random number generators with modulus 231 − 1, Journal of the American Statistical Association, 77, 129–136. Galambos, J., and Kotz, S. (1978). Characterizations of Probability Distributions, Lecture Notes in Mathematics, 675, New York: Springer-Verlag. Geary, R. C. (1944). Comparison of the concepts of efficiency and closeness for consistent estimates of a parameter, Biometrika, 33, 123–128. Gerontidis, I., and Smith, R. L. (1982). Monte Carlo generation of order statistics from general distributions, Applied Statistics, 31, 238–243. Gibbons, J. D. (1974). Estimation of the unknown upper limit of a uniform distribution, Sankhy¯a, Series B, 36, 29–40. Gibbons, J. D., and Litwin, S. (1974). Simultaneous estimation of the unknown upper and lower limits in a two-parameter uniform distribution, Sankhy¯a, Series B, 36, 41–54. Goldman, A. J. (1968). Fractional container loads and topological groups, Operations Research, 16, 1218–1221. Graybill, F. A., and Connell, T. L. (1964). Sample size required to estimate the parameter in the uniform density within d units of the true value, Journal of the American Statistical Association, 59, 550–556. Gumbel, E. J. (1954). The maxima of the mean largest value and of the range, Annals of Mathematical Statistics, 25, 76–84. Gupta, A. K., and Miyawaki, T. (1978). On a uniform mixture model, Biometrical Journal, 20, 631–637. Gupta, S. S., and Sobel, M. (1958). On the distribution of a statistic based on ordered uniform chance variables, Annals of Mathematical Statistics, 29, 274–281. Haight, F. A. (1958). Two queues in parallel, Biometrika, 45, 401–410. Haight, F. A. (1960). Queueing with balking, Biometrika, 47, 285–296. Haight, F. A. (1961). Index to the distributions of mathematical statistics, Journal of Research of the National Bureau of Standards, 65B, 23–60. Haight, F. A. (1965). On the effect of removing persons with N or more accidents from an accident-prone population, Biometrika, 52, 298–300. Hall, P. (1932). The distribution of means for samples of size N drawn from a population in which the variate takes values between 0 and 1, Biometrika, 19, 240–249. Hamdan, M. A. (1972). On a characterization by conditional expectations, Technometrics, 14, 497–499. Harter, H. L. (1978). Adaptive robust estimation of location and scale parameters of symmetric populations, Technical Report AFFDL-TR-78-128, Wright-Patterson Air Force Base, OH. 1) Феллер

В. Введение в теорию вероятностей и ее применения. — Т. 2. — М.: Мир, 1984.

СПИСОК ЛИТЕРАТУРЫ

275

Hartley, H. O., and David, H. A. (1954). Universal bounds for mean range and extreme observation. Annals of Mathematical Statistics, 25, 85–99. Herer, W. (1993). A characterization of uniformly distributed random variable, Demonstratio Mathematica, 26, 207–212. Holewijn, P. J. (1969). Note on Weyl’s criterion and the uniform distribution of independent random variables, Annals of Mathematical Statistics, 40, 1124–1125. Horn, P. S., and Schlipf, J. S. (1986). Generating subsets of order statistics with applications to trimmed means and means of trimmings, Journal of Statistical Computation and Simulation, 24, 83–97. Huang, J. S., Arnold, B. C., and Ghosh, M. (1979). On characterization of the uniform distribution based on identically distributed spacings, Sankhy¯a, Series B, 41, 109–115. Hull, T. E., and Dobell, A. R. (1962). Random number generators, Journal of the Society of Industrial and Applied Mathematics, 4, 230–254. Hyrenius, H. (1953). On the use of ranges, cross-ranges and extremes in comparing small samples, Journal of the American Statistical Association, 48, 534–545. (Correction: 48, 907.) Irwin, J. D. (1932). On the frequency distribution of the means of samples from a population having any law of frequency, Biometrika, 19, 234–239. Johnson, N. L. (1950). On the comparison of estimators, Biometrika, 37, 281–287. Johnson, N. L., and Kotz, S. (1990). Randomly weighted averages: Some aspects and extensions, The American Statistician, 44, 243–249. Joo, I., and Szabo, S. (1992). On the estimate (xmin + xmax )/2, Studia Scientiarum Mathematicarum Hungarica, 27, 409–432. Kendall, M. G., and Babington Smith, B. (1938). Randomness and random sampling numbers, Journal of the Royal Statistical Society, Series A, 101, 147–166. Kendall, M. G., and Babington Smith, B. (1940). Tables of Random Sampling Numbers, Tracts for Computers, vol. 24, Cambridge: Cambridge University Press. Kennedy, W. J., and Gentle, J. E. (1980). Statistical Computing, New York: Dekker. Kotz, S. (1974). Characterizations of statistical distributions: A supplement to recent surveys, International Statistical Review, 42, 39–65. Laplace, P. S. (1812). Theorie Analytique des Probabilit´es, 1st ed., Paris. Learmonth, G., and Lewis, P. A. W. (1973). Naval Postgraduate School random number generator package LLRANDOM, In Computer Science and Statistics: 7th Annual Symposium on the Interface (ed., W. J. Kennedy), pp. 163–171. Leone, F. C. (1961). The use of sample quasi-ranges in setting confidence intervals for the population standard deviation, Journal of the American Statistical Association, 56, 260–272. Levene, H. (1952). On the power function of tests of randomness based on runs up and down, Annals of Mathematical Statistics, 23, 34–56. Lin, G. D. (1986). Characterizations of uniform distributions and of exponential distributions, Technical Report, Institute of Statistical Science, Academia Sinica, Taipei, Taiwan. Lloyd, E. H. (1952). Least-squares estimation of location and scale parameters using order statistics, Biometrika, 39, 88–95. Lowan, A. N., and Laderman, J. (1939). On the distribution of errors in N-th tabular differences, Annals of Mathematical Statistics, 10, 360–364. Lukacs, E. (1979). A characterization of the rectangular distribution, Stochastic-Processes and Their Applications, 9, 273–279. Lurie, D., and Hartley, H. O. (1972). Machine generation of order statistics for Monte Carlo simulations, The American Statistician, 26, 26–27. Lurie, D„ and Mason, R. L. (1973). Empirical investigation of several techniques for computer generation of order statistics, Communications in Statistics, 2, 363–371.

276

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Ma, C. (1992). Variance bound of function of order statistics, Statistics & Probability Letters, 13, 25–27. Marsaglia, G. (1961). Expressing a random variable in terms of uniform random variables, Annals of Mathematical Statistics, 32, 894–898. Marsaglia, G. (1972). The structure of linear congruential sequences. In Applications of Number Theory to Numerical Analysis (ed., S. K. Zaremba), pp. 249–286, San Diego, CA: Academic Press. Massey, J. L. (1988). An introduction to contemporary cryptology, Proceedings of IEEE, 76, 533–549. Mitra, S. K., and Banerjee, S. N. (1971). On the probability distribution of round-off errors in tabular differences, Australian Computer Journal, 3(2), 60–68. Mori, T. F. (1983). Note on the Cramer-Rao inequality in the nonregular case: The family of uniform distributions, Journal of Statistical Planning and Inference, 7, 353–358. Morimoto, H., and Sibuya, M. (1967). Sufficient statistics and unbiased estimation of restricted selection parameters, Sankhy¯a, Series A, 29, 15–40. Murty, V. N. (1955). The distribution of the quotient of maximum values in samples from a rectangular distribution, Journal of the American Statistical Association, 50, 1136–1141. Nagaev, S. V., and Mukhin, A. B. (1966). On a case of convergence to a uniform distribution on an interval, In Limit Theorems and Statistical Inference (ed., S. H. Sirazdinov), Tashkent: FAN, pp. 113–116. (In Russian) 1) Naus, I. (1966). A power comparison of two tests of non-random clustering, Technometrics, 8, 493–517. Nikulin, M. S. (1991). Remark on estimation of parameters of the uniform distribution, In Statistical Estimation and Testing Hypothesis Methods, Perm’, Russia: Perm’ University, pp. 36–38. (In Russian) 2) Ouyang, L. Y. (1993). Characterizations of the uniform distribution by conditional expectation, International Journal of Information and Management Sciences, 4, 107–111. Packer, L. R. (1950). The distribution of the sum of n rectangular variates, I, Journal of the Institute of Actuaries Students’ Society, 10, 52–61. Papathanasiou, V. (1990). Some characterization of distributions based on order statistics, Statistics & Probability Letters, 9, 145–147. Pearson, E. S. (1938). Tests based on the probability integral transformation, Biometrika, 30, 134–148. Perlo, V. (1933). On the distribution of Student’s ratio for samples of three drawn from a rectangular distribution, Biometrika, 25, 203–204. Proctor, J. W. (1987). Estimation of two generalized curves covering the Pearson system, Proceedings of ASA Computing Section, pp. 287–292. Pusz, J. (1988). On a characterization of probability distributions by conditional expectations, Demonstratio Mathematica, 21, 247–253. Quesenberry, C. P. (1986). Probability integral transformations, In Encyclopedia of Statistical Sciences, vol. 7 (eds., S. Kotz, N. L. Johnson, and C. B. Read), New York: Wiley, pp. 225–231. Ramberg, J. S., and Tadikamalla, P. R. (1978). On the generation of subsets of order statistics, Journal of Statistical Computation and Simulation, 6, 239–241. 1) Нагаев С. В., Мухин А. Б. Об одном случае сходимости на промежутке // Предельные теоремы и статистические выводы / Под. ред. С. Х. Сираждинова. — Ташкент: Фан, 1966. — С. 113–116. 2) Никулин М. С. Замечания к оцениванию параметров равномерного распределения // Статистические методы оценивания и проверки гипотез. — Пермь: Изд-во Пермского госуниверситета, 1991. — С. 36–38.

СПИСОК ЛИТЕРАТУРЫ

277

Rand Corporation (1955). A Million Random Digits and 100,000 Normal Deviates, Glencoe, IL: Free Press. Rider, P. R. (1929). On the distribution of the ratio of mean to standard deviation in small samples from non-normal universes, Biometrika, 21, 124–143. Rider, P. R. (1951). The distribution of the quotient of ranges in samples from a rectangular population, Journal of the American Statistical Association, 46, 502–507. Rider, P. R. (1963). Percentage Points of the Ratio of Ranges of Samples from a Rectangular Distribution, ARL 63–194, Aerospace Research Laboratories, U. S. Air Force, Wright-Patterson Air Force Base, Dayton, OH. Rizzi, A. (1990). Some theorems on the sum modulo n of two random variables, Metron, 48, 149–160. Roach, S. A. (1963). The frequency distribution of the sample mean where each member of the sample is drawn from a different rectangular distribution, Biometrika, 50, 508–513. Roy, M. K., Roy, A. K., and Ali, M. Masoom (1993). Binomial mixtures of some standard distributions, Journal of Information & Optimization Sciences, 14, 57–71. Rukhin, A. L., Kuo, L., and Dey, D. K. (1990). A class of minimax estimators of the scale parameter of the uniform distribution, Statistics & Probability Letters, 9, 317–321. Sakamoto, H. (1943). On the distribution of the product and the quotient of the independent and uniformly distributed random variables, Tohoku Mathematical Journal, 49, 243–260. Saleh, A. K. Md. E. (1976). Characterization of distributions using expected spacings between consecutive order statistics, Journal of Statistical Research, 10, 1–13. Sarhan, A. E. (1955). Estimation of the mean and standard deviation by order statistics, III, Annals of Mathematical Statistics, 26, 576–592. Sarhan, A. E., and Greenberg, B. G. (1959). Estimation of location and scale parameters for the rectangular population from censored samples, Journal of the Royal Statistical Society, Series B, 21, 356–363. Sarhan, A. E., and Greenberg, B. G. (eds.) (1961). Contributions to Order Statistics, New York: Wiley 1) . Schmidt, R. (1934). Statistical analysis of one-dimensional distributions, Annals of Mathematical Statistics, 5, 30–43. Schucany, W. R. (1972). Order statistics in simulation, Journal of Statistical Computation and Simulation, 1, 281–286. Scott, D. (1980). A letter, In Constantine (1980). Scozzafava, S. (1991). Sum and difference modulo m between two random variables, Metron, 49, 495–511. Scozzafava, S. (1993). Uniform distribution and sum modulo m of random variables, Statistics & Probability Letters, 18, 313–314. Seal, H. L. (1950). Spot the prior reference, Journal of the Institute of Actuaries Students’ Society, 10, 255–256. Seshadri, V., and Shuster, J. J. (1971). A characterization of the uniform distribution and an application to goodness of fit testing, Manuscript, McGill University, Montreal, Canada. Sheppard, W. F. (1907). Calculation of moments of a frequency distribution, Biometrika, 5, 450–459. Shimizu, R., and Huang, J. S. (1983). On a characteristic property of the uniform distribution, Annals of the Institute of Statistical Mathematics, 35, 91–94. Siddiqui, M. M. (1964). Distribution of Student’s t in samples from a rectangular universe, Revue de rinstitut International de Statistique, 32, 242–250. 1) Сархан

А. Э., Гринберг Б. Г. Введение в теорию порядковых статистик. — М.: Статистика, 1970. — 414 с.

278

ГЛАВА 26. РАВНОМЕРНОЕ (ПРЯМОУГОЛЬНОЕ) РАСПРЕДЕЛЕНИЕ

Springer, M. D. (1978). The Algebra of Random Variables, New York: Wiley. Stapleton, J. H. (1963). A characterization of the uniform distribution on a compact topological group, Annals of Mathematical Statistics, 34, 319–326. Stephens, M. A. (1966). Statistics connected with the uniform distribution: percentage points and application to testing for randomness of directions, Biometrika, 53, 235–238. Sukhatme, P. V. (1937). Tests of significance for samples from the χ 2 population with two degrees of freedom, Annals of Eugenics, London, 8, 52–56. Sumitra, P., and Kumar, B. S. (1990). Characterization of uniform distributions by inequalities of Chernoff-type, Sankhy¯a, Series A, 52, 376–382. Sz´ekely, G. J., and Mori, T. F. (1985). An extremal property of rectangular distributions, Statistics & Probability Letters, 3, 107–109. Tach, L. T. (1958). Tables of Cumulative Distribution Function of a Sum of Independent Random Variables, Convair Aeronautics Report No. ZU-7-119-TN, San Diego, CA. Terrell, G. R. (1983). A characterization of rectangular distributions, Annals o) Probability, 11, 828–836. Tippett, L. H. C. (1927). Random sampling numbers, Tracts for Computers, vol. 15, Cambridge: Cambridge University Press. Troutt, M. D. (1991). A theorem on the density of the density ordinate and an alternative interpretation of the Box-Muller method, Statistics, 22, 463–466. Van Assche, W. (1987). A random variable uniformly distributed between two random variables, Sankhy¯a, Series A, 49, 207–211. Vincze, I. (1979). On the Cramer-Frechet-Rao inequality in the non-regular case, In Contributions to Statistics: The J. Hajek Memorial Volume, Prague: Academic, pp. 253–262. Westcott, M. (1980). A letter, In Constantine (1980). Zhao-Guo, C., and Hong-Zhi, A. (1980). A letter, In Constantine (1980).

ГЛАВА 27

F-Распределение

1.

Введение

Пусть X1 и X2 — независимые случайные величины, распределенные по законам χν21 и χν22 соответственно. Распределение величины    −1 X1 ν1

X2 ν2

называется F-распределением с ν1 и ν2 степенями свободы. В частности, если Y1 и Y2 — независимые случайные величины, имеющие распределения Лапласа (гл. 24) с центром в нуле, то |Y1 /Y2 | имеет распределение F2.2 . Мы будем использовать символ Fν1 ,ν2 в обобщенном смысле для обозначения случайной величины, распределенной по этому закону. Фраза «Fν1 ,ν2 -распределение» используется в качестве синонима выражения F-распределение с ν1 и ν2 степенями свободы. Заметим, что порядок ν1 и ν2 важен. Из определения следует, что одинаково распределены. В частности, случайные величины Fν1 ,ν2 и Fν−1 2 ,ν 1 используя значок α для обозначения 100α %-ной точки, записываем Fν1 ,ν2 ,α = Fν−1 , (27.1) 1 ,ν2 1−α



поскольку Pr Fν1 ,ν2  K = Pr Fν2 ,ν1  K −1 . Важность F-распределения в статистике во многом объясняется свойствами распределения частного независимых оценок дисперсий. Пусть {Xtj } , t = 1, 2; i = 1, 2, . . . , nt ; nt  2, — независимые нормальные случайные величины со средними и средними квадратическими отклонениями, равными ξt и σt соответственно. Тогда nt nt 

2 1  Xti , Xti − X t· , где X t· = St2 = (nt − 1)−1 nt

i=1

имеет распределение лено как

χn2t −1 σt2 (nt − 1)−1 , χn2 −1 σ12 (n1 1 χn2 −1 σ22 (n2 2

т. е. имеет распределение



σ1 σ2

i=1

t = 1, 2. Отношение S12 /S22 распреде− 1)−1 − 1)−1

,

2 Fn1 −1,n2 −1 . 279

280

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

2

Статистика S1 /S2 применяется при проверке гипотезы о равенстве σ1 и σ2 . Гипотеза отвергается, если  2  2 S1 S1  Fn1 −1,n2 −1,α1 или  Fn1 −1,n2 −1.1−α2 , α1 + α2 < 1. S2

S2

Уровень значимости критерия равен α1 + α2 , а мощность (при фиксированном значении отношения σ1 /σ2 ) равна *  +  2 σ S1 1 − Pr Fn1 −1,n2 −1,α1 < < Fn1 −1,n2 −1, 1−α2  1 = S2 σ2 + *    = 1 − Pr

σ2 σ1

2

Fn1 −1,n2 −1,α1 < Fn1 −1,n2 −1
2. В этом случае имеется единственная мода в точке f = [ν2 (ν1 − 2)] [ν1 (ν2 + 2)]−1 . При ν1 = 2 мода находится в нуле; при ν1 = 1 pF (f ) → ∞ при f → 0. Момент F порядка r относительно нуля равен  r  r 

r   2 −r  ν2 ν2 ν1 (ν1 + 2) . . . (ν1 + 2 · r − 1) E χν 2 = μr = E χν21 . (27.5) ν1

ν1

(ν2 − 2)(ν2 − 4) . . . (ν2 − 2r)

282

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

1

Заметим, что если r  ν2 , то μr бесконечен. Выпишем характеристики, 2 выражающиеся через первые моменты. E[F] = var(F) =

ν2 > 2,

2ν22 (ν1 + ν2 − 2) ν1 (ν2 − 2)2 (ν2 − 4)

коэффициент вариации " β1 =

ν2 , ν2 − 2



CV(F) = 6

,

2(ν1 + ν2 − 2) ν1 (ν2 − 4)

(27.6a)

ν2 > 4;

1/2

(27.6b)

;

8(ν2 − 4) 2ν + ν − 2 · 1 2 , (ν1 + ν2 − 2)ν1 ν2 − 6

(27.6b)

ν2 > 6,

  12 (ν2 − 2)2 (ν2 − 4) + ν1 (ν1 + ν2 − 2)(5ν2 − 22) = ν1 (ν2 − 6)(ν2 − 8)(ν1 + ν2 − 2)   1 3 ν2 − 4 + (ν2 − 6)β1 2 , ν2 > 8, = ν2 − 8

(27.6c)

β2 = 3 +

(27.6d)

[Wishart (1946)]. После того как выявилась ошибка в записи характеристической функции, приведенной в работе Ifram (1970) (а также в первом издании настоящего тома), Awad (1980) нашел выражение характеристической функции распределения Gν1 ,ν2 в виде  ∞ ∞  ν2   1 1 (it)r r+j− (27.7)   2 ; B

1 1 ν , ν 2 1 2 2

r=0 j=0

r! r + j + 1 ν 2 1

j

cм. также Pestana (1977). Phillips (1982) записал характеристическую функцию распределения Fν1 ,ν2 в другом виде, используя вырожденную гипергеометрическую функцию второго рода. Напомним, что для комплексной переменной z, Re z > 0, и комплексных параметров a и c, Re a > 0, имеет место равенство ∞ 

e−zt ta−1 (1 + t)c−a−1 dt = Γ(a)Ψ(a, c; z),

0

определяющее вырожденную гипергеометрическую функцию второго рода. Phillips (1982) показал, что характеристическая функция величины Fν1 ,ν2 равна Γ



 1   (ν1 + ν2 ) ν ν ν 2 Ψ 1 , 1 − 2 ; − 2 it . Γ(ν2 /2) 2 2 ν1

(27.7)

Формула (27.3) показывает, что G(1 + G)−1 = ν1 F(ν1 + ν2 F)−1 имеет стан1 1 дартное бета-распределение, определенное в гл. 25, с параметрами ν1 + ν2 . 2 2 Следовательно,   1 1 (27.8) ν1 , ν2 , Pr[F  f ] = If1 2

2

283

2. СВОЙСТВА

 где If1



1 1 , ν — неполная нормированная бета-функция (см. гл. 25) и 2ν1 2 2 ν1 f . f1 = ν2 + ν1 f

Равенство (27.8) может быть использовано для компьютерных расчетов по методу, описанному в гл. 25, п. 6.2 для бета-распределения. Отметим, что соотношение [гл. 1, формула (3.37)] между биномиальным распределением и нормированной неполной бета-функцией означает, что для F-распределения функцию распределения можно записать как сумму биномиальных вероятностей и наоборот. Точное разложение в ряды функции распределения Fν1 ,ν2 дается формулой:

Pr Fν1 ,ν2  y = ⎧ 2θ (y) ⎪ , ν1 = ν2 = 1, ⎪ ⎪ π ⎪ ⎪ ⎪ ⎪ A(ν2 ), ν1 = 1, ν2 > 1 — нечетно, ⎪ ⎪ ⎪ ⎪ ⎪ 2θ (y) ⎪ ⎪ ⎪ π − с(ν1 , 1), ν2 = 1, ν1 > 1 — нечетно, ⎪ ⎪ ⎪ ⎪ ⎪ A(ν2 ) − c(ν1 , ν2 ), ν1 > 1, ν2 > 1 — оба нечетны, ⎪ ⎨  = 1 − xν2 /2 1 + ν2 (1 − x) + ν2 (ν2 + 2) (1 − x)2 + · · · + ⎪ 2 2·4 ⎪  ⎪ ⎪ ν1 −2 ⎪ ν ( ν + 2) . . . ( ν + ν − 4) ⎪ 2 2 2 1 ⎪ 2 (1 − x) , ν1 — четно, + ⎪ ⎪ 2 · 4 · . . . · (ν1 − 2) ⎪ ⎪ ⎪  ⎪ ⎪ ν1 ν1 (ν1 + 2) 2 ν1 (ν1 + 2) . . . (ν2 + ν1 − 4) ν2 2−2 ⎪ ν1 /2 ⎪ x + x + · · · + x 1 + , (1 − x) ⎪ ⎪ 2 2·4 2 · 4 · . . . · (ν2 − 2) ⎪ ⎪ ⎪ ⎩ ν2 — четно, (27.9)   " ν2 θ (y) = arctg y ν1 /ν2 , x = , ν2 + ν1 y   2 2 2 · 4 · . . . · (ν2 − 3) θ + sin θ cos θ 1 + cos2 θ + · · · + cosν2 −3 θ , A(ν2 ) =

где

π

3 · 5 · . . . · (ν2 − 2)

3

ν2 > 1,

 (ν2 − 1)/2 ! 2  sin θ cosν2 θ × c (ν1 , ν2 ) = √ · π (ν1 − 1)/2 !

 ν +1 (ν + 1)(ν2 + 3)(ν1 + ν2 − 4) sin2 θ + · · · + 2 sinν1 −3 θ , × 1+ 2 3

3 · 5 · . . . · (ν1 − 2)

ν2 > 1.

Для дробных a обозначаем a! = Γ(a+1). Эти формулы приведены в справочнике Abramovitz and Stegun (1964) (гл. 26, написанная M. Zelen and N. C. Severo) и затем подтверждены в работе Chen and Makowsky (1976), которые обнаружили незначительную опечатку и составили подпрограмму на FORTRANе. Lee (1988) использовал (27.9) (с модификациями) для вычисления значений функции распределения F и сообщил о некоторых преимуществах

284

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

по сравнению с подпрограммой MDFD, приведенной в трудах Института математических и статистических библиотек — пакетов, [IMSL (1985)]. Случайные величины, имеющие F-распределение, легко получить из бета-распределенных величин методом, описанным в гл. 25, п. 2. Grzeg´orski (1972) предложил алгоритм, названный им «PF Snedekor» для вычисления функции распределения Fν1 ,ν2 . Метод является более быстрым, чем алгоритм «Fisher», предложенный для целых чисел степеней свободы ν1 и ν2 в работе Donner (1968), и в некоторых случаях более быстрым, чем алгоритм «F-тест», предложенный Morris (1969). («F-тест» вдвое медленнее, чем «PF Snedekor» и использует вдвое больше параметров.) Grzeg´orski (1972) использует формулу ⎧ P(ν1 , ν2 , x) , ν2 — четно, ⎪ ⎪ ⎪ ⎪ ⎪ ν1 — четно, 1 − P(ν2 , ν1 , 1 − x), ⎨

Pr Fν1 ,ν2  f = 0.5 + [R(ν1 , ν2 , x) − ⎪

⎪ ⎪ " (ν1 −1)/2 ! ⎪ ⎪ P(ν1 , ν2 , x)/π ], ⎩ − 2(1−x)

ν1 , ν2 — нечетны, (ν2 −1)/2 !

(27.10)

где x = ν1 f /(ν1 f + ν2 ) и 1 P(ν1 , ν2 , x) = xν1 /2 2

6 R(ν1 , ν2 , x) =

/2)−1 (ν2 k=0

 (ν1 /2) + k − 1 !

 {2(1 − x)}k , (ν1 /2) − k !k!

(ν1 /2)−1

 1 x(1 − x) 2 k=0



k!  xk + arctg 1 ! k+ 2



0.5 − x √ x(1 − x)

 .

[Как и выше, для дробных y полагаем y! = Γ((y + 1).] При возрастании ν2 величина χν21 /ν2 стремится к единице с вероятностью 1. При фиксированном ν1 распределение Fν1 ,ν2 сходится к распределению χν21 /ν1 при ν2 → ∞. ? 2  χn 2 Пусть Un = χν , где χν2 и χn2 — независимые случайные величины, n

распределенные по законам хи-квадрат с ν и n степенями свободы соответственно. Тогда Un /ν имеет F-распределение с ν и n степенями свободы. Обозначим G(x) и g(x) — функцию распределения и плотность случайной величины χν2 (гл. 18). Fujikoshi (1987) показал, что   2  1 x x − (ν − 2) + Pr[Un  x] = G(x) − g(x) × n 2 2   4 3 2 1 x x x x + 2 − (9ν − 2) + (ν − 2)(9ν − 4) − (v − 2)(v − 4)(3v − 2) + · · · . n

16

48

48

16

Рассмотрев затем преобразованную случайную величину     1 U Vn = n + (ν − 2) log 1 + n , 2

n

285

2. СВОЙСТВА

 где n > max 0, (2 − ν )/2 , Fujikoshi and Mukaihata (1993) установили, что Pr[Vn  x] = G(x) + O(n−2 ) для всех действительных x. Авторы также привели некоторые приближения и границы для квантилей распределения Vn . Для получения аппроксимаций часто удобно рассматривать распределение 1) 1 zν1 ,ν2 = log Fν1 ,ν2 , вместо распределения Fν1 ,ν2 . Такой прием использовал еще 2 Fisher (1924). Распределение log Fν1 ,ν2 иногда называют логарифмическим F-распределением. Аппроксимации распределения мы рассмотрим в следующем пункте, а здесь приведем формулы для моментов zν1 ,ν2 . Опуская индексы, запишем производящую функцию моментов: 

 





 ν t/2 Γ 2 (ν1 + t) Γ 2 (ν2 − t) E etz = E F t/2 = 2 .     1 1 ν1 1

Γ

ν1 Γ

2

1

2

ν2

Семиинварианты zν1 ,ν2 суть        1 ν 1 1 log 2 + ψ κ1 (z) = ν1 − ψ ν2 , 2 ν 2 2    1   1 1 κr (z) = 2−r ψ (r−1) ν1 + (−1)r ψ (r−1) ν2 , r  2, 2

2

(27.11)

(27.12a) (27.12b)

d log Γ(z)

— двойная гамма-функция. Все моменты z конечны. Для где ψ (z) = dz r  2 можно привести альтернативную формулу κr (z) = (r − 1)!

∞ 

(−1)r (ν1 + 2j)−r + (ν2 + 2j)−r .

(27.12c)

j=0

Имеется несколько формул для κr (z) для некоторых частных случаев при различных соотношениях между ν1 и ν2 . Приведем основные формулы, полученные в работах Aroian (1941) и Wishart (1947). 1. ν1 и ν2 четные. * +    1 ν2 ∗ −1 log , (27.13a) j − E[z] = 2

где до



Σ∗j

означает



авторов.

j

суммирование

по

от

j

1 max(ν1 , ν2 ) − 1 , причем Σ∗j j−1 = 0, если ν1 = ν2 . 2 1 var(z) = 0.822467 − 4

1) Хотя

ν1

((ν1 /2)−1  j=1

)

(ν2 /2)−1 −2

j

+



1 min(ν1 , ν2 ) 2

−2

j

.

(27.13b)

j=1

z — это случайная величина, она обычно обозначается строчной буквой. — Прим.

286

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Для любого r  2 *( −r

κr (z) = 2 (r − 1)!

где Sr =

∞ $

)

(ν1 /2)−1

Sr −



(

−r

+ (−1)

j

)+

(ν2 /2)−1



Sr −

r

j=1

−r

,

j

(27.13c)

j=1

j−r .

j=1

2. ν1 и ν2 нечетные. *( κr (z) = (r − 1)!

)

(ν2 −3)/2



Tr −

(2j + 1)−r

(



Tr −

+ (−1)r

j=0

для r  2, где

)+

(ν1 −3)/2

(2j + 1)−r

j=0

(27.14)

 Tr = Sr 1 − 2−r =

∞ 

(2j + 1)−r .

j=0

В частности, 1 var(z) = 2.467401 − 4

((ν2 −3)/2 ) −3)/2     1 −2 (ν1 1 −2 j+ j+ ; . (27.15a) + 2

j=0

математическое ожидание



1 ν E(z) = log 2 2 ν1



2

j=0



∗ 

(2j + 1)−r .

(27.15b)

j

1 2

Здесь суммирование по j в сумме Σ∗j ведется от j = min(ν1 , ν2 )−1/2 1

до j = max(ν1 , ν2 ) − 3/2. 2 3. ν1 четно, ν2 нечетно. ) ( (ν1 /2)−1 )+ *( (ν2 −3)/2     1 r −r + − Sr − , r 2. κr (z)=(r −1)! Tr − (2j+1) j−r 2

j=0

4. ν2 четно, ν1 нечетно. ( * κr (z)=(r −1)! 2−r

(ν2 /2)−1

Sr −



j−r

)

j=1

( + (−1)r

j=0

(ν1 −3)/2

Tr −



(2j+1)−r

(27.16) )+ , r 2.

j=0

(27.17) Эти формулы легче запомнить, если принять во внимание соотношение



 κr (z) = 2−r κr log χν21 + (−1)r κr log χν22 для r  2. (27.17)

3.

Порядковые статистики

Порядковые статистики G1  · · ·  Gn для выборки объема n из распределения Gν1 ,ν2 (27.3) рассмотрены Patil, Raghunandanan  в работе

 

 2 and Lee (1985a, b). Таблицы E Gi , E G i и E G i Gj составлены для n = 2 (1) 5, ν1 = 2 (1 ) 4 и ν2 = 5 (1) 7. Выражения для плотностей

4. ТАБЛИЦЫ

287

и функций распределения весьма громоздки даже в наиболее простом случае четных чисел степеней свободы. В случае нечетных чисел степеней свободы возникают существенные вычислительные трудности.

4.

Таблицы

Формула (27.8) показывает, что при вычислении функции распределения Fν1 ,ν2 можно пользоваться таблицами нормированной неполной бета функции. В подходящих случаях, понятно, подойдут таблицы биномиальных вероятностей или таблицы вероятностей отрицательного биномиального распределения. Это отмечают многие авторы, например, Bizley (1950), Johnson (1959), Mantel (1966). Аналогично, по процентным точкам бета-распределения можно несложным пересчетом получить соответствующие точки F-распределения, однако удобно иметь таблицы непосредственно значений процентных точек F-распределения (т. е. значения Fν1 ,ν2 ,α ) при заданных ν1 , ν2 и α . Такие таблицы существуют, и мы перечислим здесь только наиболее известные, за исключением приводимых (частями) в учебниках. Ст´oит отметить, что достаточно привести только верхние процентили (α  0.5). Нижние легко получаются по формуле . Fν1 ,ν2 ,1−α = Fν−1 2 ,ν 1 ,α Greenwood and Hartley (1961) разбили таблицы Fν1 ,ν2 ,1−α на две категории: 1. Для α = 0.005, 0.001, 0.025, 0.05, 0.1 и 0.25. 2. Для α = 0.001, 0.01, 0.05 и 0.20. Merrington and Thompson (1943) составили таблицы с пятью десятичными знаками для ν1 = 1 (1) 10, 12, 15, 20, 24, 30, 40, 60, 120, ∞ и ν2 = 1 (1) 30, 40, 60, 120, ∞. (Большие значения включены, чтобы облегчить гармоническую интерполяцию по переменной 120ν −1 .) Fisher and Yates (1953) приводят таблицы второй категории с двумя десятичными знаками для ν1 = 1 (1) 6, 8, 12, 24, ∞ и ν2 = 1 (1) 30, 40, 60, 120, ∞. Более подробные таблицы с тремя значащими цифрами составил Hald (1952). Он приводит значения Fν1 ,ν2 ,1−α для α = 0.0005, 0.0001, 0.1, 0.3 и 0.5 для ν1 = 1 (1) 10 (5) 20, 30, 50, 100, 200, 500, ∞, ν2 = 1 (1) 20 (2) 30 (5) 50, 60 (20) 100, 200, 500, ∞,

а также для α = 0.005, 0.01, 0.025, 0.05 для ν1 = 1 (1) 20 (2) 30 (5) 50, 60 (2) 100, 200, 500, ∞, ν2 = 1 (1) 30 (2) 50 (5) 70 (10) 100 (25) 150, 200, 300, 500, 1000, ∞.

Из упомянутых работ заимствованы многочисленные другие таблицы. Таблицы предшествующих лет(уже упомянутые в 27.2) дают не значения 1 Fν1 ,ν2 ,α , но zν1 ,ν2 ,α = log Fν1 ,ν2 ,α . Для больших ν1 и ν2 интерполяция по 2 числу степеней свободы гораздо проще для z, чем для F. Это не является первопричиной ввода z [см.Fisher (1924)], но теперь это основная причина использования таких таблиц [см.Fisher and Yates (1953)]. Понятно, что при

288

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

редко возникающей необходимости можно использовать их как таблицы F-распределения, так и вычислить нужные величины по значениям zν1 ,ν2 ,α = 12 log Fν1 ,ν2 ,α . Zinger (1964) предложил следующий метод интерполяции в таблицах

процентных точек Fν1 ,ν2 для расчета Pr Fν1 ,ν2 > K . Ищутся значения Fν1 ,ν2 ,1−α и Fν1 ,ν2 ,1−mα такие, что Fν1 ,ν2 ,1−mα  K  Fν1 ,ν2 ,1−α . Тогда

Pr Fν1 ,ν2 > K ≈ 1 − α mk , где k удовлетворяет уравнению kFν1 ,ν2 ,1−mα + (1 − k)Fν1 ,ν2 ,1−α = K. Laubscher (1965) привел примеры, показывающие точность гармонической интерполяции (аргументы ν1−1 и ν2−1 ) как по одному, так и по обоим, ν1 и ν2 при фиксированном α . Большев, Гладков и Щеглова (1961) составили вспомогательные таблицы для точного расчета функций распределения бета и z-распределений. Mardia and Zemroch (1978) составили таблицы F-распределения и связанных с ним распределений и привели соответствующие алгоритмы. Их таблицы содержат значения Fν1 ,ν2 ,α с пятью значащими цифрами для ν1 = 0.1 (0.1) 1.0 (0.2) 2.0 (0.5) 5 (1) 16, 18, 20, 24, 30, 40, 60, 120, ∞, ν2 = 0.1 (0.1) 3.0 (0.2) 7.0 (0.5) 11 (1) 40, 60, 120, ∞, α = 0.0001, 0.0005, 0.001, 0.005, 0.01, 0.02, 0.025, 0.03 (0.01) 0.1, 0.2, 0.25, 0.3, 0.4, 0.5.

Включение дробных значений ν1 и ν2 полезно, если F-распределение используется для аппроксимации.

5.

Аппроксимации и номограммы

Равенство (27.8) показывает, что функция распределения случайной величины F равна нормированной неполной бета-функции. Аппроксимации последней являются аппроксимацией F-распределения. Аппроксимации нормированной неполной бета-функции описаны в гл. 3 и гл. 25. Здесь мы остановимся на более специальных аппроксимациях F-распределения. Их, конечно, можно использовать для приближения нормированной неполной бета-функции. Таким образом, содержание этого пункта можно рассматривать как расширение п. 6 гл. 3 и п. 6 гл. 25. Приводимые ниже приближения получены с помощью остроумных искусственных приемов и имеют, в основном, историческое значение. Мы решили включить их как отражение исследований в этом направлении для практических потребностей. Многие из этих аппроксимаций потеряли значимость с развитием компьютерных технологий. 1 Уже отмечено, что распределение z = log F ближе к нормальному, 2 чем F-распределение. Несколько приближенных методов базируются или на нормальных аппроксимациях или на их модификациях, например, на разложении Корниша—Фишера (Cornish—Fisher), см. гл. 12, п. 5.

289

5. АППРОКСИМАЦИИ И НОМОГРАММЫ

Для больших значений обоих параметров, ν1 и ν2 , распределение z  1 −1 аппроксимируется нормальным со средним δ = ν2 − ν1−1 и дисперсией 2  1 −1 σ2 = ν2 + ν1−1 , что приводит к простой приближенной формуле 2

 zν1 ,ν2 ,α ≈ 1 ν2−1 − ν1−1 + Uα

 1 −1 ν + ν2−1 2 1

2

= δ + Uα σ ,

(27.18)

предложенной Фишером [Fisher (1924)]. Фишер также предложил заменить ν1−1 и ν2−1 на (ν1 − 1)−1 и (ν2 − 1)−1 , что дает б´oльшую точность. Более точное приближение получается при использовании разложения Корниша—Фишера [Cornish—Fisher (1937)]. Одно из таких приближений [Aroian (1946), Fisher and Cornish (1960), Wishart (1957)] получается, если использовать приближенные формулы для семиинвариантов: 2   1  δ 2 3   1 σ 3 zν1 ,ν2 ,α ≈ Uα σ + δ Uα2 + 2 + σ Uα + 3Uα + Uα + 11Uα + 3

12

36

σ

  1 1 δ 4 3Uα + 7Uα2 − 16 + · · · . δσ 2 Uα4 + 9Uα2 + 8 − 30 810 σ 2 3

+

(27.19)

Первые два слагаемых можно переписать в виде    1 1 2 Uα − 1 + U α σ . δ + Uα σ + δ Uα2 − 1 = δ 1 + 3

3

Fisher (1924) предложил следующую формулу: 

−1/2  1 2 Uα − 1 + U α σ 1 − σ 2 zν 1 , ν 2 , α ≈ δ 1 + .

(27.20)

3

Она отражает влияние остальных слагаемых в (22.19). Формула (22.20) модифицирована в работе Cochran (1940):    −1/2 1 2 1 2 Uα − 1 + U α σ 1 − Uα + 3 zν 1 , ν 2 , α ≈ δ 1 + , (27.21) 3 6  

что отличается от суммы первых трех слагаемых на Uα3 + 11Uα /36 δ 2 /σ . Carter (1947) вывел другую формулу, использующую более точные выражения для семиинвариантов z, выведенные Уишартом (Wishart) и несколько модифицированные. Для больших ν1 и ν2 имеет место приближенное равенство:  

 1/2  zν 1 , ν 2 , α

где

−1

Uα2 /6 − 1/2 + 2ν1 ν2 ν1 + ν2 ≈

−1 2ν1 ν2 ν1 + ν2   

2 ν1 + ν2 1 1 1 2 − −  Uα + 2 − , 6 ν1 ν2 ν1 ν2 Uα

νj = νj − 1,

− (27.22)

j = 1, 2.

Отметим еще следующий асимптотический результат, полученный Aroian (1942). Он показал, что для больших ν1 и ν2 распределение величины zν 1 , ν 2

√ 2 (ν1 + ν2 − 1) ν1 ν2 ν1 + ν2

290

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

близко к распределению t с ν1 + ν2 − 1 степеней свободы. Aroian предложил приближенную формулу:   √ 2 (ν1 + ν2 − 1) Pr zν1 ,ν2 > tν1 +ν2 −1,1−α ≈ ν1 + ν2 6    (ν1 + ν2 − 1) 1 −1 5 exp ν1 + ν2−1 − (ν1 + ν2 − 1)−1 , (27.23) ≈α ν1 + ν2

6

12

где tν1 +ν2 −1,1−α есть 100(1-α )%-ная точка t-распределения с ν1 + ν2 — 1 степеней свободы. Правая часть всегда меньше α . Эта аппроксимация часто уступает формуле (27.21) Корниша—Фишера. Последние формулы были в дальнейшем модифицированы в работе Aroian (1947), который привел интересные числовые сравнения различных приближений. По его заключению наилучшим способом аппроксимации является (по крайней мере для ν1 , ν2 > 20) методология, предложенная в работе Paulson (1942). Формула Паульсона основана на приближении Уилсона—Хилферти (Wilson—Hilferty) распределения χ 2 . Высокая точность такой аппроксимации описана в гл. 18, п. 5. Если аппроксимировать величины X1 и X2 (распреде1/3 ленные как сказано в начале главы) таким методом, то распределение Fν1 ,ν2 аппроксимируется отношением двух независимых нормально распределенных 1/3 величин. Конкретно, распределение Fν1 ,ν2 близко к распределению величины 1−

2 ν + U1 9 1

2 1 − ν2 + U2 9

6 6

2 ν 9 1

,

(27.24)

2 ν 9 2

где U1 , U2 — независимы и нормально распределены. Далее, использование приближенной формулы для распределения этого отношения (гл. 13, п. 6.3) приводит к тому, что      −1/2  2 2 2 2 1/3 2/3 (27.25) Fν1 ,ν2 − 1 − Fν1 ,ν2 + W= 1− 9ν2

9ν1

9ν2

9ν1

имеет нормальное распределение с единичной дисперсией [Paulson (1943)]. Это приближение весьма точно при ν  10. Smillie and Anstey (1964) использовали его в компьютерной программе. При ν2  10 значения верхних процентных точек Fν1 ,ν2 ,α , даваемые формулой (27.24) можно уточнить следующим образом: Улучшенное значение = m × (Вычисленное значение) + c, где m и c зависят от ν2 и α , но не от ν1 . Ashby (1968) приводит значения m и c для α = 0.95, 0.99, 0.999, ν2 = 1 (1) 10; при этом достигается точность в третьей значащей цифре. Для малых ν2  3 Kelley (1948) рекомендует заменить W значением 

W  = W 1 + 0.08W 4ν2−3 .

291

5. АППРОКСИМАЦИИ И НОМОГРАММЫ

Одна из первых компьютерных программ вычисления Pr[F > f ] с использованием такой коррекции опубликована в работе Jaspen (1965). Он сравнивает точные и приближенные значения в случае ν1 = 2, ν2 = 2. Дальнейшее сравнение при ν1 , ν2 = 1, 2, 4, 10, 20, 60, 1000 только для значения f = Fν1 ,ν2 ,0.95 описано в статье Golden, Weiss and Davis (1968). По результатам работы Jaspen (1965) можно сделать вывод, что точность лучше для нижнего хвоста F-распределения, нежели для верхнего. Подобным же образом аппроксимация может быть получена с использованием приближения Фишера для χ 2 -распределения (распределение " √ 2 2 χν − 2ν − 1 близко к стандартному нормальному распределению) вместо аппроксимации Уилсона—Хилферта. В результате имеем: распределение величины 6  −1/2 6 1 1/2 1 1 1 1− Fν1 ,ν2 − 1 − Fν1 ,ν2 + (27.26) 2ν2

2ν1

2ν2

2ν1

заменяется стандартным нормальным распределением. Поскольку преобразование Фишера является менее точным, чем преобразование Уилсона—Хилферти, то следует ожидать, что формула (27.25) должна давать б´oльшую точность, чем (27.26). Это действительно так, но потеря точности при использовании (27.26) не столь велика, как можно было бы ожидать. Если велик только один из параметров, ν1 или ν2 (например, ν2 ), то приближенно можно считать, что Fν1 ,ν2 распределено как χν21 /ν1 (понятно, что всегда можно упорядочить параметры так, чтобы ν2 > ν1 ). Scheff´e and Tukey (1944) предложили простое улучшение в терминах нормированной неполной бета-функции [гл. 25, формула (25.3)]. Пусть Ip (n − r + 1, r) = α ; тогда

n≈

1 2 1 χ (1 + p)(1 − p)−1 + (r − 1). 4 2r,α 2

В терминах F-распределения это преобразуется к виду   −1 ν1 ν1 /2 (ν1 2) − 1 1 Fν1 ,ν2 ,α ≈ 2 + − . 2 χν1 ,α

ν2

χν1 ,α

2

(27.27)

Один из этапов вывода этой формулы связан с заменой чисел степеней свободы случайной величины F. McIntyre and Ward (1968) составили компьютерный алгоритм, использующий такую аппроксимацию. Mudholkar and Chaubey (1976) использовали соотношение между F- и бетараспределениями и выведенными ими аппроксимациями типа Патнайка, типа Пирсона и типа Синкарана для Ix (p, q) (см. гл. 25, п. 6.1) для приближенного расчета процентных точек F-распределения:

Pr Fν1 ,ν2  f ≈ 1 − Φ(u),   где

1/3  (− log x + b)/(κ1 − b) − 1 − κ32 / 36κ23   u= 3/2 κ3 / 6κ2

(27.28)

292

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

 −1 

и x = 1 + ν1 /ν2 f . Здесь κ1 , κ2 и κ3 — семиинварианты (− log X), а X  1 1 имеет стандартное распределение бета ν2 , ν1 : 2 2      1 1 κr = (−1)r ψ (r−1) (ν1 + ν2 ) , − ψ (r−1) 2 2 где  r d ψ (r−1) (x) = r log Γ(x) dx



[см. гл. 25, формула (25.13) ]. Если ν1 нечетно, то «интерполированное» приближение ⎫ ⎧ −3)/2  ⎨(ν1 −r  −r ⎬ 1 1 ν1 + ν2 − 1 κr∗ ≈ (r − 1)! ν2 + j + (27.29) 2 2 2 ⎭ ⎩ j=0

используется для κr . Если ν1 и ν2 четны, то формула  

1 1 Pr Fν1 ,ν2  f ≈ Iν1 f /(ν2 +ν1 f ) ν1 , ν2 2

2

(27.8)

позволяет вычислять функцию распределения Fν1 ,ν2 как сумму биномиальных 1 вероятностей с параметрами (ν1 + ν2 ) − 1, ν1 f /(ν1 + ν2 f ). Но если хотя бы 2 одно из чисел ν1 и ν2 (или оба) нечетно, то такой расчет невозможен. В последнем случае George and Singh (1987) предложили приближенную формулу вида   

1 1 Pr Fν1 ,ν2  f ≈ Iα +β log f (ν1 + 1) , (27.30a) [(ν2 + 1)] , 2

2

где [a] — целая часть a, α и β — константы, зависящие от ν1 и ν2 . Формула (27.30a) основана на аппроксимации распределения log Fν1 ,ν2 обобщенным логистическим распределением. Ранее Mantel (1966), рассмотрев случай нечетности одного   или обоих 1 1 ν1 , ν2 использовать параметров ν1 и ν2 , предложил для вычисления Ip 2 2 соседние четные значения ν1 и ν2 . Например, если ν1 = 3, ν2 = 5, то предлагается интерполировать значения Ip (1, 2) Ip (1, 3), Ip (2, 2), и Ip (2, 3), чтобы оценить Ip (1.5, 2.5). Заметим, что в каждом из случаев p = ν1 f /(ν2 + ν1 f ) (в нашем примере 3f /(5 + 3f )). George and Singh (1987) выяснили, что в случае нечетности обоих параметров ν1 и ν2 (27.30a) дает лучшее приближение, особенно для хвостов распределения. Если же только один из параметров, ν1 или ν2 является нечетным, то аппроксимация, предложенная Mantel, несколько лучше. Если − log X аппроксимируется величиной aχν2 + b, то ν определяется приравниванием первых трех моментов величин − log X и aχν2 +b. Это приводит к значениям −1 ν = 8 {β1 (− log X)} ,   var(− log X) 1/2 a= , 2ν

b = E[− log X] − aν .

(27.30b)

293

6. ПРИЛОЖЕНИЯ

Davenport and Herring (1979) предложили так называемую улучшенную аппроксимацию Корниша—Фишера для Fν1 ,ν2 ,α . Johnson (1973) опубликовал несколько эмпирических формул для Fν1 ,ν2 ,α для α = 0.95 и α = 0.975. Эти формулы приведены в табл. 27.1. Погрешность не превышает ±0.6%. В большинстве случаев погрешность меньше ±0.2%. Наибольшие ошибки получаются при ν1 = ν2 = 120 для α = 0.95 и при ν1 = 60, ν2 = 120 для α = 0.975. Ojo (1985, 1988) предложил аппроксимацию log F с помощью t-распределения, имеющего такие же среднее, дисперсию и коэффициент асимметрии, как некоторая линейная функция от log F. Viveros (1990) предложил степенное преобразование. Он заменил стандартной нормальной случайной величиной величину 

c (27.30c) Fν1 ,ν2 − d g, где c 1/2 ν2 − ν1 ν2 (ν1 − 2c) 1 (ν1 − 2c) (ν2 + 2c) c= , d= , g= . 3 (ν1 + ν2 ) − 4

ν1 (ν2 + 2c)

cd

2 (ν1 + ν2 )

Значения c, d и g получаются с помощью тэйлоровского разложения плотности распределения log F в точке, равной моде. С другой стороны, параметры преобразования c, d и g можно выбрать так, чтобы случайная величина (27.30c) имела бы нулевое среднее и единичную дисперсию. 1 1 Отметим, что следует полагать −  c  . 3 3 Для вычисления значений функции распределения можно использовать номограмму для вычисления значений неполной бета-функции. Такая номограмма, специально приспособленная для F-распределения, составленная в работе Stammberger (1967), показана на рис. 27.2. По этой номограмме можно найти любую из трех величин f , ν1 , и ν2 по двум другим. Для этого используются пунктирные линии, показанные на рис. 27.2. Dion and Fridshal (1982) опубликовали неравенства χν21 ,(1−γ )/2 /ν1 χν22 ,(1−γ )/2 /ν2 χν21 ,(1+γ )/2 /ν1 χν22 ,(1+γ )/2 /ν2

 Fν1 ,ν2 ,1−γ ,

(27.31a)

 Fν1 ,ν2 ,1+γ .

(27.31b)

В статье Burk et al. (1984) доказано, что эти неравенства выполняются при ν1 = ν2 . Однако численный анализ показал, что в случае ν1 = ν2 неравенства неверны для 0  γ  γ0 , а также для некоторых значений в области γ0 < γ < 1, где γ0 — константа, зависящая от ν1 и ν2 ; например, γ0 ≈ 0.0043 при ν1 = 4, ν2 = 2.

6.

Приложения

В статистике более всего распространено использование F-распределения для проверки гипотез в дисперсионном анализе. Многие из таких тестов основаны на общем утверждении [Kolodziejeczyk (1935)]: критерий отношения

294

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 27.1 Эмпирические формулы Джонсона (Johnson) для Fν1 ,ν2 ,α при α = 0.95 и α = 0.975 и точность этих формул [Johnson (1973)]

Группа

ν1

ν2

Приближенное значение Fν1 ,ν2 ,0.95

Максимальное абсолютное отклонение от Fν1 ,ν2 ,0.95 в %

I

1–120

1

ν1 − 0.09849 0.0039292ν1 + 0.0016579

0.005

II

1–120

2

ν1 − 0.03646 0.051294ν1 + 0.000761

0.000

III

1–120

3

ν1 + 1.094 0.1173ν1 + 0.0894

0.005

IV

1–120

4

ν1 + 1.349 0.1776ν1 + 0.1271

0.009

V

1

5–120

VI

2–120

5–120

7.71 −

ν2 − 4.032 0.2581ν2 + 0.4076

ν1 − 1.288 ν2 − 4.119 − × 0.1751ν1 + 0.1129 0.2511ν2 − 0.4236  6.530 3.993 × 0.552 − − + ν1 + 11.533 ν2 + 11.533  88.889 + (ν1 + 11.533)(ν2 + 11.533)

0.000

0.6

Группа

ν1

ν2

Приближенное значение Fν1 ,ν2 ,0.975

Максимальное абсолютное отклонение от Fν1 ,ν2 ,0.975 в %

I

1–120

1

ν1 − 0.09582 0.0009813ν1 + 0.0004153

0.001

II

1–120

2

ν1 − 0.00904 0.025317ν1 + 0.000416

0.001

III

1–120

3

ν1 + 0.9232 0.07192ν1 + 0.03836

0.003

IV

1–120

4

ν1 + 1.270 0.1210ν1 + 0.0648

0.003

V

1

5–120

12.22 − ν +1.739

VI

2–120

5–120

ν2 − 4.045 0.1387ν2 − 0.2603

0.003

ν −3.986

1 2 − × 0.1197ν1 +0.1108 0.1414ν2 −0.2864  2.706−0.06150ν1 × −0.145+0.00170ν1 +

ν2 +30

0.6

295

6. ПРИЛОЖЕНИЯ

РИС. 27.2. Номограмма функции F-распределения

правдоподобия для проверки общей гипотезы о значении параметров в общей линейной модели с нормальными остаточными членами сводится к статистике, имеющей F-распределение, если выполнена гипотеза H0 . Применение F-распределения для проверки гипотезы о равенстве дисперсий двух нормальных популяций описано в п. 27.1. Некоторые старые варианты таблиц верхних процентилей F-распределения составлены с расчетом на применение при делении большей суммы квадратов на меньшую. Такое правило удобно, так как получаемое отношение всегда больше единицы, что влияет на уровень значимости критерия. Если использовать таблицы верхних 100α %-ных значений Fν1 ,ν2 ,1−α , то в действительности уровень значимости будет не α , но 2α . Это легко понять, заметив, что «значимость» достигается, если наблюдаемое отношение или больше, чем

−1 = Fν1 ,ν2 ,α . Fν1 ,ν2 ,1−α , или меньше, чем Fν2 ,ν1 ,1−α F-распределение используется также для вычисления мощности упомянутых критериев и для построения доверительных границ отношения дисперсий

296

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

нормальных популяций. В п. 27.3 отмечена связь F-распределения и биномиального распределения. является построение приближенных

Следствием  доверительных границ p, p для биномиальной вероятности, получающихся как решения уравнений n    1 n j p (1 − p)n−j = α , j=r r   j=0

j

2



1 n j p¯ (1 − p¯)n−j = α , j 2

где r — число успехов в n наблюдениях при вероятности успеха p. Значения p и p выражаются через процентные точки F-распределения:

−1 , p = r (n − r + 1)F2(n−r+1),2r,α /2 + r

−1 p¯ = (r + 1)F2(r+1),2(n−r),α /2 n − r + (r + 1)F2(r+1),2(n−r),α /2 . Box (1949) получил некоторые аппроксимации распределений (в предположении нормальности многомерных распределений) для многомерных критериев в терминах F-распределения. Они весьма удобны для представления результатов расчетов для функций типа VI семейства Пирсона (они обсуждаются в п. 27.7). Donner, Wells and Eliasziw (1989) описали использование F-распределения для аппроксимации распределений статистик в дисперсионном анализе несбалансированных популяций [см. также Satterthwaite (1946)]. F-распределения используются также для аппроксимации некоторых других распределений. Yip (1974) аппроксимирует распределение случайной величины X по первым четырем моментам. Он приравнивает первые четыре момента величины (X + g)/h соответствующим моментам Fν1 ,ν2 [см. (27.6)] и решает получающиеся уравнения относительно ν1 , ν2 , g и h. Такой же метод он применил для аппроксимации нецентрального F-распределения и обобщенного распределения T02 Хотеллинга. Аппроксимации по четырем моментам можно получить, используя таблицы процентных точек распределений системы Пирсона, однако эти таблицы не позволяют охватить весь диапазон значений (β1 , β2 ) F-распределения. Если все же (β1 , β2 ) для случайной величины X получаются при некотором F-распределении, то аппроксимация по четырем моментам F ≈ (X + g)/h обычно дает хорошие результаты для случайной величины X. Wood (1979) использовал трехпараметрическое F-распределение для аппроксимации линейной комбинации с положительными коэффициентами центральных хи-квадрат случайных величин. Численный анализ показал, что предлагаемые приближенные формулы точнее, чем аппроксимации, полученные в работах Satterthwaite (1946) и Buckley and Eagleson (1988) в диапазоне квантилей от 0.05 до 0.95. Однако аппроксимации Wood (1979) менее точны по сравнению с предложенными в работе Solomon and Stephens (1977) приближениями, полученными итеративными методами с применением гаммаВейбулла распределения.

297

7. РАСПРЕДЕЛЕНИЯ СЕМЕЙСТВА ПИРСОНА ТИПА VI

7.

Распределения семейства Пирсона типа VI

Уже отмечено, что F-распределение есть частный случай распределения Пирсона типа VI (27.3). Здесь мы приведем условия, при которых распределения этого типа являются F-распределениями. Как показали Elderton and Johnson (1969), наиболее общий вид плотности распределения Пирсона типа VI есть pX (x) =

Γ(q1 )(a2 − a1 )q1 −q2 −1 (x − a2 )q2 , Γ(q1 − q2 − 1)Γ(q2 + 1)(x − a1 )q1

q1 > q2 > −1,

x  a2 > a1 , (27.32)

" где знак X выбирается так, чтобы β1 (X)  0. График pX (x) имеет единственную моду в точке x = a2 + q2 (q1 − q2 )−1 (a1 − a2 ), при условии, что q2 > 0. Если q2 = 0, эта мода имеет абсциссу x = a2 , а если q2 < 0, то pX (x) стремится к бесконечности при x → a2 . В последних двух случаях плотность PX (x) убывает, когда x возрастает в области x  a2 . Момент порядка r относительно a1 случайной величины X равен (a − a1 )r (q1 − 1)(r)

. E (X − a1 )r = 2 (r)

(27.33)

(q1 − q2 − 2)

Заметим, что если r  q1 −q2 −1, то r-й момент обращается в бесконечность. Среднее и дисперсия таковы: E[X] = a1 +

(q1 − 1)(a2 − a1 ) (q − 1)(a2 − a1 ) = a2 + 2 , q1 − q2 − 2 q1 − q2 − 2

q1 − q2 > 2,

(27.34)

var(X) = (a2 − a1 )2 (q1 − 1)(q2 + 1)(q1 + q2 − 2)−2 (q1 − q2 − 3)−1 , q1 − q2 > 3. Четыре параметра a1 , a2 , q1 и q2 выражаются через первые четыре момента X. Конкретно, q2 и −q1 даются формулой 6 1 1 β1 (r − 2) ± r(r + 2) , (27.35) 2 2

2

β1 (r + 2) + 16(r + 1)

где r = −6(β2 − β1 − 1)/(2β2 − 3β1 − 6). Заметим, что для кривых типа VI 2β2 − 3β1 − 6 > 0, так что r < 0, и также β1 (β2 + 3)2 > 1. 4(2β2 − 3β1 − 6)(4β2 − 3β1 )

(27.36)

Существуют простые соотношения между распределениями типа VI и типа I (гл. 25): распределение Y = (X − a2 )/(X − a1 ) является стандартным бетараспределением с параметрами q2 +1 и q1 −q2 −1. Пусть X1 , X2 , . . . , Xn — независимые случайные величины, имеющие одинаковые распределения (27.32). Тогда уравнения максимального правдоподобия для aˆ 1 , aˆ 2 , qˆ 1 и qˆ 2 записыва-

298

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

ются в виде n (ˆq1 − qˆ 2 − 1) (ˆa2 − aˆ 1 )−1 = qˆ 1

n 

xj − aˆ 1

−1

= qˆ 2

n 

j=1

xj − aˆ 2

−1

n 

log(xj − aˆ 1 ), n ψ (ˆq1 ) − ψ (ˆq1 − qˆ 2 − 1) + log(ˆa2 − aˆ 1 ) =

n ψ (ˆq2 + 1) − ψ (ˆq1 − qˆ 2 − 1) + log(ˆa2 − aˆ 1 ) =

,

(27.37a)

j=1

j=1 n 

log(xj − aˆ 2 ).

(27.37b)

(27.37c)

j=1

Решая эти уравнения, следует проверять выполнение неравенств aˆ 1 < aˆ 2 < min(x1 , . . . , xn ). Отметим также, что стандартные асимптотические − q2  2. Стандартный вид формулы для дисперсий неприменимы √ √ √при q1 √ матрицы ковариаций для nˆa1 , nˆa2 , nˆq1 и nˆq2 есть ⎛ ⎞ (q2 + 1)(q1 − q2 − 1) −(q1 − q2 − 1) . . . . . . ⎜ (q1 + 1)(a2 − a1 )2 ⎟ (a2 − a1 ) ⎜ ⎟ ⎜ −(q1 − q2 − 1) ⎟ (q1 − 1)(q1 − q2 − 1) ⎜ ⎟ ... ... ⎜ ⎟ 2 (a2 − a1 ) (q2 − 1)(a2 − a1 ) ⎜ ⎟ ⎜ ⎟  q q + 1 − 1 − ψ (q ) + 2 1 1 ⎜ ⎟ ... ⎜ ⎟  + ψ (q1 − q2 − 1) q1 (a2 − a1 ) q2 (a2 − a1 ) ⎜ ⎟ ⎝ ⎠  −ψ (q2 + 1) + −1 −1  −ψ (q1 − q2 − 1)  + ψ (q1 − q2 − 1) a2 − a1 a2 − a1 (27.38)

8.

Другие распределения, связанные с F-распределением

Связь между F-распределениями и распределением типа I (бета-распределением) описана выше в п. 2 и в более общем виде — между типом I и типом VI в п. 7. Приведем теперь менее очевидные (более специальные и ме  1/2 −1/2 1√ ν Fν,ν − Fν,ν нее полезные) соотношения. Распределение величины 2 есть t-распределение с ν степенями свободы. Этот результат опубликовали несколько авторов, например, Aroian (1953) и Cacoullos (1965). Kymn (1974) привел простое доказательство этого утверждения. Существует связь (упомянутая в гл. 3, п. 6.1) между биномиальным и F-распределением. Эта связь выражается равенством   1−p r Pr F2(n−r+1),2r > · = Pr[Y  r], r — целое, 0  r  n, (27.39) p

n−r+1

где Y имеет биномиальное распределение с параметрами (n, p) [Bizley (1950), Jowett (1963)]. Нецентральные F-распределения рассматриваются в гл. 30, многомерное обобщение — в гл. 40.

299

8. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С F-РАСПРЕДЕЛЕНИЕМ

Существует несколько псевдо F-распределений, соответствующих замене S1 и/или S2 в (27.2) на другие выборочные характеристики разброса, например, размах или среднее отклонение, об этом см. Newman (1939). Работы David (1949), Gayen (1950), Horsnell (1953), Swain (1965), Tiku (1964) и Zeigler (1965) являются наиболее содержательными среди многочисленных исследований F-распределения в случае, когда X1 , X2 , . . . , Xn , определяющие Si (i = 1, 2) имеют распределения, отличные от нормальных. Мы приведем дополнительные ссылки в гл. 28, п. 7 в связи с аналогичными задачами для t-распределения. В ряде работ, в том числе Bardsford (1948), Leimkuhler (1967), упоминается усеченное распределение типа VI с плотностью   β (27.40) (1 + β x)−1 , 0 < x < 1, β > −1 pX (x) = log(1 + β )

(здесь x — доля усечения). При ссылках иногда используют название распределение Брэдфорда. Случайную величину X, по-видимому, более естественно использовать для аппроксимации дискретных величин, и распределение Брэдфорда можно применить для аппроксимации распределений Зипфа (Zipf) и Юла (Yule) (см. гл. 11). В дисперсионном анализе часто рассматриваются отношения каждого из значений средних квадратов M1 , M2 , . . . , Mn к остаточной сумме квадратов M0 . Величины Mj , j = 0, 1, . . . ,k, можно  считать независимыми

в совокупности и распределенными как σ 2 χν2j /νj . Если одно из отношений Mj /M 0 (j = 0)велико, то следует сравнить его распределение с распределением max Mj /M0 . Если ν1 = ν2 = . . . = νk = ν (ν не обязательно равно 1jk

 ν0 ), то распределение max Mj /M0 можно сравнить со стьюдентовым χ 2 1jk

распределением, т. е. распределением минимальной из величин χν2j к χν20 . 1

Armitage and Krishnaiah (1964) составили таблицы верхних 1-, 2 -, 52 и 10%-ных точек таких распределений с двумя десятичными знаками для k = 1 (1) 12, ν = 1 (1) 19, ν0 = 6 (1) 45(а также 5- и 10%-ных точек для ν0 ). Таблицы верхних 1%-ных и 5%-ных точек распределения max Mj / min Mi 1jk

1jk

для k = 2 (1) 12 и ν1 = ν2 =. . . = νk = ν = 2 (1) 10, 12, 15, 20, 30, 60, ∞ приведены в книге Pearson and Hartley (1958); другие комментарии по этому поводу см. в п. 8.2.

8.1.

Обобщенные F-распределения

В 70–90-е годы было описано несколько обобщенных F-распределений. Мы уже упоминали статью Prentice (1975) в связи с z-распределением. Один из классов введенных обобщений содержится в множестве распределений aFνb1 ,ν2 при различных a и b.

300

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Ciampi, Hogg and Kates (1986) приводят общий анализ этого класса распределений, в том числе разбирают случаи, когда четверка параметров (a, b, ν1 , ν2 ) определяет какое-либо из известных распределений. Авторы получили оценки максимального правдоподобия параметров, используя «общий упрощенный градиентный метод», описанный в статье Lasdon et al. (1978). Если X1 и X2 независимы и имеют распределение гамма(αi , βi ) [гл. 17, формула (17.23)] с плотностью   −1 αi −1

pXi (xi ) = βiαi Γ(αi ) xi exp −βi−1 xi , xi > 0, i = 1, 2, (27.41) то X1 /X2 распределено как

α1 β1 F2α1 ,2α2 . α2 β2

Pham-Gia and Duong (1989) называют это поправленным F-распределением и обозначают G3F (что в некотором смысле аналогично распределению G3B, рассмотренному в гл. 25, п. 7). Dyer (1982) рассмотрел распределения сумм независимых G3F-распределенных случайных величин и применил полученные результаты к некоторым моделям теории надежности, многомерного статистического анализа и байесовских моделей. Shah and Rathie (1974) изучили произведение G3F-распределенных случайных величин. Amaral-Turkman and Dunsmore (1985) применили распределение G3F (названное авторами Inbe-распределением) в исследовании степени информационности и «прорицательных» распределений для гамма моделей. Если Y = aFνb1 ,ν2 (a, b > 0), то pY (y) =

(ν1 /ν2 )ν1 /2 (ab)−1 (y/a)(ν1 /(2b))−1 (ν1 +ν2 )/2 ,  B ((ν1 /2)(ν2 /2)) 1 + (ν1 /ν2 ) (y/a)1/b

y > 0,

[Malik (1967)]. Очевидно, r-й момент Y равен r

 = ar μbr μr = E aFνb1 ,ν2 (Fν1 ,ν2 ) = = ar



 ν2 br ν1

   1 1 Γ ν1 + br Γ ν2 − br 2 2 ,     1 1 Γ ν1 Γ ν2 2 2

(27.42)

(27.43)



r
0,

Начальный момент порядка k равен  

k k E X k = B p + , q − /B(p, q), a

a

p, q > 0.

−p
0,

(27.44)

причем Y распределено с плотностью (27.42) при a = 1. Плотность X равна

ν /2 ∞  ν1 /ν2 1 xm−1 y(ν1 /2b)−m−n (y − x)n−1 dy. (27.45) pX (x) =   bB(m, n)B

1 1 ν , ν 2 1 2 2

x

 (ν1 +ν2 )/2 

1 + ν1 /ν2 y1/b

При n = 1 получаем:  m (ν1 /ν2 )ν1 /2 xm−1   1 1 B ν − bm, ν + bm − pX (x) = 1 2   2 2 1 1 bB ν1 , ν1 2 2   1 1 ν1 − bm, ν2 + bm , −B[1+(ν1 /ν2 )x−b ]−1 2 2

(27.46)

где Bp (a, b) — неполная бета-функция, определенная в гл. 1 формулой (1.90). Распределение (27.46) называют раздутым (distended) бета-распределением. Другие подробности рассматриваются в статье Block and Rao (1973). Mihram (1969) обосновывает применимость распределений такого типа.

302

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Mielke and Johnson (1974) использовали репараметризацию, положив b = θ −1 ,

a = β,

ν1 = 2κθ −1 ,

ν2 = 2(α + 1 − κθ −1 ),

и получили плотность распределения Y в виде pY (y) =

κ

β B(κθ

−1

θ

, α + 1 − κθ

−1

)

·

yκ −1

1 + (y/β )θ

α +1 ,

y > 0,

θ , β , κ > 0. (27.47)

Приняв ограничение κ = αθ (т. е. ν1 = 2α , ν2 = 2), получаем: pY (y) =

κ (y/β )κ −1 · 1+(κ /θ ) , β θ 1 + (y/β )

0 0,  1 πα α FF (f |α ) = sin πα ⎪ 2 ⎩ 0, f  0,

(27.52a)

303

8. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С F-РАСПРЕДЕЛЕНИЕМ

ТАБЛИЦА 27.2 Квантили порядка 1 − θ предельного распределения F(α ) для некоторых α A 1−θ

1.9

1.8

1.7

1.6

0.990 0.975 0.950 0.900

6.857 3.268 2.105 1.528

15.636 6.399 3.543 2.178

29.758 11.008 5.618 3.009

53.651 18.120 8.349 4.111

1.5

1.4

1.3

1.2

1.1

1.0

96.179 176.386 338.548 695.841 1573.332 4052.181 29.622 49.197 84.561 153.254 299.302 647.789 12.584 19.212 30.139 49.315 85.639 161.448 5.625 7.788 11.015 16.084 24.551 39.863

при n1 , n2 → ∞. В табл. 27.2 приводятся квантили этого распределения. Соответствующая плотность равна  sin

pF (f |α ) =

1 πα 2



  ,  1 πα f −α /2 + f α /2 + 2 cos πα 2

f > 0.

(27.52b)

На рис. 27.3, a, b показаны графики этой плотности при некоторых значениях параметра.

РИС. 27.3. Плотности pF (f |α ) для различных α

304

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Задача анализа распределения максимума из набора зависимых случайных F-распределенных величин возникает в варианте дисперсионного анализа, когда требуется проверить, является ли максимум из нескольких, скажем k, отношений независимых средних квадратов M1 , . . . , Mk к общему остаточному среднему квадрату M0 значимо большим. В общей линейной модели с независимыми однородными (с одинаковой дисперсией σ 2 ) нормальными остатками при выполнении нулевой гипотезы (отсутствие влияния) величина Mj имеет распределение σ 2 χν2j /νj (j = 0, 1, . . . , k). Используемая статистика, лежащая в основе критерия, есть   (M , . . . , Mk ) M1 M = max , ... , n (27.53) T = max 1 M0

M0

M0

При выполнении нулевой гипотезы Mj /M0 распределено как Fvj ,ν0 , но k величин M1 /M0 , . . . , Mk /M0 не являются независимыми. В случае ν1 = ν2 = . . . = νk = ν статистика T распределена как отношение максимума из k независимых случайных величин, распределенных по закону χν2 , к независимой величине χν20 , взятое с коэффициентом ν0 /ν . ν T является распределением максимума Таким образом, распределение W = ν0

из k случайных величин, распределенных как Gν1 ,ν0 . Пусть теперь X = max (X1 , . . . , Xk ) и X1 , . . . , Xk — независимые в совокупности случайные величины, распределенные по закону χν2 . Тогда ⎧ ⎫k ⎬   −k ⎨x ν Pr[X  x] = 2ν/2 Γ y(ν/2)−1 e−y/2 dy , 2 ⎩ ⎭

x  0,

0

и плотность ⎫k−1 ⎧ ⎬  −k ⎨x  ν y(ν/2)−1 e−y/2 dy x(ν/2)−1 e−x/2 , pX (x) = k 2ν/2 Γ 2 ⎭ ⎩

x  0.

0

Тогда   −1  ν/2  −k ν ν w(ν/2)−1 × pW (w) = k 2ν0 /2 Γ 0 2 Γ 2 2 ⎫k−1 ⎧ ∞  ⎨ vw  ⎬ y(ν/2)−1 e−y/2 dy v(ν0 /2)−1 e−w(1+v)/2 dv. (27.54) × ⎭ ⎩ 0

0

Krishnaiah and Armitage (1964) составили таблицы верхних 100α %-ных точек (значений Tν,ν0 ,1−α ) случайной величины T для α = 0.01, 0.10, 0.25 для каждого из значений ν = 2 (2) 40, ν0 = 10 (2) 90, k = 1 (1) 12. Hamdy, Son and AlMahmeed (1987) рассматривают частный случай k = 2 и применяют

305

8. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С F-РАСПРЕДЕЛЕНИЕМ

формулу (справедливую для четных ν и ν0 ): (  )  ∞ (ν /2)+i  (ν /2)+i−1 ν  +i−1 ν 1 α= × 2 ν 2 0 i i=ν /2 ) ( (ν /2)−1 1  (ν + ν0 ) + j − 1 H j (1 − H)(ν+ν0 +i−j−1)/2 = × 2 j j=0 ( ) (ν0 /2)−1 1  (ν + ν0 ) − 1 = H i (1 − H)((ν+ν0 )/2)−i−1 − 2 i i=0 ) ( ( ) j (ν0 /2)−1 1 (ν /2)−1 ν  + i − 1  1 − H ((ν+ν0 )/2)+i−1  H (ν + ν0) + i − 1 ν /2 2 , −2 2 2−H 2(1 − H) i j i=0 j=0 (27.55)  −1 где ν H = 1 + Tν,ν0 ,1−α . ν0

Авторы приводят значения Tν,ν0 ,1−α с пятью десятичными знаками для α = 0.005, 0.01, 0.025, 0.1, 0.90, 0.95, 0.975, 0.995, ν = 4 (2) 100, ν0 = 4 (2) 8. Авторы также анонсируют публикацию таблиц, в которых ν0 = 10 (10) 80 при тех же α и ν . Hartley (1950a, b) изучил распределение статистики, отличное от F-распределения, однако сходное с ним при проверке равенства k дисперсий. Это — распределение отношения max(V1 , . . . , Vk ) , min(V1 , . . . , Vk )

где Vj — независимые в совокупности случайные величины, имеющие одинаковые распределения χν2 . Roy, Roy and Ali (1993) рассмотрели биномиальную смесь F-распределений с плотностью n   r n−r (ν1 /2)+r (ν1 /2)+r−1  x n p (1 − p) (ν1 /ν2 ) pX (x|n, p, ν1, ν2 ) = , 0 < x < ∞. r

r=0

B



1

2

+ r,

ν2   ν1 ((ν1 +ν2 )/2)+r 1+ x 2 ν2

Начальный момент порядка k случайной величины X равен

E X

k

 ν





1 2 +r+k Γ −k Γ  n   2 2 ν2 k  n r n−r = . p (1 − p)  ν  ν r ν1 1 2



r=0

Γ

2

+r Γ

2

Отсюда получаются формулы для среднего и дисперсии: E[X] = и var(X) =

2ν22 (ν1 + ν2 − 2) 2

ν1 (ν2 − 2) (ν2 − 4)

+

ν2 2npν2 + ν2 − 2 ν1 (ν2 − 2)

  4pν22 · n(2 + 5ν1 − ν1 ν2 ) + (n2 − n − ν2 − 4)p . 2 2 ν1 (ν2 − 2) (ν2 − 4)

306

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Список литературы Abramowitz, M., and Stegun, I. A. (eds.). (1964). Handbook of Mathematical Functions with Formulas, Graphs and Mathematical Tablesб National Bureau of Standards, Applied Mathematics Series, 55, U. S. Department of Commerce, Washington, DC 1) . Amaral-Turkman, M. A., and Dunsmore, I. R. (1985). Measures of information in the predictive distribution, In Bayesian Statistics, vol. 2 (eds., J. M. Bernardo, M. H. de Groot, D. V. Lindley and A. F. M. Smith), New York: Elsevier, North-Holland, pp. 603–612. Armitage, J. V., and Krishnaiah, P. R. (1964). Tables of the Studentized largest chisquare distribution and their applications, Report ARL 64–188, Aerospace Research Laboratories, Wright-Patterson Air Force Base, Dayton, OH. Aroian, L. A. (1941). A study of R. A. Fisher’s z-distribution and the related F distribution, Annals of Mathematical Statistics, 12, 429–448. Aroian, L. A. (1942). The relationship of Fisher’s z-distribution to Student’s t distribution, (Abstract), Annals of Mathematical Statistics, 13, 451–452. Aroian, L. A. (1947). Note on the cumulants of Fisher’s z-distribution, Biometrika, 34, 359–360. Aroian, L. A. (1950). On the levels of significance of the incomplete beta function and the F-distributions, Biometrika, 37, 219–223. Aroian, L. A. (1953). A certain type of integral, American Mathematical Monthly, 50, 382–383. Ashby, T. (1968). A modification to Paulson’s approximation to the variance ratio distribution, The Computer Journal, 11, 209–210. Awad, A. M. (1980). Remark on the characteristic function of the F-distribution, Sankhy¯a, Series A, 42, 128–129. Bennett, G. W., and Cornish, E. A. (1964). A comparison of the simultaneous fiducial distributions derived from the multivariate normal distribution, Bulletin of the International Statistical Institute, 46, 918. Bizley, M. T. L. (1950). A note on the variance-ratio distribution, Journal of the Institute of Actuaries Students’ Society, 10, 62–64. Block, H. W., and Rao, B. R. (1973). A beta warning-time distribution and a distended beta distribution, Sankhy¯a, Series B, 35, 79–84. Bol’shev, L. N. (1960). On estimates of probabilities, Teoriya Veroyatnostei i ee Primeneniya, 5, 453–457. (In Russian. English translation: pp. 411–415.)2) Bol’shev, L. N., Gladkov, B. V., and Shcheglova, M. V. (1961). Tables for the calculation of B and z-distribution functions, Teoriya Veroyatnostei i ee Primeneniya, 6, 446–454. (English translation: pp. 410–419.) 3) Bookstaber, R. M., and McDonald, J. B. (1987). A general distribution for describing security price returns, The Journal of Business, 60, 401–424. Box, G. E. P. (1949). A general distribution theory for a class of likelihood criteria, Biometrika, 36, 317–346. Bradford, S. C. (1948). Documentation, London: Crosby Lockwood.

1) Абрамовиц 2) Большев

М., Стиган И. Справочник по специальным функциям. — М.: Наука, 1979. Л. Н. Об оценках вероятностей // Теория вероятностей и ее применения. — С.

446–454. 3) Большев Л. Н., Гладков Б. В., Щеглова М. В. Таблицы для вычисления B и z-распределений // Теория вероятностей и ее применения. — 1961. — № 6. — С. 446–455.

СПИСОК ЛИТЕРАТУРЫ

307

Buckley, M. J., and Eagleson, G. K. (1988). An approximation to the distribution of quadratic forms in normal random variables, Australian Journal of Statistics, 30, 150–159. Burk, F., Dion, L. R., Fridshal, D., Langford, E., O’Cinneidel, C., and Parsons, T. (1984). On a conjecture relating χ 2 and F quantiles, Communications in Statistics— Theory and Methods, 13, 661–670. Cacoullos, T. (1965). A relation between t and F distributions, Journal of the American Statistical Association, 60, 528–531. (Correction: 60, 1249). Carter, A. H. (1947). Approximation to percentage points of the z-distribution, Biometrika, 34, 352–358. Chen, H. J., and Makowsky, A. B. (1976). On approximations to the F-distribution and its inverse, Report 76-3, Department of Mathematical Sciences, Memphis State University, Memphis, TN. Cheng, S. W., and Fu, J. C. (1983). An algorithm to obtain the critical values of the t, χ 2 and F distributions, Statistics & Probability Letters, 4, 223–227. Ciampi, A., Hogg, S. A., and Kates, L. (1988). Regression analysis of censored survival data with the generalized F family— An alternative to the proportional hazards model, Statistics in Medicine, 5, 85–96. Cochran, W. G. (1940). Note on an approximate formula for the significance levels of z, Annals of Mathematical Statistics, 11, 93–95. Colcord, C. G., and Deming, L. S. (1936). The one-tenth percent level of «z», Sankhy¯a, 2, 423–424. Cornish, E. A., and Fisher, R. A. (1937). Moments and cumulants in the specification of distributions, Review of the International Statistical Institute, 5, 307–322. Cummins, J. D., Dionnc, G., McDonald, J. B., and Pritchett, B. M. (1990). Applications of the GB2 family of distributions in modeling insurance loss processes, Insurance: Mathematics and Economics, 9, 257–272. Curtiss, J. H. (1953). Convergent sequences of probability distributions, American Mathematical Monthly, 50, 100–107. Davenport, J. M., and Herring, T. A. (1979). On the use of curve fitting to model the error of the Cornish-Fisher expansion of the Pearson type-VI distribution, Communications in Statistics— Simulation and Computation, B8, 311–333. David, F. N. (1949). The moments of the z and F distributions, Biometrika, 36, 394–403. Dion, L. R., and Fridshal, D. (1982). A relationship between chi-square and F critical values, Communications in Statistics— Simulation and Computation, B11, 233–235. Donner, A., Wells, G. A., and Eliasziw, M. (1989). On two approximations to the F-distributions: Application to testing for intraclass correlation in family studies, Canadian Journal of Statistics, 17, 209–215. Donner, E. (1968). Algorithm 322: F-distribution, Communications of the Association for Computing Machinery, 11, 116–117. Dyer, D. (1982). The convolution of generalized F-distributions, Journal of the American Statistical Association, 77, 189–189. Elderton, W. P., and Johnson, N. L. (1969). Systems of Frequency Curves, Cambridge: Cambridge University Press. Fisher, R. A. (1924). On a distribution yielding the error functions of several well-known statistics, Proceedings of International Mathematical Congress, Toronto, 805–813. Fisher, R. A. (1925). Statistical Methods for Research Workers, 4th ed., Edinburgh: Oliver and Boyd. Fisher, R. A., and Cornish, E. A. (1960). The percentile points of distributions having known cumulants, Technometrics, 2, 209–225.

308

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Fisher, R. A., and Yates, F. (1953). Statistical Tables for Biological, Agricultural, and Medical Research, 4th ed., London: Oliver and Boyd. Fox, B. L. (1963). Generation of random samples from the beta and F distributions, Technometrics, 5, 269–270. Fujikoshi, Y. (1987). Error bounds for asymptotic expansions of scale mixtures of distributions. Hiroshima Mathematical Journal, 17, 309–324. Fujikoshi, Y., and Mukaihata, S. (1993). Approximations for the quantiles of Student’s t and F distributions and their error bounds, Hiroshima Mathematical Journal, 23, 557–564. Gayen, A. K. (1950). The distribution of the variance ratio in random samples of any size drawn from non-normal universes, Biometrika, 37, 236–255. Geisser, S. (1964). Estimation in the uniform covariance case, Journal of the Royal Statistical Society, Series B, 26, 477–483. George, E. O., and Singh, K. P. (1987). An approximation of F-distribution by binomial probabilities, Statistics & Probability Letters, 5, 169–173. Golden, R. R., Weiss, D. J., and Davis, R. V. (1968). An evaluation of Jaspen’s approximation of the distribution functions of the F, t and chi-square statistics, Educational and Psychological Measurement, 28, 163–165. Greenwood, J., and Hartley, H. O. (1961). Guide to Tables in Mathematical Statistics, Princeton: Princeton University Press. Grzegorski, S. (1972). Evaluation of probability for the F-Snedecor distribution, Zastosowania Matematyki, 12, 499–502. Hald, A. (1952). Statistical Tables and Formulas, New York: Wiley. Hamdy, H., Son, M., and AlMahmeed, M. (1987). A note on the distribution of maximum correlated F, Proceedings of ASA Statistical Computing Section, pp. 406–411. Hartley, H. O. (1950a). The use of range in analysis of variance, Biometrika, 37, 271–280. Hartley, H. O. (1950b). The maximum F-ratio as a short cut test for heterogeneity of variance, Biometrika, 37, 308–312. Horsnell, G. (1953). The effect of unequal group variances on the F-test for homogeneity of group means, Biometrika, 40, 128–136. Ifram, A. F. (1970). On the characteristic function of the F- and t-distributions, Sankhy¯a, Series A, 32, 350–352. IMSL (1985). Institute of Mathematical and Statistical Libraries, Packages, Edition 9.2, Vol. 3, Houston, Texas. Jaspcn, N. (1965). The calculation of probabilities corresponding to values of z, t, F, and chi-square, Educational and Psychological Measurement, 25, 877–880. Johnson, E. E. (1973). Empirical equation for approximating tabular F values, Technometrics, 15, 379–384. Johnson, N. L. (1959). On an extension of the connection between Poisson and χ 2 distributions, Biometrika, 46, 352–363. Jowett, G. H. (1963). The relationship between the binomial and F distributions, The Statistician, 13, 55–57. Kellcy, T. L. (1948). The Kelley Statistical Tables (Raised), Cambridge, MA: Harvard University Press. Kennedy, W. J., Jr., and Gentle, J. E. (1980). Statistical Computing, New York: Dekker. Kolodziejczyk, S. (1935). On an important class of statistical hypotheses, Biometrika, 27, 161–190. Krishnaiah, P. K., and Armitage, J. V. (1964). Tables for the Studentized largest chi-square distribution and their applications, Aerospace Research Laboratories, Wright-Patterson Air Force Base, Dayton, OH, pp. 64–188.

СПИСОК ЛИТЕРАТУРЫ

309

Kullback, S. (1935). The distribution laws of the difference and quotient of variables independently distributed in Pearson Type III laws, Annals of Mathematical Statistics, 7, 51–53. Kymn, K. O. (1974). A simple derivation of the relation between t- and F-distributions, SI AM Journal of Applied Mathematics, 27, 517–518. Lasdon, L. S., Waren, A. D., Jain, A., and Ratner, M. (1978). Design and testing of a generalized reduced gradient code for nonlinear programming, Association for Computing Machinery Transactions on Mathematical Software, 4, 34–50. Laubscher, N. F. (1965). Interpolation in F-tables, The American Statistician, 19, No. 1, 28, 40. Lee, C. M.-S. (1988). On the computation of F-cumulative probabilities, Communications in Statistics— Simulation and Computation, 17, 1191–1201. Leimkuhler, F. F. (1967). The Bradford distribution, Journal of Documentation, 23, 197–207. Lentner, M. (1976). On the exact calculation of cumulative F probabilities, Communications in Statistics, B5, 149–155. Malik, H. J. (1967). Exact distribution of the quotient of independent generalized gamma variables, Canadian Mathematical Bulletin, 10, 463–465. Mantel, N. (1966). F-ratio probabilities from binomial tables, Biometrics, 22, 404–407. Mardia, K. V., and Zemroch, P. J. (1978). Tables of the F- and Related Distributions with Algorithms, New York: Academic Press. McDonald, J. B., and Bookstaber, R. M. (1991). Option pricing for generalized distributions, Communications in Statistics— Theory and Methods, 20, 4053–4068. McDonald, J. B., and Butler, R. J. (1987). Some generalized mixture distributions with an application to unemployment duration. The Review of Economics and Statistics, 69, 232–240. McDonald, J. B., and Butler, R. J. (1990). Regression models for positive random variables, Journal of Econometrics, 43, 227–251. McDonald, J. B., and Richards, D. O. (1987a). Model selection: Some generalized distributions, Communications in Statistics— Theory and Methods, 16, 1049–1074. McDonald, J. B., and Richards, D. O. (1987b). Hazard rates and generalized beta distribution, IEEE Transactions on Reliability, R-36, 463–466. McIntyre, G. A., and Ward, M. M. (1968). Estimates of percentile points of the Fdistribution, Australian Computation Journal, 1, 113–114. Merrington, M., and Thompson, C. M. (1943). Tables of percentage points of the inverted beta (F) distribution, Biometrika, 33, 73–88. Mielke, P. W., Jr. (1973). Another family of distributions for describing and analyzing precipitation data, Journal of Applied Meteorology, 12, 275–280. Mielke, P. W., Jr., and Johnson, E. S. (1974). Some generalized beta distributions of the second kind having desirable application features in hydrology and meteorology, Water Resources Research, 10, 223–226 (Correction: 12, [1976], 827). Mihram, G. A. (1969). A distended Gamma distribution, Sankhy¯a, Series B, 31, 421–424. Morris, J. (1969). Algorithm 346: F-test, Communications of the Association for Computing Machinery, 13, 184. Mudholkar, G. S., and Chaubey, Y. P. (1976). Some refinements of the Wise-approximation for the beta and F-distributions, Utilitas Mathematica, 10, 199–207. Newman, D. (1939). The distribution of range in samples from a normal population, expressed in terms of an independent estimate of standard deviation, Biometrika, 31, 20–30. Ojo, M. O. (1985). A new approximation to the F-distribution, Utilitas Mathematica, 28, 121–128.

310

ГЛАВА 27. F-РАСПРЕДЕЛЕНИЕ

Ojo, M. O. (1988). A new approximation to the incomplete beta function, Communications in Statistics— Theory and Methods, 17, 1423–1435. Owen, D. B. (1962). Handbook of Statistical Tables, Reading, MA: Addison-Wesley 1) . Patil, S. A., Raghunandanan, K., and Lee, R.-Y. (1985a). Order statistics of the Fdistribution, Proceedings of ASA Statistical Computing Section, pp. 337–341. Patil, S. A., Raghunandanan, K., and Lee, R.-Y. (1985b). On the moments of order statistics of the F-distribution, Computational Statistics Quarterly, 2, 285–302. Paulson, E. (1942). An approximate normalization of the analysis of variance distribution, Annals of Mathematical Statistics, 13, 233–235. Pearson, E. S., and Hartley, H. O. (1958). Biometrika Tables for Statisticians, vol. 1, 2d ed., Cambridge: Cambridge University Press. Pestana, D. (1977). Note on a paper of Ifram, Sankhy¯a, Series A, 39, 396–397. Pham-Gia, T., and Duong, Q. P. (1989). The generalized beta- and F-distributions in statistical modelling, Mathematical and Computational Modelling, 12, 1613–1625. Phillips, P. C. B. (1982). The true characteristic function of the F distribution, Biometrika, 69, 261–264. Prentice, R. L. (1975). Discrimination among some parametric models, Biometrika, 62, 607–614. Prins, H. J. (1960). Transforms for finding probabilities and variates of a distribution in terms of a related distribution function, Statistica Neerlandica, 14, 1–17. Rider, P. R. (1931). A note on small sample theory, Journal of the American Statistical Association, 26, 172–174. Roy, M. K., Roy, A. K., and Ali, M. Masoom (1993). Binomial mixtures of some standard distributions, Journal of Information and Optimization Sciences, 14, 57–71. Runde, R. (1993). A note on the asymptotic distribution of the F-statistic for random variables with infinite variance, Statistics & Probability Letters, 18, 9–12. Satterthwaite, F. E. (1946). An approximate distribution of estimates of variance components, Biometrics, 2, 110–114. Schader, M., and Schmid, F. (1986). Distribution function and percentage points of the central and non-central F-distributions, Statistische Hefte, 27, 67–74. Scheff´e, H. (1942). On the ratio of variances of two normal populations, Annals of Mathematical Statistics, 13, 371–388. Scheff´e, H., and Tukey, J. W. (1944). A formula for sample sizes for population tolerance limits, Annals of Mathematical Statistics, 15, 217. Shah, M. C., and Rathie, P. W. (1974). Exact distribution of product of generalized F-variates, Canadian Journal of Statistics, 2, 13–24. Smillie, K. W., and Anstey, T. H. (1964). A note on the calculation of probabilities in an F-distribution, Communications of the Association for Computing Machinery, 7, 725. Snedecor, G. W. (1934). Calculation and Interpretation of the Analysis of Variance, Ames, IA: Collegiate Press. Stammberger, A. (1967). Uber einige Nomogramme z¨ur Statistik, Wissenschaftliche Zeitschrift der Humboldt-Universitat Berlin. Mathematisch-Naturwissenschaftliche Reihe, 16, 86–93. Stuart, A., and Ord, J. K. (1994). Kendall’s Advanced Theory of Statistics— Volume 1, Sixth edition, London: Edward Arnold. Swain, A. K. P. C. (1965). A lower bound to the probability of variance-ratio, Annals of the Institute of Statistical Mathematics, 17, 81–84.

1) Оуэн

Д. Сборник статистических таблиц. — М.: АН СССР, 1966. — 568 с.

СПИСОК ЛИТЕРАТУРЫ

311

Tiao, G. C., and Lochner, R. H. (1966). Tables for the Comparison of the Spread of Two Normal Distributions, Technical Report No. 88, Department of Statistics, University of Wisconsin, Madison. Tiku, M. L. (1964). Approximating the general non-normal variance-ratio sampling distributions, Biometrika, 51, 83–95. Viveros, R. (1990). An approximate normalizing power transformation for the F distribution, Communications in Statistics— Simulation and Computation, 19, 57–69. Vogler, L. E., and Norton, K. A. (1957). Graphs and Tables of the Significance Levels (F(r1 , r2 , p)) of the Fisher-Snedecor Variance Ratio, National Bureau of Standards Report No. 5069, Washington, DC: GPO. Wishart, J. (1946). The variance ratio test in statistics, Journal of the Institute of Actuaries Students’ Society, 6, 172–184. Wishart, J. (1947). The cumulants of the z and of the logarithmic χ 2 and t distributions, Biometrika, 34, 170–178. (Correction: 374.) Wishart, J. (1957). An approximate formula for the cumulative z-distribution, Annals of Mathematical Statistics, 28, 504–510. Wood, A. T. A. (1989). The F approximation to the distribution of a linear combination of chi-squared variables, Communications in Statistics— Simulation and Computation, 18, 1439–1456. Yip, D. Y. N. (1974). Chi-square and F approximations of Hotelling’s generalized T 2 , M. Sc. project, Department of Applied Mathematics, McMaster University, Hamilton, Ontario, Canada. Zeigler, C. O. (1965). The effect of the normality and homogeneity of variance assumptions upon the validity of the F table for interaction terms, M. Sc. thesis, Department of Industrial Engineering, Texas Technological College, Lubbock. Zelen, M., and Severo, N. C. (1964). Probability Functions, In Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, (eds., M. Abramovitz and I. A. Stegun), Applied Mathematics Series, 55, National Bureau of Standards, U. S. Department of Commerce, Washington, DC, pp. 925–955 1) . Zinger, A. (1964). On interpolation in tables of the F-distribution, Applied Statistics, 13, 51–53.

1) Абрамовиц

М., Стиган И. Справочник по специальным функциям. — М.: Наука, 1979.

ГЛАВА 28

t-Распределение

1.

Происхождение и исторические замечания

Пусть X1 , X2 , . . . , Xn — независимые случайные величины, имеющие одинаковые нормальные распределения со средним ξ и средним квадратическим √ 1 $n отклонением σ . Тогда n(X − ξ )/σ , где X = j=1 Xj , имеет стандартное n нормальное распределение. Такая статистика используется при проверке гипотез и при построении доверительного интервала для ξ при известном σ . Если σ неизвестно, то используется оценка   2 1/2 1 n Xj − X S= , n−1

j=1

что приводит к статистике √ T= n

X−ξ .

2 1/2 $ (n − 1)−1 nj=1 Xj − X

Такой использовали, не делая различия между распределениями   √ метод √ n X − ξ /σ и n X − ξ /S. Было понятно, что распределения не совпадают, однако при нахождении распределения второй из статистик возникают определенные сложности. Стьюдент (1908) нашел распределение величины +−1/2 * n √  

  √ n X−ξ 2 1 T  =√ Xj − X =√ T = n X−ξ n−1

j=1

S

n−1

и составил небольшую таблицу функции распределения. Напомним, что результаты, касающиеся совместного распределения X и S, приведены в гл. 13. Там показано, что T  распределено как отношение нормальная случайная величина U и χn−1 независимы. U/χn−1 , где стандартная √ Множитель n − 1 в знаменателе ввел Fisher (1925a), определивший t с ν степенями свободы как отношение  2 −1/2 χ tν = U ν . (28.1) ν

Это отношение часто называют стьюдетновым t-отношением, а соответствующее распределение — распределением Стьюдента. Иногда говорят 312

313

2. СВОЙСТВА

о статистике или распределении Фишера, но этот термин чаще относится к отношению F дисперсий, см. гл. 27. Разные аспекты развития теории t-распределения приводят Eisenhart (1979) и Box (1981). Cacoullos (1965) показал, что, если X0 и X1 независимы и распределены 1√ ν (X1 − X0 ) (X0 X1 )−1/2 по закону χ 2 с ν степенями свободы (гл. 18), то 2 имеет tν -распределение. Другими словами, если Y имеет распределение Fν,ν ,  1 √ 1/2 то ν Y − Y −1/2 имеет tν -распределение. Об этом см. в гл. 27, п. 8. 2 Замечательное характеризационное свойство обнаружил Bondesson (1981): пусть независимые одинаково распределенные случайные величины X1 , . . . , Xn имеют конечные моменты всех порядков и функции распределения непрерывны в нуле. Если −1/2  n 

2 √ −1 Xi − X T = nX (n − 1) i=1

имеет tn−1 -распределение при всех n  2, то общее распределение случайных величин X1 , . . . , Xn является нормальным с нулевым средним и положительной дисперсией. Заметим, что при n = 2 существует распределение с бесконечным средним, типа обратной стандартной нормальной величины, −1 √  2 2 −1/2 √  1 = 2X |X1 − X2 | имеет для которой 2X X1 − X + X2 − X 2 t1 -распределение. Краткий перечень свойств t-распределения и информацию о таблицах и аппроксимациях читатель найдет в книге Stuart and Ord (1994, pp. 546–549).

2.

Свойства

√ −1 Плотность распределения tν = U χν / ν равна ptν (t) =



νB

   −(ν+1)/2 Γ 1 (ν + 1)  −(ν+1)/2 2 1 2 t t2 = . 1+  1+ ν    ν √ 1 1 1 , ν 2 2

πν Γ

2

ν

(28.2) Это — частный случай кривой Пирсона типа VII. Кривая симметрична относительно t = 0 и имеет единственную моду при t = 0. Легко показать, что √ −1 2 lim ptν (t) = 2π e−t /2 , ν →∞

т. е. при ν → ∞ распределение tν сходится к стандартному нормальному распределению. Этот факт лежит в основе большинства аппроксимаций, описанных в п. 4. Пусть tν,α определено равенством

(28.3) Pr tν  tν,α = α .

314

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Тогда, в силу симметрии,

tν,0.5 = 0 = U0.5 ,

где Φ(Uα ) = α . При α > 0.5 а при α < 0.5

tν,α > Uα > 0, tν,α < −U1−α < 0.

Понятно, что –tν,1−α = tν,α . Подстановка w = ν /(ν + y2 )−1 приводит при всех t  0 к формуле −(ν+1)/2 √  −1 1  1 1 y2 νB , ν dy = 1+ Pr [tν  t] = Pr [tν  0] + ν

2 2

0

 

1 1 1 1 , ν B = + 2 2 2 2

=1−

1 I 2 2 ν /(ν +t )



1

−1

w(ν−2)/2 (1 − w)−1/2 dw =

ν /(ν +t2 )

1 1 ν, 2 2





=

1 1 + It2 /(ν+t2 ) 2



1 1 , ν 2 2



,

(28.4a)

где Ix (a, b) — нормированная неполная бета-функция, определенная в гл. 1. Последнее равенство можно использовать для компьютерных вычислений функции t-распределения с использованием алгоритмов, разработанных для бета-распределения (см. гл. 25. п. 6). Например, Lee and Singh (1988), отправляясь от (28.4a) получили следующие формулы: при нечетном ν ⎧ ⎡ ⎤ ⎫ (ν −3)/2 i ⎬ ⎨  , " 3 1 2j ⎦ i 1 ⎣ Pr [tν  t] = + y(1 − y) 1 + arcsin(2y − 1), y − 4 π 2j + 1 ⎭ 2π ⎩ i=1

j=1

(28.4b)

при четном ν

⎧ ⎡ ⎤ ⎫ (ν −2)/2 i ⎬ ⎨  , " 1 1 2j − 1 ⎦ i ⎣ y , Pr [tν  t] = + 1−y 1+ 2 π 2j ⎭ ⎩ i=1

(28.4c)

j=1

$−1 $0 где y = ν /(ν + t2 ) и i=1 = −1, i=1 = 0. В работе Zelen and Severo (1964) приводятся другие формулы, справедливые при всех t: Pr [t1  t] =

1 1 + arctg t, 2 π

ν = 1;

(28.4d)

√  пусть θ = arctg t/ ν , тогда при нечетном ν > 1    1 1 2 2 · 4 · . . . · (ν − 3) 3 ν −2 Pr [tν  t] = + θ + cos θ + cos θ + · · · + cos θ sin θ ; 2 π

3

3 · 5 · . . . · (ν − 2)

(28.4e)

315

2. СВОЙСТВА

при четном ν 1 1 Pr [tν  t] = + 2 2



1 1·3 1 · 3 · . . . · (ν − 3) cos4 θ + · · · + cosν−2 θ 1 + cos2 θ + 2 2·4 2 · 4 · . . . · (ν − 2)

 sin θ .

(28.4f ) Amos (1964) получил несколько выражений для Pr [tν  t] в терминах гипергеометрических функций (см. гл. 1, п. A6). Например, формулу, полезную, если величины |t|/ν 1/2 и ν малы одновременно: 1 1 Pr [tν  t] = + √ 2 πν

Γ



1 (ν + 1) 2   1 Γ ν 2



 · 2 F1

1 1 3 −t2 (ν + 1); ; ; 2 2 2 ν

 при t2 < ν .

(28.4g) Все нечетные моменты tν относительно нуля равны нулю. Для четных r момент порядка r равен μr (tν ) = ν r/2 ·

Γ



   1 1 (r + 1) Γ (ν − r) 2 2 1 · 3 · . . . · (r − 1) = ν r/2 · . (28.5)     (ν − r)(ν − r + 2) . . . (ν − 2) 1 1 Γ Γ ν 2 2

При r  ν момент порядка r бесконечен. Полагая r = 1, получаем среднее отклонение:   1

√ Γ 2 (ν − 1) E [|tν |] = ν . √ 1  πΓ

2

(28.6)

ν

Из (28.5) получаем:

ν , ν  2. ν−2 6 3(ν − 2) α4 (tν ) = β2 (tν ) = 3 + = , ν−4 ν−4

(28.7a)

var(tν ) =

ν  4.

(28.7b)

Последняя " величина убывает по ν от 9 при ν = 5 до 3 при ν → ∞. α3 (tν ) = β1 (tν ) = 0 [Wishart (1947)]. Из (28.7a) и (28.6) следует, что   ⎤ 1 6 ⎡6 (ν − 1) Γ 2 Среднее отклонение 2⎣ 1 ⎦. ν−1 =   Стандартное отклонение π 2 1 Γ

2

ν

" 2/π с возрастанием ν быстро Множитель в квадратных скобках при стремится к 1, что видно из табл. 28.1. Плотность распределения tν имеет точки перегиба при " tν = ± ν (ν + 2). С возрастанием ν распределение tν быстро сходится к стандартному нормальному распределению. На рис. 28.1 показан график распределения tν при ν = 4 и график стандартной нормальной плотности. Даже при небольших ν

316

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.1 Отношение среднего отклонения к стандартному отклонению для распределения tν ν

3

4

5

6

7

8

9

10

11

12

Отношение 0.637 0.707 0.735 0.750 0.759 0.765 0.770 0.773 0.776 0.778

√ графики близки. Если взять нормированную величину t4 , т. е. t4 / 2, близость графиков станет сильнее [Weir (1960a)]. Fujikoshi and Mukaihata (1993) рассмотрели преобразованную величину Uν =

   1/2 1 1 ν− sgn(tν ) log 1 + tν2 2

ν

при ν > 1/2. Авторы показали, что распределение Uν быстро сходится к стандартному нормальному распределению. Более того, они установили, что при всех x Pr [Uν  x] = Φ(x) + O(ν −2 ). В статье Fujikoshi and Mukaihata (1993) также получены некоторые аппроксимации и границы квантилей распределения Uν . Если ν нечетно, то характеристическая функция tν равна m−1    1/2 j

 φtν (t) = cj,m−1 ν t exp − ν 1/2 t , (28.8) j=0

где m =

1 (ν + 1), а cj,m удовлетворяют рекуррентным соотношениям: 2

c0,m = 1,

c1,m = 1,

cm−1,m = {(2m − 3)(2m − 5) · . . . · 3 · 1}−1 ,

cj,m = {cj−1,m−1 + (2m − 3 − j)cj,m−1 }

(2m − 3)−1

при 1  j  m − 1. (28.9)

РИС. 28.1. Сравнение стандартной нормальной плотности и плотности распределения t4

317

3. ТАБЛИЦЫ И НОМОГРАММЫ

[Mitra (1978)]. В частности, φt1 (t) = exp(−|t|),  √    √       φt3 (t) = 1 + t 3 exp − t 3 , √     √      5  φt5 (t) = 1 + t 5 + t2 exp − t 5 , 3  √      √    14 2 1  √ 3   φt7 (t) = 1 + t 7 + t + t 7 exp − t 7 . 5

(28.10)

15

Ifram (1972) приводит другую форму:   (m)    1 1 1 −1 φt2m+1 (t) = , m+ 2π i (z + i)−m−1 exp it(2m + 1)1/2z /m!. B m!

2

2

z=i

(28.11) Он также приводит (без подробного вывода) выражение для случая ν = 2n: 



(k+2n)

exp it(2n)1/2 z ∞    −1   1 n − 1/2 k φt2n (t) = B ,n 2π i (2i) 2

k=0

k

(k + 2n)!

z=i

.

(28.12)

Преобразование Фурье t-распределения содержит простые полиномы Бесселя. В частности, отношение

√ 

√  (28.13) pn−1 x /pn x , где pn (z) =

n  (n + k)!zn−k k

k=0

(n − k)!k!2

 = zn yn 1/z

и yn есть n-й полином Бесселя [yn (z) = 2 F0 (−n, n+1; −; −z/2)]. Такое отношение возникает при исследовании безграничной делимости tν -распределения. Чтобы доказать безграничную делимость этого распределения достаточно доказать, что (28.13) строго монотонно на (0; ∞). Для n = 4, 5 и 6 монотонность установлена в работе Ismail and Kelker (1976), откуда следует безграничная делимость при ν = 9, 11 и 13. Позже в том же году Grosswald (1976a) доказал строгую монотонность (28.13) для нечетных n и, наконец, Grosswald (1976b) доказал это свойство для всех n, завершив, таким образом, доказательство безграничной делимости стьюдентова t-распределения. Epstein (1977) независимо получил более простое доказательство. Как и в статьях Гроссвальда, доказательство для четных n оказалось более сложным. Распределение случайной величины tν−1 при нечетных ν  3 не является безгранично делимым.

3.

Таблицы и номограммы

3.1.

Таблицы

Функция распределения Стьюдента и процентные точки табулированы весьма подробно. Мы приведем список таблиц примерно в хронологическом порядке. Кроме этого существует множество таблиц в учебных изданиях, эти таблицы,

318

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

в основном, заимствованы из упоминаемых в нашем списке. Отметим, что ν = ∞ соответствует стандартному нормальному распределению. Первые таблицы опубликованы √ в работе «Student» (1908). Там приводятся значения Pr[zν  z], где zν = tν / ν + 1. Позже тот же автор [«Student’» (1925)] опубликовал таблицы Pr[tν  t] с четырьмя десятичными знаками для ν = 1 (1) 20, ∞ и t = 0 (0.1) 6.0, а также для ν = 3 (1) 11 и t = 6.0 (0.5) 10.0 (1) 12 (2) 16 (4) 28 с шестью десятичными знаками. В работе Pearson and Hartley (1958) приводятся таблицы Pr[tν  t] с пятью десятичными знаками для ν = 1 (1) 24, 30, 40, 60, 120, ∞



и

0.0 (0.1) 4.0 (0.2) 8.0 0.00 (0.05) 2.0 (0.1) 4.0 0.5 с тремя знаками для t=

а также tν,α

(ν  20), (ν  20),

ν = 1 (1) 30, 40, 60, 120, ∞

и

α = 0.6, 0.75, 0.9, 0.95, 0.975, 0.99, 0.995, 0.9975, 0.999, 0.9995.

Кроме того, приведены значения tν,α с тремя или более значащими цифрами для ν = 1 (1) 10 и α = 0.9999, 0.99999, 0.999995. Часть из этих таблиц появилась раньше в работах Baldwin (1946) и Hartley and Pearson (1950), часть — в работе Janko (1958). Rao, Mitra and Mathai (1966) приводят аналогичные таблицы с добавлением ν = 80 (и исключением ν = 120) и α = 0.7 и 0.8. Эти таблицы замечательны тем, что включают весьма длинные хвосты, хотя некоторые из ниже перечисленных таблиц более практичны. Fisher and Yates (1966) приводят значения tν,α с тремя десятичными знаками для ν = 1 (1) 30, 40, 60, 120 и α = 0.55 (0.05) 0.95, 0.975, 0.99, 0.995, 0.9995. Lampers and Lauter (1971) расширили эти таблицы, добавив значения для α = 0.5625 (0.0625) 0.9375, за исключением α = 0.75. Vesel´a (1964) приводит значения tν,α с четырьмя десятичными знаками для ν = 30 (1) 120 и α = 0.95, 0.975, 0.995. В работе Owen (1962) табулированы значения tν,α с четырьмя десятичными знаками для ν = 1 (1) 100, 150, 200 (100) 1000, ∞ и

α = 0.75, 0.90, 0.95, 0.975, 0.99, 0.995.

Также приводятся tν,α с пятью десятичными знаками для ν = 1 (1) 30 (5) 100 (10) 200, ∞

и

α = 0.95, 0.975, 0.99, 0.995;

таблицы интересны большим диапазоном значений ν . Federighi (1959) рассмотрел значения α , близкие к 1 (т. е. далекий верхний хвост распределения). Таблицы дают значения tν,α с тремя десятичными знаками для ν = 1 (1) (30) 5 (60) (10) 100, 200, 500, 1000, 2000, 10000, ∞

319

3. ТАБЛИЦЫ И НОМОГРАММЫ

и 1 − α = 0.25, 0.1, 0.05, 0.025, 0.01, 0.005, 0.0025, 10−3, 1 × 10−4 , 2 1 10−6 , × 10−6 , 2

10−4 ,

1 1 × 10−3 , × 10−3 , 2 4

1 1 1 × 10−4 , 10−5 , × 10−5 , × 10−5 , 4 2 4 1 −6 −7 × 10 , 10 . 4

Hill (1972) табулировал значения tν,α /2 для распределения Стьюдента, соответствующие двусторонним доверительным уровням для α = 0.9 (−0.1) 0.1;{5,2,1} × 10−2 (−1) −10 (−5) −20 , ν = 1 (1) 30 (2) 50(5) 100 (10) 150,200, {240,300,400,600,1200} × {1,10,100},∞

с двадцатью десятичными знаками для tν,α /2 < 103 и с двадцатью значащими цифрами для остальных tν,α /2 . Таблицы предваряются несколькими интересными аппроксимациями. Hald (1952) рассчитал таблицы tν,α с тремя десятичными знаками для ν = 1 (1) 30 (10) 60 (20) 100, 200, 500, ∞

и

α = 0.6 (0.1) 0.9, 0.95, 0.975, 0.99, 0.995, 0.999, 0.9995.

Значения плотности ptν (t) табулировали Bracken and Schleifer (1964), Smirnov (1961) и Sukhatme (1938). В последней работе содержатся таблицы с семью десятичными знаками для ν = 1 (1) 10, 12, 15, 20, 24, 30 и

t = 0.05(0.1)7.25.

Таблицы дополнены значениями при ν = 60 для t = 0.05 (0.1) 6.35. Таблицы Bracken and Schleifer (1964) охватывают больший диапазон по каждому из аргументов (в том числе для дробного значения ν = 1.5): ν = 1, 1.5, 2 (1) 10, 12, 15, 20, 24, 30, 40, 60, 120, ∞ и

t = 0.00 (0.01) 8.00.

Сборник таблиц Smirnov (1961) содержит таблицы ptν (t) и Pr[tν  t] с шестью десятичными знаками для и для

ν = 1 (1) 12,

t = 0.00 (0.01) 3.00 (0.02) 4.50 (0.05) 6.50

ν = 13 (1) 24,

t = 0.00 (0.01) 2.50 (0.02) 3.50 (0.05) 6.50.

В сборник включены таблицы Pr[tν  t] также с шестью десятичными знаками при ν = 1 (1) 10 для значений t = 6.5 (0.1) 9.0, при и при

ν = 25 (1) 35

для t = 0.00 (0.01) 2.50 (0.02) 3.50 (0.05) 5.00

103ν −1 = 30 (−2) 0

для t = 0.00 (0.01) 2.50 (0.02) 5.00.

320

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Отметим широкий диапазон дробных значений ν . Там же находятся большие таблицы tν,α с четырьмя десятичными знаками для ν = 1 (1) 30 (10) 100, 120, 150 (50) 500 (100) 1000,1500,2000 (1000) 6000, 8000,10000,∞ при α = 0.6, 0.75, 0.9, 0.95, 0.975, 0.99, 0.995, 0.9975, 0.999, 0.9995

(см. также п. 4). Эти таблицы включают   значения мультипликативной  ;  также 1 1 −1/2 Γ (ν + 1) Γ ν и log Kν с десятью значащими константы Kν = (πν ) 2 2 цифрами для ν = 1 (1) 24. Таблицы Cotterman and Knoop (1968) содержат граничные значения (с шестью десятичными знаками) T1 (p) и T2 (p) такие, что три десятичных знака величины Pr[tν  T] совпадают со значениями p [p = 0.000 (0.001) 0.500] для всех T между T1 (p) и T2 (p) для ν = 1 (1) 15. Laumann (1967) приводит значения Pr[tν  t] с семью десятичными знаками для t = 0 (0.01) 4.50, ν = 20 (2) 40 (10) 100 (20) 200, 300, 500, 1000. Mardia and Zemroch (1978) включили в свои таблицы значения tν,α с пятью значащими цифрами для ν = 0.1 (0.1) 3 (0.2) 7 (0.5) 11 (1) 40, 60, 120, ∞ и 1 − α = 0.0001, 0.0005, 0.001, 0.005, 0.01, 0.02, 0.03 (0.01) 0.1, 0.2, 0.25, 0.3, 0.4. Отметим, что включение многих дробных значений ν удобно, если t-распределение используется для аппроксимаций. Kafadar and Tukey (1988) заметили, что tν,α аппроксимируется линейной функцией от log(1 − α ) и предложили использовать этот факт, чтобы сделать более эффективной линейную интерполяцию. Они ввели величину − logG (1 − α )

при G = 10−0.1,

названную ими децигальтом (decigalt, в честь Фрэнсиса Гальтона). Основание G логарифма выбрано так, чтобы часто встречающиеся значения α давали бы целые или близкие к целым значения числа децигальтов (например, значения, соответствующие α = 0.95, 0.975 и 0.99 равны 13.0103, 16.0205, и 20 соответственно. Kafadar and Tukey (1988) также рассмотрели двоичнодесятичные значения 1 − α = 2j · 10−k при целых j и k и составили двоичнодесятичные таблицы tν,α с тремя десятичными знаками при α вида 1−2j ·10−k . Эти таблицы близки к аналогичным, составленным по децигальтам. В статье, кроме того, имеются интересные замечания по интерполяции. Tiku and Kumra (1985) рассчитали таблицы средних, дисперсий и ковариаций порядковых статистик t-распределения Стьюдента. В случае объема 1 выборки n  20 табулированы значения для p = (ν + 1) = 2 (0.5) 10. Расчеты 2 при n > 20 приведены в работе Tiku and Suresh (1992).

3.2.

Номограммы

Предыдущий перечень показывает, что tν -распределение достаточно подробно табулировано. Для почти всех приложений существуют доступные таблицы. В практических случаях иногда требуется быстро оценить tν,α или Pr[tν  t].

3. ТАБЛИЦЫ И НОМОГРАММЫ

321

РИС. 28.2. Номограмма Джеймса-Леви (James-Levy). ν — число степеней свободы. По данным двум из трех величин ν , t и Pr[tν  t] определяется третья

В этом случае полезно иметь подходящий графический метод определения необходимых значений с удовлетворительной точностью. James-Levy (1956) построил номограмму, связывающую ν , t и Pr[tν  t]. Она показана на рис. 28.2. Использование номограммы состоит в том, что данные два значения, нанесенные на двух из трех линий, соединяются прямой линией. Точка пересечения с третьей линией дает искомое значение. Например, чтобы найти tν,α следует провести прямую через соответствующие точки на линии ν и на линии Pr[tν  t] и пересечение с линией t даст tν,α . При α = 0.950 — 0.999 можно получить точность определения tν,α около 0.001. Stammberger (1967) опубликовал простую номограмму, по которой одна из величин ν , Pr[tν  t] и t определяется по двум другим также с помощью прямолинейного отрезка. Эта номограмма показана на рис. 28.3. Babanin (1952) составил номограмму (расчетную доску или абак), по которой значения считываются непосредственно, без использования линейки. Однако эта номограмма не столь проста, как вышеупомянутые номограммы Джеймса-Леви и Штаммбергера.

322

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

РИС. 28.3. Номограмма Штоммбергера (Stommberger)

323

4. АППРОКСИМАЦИИ

4.

Аппроксимации

Существует много работ по аппроксимации t-распределения. Некоторые аппроксимации весьма точны, некоторые довольно громоздки. Мы считаем простоту и точность важнейшими характеристиками приближенных методов. Однако решено было включить в этот пункт некоторые громоздкие приближения в силу их исторического интереса. Самое простое приближение получается, если заменить tν стандартной нормальной случайной величиной. Оно является весьма грубым, если ν  30, и неудовлетворительным даже при больших ν для далеких хвостов распределения, например, |tν | > 4. Небольшая модификация, предложенная в работе √ −1 Weir (1960a), а именно, замена величины tν 1 − 2ν стандартной нормальной случайной величиной, приводит к существенному улучшению. Однако и она довольно посредственна, если рассматриваются ν < 20 или далекие хвосты распределения. Как и в п. 3, мы перечислим аппроксимации, приблизительно в хронологическом порядке. Fisher (1925b) приводит разложение плотности и, следовательно, функции распределения в ряд по степеням ν −1 . Плотность выражается формулой    1 4 1 8 t − 2t2 − 1 ν −1 + 3t − 28t6 + 30t4 + 12t2 + 3 ν −2 + ptν (t) = φ (t) 1 + 4 96   1 12 t − 22t10 + 113t8 − 92t6 − 33t4 − 6t2 + 15 ν −3 + · · · , + (28.14) 384

√ −1

 2π exp −t2 /2 . Интегрирование (28.14) дает:    1 1 6 Pr[tν  t] ≈ 1 − Φ(t) + Φ(t) t t2 + 1 ν −1 + t 3t − 7t4 − 5t2 − 3 ν −2 + 4 96 

 1 + t t10 − 11t8 + 14t6 + 6t4 − 3t2 − 15 ν −3 + · · · . (28.15)

где φ (t) =

384

Максимальная абсолютная погрешность этой аппроксимации приводится в табл. 28.2.

Максимальная

ν

5 6 7 8 9 10

абсолютная

Максимальная абсолютная ошибка

2.8 1.4 8.2 5.0 3.2 2.2

(−3) (−3) (−4) (−4) (−4) (−4)

ν

11 12 13 14 15 20

погрешность формулы [Ling (1978)]

Максимальная абсолютная ошибка

1.5 1.1 8.0 6.1 4.7 1.5

(−4) (−4) (−5) (−5) (−5) (−5)

ν

25 30 35 40 45 50

(28.15),

Максимальная абсолютная ошибка

6.5 3.2 1.7 1.0 6.4 4.3

(−6) (−6) (−6) (−6) (−7) (−7)

ν

60 80 100 120

ТАБЛИЦА 28.2 c(d) ≡ c × 10d Максимальная абсолютная ошибка

2.1 6.6 2.7 1.3

(−7) (−8) (−8) (−8)

324

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.3 Коэффициенты Br,j коэффициентов полиномов Ап$ пеля (Appell), Ar (x) = xr rj=0 Br,j xj [Dickey (1967)] j

r 0

0

1

1

2

2

0

3

0

4

0

5

0

6

0

1

2

3

4

5

6

1 2 1 3 1 4 1 5 1 6 1 7

1 8 1 6 13 72 11 60 29 160

1 48 1 24 17 288 59 810

1 384 1 144 7 576

1 3840 1 1152

1 46080

Fisher and Cornish (1960) обратили эти ряды и получили приближенную формулу  

1 1 Uα 5Uα4 + 16Uα2 + 3 ν −2 + tν,α ≈ Uα + Uα Uα2 + 1 ν −1 + 4 96 

1 + Uα 3Uα6 + 19Uα4 + 17Uα2 − 15 ν −3 . (28.16) 384

Dickey (1967) √ получил асимптотический (расходящийся) ряд, аппроксимирующий t < ν в терминах полиномов Аппеля (Appel) A(x), определенных тождеством ∞  Ar (x)ur , |ux| < 1. (28.17) e−x (1 − ux)−1/u = r=0

 1 Полагая u = 2(ν + 1)−1 , x = 1 + v−1 t2 , получаем: 2 

t2 1+ ν

−(ν+1)/2

−1 2 = e−(1+ν ) t /2

∞  r=0

    2 r 1 Ar − 1 + ν −1 t2 , 2

ν+1

t2 < ν . (28.17)

Dickey (1967) приводит коэффициенты Br,j в разложении Ar (x) = $r = xr i=0 Br,j xj . Эти коэффициенты приведены в табл. 28.3. Hendricks (1936) опубликовал следующее приближение плотности: 6  −3/2

−1  ν+1 2 t + 2ν exp −(ν + 1)c2ν t2 t2 + 2ν , (28.18) ptν (t) ≈ 2vcn где

π

cν = 1 −

3 7 (ν + 1)−1 − (ν + 1)−2 . 4 12

Формула дает хорошее приближение в «центральной» части плотности, т. е. при |t| < 2, и хуже на хвостах.

325

4. АППРОКСИМАЦИИ

−1/2 √ Формула (28.18) равносильна приближению 2(ν + 1)cν tν tν2 + 2ν √ стандартным√нормальным распределением. Практически 2(ν + 1)cν можно заменить на 2ν − 1, если ν не слишком мало. Некоторые числовые сравнения приведены в табл. 28.4. Другая аналогичная аппроксимация получена в статье Elfving (1955):     √ 5 1 2 −1 −(ν +4)/2 5 −2 1+ t ν σt ν − Φ(σ t/ 2) , (28.19) Pr [tν  t] ≈ Φ(σ t) + 96

где

2

⎡ σ=⎣

ν− ν+

1 ⎤1/2 2 ⎦

1 2 t 2

.

1

Можно показать, что ошибка менее чем в ν −2 раз отличается от Pr [tν  t] 2 при всех t. Hotelling and Frankel (1938) ищут функцию от tν , распределение которой хорошо аппроксимируется стандартным нормальным. Приведем главные члены полученного ими разложения (являющегося, по существу, разложением Корниша—Фишера).     1 1 4 1 6 13t + 8t2 + 3 ν −2 − 35t + 19t4 + t2 − 15 ν −3 + U = t 1 − t2 + 1 ν −1 + 4 96 384   1 6271t8 + 3224t6 − 102t4 − 1680t2 − 945 ν −4 . (28.20) + 92160

Следующие члены быстро усложняются. Таблица 28.5, заимствованная из работы Hotelling and Frankel (1938), содержит значения Uα , соответствующие tν,α при разных ν и α , полученные по первым двум (x1 ), трем (x2 ), четырем (x3 ) и пяти (x4 ) членам разложения (28.20). В таблице приводятся также точные значения Uα . Для далеких хвостов точные результаты получаются при ν = 10, хотя даже для очень далеких хвостов (α = 0.99995) хорошие результаты получаются для ν  30 при использовании пяти членов разложения. Среди других исследований, основанных на разложении Корниша—Фишера, отметим Pieser (1943) и Goldberg and Levine (1946). Pieser (1943) использует простую формулу  1 3 tν,α ≈ Uα + (28.21) Uα + Uα ν −1 . 4

Таблица 28.6 [Pieser (1943)] показывает, что это приближение полезно при ν  30. Goldberg and Levine (1946) включили еще один член разложения, записав   1 3 1 5 Uα + Uα ν −1 + 5Uα + 16Uα3 + 3Uα ν −2 . (28.22) tν,α ≈ Uα + 4

96

Следующие два слагаемых суть  1 7 3U + 19U 5 + 17U 3 − 15U ν −3 + 386  1 79U 9 + 776U 7 − 1482U 5 − 1920U 3 − 945U ν −4 + 92160

326

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.4 Сравнение аппроксимации Хендрикса (Hendricks) (28.18) с точными значениями Значения tν,α

ν=9

Значения tν,α

α

Точное значение

Аппроксимация Хендрикса

0.55 0.65 0.75 0.85 0.95 0.975 0.99 0.995

0.129 0.398 0.703 1.100 1.833 2.262 2.821 3.250

0.129 0.398 0.703 1.104 1.844 2.290 2.869 3.389

ν = 29

α

Точное значение

Аппроксимация Хендрикса

0.55 0.65 0.75 0.85 0.95 0.975 0.99 0.995

0.127 0.389 0.683 1.055 1.699 2.045 2.462 2.756

0.127 0.389 0.683 1.055 1.700 2.047 2.466 2.764

ТАБЛИЦА 28.5 Точные значения Uα и приближенные, полученные по (28.20) α

0.95

tν , α x1 x2 x3 x4 Uα

0.975

0.995

0.9995

ν = 10

ν = 30

ν = 10

ν = 30

ν = 10

ν = 30

ν = 10

ν = 10

ν = 30

ν = 100

1.812 1.618 1.650 1.643

1.697 1.642 1.645 1.645

2.228 1.896 1.980 1.953

2.042 1.954 1.960 1.960

3.169 2.294 2.754 2.446

2.750 2.554 2.579 2.575

4.587 3.646 6.22 2.059 3.212 0.05 4.981 3.313 12.86 0.896 3.283 20.44 7.163 3.293 75.66 3.291

4.482 3.69 3.98 3.85 3.91 3.891

4.052 3.88 3.89 3.89 3.89

1.645

1.960

2.576

ν = 30

0.99995

ТАБЛИЦА 28.6 Аппроксимация tν,α по формуле (28.21) [Pieser (1943)] α

ν

10 30 60 120

(25.99) Точное (25.99) Точное (25.99) Точное (25.99) Точное

0.9875

0.975

0.95

0.875

0.75

2.579 2.634 2.354 2.360 2.298 2.299 2.270 2.270

2.197 2.228 2.039 2.042 2.000 2.000 1.980 1.980

1.797 1.813 1.696 1.697 1.670 1.671 1.658 1.658

1.212 1.221 1.171 1.173 1.161 1.162 1.156 1.156

0.700 0.700 0.683 0.683 0.679 0.679 0.677 0.677

327

4. АППРОКСИМАЦИИ

[Abramovitz and Stegun (1964, p. 949)]. Таблица 28.7, заимствованная из работы Goldberg and Levine (1946), позволяет сравнить точные значения и приближенные, полученные по (28.22). [В оригинале таблицы содержат также значения по первым двум членам разложения, как в работе Pieser (1943)]. Включение третьего члена значительно улучшает аппроксимацию, которая дает близкие значения уже при малых ν√, например, ν = 20. Simaika (1942) модифицировал аппроксимацию U ≈ tα 1 − 2ν −1 , включив старшие степени U.  " Приближение Arsh tα 3ν −1 /2 стандартным нормальным распределением [Ansombe (1950)] является частным случаем преобразования нецентрального t-распределения (гл. 31). Но для центрального t-распределения это используется редко. Chu (1956) получил следующие неравенства, которые позволяют оценить точность простых нормальных аппроксимаций величины tν для A  0, B  0, ν  3: * ( 6 ) ( 6 )+ ν ν+1

ν+1 ν

Φ B

6 

−Φ A * ( 6

7ν − 3 Φ 7ν − 14

B

ν+1 ν

ν−2 ν

)



Pr [A < tν < B]

( 6 −Φ A

ν−2 ν



)+ .

(28.23)

Он показал, что отношение абсолютной погрешности к точному значению Pr [A < tν < B] при использовании нормальной аппроксимации для tν меньше, чем ν −1 . Wallace (1959), применив подход, разработанный Chu (1956), получил границы функции распределения tν . Они удобней всего выражаются в терминах аргумента нормальной функции распределения u(t), определенного при t > 0 равенством Φ (u(t)) = Pr [tν  t] . (28.24) Wallace (1959) сформулировал результат следующим образом:

 1/2

, u(t)  ν log 1 + t2 ν −1 1/2

 

1/2 1 1 ν log 1 + t2 ν −1 при ν > u(t)  1 − ν −1 2

2

(28.25a) (28.25b)

или, другой вариант,  1/2

− 0.368ν −1/2 u(t)  ν log 1 + t2 ν −1

при ν 

1 . 2

(28.25c)

 1/2

отличается Формулы (28.25a) и (28.25b) показывают, что ν log 1 + t2 ν −1 −1 от u(t) не более чем на 25ν %. (28.25c) показывает, что абсолютная погрешность не превосходит 0.368ν −1/2. Обычно (28.25b) дает лучшую (т. е. б´oльшую) нижнюю границу, чем (28.25c).

328

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.7 Сравнение точных и приближенных (28.22) значений процентных точек t-распределения Значение функции распределения (α )

Число степеней свободы (ν )

Приближенное значение процентной точки

Точное значение процентной точки

0.9975

1 2 10 20 40 60 120 1 2 10 20 40 60 120 1 2 10 20 40 60 120 1 2 10 20 40 60 120 1 2 10 20 40 60 120

21.8892 9.1354 3.5587 3.1507 2.9708 2.9145 2.8599 16.3271 7.2428 3.1558 2.8437 2.7043 2.6602 2.6174 7.1547 3.8517 2.2254 2.0856 2.0210 2.0003 1.9799 4.5888 2.7618 1.8114 1.7246 1.6838 1.6706 1.6577 0.9993 0.8170 0.6998 0.6870 0.6807 0.6786 0.6765

127.32 14.089 3.5814 3.1534 2.9712 2.9146 2.8599 63.657 9.9248 3.1693 2.8453 2.7045 2.6603 2.6174 12.706 4.3027 2.2281 2.0860 2.0211 2.0003 1.9799 6.3138 2.9200 1.8125 1.7274 1.6839 1.6707 1.6577 1.0000 0.8165 0.6998 0.6870 0.6807 0.6786 0.6766

0.9950

0.9750

0.9500

0.7500

329

4. АППРОКСИМАЦИИ

Wallace (1959) привел еще две хорошие аппроксимации, не сопроводив (28.27) точными границами:    1/2

8ν + 1

ν log 1 + t2 ν −1 , (28.26) 8ν + 3  

 1/2 2 2 1− {1 − e−s }1/2 ν log 1 + t2 ν −1 , (28.27) 8ν + 3

где

 −1/2 . s = 0.184(8ν + 3)ν −1 log 1 + t2 ν −1

Автор утверждает, что (28.27) отличается от u(t) не более, чем на 0.02 в широком диапазоне значений t. Prescott (1974) подтверждает применимость (28.26). Уоллес (Wallace) сравнил значения (28.25a), (28.25b), (28.25c), (28.26) и (28.27) и значения, соответствующие аппроксимации Паульсона (Paulson) для F-распределения (гл. 27), получающейся при ν1 = 1:   −1/2    2/3

1 −1 −1 4/3 t −7 ν t +1 . (28.28) 9 − 2ν Pr |tν |  t ≈ Pr U  √ 3 2

Эти результаты иллюстрирует табл. 28.8. Отметим высокую точность аппроксимации (28.27), хотя формула довольно громоздка. Piezer and Pratt (1968) предложили другие формулы такого типа: ⎡   ⎤1/2   log 1 + t2 ν −1 2 ⎣ ⎦ , u(t) ≈ ν − (28.29a) ν − 5/6

3

⎡   ⎤−1  log 1 + t2 ν −1  2 1 −1 ⎣ ⎦ . u(t) ≈ ν − + ν 3

ν − 5/6

10

(28.29b)

Gaver and Kafadar (1984) получили простые аппроксимации процентных точек t-распределения, аналогичные (28.29b), но несколько более точные. Cornish (1969) приводит результат из неопубликованной работы Hill (1969). С помощью разложения Корниша—Фишера в терминах

 1/2 1 u = aν log 1 + t2 ν −1 при aν = ν − автор получил следующую формулу: 2  −2  1 3 1 7 u + 3u aν − 4u + 33u5 + 240u3 + 855u a−4 u(t) ≈ u + ν 48 23040

(28.30a)

и обратную формулу   1/2

−1 , tν,α = ν exp u2 a−1 ν где u  = Uα −

(28.30b)

  1 3 1 7 Uα + 3Uα a−2 4Uα + 63Uα5 + 360Uα3 + 945Uα a−4 ν + ν . 48 23040

Mickey (1975) предложил аппроксимацию  

1/2 1 log 1 + t2 /ν ν− , u(t) ≈ 2

(28.31)

330

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.8 Границы эквивалентного нормального аргумента u(t) для tν Границы u(t) ν

1

3

10

100

Аппроксимации

t

Точное значение

(28.25a)

(28.25b)

(28.25c)

(28.26)

(28.27)

Paulson (28.28)

0.3 1 2 4 8 12 102 105 1 2 4 8 12 √ 2 310 1 2 4 8 12 100

0.235 0.674 1.047 1.419 1.756 1.935 2.729 4.514 0.858 1.478 2.197 2.872 3.228 5.057 0.952 1.790 3.021 4.382 5.128 21.447

0.294 0.832 1.269 1.683 2.043 2.231 3.035 4.799 0.929 1.594 2.353 3.053 3.417 5.256 0.976 1.834 3.091 4.474 5.229 21.483

0.208 0.589 0.897 1.190 1.445 1.577 2.146 3.393 0.848 1.455 2.148 2.787 3.119 4.797 0.952 1.788 3.013 4.361 5.097 21.429

0.

(28.37)

В статье Soms (1984) приведены неравенства A(x, γmin ) < Rν,x < A(x, γmax ), где

1+γ

A(x, γ ) = 

x2 + 4c2ν (1 + γ )2

γmin =

ν

2(ν + 2)c2ν

− 1,

1/2

(28.38)

при ν > 2, + γx

γmax = 

4c2ν

1 − 4c2ν

.

При ν < 2 величина γmin дается второй формулой, а γmax — первой. Для ν = 2 имеем γmin = γmax , и Rν,x = A(x, γmax ). Сомс сравнил полученные им границы с границами Peizer and Pratt (1968) и Wallace (1959), но не получил определенных выводов. Нижняя граница в (28.38) чаще была лучше, а верхняя лучше или хуже примерно в половине случаев. Упомянем теперь четыре эмпирические формулы, приведенные в работах Cucconi (1962), Gardiner and Bombay (1965), Moran (1966) и Kramer (1966).

332

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.9 Значения a, b, c, d и e в приближенной формуле (28.39) α

a

0.95 0.975 0.995

1.6449 1.9600 2.5758

b

3.5283 0.60033 −0.082847

c

0.85602 0.95910 1.8745

d

1.2209 −0.90259 −2.2311

e

−1.5162 0.11588 1.5631

Gardiner and Bombay (1965) предложили формулу вида

 −1 tν,α ≈ aν + b + cν −1 ν + d + eν −1

(28.39)

для различных процентилей. Значения a, b, c, d и e для α = 0.95, 0.975 и 0.995 приведены в табл. 28.9 (заметим, что a = Uα ). Соответствующие значения tν,α имеют четыре верных десятичных знака при ν > 3. Эти результаты, повидимому, лучше при малых ν , чем приближения, полученные по формулам Cucconi (1962):

−1/2 tν,0.975 ≈ 1.9600ν ν 2 − 2.143ν + 1.696) , ν > 1, (28.40a)

2 −1/2 tν,0.995 ≈ 2.5758ν ν − 3.185ν + 4.212) , ν > 2. (28.40b) Moran (1966) ограничился сравнением 2.5%-х, 0.5%-х и 0.05%-х процентилей и предложил следующие аппроксимации. Для 2.5%-й точки

 (28.41) U0.975 = tν,0.975 1 − 0.0550tν,0.975ν −1 и

 U0.975 = tν,0.975 1 − 0.6049tν,0.975ν −1 + 0.2783tν2,0.975ν −2 .

(28.42)

Для 0.5%-й точки

−1 U0.995 = tν,0.995 1 + 0.613tν,0.995ν −1 − 0.8ν −1 .

(28.43)

Для 0.05%-й точки

−1 . U0.9995 = tν,0.9995 1 + 0.87tν,0.9995ν −1

(28.44)

Оказалось, что формула

−1 Uα = tν,α 1 + 0.613tν,α ν −1

(28.45)

дает хорошее приближение как при α = 0.975, так и для α = 0.995. Значения, получаемые по формулам (28.42), (28.43) и (28.45) для α =0.975 и α = 0.995, приводятся в табл. 28.10. Формула (28.45) дает довольно хорошие результаты при ν  10. Аппроксимация, предложенная в статье Kramer (1966), основана на неопубликованном результате Ray (1961). Kramer (1966) установил, что следующие формулы имеют погрешность менее 0.001 при 3 < ν < 120.

333

4. АППРОКСИМАЦИИ

ТАБЛИЦА 28.10 Сравнение аппроксимаций (28.42), (28.43) и (28.45) с точными значениями Uα α = 0.975, Uα = 1.9600

ν

3 4 5 6 8 10 15 20 30 40

α = 0.975, Uα = 2.5758

(28.42)

(28.45)

(28.45)

(28.43)

2.1369 1.9830 1.9603 1.9565 1.9573 1.9586 1.9603 1.9607 1.9608 1.9607

1.9284 1.9477 1.9546 1.9575 1.9597 1.9604 1.9607 1.9606 1.9605 1.9604

2.6628 2.6994 2.6983 2.6889 2.6691 2.6537 2.6300 2.6171 2.6037 2.5969

2.3961 2.4994 2.5383 2.5556 2.5691 2.5737 2.5767 2.5771 2.5770 2.5769

Для 0 < t < 1 Pr[0 < tν < t] ≈ 0.399622t − 0.068492t3 + 0.010272t5− − 0.111604tν −1 − 0.009310t3v−1 + 0.02865tν −2. (28.46a) Для 0  t  2 Pr[0 < tα < t] ≈ −0.060820 + 0.585243t − 0.2089773t3 + 0.025489t5 + + 0.082228ν −1 − 0.276747tν −1 + 0.080726t2ν −1 + 0.011192tν −2. (28.46b) Для t > 2 Pr[0 < tν < t] ≈ 0.503226 − 0.044928ν −1 + 0.112057ν −2+

−1

−1 −1 + 1.949790 ν t2 − 5.917356 ν 2 t2 − 7.549051 ν t3 + 

2 3 −1

−1 + 11.311627 ν t − 0.399205t−4 + 5.487170 ν t4 . (28.46c) Такую же точность при ν = 1 дают следующие формулы. 1 Для 0 < t  2   1 1 1 Pr[0 < t1 < t] ≈ π −1 t − t3 + t5 − t7 . 3

Для

1 3 n  1: ∞ 

 2 −1 −(ν +1)/2

1+y ν

w dy = ν

1/2

t

−1/2 xν−1 1 − x2 dx =

0



1/2

ν

w



1 w2 1 · 3w4 + + + ··· ν 2(ν + 2) 2 · 4(v + 4)

.

(28.49b)

Обращение этого ряда использовано, чтобы выразить t2 ν −1 в терминах 2/ν

, где cν — нормировочная константа для функции распреz = ν 1/2 cν α деления, приводит к формуле ⎡ ⎤ tν2,α ν −1 ≈ z−1 +

ν+1 ⎣ z z  ⎦ , −1 + + ν+2 2(v + 4) 3(ν + 2) (ν + 6) (ν z)−1 − 1

(28.49c)

которая точна при ν = 2, а при б´oльших ν дает не менее шести точных знаков при z < ν −1 . Cornish (1969) приводит результат работы Hill (1969) о разложении типа  1/2

разложения Корниша—Фишера по переменной u = aν log 1 + t2 ν −1 , где aν = ν − 1/2 [см. (28.30a) и (28.30b)]. M. A. A. Cox (1991) переработал алгоритм работы Hill (1970a), написанный на языке АЛГОЛ, применительно к расчету процентных точек t-распределения Стьюдента на современных компьютерах. Результат входит в пакеты программ. Программы включены c , однако алгоритм легко адаптируется для пакетов в пакет SYMPHONY c c LOTUS 123 и SUPER CALC .

335

4. АППРОКСИМАЦИИ

ТАБЛИЦА 28.11 Точные и приближенные значения вероятностей хвостов t-распределения с ν степенями свободы [Pinkham and Wilk (1963)] Аппроксимация (28.49a) при m = 3

Точное значение a

0.001 0.000 0.000 0.000 0.000

0.000 0.000 0.000 0.000 0.000

05 01 001 000 1

a Точные

ν=7

816 042 008 000 000

ν = 15

8 66 873 087 7

0.001 0.000 0.000 0.000 0.000

06 051 010 001 000

ν = 40

5 2 02 102

0.001 0.000 0.000 0.000 0.000

02 050 010 001 000

3 05 003 100 1

значения взяты из работы Federighi (1959).

В работе Zelen and Severo (1964) получены следующие приближения. При ν  5 и больших t Pr[tν  t] ≈ 1 − aν t−ν − bν t−(ν+1) ,

(28.50)

где a1 = 0.3183, b1 = 0.0000,

a2 = 0.4991, b2 = 0.0518,

a3 = 1.1094, b3 = −0.0460,

a4 =3.0941, b4 = −2.756,

a5 =9.948, b5 = −14.05.

Для больших ν

     1 −1 1 2 −1 −1/2 Pr[tν  t] ≈ Φ t 1 − ν . 1+ t ν 4

2

(28.51)

Gentleman and Jenkins (1968) опубликовали приближенную формулу, удобную для компьютерного расчета: * +−8 5  1 j 1+ cj t , (28.52) Pr[|tν |  t] ≈ 2

j=1

где каждое из cj есть отношение полинома пятой степени к квадратному трехчлену относительно ν −1 . Формула дает пять верных десятичных знаков для ν > 10. Значения cj как функций от ν −1 приведены в табл. 28.12. Taylor (1970) разработал алгоритм на основе этого метода. При ν  5 абсолютная ошибка во всех случаях меньше 0.001. Ling(1978) сравнил несколько приближенных методов и показал, что для числа степеней свободы от 5 до 45 формула, полученная в статье Gentleman and Jenkins (1968) дает наименьшую абсолютную погрешность в диапазоне значений от 0.0001 до 0.4999. Продолжив анализ, представленный в статье Ling (1978), Lotz (1980) выяснил, что наилучшей аппроксимацией t-распределения Стьюдента является аппроксимация Хилла [Hill (1970a, 1972, 1981)]. Сюда включается обобщенное разложение типа Корниша—Фишера [Hill and Davis (1968)]; в этом разложении

  1 7 4Z + 33Z 5 + 240Z 3 + 855Z b−2 , U = Z + Z 3 + 3Z b−1 − (28.53) 10

336

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.12 Коэффициенты приближенных формул (28.52) Коэффициент

Числитель

Знаменатель

с1

0.009979441−0.581821ν −1 +1.390993ν −2 − −1.222452ν −3 +2.151185ν −4

1−5.537409ν −1 +11.42343ν −2

с2

0.04431742−0.2206018ν −1 +0.03317253ν −2 − −5.679969ν −3 −12.96519ν −4

1−5.166733ν −1 +13.49862ν −2

с3

0.009694901−0.1408854ν −1 +1.889930ν −2 − −12.75532ν −3 +25.77532ν −4

1−4.233736ν −1 +14.39630ν −2

с4

−0.00009187228+0.03789901ν −1 −1.280346ν −2 − −9.249528ν −3 +19.08115ν −4

1−2.777816ν −1 +16.46132ν −2

с5

0.0005796020−0.02763334ν −1 +0.4517029ν −2 − −2.657697ν −3 +5.127212ν −4

1−0.5657187ν −1 +21.83269ν −2

1/2 

1 где, как и выше, Z = a log 1 + ν −1 tν2 , a = ν − , b = 48a2 2 аппроксимируется стандартной нормальной величиной. Hill (1972, 1981) нашел первые семь членов; в работе Hill (1970a) показано, что вклад четвертого члена сравним с погрешностью от замены третьего члена 10b2 на величину 

10b b + 0.8z4 + 10 . Lozy (1982) также сравнивает аппроксимации Джентлмена—Дженкинса (Gentleman—Jenkins), Пайцера—Пратта (Peizer—Pratt), Корниша—Фишера (Cornish—Fisher) и различных аппроксимаций Хилла (Hill) с двумя и тремя членами разложения и модифицированным методом с тремя членами. Вывод таков. Только аппроксимация Джентлмена—Дженкинса и Хилла дают пять точных десятичных знаков при малом числе степеней свободы. Скорей всего, наиболее приемлемой является двучленная аппроксимация Хилла; метод Джентлмена—Дженкинса представляется громоздким. Поскольку аппроксимация Хилла дает пять точных знаков уже для восьми степеней свободы по сравнению с четырьмя или пятью членами разложения Пайцера—Пратта и Уолласа (Wallace) и не сложнее их формул, то, по-видимому, нет основания использовать последние.

Bukac and Burstein (1980) составили таблицу полиномиальных аппроксимаций величины tν,α для пяти значений α с относительной погрешностью 0.00005. Основу составляет выведенная в статье Goldberg and Levine (1946) формула tν,α = Uα +

Uα3 + Uα 5U 5 + 16Uα3 + 34Uα + a . 4ν 96ν 2

(28.22)

337

4. АППРОКСИМАЦИИ

ТАБЛИЦА 28.13 Коэффициенты полиномиальной аппроксимации (28.54b) процентных точек (tν,α ) t-распределения Стьюдента

b0

0.900 1.28155

0.950 1.64485

α 0.975 1.95996

0.990 2.32635

0.995 2.57583

b1

0.84658

1.52377

2.37227

3.72907

4.91655

b2

0.57432

1.41902

2.80775

5.72289

8.86832

b3

0.22086

1.00507

2.76386

6.61349

11.35729

b4

0.15426

0.32789

0.69551

6.61683

b5



0.39338

2.10650

−0.22569







0.422

0.316

0.291

b6 Δν,α ×10

4

17.92627 −9.45008

7.03691

27.46120

0.215

0.208

Для больших ν  120 авторы используют формулу где x = ν −1 ,

tν,α = b0 + b1 x, здесь b1 =

b 0 = Uα ;

(28.54a)

 1 3 Uα + U α . 4

При фиксированных ν и α они аппроксимируют tν,α величиной RN (x) = b0 + b1 x + b2 x2 + · · · + bN xN ,

(28.54b)

где при фиксированном N величины b2 , . . . , bN определяются так, чтобы минимизировать для малых ν максимальную погрешность Δν,α = max

      RN ν −1 − tν ,α  tν ,α

.

(28.54c)

Таблица 28.13 содержит соответствующие значения bi , i = 1, . . . , 6. Sinclair (1980) заметил, что при больших t значение log Pr [tν > t] близко линейной функции аргумента log t с угловым коэффициентом −t. Для больших t он предложил аппроксимацию {2 Pr[tν  t]} где αν = 2ν −1/2 βν =



−1/ν

1 νB 2



≈ αν t + βν t−1 , 1 1 ν, ν + 1 2 2

1/ν

(28.55) ,

1 (ν + 2)−1 ν (ν + 1)αν . 2

Константы αν и βν выбираются, чтобы два главных члена разложения в ряд −ν 1 αν t + βν t−1 совпадали с двумя членами разложения Тэйлора величины 2 Pr [tν > t] по отрицательным степеням t. Разность между точным значением

338

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.14 Множители γ1 (ν ) и γ2 (ν ) в (28.56) и (28.57) [Richter and Gundlach (1990)] ν

γ1 (ν )

γ2 (ν )

ν

γ1 (ν )

γ2 (ν )

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

0.3385 0.4124 0.4672 0.5088 0.5440 0.5772 0.5860 0.6163 0.6340 0.6495 0.6633 06756 0.6868 0.6969 0.7061

0.6629 0.7036 0.7324 0.7541 0.7713 0.7852 0.7967 0.8067 0.8152 0.8227 0.8293 0.8553 0.8406 0.8454 0.8498

19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

0.7145 0.7223 0.7295 0.7361 0.7424 0.7482 0.7536 0.7588 0.7636 0.7681 0.7725 0.7765 0.7804 0.7841 0.7876

0.8539 0.8576 0.8611 0.8642 0.8673 0.8701 0.8729 0.8752 0.8775 0.8797 0.8818 0.8837 0.8856 0.8874 0.8891

Pr [tν > t] и аппроксимацией (28.55) имеет порядок t−(ν+4) . Так как порядок Pr [tν > t] равен t−ν , то модуль относительной ошибки имеет порядок t−4 . В статье Sinclair (1980) также содержатся сравнения аппроксимаций Pinkham and Wilk (1963), Mickey (1975) и Sinclair (1980). 1 Richter and Gundlach ((1990) предложили аппроксимации при α > : 2   1/γ1 (ν) Uα − 1 (28.56) tν,α ≈ ν 1/2 ν −1/2 γ1 (ν ) + 1 и tν,α ≈ Uα +

 1 −1/2 −1/{1−γ2 (ν )} ν {γ2 (ν )} {1 − γ2 (ν )} Uα2 − 1 , 2

(28.57)

где γ1 (ν ) и γ2 (ν ) — подходящие константы, не зависящие от α . Авторы утверждают, что эти формулы дают точность ±4 · 10−5 для ν  4. Таблица 28.14, заимствованная из работы Richter and Gundlach (1990), содержит некоторые из γ1 (ν ) и γ2 (ν ). При ν → ∞ γj (ν ) → 1, j = 1, 2, и, похоже, что при ν > 33 можно считать " γ1 (ν ) ≈ 1 − {1 − γj (33)} 33/ν.

5.

Приложения

Основным приложением t-распределения является построение тестов и доверительных интервалов для среднего значения нормального распределения, об этом уже упоминалось в п. 1.

339

5. ПРИЛОЖЕНИЯ

ТАБЛИЦА 28.15 Множители bn,α n

α

0.90 0.95 0.99

4

5

6

7

8

9

10

11

12

15

20

1.18 1.59 2.92

0.95 1.24 2.06

0.82 1.05 1.65

0.73 0.93 1.40

0.67 0.84 1.24

0.62 0.77 1.12

0.58 0.72 1.03

0.55 0.67 0.96

0.52 0.64 0.90

0.45 0.55 0.77

0.40 0.48 0.66

Пусть X1 , X2 , . . . , Xn — независимые случайные величины, нормально распределенные со средним$ ξ и стандартным отклонением σ. Тогда  $ √ n X − ξ /S , где X = n−1 ni=1 Xi и S2 = (n − 1)−1 ni=1 Xi − X , имеет t-распределение с n − 1 степенями свободы. Следовательно,

√   Pr  n X − ξ /S  < tn−1,1−α /2 = 1 − α , откуда



√  √  (28.58) Pr X − tn−1,1−α /2/ n S < ξ < X + tn−1,1−α /2/ n S = 1 − α .

√  Таким образом, X ± tn−1,1−α /2/ n S — это доверительные границы для ξ с доверительной вероятностью 100(1 − α )%. √ Для практических целей удобно иметь таблицу множителей bn,α = tn−1,1− α2 / n, чтобы записать доверительные границы в виде X ± bn,α S . Таблица 28.15 содержит некоторые из таких множителей. Если одна из сравниваемых сумм квадратов в дисперсионном анализе имеет одну степень свободы, то при нулевой гипотезе статистика критерия имеет распределение F с 1 и ν степенями свободы, т. е. совпадает с распределением, tν2 . Доверительные границы для единственной линейной функции параметров в общей линейной модели (гл. 27) соответствуют одной степени свободы, аналогично тому, что уже описано. Распределение Стьюдента (будучи устойчивым распределением, как об этом сказано в гл. 12, п. 4) оказывается подходящей моделью описания ценовых изменений спекулятивных активов на биржах. Соответствующие модели описаны в работах Praetz (1972), Praetz and Wilson (1978), Blattberg and Gonedes (1974), McLeay (1986) и Taylor and Kingsman (1979). В последней из этих статей ежедневные изменения потребительских цен моделируются трехпараметрическим распределением Стьюдента (т. е. распределением Пирсона типа VII). Перечислим приложения распределения Стьюдента в публикациях 80–90-х гг. 1. Eggers and Andersen (1989), Anderson, Lauritzen and Thommesen (1990), Lauritzen, Thommesen and Andersen (1990) моделировали фазовые искажения под влиянием соседних частот в воздушных компонентах каналов мобильной связи в городских условиях.

340

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

2. Mirza and Boyer (1992) рассматривают распределение Стьюдента как элемент модели шума при глубинном картографировании и как основание для построения подходящих M-оценок. 3. Angers (1992) рассматривает эти распределения в качестве априорных независимых распределений средних значений многомерных нормальных популяций. 4. Verdinelli and Wasserman (1991) рассматривают стьюдентовы распределения как основу байесовского анализа модели выбросов при исследовании выборочного подхода Гиббса.

6.

Распределения Пирсона типа VII и их модификации

Общую формулу для плотности распределения типа VII можно записать в виде: pX (x) = √

c2m−1 Γ(m)  m , π Γ(m − 1/2) 2 c + (x − ξ )2

m > 0,

c > 0.

(28.59)

Она зависит от трех параметров, m, c и ξ . Случайная величина tν получается √ 1 при m = (ν + 1), c = ν и ξ = 0. Таким образом, если X имеет 2 √ распределение (28.59), то 2m − 1(X − ξ )/σ распределено как t2m−1 . Поэтому форма кривой (28.59) подобна форме плотности t2m−1 -распределения. Об этом уже сказано в п. 2 и мы здесь не будем повторяться. Данный пункт мы посвятим оцениванию параметров m, c и ξ по наблюдениям n независимых случайных величин X1 , X2 , . . . , Xn , плотность распределения которых дается формулой (28.59). Проблема рассматривалась в работе Fisher (1922), которая является одной из первых иллюстраций применения метода максимального правдоподобия. Дальнейшее исследование содержится в статье Sichel (1949), применившим метод частотных выборочных к оценке параметров. Материал этого пункта основан на содержании упомянутых работ. Оценки максимального правдоподобия (ОМП) m # , #c и ξ# удовлетворяют уравнениям, которые можно записать в виде: *  2 + n    # X − ξ 1 j n−1 log 1 + m) − ψ m #− , (28.60a) = ψ (# #c

j=1

n−1

n 

*



log 1 +

j=1

 n   Xj − ξ# j=1

2

# c

Xj − ξ# #c

*

 1+

2 +−1

Xj − ξ# #c

=1−

1 , 2# m

(28.60b)

2 +−1 = 0.

(28.60c)

6. РАСПРЕДЕЛЕНИЯ ПИРСОНА ТИПА VII И ИХ МОДИФИКАЦИИ

341

Для больших n обычными методами получаются следующие аппроксимации:  −1   1 m+1 (1) (1) m− − ψ (m) − 2 n var(# m) ≈ ψ , (28.61a) m (2m − 1) (m − 1/2) − ψ (1) (m) c2 n var(#c) ≈  ≈

[(2m − 1)/(m + 1)] ψ (1) (m − 1/2) − ψ (1) (m) − 1/m2



2

ψ

(1)

(m + 1)c2 1 · , 2m − 1 1 − (m + 1) 1 m2 (2m − 1)  ψ (1) (m − 1/2) − ψ (1) (m) −1

(28.61b) 2

(m + 1)c n var(ξ#) ≈ ,

m(2m − 1) √ m+1 corr(# m, #c) =

, (1) m (2m − 1) ψ (m − 1/2) − ψ (1) (m)

corr(# m, ξ#) ≈ corr(#c, ξ#) ≈ 0.

(28.61c) (28.61d) (28.61e)

В этих формулах ψ (z) = (d/dz) log Γ(z), ψ (1) (z) = (d/dz)ψ ((z) и т. д. Taylor (1980) записывает эти формулы в терминах параметров k = 2m−1 и h = c2 (2m−1)−1. Формула (28.61c) также дает дисперсию ОМП параметра ξ при одном или обоих известных m и c. Асимптотические формулы для дисперсий и ковариаций ОМП параметров m и c одинаковы при известном и неизвестном ξ . При известном c  −1   1 n var (# m) ≈ ψ (1) m − ; (28.62) − ψ (1) (m) 2

Оценки m и ξ получаются решением уравнений (28.60a) и (28.60b) с заменой #c на c. Если известно m, то n var (#c) ≈ Формулы (28.62) и неизвестном ξ . Рассматриваемые неральные моменты c2 и ξ следующим характеристики

(m + 1)c2 . 2m − 1

(28.63)

(28.63) применимы как при известном, так и при параметры можно оценить, приравняв выборочные и гепервого, второго и четвертого порядков. Параметры m, образом выражаются через теоретические моментные 1 (5β2 − 9) , m= 2 β2 − 3 2μ β c2 = 2 2 , β2 − 3

ξ = μ1 .

(28.64)

Пусть m ! , !c, ξ! — оценки, получаемые заменой теоретических характеристик выборочными в правых частях (28.64). При больших n получаются следующие

342

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

формулы: n var (! m) ≈

 2 (m − 1)(2m − 5)(2m − 3)2 2m2 − 5m + 12) (2m − 7)−1 (2m − 9)−1 , 3

 1 n var (!c) ≈ c2 (m − 1)(2m − 3) 8m3 − 48m2 + 108m − 83 × 2

(28.65a)

×(2m − 5)−1 (2m − 7)−1 (2m − 9)−1 ,   ξ = c2 (2m − 3)−1 . n var !

(28.65b) (28.65c)

Отметим следующее: • уравнение (28.65c) является точным и справедливо как при известных (одном или обоих параметрах) c и m, так и при неизвестных; 1 • уравнения (28.65a) и (28.65b) неприменимы при m > 4 ; 2 • уравнения (28.65a) и (28.65b) справедливы как при известном ξ , так и при неизвестном. Если один из параметров m или c известен, то другой параметр (c или m соответственно) оценивается из уравнения var(X) = c2 (2m − 3)−1

(28.66)

заменой теоретической выборочной дисперсией. При больших n имеют место следующие приближенные формулы для оценок !c и m ! параметров m и c, получаемых из (28.64): n var(! m) ≈ (2m − 3)2 (m − 1)(2m − 5)−1 , −1

n var(!c) ≈ c (m − 1)(2m − 5) 2

.

(28.67a) (28.67b)

Оценкой параметра ξ может выступать медиана. Дисперсия такой оценки приближенно равна  2 c2 π Γ(m − 1/2) . (28.68) 4n

Γ(m)

Для m < 2.8 дисперсия медианы меньше, чем дисперсия среднего. (Среднее имеет бесконечную дисперсию при m  1.5). Отношение асимптотической дисперсии среднего к асимптотической дисперсии медианы убывает с возрастанием m и стремится к 0.637 (именно таково отношение для нормального распределения) при m → ∞. Fraser (1976) и Sprott (1980) рассматривают плотность −(λ +1)/2 (x − θ )2 pX (x; θ , σ ) ≈ 1 + , (28.69) 2 λσ

где λ  1 — заданная константа. Sprott (1980) получил оценку σ , рассматривая θ как мешающий параметр. Он применил метод относительного правдоподобия, максимизирующий Rm (θ1 ; X) = pX (X; θ ∗ )/pX (X; θ#), 

где θ1 — оцениваемый параметр и θ ∗ = θ1 , θ2∗ , θ3∗ , . . . , θn∗ — суженная оценка максимального правдоподобия параметра θ ∗ = (θ1 , θ2 , . . . , θn ),

343

6. РАСПРЕДЕЛЕНИЯ ПИРСОНА ТИПА VII И ИХ МОДИФИКАЦИИ

  а θ# = θ#1 , # θ2 , . . . , # θn — безусловная ОМП. Borwein and Gabor (1984) исследовали ОМП параметра σ в этой модели. Это распределение возникает в следующей модели байесовского анализа. Пусть X1 , X2 , . . . , Xn — случайные величины, нормально распределенные по закону N(θ , σ ) с неизвестными θ и σ 2 . Функция правдоподобия относительно θ , проинтегрированная по безынформативному априорному распределению σ 2 , а именно σ −2 dσ 2 (можно также использовать собственное гаммараспределение) имеет вид  −n/2 √ nKn−1 n(θ − X)2 , (28.70) 1+ f (X − θ ) = 2 (n − 1)S

S

где X и S2 — обычные выборочные среднее и дисперсия, и

" −1 Kj = Γ[(j + 1)/2] jπ Γ(j/2) [см. Fan and Berger (1992) и Gambino and Guttman (1984) (и другие статьи), где рассматриваются дополнительные детали]. McDonald and Newey (1988) и Butler et al. (1990) рассматривают плотность pY (y; σ , p, q) =

1/p

2σ q



−1

B p

p  q+p−1 ,

, q 1 + |y|p / qσ p

(28.71)

√ называемую GT-распределением. При p = 2 и σ = α 2 (28.71) превращается в t-распределение с 2q степенями свободы. Здесь σ — параметр масштаба, p и q определяют форму плотности. Б´oльшим значениям p и q соответствуют более «легкие» хвосты распределения. Момент порядка h величины Y существует, если h < pq, и равен     Γ (1 + h)p−1 Γ q − hp−1   . E[Y h ] = σ h qh/p Γ p−1 Γ (q)

(28.72)

В более ранней работе McDonald and Butler (1987) рассмотрели распределение logt [LT(y; μ , σ , q)] с плотностью " −1 B(q, 1/2)y 2qσ 2 pY (y; μ , σ , q) =  1  q+ 12 , 1 + (log y − μ )2 2qσ 2 

y > 0,

(28.73)

и показали, что оно является смесью логнормального и обратного гаммараспределений. Об этом см. также [Hogg and Klugman (1983)]. Аналогичный результат имеет место для GT-распределений, которые являются смесью распределения Субботина с плотностью  ν  (28.74) pe−(|y|/σ ) / 2σ Γ(p−1 ) [см. (24.83)’] с обратным обобщенным гамма-распределением [Butler et al. (1990)]. Этот результат применяется в байесовском анализе.

344

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Плотность обратного обобщенного гамма-распределения [IGG(y; −α , β , q)] равна |a|(β /y)ap+1 e−(β /y) pY (y; a, β , q) = β Γ(p)

a

(28.75)

(см. гл. 17). [Напомним, что соотношение между обобщенным гамма-распределением с плотностью |a|(y/β )ap−1 e−(y/β ) , β Γ(p) a

y  0,

обозначаемым GG(y; α , β , q), и обратным обобщенным гамма-распределением IGG(y; α , β , q) выражается формулой IGG(y; a, β , p) ≡ GG(y; −a, β , p). ] Vaughan (1992) применил метод оценивания Tiku—Suresh (1992) для семейства обобщенных распределений Стьюдента −p 1 (x − θ )2  1+  (28.76) pX (x) = 2 σ k1/2 B

1 1 ,p − 2 2



[ср. с (28.69)] при p, k и σ > 0. При p  2 имеет место соотношение k = 2p−3, а при 1  p  2 — равенство k = 1. При p = 1 получается распределение Коши. При известном p уравнения правдоподобия суть n ∂ log L 2p  = g(Zi ) = 0 ∂θ kσ

(28.77a)

i=1

и n n  ∂ log L n kσ n 2p  = (2p − 1) − 2p = + Zi g(Zi ) = 0, ∂σ σ σ kσ kσ 2 + (Xi − θ )2 i=1 i=1

(28.77b)

 −1 . Они не решаются явно, если где Zi = (Xi − θ )/σ и g(z) = z 1 + z2 /k только p = ∞. Tiku and Suresh (1992) и Vaugham (1992) предложили итеративный метод решения уравнений (28.77a) и (28.77b). Если среди n выборочных значений не более половины совпадают, то, как показал Vaugham (1992), существует един# ) системы (28.77a), (28.77b), доставляющее максимум ственное решение (θ#, σ функции правдоподобия. Модификация метода максимального правдоподобия для получения тех же оценок предложена в работе Tiku and Suresh (1992). Они записывают  те

же уравнения в терминах порядковых статистик Xi . Пусть Zi = Xi − θ /σ . Тогда n ∂ log L 2p  = g(Zi ) = 0 (28.78a) ∂θ



i=1

345

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

и

n ∂ log L n 2p   = + Zi g(Zi ) = 0. ∂σ σ kσ

(28.78b)

i=1

∂ log L

Авторы линеаризируют , используя первые члены тэйлоровского раз∂θ ложения: 

 d g(z) = αi + βi Zi , (28.79) g(Zi ) ≈ g(ζi ) + Zi − ζi dz

z=ζi

где ζi = E[Zi ],

αi = 

(2/k)ζi3

1 + (1/k)ζi2

2 ,

1 − (1/k)ζi2 2 , 1 + (1/k)ζi2

βi = 

Заметим, что в силу симметрии распределения

n $

i = 1, . . . , n.

ai = 0. Подставив (28.79)

i=1

в (28.78) и решив полученную систему, авторы получили модифицированные ОМП: ( n )−1  n   #∗ = θ βi Xi βi , (28.80a) i=1

i=1

  √ B + B2 + 4nC #∗ = √ σ , 2 n(n − 1)

(28.80b)

где B=

n 2p  αi Xi , k i=1

C=

k  2 2p  #∗ . βi Xi − θ k i=1

√ # ∗ число n заменено на n(n − 1), Отметим, что в знаменателе выражения для σ чтобы устранить смещение. Если g(z) линейно по z, то полученная оценка — это обычная ОМП. Оценка (28.80b) может иногда давать отрицательное значение σ . Подробный анализ этих оценок приводится в статье Vaughan (1992), где также рассмотрены усеченные выборки.

7.

Другие распределения, связанные с t-распределением

Мы уже писали, что распределение tν2 совпадает с распределением F с 1, ν степенями свободы. Учитывая симметрию tν2 -распределения относительно нуля, имеем:  √  Pr[F1,ν < K] = Pr[tν2 < K] = Pr |tν | < K (28.81) и, следовательно,

" F1,ν,α = tν,(1+α )/2 .

346

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Другие соотношения между t- и F-распределениями описаны в гл. 27. Psarakis and Panaretos (1990) рассмотрели случайную величину W = |tν |, распределение которой они назвали кратным t-распределением. Математическое ожидание и дисперсия суть 6

 ν Γ (ν + 1)/2 , ν > 1, (28.82a) E[W] = 2 π Γ(ν /2)(ν − 1)

4ν ν var(W) = ν − 2 π (ν − 1)2



 2 Γ (ν + 1)/2 , Γ(ν /2)

ν > 2.

(28.82b)

Авторы показали, что предельным при ν → ∞ является кратное стандартное нормальное распределение (см. гл. 13, п. 10.3) с плотностью   2 2 2 2 1 √ e−(x−μ ) /(2σ ) + e−(x+μ ) /(2σ ) , x > 0. 2πσ

Кратное t-распределение связано с хи-распределением, а именно, имеет место соотношение W=

ν −1/2 X , Y

(28.83)

где X и Y — независимые случайные величины, имеющие хи-распределения с 1 и ν степенями свободы соответственно. Случайная величина W с одной степенью свободы имеет стандартное распределение Коши, свернутое на положительную полуось. Если X имеет  1 √ 1/2 ν X − X −1/2 распределено распределение Fν,ν , то (как замечено в п. 1) 2  1 √  1/2 по закону tν и, следовательно, ν X − X −1/2  имеет модальное t-распре2 деление с ν степенями свободы. Psarakis and Panaretos (1990) табулировали значения функции распределения FW (w) для w = 0.0 (0.1) 6.0 и ν = 1 (1) 5, 10 и 20. Существует √ много псевдо t-распределений, получающихся заменой знаменателя χν / n дроби U √ tν = χν / ν

не зависящей от U случайной величиной с другим распределением. Это соот √ ветствует замене S в n X − ξ /S другой выборочной характеристикой разброса, например, размахом выборки 1 , X2 , . . . , Xn ) − min(X1 , X2 , . . . , Xn )  $n max(X или средним отклонением n−1 j=1 Xj − X . Последние статистики имеют общее свойство, состоящее в том, что они распределены как σ T, где T — случайная величина, соответствующая σ = 1. Следовательно, отношение распределено как U/T и не зависит от значения σ [см., например, Pillai (1951)]. Использование статистик указанного√ типа описано в гл. 13. Если распределение знаменателя близко к cχν / ν , то распределение дроби близко к c−1 tν . Часто ν является дробным, тогда при использовании обычных таблиц, где приводятся значения только для целых ν , необходимо интерполировать; исключение составляют лишь таблицы Mardia and Zemroch (1978). Можно также использовать приближенные формулы.

347

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

Birnbaum and Vincze (1970) изучили распределение статистики T∗ =

 Xm+1 −μ   Xm+1+r − Xm+1−r

(28.84)

из популяции с произвольным непрерывным распределением. Здесь   1 μ = inf x : F(x) = 2

— медиана генеральной совокупности, r — целое, 1  r  m, объем выборки  — выборочная медиана. 2m + 1 и Xm+1 Статистика T ∗ аналогична t-статистике. Знаменатель (выборочный интерквартильный размах) является оценкой параметра масштаба (популяционного интерквартильного размаха). Статистика инвариантна относительно линейного преобразования и нуждается только в трех порядковых статистиках для вычислениях ее значения. При слабых аналитических ограничениях — непрерывность pX (x) и pX (μ ) = 0 — предельное распределение T ∗ при фиксированном r есть *6 + ∞  2 ∗ 1 lim Pr T s = ϕ (zs)z2r−1 e−z dz, (28.85) (2r − 1)!

m

m→∞

0

где ϕ (·) — стандартная нормальная плотность. По результатам моделирования Tague (1969) составил таблицы вероятности Pr[T ∗ > t] для нормальной популяции для m = 1 (1) 10, r = 1 (1) m и t = 0.0 (0.1) 5. Thompson (1935) установил связь между распределением статистики (Xj − X)/S , где Xj — случайно выбранное выборочное значение из X1 , . . . , Xn , и t-распределением. Полагая E[Xj ] = 0, var(Xj ) = 1 (что не влияет на распределение), получаем: n  2 

2 1 2 1 X3 − (X1 + X2 ) + . . . + Xj − X = X12 + (X2 − X1 )2 + j=1

2

3

2

 2 2 n−1 1 n X1 + . . . + Xn−1 Xn − X , =Y+ Xn − + n n−1 n−1 2

2 где Y и Xn − X независимы, и Y распределено как χn−1 . Следовательно, 

−1/2

√ 2 + U2 , где стандартная Xn − X /S распределено как (n − 1)/ n U χn−2   1 n

2 независимы, и, значит, имеет бета , − 1 нормальная величина U и χn−2 2 2

√ √ распределение на промежутке −(n − 1)/ n, (n − 1)/ n . Таким образом,

 Xn − X /S имеет распределение  −1/2 n−1 √ 2 √ n − 2tn−2 1 + (n − 2)tn−2 . (28.86)

n

Smith (1992) приводит остроумный вывод распределения t-статистики (28.1) $ в случае, если U и χν2 могут быть зависимы. Пусть χν2 = νi=1 Yi2 . Возьмем Z = (U, Y), имеющую многомерное нормальное распределение со средним 0 и матрицей ковариаций   1 V Σ = , V Iν (ν +1)×(ν +1)

348

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

где V есть ν ×1-вектор и Iν — единичная матрица порядка ν . Если V = 0, то U и χν2 независимы и t ∼ tν . Если V = 0, то определим w = V V  0 (так как |Σ | = 1 − w  0, w  1). Smith (1992) получил плотность в виде −(ν+1)/2

 Γ (ν + 1)/2 t2 pT (t) =  × 1+ ν (1 − w) Γ ν /2 {πν (1 − w)}1/2 ⎧  ⎫

 1 ⎪ ⎪ ⎪ ( ν + 1)/2 ∞ ⎨ ∞  ⎬  i+j ⎪ 2i+j  2 i+j w     × (−1)j × 1−w ⎪ 1 ⎪ 1 ⎪ ν i!j! i=0 j=0 ⎪ ⎩ ⎭ ×

2

t2 ν (1 − w)

i

i

2

i+j

t2 1+ ν (1 − w)

−(2i+j) ,

−∞ < t < ∞,

(28.87)

где (a)i = a(a + 1) · · · (a + i − 1). Расхождение между точными значениями Pr[T > tα ] и значениями t-распределения Стьюдента малы. Наибольшая относительная ошибка получается при малых ν , больших w и малых α . Для значений 1 − α , равных 10% и меньше, точные значения вероятности Pr[T > tα ] для зависимых величин меньше, чем, значения t-распределения. Поэтому использование стьюдентовых значений не приводит к большим ошибкам.  √ Перечислим работы, в которых распределение статистики n X − ξ /S изучается в случае одинаково распределенных X1 , X2 , . . . , Xn , имеющих распределение, отличное от нормального. Равномерное распределение рассматривается в работах Hotelling and Frankel (1938), Perlo (1933), Rider (1929, 1931), Rietz (1939), Siddiqui (1964), Watanabe (1960–1966) и Ali (1975, 1976). Экспоненциальное распределение рассматривается в работах Geary (1936) и Hoq, Ali and Templeton (1978). Распределение Коши и секанс гиперболический квадрат распределение рассматриваются в работах Bradley (1952) и Hotelling (1961). Разложения Эджворта рассматриваются в работах Bartlett (1935), Ghurye (1949), Gayen (1949, 1952), Tiku (1963) и Zackrisson (1959). Смесь нормальных распределений рассматривается в работах Hyrenius (1950) и Quensel (1943). Разные распределения (равномерное, Лапласа, χ 2 , бета-распределение) рассматриваются в работах Watanabe (1960 — 1966), Sansing (1976) и Sansing and Owen (1974). Устойчивые распределения рассматриваются в работе Logan et al. (1973). Для выборки объема 2 общую формулу для непрерывных порождающих t-распределений вывел Laderman (1939). Несколько точных формул получено для малых выборок (ν обычно 3 или 4). Для равномерной генеральной совокупности Siddiqui (1964) приводит границы функции распределения tν и числовые расчеты для ν  6. Hotelling (1961), используя геометрический метод, показал, что для равномерной популяции отношение Pr[T > t]

349

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

к соответствующей вероятности для нормального распределения при t → ∞ стремится к {π (ν + 1)}(ν +1)/2   . 1 ν +1 (ν + 3) 2 Γ 2

(28.88)

Для распределения Коши с плотностью π −1 (1 + x2 )−1 , предельное отношение равно   1 (ν +1)/2 [(ν + 1)/π ]

Γ

Γ



1 ν 2



2

(ν + 1)

.

(28.89)

Он получил также аналогичные результаты для распределения Пирсона типа II, экспоненциального распределения и двойного экспоненциального распределения (распределения Лапласа). Из наиболее интересных отметим общие результаты для распределений Эджворта. Результаты получены для любых n и показывают, что отличие от t-распределения Стьюдента, возможно, связано с отличием моментных отношений для нормальных смесей. Ghurye (1949) рассмотрел разложение " только до членов, содержащих β1 . Gayen (1949, 1952) включил следующие члены. Результаты Tiku (1963) соответствуют включению следующих членов разложения в распределение генеральной совокупности. Гайен (Gayen) вывел соотношение " (28.90) Pr[tν > t] = a − β1 P√ (t) − (β2 − 3)Pβ (t) + β1 Pβ (t), β1

2

1

где a — значение для нормальной популяции, и привел таблицы функций P(·). Таблица 28.16 воспроизводит часть его таблиц [см. также Chung (1946)]. Упомянем еще формулу [Bradley (1952, p. 21)] для случая популяции, распределенной по закону Коши, когда невозможно использовать моментные отношения как показатель отличия от нормальности. Формула дает значения Pr[tν  t] для t > 0 в виде разложения по степеням t−2 до члена t−6 .1) Ratcliffe (1968) приводит результаты эмпирического анализа распределения отношения t для пяти отличных от нормальных популяций, включая равномерное, экспоненциальное, гамма-распределение и распределение, имеющее форму U. Он изучает, в частности, уменьшение влияния отличия от нормальности при возрастании объема выборки. Автор делает вывод, что при объеме выборки 80 и больше эффект отклонения от нормальности (в частности, асимметрия) становится практически незаметным. Для симметричных распределений необходимый объем выборки значительно меньше. Теоретический анализ t-отношения для симметричного распределения общего вида содержится в работе Efron (1968).  √ Hoq, Ali and Templeton (1978) получили распределение T = n X − θ /S в случае экспоненциально распределенной популяции. При n = 2, 3 1) Во

всех упомянутых работах Xi предполагаются независимыми. Weibull (1958) рассмотрел случай нормальных сериально зависимых величин. — Прим. авторов.

350

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

1/2 и 4 получены явные выражения для t  (n − 1)(n − 2)/2 . Верхний хвост в случае экспоненциального распределения тяжелей, чем в случае нормальной популяции, однако для полунормальной популяции, т. е. при  1/2

1/2 2 exp −x2 /2 , x > 0, получается более тяжелый верхний pX (x) = π хвост, чем для экспоненциального распределения при всех t  n − 1. Хотя Hoq, Ali and Templeton (1978) сильно продвинулись, но явные распределения T для всех n в случае экспоненциального распределения пока не получены. Sansing and Owen (1974) рассмотрели случай стандартного двойного экспоненциального распределения (распределения Лапласа) (см. гл. 24) с плотностью 1 pX (x) = exp(−|x|). 2

Они показали, что плотность t-статистики (см. п. 1) по выборке объема n обладает свойством ( n )−n  |t + bn | . pT (t) ∝ j=1

Эта плотность удовлетворяет неравенствам ( n )−n  −n |t + bjn | < pT (t) < cn (n|t|) , cn

(28.91)

j=1

где cn =

bjn =

π (n−1)/2 Γ(n)  , √ 1 (n − 1) 2n−1 nΓ 2

"  " √ n−1 j(n − j) − (j − 1)(n − j + 1) .

Для далеких хвостов при |t| > n − 1 Sansing (1976) показал, что   n − 1 (n−1)/2 −(n−1) t . pT (t) = cn n

(28.92)

Теперь рассмотрим распределение и аппроксимацию разности двух стьюдентовых случайных величин. Эта разность играет большую роль в проблеме Беренса—Фишера (Behrens—Fisher). Ghosh (1975) показал, что при ν1 = ν2 = ν и Z = T1 − T2      1 1 ν+1 ∞ Γ i+ Γ ν+i+  2 2 2 Pr[0 < Z < z] =      2 1 √ 1 i=0 i!Γ ν+i+1 2ν π Γ ν 2 2 Γ



Он составил таблицы значений Pr[0 < Z < z] для z = 0.0 (0.5) 10.0;

ν = 1, 2 (2) 10

1 2 −1 4z ν



yi−(1/2)

(1 + y)(1/2)+ν +i 0

dy.

(28.93)

351

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

ТАБЛИЦА 28.16 Поправочные коэффициенты для распределения tν в случае популяции, отличной от нормальной (описываемой разложением Эджворта) t

Нормальная популяция

P√β (t) 1

Pβ2 (t)

Pβ1 (t)

0.0000 −0.0064 0.0000 0.0047 0.0064 0.0066 0.0064 0.0059 0.0055

0.0000 −0.0066 0.0044 0.0147 0.0188 0.0195 0.0188 0.0176 0.0163

0.0000 −0.0069 −0.0027 0.0025 0.0047 0.0051 0.0047 0.0041 0.0035

0.0000 −0.0066 0.0009 0.0118 0.0172 0.0179 0.0165 0.0145 0.0125

0.0000 −0.0062 −0.0034 0.0013 0.0035 0.0039 0.0034 0.0028 0.0023

0.0000 −0.0056 −0.0002 0.0098 0.0152 0.0157 0.0139 0.0114 0.0093

0.0000 −0.0055 −0.0036 0.0006 0.0028 0.0031 0.0027 0.0021 0.0016

0.0000 −0.0047 −0.0005 0.0084 0.0135 0.0139 0.0119 0.0095 0.0072

ν=1

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3524 0.2500 0.1872 0.1476 0.1211 0.1024 0.0886 0.0780

0.0470 0.0589 0.0665 0.0622 0.0547 0.0476 0.0416 0.0368 0.0329

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3333 0.2113 0.1362 0.0918 0.0648 0.0477 0.0364 0.0286

0.0384 0.0495 0.0597 0.0563 0.0469 0.0375 0.0298 0.0239 0.0194

ν=2

ν=3

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3257 0.1955 0.1153 0.0697 0.0439 0.0288 0.0197 0.0137

0.0322 0.0431 0.0540 0.0513 0.0413 0.0310 0.0229 0.0169 0.0126

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3217 0.1870 0.1040 0.0581 0.0334 0.0200 0.0124 0.0081

0.0297 0.0387 0.0495 0.0473 0.0372 0.0266 0.0184 0.0127 0.0088

ν=4

352

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.16 (продолжение) t

Нормальная популяция

P√β (t)

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3192 0.1816 0.0970 0.0510 0.0272 0.0150 0.0086 0.0052

0.0271 0.0355 0.0397 0.0440 0.0340 0.0234 0.0154 0.0099 0.0065

1

Pβ2 (t)

Pβ1 (t)

0.0000 −0.0049 −0.0035 0.0002 0.0022 0.0025 0.0021 0.0016 0.0011

0.0000 −0.0041 −0.0005 0.0074 0.0122 0.0125 0.0104 0.0079 0.0057

0.0000 −0.0044 −0.0033 0.0000 0.0019 0.0021 0.0017 0.0012 0.0008

0.0000 −0.0035 −0.0005 0.0066 0.0111 0.0113 0.0092 0.0067 0.0047

0.0000 −0.0037 −0.0030 −0.0002 0.0014 0.0016 0.0013 0.0008 0.0005

0.0000 −0.0028 −0.0005 −0.0055 0.0094 0.0095 0.0074 0.0051 0.0033

0.0000 −0.0027 −0.0023 −0.0004 0.0009 0.0011 0.0008 0.0005 0.0003

0.0000 −0.0019 −0.0002 0.0042 0.0073 0.0072 0.0053 0.0033 0.0019

ν=5

ν=6

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3174 0.1780 0.0921 0.0462 0.0233 0.0120 0.0064 0.0036

0.0251 0.0329 0.0430 0.0413 0.0315 0.0210 0.0132 0.0081 0.0050

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3153 0.1733 0.0860 0.0403 0.0185 0.0085 0.0040 0.0020

0.0222 0.0291 0.0384 0.0371 0.0277 0.0177 0.0103 0.0058 0.0032

ν=8

ν = 12

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3131 0.1685 0.0797 0.0343 0.0140 0.0055 0.0022 0.0009

0.0184 0.0243 0.0325 0.0315 0.0230 0.0137 0.0072 0.0036 0.0017

353

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

ТАБЛИЦА 28.16 (окончание) t

P√β (t)

Нормальная популяция

1

Pβ2 (t)

Pβ1 (t)

0.0000 −0.0015 −0.0014 −0.0003 0.0004 0.0005 0.0003 0.0002 0.0001

0.0000 −0.0010 −0.0001 0.0025 0.0043 0.0041 0.0028 0.0015 0.0007

ν = 24

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3101 0.1636 0.0733 0.0285 0.0098 0.0031 0.0009 0.0003

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.5000 0.3085 0.1587 0.0668 0.0228 0.0062 0.0013 0.0002 0.0000

0.0133 0.0176 0.0238 0.0232 0.0164 0.0090 0.0041 0.0016 0.0006 ν=∞

и для z = 0.0 (0.5) 7.5;

ν = 1 (1) 20.

Guenther (1975) заметил, что (28.93) можно записать в виде ∞    1 Pr[0 < Z < z] = Ci Pr F2i+1,2ν  (2i + 1)−1 z2 , 2

i=0

где

(28.93)

     i+1 2 ν+1 Γ Γ 2 2 Ci =     . 1 ν i!2π Γ Γ ν+i+1 2 2

Коэффициенты Ci вычисляются рекуррентно: Ci =

(2i − 1)2 Ci−1 , 2i(ν + 2i)

i  1.

Эти вычисления можно провести на калькуляторе. Chaubey and Mudholkar (1982) отметили, что если F1 (x) и F2 (x) — распределения, симметричные относительно нуля и имеющие второй момент, равный 1, то смесь (28.94) F(x) = λ F1 (x) + (1 − λ )F2 (x)

354

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

обладает тем же свойством. Величина 6 ν1 D = (T1 − T2 ) + ν1 − 2

" ν2 = (T1 − T2 ) Q ν2 − 2

распределена симметрично относительно нуля и имеет единичную дисперсию. Для аппроксимации Z = T1 −T2 авторы взяли F1 (x) = Φ(x), а в качестве F2 (x) — стандартизированную симметричную"функцию распределения с б´oльшим эксцессом, конкретно, распределение ν /(ν − 2)tν . Приравнивание 4-го и 6-го семиинвариантов смеси F1 (x) и F2 (x) соответствующим семиинвариантам величины Z приводит к следующим значениям ν и λ : λ = 1 − (ν − 4)R,

ν = 6 + R/S;

(28.95)

где R = (A1 + A2 )/Q2 , S = (B1 + B2 )/Q3 ,

−2 −1 2 Aj = νj − 2 νj − 4 νj ,

−3 −1  νj − 4 νj − 6 νj3 , Bj = νj − 2

j = 1, 2.

Тогда получаем:

 "  Pr[D  d] = Pr D∗ < d/ Q = λ F1 (d∗ ) + (1 − λ )F2 (d∗ ), √ где d∗ = d/ Q. Если F1 (x) и F2 (x) не слишком различны, то предлагается следующая аппроксимация 100α %-й точки Dα распределения D: " Dα ≈ {λ X1 (α ) + (1 − λ )X2 (α )} Q, где X1 (α ) = F1−1 (α ) и X2 (α ) = F2−1 (α ) — верхние 100α %-е точки F1 (x) (= Φ(x)) и F2 (x) соответственно. Явное выражение есть 6  6 Dα ≈

λ Uα + (1 − λ )tν,α

ν−2 ν

ν1 ν2 + , ν1 − 2 ν2 − 2

(28.96)

где Uα = Φ−1 (α ), а ν , λ даются формулой (28.95). Используя преобразование, предложенное в работе Wallace (1959), tν аппроксимируем величиной    1/2 2 1 8ν + 3 ∗ U −1 , (28.97) tν ≈ ν exp ν

8ν + 1

где U — стандартная нормальная случайная величина. Вычисления показывают, что потеря точности от замены tν на tν∗ невелика. Таким образом, (28.98) Pr[D  d] ≈ λ Φ(d∗ ) + (1 − λ )Φ(d∗∗ ), @

где ∗

d =d d∗∗ =

ν1 ν2 + ν1 − 2 ν2 − 2



8ν + 1 ν log 8ν + 3



1+

1/2

d∗2 ν−2

,  .

355

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

Числовые расчеты показывают, что аппроксимация Chaube and Mudholkar (1983) значительно точнее, чем аппроксимация Patil (1965). Например, при ν1 = ν2 = 10 и α = 0.99 точное значение dα = 3.807, смесь дает значение 3.815, а приближение Пейтила — значение 3.940. При ν1 = ν2 = 20 и α = 0.99 соответствующие значения суть 3.526, 3.527 и 3.585. Ghosh (1975), получивший точное распределение D, предложил аппроксимацию  √      √  dϕ d/ 2 1 1 1 1 √ Pr[D  d] = Φ d/ 2 − Q1 (d) + 2 Q2 (d) + 3 Q3 (d) + O 4 , ν2

32 2

ν2

ν2

ν2

(28.99) где Q1 (d) = (1 + θ )(d2 + 10),  θ 6  1 + θ2 6 3d + 98d4 + 620d2 + 168 + d − 10d4 + 36d2 − 456 , Q2 (d) = 384 64  1 + θ 3 10 8 6 d + 66d + 1016d − 1296d4 − 65328d2 − 141408 + Q3 (d) = 24576  θ (1 + θ ) 10 3d − 58d8 − 280d6 + 6864d4 − 70032d2 + 122592 + 24576

и

θ = ν2 /ν1 .

Обращение (28.99) дает    √ 1 1 1 1 dα = Uα 2 1 + R1 (Uα ) + 2 R2 (Uα ) + 3 R3 (Uα ) + O 4 , ν2

ν2

ν2

ν2

(28.100)

где Uα удовлетворяет равенству Φ(Uα ) = α ,  1+θ 2 t +5 . R1 (t) =

16 1 + θ2 R2 (t) = 1536 1 + θ3 R3 (t) = 8192



  θ 4 37t4 + 200t2 + 171 − 9t − 24t2 + 7 , 256

 θ (1 + θ )  81t6 + 349t4 − 293t2 − 1153 − 231t6 − 773t4 − 499t2 + 2871 . 24576

Приближения Chaubey and Mudholkar (1982) и Ghosh (1975) имеют одинаковую точность, однако первое заметно проще, особенно при использовании преобразования Уоллеса (Wallace); это иллюстрирует табл. 28.17. Распределение линейной функции вида a1 T1 − a2 T2 , где a1 и a2 положительны, T1 и T2 — независимые случайные величины, распределенные по законам tν1 и tν2 соответственно, изучалось в связи с проверкой гипотезы о равенстве средних двух нормальных популяций, если нет оснований считать равными их дисперсии. Такой подход предложен в работе Behrens (1929) и затем изучен в статьях Fisher (1935, 1941). Эта задача носит название проблемы Беренса—Фишера. Пусть Xj1 , Xj2 , . . . , Xjn , j = 1, 2 — независимые нормальные случайные величины со средними ξj и стандартными отклонениями σj , j = 1, 2. Тогда

356

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.17 Сравнение аппроксимаций величины Dα (ν1 = ν2 ) ν1 = ν2

10

15

20

α

0.55 0.75 0.90 0.95 0.99 0.55 0.75 0.90 0.95 0.99 0.55 0.75 0.90 0.95 0.99

Аппроксимации Dα

Точное значение

0.1892 1.022 0.978 2.581 3.807 0.1583 0.9988 1.919 2.489 3.616 0.1834 0.9872 1.891 2.445 3.526

(1)

(2)

(3)

(4)

0.1892 1.022 1.979 2.582 3.815 0.1853 0.9987 1.919 2.489 3.616 0.1834 0.9872 1.891 2.446 3.527

0.1885 1.020 1.979 2.586 3.820 0.1852 0.9984 1.919 2.490 3.617 0.1833 0.9871 1.891 2.446 3.527

0.1798 0.9776 1.926 2.554 3.940 0.1796 0.9719 1.890 2.476 3.697 0.1793 0.9683 1.871 2.438 3.585

0.1892 1.022 1.978 2.581 3.814 0.1853 0.9988 1.919 2.489 3.616 0.1834 0.9873 1.891 2.446 3.526

Примечание. (1) Смесь распределений [Chaubey—Mudholkar (1982)] (28.96); (2) То же, но с использованием преобразования Уоллеса (28.98); (3) Patil (1965); (4) Ghosh (1975) (28.99).

 √ nj X j − ξj /Sj , j = 1, 2, распределены как tnj −1 (в обозначениях п. 1). В соответствии с одним из вариантов теории фидуциальных распределений (гл. 13, п. 8) из того, что

 √ nj Xj − ξj S j

распределено как tnj −1 , следует, что фидуциальное распределение ξj совпадает с распределением    S X j − √ j tnj −1 nj



(X и S j рассматриваются как фиксированные). Формально можно считать, что ξ1 − ξ2 имеет фидуциальное распределение, совпадающее с распределением        S1 S X2 − X1 + tn1 −1 − √ 2 tn2 −1 . (28.101) √ n1

n2

Критерий Беренса—Фишера отвергает гипотезу ξ1 = ξ2 на уровне значимости α , если, (в соответствии с фидуциальным распределением) Pr[ξ2 − ξ1 < 0]
0]
4.

(28.103)

Эти значения c и f обеспечивают совпадение первых четырех моментов распределений. Такая аппроксимация точна, если cos θ = 1 или sin θ = 1 и дает удовлетворительные результаты в средней части распределения: при |Dθ | < 5 даже при малых ν1 и ν2 , равных 7. Аппроксимация дает хорошие

358

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

результаты при любых ν , не меньших 24. Относительная ошибка велика на далеких хвостах распределения. Weir (1960b) предложил аппроксимацию верхних процентных точек для близкой статистики, заметив, что верхние 2.5%-е точки статистики X1 − X2



(n1 − 1)S12 /{(n1 − 3)n1 } + (n2 − 1)S22 /{(n2 − 3)n2 }

лежат между 1.96 и 2, если n1  6 и n2  6 (α = 0.975). −1  2 2 Welch (1938) предложил аппроксимировать распределение n−1 1 S 1 + n2 S 2 2 распределением cχν , где   −1  2 −1 2 2 2 S + n S (28.104a) = n−1 cν = E n−1 1 2 1 2 1 σ1 + n2 σ2 ,   −1  2 −2 −2 2 −1 4 −1 4 2c2 ν = var n−1 1 S 1 + n2 S 2 = 2n1 (n1 − 1) σ1 + 2n2 (n2 − 1) σ2 , (28.104b) т. е. c=

−2 −1 4 4 n−2 1 (n1 − 1) σ1 + n2 (n2 − 1)σ2

ν=

−1 2 2 n−1 1 σ1 + n2 σ2  2 −1 2 2 n−1 1 σ1 + n2 σ2

−2 4 4 n−2 1 (n1 − 1)σ1 + n2 (n2 − 1)σ2

,

.

−1/2

 −1  2 2 близко к распределению Тогда распределение X 1 − X 2 n−1 1 S 1 + n2 S 2 U

−1 2 2 n−1 1 σ1 + n2 σ2 √ √  = tν , cν xν / ν

−1 2 2 так как cν = n−1 1 σ1 +n2 σ2 . Работу в этом направлении продолжил Aspin (1948), составивший затем таблицы [Aspin (1949)], из которых можно получить точные значения вероятностей [см. также Welch (1949)]. Rahman and Saleh (1974) вывели точное распределение Dθ при всех комбинациях ν1 и ν2 . Полученные выражения весьма громоздки. В частном случае ν1 = ν2 = ν



B

pD (d) =

   1 1 1 (ν + 1), (ν + 1) Γ ν + 2 2 2 cosec θ ctgν θ ×   2 √ 1 νπ Γ ν 2

  1 1 1 −d2 × 2 F1 ν + , (ν + 1); ν + 1; , 2 2 2

2

ν sin θ

(28.105)

где 2 F1 (·, ·; ·; ·) — гауссова гипергеометрическая функция [гл. 1, формула (1.104)]. Rahman and Saleh (1974) приводят 97.5%-е и 95%-е точки распределения Dθ при ν1 = 6 (1) 15 и ν2 = 6 (1) 9. Числовые значения получаются с использованием

359

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ

вычислений функции Аппеля (Appel) и использовании метода Гаусса квадратичного численного интегрирования. Заметим, что Behrens (1929) приводит квадратурную формулу для распределения Dθ при различных числах степеней свободы. Fisher (1935) подтвердил и обобщил этот результат Беренса. Позже Fisher and Healy (1956) получили точное распределение Dθ для небольших нечетных значений числа степеней свободы. Molenaar (1977) предложил следующие две аппроксимации для Pr [a1 t1 − a2 t2  d]. Пусть 5  ν1  ν2 (случай ν1 > ν2 получается по симметрии, ν1 < 5 не рассматривается). Метод U. В качестве приближения указанной вероятности берется Φ(u), где Φ — стандартная нормальная функция распределения, и u = d/(ω1 + ω2 )1/2 , ωi =

a2i νi , i = 1, 2. νi − 2

Метод V. В качестве приближенного значения берется Φ(v), где ⎫ ⎧  ⎨ log 1 + t2 /f  ⎬1/2 2 1 v = sgn(t) f − + , 3 10f ⎩ f − 5/6 ⎭ (ω1 + ω2 )2 f =4+ 2 и t=d ω1 /(ν1 − 4) + ω22 /(ν2 − 4)

 −1/2 2 1− (ω1 + ω1 )−1/2 . f

Это, по существу, упрощенный метод Пейтила (Patil). Добавим еще Метод W — точное вычисление. Molenaar (1977) рекомендует использовать следующую таблицу. Максимальная абсолютная погрешность не более

0.01 0.005 0.002 0.001 0.0005 0.0002 0.0001

Рекомендуемый метод

U U U U U U U

при при при при при при при

ν1 ν1 ν1 ν1 ν1 ν1 ν1

 16  30  72  140  273  680  1310

V V V V V V V

при при при при при при при

6  ν1  15 7  ν1  29 9  ν1  71 12  ν1  139 16  ν1  172 23  ν1  679 32  ν1  1309

W W W W W W W

при при при при при при при

ν1 = 5 ν1 = 6 6  ν1  8 7  ν1  11 9  ν1  15 14  ν1  22 19  ν1  31

Ошибка метода U слабо зависит от параметров. Наибольшая ошибка получается, если вероятности находятся между 0.20 и 0.25 и между 0.75 и 0.80. Вторичные локальные максимумы близки к вероятностям 0.01 и 0.99 соответственно. Для метода V наибольшие отклонения получаются для вероятностей, находящихся между 0.72 и 0.75 и между 0.25 и 0.28, а вторичные максимумы и минимумы — в окрестности 0.01 — 0.02 и 0.95 — 0.99.

360

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Nel, van der Merwe and Moser (1990) рассмотрели задачу Беренса—Фишера и нашли точное распределение величины X1 − X2

T=

 2 1/2

−1   n−1 1 S 1 + n2 S 2 2

.

Это распределение является обобщением нецентрального F-распределения, $k которое рассматривается в гл. 30. Hajek (1962) показал, что, если j=1 λj = 1 и * k +−1/2  T=U λj χν2j νj−1 , j=1

где U — стандартная нормальная случайная величина, и величины U и χν2j независимы в совокупности, то при t  0  t значение Pr[t  T < t ] лежит между Pr[t  tν < t ] и Pr[t  tm < t ], где tm имеет нормальное $k распределение, m = j=1 νj и ν — произвольное целое, не превосходящее

 min νj /λj . Wallgren (1980) исследовал распределение отношения W=

XY , S2

(28.106)

где случайная величина (X, Y) имеет двумерное нормальное распределение [см. гл. 32, формула (32.2)], ν S2 /σ 2 имеет распределение χν2 [см. гл. 18, формула (18.5)] и двумерная случайная величина (X, Y) и случайная величина S независимы. Пусть (28.107) E[X] = ξ , E[Y] = η, var(X) = var(Y) = σ 2 , corr(X, Y) = ρ. В частном случае, когда ρ = 0 (X и Y независимы) и ξ = η = 0, задача исследована в работе Harter (1951). В общем случае W распределено как произведение двух коррелированных нецентральных t-распределенных случайных величин (см. гл. 31):   X ξ ], [распределено как tν W1 = S σ (28.108)   Y η W2 = [распределено как tν ]. σ

S

Если ξ = η = 0, то W1 и W2 коррелированы и каждая имеет tν -распределение. В этом случае Wallgren (1980) получил следующее выражение для функции распределения W: 0 при w < 0 Qν (θ ; ρ, w)dθ , (28.109a) FW (w) = ε1

где



α−π α

при ρ < 0, при ρ > 0,

  α = arctg −(1 − ρ2 )1/2 /ρ ,

0  α  π, 1/2 1

Qν (θ ; ρ, w) = ; {ν sin θ sin(θ + arccos ρ)} {w + ν sin θ sin(θ + arccos ρ)}

ε1 =

при w > 0

π

FW (w) = 1 −

 ε2 0

Qν (θ ; ρ, w)dθ ,

(28.109b)

361

7. ДРУГИЕ РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С T -РАСПРЕДЕЛЕНИЕМ



где ε2 =

α α+π

при ρ < 0, при ρ > 0.

Roy, Roy and Ali (1993) рассмотрели биномиальную смесь t-распределений с плотностью n 

n pr (1 − p)n−r x2r −∞ < x < ∞. pX (x|n, p, ν ) =  ((ν +1)/2)+r , r=0

r

  1 ν r+ 12 B r+ , ν 2 2

1+

x2 ν

Моменты X даются формулами:



E X 2k+1 = 0,    1 ν −k Γ r+k+ Γ 2 2 .     1 ν Γ r+ Γ 2 2 

n   

n r E X 2k = ν k p (1 − p)n−r r=0

r

В частности, E[X] = 0, var(X) =

  np2 (1 + 2n)(ν − 2) 2ν 1 ν−2 − . np + , β1 (X) = 0, β2 (X) = 3   ν−2 2 ν−4 1 2 np + (ν − 4) 2

McDonald and Newey (1988) ввели обобщенное t-распределение с плотностью pX (x|p, q) =

p , −∞ < x < ∞,  1 q+1/p 1/2 p , q (1 + |x| /q) 2q B p 

p, q > 0,

которое, как нетрудно видеть, включает (28.2), получающееся √ при p = 2, q = 2ν . (В действительности, это плотность распределения tν / 2). Приведенная формула включает как частный случай плотность показательно-степенного распределения, используемого в работе Box and Tiao (1962) [см. библиографию к гл. 24] или плотность распределения Субботина [(24.83)’, см. Subbotin (1923) в библиографии к гл. 24]:

 p  pe−|x| / 2Γ p−1 , −∞ < x < ∞, p > 0 при q → ∞. Обе плотности симметричны относительно нуля. Нечетные моменты равны нулю, а четные даются формулой ;   

k+1 k 1 B ,q . E X 2k = qk/p B ,q − p

p

p

Таблица 28.18, заимствованная из работы McDonald (1991), содержит коэффициенты эксцесса β2 (X) при некоторых p и q. McDonald (1984) показал, что обобщенное t-распределение является смесью обобщенного гамма-распределения и показательно-степенного распределения Бокса и Тиао (Box and Tiao). McDonald and Newey (1988) использовали обобщенное t-распределение для получения частично адаптивных оценок в регрессионных моделях, см. также

362

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 28.18 Значения эксцесса β2 для обобщенного t-распределения при некоторых значениях p и q q = 1.0 p = 0.5 1.0 1.5 2.0 3.0 5.0 10.0 50.0 100.0

4.28 2.07 1.81 1.80

2.0

5.0

4.11 2.38 1.94 1.81 1.80

36.0 6.68 4.00 2.72 2.15 1.90 1.81 1.80

10 635.0 10.3 4.68 3.38 2.54 2.11 1.89 1.80 1.80

50 35.8 6.53 3.90 3.06 2.44 2.08 1.89 1.80 1.80

100 29.8 6.25 3.83 3.03 2.43 2.07 1.88 1.80 1.80

∞ 25.2 6.00 3.76 3.00 2.42 2.07 1.88 1.80 1.80

McDonald and Nelson (1989). Butler et al. (1990) с помощью обобщенного t-распределения получают робастные оценки в регрессионных моделях. Также с помощью обобщенного t-распределения в работе McDonald (1989) рассматриваются частично адаптивные оценки в авторегрессионных моделях со скользящими средними при анализе временных рядов.

Список литературы Abramowitz, M., and Stcgun, I. A. (eds.) (1964). Handbook of Mathematical Functions with Formulas, Graphs and Mathematical Tables, Applied Mathematics Scries 55, National Bureau of Standards, Washington, D. C.: GPO 1) . Albert, J., Delampady, M., and Polarsk, W. (1991). A class of distributions for robustness studies, Journal of Statistical Planning and Inference, 28, 291–304. Ali, M. M. (1975). Tail distributions of «Student’s» ratio for t  n − 1 in samples of size n from rectangular distribution, Journal of Statistical Research, 9, 11–24. Ali, M. M. (1976). Tail distribution of «Student’s» ratio for t  (n − 2)/2 in samples of size n from rectangular distribution, Journal of Statistical Research, 10, 43–71. Amos, D. E. (1964). Representations of the central and non-central t distributions, Biometrika, 51, 451–458. Andersen, J. B., Lauritzcn, S. L., and Thommcsen, C. (1990). Distributions of phase derivatives in mobile communications, IEEE Proceedings, Microwaves, Antennas and Propagation, 137, 197–201. Angers, J.-F. (1992). Use of the Student-/ prior for the estimation of normal means: A computational approach. In Bayesian Statistics 4 (Eds., J. M. Bernardo, J. O. Berger, A. P. Dawid, and A. F. M. Smith), Oxford: Oxford University Press, √ pp. 567–575. Anscombc, F. J. (1950). Table of the hyperbolic transformation sinh−3 x, Journal of the Royal Statistical Society, Series A, 113, 228–229. Aspin, A. (1948). An examination and further development of a formula arising in the problem of comparing two mean values, Biometrika, 35, 88–96. Aspin, A. (1949). Tables for use in comparisons whose accuracy involves two variances, separately estimated, Biometrika, 36, 290–293. 1) Абрамовиц

М., Стиган И. Справочник по специальным функциям. — М.: Наука, 1979.

СПИСОК ЛИТЕРАТУРЫ

363

Babanin, B. V. (1952). Nomogram of basic statistical distributions and its application to some problems of sampling method, Academy of Sciences, USSR, Institute of Mechanics, Engineering Transactions, 11, 169–180 (In Russian). Bailey, B. J. R. (1980). Accurate normalizing transformations of a Student’s t-variate, Applied Statistics, 29, 304–306. Baldwin, E. M. (1946). Table of percentage points of the t-distribution, Biometrika, 33, 362. Bancrjec, S. K. (i957). A lower bound to the probability of Student’s ratio, Sankhy¯a, Series B, 19, 391–394. Bartlett, M. S. (1935). The effect of non-normality on the t distribution. Proceedings of Cambridge Philosophical Society, 31, 223–231. Behrcns, W. V. (1929). Ein Beitrag zur Fehlenbercchnung bei wenigen Beobachtungen, Landwirtschaftliche Jahrbucher, 68, 807–837. Bhattacharyya, A. (1952). On the uses of the t-distribution in multivariate analysis, Sankhy¯a, 12, 89–104. Birnbaum, Z. W. (1942). An inequality for Mills’ ratio, Annals of Mathematical Statistics, 13, 245–246. Birnbaum, Z. W. (1970). On a statistic similar to Student’s t, In Nonparametric Techniques in Statistical Inference (Ed., M. L. Puri), New York: Cambridge University Press, pp. 427–433. Birnbaum, Z. W., and Vincze, I. (1973). Limiting distributions of statistics similar to Student’s t, Annals of Statistics, 1, 958–967. Blattberg, R. C., and Gonedes, N. J. (1974). A comparison of the stable and Student distributions as statistical models for stock prices, Journal of Business, 47, 244–280. Bondesson, L. (1981). When is the t-statistic t-distributed? Statistical Research Report, University of Ume˚a, S-90187, Ume˚a, Sweden. Borwein, P., and Gabor, G. (1984). On the behavior of the MLE of the scale parameter of the Student family, Communications in Statistics— Theory and Methods, 13, 3047–3057. Box, J. F. (1981). Gosset, Fisher and the t distribution, The American Statistician, 35, 61–67. Bracken, J., and Schleifer, A., Jr. (1964). Tables for normal sampling with unknown variances: The Student distribution and economically optimum sampling plans, Division of Research, Harvard University. Bradley, R. A. (1952). The distribution of the t and F statistics for a class of non-normal populations, Virginia Journal of Sciences, 3, 1–32. Buehler, R. J., and Feddersen, A. P. (1963). Note on a conditional property of Student’s t, Annals of Mathematical Statistics, 34, 1098–1100. Bukaˇc, J., and Burstein, H. (1980). Approximations of Student’s t and chi-squared percentage points, Communications in Statistics— Simulation and Computation, 12, 665–672. Butler, R. J., McDonald, J. B., Nelson, R. D„ and White, S. B. (1990). Robust and partially adaptive estimation of regression models, Review of Economics and Statistics, 72, 321–326. Cacoullos, T. (1965). A relation between t and F distributions, Journal of the American Statistical Association, 60, 528–531 (Correction: 60, 1249). Chaubey, Y. P., and Mudholkar, G. S. (1982). Difference of two t-variables, Communication in Statistics— Theory and Methods, 11, 2335–2342. Cheng, S. W., and Fu, J. C. (1983). An algorithm to obtain the critical values of t, χ 2 and F distributions, Statistics & Probability Letters, 1, 223–227. Chu, J. T. (1956). Errors in normal approximations to the t, r, and similar types of distribution, Annals of Mathematical Statistics, 27, 780–789.

364

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Chung, K. L. (1946). The approximate distribution of Student’s statistic, Annals of Mathematical Statistics, 17, 447–465. Cornish, E. A. (1969). Fisher Memorial Lecture (37th Session, International Statistical Institute, London). Cotterman, T. E., and Knoop, P. A. (1968). Tables of limiting t values for probabilities to the nearest .001 (n = 2 − 16), Report AMRL-TR-67-161, Aerospace Medical Research Laboratories, Wright-Patterson Air Force Base, Dayton, OH. Cox, M. A. A. (1991). The implementation of functions to evaluate percentage points of the normal and Student’s t distributions on a spreadsheet, The Statistician, 40, 87–94. Cucconi, O. (1962). On a simple relation betwen the number of degrees of freedom and critical value of Student’s t, Memoire Accademia Patavina, 74, 179–187. Deming, W. E., and Birge, R. T. (1934). On the statistical theory of errors, Review of Modern Physics, 6, 119–161. Dickey, J. M. (1967). Expansions of t densities and related complete integrals, Annals of Mathematical Statistics, 38, 503–510. Dickey, J. M. (1976). A new representation of Student’s t as a function of independent t’s with a generalization to the matrix t, Journal of Multivariate Analysis, 6, 343–346. Efron, B. (1968). Student’s t-test under non-normal conditions, Technical Report No. 21, Harvard University, Department of Statistics. Eggers, P. C. F., and Andersen, J. B. (1989). Measurements of complex envelopes of mobile scenarios at 450 MHz, IEEE Transactions on Vehicular Technology, 38, 37–42. Eisenhart, C. (1979). On the transition from «Student’s» z to «Student’s t», The American Statistician, 33, 6–11. Elfving, G. (1955). An expansion principle for distribution functions, with application to Student’s statistic, Annales Academiae Scientiarum Fennicae, Series A, 204, 1–8. Epstein, B. (1977). Infinite divisibility of Student’s t-distribution, Sankhy¯a, Series B, 39, 103–120. Fan, T.-H., and Berger, J. O. (1992). Behavior of the posterior distribution and inferences for a normal mean with t prior distributions, Statistics and Decisions, 10, 99–120. Federighi, E. T. (1959). Extended tables of the percentage points of Student’s t-distribution, Journal of the American Statistical Association, 54, 683–688. Fisher, R. A. (1922). On the mathematical foundations of theoretical statistics, Philosophical Transactions of the Royal Society of London, Series A, 222, 309–368. Fisher, R. A. (1925a). Applications of «Student’s» distribution, Metron, 5, 90–104. Fisher, R. A. (1925b). Expansion of «Student’s» integral in powers of n−1 , Metron, 5, 109–112. Fisher, R. A. (1935). The mathematical distributions used in the common tests of significance, Econometrica, 3, 353–365. Fisher, R. A., (1941). The asymptotic approach to Behrens’ integral with further table for the d test of significance, Annals of Eugenics, 11, 141–172. Fisher, R. A., and Cornish, E. A. (1960). The percentile points of distribution having known cumulants, Technometrics, 2, 209–225. Fisher, R. A., and Healy, M. J. R. (1956). New tables of Behrens’ test of significance, Journal of the Royal Statistical Society, Series B, 18, 212–216. Fisher, R. A., and Yates, F. (1966). Statistical Tables for Biological, Agricultural and Medical Research, Edinburgh: Oliver and Boyd. Fraser, D. A. S. (1976). Necessary analysis and adaptive inference (with discussion), Journal of the American Statistical Association, 71, 99–113. Fujihara, R., and Park, K. (1990). The probability distribution of future prices in the foreign exchange market: A comparison of candidate processes, Journal of Futures Market, 10, 623–641.

СПИСОК ЛИТЕРАТУРЫ

365

Fujikoshi, Y., and Mukaihata, S. (1993). Approximations for the quantiles of Student’s t and F-distributions and their bounds, Hiroshima Mathematical Journal, 23, 557–564. Gambino, J., and Guttman, I. (1984). A Bayesian approach to prediction in the presence of spurious observation for several models, Communications in Statistics— Theory and Methods, 13, 791–812. Gardiner, D. A., and Bombay, B. F. (1965). An approximation to Student’s t, Technometrics, 7, 71–72. Gaver, D. P., and Kafadar, K. (1984). A retrievable recipe for inverse t, The American Statistician, 38, 308–311. Gayen, A. K. (1949). The distribution of «Student’s» t in random samples of any size drawn from non-normal universes, Biometrika, 36, 353–369. Gayen, A. K. (1952). The inverse hyperbolic sine transformation on Student’s t for non-normal samples, Sankhy¯a, 12, 105–108. Geary, R. C. (1936). The distribution of «Student’s» ratio for non-normal samples, Journal of the Royal Statistical Society, Series B, 3, 178–184. Gentleman, W. M., and Jenkins, M. A. (1968). An approximation for Student’s t distribution, Biometrika, 55, 571–572. Ghosh, B. K. (1975). On the distribution of the difference of two t-variables, Journal of the American Statistical Association, 70, 463–467. Ghurye, S. G. (1949). On the use of Student’s t-test in an asymmetrical population, Biometrika, 36, 426–430. Goldberg, H., and Levine, H. (1946). Approximate formulas for the percentage points and normalization of t and χ 2 , Annals of Mathematical Statistics, 17, 216–225. Grosswald, E. (1976a). The Student t-distribution for odd degrees of freedom is infinitely divisible, Annals of Probability, 4, 680–683. Grosswald, E. (1976b). The Student t-distribution for any degree of freedom is infinitely divisible, Zeitschrift fur Wahrscheinlichkeitstheorie und Verwandte Gebiete, 36, 103–109. Guenther, W. C. (1975). Desk calculations of probabilities for the distribution of the difference of two t-variables. Research paper No. S3, S-1975-540. College of Commerce and Industry, University of Wyoming, Laramie. Hajek, J. (1962). Inequalities for the generalized Student’s distribution and their applications, Selected Translations in Mathematical Statistics and Probability, vol. 2, American Mathematical Society: Providence, RI, pp. 63–74. Hald, A. (1952). Statistical Tables and Formulas, New York: Wiley. Harter, H. L. (1951). On the distribution of Wald’s classification statistic, Annals of Mathematical Statistics, 22, 58–67. Hartley, H. O., and Pearson, E. S. (1950). Table of the probability integral of the tdistribution, Biometrika, 37, 168–172. Hendricks, W. A. (1936). An approximation to «Student’s» distribution, Annals of Mathematical Statistics, 7, 210–221. Hill, G. W. (1969). Progress results on asymptotic approximations for Student’s ratio and chi-squared, Personal communication. Hill, G. W. (1970a). Algorithm 395: Student’s t approximation, Communications of the Association for Computing Machinery, 13, 617–619. Hill, G. W. (1970b). Algorithm 396: Student’s t-quantiles, Communications of the Assocation for Computing Machinery, 13, 619–620. Hill, G. W. (1970c). Student’s t quantiles, Communications of the Association for Computing Machinery, 13, 621–624. Hill, G. W. (1972). Reference Table: «Student’s» t-distribution quantiles to 20D. CSIRO, Australia, Division of Mathematical Statistics Technical Paper No. 35. Hill, G. W. (1981). Remark on algorithm 395, Student’s t distribution, Association for Computing Machinery, Transactions of Mathematical Software, 7, 247–249.

366

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Hill, G. W., and Davis, A. W. (1968). Generalized asymptotic expansions of Cornish-Fisher type, Annals of Mathematical Statistics, 39, 1264–1273. Hogg, R. V., and Klugman, S. A. (1983). On the estimation of long-tailed skewed distributions with actuarial data, Journal of Econometrics, 23, 91–102. Hoq, A. K. M. S., Ali, M. M., and Templeton, J. G. C. (1978). The distribution of Student’s ratio for samples from exponential population, Communications in Statistics— Theory and Methods, 7, 837–850. Hotelling, H. (1961). The behavior of some standard statistical test under non-standard conditions, Proceedings of the 4th Berkeley Symposium on Mathematical Statistics and Probability, 1, 319–359. Hotelling, H., and Frankel, L. R. (1938). The transformation of statistics to simplify their distribution, Annals of Mathematical Statistics, 9, 87–96. Hyrenius, H. (1950). Distribution of «Student»-Fisher t in samples from compound normal functions, Biometrika, 37, 429–442. Ifram, A. F. (1972). On the characteristic functions of the F and t distributions, Sankhy¯a, Series A, 32, 350–352. Isaacs, G. L„ Christ, D. E., Novick, M. R„ and Jackson, P. H. (1974). Tables for Bayesian Statisticians, Ames: Iowa State University. Ismail, M. E. H., and Kelker, D. H. (1976). The Bessel polynomials and the Student t distribution, SI AM Journal on Mathematical Analysis, 7, 82–91. James-Levy, G. E. (1956). A nomogram for the integral law of Student’s distribution, Teoriya Veroyatnostei i ee Primeneniya, 1, 271–274 (In Russian), (pp. 246–248 in English translation) 1) . Janko, J. (1958). Statisticke Tabulky, Prague 2) . Jeffreys, H. (1948). Theory of Probability, 2nd ed., Oxford: Clarendon. Kafadar, K„ and Tukey, J. W. (1988). A bidec t table, Journal of the American Statistical Association, 83, 523–529. Kennedy, W. J., and Gentle, J. E. (1980). Statistical Computing, New York: Dekker. Kitagawa, T. (1954–56). Some contributions to the design of sample surveys, Sankhy¯a, 14, 317–362; 17, 1–36. Koehler, K. J. (1983). A simple approximation for the percentiles of the t-distribution, Technometrics, 26, 103–106. Kotlarski, I. (1964). On bivariate random vectors where the quotient of their coordinates follows the Student’s distribution, Zeszyty Naukowe Politechniki Warszawskiej, 99, 207–220 (In Polish). Kramer, C. Y. (1966). Approximation to the cumulative t-distribution, Technometrics, 8, 358–359. Krish namoorthy, A. S. (1951). On the orthogonal polynomials associated with Student’s distribution, Sankhy¯a, 11, 37–44. Laderman, J. (1939). The distribution of "Student’s"ratio for samples of two items drawn from non-normal universes, Annals of Mathematical Statistics, 10, 376–379. Lampers, F. B., and Lauter, A. S. (1971). An extension of the table of the Student distribution, Journal of the American Statistical Association, 66, 503. Laumann, R. (1967). Tafeln der STUDENT-oder t-Vertedung, Deutsch-Franzo-Sisches Forschungsinstitut, Saint-Louis, Akt. N21/67. Lauritzen, S. L., Thommcsen, C., and Andersen, J. B. (1990). A stochastic model in mobile communication, Stochastic Processes and Their Applications, 36, 165–172. 1) Джеймс-Леви

Д. Е. Номограмма интегральной функции распределения Стьюдента. Теория вероятностей и ее применения. Т. 1. — С. 271–274. 2) Янко Ярослав. Математико-статистические таблицы / Пер. с чешского А. Ф. Маслова; под ред. А. М. Длина. — М.: Госстатиздат, 1961.

СПИСОК ЛИТЕРАТУРЫ

367

Lee, C. M.-S., and Singh, K. P. (1988). On the t cumulative probabilities, Communications in Statistics— Simulation and Computation, 17, 129–135. Ling, R. F. (1978). A study of the accuracy of some approximations for t, χ 2 , and F tail probabilities, Journal of the American Statistical Association, 73, 274–283. Logan, B. F., Mallows, C. L., Rice, S. O., and Shepp, L. A. (1973). Limit distributions of self-normalized sums, Annals of Probability, 1, 788–809. Lozy, M. El (1982). Efficient computation of the distribution functions of Student’s t, chi-squared and F to moderate accuracy, Journal of Statistical Computation and Simulation, 14, 179–189. Mardia, K. V., and Zemroch, P. J. (1978). Tables of the F- and Related Distributions with Algorithms, New York: Academic Press. Mauldon, J. G. (1956). Characterizing properties of statistical distributions, Quarterly Journal of Mathematics, Oxford, 7, 155–160. McDonald, J. B. (1984). Some generalized functions for the size distribution of income, Econometrica, 52, 647–663. McDonald, J. B. (1989). Partially adaptive estimation of ARMA time series models, International Journal of Forecasting, 5, 217–230. McDonald, J. B. (1991). Parametric models for partially adaptive estimation with skewed and Ieptokurtic residuals, Economics Letters, 37, 237–278. McDonald, J. B., and Butler, R. J. (1987). Some generalized mixture distributions with an application to employment duration, Review of Economics and Statistics, 69, 232–240. McDonald, J. B., and Nelson, R. D. (1989). Alternative beta estimation for the market model using partially adaptive techniques, Communications in Statistics-Theory and Methods, 18, 4039–4058. McDonald, J. B., and Newey, W. K. (1988). Partially adaptive estimation of regression models via the generalized t distribution, Econometric Theory, 4, 428–457. McLeay, S. (1986). Student’s t and the distribution of financial ratios, Journal of Business Finance and Accounting, 13, 209–222. McMullen, L. (1939). «Student» as a man, Biometrika, 30, 205. Mickey, M. R. (1975). Approximate tail probabilities for Student’s t distribution, Biometrika, 62, 210–217. Mirza, M., and Boyer, K. L. (1992). Performance evaluation of a class of M estimators for surface parameter estimation in noise range data, Proceedings, SPIE— The International Society for Optical Engineering, 1708, 198–209. Mitra, S. S. (1978). Recursive formula for the characteristic function of Student t distributions for odd degrees of freedom, Manuscript, Pennsylvania State University, State College. Molenaar, W. (1977). The Behrens-Fisher distribution and its approximation, Bulletin No. 15, Rijksuniversiteit Groningen, (Sociological Institute) Netherlands. Molina, E. C., and Wilkinson, R. I. (1929). The frequency distribution of the unknown mean of a sampled universe, Bell System Technical Journal, 8, 632–645. Moran, P. A. P. (1966). Accurate approximations for t-tests, In Research Papers in Statistics, Festschrift for J. Neyman (Ed. F. N. David), pp. 225–230. Mudholkar, G. S., and Chaubey, Y. P. (1976a). A simple approximation for the doubly nonccntral t distribution, Communications in Statistics, B5, 85–92. Mudholkar, G. S., and Chaubey, Y. P. (1976b). Use of logistic distribution for approximating probabilities and percentiles of Student’s t distribution, Journal of Statistical Research, 9, 1–9. Nel, D. G., van der Merwe, C. A., and Moser, B. K. (1990). The exact distributions of the univariate and multivariate Behrens-Fisher statistics with a comparison of several solutions in the univariate case, Communications in Statistics— Theory and Methods, 19, 279–298.

368

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Owen, D. B. (1962). Handbook of Statistical Tables, Reading, MA: Addison-Wesley 1) . Owen, D. B. (1965). The power of Student’s t-test, Journal of the American Statistical Association, 60, 320–333. Patil, V. H. (1965). Approximation to the Behrens-Fisher distributions, Biometrika, 52, 267–271. Pearson, E. S., and Hartley, H. O. (1958) Biometrika Tables for Statisticians, vol. 1, 2d ed., Cambridge: Cambridge University Press. Peiser, A. M. (1943). Asymptotic formulas for significance levels of certain distributions, Annals of Mathematical Statistics, 14, 56–62. Peizer, D. B., and Pratt, J. W. (1968). A normal approximation for binomial, F, beta, and other common, related tail probabilities, I, Journal of the American Statistical Association, 63, 1416–1456. Perlo, V. (1933). On the distribution of Student’s ratio for samples of three drawn from a rectangular distribution, Biometrika, 25, 203–204. Pillai, K. C. S. (1951). On the distribution of an analogue of Student’s t, Annals of Mathematical Statistics, 22, 469–472. Pinkham, R. S., and Wilk, M. B. (1963). Tail areas of the t-distribution from a Mills’ratio-like expansion, Annals of Mathematical Statistics, 34, 335–337. Praetz, P. D. (1972). The distribution of share price changes, Journal of Business, 45, 49–55. Praetz, P. D., and Wilson, E. J. G. (1978). The distribution of stock market returns: 1958–1973, Australian Journal of Management, 3, 79–90. Pratt, J. W. (1968). A normal approximation for binomial, F, beta and other common, related tail probabilities, II, Journal of the American Statistical Association, 63, 1457–1483. Prescott, P. (1974). Normalizing transformations of Student’s t distribution, Biometrika, 61, 177–180. Psarakis, S., and Panaretos, J. (1990). The folded t-distribution, Communications in Statistics— Theory and Methods, 19, 2717–2734. Quensel, C. E. (1943). An extension of the validity of «Student»-Fisher’s law of distribution, Skandinarisk Aktuarietidskrift, 26, 210–219. Rahman, M., and Saleh, A. K. M. E. (1974). Explicit form of the distribution of the Behrens-Fisher d-statistic, Journal of the Royal Statistical Society, Series B, 36, 54–60. [Corrigendum: p. 466 [to Tables 1 and 2 and eqs. (7), (9), (10), (12), (14), (16), and (22);] see Isaacs et al. (1974).] Rao, C. R., Mitra, S. K., and Mathai, A. (1966). Formulae and Tables for Statistical Work, Calcutta, India: Statistical Publishing Society. Ratcliffe, J. F. (1968). The effect on the t-distribution of non-normality in the sampled population, Applied Statistics, 17, 42–48. Ray, J. P. (1961). Unpublished thesis, Virginia Polytechnic Institute. Richter, W.-D., and Gundlach, G. (1990). Asymptotic quantile approximation for Student’s t-distribution, Rostocker Mathematisches Kolloquium, 42, 53–58. Rider, P. R. (1929). On the distribution of the ratio of mean to standard deviation in small samples from non-normal universes, Biometrika, 21, 124–143. Rider, P. R. (1931). On small samples from certain non-normal universes, Annals of Mathematical Statistics, 2, 48–62. Rietz, H. L. (1939). On the distribution of the «Student» ratio for small samples from certain non-normal populations, Annals of Mathematical Statistics, 10, 265–274. Roy, M. K., Roy, A. K., and Ali, M. Masoom (1993). Binomial mixtures of some standard distributions, Journal of Information & Optimization Sciences, 14, 57–71. 1) Оуэн

Д. Сборник статистических таблиц. — М.: АН СССР, 1966. — 568 с.

СПИСОК ЛИТЕРАТУРЫ

369

Ruben, H. (1960). On the distribution of the weighted difference of two independent Student variables, Journal of the Royal Statistical Society, Series B, 22, 188–194. Sampford, M. R. (1953). Some inequalities on Mills’ ratio and related functions, Annals of Mathematical Statistics, 24, 130–132. Sansing, R. C. (1976). The t-statistic for a double exponential distribution, SIAM Journal on Applied Mathematics, 31, 634–645. Sansing, R. C., and Owen, D. B. (1974). The density of the t-statistic for non-normal distributions, Communications in Statistics, 3, 139–155. Scheff´e, H. (1943). On solutions of the Behrens-Fisher problem based on the t-distribution, Annals of Mathematical Statistics, 14, 35–44. Sichel, H. S. (1949). The method of frequency-moments and its application to Type VII populations, Biometrika, 36, 404–425. Siddiqui, M. M. (1964). Distribution of Student’s t in samples from a rectangular universe, Review of the International Statistical Institute, 32, 242–250. Simaika, J. B. (1942). Interpolation for fresh probability levels between the standard table levels of a function, Biometrika, 32, 263–276. Sinclair, C. D. (1980). Two approximations for Student’s t-distribution, Report, Department of Statistics, University of St. Andrews, Scotland. Smirnov, N. V. (1961). Tables for the Distribution and Density Functions of t-Distribution («Student’s» Distribution), Oxford: Pergamon 1) . Smith, M. D. (1992). Comparing the exact distribution of the t-statistic to the Student’s distribution when its constituent normal and χ 2 variables are dependent, Communications in Statistics— Theory and Methods, 21, 3589–3600. Soms, A. P. (1976). An asymptotic expansion for the tail area of the t-distribution, Journal of the American Statistical Association, 71, 728–730. Soms, A. P. (1984). A note on an extension of rational bounds for the t-tail area to arbitrary degrees of freedom, Communications in Statistics— Theory and Methods, 13, 887–893. Sprott, D. A. (1980). Maximum likelihood in small samples: Estimation in the presence of nuisance parameters, Biometrika, 67, 515–523. Stammberger, A. (1967). Uber einige Nomogramme zur Statistik, Wissenschaftliche Zeitschrift der Humboldt-Uniiersitat Berlin, Mathematisch-Naturwissenschaftliche Reihe, 16, 86–93. Stone, M. (1963). The posterior t distribution, Annals of Mathematical Statistics, 34, 568–573. Stuart, A., and Ord, J. K. (1994). Kendall’s Advanced Theory of Statistics— Vol. 1, 6th ed., London: Edward Arnold. «Student» (1908). On the probable error of the mean, Biometrika, 6, 1–25. «Student» (1925). New tables for testing the significance of observations, Metron, 5, 105–108, 114–120. Sukhatme, P. V. (1938). On Fisher and Behrens’ test of significance for difference in means of two normal samples, Sankhy¯a, 4, 39–48. Tague, J. (1969). Monte Carlo tables for the S-statistic, Unpublished Report, Memorial University of Newfoundland, St. Johns’, Newfoundland, Canada. Taylor, S. J. (1980). The variance of the maximum likelihood estimate of the shape parameter of the Student distribution, Manuscript, Department of Operational Research, University of Lancaster, England. Taylor, S. J., and Kingsman, B. G. (1979). An analysis of the variance and distribution of commodity price-changes, Australian Journal of Management, 4, 135–149. 1) Это

часть более широких таблиц Большева и Смирнова — «Таблицы математической статистики», перепечатанная в Оксфорде.

370

ГЛАВА 28. t-РАСПРЕДЕЛЕНИЕ

Thompson, W. R. (1935). On a criterion for the rejection of observations and the distribution of the ratio of deviation to sample standard deviation, Annals of Mathematical Statistics, 6, 213–219. Tiku, M. L. (1963). Approximation to Student’s t distribution in terms of Hermite and Laguerre polynomials, Journal of the Indian Mathematical Society, 27, 91–102. Tiku, M. L., and Kumra, S. (1985). Expected values and variances and covariances of order statistics for a family of symmetric distributions (Student’s t), Selected Tables in Mathematical Statistics, vol. 8, Providence, RI: American Mathematical Society, pp. 141–270. Tiku, M. L., and Suresh, R. P. (1992). A new method of estimating for location and scale parameters, Journal of Statistical Planning and Inference, 30, 281–292. Vaughan, D. C. (1992). On the Tiku-Suresh method of estimation, Communications in Statistics— Theory and Methods, 21, 451–469. Verdinelli, I., and Wasserman, L. (1991). Bayesian analysis of outlier problems using the Gibbs sampler Statistics and Computing, 1, 105–117. Vesel´a, A. (1964). Kritische Werte der Studentschen t-Verteilung fur die Freiheitsgrade zwischen 30 und 120, Biometrische Zeitschrift, 6, 123–137. Wallace, D. L. (1959). Bounds on normal approximations to Student’s and the Chi-square distributions, Annals of Mathematical Statistics, 30, 1121–1130. Wallgren, C. M. (1980). The distribution of the product of two correlated t variates, Journal of the American Statistical Association, 75, 996–1000. Walsh, J. E. (1947). Concerning the effect of intraclass correlation on certain significance tests, Annals of Mathematical Statistics, 18, 88–96. Wasow, W. (1956). On the asymptotic transformation of certain distributions in the normal distribution, Proceedings of the Symposium on Applied Mathematics, vol. 6 (Numerical Analysis), New York: McGraw-Hill, pp. 251–259. Watanabc, Y. (1960), (1962), (1963), (1966). The Student’s distribution for a universe bounded at one or both sides, Journal of Gakugei, Tokushima University, 11, 11–51; 12, 5–50; 13, 1–42; 14, 1–53; 15, 1–35. Weibull, C. (1958). The distribution of the Student ratio in the case of serially correlated normal variables, Skandinavisk Aktuarietidskrift, 33, 137–167. Weir, J. B. de V. (1960a). Standardized t, Nature, London, 185, 558. Weir, J. B. de V. (1960b). Significance of the difference between two means when the populations variances may be unequal, Nature, London, 187, 438. Weir, J. B. de V. (1966). Table of 0.1 percentage points of Behrens’s d, Biometrika, 53, 367–368. Welch, B. L. (1938). The significance of the difference between two means when the population variances are unequal, Biometrika, 29, 350–362. Welch, B. L. (1949). Further note on Mrs. Aspin’s tables and on certain approximations to the tabled function, Biometrika, 36, 293–296. Welch, B. L. (1958). «Student» and small sample theory, Journal of the American Statistical Association, 53, 777–788. Wishart, J. (1947). The cumulants of the z and of the logarithmic χ 2 and t distributions, Biometrika, 34, 170–178. Zackrisson, U. (1959). The distribution of «Student’s» t in sample form individual non-normal populations, Statistical Institute of the University of Gotehorg, Publications, 6, 7–32. Zelen, M., and Severo, N. C. (1964). Probability Functions, In Handbook of Mathematical Functions (eds., M. Abramowitz and I. A. Stegun), National Bureau of Standards, Applied Mathematics Series 55, Washington, DC: GPO. pp. 925–995; Table 26.10, p. 990 1) . 1) Абрамовиц

М., Стиган И. Справочник по специальным функциям. — М.: Наука, 1979.

ГЛАВА 29 2

Нецентральное χ -распределение

1.

Определение и происхождение

Пусть U1 , U2 , . . . , Uν — независимые случайные величины, имеющие стандартное нормальное распределение, δ1 , δ2 , . . . , δν — константы. Тогда распределение величины ν  (Uj + δj )2 (29.1) j=1

зависит только от суммы квадратов величин δ1 , δ2 , . . . , δν . Оно называется нецентральным χ 2 -распределением с ν степенями свободы и параметром $ν нецентральности λ = j=1 δj2 . Случайную величину, распределенную по этому закону, будем обозначать χν 2 (λ ), а χ 2 — случайную величину, имеющую центральное χ 2 -распределение с ν степенями (гл. 18), распределение которой совпадает с распре$ν свободы 2 делением j=1 Uj . Нецентральное распределение превращается в центральное χ 2 -распределение при λ = 0. Символы ν и λ будем опускать, записывая χ  , если по контексту ясно, о какой величине идет речь. (Штрих оставляем для обозначения √ нецентральности.) Иногда параметром нецентральности называют λ или 1 λ . Мы не используем такую терминологию. 2

Нецентральное χ 2 -распределение получается при рассмотрении суммы квадратов n  (Xj − X)2 , S= j=1

где

X = n−1

n 

Xj

j=1

и X1 , X2 , . . . , Xn — нормальные случайные величины со средними ξj и стандартным отклонением σ (одинаковым для всех j), j = 1, 2, . . . , n. Ясно, что Xj = ξj + σ Uj , где Uj — независимые стандартные нормальные случайные величины. Теперь ν   2   , S = σ2 Uj + ξj σ −1 − U + ξ σ −1 ξ =1

371

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

372 где



U =n

−1

n 

Uj ,

ξ =n

−1

j=1

n 

ξj .

j=1 

Преобразовав U1 , . . . , Un в U1 , . . . , Un−1 , U (см. аналогичное преобразование в гл. 13, п. 3), записываем: n  n−1     2 = Uj2 , Uj − U j=1

j=1

где U1 , U2 , . . . ,Un−1 — независимые стандартные нормальные величины. Тогда S = σ2

n−1 

(Uj + δj )2 ,

j=1

где величины δj — линейные функции ξj , а Uj — линейные функции Uj . Полагая Uj = 0 для всех j, получаем Uj = 0 для всех j, и n−1 

δj2 =

j=1

n 

2 ξj − ξ /σ 2 .

j=1

Следовательно, S распределено как умноженная на σ 2 величина χ 2 с n − 1 степенями свободы и параметром нецентральности n 

 ξj − ξ /σ 2 , j=1

т. е. распределение S совпадает с распределением ( n )   2  2 σ 2 χn−1 ξj − ξ /σ 2 . j=1

2.

Исторические замечания

Распределение было получено в работе Fisher (1928, p. 663) как предельный случай распределения оценки множественного коэффициента корреляции (гл. 32). Фишер рассчитал 5%-е точки для некоторых значений ν и λ (см. п. 7). Распределение можно получить разными способами, описанными в п. 3. Patnaik (1949) подчеркивает значение этого распределения для приближенного определения мощности критерия χ 2 и предлагает аппроксимации нецентрального χ 2 -распределения. Нецентральное χ 2 -распределение можно рассматривать как обобщенное распределение Рэлея (Rayleigh) [Miller, Bernstein and Blumenson (1958), Park (1961)], об этом см. также в гл. 18. Используется также название распределение Рэлея—Райса (Rayleigh-Rice) или распределение Райса (Rice). Эти названия чаще используются в математической физике. Нецентральное χ 2 -распределение возникает также в теории передачи информации. В этой области нецентральное χ 2 -распределение называют

373

3. РАСПРЕДЕЛЕНИЕ

Q-функцией Мэркама (Marcum), и параметр нецентральности интерпретируется как отношение сигнал/шум. Среди многих источников, связанных с этой темой, отметим работы Marcum(1948), Helstrom (1960), Felsen (1963), Urkowitz (1967) и Rice (1968).

3.

Распределение

Функция распределения величины χν 2 (λ ) равна Pr[χν 2 (λ )  x] = F(x; ν , λ ) = = e−λ /2

∞  j=0



j 1 x λ /j! 2 (ν /2)+j−1 −y/2 e dy,   y 1 2(ν /2)+j Γ ν+j 0 2

x > 0, (29.2)

и F(x; ν , λ ) =0 при x < 0 [Patnaik (1949)]. Можно записать F(x; ν , λ ) при x > 0 в виде взвешенной суммы функций распределения центральных величин χ 2 1 с весами, являющимися пуассоновскими вероятностями со средним λ : 2 ⎧  j ⎫ ⎧  j ⎫ ∞ ⎨ 1 λ ∞ ⎨ 1 λ ⎬

⎬   −λ /2 2 2 2 Pr χν+2j  x = F(x; ν , λ ) = e e−λ /2 F(x; ν + 2j, 0). ⎩ j! ⎭ ⎩ j! ⎭ j=0 j=0 (29.3) Таким образом, χν 2 (λ ) выражается смесью центральных χ 2 -распределений. Эта интерпретация часто оказывается полезной при выводе распределений функций от случайных величин, имеющих нецентральные χ 2 -распределения [см., например, обсуждение нецентрального F-распределения в гл. 30, п. 3]. Плотность также выражается смесью центральных χ 2 -плотностей [Fisher (1928)]: ⎧  j ⎫ ∞ ⎨ 1 λ ⎬  2 p(x; ν , λ ) = e−λ /2 p(x; ν + 2j, 0) = ⎩ j! ⎭ j=0

  1 ∞  j exp − (λ + x)  λ x(ν /2)+j−1 2 =   = 4 j!Γ 1 ν + j 2ν /2 j=0 2  (ν−2)/4

√  x −(λ +x)/2 1 =e I(ν−2)/2 λ x , x > 0, 2 λ

где

 Ia (y) =

1 y 2

∞ a  j=1

(29.4)

j y2 /4 j!Γ(a + j + 1)

— модифицированная функция Бесселя первого рода порядка a [Abramovitz and Stegun (1964)].

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

374

Мы рассматривали пока ν как целочисленный параметр, что соответствует происхождению χν 2 (λ ). Однако (29.3) и (29.4) являются собственными функциями распределения и плотностями при любых положительных ν . Для удобства мы в дальнейшем опускаем индекс χν 2 (λ ) в обозначениях F(·) и p(·), однако указываем явно ν и λ , записывая F(x; ν , λ ) и p(x; ν , λ ). Закон распределения был получен различными способами. Fisher (1928) приводит непрямой вывод, как некоторого предельного распределения. Первым прямой вывод дал Tang (1938). Геометрический вывод содержится в работах Patnaik (1949), Ruben (1960) и Guenther (1964). Можно определить распределение рекуррентно, получив сначала распределение χ1 2 (λ ) и затем, используя соотношение χν 2 (λ ) = χ1 2 (λ ) + χν2−1 ,

(29.5a)

где нецентральная и центральная случайные величины χ 2 в правой части независимы [см., например, Johnson and Leone (1964, p. 245) и Kerridge (1965)]. Hjort (1989) использует разложение χν 2 (λ ) = Zλ + χν2 ,

(29.5b)

где Zλ — «чистая» нецентральная часть χ1 2 (λ ) и имеет нецентральное χ 2 -распределение с нулем степеней свободы и параметром нецентральности λ [Siegel (1979)]. Функция распределения величины Zλ есть ⎧  j ⎫ ∞ ⎨ 1 λ ⎬

 2 e−λ /2 Pr χ2j2  z , z  0, (29.5c) Pr[Zλ  z] = ⎩ j! ⎭

j=0



где Pr χ02  z = 1 при всех z. Jones (1989) упоминает работу Torgerson (1972), где впервые появилось нецентральное χ 2 -распределение с нулем степеней свободы. Чтобы убедиться в справедливости сказанного, можно использовать производящую функцию моментов, полученную Graybill (1968) или характеристическую функцию и формулу обращения [McNolty (1962)]. Мы запишем производящую функцию моментов в виде, полученном в работе Van der Vaart (1967): + *  ν ν  ,

2 = t(Uj + δj ) E exp t(Uj + δj )2 = E exp j=1

= =

∞ ν  , 1 √

j=1 ν ,





−∞

j=1

   1 2 2 exp − u + t(u + δj ) du = 2

  (1 − 2t)−1/2 exp δj2 t(1 − 2t)−1 =

j=1

= (1 − 2t)−ν/2 e−λ /2 exp



1 λ (1 − 2t)−1 2



= e−λ /2

 j 1 ∞  λ (1 − 2t)−(ν +2j)/2 2

j=0

j!

. (29.6)

375

3. РАСПРЕДЕЛЕНИЕ

Заметив, что (1 − 2t)−(ν+2j)/2 есть производящая функция моментов χν+2j 2 , получаем формулу (29.4). Производящую функцию моментов можно записать в виде exp{λ t/(1 − 2t)} (1 − 2t)

·

(ν /2)−1

1 exp{λ t/(1 − 2t)} 2t exp{λ t/(1 − 2t)} = + , 1 − 2t (1 − 2t)(ν /2)−1 (1 − 2t)ν /2

(29.6)

и это показывает, что F(x; ν , λ ) = F(x; ν − 2, λ ) − 2p(x; ν , λ )

(29.7)

[Alam and Rizvi (1967)]; это получается также интегрированием по частям. Функцию распределения и плотность можно записать в нескольких различных формах. Мы привели, в первую очередь, те формы, которые наиболее полезны. Теперь остановимся на других. Если ν четно, то функция распределения χν 2 (λ ) выражается через элементарные функции. Используя соотношение (см. гл. 18) между функцией распределения χν2 с четным ν и суммой пуассоновских вероятностей, можно показать, что  

1 (29.8) Pr χν 2 (λ )  x = Pr X1 − X2  ν , 2

где X1 , X2 — независимые случайные величины, распределенные по за1 1 x и λ соответственно [Fisher (1928), кону Пуассона с параметрами 2 2 Johnson (1959)]. Отсюда следует, что плотность распределения χν 2 (λ ) выражается через элементарные функции при четном ν . При нечетном ν (24.9) также можно выразить через элементарные функции, используя формулу 6     2 m+1/2 1 d m sh z Im+ 1 (z) = при целом m(27.9). (29.9) z 2

π

z dz

z

Tiku (1965) получил выражение плотности через введенные им обобщенные полиномы Лагерра: L(m) j (x) =

j  (−x)j i=0

i!(j − i)!

·

Γ(j + m + 1) , Γ(i + m + 1)

m > −1,

(29.10)

[см также гл. 1, формула (1.173)]. Tiku (1965) показал, что 

j 1 − λ ∞  ( ν2 −1)    2 1 1 ( ν2 −1) 1 p(x; ν , λ ) = e−x/2 x L x ,  j  2 2 2 j=0 Γ 1 ν + j 2

Альтернативную форму предложил Venables (1971):   e−x/2 x(ν/2)−1 1 1 ν, λ x · p(x; ν , λ ) = e−λ /2 0 F1   , 2

где 0 F1 определено в гл. 1.

4

2ν /2 Γ

1 ν 2

x > 0,

x > 0.

(29.11)

(29.11)

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

376

Формулу (29.2) можно преобразовать, разложив e−λ /2 в ряд по степеням λ /2, сгруппировав члены с одинаковыми степенями λ /2 и изменив порядок суммирования. В результате получается компактное представление F(x; ν , λ ) =

∞ 



1 λ 2 j!

ι =0

j

Δj g0

(29.12)

или, в символьной форме, eλ Δ/2 g0 , где gj = Pr χν+2j 2  x и Δ — оператор прямой разности, т. е. Δgm = gm+1 − gm . Эта формула приводится в статье Большев и Кузнецов (1963). Gideon and Gurland (1977), следуя Tiku (1965), записали разложение по полиномам Лагерра в виде: x1 F(x; ν , λ ) ∼

 λ α +1 yα e−λ y dy+ Γ(α + 1)

0

+e−λ



x1

(λ  x1 )

∞  k=1

λ k Ck Γ(k) (α +1)  L (λ x1 ). Γ(α + 1 + k) k−1

(29.13)

Пусть Li — разложение (29.13), где первые i моментов случайной величины, определенной главным членом разложения (гамма-распределением), равны соответствующим моментам χν 2 (λ ), Lαn (x) — обобщенный полином Лагерра (29.10), x1 = x + θ , и α , θ , λ ’ определены следующим образом. 1 2

Для L0 , α + 1 = ν /2, θ = 0, λ  = . Для Для Для λ =

  L1 , α + 1 = ν /2, θ = 0, λ  = (α + 1)/ n(1 + δ2 ) .  L2 , α + 1 = νλ  (1 + δ 2 ), θ = 0, λ  = (1 + δ 2 )/ 2(1 + 2δ 2 ) . L3 , α + 1 = 2νλ 2 (1 + 2δ 2 ), θ = 2nλ  (1 + 2δ 2 ) − n(1 + δ 2 ), 1 (1 + 2δ 2 )/(1 + 3δ 2 ); здесь δ 2 = λ /ν . 2

Коэффициенты Ck вычисляются рекуррентно и довольно громоздки [Gideon and Gurland (1977)]. Сравнение разложений L0 −L3 показывает, что при малых параметрах нецентральности λ ряды L0 и L1 дают лучшие результаты, хотя хорошие приближения получаются и с помощью разложений L2 и L3 . При использовании L2 и L3 (по сравнению с L0 ) получается 3–5 точных знаков уже при небольшом числе членов разложения (от одного до пяти), при использовании следующих членов точность медленно возрастает. Ряды L0 дают меньшую точность, если использовать частичную сумму пяти членов, однако быстро сходятся к истинному значению при увеличении числа членов. Venables (1971) предложил несколько других разложений по полиномам Лагерра для F(x; ν , λ ). Наилучшим, по видимому, является разложение F(x; ν , λ ) = Γβ





1 ax + b − γβ +1 2



∞    1 1 β) ax + b dj L(j−1 ax + b , 2 2 j=1

(29.14)

377

3. РАСПРЕДЕЛЕНИЕ

где

a = (ν + 2λ )(ν + 3λ )−1 , 1 2 1 λ (ν + 2λ )(ν + 3λ )−1 = λ 2 a, 2 2 1 3 −2 β = (ν + 2λ ) (ν + 3λ ) , 2

b=

γα (x) = {Γ(α )}−1 xα −1 e−x , x, α > 0, x Γα (x) = γα (t)dt[см. гл. 1, формула (1.85)], (1 ) 0 j ν λa ( −1) (β −3− ν ) j!  2 Lj−i 2 (b), (1 − a)i Li 2 dj = (β )j

1−a

i=0

здесь (β )j = β (β + 1) · · · (β + j − 1). Сходимость довольно быстрая, если ν или λ (или оба параметра) велики, при условии, что x не слишком мало [не меньше χν ,0.012 (λ )]. Отметим, что простой ряд (29.2) тоже быстро сходится при больших λ . Han (1975) приводит следующую формулу, применимую при нечетном ν = 2s + 1: i  s    i − 1 j (j) (29.15) 2 F (x; 1, λ ), F(x; 2s + 1, λ ) = F(x; 1, λ ) + i=1 j=1

где F (j) (·) =

j−1

dj F(·)

. Для ν = 3 (m = 1) имеем: √  √ √  √ √  √  √  λ + x −Φ λ − x +λ −1/2 ϕ λ + x −ϕ λ− x , (29.16)

j

F(x; 3, λ ) = Φ

λ d√

где ϕ (t) = Φ (t). В работе Chou et al. (1984) выведено представление F(x; ν , λ ) =

x √  √ √  √ 

√   √ π (ν −3)/2 = ν−1 dy. ϕ y Φ x − y− λ − Φ − x − y− λ  y 2 Γ (ν − 1)/2

(29.17)

0

В частности, F(x; 1, λ ) = Φ

√

x−

 √ √  √  λ −Φ − x− λ .

Плотность записывается в виде p(x; ν , λ ) = x

(2π )1/2

× Γ (ν − 1)/2

(ν −1)/2

2

 √ √  √  1

√   √ y ϕ x−y− λ −ϕ − x−y− λ (x − y)−1/2 dy. 2 (29.18) 0 Интегрирование по частям приводит к простому выражению (29.7). × y(ν−3)/2 ϕ

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

378

Guenther (1964) записал плотность в виде √  π √  (2π )1/2 ϕ λ

√  (ν −2)/2 p(x; ν , λ ) = (ν−1)/2 ϕ x exp xλ cos θ sinν−2 θ dθ = x 2 Γ (ν − 1)/2 0

= πλ −(ν−2)/4 I(ν−2)/2

√  √  √  xλ x(ν−2)/4 ϕ λ ϕ x .

(29.19)

Temme (1993) получил выражение F(x; ν , λ ) = ⎧    √  √  1 x ν /4 ⎪ ⎨1 + T(ν−2)/2 xλ , ω − Tν/2 xλ , ω 2 λ =    √  √  ⎪ ⎩ 1 x ν/4 T xλ , ω − Tν/2 xλ , ω (ν −2)/2 2

λ

при x > λ , при x < λ , (29.20)

где ω=





√ 2 √ 1 √ x − λ / xλ , 2 

∞ 

xλ , ω =

e−(ω +1)t Iμ (t)dt,

√ xλ

которое, по его мнению, удобно для вычислений. Ennis and Johnson (1993) предложили формулу 1 1 F(x; ν , λ ) = − 2 π

∞ 

  1 y−1 (1 − y2 )−ν/4 exp − λ y2 (1 + y2 )−1 × 2

0

× sin

  1 2

  ν · arctg y + λ y(1 + y2 ) − yx dy.

(29.21)

Здесь не требуется оценивать сумму ряда, но нужно численно интегрировать по бесконечному промежутку. Последнее облегчается тем, что порядок подынтегральной функции равен y−(ν+4)/4 при y → ∞. Ruben (1974) вывел рекуррентное соотношение при ν > 6: λ F(x; ν , λ ) = {λ −(ν −4)}F(x; ν −2, λ )+{x−(ν −4)}F(x; ν −4, λ )−xF(x; ν −6, λ ). (29.22a) [См. также Cohen (1988) и Temme (1993).] При λ = 0 подстановка ν + 2 вместо ν приводит к соотношению

(ν − 2)F(x; ν , 0) = (x + ν − 2)F(x; ν − 2, 0) − xF(x; ν − 4, 0),

(29.22b)

связывающему центральные функции χ 2 -распределения [Khamis (1965)].

379

3. РАСПРЕДЕЛЕНИЕ

Следующие рекуррентные соотношения получены в работе Cohen (1988): ∂p(x; ν − 2, λ ) , ∂λ ∂p(x; ν + 2, λ ) p(x; ν , λ ) = p(x; ν + 2, λ ) + 2 , ∂λ   1 p(x; ν , λ ) = λ −(ν−2)/2 exp − (λ − 1)(x − 1) p(λ x; ν , 2

p(x; ν , λ ) = p(x; ν − 2, λ ) + 2

Соотношение

(29.23a) (29.23b) 1).

∂F(x; ν , λ ) 1 = {F(x; ν + 2, λ ) − F(x; ν , λ )} ∂λ 2

(29.23c) (29.23d)

полезно при интерполяции по λ , а ∂F(x; ν , λ ) 1 = p(x; ν , λ ) = {F(x; ν − 2, λ ) − F(x; ν , λ )} ∂λ 2

(29.7)

[ср. с (29.7)] полезно при интерполяции по x. Заметим, что из (29.23d) и (29.7) следует, что ∂F(x; ν , λ ) = −p(x; ν + 2, λ ) ∂λ

(29.23e)

[см. Quenouille (1949), Guenther and Terragno (1964), Ruben (1974) и Schroder (1989)]. Ashour and Abdel-Samad (1990), основываясь на результате, полученном Shear (1988), получили алгоритмическую формулу ∞ n      1 1 1 1 1 Ci λ, ν Cj x, ν + i , (29.24a) F(x; ν , λ ) = e−λ /2 p(x; ν , 0) i=0

где Ci (a, b) =

i!

4

a Ci−1 (a, b) b+i

2

2

j=0

и

2

C0 (a, b) = 1.

Для нечетного ν они использовали (29.3) и формулу (ν −1)+j

√   2 1/2 −x/2 2   e F(x; ν + 2j, 0) = 2 1 − Φ x + 1

π

i=1

xi−1/2 (29.24b) 1 · 3 · 5 · · · (2i − 1)

[Abramovitz and Stegun (1964)]. Kallenberg (1990) нашел границы разности между функциями распределения нецентрального χ 2 -распределения с одинаковыми числами степеней свободы ν и разными параметрами нецентральности: λ и λ *. Если λ  λ ∗ , то √ √  0 < F(x; ν , λ ) − F(x; ν , λ ∗ )  (2π )−1/2 λ ∗ − λ F(x; ν − 1, 0). (29.25a) [Заметим, что F(x; ν − 1, 0) — функция распределения центрального χ 2 -распределения.] Нижняя граница, равная 0, соответствует тому, что F(x; ν , λ ) — убывающая функция от λ . Улучшенную нижнюю границу дает следующее утверждение, также полученное а работе Kallenberg (1990): если

 lim inf max λn , λn∗ > 0 (29.25b) n→0

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

380

РИС. 29.1. a–c. Плотности нецентрального и центрального χ 2 — распределения

и

√ √ λ ∗ − λ = O(1),

то существует такое C(ν ), что

" √   sup |F(x; ν , λ ) − F(x; ν , λn∗ )|  C(ν )  λn∗ − λ  . x>0

Характер графиков p(x; ν , λ ), построенных в работе Narula and Levy (1975) показан на рис. 29.1, a и b. Для сравнения на рис. 29.1, c показаны плотности p(x; ν , 0), т. е. центрального χ 2 -распределения. Легко заметить возрастание параметров положения (среднего, медианы и моды) при возрастании параметра нецентральности λ при фиксированном ν , а также при возрастании числа степеней свободы ν при фиксированном λ .

381

3. РАСПРЕДЕЛЕНИЕ

Рис. 29.1 (окончание)

Siegel (1979) определил χ0 2 (λ ), т. е. нецентральное χ 2 -распределение с нулевым числом степеней свободы следующим образом. Выберем K из 1 распределения Пуассона с параметром λ , т. е. 

Pr[K = k] = e

−λ /2

1 λ 2

2 k

k!

,

k = 0, 1, . . . .

2 Тогда случайная величина Yλ = χ2k имеет центральное χ 2 -распределение. При K = 0 принимается, что центральная величина χ02 тождественно равна нулю, это рассматривается как дискретная компонента распределения χ02 (λ ). Таким образом, χ02 (λ ) есть смесь константы, равной нулю, и распределений χ22 , χ42 , . . . с пуассоновскими весами [см. (29.5c)]. Функция распределения Yλ = χ02 (λ ) равна

F(y; 0, λ ) = 1 − e−(λ +y)/2

∞  k=1



1 λ 2 k!

k

k−1  j=0



1 y 2 j!

j

(29.5c)

при y  0 и 0 при y < 0. На рис. 29.2, a, b, заимствованных из работы Siegel (1979), показаны плотности p(x; 0, λ ) непрерывной компоненты случайной величины χ02 (λ ) при разных λ . Понятно, что площадь под кривыми уменьшается на массу e−λ /2 , сосредоточенную в нуле. Графики иллюстрируют асимптотическую нормальность при больших λ и асимптотически экспоненциальное распределение положительной компоненты χ22 при малых λ .

382

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

РИС. 29.2. Плотность непрерывной компоненты распределения χ0 2 (λ ) при некоторых параметрах нецентральности: (a) λ  2, (b) λ  2

383

4. МОМЕНТЫ

Это распределение использовал Siegel (1979) для вычисления критических значений теста на равномерность. Отметим, что непрерывная часть Zλ величины χν 2 (λ ), определенная в работе Hjort (1989) [см. (29.5b)] есть рассмотренная выше величина χ0 2 (λ ).

4.

Моменты

Из (29.6) получаем производящую функцию моментов величины χν 2 (λ ):   λt M(t; ν , λ ) = (1 − 2t)−ν/2 exp . (29.6) 1 − 2t

Производящая функция семиинвариантов равна K(t; ν , λ ) = log M(t; ν , λ ) = −

1 ν log(1 − 2t) + λ t(1 − 2t)−1 . 2

(29.26)

Отсюда получаем r-й семиинвариант: κr = 2r−1 (r − 1)!(ν + rλ ).

В частности,

следовательно,

⎧ κ1 ⎪ ⎪ ⎪ ⎪ ⎨ κ2 ⎪ ⎪ κ3 ⎪ ⎪ ⎩ κ4

(29.27)

= ν + λ = E χ 2 ,

  2 = 2(ν + 2λ ) = var χ 2 = σ χ 2 ,

 = 8(ν + 3λ ) = μ3 χ 2 ,

(29.28)

= 48(ν + 4λ ),

 μ4 χ 2 = κ4 + 3κ22 = 48(ν + 4λ ) + 12(ν + 2λ )2 .

Из последних формул получаются моментные отношения: √ " 8(ν + 3λ ) 12(ν + 4λ ) α 3 = β1 = , α 4 = β2 = 3 + , 2 3/2 (ν + 2λ )

(ν + 2λ )

откуда



(29.29)

(29.30)



β2 − 3 3 + (ν + 4λ )(ν + 2λ ) 3 λ2 = = 1− , 2 β1 2 2(ν + 3λ ) (ν + 3λ )2

и, следовательно,

4 β −3 3  2  . 3 β1 2

(29.31)

Моменты χν 2 (λ ) относительно нуля, полученные в статье Park (1961), не столь просты, как центральные моменты и семиинварианты. Sen (1989) рассматривает неравенства между средним, медианой и модой. D. W. Boyd в неопубликованной работе получил следующую формулу для r-го начального момента: r     (λ /2)j 1 r  r μr = 2 Γ 1 + ν  .  2

j=0

j

Γ j+

1 v 2

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

384

Bennett (1955) использовал производящую функцию моментов случайной

1 величины log χ 2 (λ )/ν для вычисления моментов этой величины. Ясно, 2 что  E

1 log χν +2j 2 (λ )/ν 2

и что значение E

r 

= 2−r

∞ 

⎡  1 j ⎤ λ



r 2 ⎣ e−λ /2 ⎦ E log χν+2j 2 (λ )/ν , j!

j=0



r log χν+2j 2 (λ )/ν получается из соотношения  

 1 κr log χν2 = ψ (r−1) ν + εr log 2, 2

1

где ε1 = , εr = 0 при r > 1 [см. гл. 27, формулы (27.10) и (27.14)]. 2 При целом ν в работе Bock et al. (1984) получены выражения обратных моментов: 1. Для четного ν > 2r E



−r χν 2 (λ )



r−1 



(−1)r+(ν /2) −r  r − 1 2 = s (r − 1)! s=0

⎧ ⎨ ⎩

1 λ 2

 s+1−(ν/2)  1 Γ ν−s−1 × 2

(ν /2)−s−2

e−λ /2 −

 t=0





1 λ 2 t!

t ⎫

⎬ ⎭

. (29.32a)

2. Для нечетного ν > 2r  −r  = E χν 2 (λ ) =

r−1     s+1−(ν/2)  (−1)r+((ν −1)/2)  r − 1 1 1 λ Γ ν−s−1 × s (r − 1)! 2 2 s=0 ⎡  t ⎤ )−s − 1 λ "  "  ((ν−5)/2  2 ⎥ ⎢ 2 λ /2 − λ /2 × ⎣√ D  ⎦.  π 3 t=0 Γ t+ 2

(29.32b)

Если ν  2r, то r-й обратный момент бесконечен. В этих формулах y D(y) =



2 2 exp t dt e−y /2

0

— интеграл Даусона (Dawson). Этот интеграл есть неотрицательная функция y (при y > 0), наибольшее значение которой, равное 0.541044. . . , получается 1 при y = 0,924139. . . При больших y имеем D(y) ∼ y−1 . 2

385

5. СВОЙСТВА РАСПРЕДЕЛЕНИЯ

Другое выражение, справедливое при всех ν > 2r, есть 

E



χν 2 (λ )

−r 

= 2−r e−λ /2

∞  j=0

1 λ 2 j!

j

 1 (ν + 2j) − r Γ 2  .  1 (ν + 2j) Γ 2 

(29.32c)

Ullah (1976) преобразовал (29.32c) к виду E



χν 2 (λ )

−r 

= 2−r e−λ /2

Γ

 ν   −r 1 1 1 2  F ν − r; ν , λ , 1 1 ν 2 2 2 Γ 2



(29.32d)

где 1 F1 (·) — вырожденная гипергеометрическая функция (см. гл. 1). Еще одно выражение, приводимое, например, в работе Egerton and Laycock (1982), таково:   −r  −r  E χν 2 (λ ) = EJ χν2+2J =   −1 = EJ {(ν + 2J − 2)(ν + 2J − 4) . . . (ν + 2J − 2r)} , (29.32e) где J — имеет распределение Пуассона с параметром

5.

1 λ. 2

Свойства распределения

Устойчивость Из определения следует, что, если χν21 (λ1 ) и χν22 (λ2 ) независимы, то сумма χν21 (λ1 ) + χν22 (λ2 ) распределена как χν21 +ν2 (λ1 + λ2 ). Другими словами, нецентральное распределение χ 2 устойчиво относительно свертки, при этом число степеней свободы равно сумме чисел степеней свободы слагаемых, и аналогично складываются параметры нецентральности. Характеризационные свойства Если Y имеет распределение χν2 (λ ) и Y = Y1 + · · · + Yν , где Yi , i = 1, . . . , ν , независимы и одинаково распределены, то Yi имеет распределение χi2 (λ /ν ). Случай ν = 2 изучен в работе McNolty (1962). F(x; ν , λ ), естественно, возрастает по x при x > 0 и убывает по ν и по λ . При фиксированном x lim F(x; ν , λ ) = lim F(x; ν , λ ) = 0.

ν →∞

λ →∞

Распределение нормированной величины χν 2 (λ ) − (ν + λ )

1/2 2(ν + 2λ )

сходится к нормальному при ν → ∞ и фиксированном λ или при λ → ∞ и фиксированном ν .

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

386

Унимодальность Распределение χν 2 (λ ) унимодально. Мода находится в точке пересечения плотностей распределения χν 2 (λ ) и χν −2 2 (λ ), так что x удовлетворяет уравнению p(x; ν , λ ) = p(x; ν − 2, λ ). Полнота Семейство распределений χν 2 (λ ) на конечном интервале λ1 < λ < λ2 значений λ полно в обычном смысле [Marden (1982), Oosterhoff and Schreiber (1987)]. Монотонность Как уже отмечено в п. 3, F(x; ν , λ ) убывает по каждому из параметров ν и λ (см. рис. 29.1, b, c) [Ghosh (1973), Ruben (1974)].

6.

Оценки

Нецентральное χ 2 -распределение зависит от двух параметров: числа ν степеней свободы и параметра нецентральности λ . При известном ν оценка максимального правдоподобия (ОМП) λ# параметра λ по независимой выборке случайных величин X1 , . . . , Xn , имеющих распределение (29.4), удовлетворяет уравнению     ⎡ ⎤ j−1 j  n  ⎢ ⎢ ⎣ i=1

$∞

−λ# /2 j=0 e

1# λ 2

$∞

−λ# /2 j=0 e

или, что то же самое, ⎡  n ⎢  ⎢ ⎢ ⎢ i=1 ⎣

1 # λ /j! 2

/(j − 1)! −

$∞

j=0

$∞

j=0



1 # λ 2

j



1 # λ /j ! p(Xi ; ν + 2j, 0) 2

j−1



p(Xi ; ν + 2j, 0)

⎥ ⎥ = 0 (29.33) ⎦



/(j − 1)! p(Xi ; ν + 2j, 0) ⎥ 1 # λ 2

j

/j ! p(Xi ; ν + 2j, 0)

⎥ ⎥ = n, ⎥ ⎦

если это уравнение имеет положительный корень. Последнее уравнение решить не легко. При ν = 2 Meyer (1967) показал, что уравнение имеет 1 $n положительное решение, если X = i=1 Xi > 2; в противном случае ОМП n равна нулю. Он показал, кроме того, что lim Pr[X > 2] = 1.

n→∞

Dwivedi and Pandey (1975) распространили результат Мейера на ν > 2. Они показали, что ОМП параметра λ при известном ν равна 0, если X  ν и удовлетворяет уравнению   n  h 2Xi λ# Xi = n, если X > ν , (29.34a) i=1

387

6. ОЦЕНКИ

 −1 где h(z) = Iν/2 (z) zI(ν−2)/2 (z) , Iν (z) — модифицированная функция Бесселя порядка ν чисто мнимого аргумента, в гл. 1 приводится ее явное выражение. Для больших n ( )2 n  1 1/2 −1 # n λ ≈ Xi , 2

i=1

−1

при больших z. так как h(z) ≈ z Anderson (1981a, b) рассматривает ОМП параметров σ и λ по наблюдениям 2 2 Y1 , Y2 , . . . , Yn√ , распределенных √ √ как σ χν (λ ) при известном ν . (В работе рассмотрены Y1 , Y2 , . . . , Yn , но это не влияет на ОМП). Уравнение правдоподобия совпадает с (29.34a), но только Xi заменяются на Yi /# σ2 и добавляется равенство n    2 −1 # = (ν n) σ Yi − λ# . (29.34b) i=1

Там же установлено, что эти уравнения имеют единственное решение, #2 # 2 не слишком мало. Асимптотические дисперсии и ковариация σ если σ 1/2 # # = λ /# и μ σ при n → ∞ даются формулами   1 μ ) ≈ Δ−1 νλ −1 − 1 − λ + θσ −2 σ 2 , (29.35a) n var(# 2 

σ ) ≈ Δ−1 θλ −1 σ −2 − 1 σ 4 , (29.35b) n var(#

 # 2 ) ≈ Δ−1 λ 1/2 θλ −1 σ −2 − 1 − λ −1 σ 3 , μ, σ (29.35c) n cov(# где

1

Δ = (θλ −1 σ −2 − 1)( ν + λ −1 ) − 1, 2 ⎡ "  ⎤

θ = E⎣

XIν2/2

X λ /σ " ⎦ . I(2ν −2)/2 X λ /σ

В работе Anderson (1981b) приводятся границы величины θλ −1 σ −2 : 1 + λ −1 −

1 1 5 20ν − 13 −2 νλ −2 + ν 2 λ −3  θλ −1 σ −2  1 + λ −1 − λ . (29.36a) 2 4 4 39

В этой же статье найдена улучшенная нижняя граница для больших λ : 1 + λ −1 −

1 1 (ν − 1)λ −2 + (ν − 1)(ν − 2)λ −3 . 2 4

При больших λ имеют место также следующие асимптотики:  1 1 − 2(ν − 1)λ −2 + · · · σ 2 , σ) ≈ n var(# 2

1 n var(λ# ) ≈ 1 + λ 2 , 2  1/2

−2 #) ≈ 1 − λ 1 − 2(ν − 2)λ −2 corr(λ# , σ .

#. Отметим еще высокую корреляцию между λ# и σ

(29.36b)

(29.37a) (29.37b) (29.37c)

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

388

При известном σ несмещенная оценка λ , даваемая методом моментов, есть n  −1 2 ! λ =n σ Xi − ν . (29.38) i=1

Имеем:

n var(λ! ) = 2ν + 4λ ,

(29.39a)

тогда как нижняя граница Рао—Крамера для дисперсии несмещенной оценки λ! есть 4(θλ −1 − 1)n−1 , (29.39b) где θ определено формулой (29.35). Асимптотическая относительная эффективность (АОЭ) оценки λ! равна (при больших λ ) АОЭ(λ# ) = 4(θλ −1 − 1)−1 (2ν + 4λ )−1 = 1 −

1 −2 1 λ + (2ν − 3)λ −6 + · · · (29.40) 2 4

При ν = 1 получаются оценки параметров кратного нормального распределения (т. е. распределения модуля величины, см. гл. 13, " нормальной   2 (λ ) совпадает с распределением χ ( λ ) ≈ χ п. 7.3), так как распределение 1 1  √   U + λ , где U — стандартная нормальная случайная величина. Плотность кратного нормального распределения, т. е. распределения величины|U σ + ξ |, приводимая в статье Leone, Nelson and Nottingham (1961), равна 6     2 −1 1 ch ξ xσ −2 exp − x2 + ξ 2 σ −2 , 0 < x. σ p(x) = (29.41) π

2

 Очевидно, что |U σ + ξ | имеет то же самое распределение, что и σχ1 ξ 2 /σ 2 . Об этом более подробно см в гл. 13, п. 7.3. Первые два начальных момента распределения (29.41) равны 6      2 1 ξ μf = σ exp − ξ 2 σ −2 + ξ 1 − 2Φ − , (29.42a) π

σ

2

μf +

σf2

= ξ +σ 2

2

(29.42b)

соответственно. Leone, Nelson and Nottingham (1961) приводят таблицы среднего μf и стандартного отклонения σf для μf /σf = 1.33 (0.01) 1.50 (0.02) 1.70 (0.05) 2.40 (0.1) 3.0.

равно Заметим, что наименьшее возможное значение μf /σf −1/2 1 π−1 = 1.3237. Leone, Nelson and Nottingham (1961) приводят 2 значения функции распределения с четырьмя десятичными знаками для ξ /σ = 1.4 (0.1) 3.0 и для аргумента с шагом 0.01. Значения моментных отношений β1 и β2 для нескольких случаев приведены в работе Elandt (1961). Параметры ξ и σ можно оценить, приравняв первые два выборочных момента величинам (29.42a), (29.42b) соответственно. Таблицы в работе Leone, Nelson and Nottingham (1961) облегчают расчеты. Простые явные решения 

389

6. ОЦЕНКИ

получаются при использовании второго и четвертого моментов. Тогда θ = μf /σf оценивается величиной θ!, которая находится из уравнения Выборочный 4-й момент 3 + 6θ!2 + θ!4 =  2 . Квадрат 2-го выборочного момента !2

(29.43)

1+θ

Elandt (1961) получил разложение до членов порядка n−3 дисперсий оценок θ , полученных двумя способами. При θ < 0.75 разница мала. При θ = 3 оценка с использованием первого и второго моментов примерно на 40% эффективней. # параметров ξ Уравнения максимального правдоподобия для оценок ξ# и σ и σ можно записать в виде: n  # # 2 = n−1 ξ2 + σ Xj2 , (29.44a) j=1

ξ# = n−1

n  j=1



Xj th

# ξ Xj



#2 σ

.

(29.44b)

#. Johnson (1962) вывел асимптотические формулы для дисперсий θ# = ξ#/# σ и σ Выражения громоздки, но при больших θ упрощаются: 1 n var(θ#) ≈ 1 + θ 2, 2 1 n var(# σ) ≈ , 2

# ) ≈ −θ (2 + θ 2 )−1/2 . corr(θ#, σ

(29.44c)

Эффективность оценки θ относительно ОМП по первому и второму выборочным моментам составляет около 95% при θ = 1 и возрастает с ростом θ . При малых θ эффективность низка. Если известно σ , т. е. оценивается параметр λ распределения χ1 (λ ), то уравнение правдоподобия для ξ# совпадает с (29.44b) # на σ . с заменой σ Рассмотрим теперь случай n = 1, так что наблюдается только одна величина X из распределения χν 2 (λ ). При известном ν естественно оценить λ величиной λ! = X − ν , (29.45a) которая есть оценка метода моментов, полученная приравниванием наблюденного среднего оцениваемому параметру. Такая оценка является единственной несмещенной оценкой с минимальной дисперсией. Существуют, однако, (смещенные) оценки, имеющие меньшую среднеквадратическую ошибку (СКО). Простейшая из них есть X − ν при X  ν , (X − ν )+ = (29.45b) 0 при X  ν . Perlman and Rasmussen (1975) рассмотрели модифицированную оценку λ! , а именно b (29.45c) X − ν + , ν > 5, 0 < b < 4(ν − 4). X

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

390

Neff and Strawderman (1976) продолжили анализ, получив оценки X−ν+ X−ν+

X−ν+

b , X+c

b , Xa

ν > 1,

0 8, r(X) монотонно возрастает, (29.45e)

4(ν − 4)(ν − 6)(ν + 8) 2 ; E {r(X)}  ν (ν + 2)  2  c ν > 4, 0 < b < 4(ν − 4) 1 − , 0 < c < ν − 4. ν+4

(29.45f ) Эти оценки имеют равномерно меньшие СКО по сравнению с λ! . Заметим, что оценка (29.45f) ограничена при X → 0, а (29.45c)–(29.45e) не ограничены. Kubokawa, Robert and Saleh (1993) показали, что оценки ∞   1 j − ν /2 −1 , (29.45g) λ!1 (X) = X − ν + e − ν {j!(ν + 2j)} λ!2 (X) =



2

j=0

X−ν при X  ν + 2, 2(ν + 2)−1 X при X  ν + 2,

(29.45h)

также имеют равномерно меньшие СКО по сравнению с λ! и ограничены при X → 0. Alam and Saxena (1982) определили нецентральное гамма-распределение с параметрами α и θ как распределение с плотностью pY (y; α , θ ) = yα −1 e−θ −y

∞  j=0

(θ y)j = e−θ −y j!Γ(α + j)

где  Ip (x) = Это — распределение величины

1 x 2

∞ p  k=0

2χν 2 (λ )

ν = 2α

и

 (α −1)/2



y θ

x2 /4

 √  Iα −1 2 θ x , (29.46)

k

k!Γ(p + k + 1)

.

с параметрами λ = 2θ .

Alam and Saxena (1982) сравнили СКО оценок максимального правдоподобия и оценок метода моментов; в табл. 29.1 приведены отношения среднеквадратических отклонений (в зависимости от исходных параметров λ и ν ). Venables (1975) предложил новый способ определения доверительных границ для λ . Его подход дает полезные результаты, если наблюденное значение велико по сравнению с подходящей процентной точкой центрального χν2 -распределения. Автор заметил, что дополнительную функцию

391

6. ОЦЕНКИ

ТАБЛИЦА 29.1 Отношения среднеквадратических ошибок СКО(λ# )/СКО((X − ν )+ )

aa ν aaλ a 1 2 10 20

1

2

10

20

1.41 1.35 1.16 1.10

1.28 1.26 1.15 1.10

1.04 1.04 1.06 1.06

1.01 1.02 1.03 1.03

распределения для χν 2 (λ ) можно записать в виде 1 − F(x; ν , λ ) = 1 − F(x; ν , 0) + p(x; ν , 0)

j ∞  x/2

j=1

ν /2

[j] F(λ ; 2j, 0)

(29.47)

[ср. с (29.4)]. Это можно рассматривать как «доверительное» распределение (фидуциальное распределение) для λ ; оно является смесью распределений: Pr[λ = 0] = 1 − F(x; ν , 0) и множества распределений {F(x; 2j, 0)} с весами  j  [j]  1 1 x / ν , j = 1, 2, . . . . 2

2

Можно найти 100(1 − α )%-е доверительные границы λ как нижнюю и верхнюю 50α %-е точки распределения (29.47). Venables (1975) предложил следующий приближенный метод. Соответствующая производящая функция моментов есть  



 xt E∗ etλ = 1 − F(x; ν , 0) + exp (1 − 2t)(ν/2)−1 F x(1 − 2t)−1 ; ν , 0 . (29.48) 1 − 2t

Если x достаточно велико, то

 F(x; ν , 0) ≈ F x(1 − 2t)−1 ; ν , 0 = 1,

и для производящей функции моментов получается приближенное равенство  

xt . (29.49) E∗ etλ ≈ (1 − 2t)(ν/2)−1 exp 1 − 2t

Соответствующие приближения семиинвариантов суть κr∗ = 2r−1 (r − 1)!(rx − ν + 2).

(29.50)

В частности, κ1∗ = x − ν + 2,

(29.51a)

κ2∗

(29.51b)

= 2(2x − ν + 2).

Venables (1975) приводит разложение типа Корниша—Фишера для 100α %-й точки доверительного распределения в терминах квантили стандартного

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

392

нормального распределения: Φ(uα ) = α . Приведем часть этого разложения.



 2 λ#α = X − ν + 2 + u2α − 1 + uα σ − uα σ −1 + (ν − 1) u2α − 1 σ −2 + 3  

 1 2 4 3 −3 (4ν − 7)uα − (ν − 1)uα σ + (ν − 1) 3u4α + 2u2α − 11 σ −4 + O(σ −5 ). + 6

3

15

(29.52) В работе De Waal (1978) рассматривается байесовская оценка λ , минимизирующая квадратичные потери. Оценка основывается на безынформационном априорном распределении и дает удивительный результат: оценкой является X + ν . (Эта оценка никогда не будет меньше ν и всегда имеет смещение, равное ν .) Если в качестве априорного взять гамма-распределение g(λ ) =

cp λ p−1 e−cλ , Γ(p)

c, p, λ > 0,

то байесовская оценка есть l(X) = (1 + c)−1 p + (1 + c)−2 X,

(29.53)

где l(X) → X + p при c → 0. Ее среднеквадратическая ошибка l(X) равна   (29.54) (1 + c)−r p + 2λ + (2 + с)2 (p − cλ )2 .

7.

Таблицы и вычислительные алгоритмы

За последние 20 лет появилось много работ, посвященных вычислению функции распределения F(x; ν , λ ) нецентрального хи-квадрат распределения, есть даже повторения. При малых λ подходящим является разложение F(x; ν , λ ) по формуле (29.3). Если ограничиться s + 1 членом разложения, то ошибка является отрицательной и ее модуль (для любых ν или x) меньше e−λ /2

∞  j=s+1



1 λ 2 j!

j

.

Эта величина не превосходит  1−Φ

s + 1 − (λ /2) " λ /2



[см. гл. 4, формула (4.49)]. Чтобы избежать ошибки, большей 100α %, следует  6  1 λ > uα , где Φ(uα ) = 1− α . В следующей таблице привевзять s + 1 − λ / 2

2

393

7. ТАБЛИЦЫ И ВЫЧИСЛИТЕЛЬНЫЕ АЛГОРИТМЫ

 дено несколько типичных значений наименьшего s = 1 + uα ([a] обозначает целую часть a). λ =

2

XX XXXmin s = XXX 1 + [uα ] α X

0.001 0.0001 0.00001

1 1 λ + λ −1 2 2

8

32

1 + [2uα + 3]

1 + [4uα + 15]

10 11 12

28 30 33

4 4 5



Эти значения обеспечивают гарантию точности для всех x и ν . Гораздо б´oльшая точность достигается при малых x и ν . Guenther (1975) отмечает, что при использовании ряда (29.3) для x = 4.60517, ν = 2 и λ = 2.2 получается пять верных десятичных знаков. Наиболее подробные таблицы нецентрального χ 2 -распределения содержатся в работе Haynam, Govindarajulu and Leone (1973). Эти таблицы специально приспособлены для вычислений, включающих определение мощности тестов χ 2 . Пусть χν2,1−α есть верхняя 100α %-я точка центрального χ 2 -распределения с ν степенями свободы и пусть

(29.55) β (ν , λ , α ) = Pr χν 2 (λ ) > χν2,1−α — мощность относительно параметра нецентральности λ . В работе составлены следующие таблицы. Значения β с четырьмя десятичными знаками

ТАБЛИЦА 1

α = 0.001, 0.005, 0.01, 0.025, 0.05, 0.1, λ = 0 (1) 1.0 (0.2) 3.0 (0.5) 5 (1) 40 (2) 50 (5) 100 ν = 1 (1) 30 (2) 50 (5) 100.

ТАБЛИЦА 2 λ с тремя десятичными знаками для тех же значений α и ν , что в табл. 1 1 − β = 0.1 (0.02) 0.7 (0.01) 0.99. ТАБЛИЦА 3 ν с тремя десятичными знаками для тех же значений α , λ и β , что и в табл. 1 и 2

Первые таблицы (не предназначенные для специальных расчетов), связанные с нецентральным χ 2 -распределением, составил Fix (1949). Они дают λ с тремя знаками для α = 0.01, 0.05, 1 − β = 0.1 (0.1) 0.9, ν = 6 (1) 20 (2) 40 (5) 60 (10) 100.

Эти таблицы включены в книгу Большева—Смирнова (1965). Аналогичные таблицы включены в книгу Owen (1962).

394

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ



В работе Bark et al. (1964) приведены таблицы Pr χν 2 (ω 2 )  u2 = Q(u, ω ) с шестью десятичными знаками для ω = 0 (0.02) 3.00 и u = 0 (0.02) до значений, при которых Q(u, ω ) становится меньше 0.0000005. При ω > 3 и u  3 авторы предлагают использовать формулу Q(u, ω ) = 1 − Q(ω , u) + Q(ω − u, 0)e−uω I0 (uω ) (29.56a) и приводят таблицы функции e−x I0 (x). При u > ω >3 из последней формулы следует, что (29.56b) Q(u, ω ) = q − R(q, ε ),

 где q = 1 − Φ u − ω − (2ω )−1 , ε = (1 + ω 2 )−1 , а для R(q, ε ) также приведены таблицы. Формулы (29.56a) и (29.56b) можно использовать для расчетов при ω > u > 3. Johnson (1968) приводит таблицы процентных точек x(ν , λ , α ), удовле

творяющих условию Pr χν 2 (λ ) > x(ν , λ , α ) = α , с четырьмя десятичными √ знаками для λ = 0.2 (0.2) 6.0; ν = 1 (1) 12, 15, 20; α = 0.001, 0.0025, 0.005, 0.01, 0.025, "0.05, 0.1, 0.25, 0.5, 0.75, 0.9, 0.95, 0.975, 0.99, 0.995, 0.9975, 0.999. x(ν , λ , α ) с четырьмя значащими цифрами для тех же значений Таблицы √ λ и ν , только для α = 0.01, 0.025, 0.05, 0.95, 0.975 и 0.99 приводят Johnson and Pearson (1969). Компьютерная программа для вычисления p(x; ν , λ ) и F(x; ν , λ ) опубликована в работе Bargmann and Ghosh (1964), а также в работе Robertson (1969). Авторы использовали (29.2) и (29.4) для значений параметров от 10−8 до 108. Программа обеспечивает пять точных десятичных знаков. О более подробных таблицах для ν = 2 и 3, рассчитанных в связи с задачей накрытия случайной точки сферы радиуса R со случайным центром, мы скажем в п. 9. Narula and Desu (1981) разработали быстродействующий алгоритм для вычисления F(x; ν , λ ), использующий (29.13). Алгоритм реализован на языке FORTRAN 66, использует метод Lau (1980) вычисления неполной гаммафункции и метод Pike and Hill (1966) вычисления логарифмической гаммафункции. Wiener (1975) предложил программу, названную им LAMBDA и составленную на FORTANе, для вычисления мощности критерия проверки гипотезы H0 о χν2 -распределении X против альтернативной гипотезы H1 о нецентральном распределении χν 2 (λ ) при λ = 0. В качестве критической области принимается X > χν2,1−α . При уровне значимости α . Если альтернативной гипотезой является H1 : λ = λ1 , то мощность равна





β (λ1 |α ) = Pr X > χν2,1−α = Pr χν 2 (λ ) > χν2,1−α = F χν2,1−α ; ν , λ1 , (29.57) именно эта величина вычисляется в программе. Wiener (1975) приводит таблицы значений λ , удовлетворяющие условию β (λ |α ) = β (29.58) для ν = 1 (1) 30 (2) 50 (5) 100; α = 0.001, 0.005, 0.01, 0.025, 0.05; 0.1; β = 0.01 (0.01) 0.30 (0.20) 0.90,

395

8. АППРОКСИМАЦИИ

составленные аналогично таблицам в работе Haynam, Govindarajulu and Leone (1970). Posten (1989) составил рекуррентный алгоритм вычисления F(x; ν , λ ) в терминах функции F(x; ν , 0) центрального распределения χν2 . Алгоритм предусматривает модификации, позволяющие обойти вычислительные трудности при больших λ . Алгоритм использует рекуррентное соотношение для вычисления F(x; ν +2j, 0); автор рекомендует использовать разложение в цепные дроби, описанное, например, в статье Boardman and Kopitzke (1975). В работах Farebrother (1987) и Ding (1992) также описаны алгоритмы вычисления распределения для нецентрального χ 2 . Важно упомянуть здесь, что Boomsma and Molenaar (1994) пересмотрели четыре статистических пакета, предназначенных для MS-DOS. Это, конкретно, пакеты Electronic Tables, P Calc, Sta Table и STATPOWER, предназначенные для вычисления функций распределения и квантилей многих распределений, содержащихся в этом и предыдущих томах. Особое внимание уделено нецентральному χ 2 -распределению. Метод построения датчика псевдослучайных чисел, распределенных по закону Рэлея—Райса описала Zolnowska (1965).

8.

Аппроксимации

Существует большое число приближенных методов расчета Pr χν 2 (λ )  x . При выборе аппроксимации приходится учитывать взаимно противоречащие требования простоты и точности расчетов. Первые приближенные формулы для нецентрального χ 2 -распределения можно разбить на две группы. Первая — это нормальные аппроксимации для распределения дробных степеней случайной величины χ 2 [Patnaik (1949), Abdel-Aty (1954), Sankaran (1959, 1963)]. Эти аппроксимации иногда уточняются добавлением одного — двух членов разложения в ряд Эджворта, однако улучшения незначительны, хотя и сопровождаются значительным увеличением объема вычислений. Вторая группа содержит аппроксимации гамма-функциями (т. е. центральными χ 2 -распределениями) вида αχ 2 + β , где α и β — подходящим образом выбранные константы [Patnaik (1949), Pearson (1959)]. Такие приближения можно, во-первых, преобразовать к нормальным аппроксимациям, таким, например, как аппроксимация Вилсон—Хильферти [гл. 18, формула (18.24)], использующая кубический корень (и попадающая таким образом в первую группу). Во-вторых, можно дополнить гамма-аппроксимацию несколькими членами разложения по полиномам Лагерра [Khamis (1965), Tiku (1965)]. Как (29.4), так и неравенства (29.31) позволяют думать, что гаммараспределение дает приемлемую аппроксимацию. В наиболее простом случае χ 2 заменяется преобразованной величиной χ 2 , например, cχf2 , где c и f подбираются по условию близости двух первых моментов χν 2 (λ ) и cχf2 . Подходящими c и f являются c=

ν + 2λ ; ν+λ

f =

(ν + λ )2 λ2 =ν+ ; ν + 2λ ν + 2λ

(29.59)

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

396

это приближение предложено в работе Patnaik (1949). Два поправочных коэффициента к аппроксимации Патнайка приводят Roy and Mohamad (1964). Pearson (1959) предложил модификацию, введя дополнительную константу b так, чтобы b, c и f обеспечили близость первых трех моментов величин χν 2 (λ ) и cχf2 + b. Такие значения b, c и f суть b=−

λ2 , ν + 3λ

c=

ν + 3λ , ν + 2λ

f =

(ν + 2λ )3 λ 2 (3ν + 8λ ) = ν + . (ν + 3λ )2 (ν + 3λ )2

(29.60)

Такой прием улучшает аппроксимацию Патнайка функции F(x; ν , λ ) при больших x. В то же время аппроксимация Пирсона дает ненулевое значение

Pr −λ 2 (ν + 3λ )−1 < χ 2  0 и, следовательно, неудовлетворительна при малых x. Можно показать, что при фиксированных x и ν ошибка аппроксимации Патнайка для F(x; ν , λ ) имеет порядок O(λ 2 ) при λ → 0 и O(λ −1/2 ) при λ → ∞; ошибка аппроксимации Пирсона также имеет порядок O(λ 2 ) при λ → 0, но O(λ −1 ) при λ → ∞. В обоих случаях границы ошибок равномерны по x. Для аппроксимаций Патнайка и Пирсона число f часто получается дробным и, следовательно, требуется интерполяция в стандартных таблицах χ 2 -распределения. В аппроксимациях Патнайка и Пирсона центральным χ 2 -распределением можно использовать приближение для центрального χ 2 -распределения. Если применить аппроксимацию Вилсона—Хильферти [гл. 18, формула (18.24)], то, как показал Abdel-Aty (1954),  2 1/3 χ аппроксимируется нормальной случайной величиной ν+λ

со средним 1 −

2(ν + 2λ ) 2(ν + 2λ ) и дисперсией . 9(ν + λ ) ν+λ

(29.61a)

Sankaran (1959, 1963) рассматривает несколько подобных аппроксимаций, в том числе: 1/2  1 χ 2 − (ν − 1) аппроксимируется нормальной случайной величиной 2 1/2  1 и дисперсией 1; (29.61b) со средним 1 + (ν − 1) 



2 1/2 1 χ − (ν − 1) 3 аппроксимируется нормальной случайной величиной (ν + λ ) 2

χ 2 ν+λ

  ν − 1 1/2 и дисперсией (ν + λ )−1 ; (29.61c) со средним 1 − 3(ν + λ ) h аппроксимируется нормальной случайной величиной со средним

1 + h(h − 1)

ν + 2λ

(ν + 2λ )2

− h(h − 1)(2 − h)(1 − 3h) и дисперсией (ν + λ ) 2(ν + λ )4  2(ν + 2λ ) ν + 2λ h2 1 − (1 − h)(1 − 3h) , (29.61d) 2 2 2

(ν + λ )

(ν + λ )

397

8. АППРОКСИМАЦИИ

где h=1−

2 (ν + λ )(ν + 3λ )(ν + 2λ )−2 . 3

Из последних аппроксимаций (29.61b) не удовлетворительна при малых λ , (29.61) весьма точна при всех λ , но очень сложна и не намного точнее аппроксимации Пирсона. Сравнение методов иллюстрирует табл. 29.2. Hayya and Ferrara (1972), используя моделирование, установили, что основанное на аппроксимации Патнайка нормальное приближение, состоящее в том, что  2χ 2 − (ν + λ ) ν + 2λ

распределено нормально со средним 

2(ν + λ ) −1 ν + 2λ

1/2

1/2

и единичной дисперсией, «подтверждается» на уровне значимости 5%. Для λ < 80 аппроксимация подтверждается для правого хвоста, а для левого не подтверждается. (Авторы не совсем точно объясняют смысл слова «подтверждается», основываясь, скорее, на графическом представлении.) Как уже отмечено выше, некоторые аппроксимации допускают улучшение с использованием разложения Эджворта, однако вычислительные трудности делают такой подход непривлекательным. Rice (1968) приводит разложение функции распределения по степеням ν −1 , которое должно давать равномерную точность во всем диапазоне значений аргумента. Другие приближения, применяемые при малых λ , получаются разложением по полиномам Лагерра (29.11). Лучшие результаты получаются разложением в ряд Лагерра подходящей линейной функции от χ 2 [Tang (1938), Tiku (1965]. Bol’shev and Kuznetzov (1963) использовали метод, при котором распределение χν 2 (λ ) связывается с центральным χ 2 -распределением с тем же числом степеней свободы. Они нашли функцию w(x; ν , λ ), для которой



Pr χν 2 (λ )  x ≈ Pr χν2  w(x; ν , λ ) . Это эквивалентно требованию, чтобы распределение w(χν 2 (λ ); ν , λ ) было близко к центральному χ 2 -распределению с ν степенями свободы. Для малых λ w(x; ν , λ ) = w∗ (x; ν , λ ) + O(λ 3 ), где

w∗ (x; ν , λ ) = x − xλν −1 +

(29.62)

 1  x 1 + (ν + 2)−1 x λ 2 ν −2 , 2

и остаточный член имеет порядок O(λ 3 ) в любом конечном интервале изменения x. Тогда при λ → 0

F(x; ν , λ ) = Pr χ 2  w∗ (x; ν , λ ) + O(λ 3 ). (29.63) Для оценки процентных точек, а именно решений x(α , ν , λ ) уравнения F(x; ν , α ) = α

(29.64)

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

398

ТАБЛИЦА 29.2 Ошибки аппроксимаций Johnson (29.68), Patnaik (29.59), Pearson (29.60), Abdel-Aty (29.61a) и Sankaran (29.61b — d) для ν =2, 4 и 7 ν

λ

Точное значение

Johnson (25.68)

Patnaik (29.59)

Pearson (29.60)

Abdel-Aty (29.61a) (29.61b)

Sankaran (29.61c)

(29.61d)

Верхние 5%-е точки 2

4

7

1

8.642

0.92

−0.01

−0.04

−0.08

0.09

0.23

−0.06

4

14.641

0.55

0.08

−0.06

0.02

0.04

0.04

−0.01

16

33.054

0.28

0.29

−0.03

0.27

0.02

0.01

0.02

25

45.308

0.23

0.35

−0.03

0.33

0.01

0.00

0.00

1

11.707

0.88

0.01

−0.02

−0.04

0.20

0.26

−0.02

4

17.309

0.57

0.07

−0.04

0.03

0.11

0.08

−0.03

16

35.427

0.30

0.26

−0.03

0.23

0.04

0.01

0.00

25

47.613

0.25

0.33

−0.02

0.30

0.03

0.01

0.01

1

16.003

0.83

0.01

−0.01

−0.02

0.28

0.24

−0.02

4

21.228

0.59

0.05

−0.02

0.02

0.18

0.10

0.03

16

38.970

0.33

0.19

−0.02

0.19

0.08

0.02

−0.01

25

51.061

0.26

0.28

−0.02

0.27

0.05

0.01

0.00

Нижние 5%-е точки 2

4

7

1

0.17

*

0.03

−0.09

0.00

*

*

−0.05

4

0.65

−0.43

0.29

−0.12

0.24

0.08

−0.01

0.01

16

6.32

−0.25

0.57

−0.02

0.55

0.02

0.00

0.02

25

12.08

−0.21

0.60

−0.01

0.59

0.01

0.00

0.03

1

0.91

−0.07

0.02

−0.03

0.00

*

0.14

−0.04

4

1.77

−0.24

0.18

−0.06

0.17

0.23

0.01

−0.03

16

7.88

−0.20

0.48

−0.02

0.47

0.06

0.00

0.02

25

13.73

−0.17

0.53

−0.01

0.53

0.04

0.00

0.05

1

2.49

0.10

0.02

0.00

0.00

0.64

0.11

−0.02

4

3.66

−0.07

0.12

−0.02

0.10

0.34

0.03

−0.01

16

10.26

−0.15

0.38

−0.01

0.37

0.11

0.00

0.01

25

16.23

−0.14

0.45

−0.01

0.44

0.07

0.00

0.02

Замечание. Табулированные значения приведены с недостатком (меньше истинных). Точные значения верхних 5%-х точек взяты из работы Fisher (1928), нижние — из работы Garwood (1934). Замечательна равномерность ошибок аппроксимации Пирсона верхних 5%-х точек; поправка 0.16(ν + 2)−1 дала бы точный результат. То же самое наблюдается для нижних 5%-х точек при ν = 4 и ν = 7.

399

8. АППРОКСИМАЦИИ

используется обратная функция x(w∗ , ν , λ ) = w∗ + w∗ ν −1 +

 1 ∗ w 1 − (ν + 2)−1 w∗ λ 2 ν −2 2

.

(29.65)

Если χν2,α есть табл. 100α %-я точка центрального χν2 -распределения, то x∗ = χν2,α + χν2,α λν −1 +

 1 2  χν,α 1 − (ν + 2)−1 χν2,α λ 2 ν −2 2

(29.66)

является приближенным решением значением x(α , ν , λ ). Упомянем теперь еще две формулы, полученные непосредственно нормальной аппроксимацией. Приближая χν 2 (λ ) нормальной величиной, получаем:   x−ν−λ , (29.67) F(x; ν , α ) ≈ Φ 1/2 {2(ν + 2λ )}

где 1 Φ(y) = √ 2π

y

e−u

2

/2

du.

−∞

Применив нормальную аппроксимацию к правой части (29.6), Johnson (1959) получил приближенное равенство   x−ν−λ +1 F(x; ν , α ) ≈ Φ . (29.68) 1/2 {2(ν + 2λ )}

В обоих случаях порядок ошибки равен O(λ −1/2 ) при λ → ∞ равномерно по x. Приведенные аппроксимации просты, но не очень точны. Сравнительная точность некоторых аппроксимаций приведена в табл. 29.2. По таблице видно, что только формулы Пирсона (29.60) и Санкарана (29.61) надежны во всем диапазоне λ . Формулы Патнайка и Абдель-Аты теряют точность при возрастании λ , в то время как точность других формул увеличивается. Germond and Hastings (1944) приводят аппроксимацию  

2 R2 λ 2 exp − , (29.69) Pr χ2 (λ )  R ≈ 2 2 2 + R /2

2 + R /2

которая дает четыре верных знака при R  0.4. Авторы также приводят небольшую поправку этой формулы, обеспечивающую четыре верных десятичных знака до R = 1.2, а также поправки для больших значений R. При R = 5 формула ∞ 



1 Pr χ2 2 (λ )  R2 ≈ √







λ−

e−t

2

/2

dt

(29.70)

R2 −1

дает приемлемые результаты. Упомянем еще эвристическую формулу для x(0.95, ν , λ ), приведенную Tukey (1957), которая, похоже, весьма точна.

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

400

Следующие полезные аппроксимации при больших x и λ принадлежат Temme (1993): √  (ν−1)/4  √  x 1−Φ при x > λ , F(x; ν , λ ) ≈ 1 − 2x − 2λ (29.71a) λ  (ν−1)/4   √ √ x F(x; ν , λ ) ≈ 2λ − 2x при x  λ . (29.71b) 1−Φ λ

9.

Приложения

Одно из приложений нецентрального χ 2 -распределения связано с тем, что таково распределение выборочной дисперсии нормальной популяции с переменным средним значением, об этом уже сказано в п. 1. По-видимому более распространенным приложением является аппроксимация мощности χ 2 -критерия применительно к таблицам сопряженности (критериям согласия). Один из простейших вариантов таков. N наблюдений разделяются на k классов: Π1 , Π2 , . . . , Πk , причем класс Πi содержит Ni наблюдений, i = 1, 2, . . . , k. Гипотеза H0 состоит в том, что вероятность попадания в класс Πi равна πi0 , i = 1, . . . , k. Альтернативная гипотеза: вероятности не равны гипотетическим. Аппроксимация критерия максимального правдоподобия состоит в том, что критическая область строится в виде T=

k  (Ni − N πi0 )2 i=1

N πi0

> Kα ,

(29.72)

где Kα выбирается подходящим образом. Если истинные вероятности равны $k  2 πi , i = 1, . . . , k, с условием i=1 πi = 1, то распределение T близко к χk−1 (λ ), где k  (π − π )2 i i0 λ =N . i=1

πi0

Если πi = πi0 при всех i, т. е. верна нулевая гипотеза, то λ = 0 и распределение 2 близко к центральному распределению χk−1 . Таким образом, на уровне значимости α следует взять 2 Kα = χk−1, α. Мощность критерия в случае, если истинные вероятности равны π1 , π2 , . . . , πk , приближенно равна

 2 2 (λ ) > χk−1, Pr χk−1 α . Подробное обсуждение более сложных форм χ 2 -тестов содержится в работе Patnaik (1949). Нецентральное χ 2 -распределение встречается в приближенных расчетах мощности некоторых непараметрических критериев. [Andrews (1945), Lehmann (1959, pp. 302–306)]. Следуя построениям книги Wilks (1962, p. 419), можно показать, что, если данные представляют n независимых случайных величин, зависящих от параметров (θ1 , . . ., θn ), то предельное при n → ∞ распределение величины −2 log(отношения правдоподобия)

401

9. ПРИЛОЖЕНИЯ

для некоторых последовательностей альтернативных гипотез, сходящихся к нулевой гипотезе, имеет нецентральное χ 2 -распределение. Отношение правдоподобия здесь равно отношению максимумов двух функций правдоподобия: числитель — при ограничении, что некоторые из значений θ1 , . . ., θn фиксированы, а знаменатель — без таких ограничений. Sigura (1968) рассмотрел распределение логарифма отношения правдоподобия при проверке многомерной линейной гипотезы. Он получил асимптотическое разложение до членов порядка n−1 в виде линейной комбинации χ 2 -распределений с возрастающими числами степеней свободы и одинаковыми параметрами нецентральности. Рассмотрим случайную точку (X1 , X2 , . . . , Xν ), координаты которой — независимые нормальные случайные величины с нулевым средним и одинаковыми среднеквадратическими отклонениями. Вероятность попадания этой точки $ν 2 (X − ξ )  R2 со смещенным от O центром равна в сферу i i i=1 ( ) + * ν  2  R 2 −2 2 . Pr χν σ ξi  σ

i=1

При ν = 2 это — вероятность попадания двумерного нормального случайного вектора, имеющего симметричное распределение с маргинальными дисперсиями σ 2 , в окрестность радиуса R точки (ξ1 , ξ2 ). Имеется несколько таблиц этой вероятности, в частности, для интересных физикам приложений при ν = 2 и ν = 3. Подробный обзор и библиографические ссылки приводят Guenther and Terragno (1964). Для ν = 2 имеются подробные таблицы в работах Bell Aircraft Corporation (1956), Di Donato and Jarnagin (1962a), Marcum (1950). Наиболее доступные таблицы содержатся в учебнике Birington and May (1970), сообщениях Di Donato and Jarnagin (1962a, b) и в книге Owen (1962, pp. 178–180). Таблицы в работах Di Donato and Jarnagin (1962a, b) содержат значения R/σ в зависимости от приведенной выше вероятности. Другие работы содержат таблицы вероятностей в зависимости от R/σ и (ξ12 + ξ22 )/σ 2 . При ν = 3 имеет место простое соотношение  2   R 1 =√ Pr χ3 2 (λ )  σ









λ 1/2 +(R/  σ)

2

λ 1/2 −(R/σ )

1 1 R λ 1/2 − exp − 2 σ 2πλ

−√

  1 exp − u2 du −

2 

     1 R 2 λ 1/2 + − exp − . (29.73) 2

σ

Таким образом, нет надобности в специальных таблицах, хотя короткую таблицу приводит Guenther (1961). Общие условия, при которых квадратичная форма от нормальных случайных величин имеет нецентральное χ 2 -распределение, приведены в гл. 29 первого издания настоящей книги. Spruill (1979) показал, что измерения мощности в электросети приводят к оценке параметров нецентрального хи-квадрат распределения.

402

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

Перечислим приложения нецентрального χ 2 -распределения в различных областях финансовой математики. 1. Boyle (1978, 1979) рассмотрел объемы индивидуальных исков в определенных областях страхования и нашел, что они распределены по закону K χ22 , т. е. имеют экспоненциальное распределение. Число исков в течение фиксированного периода, например, за год распределено по закону Пуассона. Отсюда получается, что суммарная величина исков имеет распределение K χ2 2 (2θ ), где θ — параметр распределения Пуассона. 2. Cox, Ingersoll and Ross (1985) исследовали распределение процентной ставки в определенных предположениях относительно технологических изменений, в предположении существования преференций, а также в предположении устойчивости распределения процентной ставки. Авторы отметили, что плотность распределения процентной ставки в момент s при условии, что известно ее значение в момент t, следуя обратимым в среднем процессам, описывается плотностью нецентрального χ 2 -распределения с параметром нецентральности, пропорциональным текущему значению спотовой ставки. 3. Более тонкий анализ касается так называемой модели постоянной эластичности дисперсии (CEV — constant elasticity of variance model), описывающей волатильность биржевых цен. Предполагается, что цены описываются «диффузионным процессом» типа dS = μ Sdt + δ Sβ −2 dZ, где dZ — винеровский процесс, а (β − 2) есть так называемая эластичность дисперсии коэффициента возврата в зависимости от цены. Если β = 2, то эластичность равна нулю и цены имеют логнормальное распределение, а дисперсия коэффициента возврата постоянна. Используя результаты статьи Cox, Ingersoll and Ross (1985), Shroder (1989) показал, что модель CEV описывается смесью двух нецентральных χ 2 -распределений с разным числом степеней свободы и одинаковыми параметрами нецентральности. 4. Hayya and Ferrara (1972) получили нецентральное χ 2 -распределение, анализируя модель риска, связанную с ценами и доходами.

10.

Распределения, связанные с нецентральным χ 2-распределением

В п. 6 отмечено, что χ1 (λ ) есть кратная нормальная случайная величина (рассмотренная в гл. 13). Формулы (29.3) и (29.4) описывают связь между нецентральным χ 2 -распределением и распределением Пуассона. Перечислим другие соотношения, уже упомянутые в этой главе. 1. Если λ = 0, то нецентральное χ 2 -распределение превращается в центральное χ 2 -распределение. 2. Предельное распределение нормированной величины χν 2 (λ ) является стандартным нормальным распределением при (a) ν → ∞ и постоянном λ и (b) при λ → ∞ и постоянном ν .

10. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НЕЦЕНТРАЛЬНЫМ χ 2 -РАСПРЕДЕЛЕНИЕМ

403

3. Предельное распределение нормированной (обычной или двойной) нецентральной случайной величины F при стремлении к бесконечности числа степеней свободы числителя (и постоянным параметром нецентральности) есть распределение величины, пропорциональной случайной величине χ 2 (гл. 30, п. 5). 4. Press (1966) показал, что распределение линейной функции от независимых нецентральных χ 2 случайных величин с положительными коэффициентами выражается смесью центральных χ 2 -распределений. Это является частью теории квадратичных форм от нормальных случайных величин, которая приводится в одной из глав тома «Многомерные непрерывные распределения». 5. Смеси центральных χ 2 -распределений, подобных (29.3), но с другими весами возникают как распределения при нулевой гипотезе в некоторых статистических критериях. Bartholomew (1959a, b) описывает такую ситуацию при построении проверки гипотезы о равенстве математических ожиданий последовательности {ξi } , i = 1, . . . , k, против гипотезы о их зависимости от порядка следования величин ξi . Статистика m  cj Xj $m χ2 = , cj > 0, (29.74) j=1

i=1 ci

полученная по значениям независимых в совокупности случайных величин X1 , . . . , Xm , где Xj имеет распределение χν2j , j = 1, 2, . . . , m, распределена как смесь центральных χ 2 -распределений. Название распределение χ 2 с чертой (chi-bar-squared), по видимому придумано в работе Conoway et al. (1990) применительно к распределению, получаемому заменой центральных χ 2 -распределений на нецентральные [см. гл. 18, формула (18.71)]. Последнее, в свою очередь, можно в соответствии с (29.4) представить как смесь центральных χ 2 -распределений, т. е. (29.74) включает все распределения χ 2 с чертой. Об этом подробно можно прочитать в работах Bartholomew (1961), Barlow et al. (1972) и Conoway et al. (1990). Распределение χ 2 с чертой получается как смесь нецентральных χ 2 -распределений, в котором параметр нецентральности является случай величиной. Плотность соответствующей случайной величины, назовем ее Y, равна ⎡  j ⎤ 1 ∞  λ ⎦ p(y; ν + 2j, 0) pY (y) = E ⎣e−λ /2 2 (29.75) j=0

j!

с соответствующей формулой для функции распределения. Szroeter (1992) рассмотрел случай, в котором λ = T T + c2 ,

где T — случайный r × 1-вектор с матрицей ковариаций Ω и вектором средних τ . Пусть ω — наибольшее собственное значение Ω . Тогда при ω → 0 Eλ [F(x; ν , λ )] → F(x; ν , Λ),

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

404 где

Λ = τ τ + c2 .

Szroeter (1992) получил границы (1 − θδ −2 )F(x; ν , Λ + δ )  Eλ [F(x; ν , λ )   (1 − θδ −2 )F(x; ν , max(0, Λ − δ ) + θδ −2 ), √ справедливые при всех δ  θ , где

θ = ω 2Λ + 2ω rank(Ω ) + ω {rank(Ω )}2 .

(29.76)

Он также вывел другую верхнюю границу в виде 

Eλ [F(x; ν , λ )]  F x; ν , (1 + ω )−1 Λ и нижнюю границу

где 

ν =

(29.77a)



F (1 + ω )−1 x; ν  , Λ  Eλ [F(x; ν , λ )],

(29.77b)

ν при ν = r = rank(Ω ), c = 0, max(ν , rank(Ω ) + 1) в противном случае.

Если X1 и X2 — независимые случайные величины и Xj распределено как χν j 2 (λj ), j = 1, 2, то распределение отношения Y = X1 /X2 легко получить в виде распределения смеси случайных величин Gν1 +2j1 ,ν2 +2j2 , определенных в гл. 27 с весами, равными произведениям пуассоновских вероятностей: ⎧   ih ⎫ 1 2 ⎨ , λh ⎬ e−λh /2 2 . (29.78) ih ! ⎭ ⎩ h=1

Используя (27.3) (гл. 27), получаем: ⎧   ih ⎫ 1 ∞ ⎨, 2 ∞   λh ⎬ 2 pY (y) = e−(λ1 +λ2 )/2 × ih ! ⎭ ⎩ i1 =0 i2 =0 h=1 * ×

y(ν1 /2)+i1 −1   1 1 1 B ν1 + i1 , ν2 + i2 (1 + y) 2 (ν1 +ν2 )+i1 +i2 2 2

+ . (29.79a)

Распределение произведения Z = X1 X2 также является смесью распределений χν21 +2i1 и χν22 +2i2 с теми же весами (29.78). Выражения получаются более сложными, чем (29.79a), поскольку распределение произведения χν21 +2i1 и χν22 +2i2 более громоздко, чем распределение отношения. Используя распределение произведения двух независимых гамма-распределенных случайных величин, приведенное в гл. 17, п. 8.4, получаем: ⎧  ih ⎫   14 (ν1 +ν2 )+ 12 (ν1 +ν2 )−1 √ 1 1 ∞ ⎨, 2 ∞   z λh ⎬ K 1 (ν −ν )+i −i ( z) 2 1 2 −(λ1 +λ2 )/2 2 1 2 2 , e     1 1 ih ! ⎭ ⎩ Γ ν +i Γ ν +i i1 =0 i2 =0

h=1

2

1

1

2

2

2

(29.79b)

405

СПИСОК ЛИТЕРАТУРЫ

где 1 Kg (y) = 2

∞ 

  1 tg−1 exp − y(t + t−1 ) dt 2

0

— модифицированная функция Бесселя 2-го рода (см. гл. 1); отметим, что Kg (y) = K−g (y). Kotz and Srinivasan (1969) вывели формулы (29.79a) и (29.79b) с помощью преобразования Меллина. В полученных ими формулах суммирование по i1 и i2 заменено суммированием по i1 и i1 +i2 . Более простая формула получается в случае двух степеней свободы; она также приводится в работе Kotz and Srinivasan (1969).

Список литературы Abdel-Aty, S. H. (1954). Approximate formulae for the percentage points and the probability integral of the non-central χ 2 -distribution, Biometrika, 41, 538–540. Abramowitz, M., and Stegun, I. A. (1964). Handbook of Mathematical Functions with Formulas, Graphs and Mathematical Tables, National Bureau of Standards, Applied Mathematics Series, 55, Washington, DC: GPO 1) . Alam, K., and Rizvi, M. H. (1967). On non-central chi-squared and non-central F distributions, The American Statistician, 21(4), 21–22. Alam, K., and Saxena, L. (1982). Estimation of the noncentrality parameter of a chi-square distribution, Annals of Statistics, 10, 1012–1016. Anderson, D. A. (1981a). The circular structural model, Journal of the Royal Statistical Society, Series B, 43, 131–143. Anderson, D. A. (1981b). Maximum likelihood estimation in the non-central chi-distribution with unknown scale parameter, Sankhy¯a, Series B, 43, 58–67. Andrews, F. C. (1954). Asymptotic behavior of some rank tests for analysis of variance, Annals of Mathematical Statistics, 25, 724–736. Ashour, S. K., and Abdel-Samad, A. I. (1990). On the computation of non-central χ 2 distribution, Communications in Statistics— Simulation and Computation, 19, 1279–1291. Bargmann, R. E., and Ghosh, S. P. (1964). Noncentral Statistical Distribution Programs for a Computer Language, IBM Research Report R.C.-1231. Bark, L. S., Bol’shev, L. N., Kuznetzov, P. I., and Cherenkov, A. P. (1964). Tables of the Rayleigh-Rice Distribution, Computation Center, Academy of Sciences, USSR, Moscow 2) . Bartholomew, D. J. (1959a). A test of homogeneity for ordered alternatives, Biometrika, 46, 36–48. Bartholomew, D. J. (1959b). A test of homogeneity for ordered alternatives II, Biometrika, 46, 328–335. Bartholomew, D. J. (1961). A test of homogeneity of means under restricted alternatives, Journal of the Royal Statistical Society, Series B, 23, 239–272. Barlow, R. E., Bartholomew, D. J., Bremner, J. M., and Brunk, H. D. (1972). Statistical Inference under Order Restrictions— The Theory and Application of Isotonic Regression, New York: Wiley. 1) Абрамовиц

М., Стиган И. Справочник по специальным функциям. — М.: Наука, 1979. Л. С., Большев Л. Н., Кузнецов П. И. Таблицы распределения Рэлея—Райса. — М.: Вычислительный центр АН СССР, 1964. — 246 с 2) Барк

406

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

Bell Aircraft Corporation (1956). Tables of Circular Normal Probabilities, Report No. 02949-106, Operations Analysis Group, Dynamics Section, Bell Aircraft Corporation. Buffalo. NY. Bennett, B. M. (1955). Note on the moments of the logarithmic noncentral χ 2 and z distributions, Annuls of the Institute of Statistical Mathematics, 7, 57–61. Boardman, T. J., and Kopitzke, R. W. (1975). Probability and table values for statistical distributions, Proceedings of ASA Statistical Computing Section, pp. 81–86. Bock, M. E., Judge, G. G., and Yancey, T. A. (1984). A simple form for the inverse moments of non-central χ 2 and F random variables and certain confluent hypergeometric functions, Journal of Econometrics, 25, 217–234. Bol’shev, L. N., and Kuznetzov, P. I. (1963). On computing the integral p(x, y) = . . . Zhurnal Vychislitelnoj Matematiki i Matematicheskoi Fiziki, 3, 419–430. (In Russian) 1) . Bol’shev, L. N., and Smirnov, N. V. (1965). Tables of Mathematical Statistics, Moscow: Akademia Nauk SSSR 2) . Boomsma, A., and Molenaar, I. W. (1994). Four electronic tables for probability distributions, The American Statistician, 48, 153–162. Boyle, P. P. (1978). The Poisson-exponential model and the non-central chi-squared distribution, Scandinavian Actuarial Journal, 108–111. Boyle, P. P. (1979). Reply to remark by Thelander, Scandinavian Actuarial Journal, 55–56. Burington, R. S., and May, D. C. (1970). Handbook of Probability and Statistics with Tables, Second edition, Sandusky, OH: Handbook Publishers. Chou, Y.-M., Arthur, K. H„ Rosenstein, R. B., and Owen, D. B. (1984). New representations of the non-central chi-square density and cumulative, Communications in Statistics— Theory and Methods, 13, 2673–2678. Chow, M. S. (1987). A complete class theorem for estimating a non-ccntrality parameter, Annals of Statistics, 15, 800–804. Cohen, J. P. (1988). Noncentral chi-square: Some observations on recurrence, The American Statistician, 42, 120–122. Conoway, M., Pillers, C., Robertson, T., and Sconing, J. (1990). The power of the circular cone test: A noncentral chi-bar-squared distribution, Canadian Journal of Statistics, 18, 63–70. Cox, J., Ingersoll, E., and Ross, S. A. (1985). A theory of the term structure of interest rates, Econometrics, 53, 385–407. De Waal, D. J. (1974). Bayes estimate of the noncentrality parameter in multivariate analysis, Communications in Statistics, 3, 73–79. Di Donato, A. R., and Jarnagin, M. P. (1962a). A method for computing the generalized circular error function and circular coverage functions, NWL Report No. 1768, U. S. Naval Weapons Laboratory, Dahlgren, VA. Di Donato, A. R., and Jarnagin, M. P. (1962b). A method for computing the circular coverage function, Mathematics of Computation, 16, 347–355. Ding, C. G. (1992). Algorithm AS 275: Computing the non-central χ 2 distribution function, Applied Statistics, 41, 478–482. Dwivedi, T. D., and Pandey, J. N. (1975). A note on Meyer’s maximum likelihood estimate of the non-centrality of the non-central χ 2 variate, Sankhy¯a, Series B, 37, 453–456. Egcrton, M. F., and Laycock, P. J. (1982). An explicit formula for the risk of James-Stein estimators, Canadian Journal of Statistics, 10, 199–205. ∞ 2 2 Кузнецов П. И. О вычислении интеграла p(x, y) = 2 0 ue−(u +y ) i0 (2uy)du // Ж. вычисл. матем. и матем. физ. — 1963. — 3:3. — С. 419–430. 2) Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — М.: Наука, 1965. 1) Большев Л. Н.,

СПИСОК ЛИТЕРАТУРЫ

407

Elandt, R. C. (1961). The folded normal distribution: Two methods of estimating parameters from moments, Technometrics, 3, 551–562. Ennis, D. M., and Johnson, N. L. (1993). Noncentral and central chi-square, F and beta distribution functions as special cases of the distribution of an indefinite quadratic form. Communications in Statistics— Theory and Methods, 22, 897–905. Farebrother, R. W. (1987). Algorithm AS 231: The distribution of a noncentral χ 2 variable with nonnegative degrees of freedom, Applied Statistics, 36, 402–405. Felsen, L. B. (1963). Radiation from a uniaxially anisotropic plasma half-space, IEEE Transactions on Antennas and Propagation, 11, 469–484. Fisher, R. A. (1928). The general sampling distribution of the multiple correlation coefficient. Proceedings of the Royal Society of London, 121A, 654–673. Fix, E. (1949). Tables of non-central χ 2 , University of California Publications in Statistics, 1, No. 2, 15–19. Garwood, F. (1934). Cited in Abdel-Aty (1954), Unpublished Ph. D. dissertation, University of London. Germond, H. H., and Hastings, C. (1944). Scatter Bombing of a Circular Target, A report submitted by the Bombing Research Group, Columbia University and the Applied Mathematics Group, Columbia University to the Applied Mathematics Panel, National Defense Research Committee, May 1944. Ghosh, B. K. (1973). Some monotonicity theorems for χ 2 , F and t distributions with applications, Journal of the Royal Statistical Society, Series B, 35, 480–492. Gideon, R. A., and Gurland, J. (1977). Some alternative expansions for the distribution function of a noncentral chi-square variable, SIAM Journal on Mathematical Analysis, 8, 100–110. Graybill, F. A. (1961). An Introduction to Linear Models, vol. 1, New York: McGraw-Hill. Guenther, W. C. (1961). On the probability of capturing a randomly selected point in three dimensions, SIAM Review, 3, 247–250. Guenther, W. C. (1964). Another derivation of the non-central chi-square distribution, Journal of the American Statistical Association, 59, 957–960. Guenther, W. C. (1975). Evaluation of noncentral distribution integrals with a desk calculator, Research Paper No. 80 S-1975-578, College of Commerce and Industry, University of Wyoming, Laramie. Guenther, W. C., and Terragno, P. J. (1964). A review of the literature on a class of coverage problems, Annals of Mathematical Statistics, 35, 232–260. Han, C. P. (1975). Some relationships between noncentral chi-squared and normal distributions, Biometrika, 62, 213–214. Haynam, G. E., Govindarajulu, Z., and Leone, F. C. (1973). Tables of the cumulative non-central chi-square distribution, In Selected Tables in Mathematical Statistics, vol. 1 (eds., H. L. Harter and D. B. Owen,) Providence, RI: American Mathematical Society, pp. 1–78. Hayya, J. C., and Ferrara, W. L. (1972). On normal approximations to the frequency functions of standard forms where the main variables are normally distributed, Management Science, 19, 173–186. Helstrom, C. W. (1960). Statistical Theory of Signal Detection, Oxford: Pergamon. Hjort, N. L. (1989). The eccentric part of the non-central chi-square distribution, Manuscript, Norwegian Computing Center, Oslo. Johnson, N. L. (1959). On an extension of the connexion between Poisson and χ 2 distributions, Biometrika, 46, 352–363. Johnson, N. L. (1962). The folded normal distribution: Accuracy of estimation by maximum likelihood, Technometrics, 4, 249–256.

408

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

Johnson, N. L. (1968). Tables of Percentile Points of Noncentral Chi-square Distributions, Mimeo Series No. 568, Institute of Statistics, University of North Carolina. Johnson, N. L., and Leone, F. C. (1964). Statistics and Experimental Design in Engineering and the Physical Sciences, vol. I, New York: Wiley. Johnson, N. L., and Pearson, E. S. (1959). Tables of percentage points of non-central X, Biometrika, 56, 315–333. Jones, M. C. (1989). Letter to the editor, The American Statistician, 43, 68. Kallenberg, W. C. M. (1990). Inequalities for noncentral chi-square distributions, Statistics & Probability Letters, 9, 273–278. Kerridge, D. (1965). A probabilistic derivation of the non-central χ 2 distribution, Australian Journal of Statistics, 7, 37–39. (Correction: 7, 114.) Khamis, S. H. (1965). Some basic properties of the incomplete gamma function, Annals of Mathematical Statistics, 36, 926–937. Kotz, S., and Srinivasan, R. (1969). Distribution of product and quotient of Bessel function variates, Annals of the Institute of Statistical Mathematics, 21, 201–210. Kubokawa, T., Robert, C. P., and Saleh, A. K. Md. E. (1993). Estimation of noncentrality parameters, Canadian Journal of Statistics, 21, 45–57. Lam, Y.-M. (1987). Confidence intervals for noncentrality parameters of noncentral chisquared and F distributions, Proceedings of ASA Statistical Computing Section, 441–443. Lau, C. (1980). Algorithm AS 147. A simple series for the incomplete gamma integral, Applied Statistics, 29, 113–114. Lehmann, E. L. (1959). Testing Statistical Hypotheses, New York: Wiley (2nd ed., 1986) 1) . Leone, F. C„ Nelson, L. S., and Nottingham, R. B. (1961). The folded normal distribution, Technometrics, 3, 543–550. Lowe, J. R. (1960). A table of the integral of the bivariate normal distribution over an offset circle, Journal of the Royal Statistical Society, Series B, 22, 177–187. Marcum, J. I. (1948). A statistical theory of target detection by pulsed radar: mathematical appendix, Research Memorandum RM-733, Rand Corporation, Santa Monica, CA. [Also published as Marcum, J. I., and Swerling, P. (1960), IRE Transactions PGIT, Vol. IT-4.] Marcum, J. I. (1950). Tables of Q-functions, Rand Report No. RM-339, Rand Corporation, Santa Monica, CA. Marden, J. I. (1982). Combining independent non-central chi-squared or F tests, Annals of Statistics, 10, 266–267. McNolty, F. (1962). A contour-integral derivation of the non-central chi-square distribution, Annals of Mathematical Statistics, 33, 796–800. Meyer, P. L. (1967). The maximum likelihood estimate of the non-centrality parameter of a non-central χ 2 variate, Journal of the American Statistical Association, 61, 1258–1264. Miller, K. S., Bernstein, R. I., and Blumenson, L. E. (1958). Generalized Rayleigh processes, Quarterly of Applied Mathematics, 16, 137–145 (and Note, Ibid; 20, Jan. 1963). Narula, S. C., and Desu, M. M. (1981). Algorithm AS 170. Computation of probability and non-centrality parameter of a non-central χ 2 distribution, Applied Statistics, 30, 349–352. Narula, S. C., and Levy, K. J. (1975). Probability density plots of the noncentral χ 2 and noncentral F distributions, International Statistical Review, 43, 79–82. Neff, N., and Strawderman, W. E. (1976). Further remarks on estimating the parameters of a noncentral chi-square distribution, Communications in Statistics— Theory and Methods, A5, 66–76.

1) Леман

Э. Проверка статистических гипотез. — М.: Наука, 1964.

СПИСОК ЛИТЕРАТУРЫ

409

Oosterhoff, J., and Schreiber, B. F. (1987). A note on complete families of distributions, Statistica Neerlandica, 41, 183–189. Owen, D. B. (1962). Handbook of Statistical Tables, Reading, MA: Addison-Wesley 1) . Park, J. H. (1961). Moments of the generalized Rayleigh distribution, Quarterly of Applied Mathematics, 19, 202–232. Patnaik, P. B. (1949). The non-central χ 2 - and F-distributions and their applications, Biometrika, 36, 202–232. Pearson, E. S. (1959). Note on an approximation to the distribution of noncentral χ 2 , Biometrika, 46, 364. Perlman, M. D., and Rasmussen, U. (1975). Some remarks on estimating a non-centrality parameter, Communications in Statistics, 4, 455–468. Pike, M. C., and Hill, I. D. (1966). Algorithm 291. Logarithm of the gamma function, Communications of the Association for Computing Machinery, 9, 684. Posten, H. O. (1989). An effective algorithm for the noncentral chi-squared distribution function, The American Statistician, 43, 261–263. Press, S. J. (1966). Linear combinations of noncentral chi-square variates, Annals of Mathematical Statistics, 37, 480–487. Quenouille, M. H. (1949). The evaluation of probabilities in a normal multivariate distribution, with special reference to the correlation ratio, Proceedings of Edinburgh Mathematical Society, Series 2, 8, 95–100. Rainville, E. D. (1960). Special Functions, New York: Macmillan. Rice, S. O. (1968). Uniform asymptotic expressions for saddle point integrals— Application to a probability distribution occurring in noise theory, Bell System Technical Journal, 47, 1971–2013. Robertson, G. H. (1969). Computation of the noncentral chi-square distribution, Bell System Technical Journal, 48, 201–207. Roy, J., and Mohamad, J. (1964). An approximation to the non-central chi-square distribution, Sankhy¯a, Series A, 26, 81–84. Ruben, H. (1960). Probability content of regions under spherical normal distributions, I, Annals of Mathematical Statistics, 31, 598–618. Ruben, H. (1974). Non-central chi-square and gamma revisited, Communications in Statistics, 3, 607–633. Ruben, H. (1976). A new result on the probability integral of noncentral chi-square with even degrees of freedom, Manuscript, McGill University, Montreal, Canada. Sankaran, M. (1959). On the noncentral chi-square distribution, Biometrika, 46, 235–237. Sankaran, M. (1963). Approximations to the noncentral chi-square distribution, Biometrika, 50, 199–204. Schneider, H. (1989). Failure-censored variables-sampling plans for lognormal and Weibull distributions, Technometrics, 31, 199–206. Schroder, M. (1989). Computing the constant elasticity of variance option pricing formula, Journal of Finance, 44, 211–219. Sen, P. K. (1989). The mean-median-mode inequality and noncentral chi square distributions, Sankhy¯a, Series A, 51, 106–114. Shea, B. L. (1988). Algorithm AS 239. Chi-squared and incomplete gamma integral, Applied Statistics, 37, 466–473. Sicgel, A. F. (1979). The noncentral chi-squared distribution with zero degrees of freedom and testing for uniformity, Biometrika, 66, 381–386.

1) Оуэн

Д. Сборник статистических таблиц. — М.: АН СССР, 1966. — 568 с.

410

ГЛАВА 29. НЕЦЕНТРАЛЬНОЕ χ 2 -РАСПРЕДЕЛЕНИЕ

Spruill, M. C. (1979). Estimation of the non-centrality parameter of a chi-squared distribution, Unpublished Report, School of Mathematics, Georgia Institute of Technology, Atlanta, Georgia. Spruill, M. C. (1986). Computation for the maximum likelihood estimate of a non-centrality parameter, Journal of Multivariate Analysis, 18, 216–224. Sugiura, N. (1968). Asymptotic expansions of the power functions of the likelihood ratio tests for multivariate linear hypotheses and independence, Mimeo Series No. 563, Institute of Statistics, University of North Carolina, Chapel Hill. Szroeter, J. (1992). Bounds for non-central chi-square distributions having unobservable random non-centrality parameters, Statistics & Probability Letters, 13, 73–81. Tang, P. C. (1938). The power function of the analysis of variance tests with tables and illustrations of their use, Statistical Research Memoirs, 2, 126–149. Temme, N. M. (1993). Asymptotic and numerical aspects of the noncentral chi-square distribution, Computers in Mathematics and Applications, 25(5), 55–63. Tiku, M. L. (1965). Laguerre series forms of non-central χ 2 and F distributions, Biometrika, 52, 415–426. Torgerson, E. N. (1972). Supplementary notes on linear models, Statistical Memoirs-1, Institute of Mathematics, University of Oslo, Norway. Tukey, J. W. (1957). Approximations to the upper 5% points of Fisher’s B distribution and non-central χ 2 , Biometrika, 44, 528–530. Ullah, A. (1976). On the sampling distribution of improved estimators for coefficients in linear regression, Journal of Econometrics, 2, 143–180. Urkowitz, H. (1967). Energy detection of unknown deterministic signals, Proceedings of IEEE, 55, 523–531. Var der Vaart, H. R. (1967). A note on the derivation of the non-central chi-square density function, Statistica Neerlandica, 21, 99–100. Venables, W. N. (1971). Inference problems based on non-central distributions, Ph. D. dissertation, Department of Statistics, University of Adelaide, Australia. Venables, W. N. (1975). Calculation of confidence intervals for non-central distributions, Journal of the Royal Statistical Society, Series B, 27, 406–412. Wiener, H. L. (1975). A FORTRAN program for rapid computations involving the noncentral chi-square distributions, NRL Memorandum Report, Naval Research Laboratory, Washington, DC. Wiley, J. A., Herschokoru, S. J., and Padiau, N. (1989). Heterogeneity in the probability of HIV transmission in sexual contact: The case of male-to-female transmission in penile-vaginal intercourse, Statistics in Medicine, 8, 93–102. Wilks, S. S. (1962). Mathematical Statistics, New York: Wiley. Zolnowska, H. (1965). Generators of random numbers of Rayleigh and Rice’s distributions, Algorytmy, 3, 73–94.

ГЛАВА 30

Нецентральное F-распределение

1.

Определение и происхождение

В гл. 27 F-распределение с ν1 и ν2 степенями свободы введено ? 2 как  χν21 χν2 . распределение отношения независимых случайных величин ν1

ν2

χν2i

Если обе величины заменить величинами, имеющими нецентральные χ 2 -распределения, то полученная величина имеет двойное нецентральное F-распределение с ν 1 и ν 2 степенями свободы и с параметрами нецентральности λ1 и λ2 :   2 −1  2 χν1 (λ1 ) χν2 (λ2 ) . (30.1) ν1

ν2

В приложениях чаще рассматривается λ2 = 0, т. е. знаменателем (30.1) является центральная χ 2 величина. Это можно назвать простой нецентральной случайной величиной F с ν1 и ν2 степенями свободы и параметром нецентральности λ1 . Случай λ1 = 0, λ2 = 0 обычно не рассматривается как самостоятельный, поскольку получающаяся величина обратна к уже определенной простой нецентральной случайной величине F. Мы обозначаем F  ν1 ,ν2 (λ1 , λ2 ) двойную нецентральную случайную величину, определенную формулой (30.1), и Fν 1 ,ν2 (λ1 ) — простую нецентральную величину F:  2  2 −1 χν1 (λ1 ) χν2 (30.2) ν1

ν2

и также обозначаем соответствующее распределение. В наших обозначениях

−1 . F  ν1 ,ν2 (0, λ2) = Fν 2 ,ν1 (λ2 ) В этой главе рассматривается, главным образом, (простое) нецентральное F-распределение. Двойное нецентральное F-распределение появляется только в п. 7. Нецентральное F-распределение применяется при вычислении мощности критериев проверки общих линейных гипотез. В гл. 27 уже отмечено несколько ранних результатов, связанных с дисперсионным анализом: Tang (1938), Madow (1948), Lehmann (1959) и Scheff´e (1959). Более поздние работы, 411

412

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

включая Cohen (1977), Fleishman (1980), Cohen and Nel (1987), относятся к конкретным прикладным моделям.

2.

Исторические замечания

Нецентральное бета-распределение, связанное с F-распределением (см. п. 7) введено в работе Fisher (1928) в связи с исследованием множественных коэффициентов корреляции (см. гл. 32). Его свойства обсуждались в работе Wishart (1932). Нецентральное F-распределение получено в работе Tang (1938), хотя похоже, что первым такое название использовал Patnaik (1949). Tang (1938) использовал двойное нецентральное F-распределение (не используя, однако, это название) применительно к свойствам критериев в дисперсионном анализе при некоторых специальных условиях. Общая сводка по этому распределению и его приложениям к линейным моделям содержится в книге Odeh and Fox (1975).

3.

Свойства

Из независимости числителя и знаменателя в (30.2) следует, что μr



Fν 1 ,ν2 (λ1 )

 =

ν2 ν1

r

= e−λ1 /2

  2 μr χν 1 2 (λ1 ) μ−r χν 2 =



ν2 ν1

r Γ



1 ν −r 2 2   1 Γ ν 2 2



 ∞ 

1 λ 2 1

j=0

j!

j

 1 ν1 + j + r 2  ,  1 Γ ν +j 2 1 

Γ

следовательно, ν (ν + λ )

E Fν 1 ,ν2 (λ1 ) = 2 1 1 , ν2 > 2, ν1 (ν2 − 2)  2

  ν (ν1 + λ1 )2 + (ν1 + 2λ1 )(ν2 − 2) var Fν1 ,ν2 (λ1 ) = 2 2 , 2 ν1

(ν2 − 2) (ν2 − 4)

(30.3a) ν2 > 4.

(30.3b)

Третий центральный момент равен

 μ3 Fν 1 ,ν2 (λ1 ) =

* 

4 4 = (ν2 − 4)(ν2 − 6)

ν1 + λ1 ν2 − 2

3 +

6(ν1 + λ1 )(ν1 + 2λ1 )

ν2 > 6.

(ν2 − 2)2

+

2(ν1 + 3λ1 ) , + ν2 − 2

(30.3c)

413

3. СВОЙСТВА

Pearson and Tiku (1970) получили другие формулы. Пусть Λ1 = λ1 /ν1 . Тогда μ1 = μ2 = μ3 =

ν2 (1 + Λ1 ), (ν2 − 2)2

2ν22 (ν1 + ν2 − 2) ν1 (ν2 − 2)2 (ν2 − 4)

 1 + 2Λ1 +

8ν23 (ν1 + ν2 − 2)(2ν1 + ν2 − 2) ν 2 (ν − 2)3 (ν2 − 4)(ν2 − 6)

1 2 × 1 + 3Λ1 + μ4 =

(30.3a)’ ν1 Λ2 (ν1 + ν2 − 2) 1



(30.3b)

,

×

2ν12 6ν1 Λ21 + Λ3 2ν1 + ν2 − 2 (ν1 + ν2 − 2)(2ν1 + ν2 − 2) 1

12ν24 (ν1 + ν2 − 2) 3 ν1 (ν2 − 2)4 (ν2 − 4)(ν2 − 6)(ν2 − 8)

 (30.3c)

,

×

 × {2(3ν1 + ν2 − 2)(2ν1 + ν2 − 2) + (ν1 + ν2 − 2)(ν2 − 2)(ν1 + 2)}(1 + 4Λ1) +  ν 3 (ν + 10) 4 Λ1 . (30.3d) + 2ν1 (3ν1 + 2ν2 − 4)(ν2 + 10)Λ21 + 4ν12 (ν2 + 10)Λ31 + 1 2 (ν1 + ν2 − 2)

Выпишем обратные моменты величины при четных ν1 >2r 

ν −r = 1 E {Fν 1 ,ν2 (λ1 )}

r

ν2

×

Так:



 1 ν2 + r 2   × 1 Γ(r)Γ ν2 2 Γ

(−1)r−(ν1 /2)

r−1    r−1 1

Fν 1 ,ν2 (λ1 ).

λ1

 s−(ν1 /2)+1  1 Γ ν1 − s − 1 ×

s 2 s=0  t ⎧ 1 (ν1 /2)−s−2 − λ2 ⎨  2 × e−λ1 /2 − ⎩ t! t=0

при нечетных ν1 > 2r

E {Fν 1 ,ν2 (λ1 )}

−r

 =

ν1 ν2

×

r

1

r−1    r−1 1 s=0

×

(−1)r− 2 (ν1 −1)

⎧ ⎨ ⎩

s

2

2π −1/2 D



λ1

2

⎫ ⎬ ⎭

(30.4a)

;



 1 ν2 + r 2  × 1 Γ (r) Γ ν2 2 Γ

 s−(ν1 /2)+1  1 Γ ν1 − s − 1 ×

1 λ1 2

2

1/2 





1 λ1 2

1/2

1 2 (ν1 −5)−s





− 

t=0

1 λ 2 1

3 Γ t+ 2

t ⎫



 ⎭,

(30.4b)

где D(y) = e−y

2

y

2

eu du 0

414

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

— интеграл Даусона (Dawson) [Bock, Judge and Yancey (1984)]. При ν1  2r обратный момент бесконечен. Характеристическая функция равна e−λ1 /2

∞  j=0



1 λ 2 1 j!

j

 1 F1



1 ν ν it ν1 + j; − 2 ; − 2 . 2 2 ν1

(30.5)

виде Напомним, что в гл. 29 приведено представление величины χν 1 2 (λ 1 ) в  2 −λ1 /2 1 суммы центральных случайных величин χν1 +2j с весами e λ1 /j!, 2 j = 0, 1, 2, . . . , поэтому Gν1 ,ν2 (λ1 ) =

χν21 (λ1 )

(30.6)

χν22

имеет распределение,

совпадающее с распределением смеси величин  j 1 Gν1 +2j,ν2 , определенных в гл. 27 формулой (27.3), с весами e−λ1 /2 λ1 /j!, 2

j = 0, 1, 2, . . . . Следовательно, плотность распределения Gν1 ,ν2 (λ1 ) равна (мы для удобства пишем просто G )

pG (g) =

∞  j=0

=

⎛  1 j ⎞ λ1 2 ⎝ e−λ1 /2 ⎠  1 j!

g(ν1 /2)+j−1 =  1 1 B ν1 + j, ν2 (1 + g) 2 (ν1 +ν2 )+j 2 2

e−λ1 /2 g(ν1 /2)−1 × · 1 1 (1 + g)(ν1 +ν2 )/2 B ν1 , ν2 2 2 ⎛ 1 ⎞j ∞ λ1 g  ⎝ 2 ⎠ (ν1 + ν2 )(ν1 + ν2 + 2) · · · (ν1 + ν2 + 2(j − 1)) , × j!ν1 (ν1 + 2) · · · (ν1 + 2(j − 1)) 1+g 

j=0

Плотность распределения Fν 1 ,ν2 (λ1 ) = сокращенное обозначение F’)

0 < g. (30.7)

ν2  G (λ1 ) равна (снова используем ν1 ν1 ,ν2

ν /2 ν /2

pF (f ) =

e−λ1 /2 ν1 1 ν2 2 f (ν1 /2)−1 ×  ·  1 1 (ν2 + ν1 f )(ν1 +ν2 )/2 B ν1 , ν2 2 2 (1 )j ∞  λ1 ν1 f (ν1 + ν2 )(v1 + ν2 + 2) . . . (ν1 + ν1 + 2(j − 1)) 2 = × ν2 + ν1 f j!ν1 (v1 + 2) . . . (ν1 + 2(j − 1)) j=0

⎧* ⎫ +j ∞ ⎨ 1 λ v f ⎬  1 1 (ν1 + ν2 )(v1 + ν2 + 2) . . . (ν1 + ν1 + 2(j − 1)) 2 = pFν1 ,ν2 (f )e−λ1 /2 , j!ν1 (v1 + 2) . . . (ν1 + 2(j − 1)) ⎩ ν2 + ν1 f ⎭ j=0

(30.8)

415

3. СВОЙСТВА

где pFν1 ,ν2 (f ) — плотность центрального F-распределения с ν1 , ν2 степенями свободы. Заметим, что хотя ⎡  j ⎤ 1 ∞  e−λ1 /2 λ1 2 ⎣ ⎦ pGν +2j,ν (g), pG (g) = 1 2 j!

j=0

однако

⎡  j ⎤ 1 ∞  e−λ1 /2 λ1 2 ⎣ ⎦ pFν +2j,ν (f ). pF (f ) = 1 2 j!

j=0

При ν1 = ν2 = 1 плотность нецентрального F-распределения равна   e−λ /2 −1/2 1 f (1 + f )−1 1 F1 1; ; c = pF (f ) = π 2 

−λ /2 −1/2  −1 −1 1 + 2ec c1/2 D(c1/2) , = e f (1 + f ) λ

(30.9)

−1

где c = (λ /2)f (1 + f ) , D(·) — интеграл Даусона. Функция распределения выражается в виде ряда, члены которого пропорциональны нормированным неполным бета-функциям:  

ν Pr Fν 1 ,ν2 (λ1 )  f = Pr Gν1 ,ν2 (λ1 )  1 f = ν2

⎛  1 j ⎞ ∞ λ1    1 1 ⎝ 2 e−λ1 /2 ⎠ · Iν1 f /(ν2 +ν1 f ) ν1 + j, ν2 . (30.10) = 2

j!

j=0

2

Здесь Ip (a, b) — нормированная неполная бета-функция, определенная фор p ta−1 (1 − t)b−1 мулой Ip (a, b) = 0 dt. Существуют разные выражения для B(a, b)

нормированной неполной бета-функции (см. гл. 1), которым соответствуют различные выражения функции нецентрального F-распределения. В частности, если ν2 — четное целое, т. е. несколько простых выражений в виде конечных сумм. Sibuya (1967) отметил, что их можно получить, используя формальное разложение 

∞  j=0

1 λ 2 1 j!

j



e−λ1 /2 h(j) =

∞  j=0

1 λ 2 1 j!

j

Δj h(0)

(30.11)

[ср. с (29.12)’, гл. 29], где h(·) — нормированная неполная бета-функция, и рекуррентные соотношения, которым удовлетворяет эта функция. В частности, Sibuya (1967) показал, что при четном целом ν2 

(ν2 /2)−1



Pr Fν 1 ,ν2 (λ1 )  f = e(−λ1 /2)(1−Y) i=0

где Y = ν1 f /(ν2 + ν1 f ).

i 1 λ1 (1 − Y)   2 1 1 IY ν1 + i, ν2 − i , i! 2 2

(30.12)

416

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

  1 1 Записав IY ν1 + i, ν2 − i в виде полинома, получим формулу, приве2 2 денную в работе Seber (1963): ⎧ j ⎫  ⎪ ⎪ 1 ⎪  /2)−1 i ⎨ λ Y ⎪ ⎬   (ν2  i + (ν1 /2) − 1 2 1 1 ν1 /2 i exp − λ1 (1 − Y) (1 − Y) = Y i−j 2 j! ⎪ ⎪ ⎪ ⎪ i=0 j=0 ⎩ ⎭   1 = Y ν1 /2 exp − λ1 (1 − Y)

(ν2 /2)−1



2

Ti ,

(30.13)

i=0

где T−1 = 0, T0 = 1,

  1 1 1 Ti = i−1 (1 − Y) (2i − 2 + ν1 + λ1 Y)Ti−1 − (i + ν1 − 2)(1 − Y)Ti−2 , 2

2

2

1 i = 1, 2, . . . , ν2 − 1. 2

Эта формула получена в несколько ином виде в статьях Nicholson (1954) и Hodges (1955), но эти авторы не приводят рекуррентной формулы для Ti . Сходные выражения приводят Wishart (1932) и Tang (1938): (ν2 /2)−1

Y

1 2 (ν1 +ν2 )−1

e

−(λ1 /2)(1−Y)



Ti ,

(30.14)

i=0

где  = 0, T−1

T1 = 1, Ti = i−1 (Y −1 − 1) i = 1, 2, . . . ,





1 1 1   (ν1 + ν2 ) − i + λ1 Y Ti−1 + λ1 (1 − Y)Ti−2 2 2 2



,

1 ν2 − 1. 2

Формулы (30.12)–(30.14) применимы только при целых четных ν2 . Price (1964) нашел конечные выражения, применимые к случаю целых нечетных ν2 , но они весьма сложны и здесь не приводятся. Подставляя (30.11) непосредственно в (30.10), получаем разложение для всех ν2 :  

1 1 Pr Fν 1 ,ν2 (λ1 )  f = IY ν1 , ν2 − 2 2   1 (ν1 + ν2 ) Γ ∞ j  2 λ1 j−1 ν1 /2 (1 − Y)ν2 /2 Δ tj , −  Y  j! 1 j=0 Γ ν +1 2 1

где t1 = 1,

1 2

tj+1 = ( ν1 + j)−1





1 (ν1 + ν2 ) + j − 1 Ytj . 2

(30.15)

417

3. СВОЙСТВА

РИС. 30.1. Плотности нецентрального F-распределения

Это можно записать с помощью обобщенных полиномов Лагерра [см. Tiku (1965a)]. В той же работе получено более сложное по сравнению с (30.15), но быстрее сходящееся разложение ∞   

 1 1 (−1)j Y a/2 (1 − Y  )ν2 /2 j−1   Δ tj , (30.16)  a, ν2 + bj Pr Fν1 ,ν2 (λ1 )  f = IY 2

2

j=3

j!

B

1 1 a, ν 2 2 2

где tj определены в (30.15), a = (ν1 + λ1 )2 (ν1 + 2λ1 )−1 ,  −1 ν1 (ν1 + λ1 )  Y =1− 1+ f , ν2 (ν1 + 2λ2 )

b3 = 2λ12 (ν1 + 2λ1 )−2 , b4 = 6λ12 (ν1 + 4λ1 )(ν1 + 2λ1 )−3 ,

 b5 = 24λ12 ν1 + 6ν1λ1 + 11λ12 (ν1 + 2λ1 )−4 , . . . . Отметим, что bj , j = 3, 4, 5, . . . не зависят от ν2 . Можно показать, что Pr Fν 1 ,ν2 (λ1 )  f убывает по λ1 , что можно было предположить интуитивно. Плотность распределения унимодальна. При стремлении ν2 к бесконечности распределение Fν 1 ,ν2 (λ1 ) приближается к распределению величины ν1−1 χν 1 2 (λ1 ). При стремлении λ1 к нулю распределение, как и следует ожидать, сходится к центральному Fν1 ,ν2 -распределению. Другие разложения функции распределения и производящей функции моментов приводит Venables (1975). Narula and Levy (1975) построили графики плотности нецентрального F-распределения при λ1 = 3 и (ν1 , ν2 ) = (10, 10), (5, 10), (3, 10) и (1, 10). Графики показаны на рис. 30.1, a. При уменьшении числа степеней свободы числителя кривые становятся более плоскими, медиана, мода и среднее значение смещаются вправо. На рис. 30.1, b показано несколько графиков, также заимствованных из работы Narula and Levy (1975), плотности F-распределения при (ν1 ,ν2 ) = (5, 10) и при возрастании параметра нецентральности: λ1 = 0,

418

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

λ1 = 1, λ1 = 3 и λ1 = 5, Кривые также становятся более плоскими со смещением параметров расположения вправо.

4.

Таблицы и вычислительные алгоритмы

4.1.

Таблицы

Первые таблицы опубликовал Tang (1938). Целью этого расчета было вычисление мощности дисперсий. В таблицах при

критерия отношения ведены значения Pr Fν 1 ,ν2 (λ1 )  Fν1 ,ν2 ,α с тремя десятичными знаками для " α = 0.95, 0.99; ν1 = 1 (1) 8; ν2 = 2 (2) 6 (1) 30, 60, ∞ и λ1 /(ν1 + 1) = 1.0 (0.5) 3.0 (1) 8. Позже эти таблицы были воспроизведены во многих учебниках. Затем их расширил Lachenbruch (1966) значениями вероятностей с четырьмя десятичными знаками для тех же α и для " ν1 = 1 (1) 12 (2) 16 (4) 24, 30 (10) 50, 75; ν2 = 2 (2) 20 (4) 40 (10) 80 и λ1 /(ν1 + 1) = 1.0 (0.5) 3.0 (1) 8. Lachenbruch (1966) также привел таблицы процентных точек Fν 1 ,ν2 ,α (λ1 ) нецентрального F-распределения для λ1 = 2 (2) 20; α = 0.01, 0.025, 0.05, 0.1, 0.5, 0.9, 0.95, 0.975, 0.99; ν1 = 1 (1) 10, 15, 20, 30, 50, 60, 120 и ν2 = 2 (2) 10 (10) 40, 60. Значения приводятся с четырьмя десятичными знаками, кроме случаев ν1 = 1 и ν2  30, когда даются три значащие цифры. Только три значащие цифры приводятся в случаях ν1 = 2, 3, 4 при ν2 = 2; ν1 = 2, 3, при ν2 = 4; ν1 = 2, при ν2 = 6 и ν1 = 120 при ν2 = 30. Pearson and Hartley (1951) приводят графический аналог таблиц Танга (Tang) применительно к вычислению мощности критерия отношения дисперсий в дисперсионном анализе. Patnaik (1949) опубликовал таблицу, иллюстрирующую соотношение между λ1 , ν1 и ν2 , удовлетворяющих соотношению

Pr Fν 1 ,ν2 (λ1 )  Fν1 ,v2 ,α = β (30.17) α = 0.95, β = 0.5 и 0.9. Fox (1956) приводит диаграмму зависимости для " φ = λ1 /(ν1 + 1) на плоскости (ν1 , ν2 ) при выполнении условия (30.17) для α = 0.95, 0.99, β = 0.5 (0.1) 0.9. Lehmer (1944) приводит значения φ с тремя десятичными знаками для α = 0.95, 0.99; β = 0.2, 0.3, ν1 = 1 (1) 9 и 120/ν1 = 1 (1) 6 (2) 12, ν2 = 2 (2) 18 и 240/ν2 " = 1 (1) 4 (2) 12. Упомянем еще таблицы Ura (1954); он приводит значения λ1 /ν1 с двумя десятичными знаками для α = 0.95, β = 0.90 при ν1 = 1 (1) 9 и 120/ν1 = 0 (1) 6 (2) 12, ν2 = 2 (2) 18 и 120/ν2 = 0 (1) 6. Tiku (1967) приводит значения Pr Fν 1 ,ν2 (λ1 ) > Fν1 ,v2 ,1−α с четырьмя десятичными знаками для α = 0.005, 0.01, 0.025, 0.05; ν1 = 1 (1) 10, 12;

1/2 ν2 = 2 (2) 30, 40, 60, 120, ∞; λ1 /(ν1 + 1) = 0.5 (0.5) 3.0.

4.2.

Компьютерные программы

Bargmann and Ghosh (1964) сообщили о программе на языке FORTRAN для расчета плотности и функции нецентрального F-распределения.

419

4. ТАБЛИЦЫ И ВЫЧИСЛИТЕЛЬНЫЕ АЛГОРИТМЫ

Fleishman (1980) описывает аналогичную программу примерно с теми же возможностями, использующую представление, полученное в работе Venables (1975). Существует несколько эффективных и легко реализуемых рекуррентных алгоритмов для вычисления нормированной неполной бетафункции (гл. 25) и функции нецентрального бета-распределения. Первый из опубликованных алгоритмов, специально разработанных для нецентрального F-распределения (или, что равносильно, функции бета-распределения), разработал Norton (1983). Затем подобные алгоритмы опубликовали Schader and Schmid (1986) и Lenth (1987). Эти алгоритмы включают процедуры вычисления с высокой точностью нормированной неполной бета-функции; алгоритмы и пример содержатся в статье Majumder and Bhattacharjee (1973). Во всех алгоритмах существенно используется неполная нецентральная бета-функция (см. п. 7) Ix (a, b; λ1) =

∞ 



⎡ ⎣e−λ1 /2

1 λ 2 1 j!

j=0

j ⎤

⎦ Ix (a + j, b),

(30.18)

где Ix (a, b) — обычная нормированная неполная бета-функция [гл. 1, формула (1.91)]. Разные алгоритмы допускают различные оценки для разности точного значения и значения, полученного суммированием конечного числа r членов ряда (30.18). Используются также различные алгоритмы вычисления неполной нормированной бета-функции. Norton (1983) приводит границы    r+1   1 1 λ λ1 Ix (a + r + 1, b) min 1, e−λ1 /2 + 1 , (30.19a) 0 < Er < (r + 1)!

2

2r + 4

ранее уже найденные в статье Guenther (1978). Lenth (1987) улучшил эти границы, получив выражение ⎧ ⎡  j ⎫⎤ 1 r ⎨  λ1 ⎬ ⎦, e−λ1 /2 2 (30.19b) 0 < Er < Ix (a + r + 1, b) ⎣1 − j! ⎩ ⎭ j=0

 r+1 1 а Wang (1992) нашел нижнюю границу вида e−λ1 /2 λ1 /(r + 1)!. 2 Schader and Schmid (1986) и Lenth (1987) уменьшили затраты времени при вычислении Ix (a + j, b), j = 0, 1, 2, . . . , в (30.18) повторным использованием соотношения Γ(a + b) Ix (a + 1, b) = Ix (a, b) − xa (1 − x)b (30.20) Γ(a + 1)Γ(b)

[см. гл. 25, формула (25.72a)] и тем, что Γ(a + 1) = aΓ(a). Комментируя работу Lenth (1987), Frick (1990) заметил, что хорошие результаты получаются при малых λ1 и что при больших λ1 в разложении (10.18) следует брать много членов, т. е. r должно быть велико. Фрик (Frick) предложил для упрощения опускать первые s членов, аналогично членам с номерами j > r. Возникающие

420

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 30.1 Число n + 1 членов в разложении (30.18), необходимых для получения границ точности 10−8 и 10−10 Граница точности −8

10 10−10

λ1

0.5

1.0

2.0

4

6

8

10

15

20

6 8

8 10

11 12

14 16

17 19

20 22

22 25

27 31

32 36

дополнительные ошибки ограничены величиной 6  6    2 1 2 1 Ix (a, b)Φ s − λ1 Φ s − λ1 , λ1

λ1

2



так как Pr[Y  k]  Φ

k−θ √ θ

2

(30.21)

 ,

если Y — пуассоновская случайная величина со средним θ (гл. 4). Чтобы обеспечить вносимую дополнительную ошибку меньше фиксированного δ , следует взять 6   s  max

1 λ1 − Uδ 2

λ1 ,0 2

,

(30.22)

где Φ(Uδ ) = δ . Например, взяв Uδ = −5, имеем δ ≈ 0.0000003. Тогда " 1 s  λ1 − 5 λ1 /2 дает достаточно малую ошибку. 2 Posten (1993) несколько переработал алгоритм Лента (Lenth), применив вышеуказанную модификацию с отбрасыванием s первых членов. Этот прием аналогичен описанному в гл. 29 для вычисления нецентрального хи-квадрат 1 распределения. Автор предложил начать расчет со значений j, близких к λ1 , 2 и затем добавлять члены, увеличивая и уменьшая j до тех пор, пока сумма пуассоновских вероятностей (множителей) ⎧  j ⎫ 1 r ⎨  λ1 ⎬ e−λ1 /2 2 (30.23) P(r, s) = j! ⎩ ⎭ j=s

не станет достаточно близка $r к 1. Если $∞ P(r, s)  1 − ε , то ошибка при использовании в (30.18) вместо не превосходит ε . j=s $r $∞j=0 Отметив, что ошибка от замены j=0 суммой j=s в (30.18) ограничена величиной (30.19b), Lee (1992) составил таблицу (табл. 30.1), содержащую число r + 1 членов, необходимых для получения заданной точности. Метод расчета Ix (a, b; λ ), использованный в библиотеке программ в пакете IMSL (1987), для 0.5 < λi < 20, когда max(a, b) < 200, требует почти вдвое больше времени для реализации, чем алгоритм Lee (1992). Последний алгоритм предусматривает вычисление r+1 значения нормированной неполной бета-функции, а алгоритмы, предложенные Posten (1993) и Lenth (1987)

421

5. АППРОКСИМАЦИИ

требуют однократного вычисления и дальнейшего использования рекуррентной формулы. В статье Singh and Relyea (1992), где используются идеи работы Lenth (1987), и в статье Posten (1993) применяются границы (30.19a) погрешности, найденные в Guenther (1978). Отличие этих работ состоит в том, что использованы явные выражения для нормированной неполной бета-функции. Как ясно из сказанного, даже без технических деталей, в статистической литературе имеется много примеров пересекающихся и повторяющихся результатов, особенно в части статистических алгоритмов. Главным образом из-за недостаточной координации в разных журналах встречаются почти идентичные публикации или результаты, содержащие «ε -изменения».

5.

Аппроксимации

Формула (30.2) показывает, что для аппроксимации нецентрального F-распределения можно использовать нецентральные χ 2 -распределения. Простая аппроксимация распределения χν 2 с помощью cχν2 , где c = (ν1 + 2λ1 )(ν1 + λ1 )−1 ; ν = (ν1 + λ1 )2 (ν1 + 2λ1 )−1 приводит к аппроксимации Fν 1 ,ν2 (λ1 ) величиной

 (cν /ν1)Fν,ν2 = 1 + λ1 ν1−1 Fν,ν2 (отметим появление множителя ν /ν1 ). Точность такого приближения изучил Patnaik (1949). Понятно, что распределение Fν,ν2 также можно аппроксимировать одним из методов, описанных в гл. 27, это приведет к композиции приближенных формул для распределения Fν 1 ,ν2 (λ1 ). Используя приближение Паулсона (Paulson), Severo and Zelen (1960) нашли, что распределение величины 

1− 

2 9ν2



ν1 F  /(ν1 + λ1 )

1/3



− 1 − [2 (ν1 + 2λ1 )/9] (ν1 + λ1 )−2

 [2 (ν1 + 2λ1 )/9] (ν1 + λ1 )−2 + 2ν2−1 /9





ν1 F (ν1 + λ1 )

(30.24)

2/3 1/2

близко к стандартному нормальному распределению. Независимо тот же результат получил Laubscher (1960) и сравнил его с полученной Фишером аппроксимацией корнем квадратным для распределений χ 2 и Fν1 ,ν2 , а именно:   1/2  −1/2  1/2 2(ν1 + λ1 ) − (ν1 + 2λ1 ) v1 F ν1 + 2λ1 1/2 ν1 F (2ν2 − 1) − + ν2

ν1 + λ1

ν2

ν1 + λ1

(30.25) имеет распределение, близкое к стандартному нормальному. Laubscher (1960) сравнил значения Pr Fν 1 ,ν2 (λ1 ) < f , даваемые (30.24) и (30.25), и точное значение при следующих значениях параметров ν1 3 5 8

для f = Fν1 ,ν2 ,α = 0.95,

0.99.

ν2 10, 20 10, 20 10, 30

λ1 4, 16 6, 24 9, 36

422

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

Несмотря на то, что преобразование Уилсона—Хилферти (Wilson—Hilferty), на котором основана формула (30.24), обычно дает более точные результаты, чем преобразование Фишера, на котором основана формула (30.25), в рассматриваемом случае последняя дает несколько более точные значения по сравнению с первой. Ситуация, однако, меняется при увеличении f и λ1 . Аналогичное сравнение, проведенное в работе Fowler (1984) для ν1 = 1 (1) 6, 8, 12, 24 и ν2 = 6 (2) 30, 40, 60, 120 и 240 при λ12 /ν1 = 0.1, 0.25, 0.4, показало, что при ν1 < 6 (30.24) лучше, по меньшей мере, для нижнего хвоста: F(t; ν1 , ν2 , λ1 )  0.5. Cohen (1977) в анализе мощности, к сожалению, чаще ссылается на (30.25), так как считает, что эта формула дает лучшие результаты, чем (30.24), кроме случая малых ν1 , ν2 и λ1 ; об этом также пишут Cohen and Nel (1987). Laubscher (1960) рассмотрел преобразование 

 1/2  ν1 (ν2 − 2)1/2 F  + (ν2 /ν1 ) 1 ν2 − 2 Arch , (30.26) 1/2 ν2 (ν1 + ν2 − 2)

2

считая, что распределение близко к стандартному нормальному в силу совпадения первых двух моментов, однако близость распределений имеет место только при весьма больших λ1 . Хорошую аппроксимацию получил Tiku (1966), приблизив Fν 1 ,ν2 (λ1 ) величиной (b + cFν ,ν2 ) и выбрав c, b и ν , чтобы совпали первые три момента. Эти значения таковы: *C + ν=

1 (ν2 − 2) 2

 c=

ν1 ν1



H2

H 2 − 4K

2ν1 + ν2 − 2

−1 ,

−1  H  K

,

b = −ν2 (ν2 − 2)−1 (c − 1 − λ1 ν1−1 ),

(30.27)

где H = 2(ν1 + λ1 )3 + 3(ν1 + λ1 )(ν1 + 2λ1 )(ν2 − 2) + (ν1 + 3λ1 )(ν2 − 2)2 , K = (ν1 + λ1 )2 + (ν2 − 2)(ν1 + 2λ1 ). Mudholkar, Chaubey and Lin (1976) сперва заменили число степеней свободы распределения χν 1 2 (λ1 ) на ν=

(ν1 + 2λ1 )3 (ν1 + 3λ1 )2

(30.28a)

[ср. с (29.60), гл. 29] и затем подобрали c и b, обеспечивающие совпадение первых двух моментов с моментами Fν 1 ,ν2 (λ1 ). Эти значения суть    −1/2 1/2 ν c= {(ν2 − 2)(ν1 + 2λ1 ) + (ν1 + λ1 )2 } , {ν 2 + (ν2 − 2)} ν1 (30.28b) b = −ν2 (ν2 − 2)−1 (c − 1 − λ1 ν1−1 ). Получившаяся аппроксимация лучше, чем аппроксимация Tiku (1966) (30.27) для правого хвоста (больших f ), но хуже для левого хвоста. В целом, можно считать, что приведенные аппроксимации равносильны.

423

5. АППРОКСИМАЦИИ

Tiku (1966) выяснил, что его аппроксимация при значениях b, c и ν , даваемых (30.27), лучше приближения (30.24) [Severo and Zelen (1960)] и приближения Патнайка. Из двух последних формула (30.24) удобней для вычислений, хотя и менее точна, чем формулы Патнайка при больших ν2 . Pearson and Tiku (1970) получили соотношения между центральным и нецентральным F-распределениями, построив график (β1 , β2 ) для двух типов распределений. Авторы сделали вывод, что (а) при фиксированном ν2 график (β1 , β2 ) для центрального F-распределения близок к прямой, (b) при том же ν2 точки (β1 , β2 ) для Fν 1 ,ν2 (λ1 ) лежат вблизи прямой (а) и сходятся к ней при увеличении ν1 или λ1 . Авторы отметили, что аппроксимация Тику (Tiku) по трем моментам не приводит к совпадению "значений β2 . Разность значений β2 становится мала при возрастании φ = λ1 /(ν2 + 1) или ν1 . Относительная погрешность β2 равна 0.15 или меньше, и погрешность определения верхних процентных точек редко превосходит 1/100 стандартного отклонения, однако нижние процентные точки искажаются более существенно, до 3–4% стандартного отклонения для 0.5%-й или 1%-й точки. Улучшить аппроксимацию нижнего хвоста можно было бы, используя первые четыре момента, если β1 > 4. По аналогии с центральным F-распределением можно было бы ожидать, что хорошая аппроксимация получится при рассмотрении Zν 1 ,ν2 (λ1 ) =

1 log Fν 1 ,ν2 (λ1 ), 2

т. е. нецентрального Z-распределения. Так как Z  = Zν 1 ,ν2 (λ1 ) =

1 1 1 log(ν2 /ν1 ) + log χν 1 2 (λ1 ) − log χν22 , 2 2 2

то семиинварианты Z’ равны    

  1 ν κ1 (Z  ) = log 2 + κ1 χv1 2 (λ1 ) − κ1 χν2 2 , 2 ν1

 2

  −r κr (Z ) = 2 κr χν1 (λ1 ) + (−1)r κr χν2 2 , r  2.

(30.29)

Barton, David and

O’ Neill  (1960) приводят формулы, позволяющие избежать вычисления κr χν 1 2 (λ1 ) при вычислении функции мощности F-критерия при разложении распределения Z  в ряд Эджворта. Pearson (1960) получил хорошие результаты, заменив распределение Z  распределением SU (см. гл. 12, п. 4.3). [Заметим, что Tiku (1965a) ошибочно пишет, что Пирсон заменяет распределение F  распределением SU ]. В то же время, вычисление семиинвариантов Z  весьма трудоемко. В работе Barton, David and O’ Neill (1960) это анализируется подробно, и семиинварианты выражены через полигамма-функцию [гл. 1, формула (1.39)] и специально введенные R-функции, табулированные в статье. Mudholkar, Chaubey and Lin (1976) использовали равенство  

1/3

1/3 Pr Fν 1 ,ν2 (λ1 )  f = Pr ν1−1 χν 1 2 (λ1 ) − f 1/3 ν2−1 χν22 0 , (30.30)

424

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

 1/3 2 1/3 а также то, что χν 1 2 (λ1 ) и χν 2 хорошо аппроксимируются нормальным распределением. Авторы предложили использовать разложение Эджворта для величины  1/3 

1/3 V = ν1−1 χν21 (30.31) − f 1/3 ν2−1 χν22 с использованием выражений, полученных Aty (1954) для семиинвариантов кубического корня из нецентральной χ 2 -случайной величины. (По существу, авторы использовали первые три члена в своих расчетах.)

6.

Оценка параметра нецентральности λ1

Существует много работ, посвященных оценке параметра нецентральности λ1 по одному наблюдению величины F  из популяции Fν 1 ,ν2 (λ1 ) при известных ν1 и ν2 . Настоящий пункт содержит, в основном, эти результаты. В заключительной части мы рассмотрим также оценки максимального правдоподобия, основанные на n значениях F1 , . . . , Fn . Оценкой λ1 с равномерно наименьшей дисперсией является λ1∗ = ν1 ν2−1 (ν2 − 2)F  − ν1

(30.32)

[Perlman and Rasmussen (1975)]. К сожалению, это значение не всегда получается положительным, поэтому неприемлемо. Chow (1987) показал, что 

∗ ν1 ν2−1 (ν2 − 2)F  − ν1 при F  > ν2 (ν2 − 2)−1 , λ1 + = (30.33) 0 в противном случае также неприемлемо. Если оценивать качество среднеквадратической ошиб  кой, то любая оценка вида a ν2−1 (ν2 − 2)F  − 1 + неприемлема. Оценка   a ν2−1 (ν2 − 1)F  − 1 лучше λ1∗ при всех λ1 при условии, что   ν2 − 6 max 0,  a  1. ν2 − 2

Rukhin (1993) исследовал линейные выражения от F в качестве оценок λ1 . Для аналитического упрощения удобнее заменить F  на G = ν1 F  /ν2, распределенную как Gν1 ,ν2 (λ1 ). Ожидаемый средний квадрат ошибки aG + b равен    2  1 = 2(ν2 − 2)−1 (ν2 − 4)−1 ν1 + 2λ1 + (ν1 + λ1 )2 a2 + E aG + b − λ1 2

−1

+ 2(ν2 − 2)

(ν1 + λ1 )a(b − λ1 ) + (b − λ1 )2 ,

ν2 > 4. (30.34)

Вычисления показывают, что при a > ν2 −4 оценка улучшается, если положить a = ν2 − 4. Если ν2  4, то среднеквадратическая ошибка оценки aG + b бесконечна и, следовательно, неприемлема [см. также Rasmussen (1973)]. Байесовские оценки рассмотрены в работах Perlman and Rasmussen (1975) и De Waal (1974). Пусть априорным распределением λ1 является γχn2 , γ > 0.

6. ОЦЕНКА ПАРАМЕТРА НЕЦЕНТРАЛЬНОСТИ λ1

425

Тогда байесовская оценка, минимизирующая среднеквадратические потери, есть γ γ (ν1 + ν2 )ν1 F  /ν2 .

· (30.35)  1+γ

1 + γ + ν1 F /ν2

При γ → ∞ получается несобственная байесовская оценка ν1 (ν1 + ν2 )ν2−1 F  + ν1 .

(30.36)

Среднеквадратическая ошибка как оценки (30.35), так и (30.36) больше, чем оценки   (30.37) ν1 (ν2 − 4) ν2−1 F  − (ν2 − 2)−1 . Perlman and Rasmussen (1975) отмечают, что любое собственное априорное распределение (независимо от его вида) дает байесовскую оценку, которая ближе к (30.37), чем к (30.35) или (30.36). Оценки (30.35) и (30.36) не могут быть меньше ν1 , что представляется удивительным. Для ν1, ν2  5 среднеквадратическая ошибка оценки   aν1 ν2−1 (ν2 − 2)F  − 1 + bν1−1 ν2 F −1 (30.38) меньше, чем оценки

  aν1 ν2−1 (ν2 − 2)F  − 1 ,

(30.39)

если 0 < b < 4aν2−1 (ν2 + 2)−1 (ν1 − 4)(ν1 + ν2 − 2) для всех a > 0. Perlman and Rasmussen (1975) рекомендуют использовать значения a = (ν2 − 2)−1 (ν2 − 4), b = 2ν2−1 (ν2 + 2)−1 (ν2 − 2)−1 (ν1 − 4)(ν2 − 4)(ν1 + ν2 − 2).

(30.40)

Авторы отмечают, что использование несобственного распределения в качестве априорного является причиной вышеуказанной удивительной особенности оценок (30.35) и (30.36) [см. также Efron (1970, 1973)]. Статья Gelfand (1983) посвящена методам выбора априорного распределения. Рассмотрим теперь построение доверительных интервалов для λ1 по одному наблюдению F  . Venables (1975) предложил метод построения доверительного интервала для λ1 , аналогичный методу, используемому при оценке параметра нецентральности нецентрального хи-квадрат распределения [гл. 29, формула (29.47) и следующие]. По аналогии с формулой (29.47) гл. 29, автор строит доверительный интервал для λ1 при одном известном значении F’ из распределения Fν 1 ,ν2 (λ1 ), исходя из функции распределения

Pr Fν1 ,ν2 > F  + + p(F  ; ν1 , ν2 , 0)

∞  j=1



  [j−1] 1 1  j (ν1 + ν2 ) F  j−1

2 2 2 · · Pr χ2j2  λ1 .  [j]

 ν j−1 2 1 1 + ν2−1 F  ν (30.41) 2 1

426

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

Производящая функция моментов распределения (30.41) равна

 Pr Fν1 ,ν2 > F  + 1 −

2F  t ν2 (1 − 2t)

−ν2 +(1/2)  ×F

(1 − 2t)(ν1 /2)−1 × F

1 − 2 1 + ν2−1 F

 ; ν , ν , 0 . (30.42) 1 2 

Она в работе Venables (1975) аппроксимируется функцией −ν2 /2 2F  t (1 − 2t)(ν1 /2)−1 . 1−

(30.43)

Отсюда получается приближенная формула для семиинвариантов   r κr∗ ≈ 2r−1 (r − 1)! ν2 1 + ν2−1 F  − ν1 − ν2 + 2 =  

= 2r−1 (r − 1)! rF  − ν1 + 2 + O ν2−1

(30.44)

ν2 (1 − 2t)

[см. гл. 29, формула (29.50)]. Автор, однако, не использует разложение типа Корниша—Фишера квантилей (доверительных границ) для λ1 (как это сделано в гл. 29 для λ ); вместо этого распределение аппроксимируется по нескольким приближенным значениям моментов. Guirguis (1990), решая уравнение

(30.45) Pr Fν 1 ,ν2 (λ1 )  F  = α относительно λ1 , использует метод итераций, основанный на формуле   



∂ Pr Fν 1 ,ν2 (λ1 )  F  1 ν F = Pr Fν 1 +2,ν2 (λ1 )  1 − Pr Fν 1 ,ν2 (λ1 )  F  . ∂ λ1

При F  > 0 

Fν 1 ,ν2 ,α .

ν1 + 2

2

  ∂ Pr Fν 1 ,ν2 (λ1 )  F  ∂ λ1

(30.46)  0, тогда (30.45) не имеет решения, если

F < В противном случае решение (30.45) существует и единственно, так как Pr Fν 1 ,ν2 (λ1 )  F  → 0 при λ1 → ∞. Guirguis (1990) применяет модифицированный линейный вариант метода Ньютона (L-метод Ньютона), который он называет E-методом Ньютона (exponential Newton). При решении уравнения g(x) = α (n + 1)-я итерация xEn+1 ищется как xEn+1

=

xEn

 

 g xEn α +  E  log

 . g xn g xEn

(30.47)

E-метод Ньютона лучше, чем L-метод, если трудно подобрать хорошее начальное приближение.

427

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С F-РАСПРЕДЕЛЕНИЕМ

Lam (1987) предложил итеративный метод расчета доверительных границ для параметра нецентральности λ1 . Алгоритм реализован на языке FORTRAN77, автор располагает соответствующей программой. Guirguis (1990) сравнил L- и E-методы Ньютона с квадратичным Q-методом Ньютона, разработанным в работе Narula and Weistroffer (1986). Сравнение проводилось при ν1 = 8, ν2 = 2, α = 0.01, F  = 0.5 (1) 9.5. Он обнаружил, что E-метод сходится быстрее, чем L-метод при F  =0.5 и 1; при F  > 1 скорость сходимости примерно одинакова. Q-метод Ньютона заметно медленнее как L-метода, так и E-метода. Пусть G1 , . . . , Gn независимы и распределены как χν 1 2 (λ1 )/χν22 при известных ν1 и ν2 . Оценка максимального правдоподобия λ#1 параметра λ1 является решением уравнения

n=

n  i=1

ν1 Gi · ν2 + ν1 Gi

 2 F0

 

2 F0

1 1 (ν + ν2 ), ν1 ; λ#1 ν1 Gi (ν2 + ν1 Gi )−1 2 1 2 1 1 (ν + ν2 ), ν1 ; λ#1 ν1 Gi (ν2 + ν1 Gi )−1 2 1 2

где 2 F0 (a, b; x)

=

∞ [j]  a j=0

b[j]

·

  ,

(30.48)

xj j!

— вырожденная гипергеометрическая функция (гл. 1, п. A7). Pandey and Rahman (1971) доказали единственность положительного решения уравнения (30.48) при условии n  i=1

ν1 Fi nν1 > . ν1 + ν2 ν2 + ν1 Fi

7.

Распределения, связанные с f -распределением

7.1.

Двойное нецентральное F-распределение

Мы уже определили двойное нецентральное F-распределение (30.1). Используя представление каждой из нецентральных χ 2 -величин смесью центральных χ 2 -величин, можно показать, что Gν1 ,ν2 (λ1 , λ2 ) =

χν 1 2 (λ1 ) χν 2 2 (λ2 )

распределено как смесь Gν1 +2j,ν2 +2k распределений с весами e−λ1 /2

 j!

1 λ 2 1

j

e−λ2 /2

·

 k!

1 λ 2 2

k

.

428

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

Следовательно (используем, как уже было, F  и G для обозначения случайных величин), плотность G равна p(g; ν1 , ν2 ; λ1 , λ2 ) = ⎡  j ⎤ ⎡  k ⎤ 1 1 ∞  ∞   −1  e−λ1 /2 λ1 e−λ2 /2 λ2 2 2 ⎣ ⎦⎣ ⎦ B 1 ν1 + j, 1 ν2 + k = × j!

j=0 k=0

k!

2

2

× g(ν1 /2)+j−1 (1 + g)− 2 (ν1 +ν2 )−j−k , 1

(30.49)

а плотность F  = ν2 G /ν1 равна p(f ; ν1 , ν2 ; λ1 , λ2 ) = ⎡  j ⎤ ⎡  k ⎤ 1 1 ∞ ∞   e−λ1 /2 λ1 e−λ2 /2 λ2 2 2 ⎣ ⎦⎣ ⎦ν (ν1 /2)+j ν (ν2 /2)+k f (ν1 /2)+j−1 × = 1 2 j!

j=0 k=0

k!

−1   1 1 1 ν1 + j, ν2 + k = × (ν2 + ν1 f )− 2 (ν1 +ν2 )−j−k B = pFν1 ,ν2 (f ) ·

∞  ∞   1

j!

j=0 k=0

×



e−λ1 /2





2

2

j 

1 λ1 ν1 f /(ν2 + ν1 f ) 2

1 −λ2 /2 1 e λ2 ν2 /(ν2 + ν1 f ) k! 2



k 

B 

1 1 ν , ν 2 1 2 2

× 

1 1 B ν + j, ν2 + k 2 1 2

 .

(30.50)

Этот результат получил Malik (1970), использовавший преобразование Меллина, а также Bulgren (1971), получивший эквивалентные формулы с небольшим отличием в записи. Pe and Drygas (1994) получили представление p(f ; ν1, ν2 ; λ1 , λ2 ) = e−(λ1 +λ2 )/2 

 j 1 ∞  λ1 2

j=0

 ν1 (ν1 /2)+j ν2

j!

2 F1

  1 1 λ ν f 1 − ν1 − j, −j; ν2 ; 1 1 × 2

λ2 ν2

2

f (ν1 /2)+j−1   1 (ν1 +ν2 )+j = 1 1 B ν1 + j, ν2 1 + ν1 ν2−1 f 2 2 2  j 1 j ∞    λ k  j   ν (ν1 /2)+j+k λ 1 1 2 1 × = e−(λ1 +λ2 )/2 k ν2 j! λ2

×



j=0

×

k=0

f 

(ν1 /2)+j+k−1

  1 (ν1 +ν2 )+j 1 1 B ν1 + j − k, ν2 + k 1 + ν1 ν2−1 f 2 2 2

,

0 < f. (30.50)

429

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С F-РАСПРЕДЕЛЕНИЕМ

Функция распределения G равна, конечно,

Pr Gν1 ,ν2 (λ1 , λ2 )  g = 

= e−(λ1 +λ2 )/2

∞ ∞  

1 λ 2 1

j 

1 λ 2 2

k

j!k!

j=0 k=0

 Ig/(1+g)



1 1 ν1 + j, ν2 + k . 2 2

(30.51)

Функция распределения F  , Pr Fν1 ,ν2 (λ1 , λ2 )  f получается заменой g на f ν1 ν2−1 в правой части (30.51). Начальный момент F  порядка r равен   μr (F ) = E[{F  }r ] =  =  =

ν2 ν1 ν2 ν1

r

e−(λ1 +λ2 )/2

∞ ∞  



1 λ 2 1

e−(λ1 +λ2 )/2

∞ ∞  

1 λ 2 2

k

E



j!k!

j=0 k=0

r

j 



1 λ 2 1

j=0 k=0

j 

1 λ 2 2

k

j!k!

Γ



χν21 +2j

r  2 −r  E χν2 +2k =

   1 1 ν1 + j + r Γ ν2 + k − r 2 ,   2  1 1 Γ ν1 Γ ν2 2 2

ν2 > 2r.

μr (F  )

При ν2  2r момент представил (30.52) в виде

(30.52) обращается в бесконечность. Tiku (1972)

   1

1 μr (F  ) = μr Fν 1 ,ν2 (λ1 ) M r, ν2 ; − λ2 , (30.52) 2 2 $∞ где M(a, b; x) = 2 F0 (a, b; x) = j=0 a[j] b[j] xj /j! — вырожденная гипергеометрическая функция (см. гл. 1, п. A7). Bulgren (1971) рассчитал таблицы процентилей F , т. е. значений f = Fν1 ,ν2 ,α (λ1 , λ2 ), для которых

(30.53) Pr Fν1 ,ν2 (λ1 , λ2 )  f = α при ν1 = 2, 4, 8; ν2 = 4, 15, 30, 60; α = 0.95, 0.99; λ1 , λ2 = 0.5, 1.5, 2 (1) 6, 9, 10, 24. В учебнике Winer (1971) приведены таблицы двойного нецентрального F-распределения. Более подробные таблицы составлены в работе Tiku (1974). Они включают значения f для ν1 = 1 (1) 8, 10, 12; ν2 = 2 (2) 12, 16, 20, 24, 30, 40, 60; α = 0.95, 0.99; φ1 = {λ1 /(2ν1 +1)}1/2 = 0 (0.5) φ1 = {λ2 /(2 ν2 +1)}1/2 = 0 (1) 8.

3.0;  В другой таблице приведены значения Pr Fν1 ,ν2 (λ1 , λ2 ) > f для вышеуказанных значений φ1 и φ2 , ν1 = ν2 =4 (2) 12 и (1+ ν1 f /ν2 )−1 = 0.02 (0.08) 0.50, 0.60, 0.75, 0.95. Tiku (1972) исследовал аппроксимацию распределения Fν1 ,ν2 (λ1 , λ2 ) линейной функцией величины F. Его анализ состоит из следующих шагов. 1 2

1. Если (λ2 /λ1 ) < , то M(r,

1 1 ν ; − λ2 ) быстро сходится и приближенно 2 2 2

равно (1 + ν2−1 λ2 )−r и, следовательно, r-й момент случайной величины

−r  F  [см. (30.52)] близок к значению μr Fν 1 ,ν2 (λ1 ) 1 + ν2−1 λ2 .

430

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

ТАБЛИЦА 30.2 Точные значения (1) и погрешности ×10  (2) приближенных значений Pr F ν1 ,ν2 (λ1 , λ2 ) > Fν1 ,ν2 ,0.95 при ν1 = 4 4

ν2

φ1

φ2

0.0 (1)

8

24

0 1 2 3 0 1 2 3

0.5 (2)

(1)

1.0 (2)

(1)

2.0 (2)

(1)

3.0 (2)

(1)

(2)

0.0500 0 0.0328 −7 0.0215 −17 0.0092 −30 0.0039 −31 0.2398 −1 0.2788 −18 0.1326 −52 0.0717 −119 0.0381 −15 0.7714 −1 0.6886 −4 0.6070 −22 0.4562 −125 0.3301 −283 0.9868 1 0.9729 −7 0.9536 28 0.8980 91 0.8222 128 0.0500 0 0.0358 −2 0.0256 −4 0.0130 −9 0.0065 −11 0.3302 −1 0.2764 −1 0.2300 −6 0.1566 −28 0.1045 −52 0.9192 0 0.8915 −1 0.8601 1 0.7879 7 0.7068 7 0.9995 0 0.9991 0 0.9985 1 0.9963 10 0.9920 12

2. Далее, распределение (F  + a)/h близко к распределению Fν,ν2 при значениях констант, равных * +−1 −1/2 1 32(ν2 − 4) ν = (ν2 − 2) + 1− −1 , 2 (ν2 − 6) β1

2

h=

1 −1 ν (ν2 − 2)(ν2 − 6)μ3 {ν2 μ2 (2ν + ν2 − 2)} , 2

a = hν2 (ν2 − 2)−1 − μ1 , где μ1 , μ2 , μ3 и β1 соответствуют распределению F  . Таблица 30.2, которая является частью более подробной таблицы из работы Tiku (1972), содержит погрешности приближенных значений Pr Fν1 ,ν2 (λ1 , λ2 ) > Fν1 ,ν2 ,0.95 при некоторых значениях ν1 , ν2 и φi . Погрешности возрастают с ростом φ2 . Tiku (1972) рекомендует использовать точную 1 формулу, если λ2 /ν2 > . 2 Для аппроксимации двойного нецентрального F-распределения можно использовать аппроксимации нецентральных χ 2 -распределений. Понятно, что также можно аппроксимировать только одно из двух нецентральных χ 2 -распределений. Пусть χν 2 2 (λ2 ) аппроксимируется величиной c χν2 при c = (ν2 + 2λ2 )(ν2 + λ2 )−1 и ν  = (ν2 + λ2 )2 (ν2 + 2λ2 )−1 , тогда соответствующая ν аппроксимация Fν1 ,ν2 (λ1 , λ2 ) есть  2  Fν 1 ,ν2 (λ1 ) = (1 + λ2 ν2 )−1 Fν 1 ,ν (λ1 ). Если cν аппроксимируются числитель и знаменатель, то получается аппроксимация величиной 1 + λ1 ν1−1 1 + λ2 ν2−1

Fν,ν ,

(30.54)

где ν = (ν1 + λ1 )2 (ν1 + 2λ1 )−1 ; ν  = (ν2 + λ2 )2 (ν2 + 2λ2 )−1 . Двойное нецентральное F-распределение встречается при оценке мощности в дисперсионном анализе, если имеются неслучайные воздействия

7. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С F-РАСПРЕДЕЛЕНИЕМ

431

на остаточную дисперсию. Пусть, например, в задаче однонаправленной классификации для каждого элемента выход из своей группы зависит от номера наблюдения. Тогда остаточная внутригрупповая сумма квадратов пропорциональна величине, имеющей скорее нецентральное χ 2 -распределение [Scheff´e (1959, pp. 134–135]. Приложение дважды нецентрального F-распределения к задаче однонаправленной классификации в вариационном анализе описано Tiku (1972), а также в многочисленных других источниках. Инженерные приложения описаны в работах Wishner (1962) и Price (1964).

7.2.

Нецентральное бета-распределение

Пусть случайные величины χν21 и χν22 независимы. Тогда, как известно (гл. 27), 

отношение χν21 / χν21 + χν22 имеет стандартное бета-распределение с парамет1

1

рами ν1 , ν2 . Заменив χν21 нецентральной величиной χν 1 2 (λ1 ), получим 2 2 так называемое нецентральное бета-распределение с параметрами формы 1 1 ν и ν2 и параметром нецентральности λ1 . Если оба χ 2 -распределения 2 1 2 заменить нецентральными, то получим  −1 βν1 ,ν2 (λ1 , λ2 ) = χν 1 2 (λ1 ) χν 1 (λ1 ) + χν 2 (λ1 ) =  −1 = Gν1 ,ν2 (λ1 , λ2 ) 1 + Gν1 ,ν2 (λ1 , λ2 ) .

(30.55)

Соответствующее распределение называется двойным нецентральным бета1 1 распределением с параметрами формы ν1 и ν2 и параметрами нецен2 2 тральности λ1 и λ2 . Нецентральное бета-распределение представимо как смесь центральных бета-распределений аналогично тому, как нецентральное F-распределение представимо смесью центральных F-распределений. Каждое из нецентральных χ 2 -распределений можно (см. гл. 29) заменить аппроксимацией Патнайка. Это приводит к распределению случайной величины (ν1 + 2λ1 )(ν2 + λ2 ) β (f1 , f2 ), (30.56) (ν1 + λ1 )(ν2 + 2λ2 )

где β (f1 , f2 ) — случайная величина, имеющая бета-распределение с параметрами f1 и f2 , fj = (νj + λj )2 (νj + 2λj )−1 , j = 1, 2. DasGupta (1968) сравнил эту аппроксимацию с двумя следующими: (1) аппроксимацией, получающейся разложением по полиномам Якоби (гл. 1, пп. A6, A11) с совпадающими первыми и вторыми моментами; (2) аппроксимацией с помощью рядов Лагерра каждого из χ 2 -распределений. Автор сделал вывод, что аппроксимация Патнайка более практична. Хотя аппроксимации (1) и (2) возможно, более точны, они менее удобны для вычислений. Напомним, что распределение χν 2 (λ ) связано с распределением двух независимых пуассоновских случайных величин (см. гл. 29). Аналогичным

432

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

образом Johnson (1959) показал, что при четном ν1  

1 Pr Fν 1 ,ν2 (λ1 ) < f = Pr Y − Z  ν1 ,

(30.57)

2

где Y и Z независимы, Y имеет отрицательное биномиальное распределение 1 (гл. 5, п. 1) с параметрами ν2 , ν1 f /ν2 , а Z имеет распределение Пуассона с па1

2

раметром λ1 . Непосредственное продолжение этого рассуждения приводит 2 к следующему соотношению для двойного нецентрального F-распределения: 



Pr Fν1 ,ν2 (λ1 , λ2 ) < f =

∞  j=0

e−λ2 /2

1 λ 2 2 j!

j

  1 Pr Yj − Z  ν1 , 2

(30.58)

где Yj и Z независимы, Yj имеет отрицательное биномиальное распределение 1 с параметрами ν2 + j, ν1 f /ν2 , а распределение Z такое же, как в (30.57). 2 Gupta and Onukogu (1983) вывели выражение плотности произведения двух независимых нецентральных бета-распределенных случайных величин 1 1 1 1 с параметрами формы ( ν1 , ν2 ) и ( δ1 , δ2 ) и параметрами нецентрально2 2 2 2 сти λ1 и λ2 соответственно. Выражение содержит пуассоновские взвешенные суммы смесей соответствующих центральных бета-распределений.

Список литературы Aty, A. S. H. (1954). Approximate formulae for the percentage points and the probability integral of the noncentral χ 2 distribution, Biometrika, 44, 538–540. Bargmann, R. E., and Ghosh, S. P. (1964). Noncentral statistical distribution programs for a computer language, Report No. RC-1231, IBM Watson Research Center, Yorktown Heights, NY. Barton, D. E., David, F. N., and O’Neill, A. F. (1960). Some properties of the distribution of the logarithm of noncentral F, Biometrika, 47, 417–429. Bennett, B. M. (1955). Note on the moments of the logarithmic noncentral χ 2 and z distributions, Annals of the Institute of Statistical Mathematics, 7, 57–61. Bock, M. E., Judge, G. G., and Yancey, T. A. (1984). A simple form for the inverse moments of noncentral χ 2 andd F random variables and certain confluent hypergeometric functions, Journal of Econometrics, 25, 217–234. Bulgren, W. G. (1971). On representations of the doubly non-central F distribution, Journal of the American Statistical Association, 66, 184–186. Chow, M. S. (1987). A complete class theorem for estimating a noncentrality parameter, Annals of Statistics, 15, 800–804. Cohen, J. (1977). Statistical Power Analysis for the Behavioral Sciences, rev. ed., New York: Academic Press. Cohen, J., and Nel, J. C. M. (1987). A comparison of two noncentral F approximations with applications to power analysis in set correlation, Multivariate Behavioral Research, 22, 483–490. DasGupta, P. (1968). Two approximations for the distribution of double noncentral beta, Sankhy¯a, Series B, 30, 83–88.

СПИСОК ЛИТЕРАТУРЫ

433

DeWaal, D. J. (1974), Bayes estimate of the noncentrality parameter in multivariate analysis, Communications in Statistics, 3, 73–79. Dixon, W. J. (1962). Rejection of observations, In Contributions to Order Statistics, (eds., A. E. Sarhan and B. G. Greenberg), New York: Wiley, pp. 299–342 1) . Efron, B. (1970). Comments on Blyth’s paper, Annals of Mathematical Statistics, 41, 1049–1054. Efron, B. (1973). Discussion on the paper by David, Stone and Zidck, Journal of the Royal Statistical Society, Series B, 35, 219. Fisher, R. A. (1928). The general sampling distribution of the multiple correlation coefficient, Proceedings of the Royal Society of London, Series A, 121, 654–673. Fleishman, A. I. (1980). Confidence intervals for correlation ratios, Educational and Psychological Measurement, 40, 659–670. Fowler, R. L. (1984). Approximating probability levels for testing null hypotheses with noncentral F distributions, Educational and Psychological Measurement, 44, 275–281. Fox, M. (1956). Charts of the power of the F-test, Annals of Mathematical Statistics, 27, 484–497. Frick, H. (1990). AS R-84. A remark on Algorithm AS 226, Computing noncentral beta probabilities, Applied Statistics, 39, 311–312. Gelfand, A. E. (1983). Estimation in noncentral distributions, Communications in Statistics— Theory and Methods, 12, 463–475. Guenther, W. C. (1978). Evaluation of probabilities for noncentral distributions and the difference of two T-variables with a desk calculator, Journal of Statistical Computation and Simulation, 6, 199–206. Guirguis, G. H. (1990). A note on computing the noncentrality parameter of the noncentral F distribution, Communications in Statistics— Simulation and Computation, 19, 1497–1511. Gupta, D., and Onukogu, I. B. (1983). The distribution of the product of non-central beta variates, Biometrical Journal, 25, 621–624. Helstrom, C. W., and Ritcey, J. A. (1985). Evaluation of the noncentral F distribution by numerical contour integration, SIAM Journal on Scientific and Statistical Computing, 505–515. Hodges, J. L. (1955). On the noncentral beta-distribution, Annals of Mathematical Statistics, 26, 648–653. Institute of Mathematical and Statistical Libraries. (1987). Packages, Version 1.0, vol. 3, Houston, Texas. Johnson, N. L. (1959). On an extension of the connexion between the Poisson and χ 2 distributions, Biometrika, 46, 352–363. Lachenbruch, P. A. (1966). The noncentral F distribution-extensions of Tang’s tables, Annals of Mathematical Statistics, 37, 774. (Abstract). [Tables in University of North Carolina Mimeo Series No. 531 (1967).] Lam, Y.-M. (1987). Confidence limits for non-centrality parameters of noncentral chi-squared and F distributions, ASA Proceedings of the Statistical Computing Section, 441–443. Laubscher, N. H. (1960). Normalizing the noncentral t and F distributions, Annals of Mathematical Statistics, 31, 1105–1112. Lee, C. M.-S. (1992). On the computation of central and noncentral Beta probabilities, Journal of Statistical Computation and Simulation, 43, 1–10. Lehmann, E. L. (1959). Testing Statistical Hypotheses, New York: Wiley 2) . 1) См. в сборнике: Сархан А. Е., Гринберг Б. Г. Введение в теорию порядковых статистик. — М.: Статистика, 1970. — 414 с. 2) Леман Э. Проверка статистических гипотез. — М.: Наука, 1964.

434

ГЛАВА 30. НЕЦЕНТРАЛЬНОЕ F-РАСПРЕДЕЛЕНИЕ

Lehmer, E. (1944). Inverse tables of probabilities of errors of the second kind, Annals of Mathematical Statistics, 15, 388–398. Lenth, R. V. (1987). Computing noncentral beta probabilities, Applied Statistics, 36, 241–244. Madansky, A., and Olkin, I. (1969). Approximate confidence regions for constraint parameter. In Multivariate Analysis-II (cd., P. R. Krishnaiah), New York: Academic Press. Madow, W. G. (1948). On a source of downward bias in the analysis of variance and covariance, Annals of Mathematical Statistics, 19, 351–359. Majumder, K. L., and Bhattacharjee, G. P. (1973). Algorithm AS63. The incomplete beta integral, Applied Statistics, 22, 409–411. Malik, H. J. (1970). An alternative derivation of doubly noncentral F distribution, Metron, 28, 180–184. Marakathavalli, N. (1955). Unbiased test for a specified value of the parameter in the noncentral F distribution, Sankhy¯a, 15, 321–330. Mudholkar, G. S., Chaubey, Y. P., and Lin, C. C. (1976). Some approximations for the noncentral F distribution, Technometrics, 18, 351–358. Narula, S. C., and Levy, K. J. (1975). Probability density plots of the noncentral χ 2 and noncentral F distributions, International Statistical Review, 43, 79–82. Narula, S. C., and Weistroffer, H. R. (1986). Computation of probability and noncentrality parameter of noncentral F distribution, Communications in Statistics— Simulation and Computation, 15, 871–878. Nicholson, W. L. (1954). A computing formula for the power of the analysis of variance test, Annals of Mathematical Statistics, 25, 607–610. Norton, V. (1983). A simple algorithm for computing the noncentral F distribution, Applied Statistics, 32, 84–85. Odeh, R. E., and Fox, M. (1975). Sample Size Choice; Charts for Experiments with Linear Models, New York: Dekker. Pandey, J. N., and Rahman, M. (1971). The maximum likelihood estimate of the noncentrality parameter of a noncentral F variate, SIAM Journal on Mathematical Analysis, 2, 269–276. Park, J. H. (1964). Variations of the noncentral t and beta distributions, Annals of Mathematical Statistics, 35, 1583–1593. Patnaik, P. B. (1949). The noncentral χ 2 and F-distributions and their applications, Biometrika, 36, 202–232. Pe, T., and Drygas, H. (1994). Alternative representations of some doubly noncentral distributions: Univariate case, Statistical Papers, 35 (to appear). Pearson, E. S. (1960). Editorial note, Biometrika, 47, 430–431. Pearson, E. S., and Hartley, H. O. (1951). Charts of the power function for analysis of variance tests, derived from the noncentral F distribution, Biometrika, 38, 112–130. Pearson, E. S., and Tiku, M. L. (1970). Some notes on the relationship between the distributions of central and noncentral F, Biometrika, 57, 175–179. Perlman, M. D., and Rasmussen, U. A. (1975). Some remarks on estimating a noncentrality parameter, Communications in Statistics, 4, 455–468. Posten, H. O. (1993). An effective algorithm for the noncentral beta distribution function. The American Statistician, 47, 129–131. Price, R. (1964). Some noncentral F distributions expressed in closed form, Biometrika, 51, 107–122. Rasmussen, U. (1973). Testing and estimation problems concerning noncentrality parameters, Ph. D. dissertation, University of Minnesota, Minneapolis.

СПИСОК ЛИТЕРАТУРЫ

435

Rukhin, A. L. (1993). Estimation of the noncentrality parameter of an F distribution, Journal of Statistical Planning and Inference, 35, 201–211. Schader, M. and Schmid, F. (1986). Distribution function and percentage points for the central and noncentral F distribution, Statistische Hefte, 27, 67–74. Scheffe, H. (1959). The Analysis of Variance, New York: Wiley.1) Sebcr, G. A. F. (1963). The noncentral chi-squared and beta distributions, Biometrika, 50, 542–544. Severo, N., and Zelen, M. (1960). Normal approximation to the chi-square and noncentral F probability functions, Biometrika, 47, 411–416. Sibuya, M. (1967). On the noncentral beta distribution function. Unpublished manuscript. Singh, K. P., and Relyca, G. E. (1992). Computation of noncentral F probabilities. A computer program, Computational Statistics & Data Analysis, 13, 95–102. Steffens, F. E. (1968). Probability integrals of doubly noncentral F- and t-distributions with regression applications, Research Report No. 267, Council for Scientific and Industrial Research, Pretoria, South Africa. Tang, P. C. (1938). The power function of the analysis of variance tests with tables and illustrations of their use, Statistical Research Memoirs, 2, 126–150. Tiku, M. L. (1965a). Laguerre series forms of noncentral χ 2 and F distributions, Biometrika, 52, 414–427. Tiku, M. L. (1965b). Series expansions for the doubly noncentral F distribution, Australian Journal of Statistics, 7, 78–89. Tiku, M. L. (1966). A note on approximating to the noncentral F distribution, Biometrika, 53, 606–610. Tiku, M. L. (1967). Tables of the power of the F test, Journal of the American Statistical Association, 62, 525–539. Tiku, M. L. (1972). A note on the distribution of the doubly noncentral F distribution, Australian Journal of Statistics, 14, 37–40. Tiku, M. L. (1974). Doubly Noncentral F Distribution Tables and Applications, Selected Tables in Mathematical Statistics, vol. 2 (eds., H. L. Harter and D. B. Owen), Providence, RI: American Mathematical Society, pp. 139–178. Ura, S. (1954). A table of the power function of the analysis of variance test, Reports of Statistical Application Research, JUSE, 3, 23–28. Venables, W. (1975). Calculation of confidence intervals for non-centrality parameters, Journal of the Royal Statistical Society, Series B, 37, 406–412. Wang, M. C. (1992). Self-validating computation of non-central F probabilities, Proceedings of the ASA Statistical Computing Section, pp. 51–55. Weibull, C. (1953). The distribution of t- and F-statistics and of correlation and regression coefficients in stratified samples from normal populations with different means, Skandinavisk Aktuarietidskrift, 1–2, Supplement. Winer, B. J. (1971). Statistical Principles in Experimental Design, New York: McGraw-Hill. Wishart, J. (1932). A note on the distribution of the correlation ratio, Biometrika, 24, 441–456. Wishner, R. P. (i962). Distribution of the normalized periodogram detector, IRE Transactions on Information Theory, IT-8, 342–349.

1) Шеффе

Г. Дисперсионный анализ.: Пер. с англ. — М.: МГУ, 1963.

ГЛАВА 31

Нецентральное t-распределение

1.

Определение

Пусть U и χν — независимые случайные величины, где U имеет стандартное нормальное распределение [N(0, 1)], а χν — хи-распределение с ν степенями свободы. Отношение tν (δ ) =

U+δ χν ν −1/2

,

(31.1)

где δ — константа, называется нецентральной случайной величиной t с ν степенями свободы и параметром нецентральности δ . Иногда параметром 1 2 δ (а не δ ). При δ = 0 получается нецентральности называют δ 2 или 2 ν степенями свободы, описанное в гл. 28. (центральное) t-распределение с Если нет опасности ошибки, мы будем писать tν вместо tν (δ ), а иногда даже опускать индекс ν , записывая просто t . Однако, если будет возможна двусмысленность, например при рассмотрении двух возможных параметров нецентральности, то используем полное обозначение tν (δ ).

2.

Исторические замечания

Нецентральное t-распределение введено в работе Fisher (1931), где показано, как можно при работе с этим распределением использовать функции, получающиеся повторным интегрированием по полубесконечному промежутку стандартной нормальной функции распределения. Для некоторых t-распределений Neymann, Iwaszkiewicz and Kolodziejczyk (1935) составили таблицы, основанные на оценках функции распределения. Таблицы, по которым можно находить процентные точки нецентрального t-распределения, приводят Johnson and Welch (1940). Более поздние таблицы [Reznikoff and Lieberman (1957), Locks, Alexander and Byars (1963), Bagui (1993)] полнее и требуют меньше вычислений. Диаграммы, основанные на функции распределения, приведены в работе Pearson and Hartley (1954), см. также п. 7. Выражения для функции нецентрального t-распределения весьма сложны, даже более сложны, чем соответствующие функции нецентральных χ 2 и F-распределений. Несколько приближенных формул читатель найдет в ра436

437

3. ПРИЛОЖЕНИЯ И ОЦЕНКИ

боте Amos (1964). Существует ряд аппроксимаций функции распределения и процентных точек нецентрального t-распределения. Сравнение различных приближений для процентных точек содержится в статьях van Eeden (1961) и Owen (1963); в п. 6 резюмированы эти работы. Компьютерные программы для расчета процентных точек описаны в работах Owen and Amos (1963) и Bargmann and Ghosh (1964). Amos (1964) приводит сравнение двух таких программ. Более подробно об этом см. в п. 7.

3.

Приложения и оценки

 √ Статистика n X − ξ0 /S используется при проверке гипотезы о равенстве среднего нормальной популяции гипотетическому значению ξ0 . Если 2 3 n n   3 X = n−1 Xi и S = 4(n − 1)−1 (Xi − X)2 i=1

i=1

вычисляются по  выборке объема n из генеральной совокупности со средним ξ0 , √ то n X − ξ0 /S имеет (центральное) t-распределение с n − 1 степенью  √ свободы. Однако, если генеральное среднее ξ не равно ξ0 , то n X − ξ0 /S

√   имеет нецентральное распределение tn−1 n(ξ − ξ0 )/σ , где σ — генеральное стандартное отклонение. Мощность критерия выражается интегралом по конечному или полубесконечному промежутку от плотности нецентрального t-распределения. В близкой задаче проверки гипотезы о равенстве средних значений двух популяций (Π1 ) и (Π2 ) с равными, но неизвестными дисперсиями σ 2 по случайным независимым выборкам объемов n1 и n2 соответственно используется статистика "

 n1 n2 (n1 + n2 )−1 X 1 − X 2

. (n1 + n2 − 2)−1 (n1 − 1)S12 + (n2 − 1)S2 2

(31.2)

Если генеральные средние действительно равны, то это статистика имеет (центральное) t-распределение с (n1 + n2 − 2) степенями свободы. Если же разность генеральных равна θ , то  средних  (31.2) имеет нецентральное рас"  −1 −1 n1 n2 (n1 + n2 ) пределение tn1 +n2 −2 θσ . Здесь также мощность критерия выражается пространственным интегралом от плотности соответствующего нецентрального t-распределения. Диаграммы, показывающие мощность t-критериев, опубликовали Pearson and Hartley (1954) и Croarkin (1962). Таблицы функции мощности также содержатся в работах Neyman, Iwaszkiewicz and Kolodziejczyk (1935) и Davies (1954). Нецентральное t-распределение появляется также в некоторых критериях многомерного статистического анализа [см., например, Gupta and Kabe (1992)]. В некоторых приложениях возникает необходимость найти доверительные границы отношения генерального среднего к стандартному отклонению

438

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

(величина, обратная коэффициенту вариации). Такие доверительные границы в некоторых ситуациях можно найти, если X и S2 вычисляются по выборке X1 , . . . , Xn из нормальной популяции со средним ξ√и стандартным откло √  nξ /σ . Симметричные нением σ . Тогда nX/S имеет распределение tn−1 100(1 − α )%-е доверительные границы для ξ /σ получаются как решения уравнений

√  √nX  nθ = (31.3a) tn−1, α 2

и  tn−1,1− α 2

S √

√  nX nθ = . S

(31.3b)

Аппроксимации распределений выборочного коэффициента вариации и связь с нецентральным t-распределением изучаются в работе McKay (1932). Iglewicz, Myers and Howe (1968) нашли приближенные значения (с четырьмя точными десятичным знаками) процентных точек, выраженных через процентные точки χ 2 -распределения. Belobragina and Eliseyev (1967) построили номограмму, позволяющую находить нижнюю 100(1 − α )%-ную границу для ξ /σ . Их графики дают верхнюю границу для Φ(−ξ /σ ) по значению X/S в случае объема выборки 5, 10, 20, 50 и 100 и доверительной вероятности 90%, 95%, 97%, 99% и 99.9%. Rukhin (1992) рассмотрел точечную оценку (ξ /σ )2 . Оценка максимального правдоподобия равна  2 n X ; n−1

S

несмещенная оценка с минимальной дисперсией при n > 3 есть  2 n−3 X 1 − . n−1

S

n

(31.4)

Рухин (Rukhin) выяснил, что последняя оценка может оказаться отрицательной, поэтому неприемлема. Он предложил искать хорошую оценку в виде  2 a X b + , a, b  0. (31.5) n−1

S

n

Используя среднеквадратическую ошибку как меру качества оценки, Рухин рекомендует оценки вида  2 n−5 X b + , n > 5, b > 0, (31.6) n−1

S

n

если предполагается, что |ξ /σ | велико. Эти оценки являются предпочтительными в классе оценок (31.5), но не в общем случае. Рассмотрим теперь задачу построения 100(1 − α )%-го доверительного интервала для 100P-процентили распределения X, которая равна ξ +uP σ , где ξ и σ определены выше, и Φ(uP ) = P. Эту задачу рассматривают Stedinger (1983a) и Chowdhury and Stedinger (1991) в связи с оценкой величины P−1 при

439

3. ПРИЛОЖЕНИЯ И ОЦЕНКИ

расчете водных потоков в гидротехнике (об этом√также см. ниже). Поскольку   √  −uP n , то n X − ξ − uP σ /S распределено как tn−1   

√  S √    Pr X − tn−1,1− −uP n √ < ξ + uP σ < X − tn−1, −uP n  ξ , σ = 1 − α . α α n

2

Следовательно,

√    tn−1,1−α /2 −uP n √ X− S, n

2

X−

√    tn−1, α /2 −uP n √ S n

(31.7)

есть 100(1 − α )%-й интервал для ξ + uP σ . В силу равенства tν ,ε (−δ ) = −tν ,1−ε (−δ ) имеет место равносильная формула, полученная в статье Wolfowitz (1946):

√ 

√      tn−1,α /2 uP n tn−1,1−α /2 uP n √ √ S, X + S . (31.7) X− n

n

Таблицы множителей при S с тремя десятичными знаками вычислены в статье Stedinger (1983a) для 1 − α = 0.50, 0.90, 0.99; P = 0.90, 0.98, 0.99; n = 4 (1) 20, 22, 25, 27, 30 (5) 60 (10) 100 [см. также Chowdhury and Stedinger (1991)]. В этой же статье приведено сравнение нескольких аппроксимаций, используемых в приложениях, связанных, конкретно, с распределением водных потоков. Это является одним из многочисленных приложений, рассматриваемых в последние десятилетия и отраженных в библиографии, которая насчитывала уже тогда более 100 названий, приведенных в статье Owen (1968). Много примеров содержит монография K¨uhlmeyer (1970). Мы приведем здесь более поздние примеры. Hall and Sampson (1973) использовали (31.7) для построении толерантных границ распределения произведения двух нормальных величин, возникающего при анализе производства таблеток в фармацевтической промышленности. Malcolm (1984) применяет нецентральное t-распределение при исследовании микробиологических характеристик продуктов питания. Lahiri and Teigland (1987) выяснили, что нецентральное t-распределение хорошо моделирует распределение оценочного прогноза национального валового продукта и дефлятора инфляционных явлений. Miller (1989) использует нецентральное t-распределение для вычисления параметрического байесовского коэффициента при вычислении нормальных толерантных границ. Dasgupta and Lahiri (1992) рассматривают нецентральное t-распределение как одно из изучаемых ими моделей выборочного обследования. Phillips (1993) применяет нецентральное t-распределение при построении критерия проверки гипотезы о вероятности того, что отношение биологической активности нового и традиционного препарата находится в определенных границах.

440

4.

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

Моменты

Момент порядка r величины tν (δ ) относительно нуля равен

E[tν r (δ )] = ν r/2 E[χν−r ]E (U + δ )r =  1 (ν − r) Γ 2   1 Γ ν 2 

 =

1 ν 2

r/2

  r  (2j)! δ r−2j . 2j 2j j!

(31.8)

0jr/2

Hogben, Pinkham and Wilk (1961) приводят несколько отличную форму,    dr r δ 2 /2 −δ 2 /2 в которой сумма заменена выражением e e . Merrington and dδ r Pearson (1958) получили следующие выражения:   1/2 Γ 1 (ν − 1) 1 2 μ1 = ν δ, 



2

Γ

ν

(31.9a)

1 ν 2

var(tν ) = μ2 = (1 + δ 2 ) − μ1 2 , ν−2  ν (2ν − 3 + δ 2 )  μ3 = μ1 − 2μ2 ,

(31.9b)

(31.9c)

 ν (ν + 1)δ 2 + 3(3ν − 5) (3 + 6δ 2 + δ 4 ) − μ1 2 − 3μ2 .

(ν − 2)(ν − 3)

μ4 =

ν2 (ν − 2)(ν − 4)

(ν − 2)(ν − 3)

(31.9d) Момент порядка r записывается в виде многочлена от δ 2 : 

[r/2]

μr =

cr,r−2j (ν )δ r−2j .

j=0

Hogben, Pinkham and Wilk (1961) приводят таблицы коэффициентов cr,i (ν ) с шестью значащими цифрами для r = 2, 3, 4 и ν = 1 (1) 25 (5) 80 (10) 100 (50) 200 (100) 1000. Авторы также приводят значения μ1 /δ (31.9a) с шестью значащими цифрами. Для больших ν при фиксированном δ  

 1 5 μ1 ≈ δ , var tν ≈ 1 + δ 2 ν −1 , μ3 ≈ ν −1 δ 3 + δ 2 ν −1 , 2 4 " β1 , выражающее асимметрию, приближенно равно моментное отношение

 ν −1 δ 3 − δ 2 ν −1 . Заметим, что знак асимметрии и знак среднего значения совпадают со знаком δ . Кроме того, распределение tν (−δ ) получается зеркальным отражением распределения tν (δ ) относительно tν = 0. Точки (β1 , β2 ) для распределения tν лежат в области распределений системы Пирсона типа IV (см. гл. 12). Merrington and Pearson (1958) нашли интересное приближенное равенство β2 ≈

1.406(ν − 3.2) 3(ν − 2) β1 + . ν−4 ν−4

441

5. ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ

5.

Функция распределения

События tν (δ ) 0 дает

1 2 Pr 0 < tν  t = e−δ /2 2



 1 2 1/2 δ   2 1 1 I (j + 1), ν 2 /(ν +t2 ) t   2 2 1 j+1 Γ 2

∞  j=0

(31.16)

[см. также Hawkins (1975)]. Guenther (1975) получил следующее разложение в терминах нормированной неполной бета-функции (см. гл. 1, п. A5): ∞      

1 ν ν pj Ix j + , + qj Ix j + 1, , (31.17) Pr 0 < tν < t = 2 2

j=0

где

2

t2 , t2 + ν 1 −δ 2 /2 2 j e δ /2 , pj = 2 j! 1 −δ 2 /2 2 j e δ /2 qj = 2 √   . 3 2Γ j + 2

x=

Вычисление по формуле (31.17) можно вести на карманном калькуляторе, и она использована в работе Lenth (1989) в компьютерном алгоритме (см. п. 7). Можно записать разложение, аналогичное (31.16) для Pr[−t < tv  0] при −t < 0, тогда получается знакочередующийся ряд. Но можно последнюю вероятность выразить Pr[−t < tv  t],

 2 через (31.16), так же как и вероятность 2 2 которая равна Pr tν  t . Для этого заметим, что tν имеет нецентральное  распределение F1, ν (δ ) (гл. 30, п. 4). Следовательно, Pr[−t  tv  t] = e−δ

2

/2



∞ 

1 2 δ 2

=e



Pr F1+2j,ν < (1 + 2j)−1 t2 =

j!

j=0

−δ 2 /2

j

  1 2 j ∞  δ 2

j!

j=0

  1 1 It2 /(ν+t2 ) j + , ν .

(31.18)

2 2

При t > 0 и четном ν вероятность Pr[0 < tv  t] выражается конечной суммой в терминах функций Hh:   1 δ 2ν  Pr[0 < tv  t] = √ exp − × 2 2π

2 ν+t

 (2j)! 

(ν −2)/2

×

j

j=0

2 j!

ν



2 ν + t2

j

 δt Hh2j − √

ν + t2

 .

(31.19)

Среди формул, приведенных в статье Amos (1964), автор выделяет удобное для вычислений выражение функции распределения tv через вырожденные

444

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

гипергеометрические функции (гл. 1, п. A7): ∞  Γ(a + j)Γ(b)xj M(a, b; x) = j=0

Γ(a)Γ(b + j)j!

(b = 0 и не является отрицательным целым). При ν > 2

1 Pr tν  t = 1 − √

δν 1/2 /(ν +t2 )1/2



−∞



*



1 1 exp − u2 du+ √ 2 π



Γ

t



ν + t2

 1 (ν + 1) 2  × 1 Γ ν 2

  1   2 j  Γ 1− ν +j t 1 1 −δ 2 ν 2 × · M j + , ; 2 −   1 2 2 2 ν +t ν + t2 j=0 j!(2j + 1)Γ 1 − ν 2    + ∞ Γ 1 (1 − ν ) + j  2  √  δ ν t 1 3 −δ 2 ν 2 · M j + , ; 2 . −   

1 2 2 2 ν +t ν + t2 2 ν + t2 j=1 j!Γ (1 − ν ) 2 ∞ 

Если ν четно, то первая сумма содержит конечное число 1



(31.20)  1 ν + 1 слагаемых; 2

при нечетном ν конечное число (ν + 3) слагаемых содержит вторая сумма. 2 Hodges and Lehmann (1965) разложили √ в асимптотический (при ν → ∞) ряд по степеням центральных моментов χν / ν мощность t-критерия (см. п. 3) с ν степенями свободы. Авторы выяснили, что использование этого ряда при «не слишком малых ν » (детально разобран случай ν = 40) позволяет во многих случаях вычислить мощность с удовлетворительной точностью. Кроме того, этот ряд полезен при оценке возможности интерполяции по δ в таблицах нецентрального t-распределения (см. далее, п. 6). При t > 0 Guenther (1975) рекомендует разделять ряды в (31.20) на два ряда, один из которых содержит суммирование по нечетным j, а другой — по четным. При суммировании по четным j, используя тождество j! =



2j Γ (j + 1)/2 Γ (j + 2)/2 √ π

и полагая t2 = u и u = (j+ 1)/f , получаем:

j 2 ∞  ∞ e−δ /2 δ 2 /2

 1 Pr tν > t = 2

+

j!

j=0

t2 /(2j+1)

j

2 ∞  δ e−δ /2 j! 2δ 2 √

j=0



p(f ; 2j + 1, ν )df + ∞ 

p(f ; 2j + 2, ν )df ,

(2j + 1)!

(31.21)

t2 /(2j+2)

где p(f ; ν1, ν2 ) — плотность (центрального) F-распределения с ν1 , ν2 степенями свободы [гл. 27, формула (27.4)]. Это выражение особенно удобно для расчета на калькуляторе.

445

6. АППРОКСИМАЦИИ

Ifram (1970) заметил, что плотность нормальной случайной величины со средним ξ и дисперсией 1 можно записать в виде   1 pX (x) = φ (x − δ ) = φ (x) exp − δ 2 + δ x = 2     1 1 −1 (|x|) + δ x EK pχ2K+2 (|x|) (31.22) = EK pχ2K+1 2 2 2

где

2

  −1 1 ν x(ν/2)−1 e−x/2 pχν2 (x) = 2ν/2 Γ 2

[см. гл. 18, формула (18.1)], и K имеет распределение Пуассона со средним 1 2 δ . Отсюда автор получил равенство 2

ptv (δ ) (t) =

    1 1 δ Γ ((ν − 1)/2) √ EK p√G (|t|) + E (|t|) , p K G2K+3,ν −1 2K+1,ν 2 2 t √ 1  2Γ ν 2

(31.23)

где Gν1 ,ν2 распределено как отношение χν21 /χν22 независимых величин χ 2 . 2 Если " U имеет распределение Gν1 ,ν2 , то говорим, что U имеет распределение Gν1 ,ν2 . Voit and Rust (1990) предложили вычислять нецентральное t-распределение, применяя каноническую S-систему [см. гл. 12, формула (12.90)]. Они заметили, что плотность (31.15) нецентрального t-распределения записывается в виде

  (ν+1)/2 exp −δ 2 /2 Γ ((ν + 1)/2) ν √ S(t), (31.15) 2 Γ (ν /2)

πν

где S(t) =

ν+t

∞  √ j  Γ ((ν + j + 1)/2) tδ 2 j=0

и что S(t) и

Γ ((ν + 1)/2)



ν + t2

,

3/2 ν + t2 Z(t) = S (t) νδ

удовлетворяют дифференциальному уравнению dZ(t) tνδ 2 ν (ν + 1)δ = Z(t) +  3/2 S(t). 2 dt ν + t2 ν + t2

(31.24)

Это позволяет построить представление S-системой [гл. 12, формула (12.90)] центрального и нецентрального t-распределения. Авторы также описывают подход, позволяющий вычислять квантили и моменты нецентрального t-распределения, используя S-систему.

6.

Аппроксимации

Настоящий раздел получился довольно большим, так как в нем отражены многочисленные публикации по методам аппроксимации нецентральных распределений, привлекающих внимание исследователей в последние десятилетия. Несмотря на развитие компьютерных технологий, эта область далеко

446

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

не исчерпана и остается актуальной, что показывает, например, остроумная работа Deutler (1984), результаты которой мы сформулируем ниже. Если δ фиксировано и ν неограниченно возрастает, то распределение tν сходится к нормальному N(δ , 1). При фиксированном ν > 2 и неограниченном возрастании δ нормированное tν -распределение сходится к нормированному распределению χν−1 . Первые работы основывались на распределениях функций от аппроксимируемой величины. Jennett and Welch (1939) использовали приближенную нормальность величины U − t0 χν ν −1/2 в равенстве  

(31.25) Pr tν  t = Pr U − tχν ν −1/2  −δ и получили Pr где



tν

√ −1  x t ≈ 2π

e−u

2

/2

du,

−∞

−1/2   −δ + tν −1 E[χν ] . x = 1 + t2 ν −1 var(χν )

Аппроксимация процентных точек tν ,α (δ ), определенных равенством

Pr tν (δ )  tν ,α (δ ) = α , получается, если взять x = uα и решить получившееся уравнение относительно t. В результате имеем: tν ,α ≈

δ bν + uα

 

b2ν + 1 − b2ν δ 2 − u2α   b2ν − u2α 1 − b2ν

где



1 (ν + 1) 2   1 Γ ν 2

,

(31.26a)



(2/ν )1/2 Γ

bν = ν −1/2 E [χν ] =

,

 var (χν ) = ν 1 − b2ν .

Значения bν содержатся в таблице 35 книги Pearson and Hartley (1954) для ν = 1 (1) 20 (5) 50 (10) 100, а также в сообщении van Eeden (1958). 1 Johnson and Welch (1940), используя приближенные значения var(χν ) ≈ 2 √ и E [χν ] ≈ ν , получили приближенную формулу 6   −1 1 1  . (31.26b) tν,α ≈ δ + uα 1 + (δ 2 − u2α ) ν −1 1 − u2α ν −1 2

2

[Masuyama (1951) показал, как можно находить приближенные значения этой величины, используя специальный вид «биномиальной вероятностной бумаги».] Аппроксимация, занимающая промежуточное место между (31.26a)

447

6. АППРОКСИМАЦИИ

и (31.26b), получается, если использовать точное значение E[χν ] и заменить 1 var(χν ) на . Это сделал van Eeden (1958), получивший формулу 2

6

tν ,α ≈

δ bν + uα

b2ν + b2ν −

 1 2 δ − u2α ν −1 2

1 2 −1 u ν 2 α

.

(31.26c)

Приведенные аппроксимации дают значения tν ,α , близкие к истинным только в ограниченных диапазонах δ и uα . Формула (31.26a) применима, если  

b2ν + 1 − b2ν δ 2 − u2α > 0, откуда

−1 u2α < b2ν 1 − b2ν + δ 2.

Формула (31.26b) применима, если  1 2 1+ δ − u2α ν −1 > 0, 2

откуда

u2α < 2ν + δ 2 .

Формула (31.26c) применима, если  1 2 b2ν + δ − u2α ν −1 > 0, 2

откуда

u2α < 2ν b2ν + δ 2 .

−1 Из неравенств 2ν b2ν < b2ν 1 − b2ν < 2ν следует, что при фиксированном δ (31.26b) применима в более широком диапазоне значений α , чем (31.26a), а (31.26a) — в более широком диапазоне, чем (31.26c). Следует, однако, принять во внимание, что для значений α , близких к границам допустимого диапазона, получаемые значения ненадежны. Van Eeden (1958) отмечает, что формула (31.26b), хотя и применима в более широком диапазоне, имеет меньшую точность. Задачу решения обратного уравнения   √

 (U + δ ) ν Pr tν (δ )  t = Pr t =α (31.27) χν

относительно δ при фиксированных t, ν и α для построения доверительного интервала для δ рассмотрел Deutler (1984). Он модифицировал старый результат, полученный в работе Johnson and Welch (1940). Обозначим решение (31.27) δ (t; ν , α ). Johnson and Welch (1940) получили грубую аппроксимацию

 (31.28) δ (t; ν , α ) ≈ bν t − uα 1 + (2ν )−1 t2 − a2ν , ;    " 1 1 где Φ(uα ) = α , bν = (2/ν )Γ (ν + 1) Γ ν , как и в (31.26a) и a2ν = 2 2

 = 2ν 1 − b2ν ; ее усовершенствовал Deutler (1984), использовавший устой√ чивое разложение Корниша—Фишера (Cornish—Fisher) для χν / v. Тогда uα

448

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

заменяется величиной zν,α = uα + A1 + A2 + A3 + · · · ,

(31.29)

где  1 2 u − 1 ζ3 , 6 α   1 3 1 3 uα − 3uα ζ4 − 2uα − 5uα ζ32 , A2 = 24 36    1 4 1 4 1 2 uα − 6uα + 3 ζ5 + uα − 5u2α + 2 ζ3 ζ4 + 12u4α − 53u2α + 17 ζ33 A3 = 120 24 324 A1 =

и

ζr =

t2 2 2 1 + t bν /(2ν )

r/2

 (−1)r κr

χ √ν ν

 ,

r  3,

(31.30)

есть r-й семиинвариант величины    −1/2 χν 1 U − √ t + aν t 1 + b2ν ν −1 t2 ν

2

[aν и bν определены как в (31.28)]. Подходящие разложения по степеням ν −1 таковы:

√  1 1 13 75 1215 17403 122101 κ3 χν / ν = 2 2 + 4 3 − 7 4 − 9 5 + 13 6 + 15 7 − 18 8 − 2 ν 2 ν 3371095



√  κ4 χν / ν =

220 ν 9 3 3

4 4

+



2 ν

2 ν

2 ν

,

225 ν 10 45 57

2 ν

7 6



6 7

+

4875 12 8

+

24129 12 9



226155

,

2 ν 2 ν 2 ν 2 ν 215 ν 10

√  3 9 345 2625 88161 1321815 17285517 κ5 χν / ν = − 4 4 − 6 5 + 9 6 + 11 7 − 15 8 − 17 9 + 20 10 . 2 ν 2 ν 2 ν 2 ν 2 ν 2 ν 2 ν 2 ν

4 5

+

2 ν 2 ν 88464187

Эта аппроксимация дает весьма хорошие результаты при ν > 5 и становится более точной с возрастанием ν . Johnson and Welch (1940) составили таблицы, по которым δ (t; ν , α ) вычисляется непосредственно. Таблицы дают значения λ (t; ν , α ), и δ (t; ν , α ) вычисляется по формуле 6 δ (t; ν , α ) = t − λ (t; ν , α )

1+

t2 . 2ν

(31.31)

Значения λ (t; ν , α ) табулированы для α = 0.5 (0.1) 0.9, 0.95, 0.975, 0.99, 0.995,

ν = 4 (1) 9, 16, 36, 144, ∞.

Большие значения ν используются, чтобы облегчить интерполяцию √ по 12/ ν . В монографии K¨uhlmeyer (1970) значения λ (t; ν , α ) табулированы в за√ −1/2  висимости от y = 1 + t2 (2ν )−1 при |t|/ 2ν  0.75 и в зависимости от " √ −1/2

= 1 − y2 при |t|/ 2ν < 0.75 для α = 0.99, 0.95, 0.90 y = t 2ν + t 2

449

6. АППРОКСИМАЦИИ

и вышеприведенных значений ν . При α = 0.01, 0.05, 0.10 используется равенство δ (t; ν , α ) = −δ (−t; ν , 1 − α ). Непосредственные аппроксимации нецентрального t-распределения получены в более поздних работах. Для малых δ и больших ν (>20) простая аппроксимация стандартизированного распределения tν стандартной нормальной величиной дает удовлетворительный результат. Это равносильно использованию формулы 6   ν 2 ν ν 1 + δ2 − δ bν + uα δ 2 b2ν . (31.32) tν ,α (δ ) ≈ ν−1 ν−2 ν−1

 Так как var tν не существует при ν  2, то формула неприменима при ν  2. Мы уже упомянули, что в действительности эти формулы неприменимы, если ν недостаточно велико, а δ — недостаточно мало. При δ = 0 получается 6 ν , tν,α ≈ uα ν−2

что является хорошим приближением, как уже отмечено в п. 4 гл. 28. Предпочтительней аппроксимация, получаемая при использовании распределения типа IV системы Пирсона, четыре первых момента которого совпадают с моментами t-распределения. Merrington and Pearson (1958) показали, что это приближение дает верхние и нижние 5%-, 1%-, и 0.5%-е точки с погрешностью, не большей 0.01 в широком диапазоне значений δ и ν (включая ν = 8). Дальнейшие исследования Пирсона [Pearson (1963)] подтвердили близость указанных распределений. С помощью разложения Корниша—Фишера получается следующее приближение α -квантиля распределения tν (δ ) (до членов порядка ν −2 включительно):

 1

tν ,α (δ ) ≈ uα + δ + u3α + uα + 2u2α + 1 δ + uα δ 2 ν −1 + 4

 1 5 5uα + 16u3α + 3uα + 3 4u4α + 12u2α + 1 δ + + 96 



(31.33a) + 6 u3α + 4uα δ 2 − 4 u2α − 1 δ 3 − 3uα δ 4 ν −2 . Полагая δ = 0 в (31.33a), получаем аппроксимацию процентных точек центрального t-распределения [см. гл. 28, формула (28.16)]:   1 3 1 5 tν,α ≈ uα + uα + uα ν −1 + 5uα + 16u3α + 3uα ν −2 . 4

96

Если слагаемые в (31.33a) заменить точными значениями tν,α , то получаем аппроксимацию  1 tν ,α (δ ) ≈ tν,α + δ + δ 1 + 2u2α + uα δ ν −1 + 4 

  1 4 + δ 3 4uα + 12u2α + 1 + 6 u3α + 4uα δ − 4 u2α − 1 δ 2 − 3uα δ 3 ν −2 . 96

(31.33b) Большой объем числовых сравнений при ν = 2 (1) 9, проведенных в работе van Eeden (1958), показывает, что при δ > 0 формула (31.33a) дает

450

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

  1 лучшие результаты для нижних процентных точек α < , а (31.33b) лучше 2

1

при α > . 2 Azor´ın (1953) получил аппроксимацию другого типа, построив преобразование, сохраняющее приближенное значение дисперсии. Отправляясь от соотношения 2 var(tν ) = a2 + b2 {E[tν ]} , где

6 a=

ν , ν−2



1 b=Γ ν 2



получаем преобразование

C

−1   2 1 2 (ν − 2) Γ (ν − 1) −1 , 2

bE tν 1 bt Arsh ν − Arsh , b a a

(31.34a)

и эта величина имеет распределение, близкое к стандартному нормальному. Такое преобразование рассматривается в статье Laubscher (1960). Азорин (Azor´ın) предложил два более простых преобразования, каждое из которых приводит к распределению, близкому к нормальному:    √ t ν Arsh √ν − δ , (31.34b) ν 6   2 ν Arsh 3

"

tν (2/3)ν

− δ.

(31.34c)

Приведенные преобразования приближают нецентральное t-распределение распределением SU (см. гл. 12, п. 4.3). Преобразования типа (31.34), повидимому, приводят к точности, сравнимой с точностью аппроксимации распределением типа IV в связи с близостью распределений типа IV и SU — распределения. Преобразование, дающее весьма хорошую точность, предложено в работ Hartley (1957). Она предложила аппроксимировать распределение tν (δ ) распределением коэффициента корреляции R (гл. 32) для выборки объема ν + 2 из двумерного нормального распределения с коэффициентом корреляции 6 2 ρ=δ· . 2 2ν + 1 + δ

Предлагаемая функция есть "

(см. гл. 32, п. 2).

R 1 − R2

6

ν (2ν + 1) 2v + 1 + δ 2

(31.35)

451

6. АППРОКСИМАЦИИ

Не только процентные точки распределения tν аппроксимируются процентными точками R, но и наоборот, можно аппроксимировать процентные точки R процентными очкам tν . По мнению van Eeden (1958) и Owen (1963), последнее более важно. Hogben, Pinkham and Wilk (1964) аппроксимируют распределение

−1/2 и, следовательно, tν . Использование распределения типа Q = tν ν + tν2 I, т. е. бета-распределения на промежутке (−1; 1) для аппроксимации Q равносильно аппроксимации распределения tν . Авторы утверждают, что такое приближение особенно полезно при малых значениях δ . Упомянем теперь аппроксимации, предложенные в работе Halperin (1963). Они не столь точны, но позволяют найти границы процентных точек. Они также просты для вычислений и используют процентные точки центральных распределений tν (tν,α ) и χν2 (χν2,α ). Автор получил неравенства (при δ > 0): √ δ ν + tν,α , χν ,1−α √ δ ν tν ,α (δ )  + tν,α , χν ,1−α

tν ,α (δ ) 

α

1 , 2

(31.36a)

α  0.43.

(31.36b)

Kraemer (1978) приближает tν с помощью центральных t-распределений. Аппроксимация основана на следующем утверждении, доказанном в работе Kraemer (1978): существует функция θ = θ (δ , ν ), удовлетворяющая уравнению  

 −1/2   lim Pr tν (δ )  t − Pr tν  (g − θ ) 1 − g2 1 − θ 2 ν −1 = 0, ν →∞ (31.37) где g = t(t2 + ν )−1/2 . Kraemer (1978) эмпирически установила, что хорошие результаты получаются при θ (δ , ν ) = δ (δ 2 + ν )−1/2 . Используя эту функцию и второе нормальное приближение, приведенное в статье Johnson and Welch (1940), она получила приближение *  −1/2 +

 t2 , (31.38) Pr tν (δ )  t ≈ Φ (1 − δ ) 1 + 2ν

откуда *

*   −1/2 + 1/2  1/2 + t2 δ2 t2 ≈ Pr tν < t 1 + . (31.39) Φ (t − δ ) 1 + −δ 1+ 2ν

ν

ν

Для не очень больших ν и δ > 0 нельзя отдать предпочтение ни (31.38), ни (31.39). В статье Kraemer (1978) показано, что при оценке 95%-й точки t-аппроксимация лучше при δ < 2, а при δ > 2 лучше нормальная аппроксимация. «Односторонние критерии и доверительные интервалы, основанные на t-аппроксимации, одинаково точны для обеих сторон; нормальная аппроксимация может давать различные ошибки для разных сторон». Аппроксимация Кремер (Kraemer) дополняет существующие результаты и более точна для тех диапазонов параметров, для которых таблицы точных значений пока недостаточны.

452

7.

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

Таблицы, диаграммы и компьютерные алгоритмы

Первые таблицы нецентрального t-распределения составлены Ежи Нейманом (Jerzy Neymann) и его коллегами в середине тридцатых годов XX в. Существенное продвижение в деле табулирования относится к началу шестидесятых годов. Ниже мы перечислим некоторых авторов. Наиболее подробные таблицы появились в 1993 г. Имея в виду исторический интерес и возможности расширения, мы приведем более или менее подробное описание ранних работ. Таблицы Neyman, Iwaszkiewicz and Kolodziejczyk (1935) и Neyman and Tokarska (1936) составлены для расчета мощности t-критерия. В первой из указанных работ (таблица III) приведена оперативная характеристика (1−мощность) t-критерия при уровне значимости 5% для значений δ = 1 (1) 9

и для ν = 1 (1) 30 (т. е. значения Pr tν (δ )  t ν,0.95 ), а также значения δ , удовлетворяющие уравнению Pr tν (δ )  tν,0.95 = 0.05. Во второй статье содержится расширенный вариант тех же таблиц. Owen (1965) приводит таблицы с пятью десятичными знаками значений δ , удовлетворяющих

уравнению Pr tν (δ )  tν,1−α = β для ν = 1 (1) 30 (5) 100 (10) 200, ∞, α = 0.005, 0.01, 0.025, 0.05, β = 0.01, 0.05, 0.1 (0.1) 0.9.

Johnson and Welch (1940) составили таблицы значений λ , удовлетворяющих условию   tν ,α (δ ) =

δ +λ 1+

 1 2 δ − λ 2 ν −1 2

1−

1 2 −1 λ ν 2

1/2

.

(31.40)

Сравнение с (31.26b) показывает, что (как можно было ожидать) λ ≈ uα , но значения λ меняются медленно при изменении δ и ν , что облегчает интерполяцию. Значения λ (т. е. uα ) приводятся для ν = 4 (1) 9, 16, 36, 144, ∞. При ν  9 предлагается интерполяция по аргументу 12ν −1/2. Используемый  −1/2 √ 1 аргумент есть y = 1 + tν 2 ν −1 при 0.6  |y|  1 и y = ytν / 2ν при 2 |y|  0.6. Значения α (в оригинале статьи 1 − ε ) суть 0.005, 0.01, 0.025, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 0.95, 0.975, 0.99 и 0.995. Так как аргумент есть функция от tν , то напрямую таблица дает значения δ  = δ (ν , t , α ) = t −

λ , y

(31.41)

и тогда tν ,α (δ  ) = t . Чтобы найти tν ,α (δ ) при заданном δ , необходим итеративный алгоритм (обратная интерполяция). Таблица, обеспечивающая применение такого алгоритма, приведена только при α = 0.95. Эта таблица дает λ с тремя или четырьмя десятичными знаками как функции −1/2  √  1 η = δ / 2ν 1 + δ 2 ν −1 . Опубликованные позже таблицы Owen (1963) 2

7. ТАБЛИЦЫ, ДИАГРАММЫ И КОМПЬЮТЕРНЫЕ АЛГОРИТМЫ

453

являются значительно более подробными. Аргумент η табулирован с шагом 0.01 вместо 0.1; λ дается с пятью десятичными знаками, включены значения ν = 1, 2, 3 в дополнение к значениям, содержащимся в таблицах Welch (1940). Множество значений α , однако, меньше: 0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.75, 0.9, 0.95, 0.975, 0.99, 0.995. Owen (1963) приводит также таблицы λ с пятью десятичными знаками как функции от y и от y (в той же форме, что и в таблицах Джонсона и Уэлча (Johnson and Welch)) для тех же значений ν и α . Существуют также таблицы величины k с тремя десятичными знаками, удовлетворяющей равенству   √ √ (31.42) tν ,α up ν + 1 = k ν + 1, для p = 0.75, 0.9, 0.95, 0.975, 0.99, 0.999, 0.9999, 0.99999, и ν + 1 = 2 (1) 200 (5) 400 (25) 1000 (500) 2000, 3000, 10000, ∞. Значения α — те же, √ что в таблицах Оуэна (Owen). Выбор up ν + 1 в качестве параметра нецентральности делает более удобным использование таблиц для нахождения доверительных интервалов для процентных точек нормального распределения. В силу равносильности неравенств X − kS < ξ − up σ и  √ √ n X − ξ σ −1 + nup

получаем:



−1

√ 6, α  0.01 и β  0.09 линейная гармоническая интерполяция дает хорошие результаты, и практически используемые значения получаются во всех промежуточных точках. Из коротких, но полезных таблиц упомянем таблицы van Eeden (1961) и таблицы Scheuer and Spurgeon Van Eeden (1961) приводит непо  √ (1963).  средственно значения tν,α up ν + 1 с тремя десятичными знаками (при α = 0.99, 0.01 — с двумя) для ν = 4 (1) 9, α = 0.01, 0.025, 0.05, 0.95, 0.99 и p = 0.125, 0.15 (0.05) 0.45. Scheuer and Spurgeon (1963) приводят значения той же функции при p и ν тех же, что в работе Resnikoff and Lieberman (1957), но только для α = 0.025, 0.975. Bruscantini (1968) предпринял детальное изучение распределения U + θχ2 . Он ссылается и приводит выдержки из неопубликованных таблиц (с пятью десятичными знаками) функции распределения величины    −1/2 π 1 Y = Y − θ (31.47) 1 + θ2 2 − π 2



2

0.5 и θ = 2.00 (0.05) 7.20. Эти значения равны для аргумента y с шагом значениям Pr t2 (y ) > θ , где 6   π 1   (31.48) y =θ + y 1 + θ2 1 − π . 2

2

455

7. ТАБЛИЦЫ, ДИАГРАММЫ И КОМПЬЮТЕРНЫЕ АЛГОРИТМЫ

В одной из последних по времени подробных таблиц Bagui (1993) содержатся значения tν ,α (δ ) с пятью десятичными знаками для α = 0.01, 0.025, 0.05, 0.1, 0.2, 0.3, 0.7, 0.8, 0.95, 0.975, 0.99, δ = 0.1 (0.1) 8.0, ν = 1 (1) 60.

Компьютерный алгоритм вычисления функции распределения нецентрального t-распределения составил Cooper (1968) (алгоритм S5) [воспроизведен с модификациями в работе Griffiths and Hill (1985)] — один из первых, вошедших в раздел алгоритмов журнала «Applied Statistics». Другие алгоритмы содержатся в работах Lenth (1989), Narula and Weistroffer (1986), Guirguis (1990) и Posten (1993). Программа Купера (Cooper), составленная на стандартной версии языка FORTRAN, использует численный метод, разработанный Owen (1965b). Результат является точным при условии точного вычисления вспомогательных функций. Существенная часть программы — вычисление вспомогательной функции     2 2 h ax a exp −h2 /2 1 + x2 arctg a 1 x +y 1 − exp − dx. dxdy = T(h, a) = 2π 2π 2 2π 1 + x2 (31.49) 0 0 0 При h  a Cooper (1968) использует аппроксимацию   h arctg a 1 1 u2 arctg(1/a) T(h, a) ≈ − √ exp − du + 2π

2





2

0

(алгоритм Купера AS 4). Другая подпрограмма использует алгоритм (алгоритм Купера S2) вычисления нормальной функции распределения. Для большого числа степеней свободы Купер использует нормальную аппроксимацию, причем допускается дробное число степеней свободы. Автор сообщает, что расчеты имеют точность шесть десятичных знаков, однако при ν порядка 100 погрешность нормальной аппроксимации имеет порядок 5 × 10−4 . Алгоритм работы Lenth (1989) основан на разложении в ряд (31.21), приводимом в статье Guenther (1975). Ошибка определяется использованием конечного числа членов ряда и при использовании n членов ряда ограничена    величиной n   3 ν |En | < 2 1 − pj Ix n + , , 2 2

j=0

где, как и выше, pj =

 j 1 −δ 2 /2 2 e δ /2 2 j!

[см. также Singh, Relyea and Bartolucci (1992)]. Точность алгоритма Лента (Lenth) порядка ±10−6 для −11.0  δ 11.0 получается, если брать 100 членов разложения. Вычисление неполной бета-функции проводится по улучшенной версии алгоритма Majumber and Bhattacharjee (1973). В большинстве

456

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

случаев алгоритм Купера быстрее алгоритма Лента, это — цена большей общности алгоритма Лента. Эксперименты, проведенные на IBM PC (Microsoft Fortran 77), показали, что погрешность алгоритма Лента [Lenth (1989)] не превосходит 10−6 . Singh, Relyea and Bartolucci (1992) и Posten (1993) приводят алгоритмы, также основанные на разложении Гюнтера (Guenther) (31.21). Опишем подробнее алгоритм Постена (Posten). Используется разложение [ср. с (31.21)]: 

√ j

∞    δ/ 2

2 1 ν j+1

 Ix , , Pr tν  t = 1 − e−δ /2

2

j=0

Γ j/2 + 1

2

2

где x = ν /(ν + t2 ). Основная трудность — оценка усеченной суммы 2n  Tj Bj , j=0

где



√ j δ/ 2 , Tj = Γ j/2 + 1

 Bj = Ix

ν j+1 , 2 2



.

Для оценки этих сумм используются рекуррентные формулы. Пусть Di = T2i , Ei = T2i+1 . Тогда 2n n   Tj Bj = (Di b(i) + Ei BB(i)), j=0

i=0

" λ λ где D0 = 1, E0 = δ 2/π , Di = Di−1 , Ei = Ei−1 и i i + 1/2   1 1 ν, , B(0) = Ix 2 2   1 ν, 1 , BB(0) = Ix 2

B(i) = B(i − 1) + S(i − 1), BB(i) = BB(i − 1) + SS(i − 1),

 1 (ν + 1) 2 ν /2 1/2     x (1 − x) , 3 1 Γ Γ ν 2 2   1 Γ ν+1 2 ν /2   x (1 − x), 1 Γ ν 2 ν + 2i − 1 S(i − 1), (1 − x) 1 + 2i ν + 2i SS(i − 1). (1 − x) 2 + 2i 

Γ

S(0) =

SS(0) =

S(i) = SS(i) =

(31.50)

8. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НЕЦЕНТРАЛЬНЫМ T -РАСПРЕДЕЛЕНИЕМ

457

Для вычисления S(0) и SS(0) можно использовать алгоритм Posten (1986). Singh, Relyea and Bartolucci (1992) используют похожий метод. Posten (1993) провел предварительное исследование алгоритма в некотором диапазоне значений t и δ с числом степеней свободы 4, 19 и 39. Результаты вычислений (с двойной точностью на компьютере IBM 3000 в стандартной комплектации) сравнивались с результатами расчетов по алгоритму Cooper— Owen (1965), приводимому в IMSL (1987). В большинстве случаев для получения 12 точных знаков требовалось не более N = 200 членов ряда, а часто такая точность достигалась при N < 100. Chattamvelli and Shanmugam (1994) опубликовали алгоритм расчета нецентрального t-распределения, не требующий вычисления неполной бетафункции. Таким образом, этот алгоритм позволяет вычислить функцию нецентрального t-распределения даже на калькуляторе. Авторы записали алгоритм в пошаговой форме, облегчающей программирование.

8.

Распределения, связанные с нецентральным t-распределением

8.1.

Нецентральное бета-распределение

Нецентральное бета-распределение определяется как распределение отношения bν1 ,ν2 (λ ) =

χν 1 2 (λ )

χν22 + χν 1 2 (λ )

,

(31.51)



2 ; 2 см. гл. 30, п. 7. Можно показать, что tν (δ ) ν + {tν (δ )} распределено как b1,ν (δ 2 ). Такое же распределение имеет Q2 , где Q — упомянутая в п. 6 случайная величина, изученная в работе Hogben, Pinkham and Wilk (1964), см. также David and Paulson (1965, p. 434).

8.2.

Двойное нецентральное t-распределение

Если χν в знаменателе отношения, определяющего tν (δ ) (см. (31.1)), заменить случайной величиной, имеющей нецентральное χν -распределение с параметром нецентральности λ , то получим величину, имеющую двойное нецентральное t-распределение с параметрами нецентральности (δ , λ ) и ν степенями свободы. Запишем это в виде: tν (δ , λ ) =

U+δ √ . χν (λ )/ ν

(31.52)

Так как распределение χν (λ ) есть смесь распределений χν+2j с весовыми  j 1 коэффициентами e−λ /2 λ /j!, j = 0, 1, 2, . . . , то распределение величины 2 tν (δ , λ ) есть смесь распределений " ν (ν + 2j)−1 tν +2j (δ )

458

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

с теми же весами. Следовательно, все формулы, аппроксимации, таблицы и т. д. нецентрального t-распределения применимы к двойному нецентральному t-распределению. Например, r-й момент tν относительно нуля для r < ν равен

 r

E tν

 =

1 ν 2

r/2

 j ⎡    ⎤ 1 1 1 ∞ λ  ( Γ ν Γ ν − r) + j 2 2  e−λ /2 ⎣ 2 ⎦ × 1 1 j! Γ

j=0

2



 1 (ν − r) Γ 2 × E[(U + δ )r ] =   1 Γ ν 2

 r/2 ν 2

=

E [(U + δ )r ]

∞ 

  λ 2

τα

α =0

(ν − r) Γ

2

ν+j

Γ ((ν + 2α − r)/2) , Γ ((ν + 2α )/2)

r < ν,

(31.53)

где τj (θ ) = e−θ θ j /j!. Krishnan (1967) заметил, что сумму ряда в этой формуле можно выразить через вырожденную гипергеометрическую функцию   1 1 1 (ν − r); ν ; λ и в более простой форме, используя формулу Куммера: M 2  2 2    1 1 1 1 1 1 −λ /2 e M (ν − r); ν ; λ = M r; ν ; − λ . 2 2 2 2 2 2 Kocherlakota and Kocherlakota (1991) вывели явную формулу E



tν r



 r/2 =

ν 2



  Γ (ν − r)/2

r ν λ , E (U + δ )r M ; ;− Γ(ν /2)

2 2

2

(31.54)

в частности,



 1/2 Γ (ν − 1)/2  

ν 1 ν λ , M ; ;− E tν = δ 2

Γ(ν /2)

2 2

(31.55a)

2

 

δ2 ν λ M 1; ; − E tν 2 = , ν−2

2

  ν 3/2

E tν 3 = δ δ 2 + 3 2



E tν 4 = δ 4 + 6δ 2 + 3

(31.55b)

2

   Γ (ν − 3)/2 3 ν λ M ; ;− , Γ(ν /2) 2 2 2



(31.55c)



ν2 ν λ . M 2; ; − (ν − 2)(ν − 4) 2 2

(31.55d)

Krishnan (1967) получил рекуррентные соотношения для моментов относительно нуля случайных величин tν (δ , λ ), tν−2 (δ , λ ) и tν−4 (δ , λ ). Эти формулы, удобно записываемые в терминах величин μr, ν

=

 μr tν ν r/2

,

8. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НЕЦЕНТРАЛЬНЫМ T -РАСПРЕДЕЛЕНИЕМ

459

суть:

  ν−4 ν−5    μ1, μ1, μ1,ν−4 , ν = 1− ν −2 + λ λ

  −1  μ2, δ 2 + 1 − μ2, ν = λ ν −2 ,



  2   μ3,ν = δ + 3 μ1,ν−2 − μ1, ν ,   −1  1 4   μ4, δ + 6δ 2 + 3 δ 2 + 1 μ2,ν−2 − μ2, ν = ν , 2

ν > 5,

(31.56a)

ν > 4,

(31.56b)

ν > 3,

(31.56c)

(ν > 4).

(31.56d)

При больших ν и фиксированных δ и λ   

 

3 1 μ1 tν = δ 1 + − λ ν −1 + O ν −2 , 4 2

 2  

  μ2 tν = δ + 1 1 + (2 − λ )ν −1 + O ν −2 ,  



 

5 1 μ3 tν = δ δ 2 + 3 1 + 3 − λ ν −1 + O ν −2 , 4 2 

 4    2 μ4 tν = δ + 6δ + 3 1 + (6 − 2λ )ν −1 + O ν −2 .

(31.57a) (31.57b) (31.57c) (31.57d)

Ко времени написания этой книги не существовало таблиц гипергеометрической и гамма-функции, удобных для вычисления моментов tν (δ , λ ). Поэтому Krishnan (1967) также привел таблицы с шестью десятичными знаками для λ = 2 (2) 8 (4) 20 величин

 μ1 tν c1 = δ

 μ2 tν

c2 =

δ2 + 1

 μ3 tν  c2 =  δ δ2 + 3

 μ4 tν

c4 =

δ 4 + 6δ 2 + 3

при ν = 2 (1) 20, при ν = 3 (1) 20, при ν = 4 (1) 20, при ν = 5 (1) 20.

Заметим, что ci не зависят от δ . В той же статье Krishnan (1967) рассмотрены две аппроксимации распределения tν (δ , λ ). В трех частных случаях хорошие результаты получаются методом, предложенным в работе Patnaik (1955), когда распределение аппроксимируется распределением ctf (δ ), а c и f выбираются из условия совпадения первых двух моментов. Другой метод, являющийся обобщением метода Harley (1957) (см. п. 6), также дает полезные, хотя и не всегда столь же точные результаты. Последний метод состоит в том, что сначала вычисляются  −1  

 L = (ν − 3)μ3, νμ1,ν , K = 1 − 2ν −1 μ2, ν ν и

1/2  −1 ρ = (3K − L) {ν L − (ν − 1)K} .

460

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

После этого распределение tν (δ , λ ) аппроксимируется распределением величины * −1 +−1/2 ρ2 R " ν K 1 + (ν + 1) , (31.58) 2 1−ρ

1 − R2

где R имеет распределение выборочного коэффициента корреляции Пирсона по выборке объема ν +2 из двумерной нормальной популяции с коэффициентом корреляции ρ (см. гл. 32, п. 2.)

Krishnan (1968) составил таблицы Pr tν (δ , λ )  1 с четырьмя десятичными знаками для ν = 2 (1) 20, δ = −5 (1) 5, λ = 0 (2) 8. (Отметим, что для t0 < 0

Pr tν (δ , λ )  t0 равно Pr tν (−δ , λ )  −t0 ). Krishnan (1968) и Bulgren and Amos (1968) приводят формулу (содержащую двойное суммирование) ⎧  j ⎫ ∞ ⎨ 1 λ e−λ /2 ⎬

" 

"  

 2 × β +φ β Pr tν  t0 = 1 − Φ j! ⎩ ⎭ ⎡√

j=0

 [i] 1 1 ∞   (ν + 1) + j  1− ν−j 1 1 2 ×⎣ ai 1 F1 −i; ; β − 2  1 i!(2i + 1) 2 2 Γ ν+j i=0 2 ⎤  [i] 6 1 ∞    1 − ν − j 1 1 1 2 − β ai 1 F1 1 − i; ; β ⎦ , (31.59) 2 i! 2 2 αΓ





i=0

где 1 F 1 ≡ M и a=

t02 ν

+ t02

,

β = δ 2 (1 − a),

" β > 0.

Bulgren and Amos (1968) приводят также другие представления в виде рядов и таблицы значений Pr tν (δ , λ )  t0 с шестью десятичными знаками при t0 = 1, 2 и ν = 2, 5 (5) 20, δ = −4 (2) 4, λ = 0 (4) 8. Функция распределения tν (δ , λ ) дается формулой   1/2 

 W , (31.60) F(t; ν ; δ , λ ) = Pr tν (δ , λ )  t = Pr U + δ  t ν

где U и W — независимые случайные величины, U имеет стандартное нормальное распределение, а W — распределение χν 2 . Поэтому  j ⎤ ⎡ 1 ∞ λ 

 ⎣e−λ /2 2 ⎦ F t(1 + 2ν −1 j)1/2 ; ν + 2j, δ , (31.61) F(t; ν ; δ , λ ) = j=0

j!

где F(t; ν , λ ) — функция распределения tν (δ ) [Kocherlakota and Kocherlakota (1991)]. Доступность вычислительных программ для tν (δ ) упрощает вычисление F(t; ν ; δ , λ ). Процедура DTNDF используется в пакете IMSL (1987).

8. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НЕЦЕНТРАЛЬНЫМ T -РАСПРЕДЕЛЕНИЕМ

461

Krishnan (1968) и Kocherlakota and Kocherlakota (1991) заметили, что из 1 − F(t; ν ; δ , λ ) = F(−t; ν ; −δ , λ )

(31.62)

следует, что tν,α (δ , λ ) = −tν,1−α (−δ , λ ). Поэтому нет надобности в таблицах для отрицательных δ . Заметим, что медиана распределения tν (−δ , λ ) равна взятой с минусом медиане распределения tν (δ , λ ). Kocherlakota and Kocherlakota (1991) составили таблицы значений tν,α (δ , λ ) для α = 0.05, 0.1, 0.25, 0.5, 0.75, 0.9 и 0.95 при ν = 5 (5) 20, δ = 0, 2, 4, λ = 0, 4, 8. Авторы комбинируют формулы (31.61) и (31.60) и получают результаты, согласующиеся с аналогичными результатами Krishnan (1968) и Bulgren and Amos (1968). В работе Carey (1983) описан другой алгоритм вычисления F(t; ν ; δ , λ ).

8.3.

Модифицированное нецентральное t-распределение

Наиболее распространенная модификация статистики t получается при замене S в знаменателе (31.3a) или (31.3b) (см. п. 3) размахом выборки W или средним значением размаха нескольких независимых выборок [см. Lord (1947, 1950), а также гл. 13]. Тогда распределение знаменателя в выражении для tν (δ ) отлично от χν , но также не зависит от случайной величины U в числителе. Нецентральность распределения связана со слагаемым δ в числителе. И в обычном, и в модифицированном варианте распределение знаменателя одинаково как в случае центральной случайной величины, так и в случае нецентральной. Можно рассчитывать, что аппроксимации последнего распределения, основанные на аппроксимациях центрального распределения, дадут удовлетворительные результаты. Например, если аппроксимировать распреде −1 , то (U + δ )/W можно аппроксимировать ление W распределением χν c ν 1/2 распределением c tν  (δ ). Обсуждение различных вариантов приближенных формул для распределения модифицированного нецентрального t-распределения содержится в работах Lord (1950) и Zaludov´a (1960).

8.4.

Распределение нецентральной t-статистики в случае популяции, отличной от нормальной

Изучение распределения нецентральной t-статистики началось в тридцатые — сороковые годы с целью оценить влияние отличия от нормальности на мощность t-критерия. Мы отметим здесь работы Ghurye (1949) и Srivastava (1958). В первой из этих работ обобщаются результаты Geary (1936, 1947), который предположил, что плотность распределения популяции адекватно выражается формулой       "    β1 1 1 x−ξ 2 x−ξ 3 x−ξ px (x) = √ −3 exp − 1+ . (31.63) σ 2π

2

σ

6

σ

σ

Srivastava (1958), используя более позднюю работу Gayen (1949), получил результаты в случае, если плотность распределения популяции выражается

462

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

формулой (31.63), но с дополнительным слагаемым           1 1 x−ξ 2 β −3 x−3 4 x−3 2 √ −6 +3 + exp − 2 σ 24 σ σ σ 2π     6 4  β1 x−ξ x−ξ x−ξ 2 + − 15 + 45 − 15 , σ

72

σ

σ

т. е. следующим членом разложения Эджворта. Поправка к значению мощности по сравнению с нормальной моделью равна " (31.64) − β1 P√β − (β2 − 3) Pβ2 − β1 Pβ1 , 1

где величины P не зависят от β , а только от параметра нецентральности, числа степеней свободы и уровня значимости критерия. Bowman, Lam and Shenton (1986) рассмотрели четные моменты и аппроксимации величины −1/2  n  √ T = nX (n − 1)−1 (Xi − X)2 , (31.65) i=1

где Xi независимы и распределены по показательному закону с плотностью pX (x) = e−x . величин Xi (31.65) имело бы Так как E[Xi ] = 1 = 0, то для нормальных

√   нецентральное t-распределение tn−1 n . Mulholland (1977) рассмотрел распределение величины @( n )2 n   2 Wn = Xi Xi = n−1 + (n − 1)n−1 T −2 , (31.66) i=1

i=1

используя рекуррентное соотношение ∞ 

 pWn (w) = (n − 1) y−(n−2) pWn−1 wy2 − (y − 1)2 dy.

(31.67)

1

В статье Bowman, Lam and Shenton (1986) выведены следующие формулы для плотностей W2 , W3 и W4 : 1

 w  1, pW2 (w) = (2w − 1)−1/2 , 2 ⎧ 2π ⎨√ , 1  w  1 , 3 2 pW3 (w) = 2π3 √ ⎩ √ − 2 3 arccos(6w − 2)−1/2 , 1  w  1, 2 3 ⎧ 1 1 ⎪ w , 3π (4w − 1)−1/2 , ⎪ 4 3 ⎪ ⎪ ⎨ √ 1 1 −1/2 2 3π − 3π (4w − 1) , w , 3√ 2 pW4 (w) = √ ⎪ 2 3π − 3π (4w − 1)−1/2 − 6 3 arctg(6w − 3)1/2+ ⎪ ⎪

1/2 ⎪ ⎩ 1 + 18(4w − 1) (2w − 1)/(4w − 1) ,  w  1. 2

(31.68a) (31.68b)

(31.68c)

СПИСОК ЛИТЕРАТУРЫ

463

Список литературы Airey, J. R. (1931). Table of Hh functions, In British Association Mathematical Tables, vol. 1, British Association, London, Table XV, pp. 60–72. (2nd ed., 1946; 3rd ed., 1951.) Amos, D. E. (1964). Representations of the central and noncentral t distributions, Biometrika, 51, 451–458. √ Anscombe, F. J. (1950). Table of the hyperbolic transformation sinh−1 x, Journal of the Royal Statistical Society, Series A, 113, 228–229. Azorin, P. F. (1953). Sobre la distributi´on t no central. I, II, Trabajos de Estadistica, 4, 173–198 and 307–337. Bagui, S. C. (1993). CRC Handbook of Percentiles of Noncentral t-Distributions, Boca Raton, FL: CRC Press. Bargmann, R. E., and Ghosh, S. P. (1964). Noncentral statistical distribution programs for a computer language, IBM Research Report, RC-1231. Bartlett, M. S. (1935). The effect of non-normality on the t-distribution, Proceedings of the Cambridge Philosophical Society, 31, 223–231. Belobragina, L. S., and Eliseyev, V. K. (1967). Statistical estimation of a recognition error based on experimental data, Kibernetika, 4, 81–89. (In Russian) 1) . Bowman, K. O., Lam, H. K., and Shenton, L. R. (1986). Series for Student’s non-central t under exponential sampling with comments due to H. P. Mulholland, Communications in Statistics— Simulation and Computation, 15, 697–708. Bruscantini, S. (1968). Origin, features and use of the pseudonormal distribution, Statistica (Bologna), 28, 102–124. Bulgren, W. G., and Amos, D. E. (1968). A note on representations of the doubly noncentral t distribution, Journal of the American Statistical Association, 63, 1013–1019. Carey, M. B. (1983). Evaluation of the doubly non-central t cumulative distribution function, Computer Science and Statistics, Proceedings of 15h Symposium on the Interface, pp. 339–343. Chattamvelli, R., and Shanmugam, R. (1994). An enhanced algorithm for noncentral t-distribution, Journal of Statistical Computation and Simulation, 49, 77–83. Chowdhury, J. V., and Stedinger, J. R. (1991). Confidence interval for design floods with estimated skew coefficients, Journal of Hydraulic Engineering, 117, 811–831. Cooper, B. E. (1968). Algorithm AS-5. The normal integral; the integral of Student’s t-distribution; an auxiliary function for distribution integrals; the integral of the non-central t-distribution, Applied Statistics, 17, 186–194. Craig, C. C. (1941). Note on the distribution of noncentral t with an application, Annals of Mathematical Statistics, 12, 224–228. Croarkin, M. C. (1962). Graphs for determining the power of Student’s t-test, Journal of Research of the National Bureau of Standards, 66B, 59–70, [Correction: In Mathematics of Computation, (1963), 17, 83 (334).] Dasgupta, S., and Lahiri, K. (1992). A comparative study of alternative methods of quantifying qualitative survey responses using NAPM data, Journal of Business and Economic Statistics, 10, 391–400. David, H. A., and Paulson, A. S. (1965). The performance of several tests for outliers, Biometrika, 52, 429–436. Davies, O. L. (1954). The Design and Analysis of Industrial Experiments, New York: Hafner. Deutler, T. (1984). A series expansion for the cumulants of the χ -distribution and a Cornish-Fisher expansion for the noncentrality parameter of the noncentral t-distribution. Communications in Statistics— Simulation and Computation, 13, 507–513. 1) Белобрагина Л. С.,

Елисеев В. К. Статистическая оценка вероятности ошибки распознавания по данным эксперимента // Кибернетика. — Т. 4. — 1967. — С. 81–89.

464

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

Eeden, C. van (1958). Some approximations to the percentage points of the noncentral t-distribution, Report S242, Statistics Department, Mathematics Center, Amsterdam. Eeden, C. van (1961). Ibid., Rei ue de l’Institut Internationale de Statistique, 29, 4–31. Fisher, R. A. (1931). Introduction to «Table of Hh Functions», pp. xxvi-xxxv. In Airey (1931). Gayen, A. K. (1949). The distribution of «Student’s» t in random samples of any size drawn from non-normal universes, Biometrika, 36, 353–369. Geary, R. C. (1936). The distribution of «Student’s» ratio for non-normal samples, Journal of the Royal Statistical Society, Series B, 3, 178–184. Geary, R. C. (1947). Testing for normality, Biometrika, 34, 209–242. Ghurye, S. G. (1949). On the use of Student’s t-test in an asymmetrical population, Biometrika, 36, 426–430. Griffiths, P., and Hill, I. D. (eds). (1985). Applied Statistics Algorithms, Chichester: Ellis Horwood. Guenther, W. C. (1975). Evaluation of noncentral distribution integrals with a desk calculator, Research Paper No. 80 S-1975-538, College of Commerce and Industry, University of Wyoming, Laramie. Guirguis, G. H. (1990). A note on computing the noncentrality parameter of the noncentral F distribution, Communications in Statistics— Simulation and Computation, 19, 1497–1511. Gupta, A. K., and Kabe, D. G. (1992). On the derivation of a certain noncentral t-distribution. Journal of the Korean Statistical Society, 19, 182–185. Hall, I. J., and Sampson, C. B. (1973). Tolerance limits for the distribution of the product and quotient of normal variates, Biometrics, 29, 109–119. Halperin, M. (1963). Approximations to the noncentral t, with applications, Technometrics, 5, 295–305. Harley, B. I. (1957). Relation between the distributions of noncentral t and a transformed correlation coefficient, Biometrika, 44, 219–224. Hawkins, D. M. (1975). From the noncentral t to the normal integral, The American Statistician, 29(1), 42–43. Helms, R. W. (1992). Intentionally incomplete longitudinal designs, Statistics in Medicine, 11, 1889–1913. Hodges, J. L., and Lehmann, E. L. (1965). Moments of chi and power of t, Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability, 1, 187–201. Hodges, J. L., and Lehmann, E. L. (1968). A compact table for power of the t-test, Annals of Mathematical Statistics, 39, 1629–1637. Hogben, D., Pinkham, R. S., and Wilk, M. B. (1961). The moments of the non-central t distribution, Biometrika, 48, 465–468. Hogben, D., Pinkham, R. S., and Wilk, M. B. (1964). An approximation to the distribution of q (a variate related to the noncentral t), Annals of Mathematical Statistics, 35, 315–318. Ifram, A. F. (1970). On mixture of distributions with applications to estimation, Journal of the American Statistical Association, 65, 749–754. Iglewicz, B., Myers, R. H., and Howe, R. B. (1968). On the percentage points of the sample coefficient of variation, Biometrika, 55, 580–581. IMSL Statistics Library (1987), Version 1.0, vol. 3, 942–943, Houston, TX. Jennett, W. J., and Welch, B. L. (1939). The control of proportion defective as judged by a single quality characteristic varying on a continuous scale, Journal of the Royal Statistical Society, Series B, 6, 80–88. Jilek, M., and Likar, O. (1959). Coefficients for the determination of one-sided tolerance limits of normal distributions, Annals of the Institute of Statistical Mathematics, 11, 45–48.

СПИСОК ЛИТЕРАТУРЫ

465

Johnson, N. L., and Welch, B. L. (1940). Applications of the noncentral t distribution, Biometrika, 31, 362–389. Kocherlakota, K., and Kocherlakota, S. (1991). On the doubly noncentral t distribution, Communications in Statistics— Simulation and Computation, 20, 23–31. Kraemer, H. C. (1978). A central t-approximation to the noncentral t-distribution, Technical Series No. 107, Laboratory of Stress and Conflict, Dept. of Psychiatry and Behavioral Sciences, Stanford University, Stanford, CA. Krishnan, M. (1967). The moments of a doubly noncentral t-distribution, Journal of the American Statistical Association, 62, 278–287. Krishnan, M. (1968). Series representations of the doubly noncentral t-distribution, Journal of the American Statistical Association, 63, 1004–1012. Kruskal, W. H. (1954). The monotonicity of the ratio of two noncentral t density functions, Annals of Mathematical Statistics, 25, 162–164. K¨uhlmeyer, M. (1970). Die Nichtzentrale t-Verteilung, Lecture Notes in Operations Research and Mathematical Systems, New York: Springer-Verlag. Lahiri, K., and Teigland, C. (1987). On the normality of probability distributions of inflation and GNP forecasts, International Journal of Forecasting, 3, 269–279. Laubscher, N. F. (1960). Normalizing the noncentral t and F distributions, Annals of Mathematical Statistics, 31, 1105–1112. Lenth, R. V. (1989). Cumulative distribution function of the non-central t distribution, Algorithm AS 243, Applied Statistics, 38, 185–189. Locks, M. O., Alexander, M. J., and Byars, B. J. (1963). New tables of the noncentral t-distribution, Report AR63-19, Wright-Patterson Air Force Base, Dayton, OH. Lord, E. (1947). The use of range in place of the standard deviation in the t-test, Bometrika, 34, 41–67, (Correction: 39, 442.) Lord, E. (1950). Power of modified t-test (u-test) based on range, Biometrika, 37, 64–77. Majumder, K. L., and Bhattacharjec, G. P. (1973). Algorithm AS63. The incomplete beta integral, Applied Statistics, 22, 409–411. Malcolm, S. (1984). A note on the use of the noncentral t-distribution in setting numerical microbiological specifications for foods, Journal of Applied Bacteriology, 57, 175–177. Masuyama, M. (1951). An approximation to the non-central t-distribution with the stochastic paper, Reports of Stfltistical Applied Research, JUSE, 1(3), 28–31. McKay, A. T. (1932). Distribution of the coefficient of variation and the extended t distribution, Journal of the Royal Statistical Society, 95, 695–698. Merrington, M., and Pearson, E. S. (1958). An approximation to the distribution of noncentral t, Biometrika, 45, 484–491. Miller, R. W. (1989). Parametric empirical Bayes tolerance intervals, Technometrics, 31, 449–459. Mulholland, H. P. (1977). Private communication [see Bowman, Lam, and Shenton (1986)]. Narula, S. C., and Weistroffer, H. R. (1986). Computation of probability and noncentrality parameter of noncentral F distribution, Communications in Statistics— Simulation and Computation, 15, 871–878. Neyman, J., Iwaszkiewicz, K., and Kolodzicjczyk, S. (1935). Statistical problems in agricultural experimentation, Journal of the Royal Statistical Society, Series B, 2, 107–180. Neyman, J., and Tokarska, B. (1936). Errors of the second kind in testing «Student’s» hypothesis, Journal of the American Statistical Association, 31, 318–326. Owen, D. B. (1963). Factors for one-sided tolerance limits and for variables sampling plans, Sandia Corporation Monograph SCR-607, Albuquerque, New Mexico. Owen, D. B. (1965a). The power of Student’s t-test, Journal of the American Statistical Association, 60, 320–333.

466

ГЛАВА 31. НЕЦЕНТРАЛЬНОЕ t-РАСПРЕДЕЛЕНИЕ

Owen, D. B. (1965b). A special case of bivariate non-central t-distribution, Biometrika, 52, 437–446. Owen, D. B. (1968). A survey of properties and applications of the noncentral t-distribution, Technometrics, 10, 445–478. Owen, D. B., and Amos, D. E. (1963). Programs for computing percentage points of the noncentral t-distributions, Sandia Corporation Monograph SCR-551, Albuqurque, New Mexico. Park, J. H. (1964). Variations of the noncentral t- and beta-distributions, Annals of Mathematical Statistics, 35, 1583–1593. Patnaik, P. B. (1955). Hypotheses concerning the means of observations in normal samples, Sankhy¯a, 15, 343–372. Pearson, E. S. (1958). Note on Mr. Srivastava’s paper on the power function of Student’s test, Biometrika, 45, 429–430. Pearson, E. S. (1963). Some problems arising in approximating to probability distributions, using moments, Biometrika, 50, 95–111. (Appendix: p. 112.) Pearson, E. S., and Adyanthaya, N. K. (1929). The distribution of frequency constants in small samples from non-normal symmetrical and skew populations, Biometrika, 21, 259–286. Pearson, E. S., and Hartley, H. O. (1954). Biometrika Tables for Statisticians, vol. 1, Cambridge: Cambridge University Press. (2nd ed., 1958; 3rd ed., 1966.) Phillips, K. F. (1993). A log-normal model for individual bioequivalence, Journal of Biopharmaceutical Statistics, 3, 185–201. Posten, H. O. (1986). Algorithms for the beta distribution function, In Proceedings in Computational Statistics (eds., F. de Antoni, N. Lauro, and A. Rizzi), Vienna: Physica, pp. 309–319. Posten, H. O. (1993). A new algorithm for the noncentral t distribution function, University of Connecticut, Department of Statistics, Technical Report No. 93–15. Resnikoff, S. J., and Lieberman, G. J. (1957). Tables of the Non-Central t-Distribution, Stanford: Stanford University Press. Rukhin, A. L. (1992). Estimating the noncentrality parameter of a t-distribution, Systems Science and Mathematical Sciences, 5, 1–8. Scheuer, E. M., and Spurgeon, R. A. (1963). Some percentage points of the non-central t-distribution, Journal of the American Statistical Association, 58, 176–182. Singh, K. P., Relyea, G. E., and Bartolucci, A. A. (1992). On the tail probabilities of the noncentral t-distribution, Computational Statistics, 7, 67–80. Srivastava, A. B. L. (1958). Effect of non-normality on the power function of t-test, Biometrika, 45, 421–429. Stedinger, J. R. (1983a). Confidence intervals for design events, Journal of Hydraulic Engineering, ASCE, 109, 13–27. Stedinger, J. R. (1983b). Design events with specified flood risk, Water Resources Research, 19, 511–522. Steffens, F. E. (1968). Probability integrals of doubly noncentral F- and t-distributions with regression applications, Research Report No. 267, Council for Scientific and Industrial Research, Pretoria, South Africa. Voit, E. O., and Rust, P. F. (1990). Evaluation of the noncentral t-distribution in S-systems, Biometrical Journal, 32, 681–695. Wolfowitz, J. (1946). Confidence limits for the fraction of a normal population which lies between two given limits, Annals of Mathematical Statistics, 17, 483–488. Zaludov´a, A. H. (1960). The noncentral t-test (q-test) based on range in place of standard deviation, Acta Technica, 5, 143–185. Zhou, Y. (1987). Fiducial and Bayes models for the design of structural reliability, Chinese Journal of Mechanical Engineering, 23, 89–96. (In Chinese).

ГЛАВА 32

Распределение коэффициента корреляции

1.

Введение. Возникновение теории

В статистике используется выборочный коэффициент корреляции, рассчитываемый по n парам значений двух числовых признаков популяции, представленных случайными величинами (Xt , Yt ), t = 1, . . . , n: n   $ Xt − X Y t − Y

R=  n

i=1

n 2 $ 2 $ Xt − X Yt − Y

i=1

$n −1

1/2 ,

(32.1)

i=1

$n −1

где X = n Y = n t=1 Xt ; t=1 Yt . Существует множество вариантов записи этого выражения. Одно из наиболее используемых есть R=

X∗ · Y∗ = cos(X∗ , Y∗ ) = cos θ ; |X∗ | |Y∗ |

(32.1)

здесь X∗ = (X1∗ , . . . , Xn∗ ) и Y ∗ = (Y1∗ , . . . , Yn∗ ), Xt∗ = Xt − X и Yt∗ = Yt − Y, а |X∗ |, |Y∗ | — нормы векторов X∗ и Y∗ соответственно. Kass (1989) заметил, что L1 − L2 , L1 + L2

|R| =

(32.1)

где L1 и L2 — собственные значения матрицы Грама  ∗2  |X | X∗ · Y ∗ G= . X∗ · Y∗ |Y∗ |2 Если |X∗ | = |Y∗ |, то

 G=

1 cos θ

 cos θ |X∗ |. 1

(Оно показывает, что R наиболее подходит как мера связи, если выполняется равенство |X∗ | = |Y∗ | .) В работе Rogers and Nicewander (1988), а также в п. 3 приводятся другие формулы для R. Основной целью настоящей главы является изучение распределения R в следующих предположениях: 467

468

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

1. (Xi , Yi ) и (Xj , Yj ) независимы при i = j. 2. Совместная плотность распределения Xt и Yt равна 1

" × pXt ,Yt (x, y) = 2πσX σY 1 − ρ2  * 2     2 + 1 x−ξ x−ξ y−η y−η × exp − − 2ρ + 2 2(1 − ρ )

σX

σX

σY

σY

(32.2) для любых t = 1, 2, . . . , n (σX > 0; σY > 0; −1 < ρ < 1). Формула (32.2) определяет двумерную нормальную плотность, которая подробно рассматривается в томе «Многомерные непрерывные распределения». Здесь мы рассматриваем распределение R до рассмотрения порождающего двумерного распределения, поскольку это — одномерное распределение, а (32.2) является двумерным распределением и его место в томе, посвященном многомерным случайным величинам. Однако мы будем использовать некоторые свойства (32.2) при проведении анализа распределения R. Вопервых, используется тот факт, что ρ является коэффициентом корреляции распределения (32.2):

E {Xt − E[Xt ]} {Yt − E[Yt ]} √ ρ= . var(Xt ) var(Yt )

(32.3)

Во-вторых, используется, тот факт, что каждая из величин Xt и Yt имеет нормальное распределение с параметрами E[Xt ] = ξ ; E[Yt ] = η; var(Xt ) = σX2 ; var(Yt ) = σY2 . Условное распределение Yt при условии Xt является нормальным со средним η + (ρσY /σY )(Xt − ξ ) и дисперсией (1 − ρ2 )σY2 . Rao (1983), говоря о происхождении и развитии теории корреляции, отмечает, что согласно Карлу Пирсону символ R происходит от первой буквы английского слова reversion (обращение). Гальтон называет введенную им меру связи термином «co-relation», а Weldon называет эту меру связи функцией Гальтона. Карл Пирсон и Шепард нашли среднеквадратическое отклонение оценки R для большой выборки. Fisher (1915) получил явно распределение R для случая нормальной двумерной популяции. Вскоре Фишер предложил простое преобразование: R = th Z  , известное как Z  -преобразование Фишера; оно значительно упрощает запись выборочного распределения R, алгоритмы его исследования и применения, основанные на выборочном значении R. В классической книге «Natural Inheritance» Гальтон в 1908 г. пишет о своем открытии в свойственном ему возвышенном стиле: «Эту часть исследования я сравню с движением по высоко расположенной дороге, с которой открываются широкие перспективы в самых неожиданных направлениях и с которой легко спуститься для достижения совершенно различных мест назначений». Важно отметить здесь, что коэффициент корреляции можно вычислить по выборке из любого двумерного распределения. Но он не является адекватной мерой связи или зависимости случайных величин, если линия регрессии — кривая. Мы не знаем на самом деле, как в точности интерпретировать его значение в разных ситуациях, если только распределение

469

2. ВЫВОД РАСПРЕДЕЛЕНИЯ R

не является нормальным. Пренебрегать этим обстоятельством совершенно недопустимо. В этой главе, в первую очередь, рассматривается распределение R, соответствующее плотности (32.2). Однако распределения, получающиеся при других условиях, также описаны в п. 3. Более того, п. п. 8 и 9 посвящены сериальным коэффициентам корреляции, а п. 11 — множественной корреляции. В недавно вышедшей книге Stuart and Ord (1994, pp. 556–570) интересующийся читатель найдет краткий обзор свойств выборочного коэффициента корреляции, таких как точное распределение, преобразования, аппроксимации, моменты, устойчивость и т. д.

2.

Вывод распределения R

Нормированные величины (Xt − ξ )/σX и (Yt − η)/σY имеют тот же коэффициент корреляции, что и Xt и Yt , поэтому без ограничения общности можно положить ξ = η = 0, σX = σY = 1. Рассмотрим условное распределение R при фиксированных X1 , . . . , Xn . Условное распределение Yt при условии Xt является нормальным со средним ρXt и дисперсией 1 − ρ2 (напомним, что

−1/2 ξ = η = 0, σX = σY = 1); поэтому распределение R 1 − R2 является взятым с коэффициентом (n−1)−1/2 нецентральным t-распределением с n−2 степенями свободы и параметром нецентральности 2 3 n 3 ρ 4 (Xi − X)2 · " 1 − ρ2

i=1

(см. гл. 31, п. 6). −1/2

, мы должны найти Чтобы найти безусловное распределение R 1 − R2 ожидаемое значение условной плотности по распределению X1 , . . . , Xn . Так как условная плотность при условии X1 , . . . , Xn зависит только от статистики $ n 2 i=1 (Xi − X) , нам понадобится только то, что эта статистика распределена 2 2 (гл. 18, п. 1). Обозначив как χ с числом n−1 степеней свободы, т. е. как χn−1

 2 −1/2 V =R 1−R , запишем условную плотность в виде 

 −ρ2 S 

2 1 − ρ2

−(n−1)/2 1 + v2 ×   √ 1 n−1 πΓ 2

exp

pV (v | S) =

×

∞  Γ ((n − 1 + j)/2) j=0

где S =

$n i=1

2 Xi − X .

j!

2ρ2 v2 S

  1 − ρ2 1 + v2

1/2 ,

(32.4)

470

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Так как

   n − 1 −1 (n−3)/2 −s/2 s e , pS (s) = 2(n−1)/2 Γ

s > 0,

2

∞ 

   (n+j−1)/2 2j/2 Γ (n − 1 + j)/2 1

 1 − ρ2 sj/2 exp − ρ2 s(1 − ρ2 )−1 pS (s)ds = , Γ (n − 1)/2

2

0

то

(n−1)/2 1 − ρ2

 2 −(n−1)/2 pV (v) = ×  1+v  √ 1 n−1 π Γ ((n − 1)/2) Γ 2  2  2 1/2 ∞ j  (2ρ) Γ (n − 1 + j)/2 v . × j! 1 + v2 j=0

(32.5)

Учитывая теперь, что V = R(1 − R2 )−1/2 , получаем 

pR (r) =

2

(n−1)/2 

2

(n−4)/2

1−ρ 1−r     √ 1 1 (n − 1) Γ n−1 πΓ 2 2

∞  j=0

2   1 (n − 1 + j) Γ 2 (2ρr)j , −1  r  1. j!

(32.6a) [Множитель перед знаком суммы можно записать в другом виде, учитывая    √ 1 1 тождество π Γ (n − 1) Γ n − 1 = 2−(n−3) π (n − 3)!.] 2 2 Правую часть (32.6a) можно записать в разных формах. Перечислим несколько. ∞  



1 dw 2 (n−1)/2 2 (n−4)/2 1−r , (32.6b) pR (r) = (n − 2) 1 − ρ n−1 π

0

(n−1)/2 (n−4)/2 1 pR (r) = (n−2) 1 − ρ2 1 − r2 π

∞ 

1



pR (r) =

1−ρ

2

(n−1)/2 

1−r

2

(n−4)/2

(ch w − ρr)

dw  1/2 , (32.6c) (w − ρr)n−1 w2 − 1

⎧ ⎪ ⎨

⎫ ⎪ ⎬

dn−2 arccos(−ρr) 1/2 ⎪ , n−2 ⎪  d(ρr) ⎩ 1 − ρ2 r 2 ⎭

π (n − 3)!

(32.6d)

(n−1)/2  (n−4)/2    1 − r2 (n − 2) 1 − ρ2 1 1 1 1   pR (r) = √ , ; n − ; (1 + ρr) 2 F1 2 2 2 2 1 1 ,n − (1 − ρr)n−3/2 2(n − 1)B 2 2

(32.6e) [Hotelling (1953)], 

pR (r) =

1 − ρ2

(n−1)/2 

1 − r2

π (n − 3)!

(n−4)/2 ∂ n−2 ∂ θ n−2



θ sin θ



,

(32.6f )

471

2. ВЫВОД РАСПРЕДЕЛЕНИЯ R

где θ = arccos(ρr) [Fisher (1915)]. В любом случае −1  r  1. [Напомним, что 2 F1 (·, ·; ·; ·) — гауссова гипергеометрическая функция, определенная в гл. 1 формулой (1.104)]. Формулы (32.6b) и (32.6c) получаются заменой переменной интегрирования. (32.6e) непосредственно следует из (32.6a), причем даже для больших n ряды гипергеометрических функций сходятся довольно быстро. Заметим, что (32.6d) и (32.6f) выражают плотность в виде конечных сумм и включают только элементарные функции. Fisher (1915) вывел распределение RB виде (32.6f), используя геометрические соображения. Более ранние исследования содержатся в работах Student (1908) и Soper (1913). Распределение R послужило Фишеру отправной точкой для введения «фидуциального» метода исследования (см. гл. 1 и гл. 13, а также гл. 28, п. 7) и стало предметом многочисленных дискуссий в литературе; см., например, Fraser (1963), Willams (1993). Опубликовано несколько элементарных выводов распределения R для случая ρ = 0. Здесь мы отметим чисто геометрический вывод Chance (1984), следующий идеям статьи Fisher (1915) и подходящий для любого центрально симметричного распределения. Фишер рассматривает X и Y как точки n-мерной сферы и замечает, что коэффициент корреляции соответствует косинусу угла θ между радиус-векторами этих точек. В конце статьи он, однако, возвращается к аналитической форме двумерного нормального распределения, чтобы получить общее выражение. Элементарный вывод, использующий замену переменных, приводят также Srivastava and Khatri (1979). При ρ = 0 получается так называемая нуль-плотность R: pR (r) =

Γ[(n − 1)/2]

(n−4)/2 1 − r2 , −1  r  1.   1 Γ Γ [(n − 2)/2] 2

(32.7)

Распределение симметрично относительно нуля. Соответствующая производящая функция моментов равна   1 MR (t) = Γ (n − 1) 2(n−3)/2 t−(n−3)/2 I(n−3)/2 (t), n > 2, (32.8a) 2

где

 1 (n−3)/2   t 2 t2 t4 I(n−3)/2 (t) =   1 + 2(n − 1) + 23 (n − 1)(n + 1) + · · · 1 (n − 1) Γ 2 

— модифицированная функция Бесселя второго рода порядка (n − 3)/2. Соответствующая характеристическая функция, принимающая действительные значения, выражается через бесселеву функцию J(n−3)/2 (t), где Iv (z) = i−1 Jv (iz):   1 φR (t) = Γ (n − 1) 2(n−3)/2 t−(n−3)/2 J(n−3)/2 (t) (32.8b) 2

[Bhatti (1990)]. Для малых n простые явные формулы для функции распределения R получил Garwood (1933). Некоторые из них приведены в табл. 32.1, где

472

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

ТАБЛИЦА 32.1 Формулы для функции распределения R n

3 4 5





FR (r; ρ, n)

arccos(−r)− π ρ 1−r Q(rρ )

1 1

1 ρ −1 1− ρ 2 2 1−r 2 2 y3 −(πρ )−1 1− ρ 2 2 + π −1 arccos ρ π

−1

−1

2

1 1  1 (2ρ )−1 1− ρ 2 2 1−r2 2 y4 − r 1−r2 y3 − 2

−1

−(2πρ )

 1 1+ ρ 2 1−r2 2 Q(rρ )+ π −1 arccos(−r)

6

1  3 1

−1 1− ρ 2 2 1−r2 2 y3 + (3πρ 3 )−1 1− ρ 2 2 1−4ρ 2 + π −1 arccos ρ − 3ρ 3 

1 1

−1 1− ρ 2 y4 +(3ρ )−1 1− ρ 2 2 1−r2 2 y5 +r 3ρ 2

7

1 1 

−1 1− ρ 2 y5 − (4ρ )−1 1−r2 2 1− ρ 2 2 y6 +r 4ρ 2

−1

1 1    −r2 (8ρ )−1 1−r 2 2 1− ρ 2 2 2− ρ 2 y4 −r 8ρ 2 1−r 2 4−3ρ 2 +3ρ 4 y3 −

1  −(8πρ)−1 1−r2 2 3+6ρ 2 − ρ 4 Q(rρ )+ π −1 arccos (−r)

¨ Замечание. Авторы благодарны доктору O. Oksoy и доктору L. A. Aroian, заметившим опечатку ¨ в первом издании этого тома [см. Oksoy and Aroian (1982)].

через yn обозначена плотность распределения R, т. е. pR (r; ρ, n) и −1/2

Q(rρ) = 1 − r2 ρ2 arccos(−rρ).

(32.9)

Функции y3 и y4 даются формулами:

−1/2  −1 {1 + rρQ(rρ)} , 1 − ρ2 1 − r2 ρ2 y3 = π −1 1 − r2



  

 3/2 −2 1 − r2 ρ2 3rρ + 1 + 2r2 ρ2 Q(rρ) . y4 = π −1 1 − ρ2 Значения yn при n > 4 удовлетворяют рекуррентному соотношению:

−1   1/2

1 + r2 1 − ρ2 (n − 3)−1 (2n − 5) rρyn−1 + yn = 1 − r 2 ρ 2   1/2  yn−2 + (n − 2)−1 (n − 1) 1 − r2 1 − ρ2 (32.10) [Soper et al. (1917)]. Garwood (1933) получил в общем виде формулу для нечетных n = 2s + 3: 1/2

s+1

× FR (r; ρ, 2s + 3) = π −1 arccos r − 1 − r2 [(2s)!]−1 π −1 1 − ρ2    2   4 2s ρ s ∂ s ∂ s ∂ s 2s s−1 2s−2 s−2 2s−4 Δ ρ + Δ ρ + · · ·+ (−1) Q(rρ). × Δρ − 2 4 2s 2 1 ∂ρ

2 ∂ρ

∂ρ

1−ρ

(32.11a)

473

2. ВЫВОД РАСПРЕДЕЛЕНИЯ R

Greco (1992) предложил упростить вычисления с помощью формулы FR (r; ρ, n) = ⎧ ⎫ ⎧ (n−3)/2 (n−3)/2 ⎨ ⎬   ⎪



 ⎪ −1 2 1/2 2 1/2 ⎪ ⎪ arccos(−r) + 1 + , π ρ L − ρ L 1 − r 2i−1 2i ⎪ ⎪ ⎩ ⎭ ⎪ ⎪ i=1 i=1 ⎪ ⎪ ⎪ ⎨ если n нечетно, ⎧ ⎫ = ⎪ (n−4)/2 (n−2)/2 ⎨ ⎬ ⎪   



⎪ ⎪ −1 2 1/2 2 1/2 ⎪ 1 − r arccos , π ρ + 1 − ρ r L − ρ L 2i 2i−1 ⎪ ⎪ ⎩ ⎭ ⎪ ⎪ i=0 i=0 ⎪ ⎪ ⎩ если n четно, (32.11b)  1/2 k  где Lk = 1 − ρ2 1 − r2 d Q(rρ)/d(rρ)k можно вычислить по рекуррентной формуле

   Lk = 1 − r2 ρ2 1 − ρ2 1 − r2 ×       −1/2  1 − ρ2 1 − r2 × 2 − k−1 rρLk−1 + 1 − k−1 Lk−2 . С возрастанием n выражения быстро усложняются. Однако, несмотря на громоздокость формул, плотность является несложной кривой, определенной на −1  r 1 и имеющей единственный экстремум — минимум при n < 4 и максимум при n  4. Заметим теперь, что вероятность Fn (0) = Pr[R  0] вычисляется довольно просто. Так как R  0 равносильно неравенству n 

(Xt − X)Yt  0,

t=1

то достаточно вычислить вероятность последнего события. При данных X1 , X2 , . . . , Xn уже упомянутая в этом пункте вероятность ⎡ ⎤ 6  

 n 2 −ρ U ρ ⎦. Xj − X Φ " = Pr ⎣ $  −" 1 − ρ2

j=1

n j=1

Xj − X

1 − ρ2

2

2 $n Усредняя по распределению j=1 Xj − X , которое есть распределение хиквадрат с n − 1 степенями свободы, находим:     √ t ρ −ρ n − 1 Pr[R  0] = Pr √ n−1  − " = Pr tn−1  " . (32.12) n−1

1 − ρ2

1 − ρ2

Этот результат получен в работах Armsen (1956) и Ruben (1963).

474

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Моменты распределения R выражаются через гипергеометрические функции [Ghosh (1966)]:   1 1 1 μ1 = cn ρ2 F1 , ; (n + 1); ρ2 , (32.13a) 2 2 2    2 (n − 2) 1 − ρ 1 2 , (32.13b) μ2 = 1 − 2 F1 1, 1; (n + 1); ρ n − 1 2     1 1 1 μ3 = cn ρ2 F1 , ; (n + 1); ρ2 − ρ−1 (n − 1)(n − 2) × 2 2 2      1 1 1 1 1 1 × 2 F1 (32.13c) , ; (n − 1); ρ2 − 2 F1 , ; (n + 1); ρ2 , 2 2 2 2 2 2   2 (n − 2)(n − 4) 1 − ρ 1 2 μ4 = 1 + − 2 F1 1, 1; (n + 1); ρ 2(n − 1) 2 

    n(n − 2) 1 − ρ2 1 2 − F (n + 1); ρ 1, 1; − 1 , (32.13d) 2 1 2 4ρ

2

где 2 cn = n−1



Γ(n/2)  Γ (n − 1)/2

2 .

Ghosh (1966) также получил следующие разложения по отрицательным степеням m = n + 6:  1 μ1 = ρ − ρ 1 − ρ2 m−1 ×  2

   9 3 3 + ρ2 m−1 + 121 + 70ρ2 + 25ρ4 m−2 + O m−4 , (32.14a) × 1+

4 8

2  

   1 − ρ2 1 1 1+ μ2 = 14 + 11ρ2 m−1 + 98 + 130ρ2 + 75ρ4 m−2 + O m−4 , m 2 2

μ3 = −

3 ρ 1 − ρ2

(32.14b)

× 2  m 

   3 797 + 1691ρ2 + 1560ρ4 m−2 + O m−5 , × 6 + 69 + 88ρ2 m−1 + 4 (32.14c) 4

3 1 − ρ2

× 2 m 

   1 436 + 2028ρ2 + 3025ρ4 m−2 + O m−5 . × 1 + 12 + 35ρ2 m−1 + 4 (32.14d) Отсюда следует, что

 

 ρ2

β1 = 36 + 6 12 + 77ρ2 m−1 − 162 − 1137ρ2 − 6844ρ4 m−2 + O m−4 m (32.15a) " (заметим, что знак β1 противоположен знаку ρ) и   3 β2 = 3 − 2 1 − 12ρ2 + 10 + 14ρ2 − 387ρ4 m−1 + m 

  1 100 + 832ρ2 + 1503ρ4 − 14202ρ6 m−2 + O m−4 . (32.15b) + μ4 =

2

475

2. ВЫВОД РАСПРЕДЕЛЕНИЯ R

Iwase (1985), обобщив результаты статьи Ghosh (1966), получил следующие явные (не содержащие интегралов) выражения для FR (r; ρ, n) при n  3:

(n−1)/2   ρ 1 − ρ2 1 1 1 2 FR (r; ρ, n) = −   2 F1 1, n; ; ρ +

1 1 2 2 , (n − 1) 2 2 (1 1 )

(n−1)/2 4−n 1 1 − ρ2 ; (n − 1), (n − 1); ; 1:2:1 2 2 2 2 2 2 2 +  ρ r ,r +  rF1:1:0 3 1 1 1 ; ; −; , (n − 2) B 2 2 2 2 ( )

 (n−1)/2 4−n 1 1 1; n, n; (n − 2)ρ 1 − ρ2 ; 2 1:2:1 2 2 2 2 2 2 r F1:1:0 ρ r , r , (32.16) +   3 1 1 ; −; 2; , (n − 1) 2B 2 2 2 2

где

 FCA :: BD:: BD



B

 a1 , . . . , aA ; b1 , . . . , bB ; b1 , . . . , bB ; x; y = c1 , . . . , cC ; d1 , . . . , dD ; d1 , . . . , dD  ; ⎧ ⎫ B B A 7 7 7 ⎪ ⎪  ⎪ ⎪ ∞ ⎪ ∞  ⎨ (aj )m+n (bj )m (bj )m ⎪ ⎬  j=1 j=1 j=1 xm yn , = D D C ⎪ ⎪ 7 7 7 ⎪ ⎪ m=0 n=0 ⎪ ⎩ (cj )m+n (dj )m (dj )n ⎪ ⎭ j=1

j=1

j=1

и (g)h = g(g + 1) . . . (g + h − 1), 2 F1 (a, b; c; z) — гипергеометрическая функция Гаусса, определенная в гл. 1 формулой (1.104). При r = 0 получаем формулу, равносильную (32.12):

(n−1)/2   ρ 1 − ρ2 1 1 1 2 (32.17) Pr[R  0] = −   2 F1 1, n; ; ρ , n  3. 2

B

1 1 , (n − 1) 2 2

2

2

Момент R порядка k относительно нуля равен ⎧     B (k + 1)/2, (n − 2)/2 k+1 n−1 n−1 n+k−1 1 2 ⎪ 2 ⎪   1 − ρ F , , ; , ; ρ , ⎪ 3 2 ⎪ 2 2 2 2 2 ⎪ ⎪ B 1 , (n − 2)/2 ⎪ ⎪ 2 ⎪ ⎪ ⎪ ⎨ k = 0, 2, 4, . . . ,

 μk =   (n−1)/2 ⎪ (n − 2)B (k + 2)/2 , (n − 2)/2) k+2 n n n+k 3 2 ⎪ ⎪   ρ 1 − ρ2 , , ; , ;ρ , 3 F2 ⎪ ⎪ 2 2 2 2 2 1 ⎪ ⎪ , (n − 1)/2 B ⎪ ⎪ 2 ⎪ ⎪ ⎩ k = 1, 3, 5, . . . , | ρ| < 1, n  3, (32.18) [ср. с (32.13)], где 3 F2 (·, ·, ·; ·, ·; ·) — обобщенная гипергеометрическая функция, определенная в гл. 1, формулой (1.140), кроме того,   + * 1 n  k , − k − 1 B k +  

 2 2 R2 1 n−1 1 2 2 (n−1)/2   k + = ρ F , ; ; ρ 1 − E 1 2 2 1−R

B

1 , (n − 2)/2 2

2

2

2

(32.19) для любого действительного неотрицательного k, если n  3 и |ρ| = 1.

476

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

При практическом использовании важно помнить, что смещение R как  1 оценки ρ равно приблизительно − ρ 1 − ρ2 n−1 и что 2 2

(32.20) var(R) ≈ 1 − ρ2 n−1 (см. п. 5). Harley (1954, 1956) и Daniels and Kendall (1958) отметили интересное равенство: (32.21) E[arcsin R] = arcsin ρ. Subrahmaniam and Gajjar (1980) сообщают, что это единственная функция g(R), для которой E[g(R)] = g(ρ). В заключение этого раздела приведем два соотношения: (33.22) и (33.23), которым удовлетворяет pR (r). Они не часто используются в приложениях, однако могут оказаться полезны при решении определенных задач, а также имеют самостоятельный интерес: r

∂pR (r) (n − 3)r2 ∂p (r) nρ2 + pR (r) = ρ R + pR (r) 2 ∂r ∂ρ 1−r 1 − ρ2

(32.22)

[Hotelling (1953)]. Отметим некоторую симметрию коэффициентов при r в левой части и при ρ в правой части этого уравнения. Второе соотношение приводится в работе Soper et al. (1917):   (n − 1)(n − 2) 1 − (ρR)2 pR (r; ρ, n + 1) = " " = (2n − 1)(n − 2)ρ 1 − ρ2 R 1 − R2 pR (r; ρ, n) +

  + (n − 1)2 1 − ρ2 1 − r2 pR (r; ρ, n − 1). (32.23)

3.

Исторические замечания

Хотя наша основная цель — анализ распределения R (и других характеристик зависимости), а не история статистики R (32.1), мы вкратце обсудим исторические аспекты. Один из наиболее распространенных и используемых (и вводящих в заблуждение) показателей, описывающих степень линейной связи двух случайных величин — это коэффициент корреляции Пирсона (32.1), основанный на математическом ожидании произведения и впервые явно записанный Карлом Пирсоном [Pearson (1986), p. 625]. Он сопроводил эту формулу словами: «Представляется, что неблюденный результат является наиболее правдоподобным, если r дается значением S(xy)/(nσ1σ2 ). Эту величину легко вычислить, и поэтому мы ее принимаем. Такой подход предложил Bravais, не зная, что он — наилучший». В современной записи формула Пирсона имеет вид $n

R=

∗ ∗ i=1 Xi Yi

nσX σY

,

(32.24)

где Xi∗ = Xi − X и Yi∗ = Yi − Y [ср. с (32.1) ]. Известно [см., например, Symonds (1926), Tankard (1984)], что формула К. Пирсона (1896) была известна за несколько лет до ее опубликования. В статье K. Pearson (1895) содержится краткое упоминание о ней, и эту же формулу упоминает Yule (1985), который был студентом Пирсона.

477

3. ИСТОРИЧЕСКИЕ ЗАМЕЧАНИЯ

Название «коэффициент корреляции», введенное Эджвортом (Edgeworth), в его курсе, посвященным достижениям в статистике, в Университетском колледже Лондона в 1892 г. [K. Pearson (1920), Stigler (1928)], сменило название «индекс корреляции» [Galton (1896] и название «функция Гальтона», использованное Уэлдоном (Weldon). Напомним, что работы Edgeworth (1892 a, b) сильно повлияли на Карла Пирсона во время написания его основополагающей работы K. Pearson (1896). Перечислим в обычной принятой форме свойства R (или rXY ). 1. −1  R  1. 2. R = −1 означает, что наблюденные точки лежат на прямой с отрицательным угловым коэффициентом, что выражает функциональную обратную зависимость между X и Y. 3. R = 1 означает прямую линейную зависимость между выборочными характеристиками. 4. Если R близко к нулю, то линейная компонента зависимости мала или отсутствует (что не исключает нелинейной зависимости между характеристиками). 5. Если X и Y независимы, то ρXY = 0, где ρXY — генеральный коэффициент корреляции между X и Y: 1/2

ρXY = {E[XY] − E[X]E[Y]}/{var(X) var(Y)} . 6. Если X и Y распределены по нормальному закону, то из равенства ρXY = 0 следует их независимость. Аналогичное свойство имеет место, если каждая из случайных величин X и Y может принимать только два различных значения. 7. R и ρXY инвариантны относительно сдвига и изменения масштаба. До появления калькуляторов существовало множество вариантов формулы для вычисления R. Symonds (1926), например, составил коллекцию из 52 различных вариантов! Из них приведем три наиболее употребительных: $ $ XY − n−2 X Y , 2 1/2 2 1/2   −1 $ 2 −1 $ −1 $ 2 −1 $ X − n X Y − n Y n n $ $ $ XY − n−1 X Y R=  ,

$ 2 1/2 $ 2

$ 2 1/2 $ 2 X Y X − n−1 Y − n−1 $ $ $ n XY − X Y . R=   

$ 2 1/2

$ 2 1/2 $ $ n X2 − n Y2 − X Y

R=

n−1

$

(32.25a)

(32.25b) (32.25c)

Ясно, что они мало отличаются при использовании калькулятора 1). Приведенные формулы впервые опубликовал Harris (1910). Они затем были независимо «переоткрыты» в статьях Thurstone (1917) и Ayres (1920). В педагогической и психологической литературе их иногда называют формулами Ай1) Общеупотребительные инженерные калькуляторы запрограммированы на непосредственное вычисление R без использования промежуточных вычислений сумм, входящих в формулы — Прим. перев.

478

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

реса. Как пишет Symonds (1926): «Это является выразительным примером бессмысленности научных исследований без изучения результатов, уже полученных в данной области». Hull (1925) и Dodd (1926) изобрели $ 2 $ ма$ $ $ 2специальные Y и XY. шинки для автоматизированного вычисления X, Y, X , Более общие формулы, содержащие отклонения x = X − ξ , y = Y − η относительно «гипотетических средних» или «произвольного начала» (ξ , η), получаются простой заменой X и Y в (32.25a) — (32.25c) на x и y соответственно. В работе Yule (1897) эти формулы приведены, хотя и в несколько видоизмененной форме: $

R =  $

x y − ncX cY  $ 1/2 , x2 − nc2X y2 − nc2Y

(32.26)

где cX и cY — расстояния между предполагаемыми и истинными средними: cX = ξ − X и cY = η − Y. «Разностную формулу» $

R=

2 $  y2 − x − y

$  $  x2 y2 2

x2 +

$

(32.27a)

приводит K. Pearson (1896). Позже она была повторно открыта в работе Boas (1909). (Пирсон немедленно написал гневный ответ, критикуя Боаса за пренебрежение к изучению литературы.) Вариант разностной формулы («формула суммы») 2 $ $  $ x + y − x2 − y2 R=

$  $  x2 y2 2

(32.27b)

появился впервые в статье Kelley (1923). Еще одну версию опубликовал Huffaker (1925): $

R=

x2 +

$

$ y2 − (X − Y)2 + n(X − Y)2 .

$  $  x2 y2 2

(32.28)

Значительное внимание привлек случай равных дисперсий: var(X) = var(Y) = σ 2 . Harris (1910) предложил несколько формул, в том числе  $ R=1−

x − y $ 2 x2

2

.

(32.29a)

Менее известна формула [Symonds (1926)]

2 $  2 $  x + y − x − y R = $ 2 $  2 . x + y + x − y

(32.29b)

В начале 1920-х годов в США появились в продаже бланки («карточки», «форматки»), облегчающие вычисление коэффициента корреляции. Почти во всех ранних работах, посвященных распределению R, предполагалось, что X и Y имеют двумерное нормальное распределение. В дальнейшем усилилось внимание к распределениям, отличным от нормальных, и появились приближенные методы. Этому посвящен следующий пункт.

479

4. РАСПРЕДЕЛЕНИЯ R ДЛЯ ПОПУЛЯЦИЙ

4.

Распределения R для популяций, отличных от нормальных, и вопросы устойчивости

Распределение R для популяций, отличных от нормальных, получено только для некоторых частных случаев. Результаты для двумерных распределений, заданных разложениями Эджворта, указывают на изменения, которых можно ожидать, ограничиваясь исследованием моментных отношений низких порядков. Предположения о независимости n пар наблюдений и об одинаковых совместных распределениях сохраняются. Quensel (1938) предположил, что семиинвариантами и смешанными семиинвариантами порядка выше четвертого можно пренебречь, если значение коэффициента корреляции ρ = 0. Gayen (1951) продолжил такой анализ на случай ρ, отличного от нуля. Он получил разложение плотности в терминах правых частей (32.6a) — 32.6f), которые здесь обозначаем f (r, ρ):  n−1 ∂f ∂2f + L4,2 2 + L4,1 pR (r) = f (r, ρ) + 8n (n + 1)

n−2 + 12n(n + 1)(n + 3)



L6,1

∂ρ

∂ρ

∂f ∂2f ∂3f + L6,2 2 + L6,3 3 ∂ρ ∂ρ ∂ρ

 (32.30)

;

−i/2 −j/2 κ02 :

здесь Li,j — функции от n, ρ и отношений семиинвариантов γij = κij κ20

L4,1 = 3ρ (γ40 + γ04 ) − 4 (γ31 + γ13 ) + 2ργ22 ,

 L4,2 = ρ2 (γ40 + γ04 ) − 4ρ (γ31 + γ13 ) + 2 2 + ρ2 γ22 ,  

2   2 6 2 2 2 − 9ρ 1 + − L6,1 = −15ρ γ30 + γ03 γ21 + γ12 γ30 γ03 + n−2 n−2   1 18ρ +6 2+ γ21 γ12 + 18 (γ30 γ21 + γ03 γ12 ) + (γ30 γ12 + γ03 γ21 ) , n−2 n−2   

2

2   18ρ 9 2 − 5ρ2 2 2 − 3 4 + 5ρ 2 − − + γ03 γ21 + γ12 γ30 γ03 + L6,2 = −9ρ2 γ30 n−2 n−2     1 2 − 5ρ2 + 18ρ 2 + γ21 γ12 + 30ρ (γ30 γ21 + γ03 γ12 ) − 6 2 + (γ30 γ12 + γ03 γ21 ) , n−2 n−2    

2

2   2 1 − ρ2 3 1 − ρ2 2 2 − 3ρ 2 + ρ 2 − +2 1+ L6,3 = −ρ3 γ30 + γ03 γ21 + γ12 γ30 γ03 + n−2 n−2   1 − ρ2 2 + 6 1 + 2ρ − γ21 γ12 + 6ρ2 (γ30 γ21 + γ03 γ12 ) − n−2   1 − ρ2 (γ30 γ12 + γ03 γ21 ) . − 6ρ 1 + n−2

Cook (1951a) получил разложения (до членов порядка n−2 включительно) первых четырех моментов R в терминах семиинвариантов и смешенных семиинвариантов, порождающих данные распределений (независимо от конкретных видов распределений). Второе и третье слагаемые в правой части (32.30) можно интерпретировать как поправки к нормальной плотности pR (r | ρ),

480

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

ТАБЛИЦА 32.2 Главные члены разложений среднего и дисперсии Z

R



 1 1 1 − ρ 1− ρ 2 + L4,1 n 2 8

Среднее значение

ρ+

Дисперсия

  2 1 1 1− ρ 2 + L4,2 n 4



1+ ρ 1 1 log + × 2 1− ρ n−1    1 1 × ρ+ ρ 3− ρ 2 (γ40 + γ04 )−  2 2 8 1− ρ 2



 

−4 1+ ρ 2 (γ31 + γ13 )+2ρ 5+ ρ 2 γ22   1 1 ρ 2 (γ40 + γ04 )− 1+  2 n−1 4 1− ρ 2  

−4ρ (γ31 + γ13 )+2 2+ ρ 2 γ22

обусловленные изменением асимметрии и эксцесса. Gayen (1951) приводит эти поправочные члены для некоторых конкретных распределений. Если ρ = 0, то эти члены малы даже для малых n, начиная с n = 4. В то же время при ρ = 0.8, как показывают примеры, поправки весьма существенны, если n не очень велико. Gayen (1951) далее рассмотрел распределение Z  = Arth R (см. следующий пункт) и получил среднее, дисперсию, β1 и β2 . Он выяснил, что β1 и β2 для Z  при возрастании n стремятся к значениям 0 и 3, соответствующим нормальному распределению, хотя и не так быстро, как для двумерной нормальной популяции. В табл. 32.2 приведены главные члены разложения средних и дисперсий статистик R и Z  . Cheriyan (1945) сообщил результаты об экспериментальных выборочных распределениях коэффициента корреляции по выборкам из некоторых двумерных гамма-распределений. В последние 20 лет появилось большое число публикаций, посвященных распределению R по выборкам из распределений, отличных от нормальных. Чаще всего применяется разложение Корниша—Фишера (гл. 12, п. 5). Такой метод использован в работах Quensel (1938), Gayen (1951) и Cook (1951a, b). Nakagawa and Niki (1992) расширили эти результаты, получив разложения семиинвариантов R до членов порядка n−3 включительно. (Разложение семиинвариантов четвертого порядка чрезвычайно громоздко — содержит 345 членов!). Они представили результаты моделирования, показывающие вклад членов порядка n−3 в улучшение точности расчетов. Кроме двумерного нормального распределения, они рассмотрели двумерное равномерное распределение (1) на параллелограмме и (2) на трапеции, показанные на рис. 32.1, a и b. Величина коэффициента корреляции для параллелограмма равна −1/2

, (32.31a) d 1 + d2 а для трапеции

1/2 −1/2

48 + 24d2 − d4 d 12 − d2 .

(32.31b)

Начиная с 1970 г. в нескольких работах распределение R изучается для популяций, которые описываются смесью двумерных нормальных распределе-

481

4. РАСПРЕДЕЛЕНИЯ R ДЛЯ ПОПУЛЯЦИЙ

РИС. 32.1. Параллелограмм (a) и трапеция (b), на которых рассматривалось равномерное двумерное распределение

ний [Bebbington (1988), Kocherlakota and Kocherlakota (1981), Srivastava (1983), Srivastava and Awan (1982, 1984), Srivastava and Lee (1984)]. Мы резюмируем некоторые из этих результатов, используя для удобства следующие общие обозначения. Плотность распределения двумерной нормальной случайной величины (X, Y) равна φ (x, y; ξ , η; σX , σY ; ρ) =         " −1 −1  x − ξ 2 1 x−ξ y−η y−η 2 + = 2π 1 − ρ 2 exp − 1 − ρ2 − 2ρ σX

2

σX

σY

σY

(32.32a) [ср. с (32.2)]; функция распределения равна y

x

Φ (x, y; ξ , η; σX , σY ; ρ) =

φ (u, v; ξ , η; σX , σY ; ρ) dudv.

(32.32b)

−∞ −∞

Во всех упомянутых выше работах используются компонентные смеси с функцией распределения ω Φ(x, y, ; ξ1 , η1 ; σX1 , σY1 ; ρ1 ) + (1 − ω )Φ(x, y, ; ξ2 , η2 ; σX2 , σY2 ; ρ2 )

(32.33)

в соответствующей параметризации Bebbyngton (1978) изучил распределение R по выборке объема n из смеси распределений (32.33) с параметрами ω = 0.98, ξ1 = ξ2 = η1 = η2 = 0, σX1 = σY1 = 1, ρ1 = ρ, ρ2 = 0.

σX2 = σY2 = 3,

Он рассматривает это распределение как «загрязненное» нормальное распределение, считая второе слагаемое «загрязнением». Смесь, рассмотренная Бэбингтоном (Babbington) есть двумерный аналог смеси одномерных распределений, когда предметом интереса является исследование эффекта наличия выбросов. Моделирование показало, что R как оценка ρ смещается в направлении нуля, что, впрочем, вполне ожидаемо. Этот эффект более выражен для больших ρ (при n = 50 и ρ = 0.8 среднее модельное значение R оказалось равно 0.688).

482

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Бэбингтон предложил использовать метод «выравнивания оболочки» — удаления наблюденных значений (x, y) лежащих на двумерной выпуклой оболочке множества n наблюденных точек (т. е. вершин выпуклого многоугольника наименьшей площади, содержащего все выборочные точки). По мнению автора, это улучшает свойства R как оценки ρ. Titterington (1978) предложил более тонкий подход, основанный на построении минимального эллипсоида, накрывающего все точки. В работе Tiku and Balakrishnan (1986) также рассматриваются некоторые робастные оценки ρ, основанные на методе выравнивания оболочки. Srivastava and Lee (1984) и Srivastava and Awan (1984) использовали смесь (32.33) с параметрами ξ1 = ξ2 = η1 = η2 = 0, σX1 = σX2 = 3, σX2 = σY2 = 1,

ρ1 = ρ2 = 0.

На рис. 32.2, a и b, заимствованных из работы Srivastava and Lee (1984), показаны плотности распределения R для объемов выборки n = 6 и n = 10 соответственно и ω = 0.5, 0.7, 0.9, 0.95 и 1 (соответствует обычному двумерному нормальному распределению). Эти графики подтверждают опровержение Kowalski (1972) и Duncan and Layard (1973) общего утверждения E. S. Pearson (1929) о робастности оценки R на классе порождающих смесях распределений. С другой стороны, исследование Srivastava and Awan (1984) в случае одинаковых матриц ковариаций, похоже, опровергает утверждение работы Duncan and Layard (1973) (для различных ковариационных матриц), что, если ρ = 0 не влечет независимости, то статистика R чувствительна к отклонению от нормальности. Упомянутые исследования нельзя считать завершенными, но они показывают зависимость от корреляционной структуры по сравнению с двумерной нормальной моделью. Srivastava and Awan (1984) получили явную формулу плотности распределения R в случае σX1 = σX2 = σX ,

σY1 = σY2 = σY ,

ρ1 = ρ2 = ρ ,

 η2 . т. е. при совпадении матриц ковариаций, но при ξ1 = ξ2 и/или η1 = Полученная общая формула весьма громоздка. В простейшем случае ρ = 0 результат Srivastava and Awan (1984) также довольно сложен: pR (r | ρ = 0) =

n   −1 √   1 n ω g (1 − ω )n−g πΓ n−1 × g=0

g

× exp ×

2

 1 2

2 δ1g

+

2 δ2g

∞   h=0

h!Γ



2 h δ2g /2 1 (n − 3) + h + 1 2



 i h−i  h     δ 2j  2δ1g  h − i h i 1g × r (1 − r2 )(n−4)/2 i=0

δ2g

i

j=0    n−1+i n−1−i × Γ +j Γ +h−j ,



2

2

j

δ2g

(32.34)

4. РАСПРЕДЕЛЕНИЯ R ДЛЯ ПОПУЛЯЦИЙ

483

РИС. 32.2, a. Плотность распределения выборочного коэффициента корреляции R (n = 6). При ω = 1 график есть плотность выборочного коэффициента корреляции для нормальной модели

РИС. 32.2, b. Плотность распределения выборочного коэффициента корреляции R (n = 10). При ω = 1 график есть плотность выборочного коэффициента корреляции для нормальной модели

484

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

где





ξ2 − ξ1 g(n − g) 1/2 , σX n  1/2 η − η1 g(n − g) δ2g = 2 . σX n

δ1g =

Заметим, что, без потери общности, можно считать, что σX = σY = 1, ξ1 = η1 = 0. Авторы утверждают, что сходимость в (32.34) для умеренных n (порядка 20) достигается, если h усекается в районе 20, но точность вычислений должна 1 быть порядка 10−20 . В общем случае, однако, при ρ = 0 и особенно при ρ > 2 сходимость замедляется. Они также делают вывод, что для двустороннего критерия, если «загрязнение» меньше 10%, то различие между двумерным нормальным распределением и смесью двух нормальных распределений не «слишком велико». Это сравнимо с выводами упомянутой выше работы Bebbington (1978). Принципиальный интерес представляет относительная устойчивость («робастность») некоторых преобразований R, из которых отметим следующие: 1. Z  = Arth −1 R [Fisher (1921)]. 2. (R − ρ)(1 − Rρ)−1 [Nair—Pillai; Pillai (1946)].   −1/2

3. (n − 2)1/2(R − ρ) 1 − R2 1 − ρ2 [Samiuddin (1970)]. 4. arcsin R [Harley (1956)].   −1/2

−1/2 1 !2 ! = R(1 − R)−1/2 , ! ! + b! R +! ρ) 1 + ρ2 , R ρ = ρ 1 − ρ2 ; 5. (aR 2   1/2 1/2 5 3 a= n− и b= n− [Ruben (1966)]. 2

2

Kocherlakota and Kocherlakota (1981) изучили распределение R по выборке объема n из смеси (32.33) при ξ1 = ξ2 = η1 = η2 (= 0), σX1 = σX2 = σY1 = σY2 (= 1), но при ρ1 = ρ2 . Асимметрия такой смеси равна нулю. Эксцесс равен  2 {ω (1 − ω )} 3A21 + 3A22 + 2A1 A2 , (32.35) где A1 = A2 =

(1 + ρ2 )2 − (1 + ρ1 )2 ω (1 + ρ1 )2 + (1 − ω ) (1 + ρ2 )2

,

(1 − ρ2 )2 − (1 − ρ1 )2 . ω (1 − ρ1 )2 + (1 − ω ) (1 − ρ2 )2

Авторы исследовали зависимость эксцесса и ρ = corr(X, Y) от ρ1 , ρ2 и ω . При возрастании ω в отличие от двумерного нормального случая (нулевой эксцесс) обычно эксцесс сперва возрастает, а затем убывает. Наибольшее отличие от нормальной модели получается при большом различии ρ1 и ρ2 . Его наибольшее значение реализовалось при ρ1 = 0.1, ρ2 = 0.8 и ω = 0.3. В работе используются формулы для моментов R, использующие разложения, приведенные в работе Cook (1951a) для общего двумерного случая. Авторы исследуют робастность преобразований 1 − 4 применительно к обсуждаемому

485

4. РАСПРЕДЕЛЕНИЯ R ДЛЯ ПОПУЛЯЦИЙ

типу отличия от нормальности. Преобразования 2 и 3 Наира (Nair) — Пиллаи (Pillai) и Самиуддина (Samiuddin) оказались более робастны, чем преобразование Z  Фишера — преобразование 1. Преобразование 4 не является робастным к этому виду распределения, отличного от нормального. Как и для других типов отличия от нормальности, исследованных в работах Subrahmaniam and Gajjar (1979), увеличение объема выборки не намного уменьшает эксцесс. В отличие от нормального случая, преобразования 1 и 4 приводят к устойчивому смещению, которое или отсутствует, или мало при возрастании объема выборки. Преобразование 2 Наира—Пиллаи остается робастным даже в «наихудшем» случае отклонения от нормальности (ρ1 = 0.1, ρ2 = 0.8). Перечислим другие работы, где изучается влияние уклонения от нормальности. Это статьи Yang (1970), Kowalski (1972), Zeller and Levine (1974), Havlicek and Peterson (1977), Subrahmaniam and Gajjar (1978), Kocherlakota and Singh (1982a, b), Kocherlakota, Kocherlakota and Balakrishnan (1985), Kocherlakota, Balakrishnan and Kocherlakota (1986), Fowler (1987), Shanmugam and Gajjar (1992). Subrahmaniam and Gajjar (1980) применили метод, развитый в работах Cook (1951a, b) для анализа всех пяти преобразований, и получили разложение первых четырех моментов до членов порядка n−1 включительно. В частности, они сравнили преобразования в предположении, что распределение популяции является усеченным нормальным распределением с плотностью φ (x, y; 0, 0; 1, 1; ρ) , Φ (a, b; 0, 0; 1, 1; ρ)

x  a,

y  b.

(32.36)

В качестве показателя устойчивости они использовали разности между средними и отношения стандартных отклонений исследуемой и нормальной (a = b = ∞) моделей. По среднему значению наиболее робастным оказалось преобразование 2 Наира—Пиллаи, затем идут преобразование 3 Самиуддина и 5 Рубена (Ruben). Интересно, что в случае преобразования 1 Фишера и преобразования 4 Харли (Harley) возрастание объема выборки не уменьшает эффект отличия от нормальности. Сравнение, основанное на отношении стандартного отклонения исследуемой популяции и нормальной популяции, показало, что в модели, отличной от нормальной, возрастание |ρ| приводит к возрастанию стандартного отклонения при положительном ρ, а при отрицательном ρ влияние имеет противоположный характер. Возрастание объема выборки слабо влияет на результат сравнения. Для больших (ρ) наименьшей робастностью, повидимому, обладает преобразование 4 Харли. Указанные выводы основаны на моделях с распределением популяции с плотностью (32.36) при ρ = ±0.05, ±0.25, ±0.5, ±0.75 и точками усечения a = b = −2.5, −1.5, 0, 0.5 [см. также Bebbington (1978) и Gajjar and Subrahmaniam (1978)]. Shanmugam and Gajjar (1992) сравнили преобразования 1 − 4 в случае, когда популяция имеет двумерное экспоненциальное распределение Фарли—

486

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Гумбела—Моргенштерна (Farlie—Gumbel—Morgenstern) с плотностью 

  pX,Y (x, y; α ) = e−(x+y) 1 + α 2e−x − 1 2e−y − 1 , x, y > 0, | α | < 1. (32.37) 1 Коэффициент корреляции для этого распределения равен ρ = α , поэтому 1

4

не превосходит . Авторы обнаружили, что преобразование Фишера Z  4 (преобразование 1) наиболее робастно при малых |ρ|  0.05. В остальном выводы аналогичны описанным выше. С другой стороны, преобразования 2 − 4 оказались весьма чувствительны к отличию от нормальности, для распределения рассматриваемого типа. В статье Kocherlakota and Singh (1982b) изучаются преобразования 1 − 5 с применением метода Корниша—Фишера. Рассматривается вычисление семиинвариантов R для следующих двух типов популяций, отличных от нормальных. √ √ 1. Двумерное t-распределение. Пусть X = W1 / V, Y = W2 / V, где (W1 , W2 ) имеет двумерное нормальное распределение с плотностью φ (w1 , w2 ; 0, 0; 1, 1; ρ), а V — не зависящая от них случайная величина, распределенная по закону χν2 /ν . $ν $ν 2. Двумерное распределение χ 2 . Здесь X = j=1 W1j2 , Y = j=1 W2j2 , где (W1j , W2j ), j = 1, 2, . . . , ν — независимые в совокупности двумерные нормальные случайные величины, распределенные так же, как и (W1 , W2 ) в предыдущем случае.

5.

Таблицы и аппроксимации. Асимптотические разложения

5.1.

Таблицы

Материал п. 2 показывает, что распределение R весьма громоздко, так что его использование затруднительно без применения практически пригодных аппроксимаций и достаточно подробных таблиц. Отметим, что речь идет о распределении выборочного коэффициента корреляции двумерной нормальной популяции, а не о том, что это необходимо для процесса подгонки данных. David (1938) составила несколько подробных таблиц. Она рассчитала плотность pR (r; ρ, n) и функцию распределения FR (r; ρ, n) с пятью десятичными знаками для n = 3 (1) 25, 50, 100, 200, 400. При n  25 таблицы составлены для r = −1.00 (0.05) 1.00 и ρ = 0.0 (0.1) 0.4; для r = −1.00 (0.05) 0.600 (0.025) 1.000 при ρ = 0.5 (0.1) 0.9; дополнительно приведены значения для r = 0.80 (0.01) 0.900 (0.005) 1.000 и ρ = 0.9. При n > 25 используются более узкие интервалы. Отметим, что, как обычно, табличные значения — это1000pR(r). Во введении к этим таблицам сделано несколько интересных замечаний относительно распределения R. Subrahmaniam and Subrahmaniam (1983) расширили таблицы Дэйвид (David), включив значения FR (r; ρ, n) с пятью десятичными знаками для n = 26 (1) 49, ρ = 0.1 (0.1) 0.9, r = −0.70 (0.05) 0.65 (0.025) 0.975, а для

5. ТАБЛИЦЫ И АППРОКСИМАЦИИ. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ

487

квантилей rα (ρ, n), удовлетворяющих равенству FR (rα ; (ρ, n)) = α , при α = 0.01, 0.02, 0.025, 0.05, 0.1, 0.2, 0.8, 0.9, 0.95, 0.975, 0.98, 0.99 и n = 4 (1) 50, 100, 200, 400 — значения с четырьмя десятичными знаками. Boomsma (1975) обратил внимание, что в работе David (1938) в таблицах функции распределения на с. 50 при n = 100 и ρ = 0.4 числа сдвинуты на одну строку вверх. Эту же опечатку отмечают Subrahmaniam and Subrahmaniam (1983) в их расширенном варианте таблиц Дэйвид (David). Они приводят исправленные значения FR (r; ρ, n) для n = 100, ρ = 0.4, r = −0.10 (0.05) 0.70. (Вычисления проводились в 32-разрядной сетке DQG-32). ¨ Oksoy and Aroian (1981) рассчитали значения FR (r; ρ, n) и pR (r; ρ, n) с шестью десятичными знаками для n = 3 (1) 6, 35, 40 (10) 60 и ρ = 0.05, ¨ 0.98. Oksoy and Aroian (1982) также приводят значения rα (ρ, n) с четырьмя десятичными знаками для тех же n и ρ при α = 0.0005, 0.001, 0.0025 (0.0025) 0.0100, 0.0175, 0.0250, 0.0375, 0.05, 0.075, 0.10 (0.05) 0.90, 0.925, 0.95, 0.9625, 0.975, 0.9825, 0.99 (0.0025) 0.9975, 0.9990, 0.9995. Авторы ссылаются на неопубликованные таблицы FR (r; ρ, n) для n = 3 (1) 10 (2) 24, 25 (5) 40 (10) 100 (100) 500 и ρ = 0 (0.05) 0.90, 0.92, 0.94, 0.95, 0.96, 0.98. Они рекомендуют использовать формулы, полученные в статье Garwood (1933) [см. табл. 32.1] для быстрого вычисления плотности, функции распределения и квантилей и отмечают, что формула (32.6), приводимая в работе Hotelling (1953) для функции распределения, также полезна для расчетов. Odeh and Owen (1980, pp. 228 — 264) приводят таблицы доверительных границ, т. е. значений ρα (r; n), удовлетворяющих равенству FR (r; ρα (r; n); n) = α , для n = 3(1) 30, 40, 60, 100, 120, 150, 200, 400, r = −0.95 (0.05) 0.95 и α = 0.005, 0.01,

0.025, 0.05, 0.1, 0.25, 0.75, 0.90, 0.95, 0.975, 0.99, 0.995. Интервал ρ1−ε /2 (R; n), ρε /2 (R; n) есть 100(1 − ε )%-й доверительный интервал для ρ при данном R. Метод расчета, примененный авторами (приведенный на с. 287–294 цитируемой книги), основан на формулах работы Garwood (1933), переработанной формуле Хотеллинга (Hotelling), использующей разложение по неполным бета-функциям, и на новом подходе к построению доверительных границ ρ с применением в качестве первого шага преобразования Фишера. Подробные таблицы квантилей rα (ρ; n) составил Odeh (1982). Таблицы содержат значения квантилей с пятью десятичными знаками для ρ = 0.0 (0.1) 0.9, 0.95, n = 4 (1) 30 (2) 40 (5) 50 (10) 100 (20) 200 (100) 1000 и α = 0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.75, 0.9, 0.95, 0.975, 0.99, 0.995. Используя алгебраический программный пакет REDUCE 2 в системе IBM 4341, Odeh (1983) получил точные выражения для FR (r; ρ, n) при n = 3 (1) 10. При n = 5, 6 автор использует выражение, полученное в статье Garwood (1933), ¨ в форме, предложенной Oksoy and Aroian (1981, 1982, табл. 1 и следующие). При n = 7 (1) 10 для вывода формул Odeh (1983) использует основные рекуррентные формулы, полученные в работе Hotelling (1953). При n = 9, 10 первые девять производных функции −1/2

Q(rρ) = 1 − r2 ρ2 arccos(−rρ) (32.38)

488

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

¨ [см. 32.9)] приводят Oksoy and Aroian (1982). Эти производные, входящие в выражение для FR (r; ρ, n), содержат в числителе многочлены от ρr и самой функции Q, а в знаменателе — степени 1 — (ρr)2 . При нечетном n, однако, ρ не входит явно в знаменатели выражений. В свою очередь, Guenther (1977) считает удобным применение (32.6a) для числовых расчетов функции распределения выборочного коэффициента корреляции «на современных настольных калькуляторах» [подобно тому, как в 1930 г. это предлагал сделать Monroe]. Он выяснил, что разложение вероятности Pr[0 < R < r], основанное на (32.6a), быстро сходится и обеспечивает удобный расчет границ ошибки. Guenther (1977) вывел формулу   ∞ 1 (n − 2)r2 1 Pr[0 < R < r] = K1 (j) Pr F2j+1,n−2  + 2 2

j=0

1−r

2j + 1





∞ 1 (n − 2)r2 1 K2 (j) Pr F2j+1,n−2  , + 2 2j + 2 2 1−r j=0

0 < r  1, (32.39)

где Fv1 ,v2 — случайная величина F с (v1 , v2 ) степенями свободы (см. гл. 27),  1 (n − 1) + j) Γ 2

(n−1)/2 2j 1 − ρ2 K1 (j) = ρ ,   1 (n − 1) j!Γ 2   1 n + j) Γ 2

 2 (n−1)/2 2j+1 K2 (j) = ρ .    1−ρ  3 1 (n − 1) j!Γ j + Γ 2 2 

Заметим, что K1 (j) — это члены разложения бинома с отрицательным −(n−1)/2

. Автор использует это разложение вместе с форпоказателем: 1 − ρ2 мулой для Pr[R > 0] [(32.11) или (32.15)] для вычисления Pr[R > r] = Pr[R > 0] − Pr[0 < R  r].

(32.40)

Guenther (1977) показал, что, если в первом и во втором рядах (32.39) ограничиться членами до j = r1 и членами до j = r2 соответственно, то ошибка вычисления FR (r; ρ, n) отрицательна, и ее модуль меньше     1 n−1 ρ2 n − 1 ρ2 H2r1 +1,n−2 H2r1 ,n−1 + 2 2 2

1 + H2r2 +2,n−2 2



2r1 + 1 1 − ρ

n−1 ρ2 2r2 + 1 1 − ρ2



H2r2 +1,n−1



2r1 1 − ρ

n−1 ρ2 2r1 + 1 1 − ρ2

 ,

(32.41)

где Hν1 ,ν2 (y) = Pr[Fν1 ,ν2  y]. Он привел числовые расчеты, иллюстрирующие точность формул. Stammberger (1968) построил номограмму, позволяющую найти одну из величин Pr[R  r], r или n по заданным двум другим.

489

5. ТАБЛИЦЫ И АППРОКСИМАЦИИ. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ

5.2.

Аппроксимации, основанные на преобразованиях

В большинстве приложений для аппроксимации распределения R используется преобразоание Фишера [Fisher (1915, 1921)]:   1 1+R Z  = Arth R = log . (32.42) 1−R

2

Учитывая, что 

 var(R) ≈ 1 − ρ2 n−1 ,

1 − ρ2

−1

dρ =

(32.43)

1 1+ρ log 2 1−ρ

[см. (32.14b)], (32.42) можно рассматривать как преобразование, стабилизирующее дисперсию. Такой подход, однако, не был явно сформулирован в работе Fisher (1915), где впервые предложено это преобразование. Приближенные значения моментов и моментных отношений Z  суть:    1 1+ρ 1 1 (32.44a) μ1 (Z  ) ≈ log + ρ(n − 1)−1 1 + 5 + ρ2 (n − 1)−1 , 2 1−ρ 2 4     1 1 μ2 (Z  ) ≈ (n − 1)−1 1 + 4 − ρ2 (n − 1)−1 + 22 − 6ρ2 − 3ρ4 (n − 1)−2 , (32.44b) 2



−3 3



−2

6

μ3 (Z ) ≈ (n − 1)

ρ , (32.44c)     1 1 2 −1 2 4 184 − 48ρ − 21ρ (n − 1)−2 , μ4 (Z ) ≈ 3(n − 1) 1 + 14 − 3ρ (n − 1) + 3

12

(32.44d) 

−3 6

β1 (Z ) ≈ (n − 1) 

ρ , −1

β2 (Z ) ≈ 3 + 2(n − 1)

+ 4 + 2ρ − 3ρ 2

4



(32.45a) (n − 1)

−2

.

(32.45b)

Эти значения приведены в статье Fisher (1921) и позже исправлены в работе Gayen (1951) [см. также Nabeya (1951)]. Сравнение (32.45a) и (32.45b) с формулами (32.15a) и (32.15b) показывает, что значения (β1 , β2 ) для Z’ ближе к соответствующим значениям для нормального распределения с параметрами (0, 3), чем (β1 , β2 ) для R. Кроме того, var(Z  ) не зависит от ρ до членов порядка (n − 1)−1 включительно. Обычный метод аппроксимации состоит в том, что Z’ считается распределенным по нормальному закону с средним

1+ρ 1 log и дисперсией (n − 3)−1. 2 1−ρ

Последнее объясняется следующей выкладкой:   1 1 4 − ρ2 (n − 1)−2 = n−1 + n−2 + · · · + 4 − ρ2 n−2 + · · · = (n − 1)−1 + 2 2    

−1 1 = n−1 1 + 3 − ρ2 n−1 + · · · ≈ n−1 1 − 3n−1 = (n − 3)−1 . 2

Можно уточнить эту аппроксимацию, увеличив среднее на (2n − 5)−1 ρ. Fowler (1987) принял (32.44a) и (32.44b) и, рассматривая Z’ как нормальную случайную величину, сделал вывод о «хорошем совпадении, включая хвосты». Другой подход к аппроксимации состоит в изучении структуры случайной величины R. В начале п. 2 при выводе распределения R мы отметили,

490

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

−1/2

что для фиксированного множества X1 , X2 , . . . , Xn величина R 1 − R2 распределена как ⎛ ⎞ 2 $n X − X ρ j j=1  ⎝ ⎠, " (32.46) (n − 2)−1/2 tn−2 1 − ρ2

т. е. представима в виде 2 " $n 2 j=1 Xj − X ρ/ 1 − ρ

U+

χn−2

,

где U — стандартная нормальная случайная величина, U и χn−2 независимы в совокупности. Усредняя по совместному распределению (X1 , . . . , Xn ), −1/2

находим, что распределение R 1 − R2 совпадает с распределением  −1/2 U + χn−1 ρ 1 − ρ2 χn−2

,

(32.47)

где U, χn−1 и χn−2 независимы в совокупности. Такое представление получено в работах Ruben (1963, 1966). Он применил его для получения следующих аппроксимаций. Из (32.47) следует, что  

−1/2 −1/2

χn−2 − r 1 − r2 χn−1  0 . (32.48) Pr[R  r] = Pr U + ρ 1 − ρ2 Предполагая, что n не слишком мало, можно аппроксимировать χn − 1 и χn − 2 нормальными случайными " величинами в соответствии с утвер√ ждением Фишера, что распределение 2χn2 − 2n − 1 близко к нормальному. Тогда

−1/2 −1/2

U + ρ 1 − ρ2 χn−2 − r 1 − r2 χn−1 при фиксированном r имеет распределение, близкое к нормальному со средним  

−1/2  −1/2  5 1/2 3 1/2 n− n− ρ 1 − ρ2 − r 1 − r2 2

2

и стандартным отклонением 

−1 1 2 −1 1/2 1 + r 1 − r2 . 1 + ρ2 1 − ρ2 2

2

Тогда из (32.48) следует, что ⎛  ⎜ Pr[R  r] ≈ Φ ⎝

⎞   

−1/2  3 1/2 5 1/2 n− n− − ρ 1 − ρ2 2 2 ⎟ ⎠.   1/2



 1 2 1 2 2 −1 2 −1 1+ r 1−r + ρ 1−ρ 2 2

r 1 − r2

−1/2

Muddapur (1988) показал, что, если σX = σY , то статистика √ R − ρS T ∗ =   1/2 n − 2, 1 − ρ2

1 − R2

(32.49)

(32.50a)

5. ТАБЛИЦЫ И АППРОКСИМАЦИИ. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ

491

  2 1/2 $n 1 SX SY−1 + SX−1 SY , SX = (n − 1)−1 i=1 Xi − X где S = и SY = 2   2 1/2 $n = (n − 1)−1 i=1 Yi − Y имеет в точности t-распределение. Если окажется, что SX = SY , то (32.50a) принимает вид √ R−ρ (32.50b) T ∗∗ =   1/2 n − 2. 1 − ρ2

1 − R2

Эту статистику предложил Samiuddin (1970), утверждавший, что ее распределение близко к tn−2 для всех ρ и всех σX /σY при умеренно больших n, даже в случае SX = SY . Такое утверждение, грубо говоря, равносильно тому, что ⎧   ⎫1/2 ⎨ 1 − ρ 2 1 − R2 ⎬ R−ρ 1 = T ∗∗ V= 1 − Rρ n−2 ⎩ ⎭ 1 − Rρ   1 1 имеет распределение, близкое к бета n − 1, n − 1, на интервале (−1; 1), 2 2 и тогда   1 1 n − 1, n − 1 . Pr[V  v] ≈ I(v+1)/2 2

2

Samiuddin (1970) пишет, что это приближение является хорошим при n  8 даже при больших ρ. Muddapur (1988) выяснил, что распределение G=

(1 + R)(1 − ρ) (1 − R)(1 + ρ)

(32.51)

близко к распределению Fn−2, n−2 . При ρ = 0 распределения совпадают. Можно использовать соотношения

1/2  Fν,ν, α2 = 1 + 2ν −1 tν2,α + 2 ν −1 1 + tν2,α ν −1 tν,α , (32.52a) 

 1/2 Fν,ν,1− α2 = 1 + 2ν −1 tν2,α − 2 ν −1 1 + tν2,α ν −1 tν,α (32.52b) вместе с (32.51) для построения 100(1 − α )%-го доверительного интервала для ρ при отсутствии таблиц квантилей распределения Fn−2, n−2 . Muddapur (1988) табулировал доверительные границы для ρ при α = 0.025, 0.005 и R = 0 (0.5) 0.95. Эти интервалы довольно широки даже для n, равного 25, и особенно широки при малых |R|. При построении односторонних границ лучший результат по сравнению с аппроксимацией Фишера дает применение величины √ R n − 2

T = "

1 − R2

,

(32.53)

имеющей распределение, близкое к tn−2 ; здесь (при данных R и ρ) R удовлетворяет уравнению   log (1 + R )/(1 − R ) W − E[W | ρ] " " = , var(W | ρ) var(W | ρ = 0)

(32.54)

492

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

где W = log {(1 + R)/(1 − R)},

 5 + ρ2 11 + 2ρ2 + 3ρ4 + + ··· , 1+ 4(n − 1) 8(n − 1)2  4 − ρ2 22 − 6ρ2 − 3ρ4 + +··· . 1+ 2

1+ρ ρ E[W| ρ] = log + 1−ρ n−1

var[W | ρ] =

4 n−1

2(n − 1)

4(n − 1)

(32.55a) (32.55b)

В работе Kraemer (1973) утверждалось, что, если ρ (ρ, n) удовлетворяет условиям 1. |ρ (ρ, n)|  |ρ|, 2. ρ (ρ, n) = ρ при ρ = 0, −1 или 1, 3. ρ (ρ, n) = −ρ (−ρ, n), 4. lim ρ (ρ, n) = ρ, n→∞

то



√ n − 2(R − ρ ) n−2W " = ,

  2 2 1 − W2 1−R 1−ρ

(32.56)

причем распределение W = (R − ρ )/(1 − Rρ )) близко к распределению tn−2 . Однако Mi (1990) привел пример, показывающий, что условия 1 − 4 не являются достаточными и требуется добавить следующие условия: 5. ρ = ρ + o(n−1 ), 6. Знаки ρ и ρ совпадают, и, возможно, 7. |ρ |  1. Можно взять ρ (ρ, n) = ρ [Samiuddin (1970)], но Kraemer (1973) рекомендует считать, что при данных ρ и n ρ (ρ, n) равно медиане ρ∗ (ρ, n) распределения R. Она составила таблицы ρ∗ при ρ = 0.1 (0.1) 0.9 и n = 11 (1) 25, 50, 100, 200, 400, т. е. для | ρ | не слишком близких к 1. [Mi (1990) заметил, что медиана удовлетворяет условиям 6 и 7, но не ясно, удовлетворяется ли условие 5.] Аппроксимация Kraemer менее громоздка и довольно точна (см. также замечание в конце п. 5.3). Niki and Konishi (1984) нашли асимптотическое разложение медианы   1 −1 1

  1 −7ρ2 + 15 n−2 + 47ρ4 − 180ρ2 + 165 n−3 + ρ∗ = ρ + 1 − ρ2 ρ n + 2

+

24

240



 1 −4945ρ6 + 31227ρ4 − 55755ρ2 + 26145 n−4 . 40320

(32.57)

Она дает 5 верных десятичных знаков при n > 20. Kraemer (1973) использовала линейную интерполяцию, обеспечивающую три точных десятичных знака. Она также предложила дополнительные нормальные аппроксимации и в том числе   1 1 + ρ∗  E[Z ] ≈ log , ∗ 1−ρ 1 2 23 + + +··· , var(Z ) ≈ n − 1 (n − 1)(n + 1) 3(n − 1)(n + 1)(n + 3) 2



(32.58)

5. ТАБЛИЦЫ И АППРОКСИМАЦИИ. АСИМПТОТИЧЕСКИЕ РАЗЛОЖЕНИЯ

E[Z  ] ≈ var(Z  ) ≈

1 log 2



1 + ρ∗ 1 − ρ∗

493

 ,

1 . n−3

(32.59)

Она выяснила, что аппроксимация (32.58) дает более точный результат, чем приближение David (1938) для малых n и |ρ|  0.6, однако при |ρ|  0.8 аппроксимация Дэйвид (David) более точна. Thomas (1989) рекомендует использовать аппроксимацию Дэйвид и приводит графики, показывающие, что даже при n = 15 и ρ = 0.8 точное и приближенное распределения довольно близки (наибольшее расхождение получается в окрестности R =0.65). В то же время, другие авторы — Kraemer (1973), как сказано выше, и Konishi (1978) — делают другие выводы. Konishi (1978) вывел следующую аппроксимацию:     1+R 1 1+ρ 1/2 1 Pr m log − log x ≈ 2 1−R 2 1−ρ   1 x3 ρm−1/2 + φ (x) + O(m−3/2 ), (32.60) ≈ Φ(x) − 2

3

6m

1

где m = n − + ρ2 . Это приближение обеспечивает высокую точность во 2 4 всем диапазоне R при относительно малых n. Наилучший выбор величины m, корректирующий значение n, пока является проблемой. Это приближение более точно, чем предложенные в статьях Ruben (1966) и Kraemer (1973) [(32.48) и (32.56) соответственно] при ρ  0.3, и значительно лучше при ρ  0.7. Chaubey and Mudholkar (1978) отмечают, что при современном уровне продвинутых компьютерных технологий многие аппроксимации R представляют интерес скорее с точки зрения применяемых методов исследования точности или остроумия приемов исследования, чем с прикладных позиций. Они замечают, что причиной потери точности аппроксимации Фишера для больших |ρ| даже при не слишком малых n является высокий эксцесс распределения Z  . Gayen (1951) показал, что β1 (Z  ) =

ρ6

+··· ,

(n − 1)3

 2 1 2 4 β2 (Z  ) = 3 + + ρ − 3 ρ 4 + 2 +··· ; n − 1 (n − 1)2

(32.61a) (32.61b)

β1 убывает с ростом n быстрее, чем β2 − 3. Так как величина β2 − 3 для t-распределения Стьюдента с ν степенями свободы равна 6/(ν − 4), то число ν степеней свободы t-распределения, имеющего приблизительно равный эксцесс, равно ν =4+

6 3n2 − 2n + 7 ≈ . β2 − 3 n+1

(32.62)

Chaubey and Mudholkar (1978) предложили аппроксимировать нормированную величину Z  стьюдентовой случайной величиной t с ν0 = [ν ] степеней свободы,

494

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

где ν дается формулой (32.62). Приближенное значение 100α %-й точки R равно     ν0 − 2 1/2 rα (ρ; n) ≈ th μ + σ tν0 ,α , (32.63) ν0

где





1 1 (n − 1)−1 ρ 1 + (5 + ρ)2 (n − 1)−1 , 2 4 

 1

 1 2 −1 −1 4 + ρ2 + (n − 1)−2 22 − 6ρ2 − 3ρ4 . σ = (n − 1) 1 + (n − 1) 2 6

μ = Arth ρ +

Применив преобразование Уоллеса [Wallace (1959), см. гл. 28, формула (28.26)], нормирующее t-распределение, авторы нашли что     2  1/2  1 3 + 8ν ξα , (32.64) −1 rα (ρ; n) ≈ th μ + σ (ν − 2) exp ν

1 + 8ν

где Φ(ξα ) = α . Числовые расчеты показывают, что приближенное значение вероятностей и квантилей, полученные в работе Chaubey and Mudholkar (1978), близки к значениям, полученным Кремер (Kraemer) и Рубеном (Ruben), по простоте и по точности (приближенное вычисление, предложенное Кремер (Kraemer) и Рубеном (Ruben), включают решение квадратного уравнения).

5.3.

Асимптотические разложения распределения R

Асимптотические разложения Z  (R) =

1 1+R log 2 1−R

(32.65)

(для случая двумерной нормальной популяции) получены, среди других, в статьях Winterbottom (1980) и Niki and Konishi (1984). Ники (Niki) и Кониши (Konishi) рассмотрели преобразованную величину (32.66) Z ∗ = n1/2 {Z  (R) − Z  (ρ)} . ∗ Они получили первые десять семиинвариантов Z , заметив при этом, что κ2j + 1 имеет порядок n−(2j+1)/2 , а не n−(2j−1)/2 . Авторы получили формулу     Pr[Z  < z] = Φ(z) + φ (z) a1 n−1/2 + a2 n−1 + · · · + a8 n−4 + O n−9/2 , (32.67) где Φ(x) и φ (x) — стандартная нормальная функция распределения и плотность соответственно, коэффициенты ai зависят от z и ρ и могут быть выражены через полиномы Эрмита. Разложение до a8 включительно содержит первые 15 полиномов Эрмита, тогда как соответствующее разложение Эджворта функции распределения R более громоздко: содержит первые 23 полинома Эрмита. Разложение, включающее первые восемь ai , гарантирует пять верных десятичных знаков для выборки объема 11 и выше и шесть верных десятичных знаков при n  16. Winterbottom (1980) приводит разложение Эджворта в форме Корниша—Фишера, включающее семь полиномов Эрмита, однако точность заметно ниже. Mudholkar and Chaubey (1976) представили распределение Z  в виде смеси нормального и логистического распределений и получили аппроксимацию (32.68) Pr[Z  < z] = ω Φ(x) + (1 − ω )L(x),

6. ОЦЕНКИ ρ : ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О РОБАСТНОСТИ

495

  −1 πx L(x) = 1 + exp − √

где

3

и

z−μ , σ    1 1+ρ 1 1 + ρn−1 + ρ 5 + ρ2 n−2 + · · · , μ = log 2 1−ρ 2 8

x=

σ 2 = n−1 + ω =1−

 1 4 − ρ2 n−2 + · · · , 2

5 (β2 − 3) , 6

 β2 = 3 + 2n−1 + 4 + 2ρ2 − 3ρ4 n−2 + · · · . Идея состоит в том, чтобы остаточный член в разложении эксцесса величины Z  Фишера (имеющий порядок n−1 ) сделать сравнимым с соответствующим членом для асимметрии β1 (имеющим порядок n−3 ). Полученная аппроксимация сравнима по точности с аппроксимацией (32.64) Chabey and Mudholkar (1978), включающей t-распределение, хотя авторы не приводят явных числовых сравнений. Детальное сравнение аппроксимаций Рубена, Кремер, Mudholkar and Chaubey (1976) и Winterbottom (1980) читатель может найти в работе Winterbottom (1980). Сравнение приближений Ruben (1966), Kraemer (1973), Winterbottom (1980) с приближением Niki and Konishi (1984) читатель найдет в последней из упомянутых работ. Аппроксимация Niki and Konishi (1984) весьма точна, но и весьма сложна. Несмотря на впечатляющие успехи в развитии вычислительных возможностей и асимптотических методов за последние 60 лет, основой оценок, связанных с распределением коэффициента корреляции, остается замечательная работа F. N. David (1930), выполненная на примитивном (с современной точки зрения) уровне вычислительных возможностей того времени, но весьма изобретательной в том, что касается численных приближений сложных функций. Для небольших ρ аппроксимация Kraemer (1973) t-распределением представляется наилучшей по сравнению с большинством многоходовых приближенных методов.

6.

Оценки ρ: дополнительные замечания о робастности

6.1.

Общие замечания

В последние десятилетия появилось очень большое число публикаций, посвященных оценкам коэффициента корреляции. Статьи публикуются как в математических журналах, ориентированных на вопросы статистики, так и в социологических, психолого-педагогических и других специализированных прикладных изданиях. При этом из-за недостаточной координации одни и те же результаты появляются дважды, а то и трижды. Пожалуй, только статьи Kraemer (1973, 1980), опубликованные в статистическом и в педагогическом

496

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

журналах, можно рассматривать как узенький мостик между теоретическими и прикладными публикациями. Противоречивая, ошибочная и не связанная между собой информация по «робастности» выборочного коэффициента корреляции разбросана по десяткам журналов. Некоторой иллюстрацией этого служит материал пунктов 4 и 5. Публикуются разные модели и эмпирические выводы и обобщения, претендующие на оправдание применения R для популяций, отличных от нормальных, или при ρ = 0. Результаты, отражающие разные публикации, включенные в настоящий том, иллюстрируют как практическую робастность, так и неприемлемую изменчивость. Иногда смешивают робастность распределения R (или других свойств, связанных с анализом ρ) относительно отклонения генеральной совокупности от нормального закона и устойчивость по отношению к выбросам. Delvin, Gnanadesikan and Kettenring (1975) выражают опасение, что R чувствителен к выбросам. Они пишут, что «функция влияния» 1) для R не ограничена, и малая часть отклоняющихся наблюдений может привести к полному искажению результатов. Проведенное ими моделирование методом Монте-Карло эмпирически подтверждает неустойчивость R. Смещение и среднеквадратическое отклонение заметно увеличиваются, если хвост распределения становится более тяжелым (например, для распределения Коши). Во многих случаях смещение велико и достигает 99% среднеквадратического отклонения; это подтверждают также Tiku and Balakrishnan (1986). С другой стороны, Zellner and Levine (1974) на основании большого объема результатов моделирования утверждают, что «R является эффективной оценкой коэффициента корреляции ρ как для нормальной популяции, так и для популяции, отличной от нормальной». Они также сообщают, что при больших ρ стандартная ошибка меньше при более плоских формах плотности по сравнению с нормальной. Kowalski (1972) и Dunkan (1973) получили противоположный результат в части поведения R для двумерной нормальной популяции. Более раннее исследования — Rider (1932) для равномерного распределения, Hey (1938), по данным агрономических исследований, Nair (1941) — экспоненциальное распределение и Norris and Hjelm (1961) (нормальное, равномерное, островершинные, слабо асимметричные и сильно асимметричные распределения) — показывают, что квантили порядка 0.05 и 0.01 близки к квантилям для двумерной нормальной популяции. Havlicek and Peterson (1977) идут еще дальше. Они утверждают, что статистика R Пирсона робастна даже к большим отклонениям от основного предположения о двумерной нормальности популяции и типа шкалы. Отклонение от базовых предположений о нормальности одной из компонент или различных комбинаций распределений не сказывается на распределении R. Авторы исследовали 216 распределений. Для этих распределений отклонение ожидаемых квантилей распределения R порядков 0.005, 0.01, 0.025 и 0.05 было незначительным. Из этого авторы делают вывод, что отклонение распределения популяции от нормальности мало 1) Функция влияния на некоторую статистику может быть определена как изменения распределения этой статистики при добавлении наблюдения x. Это, разумеется, есть функция от x. Детали можно найти в работах Hampel (1974) и Huber (1977, p. 9) — Прим. авторов.

6. ОЦЕНКИ ρ : ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О РОБАСТНОСТИ

497

влияет на распределение R, и, следовательно, вероятностные выводы при проверке гипотезы ρ = 0 являются законными. Guilford and Frischter (1973) и McNemar (1962) указывают, что некоторые из предположений, например, нормальность, не являются обязательными. С другой стороны, Nunnaly (1967) замечает, что интерпретация R может не являться корректной в случае отклонений от основных предположений. Fowler (1987) делает вывод, что R является «в высшей степени» характеристикой и мощность критерия (например, при проверке гипотезы ρ = 0) сохраняется даже при значительных отклонениях характеристик распределения популяции от нормального, хотя мощность критерия при использовании коэффициента Rs Спирмена может оказаться выше при проверке гипотезы ρ = 0. В прикладных работах часто  1/2 (см. следующую используется преобразование t = R (n − 2)/(1 − R2 ) страницу) и считается, что оно мало чувствительно к отклонению от нормальности при ρ = 0. В случае ρ = 0 аналитическое исследование робастности статистики R [Kraemer (1980), см. ниже] и численное [Kowalski (1972)] привели к противоречащим результатам. Следует заметить, что хотя асимптотически √

n(R − ρ) ∼ N(0, 1), 1 − ρ2

нормальная аппроксимация неудовлетворительна, если n не очень велико. В работе David (1938) сообщается, что при объемах выборки до 400 кривые распределения R от ρ = 0 до ρ = 0.6 (примерно) сходятся к нормальным очень медленно и даже при n > 400 отклонения от нормальности велики при ρ > 0.6. Kraemer (1980) рассмотрела условное распределение Y при условии X. Она показала, что если E[Y | X] = ξY + ρ (X − ξX ) σY σX−1 и var(Y | X) не зависит от X, а эксцесс β2 − 3 маргинального распределения X равен λ , то распределение величины √   −1/2 n − 2(R − ρ) 1 − ρ2 (1 − R2 ) (32.50b) 1

близко к нормальному с нулевым средним и дисперсией 1 + ρ2 λ . 4 Таким образом, асимптотика R будет совпадать с асимптотикой R для двумерной нормальной популяции тогда и только тогда, когда

√ λ +2 1 = , т. е. при λ = 0. С другой стороны, lim var n {SX /σX − λ } = 4 2 n→∞ если ρ = 0, то распределение (n − 2)1/2 R

1/2 1 − R2

в описанных только что предположениях есть безусловное распределение tν , и поэтому сходится к нормальному при n → ∞ [об этом см. также Edgell and Noon(1984); Havlicek and Peterson (1977)]. Резюмируя, скажем, что нуль-распределение R (случай ρ = 0) близко к распределению R для двумерных нормальных популяций (во всяком случае,

498

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

при больших n), если выполняются условия линейности и гомоскедастичности (постоянства условной дисперсии). При ρ = 0 распределение R робастно при дополнительных условиях на эксцесс. Показано, что статистика (32.50b) сходится к своему асимптотическому распределению достаточно быстро. В то же время бутстреповская оценка коэффициента корреляции, которая является в работе основным предметом исследованияDiaconis and Efron (1983) встречает настороженное отношение в прикладной статистической литературе [см. Rasmussen (1987)]. Бутстреп дает слишком оптимистическую ошибку I рода и зауженный доверительный интервал. Более того, она недостаточно точна как в случае двумерного нормального распределения, так и в случае распределения, отличного от нормального. Silver and Dunlap (1987) подчеркивают, что выгодней применить Z  -преобразование Фишера до усреднения, а затем обратное преобразование к среднему, особенно в случае выборки малого объема. В подробном историческом обзоре Kowalski (1972) автор пишет: «Обзор литературы показывает, что мнения разделились примерно поровну. Каждому исследованию, подтверждающему робастность распределения R можно сопоставить противоречащую работу». Обзор более поздней литературы показывает неизменность такого положения вещей. Имеется утверждение Пирсона [E. S. Pearson (1929)]: «поверхность плотности двумерного нормального распределения можно весьма сильно «исказить и испортить» без существенного влияния на распределение R». Один из главных выводов исследования Ковальски (Kowalski) состоит в том, что утверждение Пирсона следует заменить следующим: «выборочное распределение R из смеси двумерных нормальных распределений существенно отличается от выборочного распределения для нормальной популяции даже в случае ρXY = 0 и даже для большой выборки». Duncan and Layard (1973) показали, что для двумерного распределения (не обязательно нормального) четыре первых момента которого конечны, распределение √ √ n (Arth R − Arth ρ) = n {Z  (R) − Z  (ρ)} сходится по распределению к N(0, σ 2 (ρ)), где  2  

1 2 σ 2 (ρ) = 1 +  2 ρ (γ40 + γ04 ) − 4ρ (γ31 + γ13 ) + 2 2 + ρ γ22 ,

(32.69)

4 1 − ρ2

γij — нормированные семиинварианты порядка (i, j) двумерного распределения [например, γ22 = κ22 /(σX2 σY2 ), где σX2 и σY2 — дисперсии маргинальных распределений]. Для двумерного нормального распределения все γij обращаются в нуль, и σ 2 (ρ) = 1. Аналогично, если компоненты независимы, то ρ = 0, γ22 = 0 и снова σ 2 (ρ) = 1. Если зависимость имеет место, то асимптотический порядок дисперсии Arth(R), вообще говоря, не равен n−1 , вне зависимости от того будет ли ρ = 0, и утверждение о распределении Z  = Arth R, справедливое для нормальной популяции, не выполняется даже асимптотически для популяции, отличной от нормальной. Duncan and Layard (1973), как и Kraemer (1973, 1980)

6. ОЦЕНКИ ρ : ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О РОБАСТНОСТИ

499

√ √ установили, что при ρ = 0 асимптотическая дисперсия T = R n − 2/ 1 − R2 равна 1 + γ22 , и это показывает асимптотическую неустойчивость.

6.2.

Точечные оценки

Olkin and Pratt (1958) получили единственную несмещенную оценку ρ с наименьшей дисперсией в виде   1 1 1 R∗ = R2 F1 (32.70a) , ; (n − 1); 1 − R2 , 2 2 2

где 2 F1 (α , β ; γ ; x) — гипергеометрическая функция Гаусса [см. гл. 1, п. A6]. Оценку (32.70a) можно записать в другом виде:

 1 −1/2 (n − 1)/2 Γ t (1 − t)((n−2)/2)−1  R∗ = R    1/2 dt, Γ 1/2 Γ (n − 2)/2 2 1 − t 1 − R 0

или

 1 −1/2 Γ (n − 1)/2 t (1 + t)(n−2)/2  R =R  dt.  1/2 Γ 1/2 Γ (n − 2)/2 2 1 + tR 0 ∗

(32.70b)

(32.70c)

R* есть нечетная строго возрастающая функция R. При ρ = ±1 R∗ = R = ±1 с вероятностью 1. Следовательно, −1  R∗  1, что совпадает с диапазоном изменения ρ. Olkin and Pratt (1958) также рассчитали значения R* и R*/R для R = 0 (0.1) 1 и n = 2 (2) 30. Авторы предложили аппроксимацию  1 − R2 + R ≈R 1+ , (32.71) 2(n − 3)

погрешность которой не превосходит ±0.01 при n  8 и ±0.001 при n  18. Отметим, что n равно N (т. е. числу измерений), если средние значения X и Y известны, и равно N − 1, если они неизвестны и оцениваются выборочными средними X и Y. Для четных N и для N = 3 Iwase (1981) нашел дисперсию R* в случае равных дисперсий X и Y. Он показал, что в случае равных дисперсий величина R* недостаточно хороша при малых n и | ρ |, но асимптотически эффективна при возрастании n. Pradhan and Sathe (1975) заметили, что, если двумерные нормальные случайные величины (Xi , Yi ), i = 1, 2, независимы и имеют одну и ту же функцию распределения Φ(x, y; 0, 0; σX , σY ; ρ), то Pr [X1 Y1 + X2 Y2 > 0] = Пусть при 1  i  j  n Sij = и



1 0

1 (1 + ρ). 2

(32.72)

при Xi Yi + Xj Yj > 0, в противном случае,

  $$ n S= i 1, определив

pX (x; ρ, n) =

1 − x2

(n−1)/2

|ρ |n

 , −1  x  1,

n/2  1 1 1 − 2ρx + ρ2 (n + 1), B 2 2

|ρ| > 1.

(32.163)

Он нашел выражения семиинвариантов этого распределения, а также распределения с плотностью

(n−1)/2 1 − x2 (1 − ρ )2 pX (x; ρ, ν ) =  , −1  x  1,

(n/2)+1  1 1 1 − 2ρx + ρ2 (n + 1), B 2 2

(32.164)

которое связано с распределением Лейпника соотношением между случайными величинами

  X−ρ =

!1 − ρ R

ρ2 − 1

! 1 + ρ2 1 − 2ρR

.

(32.165)

McCullagh (1989) получил опорную статистику τ (ρ) =

!2 1−R 1 , ! 1 + ρ2 1 − 2ρR

(32.166)

  1 1 имеющую распределение бета (n + 1), . 2 2 ρ параметра ρ, основанная на n независимых случайных величинах ОМП # Yi , i = 1, 2, . . . , n, распределенных с плотностью (32.152), удовлетворяет уравнению n  # Yi − ρ = 0. (32.167) 2 i=1

1 − 2# ρ Yi + # ρ

Уравнение содержит n только в виде числа слагаемых. Равносильное уравнение имеет вид n  # Yi − ρ (32.167) 2 = 0.

i=1

# 1 − Yi2 + Yi − ρ

Отметим аналогию с уравнением для ОМП распределения Коши [гл. 16, формула (16.35)]: n  Yi − θ# = 0, (32.168) 2 2 i=1

#) λ + (Yi − θ

где θ — параметр сдвига, λ — известный масштабный параметр. Рассмотрев ρ и n = 2ν как неизвестные параметры, МакКаллаф (McCullagh) вычислил информационную матрицу Фишера и заметил, что информация

526

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Фишера стремится к бесконечности при ρ → ±1. Распределения (32.152) и (32.164) появляются как распределения точки выхода броуновского движения в (n + 2)-мерном пространстве (при целом n), если броуновская частица начинает движение в точке ρ = (ρ, 0, . . ., 0) оси x1 . Вероятность достижения единичной сферы равна 1, если −1 < ρ 1. Saw (1984) получил распределение Лейпника (хотя и не называет его явно) в связи с разложением плотностей на m единичных сферах. !1 будет ближе к нормальному, Естественно ожидать, что распределение Arth R как и в обычном случае для выборочного коэффициента корреляции (32.1). Такое преобразование рассмотрено в статье Quenouille (1948). Из (32.158b) следует, что !1 ) ≈ var(R

тогда как var(R) ≈ 1 − ρ вание

 2 2

1 − ρ2 , n

(32.169)

/n. Формула (32.169) показывает, что преобразо! = arcsin R !1 Z

(32.170)

!1 в том же смысле, что и преобразование Z  стабилизирует дисперсию для R [см. (32.42)] величины R. Действительно, Jenkins (1954a) показал, что (32.170) !1 что и Z  для R. Он получил формулы: дает тот же эффект по отношению к R





 

! = arcsin ρ − 3 ρ 1 − ρ2 −1/2 n−1 + 1 ρ 17 − 2ρ2 −3/2 1 − ρ2 n−2 + O n−3 , E[Z] 2

! =n var(Z)

−1

8

 −1 −2 

1 − 2 − 5ρ 2 1 − ρ 2 n + O n−3 , 2

 

! = −3ρ 1 − ρ2 −1/2 n−2 + O n−3 , μ3 (Z)     

! = 3n−2 − 8 − 29ρ2 1 − ρ2 −1 n−3 + O n−4 , μ4 Z

(32.171a) (32.171b) (32.171c) (32.171d)

  "

−1/2 −1/2   −1 −1  3 2 − 5ρ 2 1 − ρ 2 β1 = −3ρ 1 − ρ2 n n 1+ + O n−5/2 , 4



−1 −1  β2 = 3 + 2 7 ρ 2 − 1 1 − ρ 2 n + O n−2 .

11.

(32.172a) (32.172b)

Множественный коэффициент корреляции

Множественный коэффициент корреляции между случайной величиной X0 (зависимая переменная) и величинами X1 , X2 , . . . , Xk (независимые переменные) при k  2 определяется как максимум коэффициента корреляции между X0 и линейной функцией независимых переменных: ( ) k  (32.173) aj Xj . P0. 12 ... k = max ρ X0 , a1 ,a2 , ... ,ak

j=1

527

11. МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Далее, будем опускать индексы 0.12 . . . k там, где нет опасности создать путаницу. Пусть   var(X0 ) V 0 . V= V0 V(1) где V(1) — матрица ковариаций величин X1 , X2 , . . . , Xk . Тогда ( )

  k  V 0a ρ X0 , aj Xj = .  1/2 j=1

{ a V(1) , a var (X0 )}

(32.174)

Так как при подходящем выборе aj можно добиться неотрицательности ρ(·), то задача равносильна максимизации квадрата ρ:

  a V0 V 0 a

  . a V(1) a

Наибольшее значение квадрата коэффициента корреляции равно V 0 V−1 V0 , var (X0 )

поэтому множественный коэффициент корреляции равен 6 V 0 V−1 V0 . var (X0 )

(32.175)

(Квадрат коэффициента корреляции иногда называют множественным коэффициентом детерминации, но мы не используем этот термин.) Предположим, что совместное распределение X1 , X2 , . . . , Xk есть многомерное нормальное распределение и что имеется n независимых наблюдаемых наборов этих величин. Величина R0.12 ... k получается заменой в (32.175) элементов V их оценками максимального правдоподобия (т. е. средних квадратов и средних произведений отклонений от выборочных средних) и называется выборочным множественным коэффициентом корреляции. Это, разумеется, случайная величина, слово «выборочный» в названии опускают, если ясно, о чем идет речь. Как и обозначение ρ0.12 ... k заменяется на ρ, обозначение R0.12 ... k заменяется на R, если исключается двусмысленность. Методом, предложенным в статье Ruben (1966), описанным в п. 3,

−1 распределена Hodgson (1967) показал, что при n > k+1 величина R2 1 − R2 как  2   2 χk−1 +

U + ρ 1 − ρ2 2 χn−k−1

−1/2

χn−1

,

(32.176)

где величины χ 2 и стандартная нормальная величина U независимы в совокупности. C учетом того, что R  0, запишем равенство  −1

−1  =  r2 1 − r2 Pr[R  r] = Pr R2 1 − R2    2



 2 2 −1/2 2 2 −1 2 = Pr χk−1 + U + ρ 1 − ρ χn−1 − r 1 − r χn−k−1 < 0 . (32.177)

528

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Аппроксимируя распределение отношения (32.176) или, что равносильно, вероятность неравенства в квадратных скобках (32.177), Hodgson (1967) вывел следующую аппроксимацию (h — подходящим образом выбранное положительное число): распределение   −1 h  −1 h (n − k + h − 2)h R2 1 − R2 − k + 2h − 2 + (n + h − 2)ρ2 1 − ρ2 ⎡ ⎤1/2 )  2h ( 2 2 2h−1 2 √ ρ ρ (n − 1) R ⎦ 2h ⎣(n − k − 1)2h−1 + 2+ k+ 1 − R2 1 + ρ2 1 − ρ2

(32.177) близко к стандартному нормальному распределению, а распределение  −1 h (32.177) R2 1 − R2 близко к нормальному со средним  

−1 h (n − k + h − 2)−1 k + 2h − 2 + (n + h − 2)ρ2 1 − ρ2 и дисперсией 

−1 2h−1 −1

2h2 (n − k − 1)−(2h+1) k + (n − 1)ρ2 1 − ρ2 (2n − k) 1 − ρ2 . Распределение R2 было первоначально изучено в работе Fisher (1928) с использованием геометрических рассуждений [см. также Soper (1929)]. Частные случаи рассматривались ранее в работах Yule (1921) и Isserlis (1917). Фишер получил формулу

 pR2 r2 =

 (n−1)/2 1 n 1 − ρ2

2 (k/2)−1 ((n−k)/2)−1 2 1 − r2 ×    r  1 1 (k − 1) Γ (n − k) πΓ 2 2 Γ



π ∞ 

× 0 −∞

sink−2 θ (ch ϕ − ρr cos θ )n−1

dϕ dθ ,

0 < r2 < 1. (32.178)

Интеграл в этой формуле можно найти почленным интегрированием, разложив подынтегральную функцию по степеням cosθ . Результат обычно выражают через гипергеометрическую функцию:

1 − ρ2

2 pR2 r =

(n−1)/2 2 (k/2)−1 ((n−k−1)/2)−1 r 1 − r2 ×   1 1 k, (n − k − 1) B 2  2  n−1 n−1 k 2 2 , ; ; ρ r , 0 < r2 < 1. × 2 F1 2 2 2

(32.179)

529

11. МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Приведем еще одно выражение:

(n−k−3)/2 2 (k−2)/2 (n−1)/2 r 1 − ρ2 × Γ ((n − 1)/2) Γ ((n − k − 1)/2) ∞ 2 i 2 i  r [Γ {((n − 1)/2) + i}]2 ρ , 0 < r2 < 1, × i!Γ ((k/2) + i)

 1 − r2 pR2 r2 =

(32.179)

i=0

полученное в работе Anderson Bargmann (1991a) в качестве программы (Алгоритм AS260) Нулевая (ρ2 = 0) плотность

(1984). Оно использовано в статье Ding and основы численного метода и эффективной для расчета распределения R2 . распределения R2 равна

(n−k−3)/2 2 (k−2)/2 r , B ((n − k − 1)/2, k/2)

 1 − r2 pR2 r2 =

0 < r2 < 1. 1

(32.180)

1

Это — стандартное бета-распределение с параметрами k, (n − k − 1). 2 2 Представление (32.179), а также непосредственное разложение позволяет 2 выразить  pR2 (r ) в виде смеси стандартных бета-распределений с параметрами  1 1 k+j , (n − k − 1) и с весами, равными членам разложения бинома 2 2 с отрицательным показателем −(n−1)/2  1 ρ2 − . 2 2 1−ρ

1−ρ

Это дает ∞ −1 (k/2)+j−1  

  ((n−k−1)/2)−1 1 1 bj B k + j, (n − k − 1) , r2 1 − r2 pR2 r2 =

2

j=0

2

r2 > 0, где

 1

2 j (n − 1) + j ρ 2 ((n−1)/2)+j .   2 1 1−ρ (n − 1) j!Γ 2

Γ

bj =

(32.181)



Gurland (1968) получил эти формулы, использовав характеристическую функцию. Он также показал, что при нечетном n−k распределение величины

 −1 R2 1 − ρ2 1 −ρ2 R2  выражается смесью стандартных бета-распределений 1

1

с параметрами k + j , (n−k −1) и с весами, равными членам разложения 2  2 2 2 (n−k−1)/2 , т. е. бинома ρ + 1 − ρ ( ) (n−k−1)/2 1  (n − k − 1) 2 j Pr[R  r] = ρ × 2 j=0

j

  ((n−k−1)/2)−j

1 1 IR2 (1−ρ2 )/(1−ρ2 R2 ) k + j, (n − k − 1) , (32.182) × 1 − ρ2 2

2

530

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

где Ix (a, b) — нормированная неполная бета-функция. Отметим, что число слагаемых в этом разложении — конечно. Различные методы вывода распределения содержатся в статьях Garding (1941), Moran (1950), Soper (1929) и Wilks (1932). Williams (1978) содержательно использовал тот факт, что условное, при данном множестве выборочных значений (X1 , . . . , Xn ),

 −1   распределение R2 /k 1 − R2 /(n − k − 1) (т. е. отношение среднего квадрата, используемого при вычислении множественной линейной регрессии к остаточной сумме квадратов, используемой в дисперсионном анализе) есть нецентральное F-распределение (гл. 27). Усреднив затем по распределению набора (X2 , . . . , Xn ) (ср. с началом п. 2), он получил (32.182). Подробный численный анализ разложений (32.181) и (32.182) провели Gurland and Milton (1970). В более поздней статье Gurland and Asiribo (1991) получили другие представления распределения R2 . Они применили результат Gurland (1968), что

−1 W = R2 1 − R2 распределено как отношение Y1 /Y2 независимых случайных величин, характеристические функции которых суть ϕY1 (t) = (1 − 2it)R (1 − 2iat)−h , ϕY2 (t) = (1 − 2it)−g ,

где

(32.183)

1 (n − k), 2 1 h = (n − 1), 2

g=

−1

. a = 1 − ρ2 Авторы подробно рассмотрели распределение Y1 [названное в работе Gurland and Milton (1970) «свернутым» χ 2 ] и привели несколько альтернативных выражений для функции распределения и для плотности Y1 в терминах сжатых χ 2 -распределений и вырожденных гипергеометрических функций, что приводит к различным представлениям распределения R2 . Момент R порядка m записывают обычно в виде [Banerjee (1952)]: 

μm (R) =

 (n−1)/2  1 (k + m) Γ   2 1 1 1   Dm 2 F1 (n − 1 + m), n; k; ρ2 , 2 2 2 1 (n − 1 + m) Γ 2

1 − ρ2

(32.184)

где D — оператор

1 3 ρ 2



∂ ∂ρ

 . Среднее и дисперсия R2 таковы: 



 n−k−1 1 1 − ρ2 2 F1 1, 1; (n + 1); ρ2 = n−1 2  2(n − k − 1) 2 

 k 2 2 1−ρ − ρ 1 − ρ2 + O n−2 =ρ + 2 n−1 n −1

E[R2 ] = 1 −

(32.185a)

531

11. МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

(отметим, что R2 как оценка ρ2 имеет существенное положительное смещение),  

 2 (n − k)2 − 1 1 2 2 2 2, 2; − E[R2 ] − 1 = 1 − ρ F (n + 3); ρ var(R2 ) = 1 2 2 2 n −1 ⎧  2 2 2 2 ⎪ 4ρ 1 − ρ (n − k − 1) ⎪

 ⎪ ⎪   ⎨ + O n−2 при ρ = 0, 2 n − 1 (n + 3) = (32.185b) ⎪ ⎪ ⎪ 2k(n − k − 1) ⎪ ⎩ при ρ = 0 2 (n − 1) (n + 1)

[Wishart (1931)]. Распределение R или R2 весьма громоздко, поэтому рассматриваются различные аппроксимации. Представляется естественным рассмотреть пре1 образование Фишера Z  = log {(1 + R)/(1 − R)} = Arth R. Однако, как 2 и для сериальной корреляции, это преобразование не приводит к полезным результатам. Gajjar (1967) показал, что предельное при n → ∞ распределение √ n − 1 Arth R не является нормальным, но будет нецентральным χ -распределением с k степенями свободы и параметром нецентральности (n−1) (Arth ρ)2 . Численные расчеты показывают, что использование преобразования Arth R, вообще говоря, не эффективно. Khatri (1966) предложил две аппроксимации. Первая связана с рассмотрением величины 

k−1 (n − k − 1) 1 − ρ2 ω (ρ)R2 1 − R2

,

(32.186a)

где

   

"

 −1 ω (ρ) = k + n − k − 1 + (n − 1)(n − k − 1) ρ2 · k + (n − k − 1) 2 − ρ2 ρ2 .

Ее распределение близко к нецентральному F-распределению с k и n − k − 1 степенями свободы и параметром нецентральности " 1 2 ρ ω (ρ) (n − 1)(n − k − 1) 2

[ср. с Williams (1978)]. Вторая аппроксимация Хатри (Khatri) основана на  величине, пропорциональной R2 / 1 − R2 . Если коэффициент пропорциональности равен

−1  (n − k − 1) 1 − ρ2 (n − k − 1)ρ2 + k , то аппроксимирующее распределение есть центральное F-распределение с числом степеней свободы

2

 −1 (n − k − 1)ρ2 + k (n − k − 1)ρ2 2 − ρ2 + k и n − k − 1. (32.186b) Gurland (1968) также рассматривает эту аппроксимацию. Хатри предполагает, что эти аппроксимации полезны при n − k − 1  100 и что вторая предпочтительнее при большом ρ2 . Gurland and Asiribo (1991) строят другие аппроксимации с использованием преобразования Уилсона— Хилферти (Wilson—Hilferty) случайной величины χ 2 (гл. 18). Это приводит

532

ГЛАВА 32. РАСПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ



к аппроксимации величины R2 / 1 − R2 с помощью нормального распределения. Авторы приводят сравнение с аппроксимацией (32.186b) [Khatri (1966) и Gurland (1968)] для k = 6, 10, n = 10, 20, 40, ρ = 0.01 (0.2) 0.9 и для ρ2 = 0.1 (0.2) 0.9. Расчеты показывают, что в большинстве случаев аппроксимации сравнимы по точности. Moschopulos and Mudholkar (1983) приводят нормальную аппроксимацию для R2 , которая по-видимому, дает хорошую точность: четыре верных десятичных знака при ρ > 1/2 при вычислении функции распределения. Для меньших ρ ошибка может появиться в третьем десятичном знаке. Для получения аппроксимации рассматривается преобразование:  h

− log 1 − R2 , g1

и распределение этой величины близко к нормальному со средним и дисперсией, зависящими от n, k и ρ. Эти зависимости (как и зависимости h и g1 ) выражаются довольно громоздко и здесь не приводятся. Srivastava (1983), Gupta and Kabe (1991) и Amey (1990) рассматривают распределение R2 , получаемого по выборке из m-компонентной смеси (k + 1)-мерных нормальных распределений и приводят выражения для точного распределения. В первых двух из названных работ, Srivastava (1983), Gupta and Kabe (1991) рассмотрен случай m = 2. Amey (1990) рассматривает общий случай. Amey (1990) составил программу вычисления этой функции распределения для случая ρ = 0, использовав программы пакета IMSL (1987), и для некоторых 2 значений параметров рассчитал процентные точки

2 распределения R . Он 2 2 табулировал значения Rα , где Pr R  Rα | ρ = 0 = α , для α = 0.90, 0.95, 0.99, k = 2, 3, 4, 5 и n = 10, 15, 20, а также при k = 2, 3, 4, 5 и n = 10, 15, 20 для нескольких значений разностей между значениями весовых функций смеси. Можно показать, что Pr[R  r | ρ] является убывающей функцией ρ. Верхняя и нижняя границы 100(1 − α )%-го доверительного интервала для ρ R получаются как решение уравнений −∞ pR (r | ρ)dr = α1 и 1 − α2 при условии α1 + α2 = α . Kramer (1963) приводит таблицы для построения нижней 95%-й границы (т. е. при α1 = 0.05, α2 = 0). Как показывает (31.185a), R2 является смещенной ρ2 . Venables (1985) рассмотрел A-преобразование Фишера для R2 , имеющее целью уменьшить смещение. A-преобразование определено формулой A=

R2 − k(n − 1)−1 1 − k(n − 1)−1

(32.187)

или равносильной формулой

 1 − A = (n − 1)(n − k − 1)−1 1 − R2 .

(32.187)

Venables показал, что A близко к ОМП параметра ρ2 , основанной на маргинальном уравнении правдоподобия, получаемой по (32.179). Автор

533

11. МНОЖЕСТВЕННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

доказал, что (32.179) имеет единственный максимум на множестве значений параметра 0  ρ2  1. Пусть этот максимум есть # ρ. Если R2  k(n − 1)−1 , то 2 2 # ρ = 0. С другой стороны, для случая 1 > R > k(n − 1)−1 Venables показал, что ОМП равна единственной точке максимума маргинальной функции правдоподобия в интервале 0  ρ2  1. Это влечет за собой, что, если #2 удовлетворяет k(n−1)−1 < R2 < 1, то оценка максимального правдоподобия ρ неравенству ρ2 < A + A 0, то функция интенсивности (отказа) или интенсивность отказа или опасность отказа (эти термины синонимичны) определяется формулой d (33.1) hT (t) = − log {1 − FT (t)} . dt

Она равна условной плотности отказа в момент t при условии, что отказа не было до момента t. Если pT (t) — плотность, то интенсивность отказа равна hT (t) = pT (t)/{1 − FT (t)}. При данной интенсивности hT (t) функция распределения равна    t

FT (t) = 1 − exp −

hT (x)dx ,

0  t < ∞.

(33.2)

0

Иногда функцию интенсивности путают с условной интенсивностью, равной d Pr[T  t|T > x] pT (t) = , dt 1 − FT (x)

t > x.

Мы уже писали о многих более или менее используемых распределениях времени жизни, таких как экспоненциальное, смесь экспоненциальных, распределение Вейбулла и особенно распределения экстремальных значений, усеченная форма которых есть хорошо известное распределение Гомперца (гл. 22). Большой класс таких распределений, исследованных до начала 1960-х годов описан в книге Buckland (1964). В качестве распределения времени жизни часто используется экспоненциальное распределение. Если отклонениями от этого распределения нельзя пренебречь, то используют распределение Вейбулла. Среди других отметим распределение с линейной функцией интенсивности [Barlow (1968), Bain (1974)]. Его плотность равна    1 , t > 0. (33.3) pT (t) = (1 + θ t) exp − t + θ t2 2

Рассматривают также распределение с плотностью

 

 

, t > 0. pT (t) = 1 + θ 1 − e−t exp − t + θ e−t − 1 Мы записали обе последние формулы в стандартной форме. Можно дополнительный параметр, рассматривая случайную величину α T, где Flehinger and Lewis (1959) рассмотрели распределения времени с интенсивностями отказа специального вида, именно a + 2b2 t, a + 3c3 t2 ;

(33.4) ввести α > 0. жизни

1) Под термином «время жизни» подразумевается как случайное физическое время жизни живого существа, так и продолжительность правильного функционирования некоего устройства, годности продукта и т. д. — Прим. ред.

548

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

соответствующие функции распределения суть



1 − exp −at − (bt)2 , 1 − exp −at − (ct)3 (33.5) [ср. с (33.3)]. Здесь параметры a и b, а также аргумент t положительны. Можно рассмотреть распределение и с функцией интенсивности a+2b2t+3c3 t2 , и с функцией распределения

1 − exp −at − (bt)2 − (ct)3 , но чрезмерная громоздкость делает его непривлекательным. Flehinger and Lewis обсуждали также возможность использования в качестве времени жизни усеченное нормальное распределение (см. гл. 13, п. 10.1). Greenwich (1992) предложил распределение с унимодальной интенсивно−1

стью, равной , a, b > 0, (33.6a) at b2 + t2 что соответствует функции распределения −a/2

FT (t) = 1 − 1 + b−2 t2 , t  0. (33.6b) 1/2

, где F2,a — случайная велиЭто, по существу, распределение b 2F2,a /a чина, имеющая центральное F-распределение с (2, a) степенями свободы (см. гл. 27). Shaked (1977) исследовал распределения с интенсивностью отказа вида hT (t) = A1 g1 (t) + A2 g2 (t) , 0  t,

(33.7)

где g1 (t) и g2 (t) предполагаются известными и не зависящими от A1 и A2 . Формула (33.7) описывает множество типов интенсивностей отказа, встречающихся в приложениях, включая немонотонные функции интенсивности. Как сказано выше, Bain (1974) рассмотрел случай gj (t)=tθj , j=1, 2 [линейная функция интенсивности получается при θ1 = 0, θ2 = 1, см. (33.3)]. Gaver and Acar (1979) провели глубокий анализ двух моделей интенсивностей отказа такого типа. Они рассматривают два типа функции интенсивности, имеющих ваннообразную форму (соответствующую функцию интенсивности отказа обозначим UФИ, а ее форму U): (i) первый определяется случайной величиной XL(X)R(X), где X — случайная величина, имеющая стандартное показательное распределение, L(X) — вогнутая функция от X, L(0) < 1, L(∞) = 1, R(X) — выпуклая функция от X, R(0) = 1, R(0) > R(∞); (ii) второй определяет интенсивность отказа вида h(t) = g(t) + λ + k(t), где g(t) > 0, убывает по t, lim g(t) = 0, t→∞ k(t) возрастает (удобней, если k(0) = 0, k(∞) = ∞), например, A + Bt + λ . h(t) = t+α

В книге Crowder et al. (1991) приводятся, в частности, графики интенсивностей отказа для следующих распределений: Вейбулла (c = 0.5, 1.5, 2.5, 5), стандартного нормального, Гумбеля, 1 1 3 логнормального [log X → N(μ , σ 2 ) при σ = , , 1, , а μ выбирается 4 2 2 так, чтобы E[X] = 1], гамма-распределения [α = 0.5, 1.5, 2.5, 5, а β выбирается так, чтобы E[X] = 1].

2. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ

549

Интенсивность отказа вида (33.7) возникает естественным образом для обычных систем, состоящих из двух независимых компонент. Bain and Engelhardt (1991) провели подробный анализ оценивания параметров распределения времени жизни, если функция интенсивности выражается многочленом. Авторы предложили метод наименьших квадратов для аппроксимации полинома по множеству наблюдений; метод применим как к полной, так и к цензурированной выборке. Foster and Craddock (1974) изучили (33.7) в случае g1 (t) = 1, g2 (t) = exp(−at). Полагая в (33.7) g1 (t) = I[0, K] (t), g2 (t) = I[K, ∞) (t) для некоторого K > 0, получим кусочно-постоянную функцию интенсивности, рассмотренную в статьях Prairie and Ostle (1961) и Colvert and Boardman (1976). Dimitrov, Chukova and Green (1993) рассматривают непрерывные распределения с периодической функцией интенсивности. Shaked (1977), полагая в (33.7) g1 (t) = 1 и g2 (t) = sint, моделирует функцию интенсивности, описывающую один из факторов, влияющих на температуру. Автор исследует оценки максимального правдоподобия параметров A1 и A2 , если функция интенсивности возрастающая (ВФИ) (33.7) является возрастающей (ВФИ), возрастающей в среднем (ВСФИ) или новый лучше старого (НЛС) (см. п. 4). Заметим, что распределения (33.5) принадлежат типу ВФИ. Для живых популяций (людей, например) интенсивность смертности имеет так называемую форму U (рис. 33.1). Во многих практических случаях с увеличением возраста сначала интенсивность отказа убывает, а затем, начиная с некоторого значения, возрастает. Детская смертность или период приработки некоторых приборов является типичным примером подобных времен жизни. Такой тип немонотонности во времени называют U-типом функции интенсивности (UФИ) или интенсивностью смертности типа UФИ. Более строго UФИ описывается следующим образом. Говорят, что распределение F принадлежит типу UФИ или типу ОUФИ (обратный UФИтип), если существует такое t0  0, что интегральная интенсивность отказа, равная − log F(t), выпукла вверх (выпукла вниз) на [0, t0 ], и выпукла вниз (выпукла вверх) на [t0 , ∞). Такое определение типа UФИ является достаточно общим и позволяет распространить понятие функции интенсивности типа UФИ на случай, когда интенсивность (33.1) не существует [см. Mitra and Basu (1944)]. MacGillivray (1981) получил соотношение между числом промежутков возрастания и промежутков убывания функции интенсивности отказа и со-

РИС. 33.1. Функция интенсивности отказа формы U

550

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

РИС. 33.2. Интенсивность отказа (33.8b) при разных значениях β

РИС. 33.3. Интенсивность отказа (33.10) при разных значениях β

ответствующей характеристикой функции pT (t) d log FT (t) = , pT (t) dt

поскольку число точек изменения направления выпуклости функции log[1 − FT (t)] не больше числа таких точек для logpT (t). Dhillon (1981) [см. также Leemis (1986)] ввел двухпараметрическое семейство распределений времени жизни — показательно-степенных распределений. Интенсивность отказа распределений этого семейства может быть как возрастающей, так и убывающей или иметь тип UФИ. Функция дожития этого семейства определяется формулой 

 F T (t) = 1 − FT (t) = exp 1 − exp (α t)β , α , β > 0, (33.8a) а интенсивность отказа равна   (33.8b) hT (t) = αβ (α t)β −1 exp (α t)β . Она имеет тип UФИ при β < 1, достигая минимума в точке t = {(1 − β )/(αβ )}1/β (см. рис. 33.2). При β = 1 получается распределение экстремальных значений (см. гл. 22). Dhillon (1981) построил еще одно двухпараметрическое семейство с функцией дожития, равной   β +1 F T (t) = exp − {log(λ t + 1)} (33.9) , β  0 , λ > 0 , t  0, и интенсивностью отказа β (33.10) hT (t) = (β + 1) (λ t + 1)−1 {log(λ t + 1)} . Несколько графиков функций интенсивности этого семейства показано на рис. 33.3. Диллон (Dhillon) предложил алгоритмы получения оценок максимального правдоподобия для обоих семейств (33.8a) и (33.9). Hjorth (1980) рассмотрел трехпараметрическое семейство с функцией   дожития 1 F T (t) = (1 + β t)−γ /β exp − α t2 , α , β > 0 (33.11) 2

и интенсивностью отказа

hT (t) = α t + γ (1 + β t)−1 .

Эти распределения принадлежат типу U, если 0 < α < βγ .

(33.12)

551

2. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ

Смесь распределений Вейбулла с параметрами формы βk , удовлетворяющими неравенству β1 < 1 < β2 (см. гл. 21), также имеет функцию интенсивности типа U. В отличие от двухпараметрического семейства Диллона такая смесь содержит пять параметров; об этом см. также в работах Nelson (1982) и Lawless (1982). Sibuya (1994) использовал взаимную зависимость формы плотности и формы интенсивности отказа. Первоначально он рассмотрел шесть основных типов функции интенсивности, а именно: возрастающую, убывающую, унимодальную, анти-унимодальную, возрастающую—убывающую—возрастающую и убывающую—возрастающую—убывающую. Затем рассмотрел все возможные 36 комбинаций по два типа. Sibuya (1994) показал, что 16 из таких комбинаций невозможны и на примерах показал, что остальные 20 типов существуют. Kunitz (1989) предложил смесь гамма-распределений (см. гл. 17) в качестве адекватной модели распределений с функциями интенсивности типа U. Эти функции интенсивности можно определить в терминах TTT-преобразования (total time on test transform): FT−1  (t) H F−1 (t) = F T (u)du. (33.13) 0

Они меняются от выпуклых к вогнутым на промежутке (0, 1) и являются экстремалями мощности при проверке гипотезы об экспоненциальном распределении при конкурирующих гипотезах о ВФИ или УФИ. Изменения монотонности, описанные выше для U-образной функции интенсивности, можно изучать, рассматривая класс распределений, имеющих возрастающее— затем убывающее в среднем оставшееся время жизни (ВУСОВЖ), введенный в работе Guess, Hollander and Proschan (1986), в которой авторы используют среднее оставшееся время жизни. Распределение F времени жизни относится к типу возрастающее— затем убывающее в среднем оставшееся время жизни (ВУСОВЖ) [убывающее— затем возрастающее в среднем время  ∞ жизни (УВСОВЖ)], если существует t0  0 такое, что функция μ(F) (t) = t F(x)dx/F(t) не убывает (не возрастает) на [0, t0 ] и не возрастает (не убывает) на [t0 , ∞). В п. 4.2 рассматриваются такие распределения, введенные в работе Mitra and Basu (1994). Zelterman (1992) рассмотрел функции интенсивности, которые быстро возрастают и обращаются в бесконечность в конечной точке ψ , соответствующей максимально достижимому времени жизни. (Целью работы было оценить предельно достижимый возраст при условии, что этот предел существует.) Автор рассматривает функцию интенсивности вида h(t) = θβ (ψ − t)β −1 ,

0  t < ψ , θ > 0,

где параметр 0 < β < 1 определяет форму [при β < 0 получается распределение экстремальных значений типа 2 (гл. 22), при β → 0 получается обобщенное распределение Парето с функцией дожития 1/β

F(t) = {1 − (β t/σ }

,

0  t  σ /β , σ > 0, β > 0,

552

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

и с интенсивностью h(t) = (σ − β t)−1 ]. При 0 < β < 1 функция дожития равна ⎧ t < 0, ⎪ ⎨1,

 β  β F(t| θ , β , ψ ) = exp −θ ψ − (ψ − t) , 0  t  ψ, ⎪ ⎩0, t  ψ. Основная особенность этой функции дожития есть скачок F(t) к нулю в точке t = ψ , представляющий конечную вероятность окончания времени жизни всех доживших до момента t = ψ . Плотность p (t), соответствующая такой интенсивности h(t) или F(t) является смешанной, она содержит как непрерывную, так и дискретную компоненту: ⎧ β −1 ⎪ 0  t < ψ, ⎨ θβ (ψ − t)  F(t) , p(t) = масса, сосредоточенная в точке t = ψ , exp −θψ β , ⎪ ⎩ 0 при остальных t. Функции интенсивности фазового типа, содержащие точки изменения типа интенсивности, изучались в ряде работ, из которых упомянем Blackstone, Naftel and Turner (1980) и Hazelrig, Turner and Blackstone (1982). Hazelrig, Turner and Blackstone (1982) ввели в рассмотрение, применительно к анализу данных о выживаемости, семейство непрерывно дифференцируемых функций интенсивности, связанных с непрерывно дифференцируемыми функциями дожития. (Такие модели связаны, обычно, с дифференциальным уравнением; отметим, что близкие идеи Войта (Voit) упомянуты в гл. 12.) Дифференциальное уравнение, описывающее такое семейство, записанное в терминах функции распределения F(t) есть  1/(1+ν) · F(t) = μ {F(t)}1−(1/m) m (1 − F(t))1/m . |m|

Здесь v > 0 и m являются параметрами формы, и при условии F(0) = 0 получается функция  −ν m + |m| μt m F(t) = 1 − + . |m|

2|m|

|m|

Параметр μ является масштабным множителем по оси времени и называется модулем смертности. Значения m естественным образом разбиваются на три категории: (i) m > 1 или m < −1/ν , (ii) m = 1 или m = −1/ν , (iii) 0 < m < 1 или −1/ν < m < 0. Hazelrig, Turner and Blackstone (1982) приводят схематическую диаграмму различных вариантов распределений этого семейства, включающего гиперболическое, гипер-логистическое, распределение с функцией распределения  −μ t/m m , гипер-распределение Гомперца и экспоненциальное вида F(t) = 1 − e

553

2. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ

РИС. 33.4. Четыре примера характерных интенсивностей отказа h(μ t)

распределение. На рис. 33.4 показаны четыре примера функций интенсивностей отказа h(μ t). Заметим, что при v = 3 и m = −0.2 интенсивность имеет локальный максимум и локальный минимум. Lewis and Shedler (1976, 1979) применили моделирование к изучению распределений с функцией интенсивности 

h(t) = exp a0 + a1 t + a2 t2 . Makino (1984) ввел понятие средней интенсивности отказа (СИО):

E r(F) (t) =

∞ 

r(F) (t)pT (t)dt, 0

где r(F) (t) ≡ hT (t). Он показал, что  ∞  −1

{1 − FT (t)}dt . E r(F) (t)  0

Последнюю величину иногда называют средней опасностью отказа. Для стандартного нормального распределения СИО = 0.9048557, распределение Вейбулла (гл. 21) с параметром формы c = 3.4392 имеет примерно ту же CИО. (Интересно, что при c = 3.43938 медиана распределения Вейбулла совпадает с его средним значением.) Armero and Bayarri (1993) рассмотрели распределения Куммера. Говорят, что случайная величина X имеет распределение Куммера с параметрами α , β , γ , δ (α > 0, β > 0, δ > 0), если ее плотность распределения равна pX (x| α , β , γ , δ ) = Ce−β x xα −1 /(1 + δ x)γ ,

0 < x < ∞,

где нормировочная константа C определена формулой C−1 =

Γ(α )

δα

U(α , α + 1 − γ , β /δ ).

Здесь U(a, b, z) — функция Куммера (вырожденная гипергеометрическая функция, см. гл. 1). Запишем ее интегральное представление: ∞ 

Γ(a)U(a, b, z) = 0

e−zt ta−1 (1 + t)b−a−1 dt, a > 0, z > 0.

554

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

Моменты X легко выражаются в терминах функции U. Например,

Γ(α + k) U(α + k, α + k + 1 − γ , β /δ ) . E Xk = k U(α , α + 1 − γ , β /δ )

δ Γ(α )

Armero and Bayarri (1993) отмечают, что распределение Куммера обобщает как гамма-распределение, так и F-распределение. Например, при γ = 0 получается гамма-распределение с параметрами (α , β ). Нетрудно показать, что при α = ν1 /2, β = 0, γ = (ν1 + ν2 )/2 и δ = 1 распределение Куммера превращается в F-распределение с ν1 и ν2 степенями свободы. Evans and Swartz (1994) рассматривают семейство плотностей, используемых при анализе продолжительности жизни. Это семейство образовано произведениями неотрицательных многочленов и нормальных плотностей. Такие распределения называют полиномиально-нормальными. Полиномиальнонормальная плотность имеет вид x − ξ  x − ξ  C Q Z , θ > 0, θ

θ

θ

где Z(·) — стандартная нормальная плотность, Q(·) — неотрицательный многочлен, нормировочная константа C дается формулой  −1 ∞ Q(x)Z(x)dx . C= −∞

Если Q(·) — многочлен степени 2m, то интегрирование выполняется по квадратурной формуле Гаусса — Эрмита порядка m + 1. В этом случае C−1 =

m+1 

wi Q(xi ),

i=1

где wi и xi — веса и узлы Гаусса — Эрмита соответственно. Аналогично, r-й момент относительно нуля можно выразить по квадратурной формуле Гаусса—Эрмита порядка (r + 2m + 1)/2. Evans and Swartz (1994) отмечают, что это семейство дает широкий класс распределений, которые можно использовать для популяций, отличных от нормальных, в частности, эксцессом и мультимодальностью. Авторы обсуждают алгоритмы исследования этих распределений. Creedy and Martin (1994) использует обобщенное гамма-распределение в качестве модели распределения цен. Плотность этого распределения равна   pX (x) = exp θ1 log x + θ2 x + θ3 x2 + θ4 x3 − η , x > 0. Нормировочная константа η определяется численно. Это семейство обобщенных гамма-распределений включает в качестве частных случаев несколько хорошо известных распределений. Например, при θ1 = θ2 = θ3 = 0 получается экспоненциальное распределение, при θ2 = θ4 = 0 получается распределение Рэлея, а при θ3 = θ4 = 0 — гамма распределение. Кроме того, это распределение связано с обобщенным гамма-распределением Mc Donald’a (1984), а также с обобщенным логнормальным распределением, рассмотренным Lye and

555

2. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ

РИС. 33.5. Обобщенные гамма-плотности Криди и Мартина

Martin (1993). На рис. 33.5 показаны графики обобщенных гамма-плотностей Криди и Мартина(Creedy and Martin (1994)):  (a) pX (x) = exp 6 log x − 11x + θ3 x2 − (x3 /3) − η , (b) pX (x) = exp 6 log x − 5x + θ3 x2 − (x3 /3) − η . Sobolev (1994) предложил семейство распределений времени жизни, названных им q − r распределениями, плотности которых даются формулой: pq xq−1

p(x; p, q, r) = |q| 

Γ 1+

1 qr 2

2/r

−(px)  e

,

x  0,

где p — масштабный параметр. Автор исследовал их свойства и методы оценивания параметров. Он рассмотрел четыре случая: 1. q, r > 0; 2. q, r > 0 и r → 0; 3. q, r < 0 и 4. q, r < 0 и | r| → 0. В случае 2 получаем: p(x) = qpq xq−1 ,

0x

1 (степенное распределение), p

а в случае 4 получаем: p(x) = qpq x−q−1 ,

p  x  ∞ (распределение Парето).

Значения (q, r), равные (−1/2, −2), (1, 0), (1, 1), (2, 1), (3, 1), (2, 2) и (2/r, r) дают устойчивое распределение Леви, равномерное, свернутое (или модальное) нормальное, распределения Рэлея, Максвелла, показательное и Вейбулла. Отметим сходство с распределением МакДональда (McDonald) (см. гл. 27) и с обобщенным гамма-распределением (гл. 17). Модифицированное преобразование Лапласа семейства плотностей Соболева (Sobolev) в случае 1 есть ∞     r/2  −q p(x) exp −(sx)2/r dx = p p2/r + s2/r . o

Для других случаев обобщенное преобразование Лапласа имеет вид ψ q , где ψ — функция от остальных параметров.

556

3.

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

Распределение Бирнбаума—Сондерса и его модификации

В этом пункте рассматриваются другие распределения, предлагаемые в качестве распределений времени жизни. Они основываются на более или менее правдоподобных соображениях о моделях, соответствующих концепции «жизни». Рассматриваемые здесь модели не являются исчерпывающими. В гл. 12 мы уже рассмотрели несколько простых преобразований нормальной случайной величины с точки зрения построения обобщенной системы распределений. Birnbaum and Saunders (1968a) пришли к обсуждению распределения величины 6 2   2 1 1 Uα + 1 , (33.14) T = β Uα + 2

2

где α и β — положительные параметры, U — стандартная нормальная случайная величина, рассмотрев время до разрушения материала, подверженного периодически повторяющимся экстремальным воздействиям. Они предположили, что j-й период приводит$к возрастанию поврежденности на величину n Xj и что распределение близко к нормальному со средним nμ0 j=1 X √j и стандартным отклонением σ0 n. Тогда вероятность, что повреждение не достигнет критического уровня ω равна    √  μ0 n ω − nμ0 ω Φ Φ − = . √ √ σ0 n

σ0 n

σ0

Предполагается, что отказ наступает, если величина повреждения превысит ω . Пусть T — время жизни (измеряемое числом периодов) до разрушения. Тогда функция распределения T аппроксимируется следующим образом:   √  √  μ0 t μ0 t ω ω FT (t) ≈ 1 − Φ − √ =Φ (33.15) √ − σ0

σ0 t

σ0

σ0 t

(предполагается, что можно пренебречь отрицательными значениями Xj ). Если считать (33.15) точным равенством, то из него следует, что √ μ0 T ω − √ U= σ0 σ0 T

(33.16)

имеет стандартное нормальное распределение. (33.16) перепишем в виде C * +2  Uσ  2 U σ ω 0 0 + +1 , (33.16) T= √ √ μ0

2 ω μ0

2 ω μ0

что совпадает с (33.16), если положить β=

ω , μ0

α=√

σ0 . ω μ0

(33.17)

Таким образом, T имеет распределение Бирнбаума—Сондерса, если 6  6 1 T β − (33.18) α

β

T

имеет стандартное нормальное распределение. Очевидно, что cT, c > 0, также имеет распределение Бирнбаума—Сондерса с параметрами β c и α [Birnbaum

557

3. РАСПРЕДЕЛЕНИЕ БИРНБАУМА—СОНДЕРСА И ЕГО МОДИФИКАЦИИ

and Saunders (1969)]. Распределение T −1 совпадает с T при замене β на β −1 и тем же самым значением α . Используя (33.18), Chang and Tang (1994 a, b), предложили простую алгоритмическую вероятностную модель порождения случайной величины, имеющей распределение Бирнбаума—Сондерса: «Пусть Z имеет стандартное нормальное распределение, а V — равномерное распределение на (0; 1). Определим t1 и t2 как корни квадратного уравнения

 t2 − β 2 + α 2 z2 t + β 2 = 0, где z — значение Z. Тогда случайная величина Бирнбаума—Сондерса равна t1 I(V>0.5) + t2 I(V 0, α > 0, β > 0.

(33.22) Desmond (1985, 1986) пишет, что эта форма плотности, выведенная в статье Birnbaum and Saunders (1969), ранее использована в несколько измененном виде в работе Freudenthal and Shinozuka (1961). Десмонд (Desmond) отмечает, что такая модель получается в следующих предположениях о процессе «усталостного» разрушения. 1. Отказ в силу усталости наступает в результате периодически повторяющихся вредных воздействий.

3. РАСПРЕДЕЛЕНИЕ БИРНБАУМА—СОНДЕРСА И ЕГО МОДИФИКАЦИИ

559

2. Под влиянием повторяющихся вредных воздействий повреждение (трещина) увеличивается до тех пор, пока не достигнет размера ω , при котором наступает усталостное разрушение. 3. Расширения трещины при каждом из указанных воздействий являются случайными величинами с одинаковыми средними и дисперсиями. 4. Случайные расширения трещины независимы в совокупности. 5. По центральной предельной теореме общий размер трещины после нескольких повторных воздействий имеет распределение, близкое к нормальному. Выше говорилось, что в исходной модели Бирнбаума—Сондерса размер повреждения предполагается распределенным по нормальному закону, т. е. с положительной вероятностью принимает отрицательные значения. Этой возможностью авторы пренебрегают. Desmond (1985) привел более общий вывод распределения Бирнбаума—Сондерса, свободный от предположения о нормальности распределения расширения трещины: 1. При различных распределениях размера увеличения трещины (многие из которых сосредоточены на положительной полуоси) получается распределение Бирнбаума—Сондерса для распределения времени усталостного разрушения. 2. Можно допустить, что увеличение трещины при каждом воздействии зависит от суммарного размера повреждения в момент начала воздействия; такая модель также приводит к распределению Бирнбаума—Сондерса времени усталостного разрушения. Desmond (1985) получил распределение Бирнбаума—Сондерса, рассматривая биологическую модель Крамера [Cram´er (1946, p. 219)], в которой «закон пропорционального воздействия» является частным случаем [см., например, Mann, Schafer and Singpurwalla (1974)]. Он подтверждает вывод о том, что использование усталостной модели Крамера приводит, скорее, к распределению Бирнбаума—Сондерса, чем к логнормальному — вывод, сделанный ранее в работах Birnbaum and Saunders (1969) и Mann, Schafer and Singpurwalla (1974). Он далее предлагает модель отказов в случайной среде, описываемую стандартным гауссовским процессом с непрерывным временем, и в этом случае также получается модель Бирнбаума—Сондерса. Модель включает отказы, обусловленные реакцией на превышение некоторого фиксированного уровня в течение длительного периода времени. Разрушения при выходе за фиксированный уровень связаны с так называемой Zn -мерой превышения [Cram´er and Leadbetter (1967)]. Случай n = 1 соответствует одному уровню, превышение которого есть мера разрушения. Усталостные отказы также могут происходить в силу прошлых воздействий, пропорциональных реакции медленно затухающего одномерного осциллятора, возбуждаемого стационарным гауссовским белым шумом. Все эти модели приводят к распределениям типа Бирнбаума—Сондерса. Seto, Iwase and Oohara (1993), изучив характеристики выпадения осадков в Хиросиме, пришли к выводу, что данные о продолжительности дождей хорошо описываются распределением

560

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

Бирнбаума—Сондерса с функцией распределения (33.15). Их анализ позволил построить так называемый тест Цукутани—Сигемицу (Tsukutani—Shigemitsu), основанный на паре (δ2 , δ3 ), где μ

δ2 = 22 , 

(33.23a)

μ1 μ3

δ3 =

(33.23b)

μ1 μ2

и μi , i = 2, 3, есть i-й момент относительно среднего значения μ1 . Для распределения (33.22) эти параметры суть функции только от α 2 : 5α 4 + 4α 2 2 , α2 + 2

δ2 = 

(33.24a)

44α 4 + 24α 2  . 5α 2 + 4 α 2 + 2

δ3 = 

(33.24b)

Saunders and Birnbaum (1969) предложили метод вычисления оценок максимального правдоподобия. ОМП параметра β есть единственный положительный корень уравнения     # 2H + K(β#) + H T + K(β#) = 0, #2 − β β (33.25) где T = n−1

n 

Tj ,

i=1

*

H = n−1

n 

+ −1 Tj−1

,

j=1

* K(β#) = n−1

n 

# + Tj β

−1

+−1

j=1

# ОМП параметра α # получается [см. также Achcar (1993)]. После вычисления β непосредственно по формуле   1/2   # −1 + H −1 β# − 1 # = 2 1 Tβ α . (33.26) 2

В качестве начального приближения при итеративном решении (33.25) предлагается «усредненное среднее» ( n )( n )−1 1/2   −1 1/2 Ti Ti . (33.27) (TH) = i=1

i=1

Авторы показали, что если 2T < 3H + min (T1 , T2 , . . . , Tn ) ,

3. РАСПРЕДЕЛЕНИЕ БИРНБАУМА—СОНДЕРСА И ЕГО МОДИФИКАЦИИ

561

# с при любом то приближенный метод Ньютона—Рафсона сходится к β начальном приближении между T и H. Если 2H > T, то итеративное вычисление величины 6 2  1 # 1 H + K(β ) − K(β#) − H(T − H) 2

4

#. обеспечивает сходимость к β Приближенное значение дисперсии упомянутого «усредненного среднего»

1/2 TH при большом n есть      3 2 1 2 −1 2 2 −1 1 α α β α . (33.28) 1+ 1+ n 8

8

4

Приближенное значение среднего равно     −1 1 3 1 β 1+ α 2 n−1 . 1 + α2 1 + α2 4

8

4



1/2 вместо оценки β#. При α < 2 можно использовать TH Ahmad (1988) отметил, что хотя «усредненное среднее» является асимптотически несмещенной оценкой, оно имеет положительное смещение при конечных объемах выборки. Он предложил оценку метода складного ножа по выборке T1 , . . . , Tn объема n = mg, где m и g — целые. Выборка разбивается на m групп B1 , . . . , Bm объема g каждая; затем вычисляются $

βi∗

(i) Tj −1 (i) Tj

=$

,

(33.29)

где Σ(i) означает суммирование по j = 1, . . . , n, кроме j = i (i = 1,. . . , m). Оценка с исключениями равна ∗

β =

mβ0∗

− 1−m

−1

m 

βi∗ ,

(33.30)

i=1

где

( $n β0∗

=

$n

j=1 Ti

−1 j=1 Tj

)1/2 [«усредненное среднее, см. (33.27)»].

Ahmad (1988) показал, что оценка β *, определяемая формулой (33.30), является состоятельной оценкой β (как и усредненное среднее). Он оценил среднее квадратическое отклонение обеих оценок и показал, что β * имеет меньшее среднеквадратическое отклонение, хотя предельные распределения оценок совпадают. Другой подход, основанный на совпадении первых  моментов, приводит  к более простой оценке. Так как α −1 (T/β )1/2 − (β /T)1/2 имеет стандартное нормальное распределение, то    1/2  T 1/2 β E − = 0. β

T

562

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

Приравнивая нулю выборочное среднее n  1/2  1/2   Ti β −1 n − , β

i=1

получаем оценку

Ti

$n

1/2 i=1 Ti −1/2 i=1 Ti



β = $ n

(33.31)

[ср. с (33.27)]. При использовании другой оценки, скажем βe , параметра β естественно использовать «моментную оценку» α , равную + * n  T 1/2  β 1/2 2 1/2 e 1 i αe = − = n

 1 n

=

i=1 n 

βe

( βe−1

i=1

Ti

n 

Ti + βe

i=1

n 

)

1/2

Ti−1 − 2

.

(33.32)

i=1

Заметим, что при известном β эта√оценка при замене βe на β дает ОМП α , распределенную по закону αχn / n. Сравнение (33.22) и (15.4a) (формула гл. 15 с изменением параметров: μ = β , λ = βα −2 ) показывает, что существует очевидная связь между плотностью Бирнбаума—Сондерса и плотностями обратно-гауссовских распределений. На самом деле, плотность распределения Бирнбаума—Сондерса в форме (33.22) является смесью (с равными весами) плотности распределения обратногауссовской случайной величины IG(β , βα 2 ) и плотности распределения обратной к ней случайной величины IG(β , β −1 α 2 ). Это свойство отмечают Desmond (1985, 1986) и Jørgensen, Seshadri and Whitmore (1991). Они считают распределение Бирнбаума—Сондерса принадлежащим к двухпараметрическому экспоненциальному семейству [вопреки мнению Bhattacharyya and Fries (1982)], но не описывающим экспоненциальную модель рассеяния. Engelhardt, Bain and Wrihgt (1981) показали, что плотность (33.22) удовлетворяет условиям регулярности, которые обеспечивают асимптотическую #) параметра (α , β ) со средним (α , β ) и асимптоти#, β нормальность ОМП (α ческой матрицей ковариаций nBij (α , β ) где

−1

,

i = 1, 2, j = 1, 2,

B11 (α , β ) = 2α −2 , B12 (α , β ) = B21 (α , b) = 0,   1 + α −2 + I(α ) , B22 (α , β ) = β −2 ∞ 

I(α ) = 2 0

4



1 + ξ −1 (α z)

−1



1 2

2

φ (z)dz,

φ (z) = Φ (z),

(33.33)

563

3. РАСПРЕДЕЛЕНИЕ БИРНБАУМА—СОНДЕРСА И ЕГО МОДИФИКАЦИИ

и, как и выше, ξ (t) = t1/2 − t−1/2 . Engelhardt, Bain and Wrihgt (1981) использовали этот результат для построения границ для α и β  √ −1 доверительных # α − 1 рассматривается как припо большой выборке. Величина n α ближенная центральная статистика (распределение которой не зависит от параметров оцениваемого распределения) и аналогичным свойством обладает   −1/2 1 # −2 # −1 − 1) #) n1/2 ββ + α − I(α . Отсюда получаются 100(1 − ε )%-е 4 доверительные интервалы    −1   −1  # 1 + (2n)−1/2 u1−ε /2 # 1 + (2n)−1/2uε /2 для α α , α (33.34a) и    −1/2    −1 # 1 + n−1/2 1 + 1 + α # −2 − I(α #) β u1−ε /2 , 4

 −1/2     −1  # 1 + n−1/2 1 + 1 + α # −2 − I(α #) β uε /2

для

4

β.

В той же статье Engelhardt, Bain and Wrihgt (1981) рассматриваются другие асимптотические свойства. Achcar (1993) разработал алгоритм байесовской оценки, основанной на безынформативных априорных совместных распределениях α и β с плотностями (33.35) pα , β (a, b) ∝ (ab)−1 , a, b > 0, и

pα , β (a, b) ∝ (ab)−1



1 + a−2 4

 1/2

,

a, b > 0,

(33.36)

(оба распределения — несобственные). Для (33.36) совместное апостериорное распределение α и β при данном T = (T1 , . . . , Tn ) имеет плотность  n  1/2 , −(n+1) −(n/2)−1 1 −2 b +a (b + Ti ) × pα , β (a, b |T) ∝ a 4

i=1



  n n   1 −2 −1 −1 × exp − a Ti + b Ti − 2n , b 2

i=1

a, b > 0. (33.37)

i=1

Плотность, соответствующая (33.35), получается, если опустить множитель 1/2  1 + a−2 . 4 Апостериорная плотность β при априорном распределении (33.35) равна  n   −n/2 n n ,   −1 −(n/2)−1 −1 (b + Ti ) b Ti + b Ti − 2n . (33.38) pβ (b | T) ∝ b j=1

i=1

i=1

Для (33.36) Achcar (1993) получил приближенную формулу для pβ (b | T) умножением правой части (33.38) на 1/2  n n   4 + (n + 2)−1 b−1 Ti + b Ti−1 − 2n . (33.39) i=1

i=1

564

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

Апостериорная плотность α более проста. Она пропорциональна ( n )1/2 ( n )−1/2 * +   Ti Ti−1 −1 , a > 0, a−n exp −na−2 i=1

(33.40)

i=1

в случае (33.35) и примерно пропорциональна ( n )1/2 ( n )−1/2 * +  1/2   −1 −(n+1) 1 −2 −2 +a exp −na Ti Ti −1 , a 4

i=1

i=1

a > 0, (33.41)

в случае (33.36). При известном β Achcar (1993) предложил использовать в качестве априорного гамма-распределение (гл. 17) для величины α −2 . Это ранее рассматривал Padgett (1982) в связи с байесовской оценкой функции надежности, соответствующей (33.32). Паджет (Padgett) также рассмотрел использование априорного несобственного распределения для α , где pα (a) пропорционально a−1 . Если T распределено с плотностью (33.22) и Y = log T (т. е. T = eY ), то     1 α −1 β −1/2 eY/2 − β 1/2e−Y/2 = 2α −1 sh (Y − γ ) , 2

где γ = log β имеет стандартное нормальное распределение. Это — частный случай sh-нормального распределения [обозначаемого SN(α , γ , σ )], введенного в статье Rieck and Nedelman (1991) как распределение величины Z, если   1 (Z − γ )/σ 2α −1 sh 2

имеет стандартное нормальное распределение. Плотность Z равна  √ −1  z − γ    z − γ  pZ (z) = 2 ασ 2π ch exp −2α −2 sh2 . σ

σ

(33.42)

Rieck and Nedelman (1991) установили следующие свойства распределения SN(α , γ , σ ): 1. Распределение симметрично относительно параметра сдвига γ . 2. Распределение строго унимодально при α  2 и бимодально при α > 2. 3. Среднее и дисперсия даются формулами E[Z] = γ и var(Z) = σ 2 ω (α ), где ω (α ) — дисперсия при σ = 1. Формула для ω (α ) пока не найдена, и Rieck (1989) приводит аппроксимации для малых и для больших α . 4. Если Zα ∼ SN(α , γ , σ ), то Sα = 2(Zα − γ ) сходится по распределению к стандартному нормальному распределению при стремлении α к нулю. Rieck and Nedelman (1991) рассматривают оценки максимального правдоподобия и оценки метода наименьших квадратов для модели (33.43) Yi = x iθ + Zi , i = 1 , 2, . . . , n, 

 где Zi ∼ SN(α , 0, 2), x i = xi1 , xi2 , . . . , xip — вектор независимых переменных, θ  = θ1 , θ2 , . . . , θp — вектор неизвестных оцениваемых параметров. ОМП

565

3. РАСПРЕДЕЛЕНИЕ БИРНБАУМА—СОНДЕРСА И ЕГО МОДИФИКАЦИИ

ТАБЛИЦА 33.1 Эффективность оценки α методом наименьших квадратов Результаты моделировании методом Монте-Карло (p = 2) α

0.5 1.5

θ1

Эффективность

0.99 0.81

θ2

n = 10

n = 20

n = 10

n = 20

1.00 0.88

1.00 0.84

0.99 0.89

1.00 0.84

величины α 2 дается формулой   n   Y − x iθ# #2 = 4 α sh2 i , n

i=1

2

(33.44)

где θ# — ОМП вектора θ . Для вычисления θ# используется численный алгоритм. # − η ) [здесь # равна α 2 /(2n) и вектор n1/2(η Асимптотическая дисперсия α  η = (θ , α ) ] сходится по распределению к многомерной нормальной величине со средним 0. Бимодальность синус-гиперболический-нормальной плотности при α > 2 может привести к существованию нескольких максимумов функции правдоподобия. Rieck (1989) приводит пример, когда уравнение правдоподобия имеет три решения: два максимума и одну седловую точку. По опытным данным в авиапромышленности можно сделать вывод, что случай α > 2 редко встречается в приложениях. Rieck (1989) показал, что при α < 2 ОМП параметра θ единственна, если ранг матрицы X = (X1 , . . . , Xn ) равен p. Rieck and Nedelman (1991) исследовали «ОМП с уменьшенным смещением» параметра α , равную

2 # )} α # , α 2 = n/{n − pA(α (33.45) где

 −1 A(α ) ≈ 2 2 + α 2 4 + α 2

для малых α . Относительная ошибка для α < 0.5 меньше 0.3%. A(α ) стремится к 2 при стремлении α к бесконечности. Авторы исследовали оценку наименьших квадратов параметра θ в модели (33.43). Они выяснили, что оценка методом наименьших квадратов для θ менее эффективна, чем ОМП, но является несмещенной оценкой θ , и что она имеет высокую эффективность, что иллюстрируется табл. 33.1 (p = 2). Результаты основаны на моделировании и позволяют сравнить эффективность оценки методом моментов и методом максимального правдоподобия для выборок малого объема. Оценка наименьших квадратов для β дается обычным равенством ! = (X X)−1 X Y, β где Y — вектор наблюдений (Yi ), а X определено выше. Achcar and Espinosa (1993) рассматривают оценки в модели (33.43), если Zi имеет распределение Бирнбаума—Сондерса.

566

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

Chang and Tang (1994) рассматривают построение доверительных интервалов для процентилей порядка 100p для распределения Бирнбаума—Сондерса и применение этих интервалов для определения двусторонних консервативных толерантных границ. Авторы описывают применение этих результатов для оценки надежности в модели Бирнбаума—Сондерса. Chaudhury and Ahmad (1993) рассмотрели распределение с плотностью    " 2 √ α −1 pT (t) = 2 exp − t α − t β (33.46) , α , β > 0 , t > 0. π

1/4 Мода находится √ в точке t = (β /α ) . Это распределение совпадает с распределением 1/ Y, если Y имеет обратное гауссово распределение. Ahmad and Chaudhury (1993) попутно использовали это соотношение для доказательства следующего характеризационного свойства. Пусть T1 , . . . , Tn независимы и одинаково распределены, моменты E[T r ] существуют при  −1 r = −4, −2 и 2 и существует E[T −2 ] . Тогда необходимым и доста $n −1 −1 $n −2 $n 2 2 точным условием того, что величины и i=1 Ti i=1 Ti − n i=1 Ti распределены с плотностью (33.46), является независимость этих величин. Интересно сравнить это свойство с характеристическими теоремами для обратного гауссова распределения, рассмотренного в гл. 15.

4.

Упорядочение и классификация распределений

4.1.

Основные определения и ограничения

В этом пункте мы рассматриваем упорядочение только в множестве независимых случайных величин, хотя общий случай, описанный в классической работе Lehmann (1966) (и независимо в первой на эту тему статье van Zwet (1964), см. гл. 24), включает рассмотрение более широкой модели. В статье Лемана изучаются свойства, связанные с зависимыми (двумя или более) случайными величинами. Но мы переносим рассмотрение зависимостей в другой том, посвященный многомерным распределениям. Подчеркнем, что существует огромное множество разных видов классификации и упорядочения. Многие из работ слабо координированы, что неизбежно влечет за собой путаницу и повторение результатов. Отметим необходимость систематизации в части введения порядка или классификации различных упорядочений, возможно, с применением современных компьютерных технологий. Упомянутые в начале этой главы книги Pecari´c, Proschan and Tong (1992) и Shaked and Shanthikumar (1994) вносят полезный вклад в такой анализ. Первоначальной целью разработки некоторых способов упорядочения было найти альтернативу весьма распространенному" использованию моментов, например стандартного отклонения, асимметрии ( β1 ) и эксцесса (β2 ) в качестве характеристик сравнения распределений. Заметим, однако, что появилось, повидимому, чересчур много альтернативных способов упорядочения, некоторые из которых имеют сомнительную прикладную ценность. Мы попытаемся разумно ограничить наш обзор, остановившись на типах упорядочения,

567

4. УПОРЯДОЧЕНИЕ И КЛАССИФИКАЦИЯ РАСПРЕДЕЛЕНИЙ

находящих признание в литературе. Возможно, что более или менее обоснованные новые варианты могли появиться во время опубликования этой книги. Мы попытались здесь привести добросовестный обзор современных идей и понятий в этой области, не приводя строго обоснованных оценок. Имеется весьма большое число работ по вопросам упорядочения, частично повторяющих друг друга. Поэтому перед нами снова стояла проблема выбора ссылок даже в том, что касается основных понятий. В библиографию к этой главе мы включили несколько дополнительных ссылок. В последние десятилетия популярной и плодотворной областью исследований оказалось упорядочение распределений с учетом изменения их характеристик с возрастом. В п. 7.2 гл. 33 («Классификация распределений по интенсивности отказа») первого издания этой книги мы рассматривали только два типа интенсивностей: ВФИ (УФИ) и ВСФИ (УСФИ) в качестве показателей старения (молодения). Расшифровку сокращений (ВФИ, УФИ и т. д.) см. ниже. В последние годы в литературе утвердилась новая терминология. Мы рассмотрим более широкую классификацию, основанную на показателях старения и сопутствующих упорядочениях. Соответствующие понятия применимы к распределениям, определенным на всей оси, но мы ограничимся временем жизни, для которого FX (0) = 0. Как сказано в п. 2 этой главы [формула (33.1)], функция интенсивности (смертности или отказа) равна r(F) (x) = −

p (x) d −1 log {1 − FX (x)} = pX (x) {1 − FX (x)} = X , dx F X (x)

(33.47)

где F X (x) = 1 − FX (x) — функция дожития, а в технических приложениях ее называют функцией надежности. При введении упорядочений используется среднее остаточное время жизни, равное ∞

F X (t)dt μ(F) (x) = E X − x | X > x = 0 . (33.48) FX (x)

В следующих определениях (а также зачастую и далее) мы опускаем нижний индекс X. 1. F(x) есть распределение с возрастающая функция интенсивности 1) (ВФИ-распределение) [increasing failure rate (IFR)], если log F(x) выпукла. Если существует плотность, то это равносильно неубыванию r(F) (x). 2. F(x) есть распределение с возрастающей в среднем функцией интенсивности (ВСФИ-распределение) [increasing failure rate average (IFRA)], если F(x) является звездообразной (star-shaped) функцией, а именно, если − log F(λ x)  −λ log F(x) при 0  λ  1 и x  0. Если существует 1 x r(F) (t)dt. плотность, то это равносильно неубыванию функции ν (x) = x 0 3. F(x) имеет тип новый лучше старого (НЛС-распределение) [new better than used (NBU)], если − log F(x) супераддитивна, т. е. если − log F(x + y)  − log F(x) − log F(y), x, y  0. 1) В русской литературе распределения типов ВФИ и ВСФИ часто называют стареющими и стареющими в среднем, а распределения типов УФИ и УСФИ — молодеющими и молодеющими в среднем — Прим. ред.

568

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

4. F(x) есть распределение с убывающим в среднем остаточным временем жизни (УСОВЖ) [decreasing mean residual life (DMRL)], если μ(F) (x) не возрастает. 5. F(x) имеет тип новый в среднем лучше старого (НСЛС) [new better than used in expectation (NBUE)], если μ(F) (x)  μ(F) (0), x  0. 6. F(x) имеет тип новый в среднем гармоническом лучше старого (НСГЛС) [harmonic new better than  used in expectation (NBUE)], если ∞ x F(t)dt  μ(F) (x) exp − , x  0. 0 μ(F) (x)

7. Абсолютно непрерывная функция распределения F(x) имеет тип новый лучше старого по функции интенсивности (НЛСФИ) [new better than used in failure rate (NBUFR)], если r(F) (x)  r(F) (0), x  0. 8. Абсолютно непрерывная функция распределения F(x) имеет тип новый лучше старого по средней функции интенсивности (НЛССФИ) [new better than used in failure rate average (NBUFRA)], если x − log F(x) 1 r(F) (t)dt = . r(F)  x

0

x

Другие типы или классы (эти термины используются как синонимы) можно определить заменив Л (лучше) на Х (хуже) при соответствующих изменениях смысла неравенств. Также можно И (интенсивность отказа) заменить на О (опасность отказа). Тип НЛС-t0 , обобщающий тип НЛС (см. класс 3, определенный выше) введен в работе Hollander, Park and Proschan (1986). F(x) имеет тип НЛС в возрасте t0 (НЛС-t0 ), если F(x + t0 )  F(x)F(t0 ) при всех

x  0.

(33.49)

Двойственный класс НХС-t0 определяется изменением смысла неравенства в (33.49) на противоположный. Класс НЛС-t0 включает класс НЛС, а класс НХС-t0 включает НХС. Детальное рассмотрение содержится в статье Hollander, Park and Proschan (1986). Мы отсылаем читателя к работам Alzaid, Ahmed and Al-Osh (1987), Block and Savits (1976), Bondesson (1983), Cao and Wang (1990), Klefsj¨o (1982a, b), Mehrotra (1981) и другим, где содержится подробное обсуждение классов ВСФИ, НСГЛС (НСГХС) и сопутствующих классов. По определению 1 функция интенсивности стареющего распределения (ВФИ) и молодеющего (УФИ) является возрастающей или убывающей функцией от x соответственно. Показательное распределение с постоянной интенсивностью является естественной границей между этими классами. Полунормальное распределение (хи-распределение с одной степенью свободы) имеет тип ВФИ. Распределение Вейбулла [см. гл. 21, формула (21.1)] принадлежит типу УФИ, если c > 1 и типу ВФИ, если c < 1. Barlow and Marshall (1964, 1965, 1967) получили границы для функций распределения типов ВФИ и УФИ. Некоторые из этих границ приведены в табл. 33.2. Некоторые из этих границ можно сравнить с хорошо известными границами чебышевского типа, приводимыми для удобства в табл. 33.3.

4. УПОРЯДОЧЕНИЕ И КЛАССИФИКАЦИЯ РАСПРЕДЕЛЕНИЙ

569

ТАБЛИЦА 33.2 Границы для функций распределения, классифицируемые по интенсивности отказа Условия

ВФИ

УФИ

x

μr 1/r

1 − F(x)  w(x), где 1 μr = rxr 0 tr−1 [w(x)]t dt,

r  т. е. λr = −x/log w(x) Γ− log w(x) (r)/Γ(r)

x

μr 1/r 1/r r λr 1/r r λr

  1/r 1 − F(x)  exp −x/λr   1/r 1 − F(x)  exp −x/λr

r 1 − F(x)  rx/e λ

x x

ВСФИ

Границы 1 − F(x)

Значения x

1 − F(x)  exp(−bx), где b определяется равенством   ∞ μr = xr 1 − e−bx + b x tr e−bt dt

x < μr 1/r

Замечания. 1) λr = μr /Γ(r + 1). 2) Barlow and Marshall (1967) приводят границы разности F(x2 ) − F(x1 ) при произвольных x2 > x1 > 0 для каждого из перечисленных случаев. Для случаев, когда r = 1 и существуют два первых момента, лучшие, но более громоздкие неравенства приведены в статьях Barlow and Marshall (1964,1965).

Читатель, интересующийся более тонкими деталями, может обратиться к работам Fr´echet (1950), Godwin (1964), Mallows (1956, 1963). Заметим, что при s = 2r неравенство Вальда превращается в одно из неравенств Кантелли. Если μr < xr < μ2r /μr , то неравенство Кантелли неприменимо. Подробный анализ этих неравенств приводится в книге Godwin (1964), где также содержатся другие неравенства, применимые к суммам независимых случайных величин. Последний круг задач получил дальнейшее развитие в статьях Hoeffding (1963) и Bennett (1968). Bennett (1968) показал, что, если X1 , . . . , Xn — независимые случайные величины с конечным математическими ожиданиями E[Xj ] и дисперсиями σ 2 (Xj ) и при всех j Pr Xj − E[Xj ] > Mj = 0, то при t < 1 ⎡ ⎤ n n  

  Pr ⎣ Mj ⎦  [f (t, r)]B , (33.50) Xj − E Xj  t j=1

j=1

где

$n

B=

j=1

Mj

maxj Mj



r = min j

,

Mj

 σ Xj



570

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

ТАБЛИЦА 33.3 Границы для функций распределения Имя

Чебышёв

Условия

Значения x



xr > μr

Неравенства для 1 − F(x)

1 − F(x) 

μr xr

1 − F(x) 

Кантелли

x 



 − μ  r2 μ2r 2  − μ  2r xr − μr + μ2r



 μ2r

μr

x  μr r



1 − F(x)  1 −  − μ2 μ2r r

 2  r μr − x + μ2r − μ  2r

1 − F(x)  r

 2 −1



μ μr  ss r x x

rr μr (r + 1)r−1 rr μr (r + 1)r−1

1 + tr2 1−t



μs − μr δ s−r

, xr xs−r − δ r

где δ > 0, δ = x удовлетворяет уравнению μr xs − μs xr + r  + δ (μs − xs ) + δ s (μr − xr ) = 0 −1/r

1 − F(x)  1 − x (r + 1)μr  −r 

1 − F(x)  1 + r−1 x μr

r2 (1−t)/(1+r2 ) .

В статье Bennett (1968) приведена таблица f (t, r) с шестью десятичными знаками для t = 0.0 (0.02) 1.00, r = 2.0 (0.5) 5.0. Из других свойств распределений типа ВФИ и УФИ отметим следующее: [1 − F(x)]1/x убывает (возрастает) по x, если F(x) имеет тип ВФИ (УФИ). Следующие импликации (и никакие другие) имеют место на множестве введенных выше классов: ВФИ ⇒ ВСФИ ⇒ НЛС ⇒ НЛСФИ ⇒ НЛССФИ ⇓ ⇓ УСОВЖ ========⇒ НСЛС ⇒ НСГЛС [Kochar and Wiens (1987), Bondesson (1983)], а также ВФИ ⇒ ВФИ ∗ ВФИ, где ∗ означает свертку. Показательное распределение принадлежит всем типам, если неравенства, определяющие типы, — нестрогие.

571

4. УПОРЯДОЧЕНИЕ И КЛАССИФИКАЦИЯ РАСПРЕДЕЛЕНИЙ

4.2.

Надежностная классификация упорядочений

Из анализа типов, описанных в предыдущем пункте, мы получаем несколько упорядочений (они пересекаются с другими вариантами введения порядка на основе различных соображений у различных авторов). ВФИ

1. По определению, F < G, если G−1 {F(x)} выпукла, причем F(0) = G(0) = 0 и G строго возрастает, а соответствующая случайная величина принимает значения из конечного промежутка. Это равноc сильно выпуклому порядку, обозначаемому F < G. Если существуют плотности, то равносильная формулировка такова:   r(F) F −1 (u)   r(G) G−1 (u)

не убывает по

на [0; 1].

u

ВСФИ

2. По определению F < G, тогда и только тогда, когда G−1 {F(x)} является звездообразной (star-shaped). Это эквивалентно звездно-упо∗ рядоченной (star-ordering) и обозначается F < G. 3. F супераддитивна (субаддитивна) относительно G [обозначается su su F < G(F > G)], если G−1 [F(x + y)]  ()G−1 [F(x)] + G−1 [F(y)] для всех x и y на носителе F. НЛС

4. По определению F < G, G−1 ∗ F(x) является супераддитивной. Это равносильно упорядочению по супераддитивности (см. 3) и также su обозначается F < G. Соотношение между этими упорядочениями выражается следующими импликациями ВФИ(c)

F < G⇒F

ВСФИ(∗)


0.

0 c

Arnold (1991) показал, что единственной функцией g(X), для которой g(X) L X для всех X, является функция

g(x) > 0 при всех x > 0,

если, кроме того, она монотонно не убывает при x  0, и g(x)/x монотонно не возрастает при x > 0. Аналогично, X L g(X) для всех X равносильно тому, что g(x) > 0 монотонно не убывает при всех x > 0, g(x)/x монотонно не убывает при всех x > 0. Arnold and Villase˜nor (1991) изучили упорядочение Лоренца порядковых статистик X1:n , X2:n , . . . , Xn:n в выборке объема n для некоторых конкретных распределений. Для стандартного равномерного распределения (см. гл. 26) авторы показали, что (33.56a) Xi+1 : n L Xi : n L Xi : n−1 , а также, что

Xn+2 : 2n+3 L Xn+1 : 2n+1 .

(33.56b)

В последних формулах мы изменили принятые выше обозначения, например, Xi : n означает функцию распределения порядковой статистики Xi : n . Соотношение (33.56b) справедливо для любого финитного симметричного распределения с носителем от 0 до c > 0. Тот же результат имеет место для степенного распределения (см. гл. 25) с функцией распределения  a x , 0  x  c , a > 0. FX (x) = c

Однако для распределения Парето с функцией распределения  −a x , c  x , a > 1, FX (x) = 1 − c

имеет место неравенство

Xi : n L Xi+1 : n ,

(33.57a)

противоположное по смыслу первому из неравенств (33.56a); кроме того, Xi : n L Xi+1 : n+1 .

(33.57b)

4. УПОРЯДОЧЕНИЕ И КЛАССИФИКАЦИЯ РАСПРЕДЕЛЕНИЙ

4.3.

575

Альтернативная стохастическая классификация упорядочений

В этом пункте мы перечислим другие типы упорядочений, начиная с естественного, но весьма ограничительного понятия стохастического порядка. Это понятие связано с другими типами упорядочений, часто встречающимися в литературе по теории надежности [см. например, Barlow and Proschan (1975, 1981)]. 1. Сейчас трудно установить, когда и где в теории вероятностей впервые упоминается понятие стохастического порядка. В качестве одной из первых ссылок в статистической литературе можно упомянуть работу van Zwet (1964). Напрашивающимся определением «F стохастически меньше G» (обозначается F st G) могло бы служить неравенство F(x)  G(x) при всех x. Однако общепринятое определение таково: F st G, если E[h(X) | FX (x) = F(x)]  E[h(X) | FX (x) = G(x)] при всех x

(33.58)

для любой неубывающей функции h(·). 2. F меньше (или равно) G по интенсивности (F har G), если F(x) G(x)

не возрастает по x ∈ [0, G−1 (1)].

В работе Keilson and Sumita (1992) это свойство названо положительным равномерным стохастическим упорядочением (positive uniform stochastic ordering). Имеется несколько равносильных определений: a. Для абсолютно непрерывных распределений F har G ⇔ r(F) (x)  r(G) (x). Заметим, что смысл неравенства меняется при переходе к опасности отказа. b. F har G ⇔ F TP2 G, где индекс TP2 означает полную положительность порядка 2, определяемую неравенством    F(x) F(y)    G(x) G(y)  0 при всех 0  x  y. c. F har G ⇔ F(x |x > y)  G(x | x > y) при всех 0  x  y, где F(x | x > y) = F(x + y)/F(y) и G(x | x > y) = G(x + y)/G(y) — условные функции распределения времени дожития. Заметим, что F har G ⇒ F st G. Подробности см. в статье Keilson and Sumita (1992). 3. Если существуют плотности f (x) = F  (x) и g(x) = G (x), то порядок по отношению правдоподобия (ОП) [likelihood ratio ordering (LR)],

576

ГЛАВА 33. РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЖИЗНИ И РАЗНООБРАЗНЫЕ УПОРЯДОЧЕНИЯ

обозначаемый F LR G имеет место, если f (t)/g(t) не убывает по t при t  0. Из F LR G следует, что при t2 > t1 f (t2 ) 

g(t2 )f (t1 ) . g(t1 )

Поэтому f (t)

r(F) (t) = ∞ t

f (x)dx

Следовательно,



f (t) ∞

{f (t)/g(t)}

t

g(t)

g(x)dx

= ∞ t

g(x)dx

= r(G) (t).

(33.59)

F LR G ⇒ F har G.

Обратное, заметим, неверно. 4. F стохастически менее (более) изменчиво, чем G [обозначается F V (V ) G] (stochastically less (more) variable than G), если E[h(X) | FX (x) = F(x)]  E[h(X) | FX (x) = G(x)]

(33.60)

для любой невозрастающей (неубывающей) выпуклой интегрируемой функции h(x), при этом E[X | FX (x) = F(x)]  () E[X | FX (x) = G(x)] [ср. с (33.58)]. Если E[X | FX (x) = F(x)] = E[X | FX (x) = G(x)], то (33.60) выполняется для всех выпуклых интегрируемых функций h(·) [Metzger and R¨uschendorf] (1991)]. Равносильным необходимым и достаточным условием выполнения неравенства F V G является ∞ ∞ F(t)dt  G(t)dt для всех x > 0. (33.61) x

x

Если F V G, то описательно можно сказать, что большие значения распределения F имеют меньший вес, чем распределения G. Metzger and R¨uschendorf (1991) замечают, что упорядочение по изменчивости есть комбинация чистого упорядочения по изменчивости и стохастического упорядочения st , где «чистое упорядочение по изменчивости» определяется неравенством 



(33.62) F x − E[X] | FX (x) = F(x) V G x − E[X] | GX (x) = G(x) . 5. Несколько авторов, в том числе Bickel and Lehmann (1976, 1979), Lewis and Thompson (1981), Oja (1981), Shaked (1982), Deshpande and Kochar (1983), Bartoszewicz (1985, 1986), Droste and Wefelmeyer (1985), Marzec and Marzec (1981a, b, 1993) рассматривают упорядочения по рассеянию и близкие упорядочения. D. J. Saunders (1984) отмечает, что упорядочение по рассеянию можно описать, сказав, что график одной из функций распределения везде «круче», чем другой; здесь определение «крутизны» дается в терминах обратной функции распределения (т. е. функции квантилей). Приведем точное определение, принадлежащее Lewis and

577

4. УПОРЯДОЧЕНИЕ И КЛАССИФИКАЦИЯ РАСПРЕДЕЛЕНИЙ

Thompson (1981). Распределение G имеет большее рассеяние, чем F (F disp G), если 



(33.63) G G−1 (α ) + a  F F −1 (α ) + a для всех a > 0 и 0 < α < 1. [F −1 (α ) = inf {t : F(t)  α }]. Deshpande and Kochar (1983) показали, что это определение равносильно выполнению неравенства G−1 (β ) − G−1 (α )  F −1 (β ) − F −1 (α ) при 0 < α < β < 1,

(33.63)

рассматриваемому как определение порядка в работе Saunders and Moran (1978) и Saunders (1978). По определению Lehmann (1966) F имеет более легкий хвост, чем G, если F −1 (β ) − F −1 (α ) M (33.64) −1 −1 G

(β ) − G

(α )

для некоторого M > 0 и всех 0 < α < β < 1. Равносильное определение ввел ранее Fraser (1957) в книге «Непараметрические методы» — первой книге по этой  определению F имеет более легкий хвост, чем G,  теме. По его если G−1 (F(x)) − x не убывает по x. Это получается, если в (33.63) положить α = F(x) и β = F(y) при x  y. Doksum (1969) ссылается на это определение и использует его при исследовании мощности тестов ранжирования, применяя термин «упорядочение по хвостам». Yanagimoto and Sibuya (1976) называют G стохастически более рассеянной величиной, чем F (stochastically more spread than F). Это же определение неявно использует Shaked (1982), рассматривающий абсолютно непрерывные распределения. Определение Shaked (1982) основано на числе перемен знака. Lynch, Mimmack and Proschan (1983) приводят следующее обобщение такого определения. Пусть S(x1, . . . , xn ) — число перемен знака в последовательности x1 , . . . , xn без учета нулей и S(f ) — число перемен знака функции f на (−∞, ∞), а именно, S(f ) = sup S[f (t1 ) , . . . , f (tm )], где супремум берется по всем m = 2, 3, . . . и любым t1 < t2 < · · · < tm . Обозначим теперь F(x−c) как Fc и S(Fc −G) как Sc для функций распределения F и G. Тогда имеем F disp G (для любого действительного c)

(33.65)

тогда и только тогда, когда (a) S(Fc − G)  1 и (b) если Sc = 1, то Fc − G меняет знак с минуса на плюс. Семейство гамма распределений с параметрами (α , β ) (см. гл. 17) при постоянном β упорядочено по параметру формы α . Чем больше параметр α , тем б´oльшим рассеянием обладает распределение. Barlow and Proschan (1975) описывают следующее упорядочение распределений времени жизни F и G [F(0) = G(0) = 0] в случае строгого возрастания функции G от 0 до 1 на конечном промежутке. c

a. F выпукло предшествует (convex-ordered) G (обозначается F 0. Barlow and Proschan (1975) получили результат, считающийся классическим: c ∗ su (33.68) F < G ⇒ F < G ⇒ F < G. su

Кроме того, F < G и F