Estatistica: Questoes Anpec [Concursos ed.]
 8535246584, 9788535246582

Table of contents :
Folha de Rosto
Créditos
Dedicatória
Agradecimentos
Autores da coleção
Prefácio
Apresentação
Sumário
Capitulo 1 - Probabilidade
Revisão de conceitos
Prova de 2006
Questão 3
Questão 12
Questão 13
Prova de 2007
Questão 1
Questão 13
Questão 14
Prova de 2008
Questão 1
Questão 8
Questão 12
Questão 13
Questão 14
Prova de 2009
Questão 2
Questão 3
Questão 4
Questão 5
Prova de 2010
Questão 3
Prova de 2011
Questão 3
Questão 7
Questão 9
Questão 15
Prova de 2012
Questão 4
Questão 5
Questão 13
Prova de 2013
Questão 2
Questão 6
Questão 9
Prova de 2014
Questão 3
Questão 7
Questão 12
Questão 15
Prova de 2015
Questão 2
Questão 4
Questão 5
Questão 10
Capitulo 2 - Principais Distribuições de Probabilidade
Revisão de conceitos
Prova de 2006
Questão 2
Questão 10
Prova de 2007
Questão 6
Prova de 2008
Questão 2
Prova de 2009
Questão 2
Questão 6
Questão 7
Prova de 2010
Questão 2
Questão 4
Questão 5
Questão 7
Questão 11
Prova de 2011
Questão 6
Prova de 2012
Questão 6
Questão 14
Questão 15
Prova de 2013
Questão 8
Prova de 2014
Questão 8
Prova de 2015
Questão 3
Questão 6
Questão 7
Questão 14
Capitulo 3 - Principais Teoremas de Probabilidade
Revisão de conceitos
Prova de 2006
Questão 5
Questão 14
Prova de 2007
Questão 11
Prova de 2008
Questão 3
Prova de 2009
Questão 8
Prova de 2010
Questão 4
Questão 5
Prova de 2011
Questão 4
Prova de 2012
Questão 9
Questão 10
Questão 13
Prova de 2013
Questão 7
Questão 11
Prova de 2015
Questão 11
Capitulo 4 - Inferência Estatística
Revisão de conceitos
Prova de 2006
Questão 4
Questão 5
Prova de 2007
Questão 2
Questão 11
Prova de 2008
Questão 3
Questão 4
Prova de 2009
Questão 8
Questão 9
Prova de 2010
Questão 4
Questão 5
Questão 6
Prova de 2011
Questão 1
Questão 4
Questão 6
Prova de 2012
Questão 1
Questão 2
Questão 9
Questão 10
Prova de 2013
Questão 3
Questão 7
Questão 15
Prova de 2014
Questão 9
Questão 11
Prova de 2015
Questão 12
Questão 15
Capitulo 5 - Análise de Regressão I: Modelos de Uma Equação
Revisão de conceitos
Prova de 2006
Questão 6
Questão 8
Questão 9
Prova de 2007
Questão 4
Questão 8
Questão 15
Prova de 2008
Questão 6
Questão 7
Questão 10
Prova de 2009
Questão 10
Questão 11
Questão 14
Prova de 2010
Questão 8
Questão 9
Questão 10
Questão 13
Questão 14
Prova de 2011
Questão 5
Questão 10
Questão 12
Questão 13
Questão 14
Prova de 2012
Questão 3
Questão 11
Questão 12
Prova de 2013
Questão 4
Questão 12
Questão 14
Prova de 2014
Questão 1
Questão 4
Questão 6
Questão 14
Prova de 2015
Questão 8
Questão 9
Questão 13
Capitulo 6 - Análise de Regressão II: Equações Simultâneas
Revisão de conceitos
Prova de 2006
Questão 7
Prova de 2007
Questão 12
Prova de 2009
Questão 12
Prova de 2010
Questão 15
Prova de 2011
Questão 2
Prova de 2014
Questão 13
Capitulo 7 - Séries Temporais
Prova de 2006
Questão 7
Questão 11
Questão 15
Prova de 2007
Questão 3
Questão 5
Questão 7
Questão 9
Prova de 2008
Questão 9
Questão 10
Questão 11
Questão 15
Prova de 2009
Questão 10
Questão 13
Questão 15
Prova de 2010
Questão 12
Prova de 2011
Questão 8
Questão 11
Prova de 2012
Questão 7
Questão 8
Prova de 2013
Questão 1
Questão 5
Questão 10
Questão 13
Prova de 2014
Questão 5
Questão 10
Capitulo 8 - Números-Índices
Revisão de conceitos
Prova de 2006
Questão 1
Prova de 2007
Questão 10
Prova de 2008
Questão 5
Prova de 2009
Questão 1
Prova de 2010
Questão 1
Prova de 2014
Questão 2
Prova de 2015
Questão 1
Gabarito
Referências Bibliográficas
Anexo

Citation preview

Carta ao Leitor

A necessidade de ter manuais como os que esta série desenvolveu é evidente para os candidatos do exame anual da ANPEC (Associação Nacional dos Centros de Pós-Graduação em Economia), cujo propósito é o ingresso nos programas de mestrado e doutorado stricto sensu em todo o Brasil. A identificação da lacuna sobre uma literatura complementar, então, surgiu da minha própria experiência como estudante. Na ocasião, não havia nenhuma referência bibliográfica (repito: complementar) aos livros-textos didáticos sobre questões resolvidas de provas anteriores. A vontade de fechar este gap tomou fôlego mais tarde, quando passei a lecionar em cursos preparatórios para esse exame. Havia, por parte dos alunos, tal como ocorria na minha época de estudante, uma busca por esse tipo de material, em razão do pouco tempo para estudar um conjunto tão vasto de disciplinas e ementas. A crescente demanda veio, de fato, acompanhada pelo surgimento de alguns livros, como o que esta série se propõe a fazer. Todos eram produzidos, porém (até 2001), de forma pontual: ora publicava-se um de micro, ora um de macro, ora um de estatística, ora um de matemática ou ora um de economia brasileira. Todos esses manuais, ressalte-se, foram preparados por professores competentes e dedicados. O que a “coleção ANPEC”, organizada por mim, tem, portanto, de diferente? Em primeiro lugar, esta série difere-se dos demais livros por se tratar da mais completa e atualizada versão de todos os manuais existentes. A coleção iniciou com a ANPEC 2002 (micro, macro, estatística/econometria e matemática) e segue até a ANPEC 2015. Em 2014 também foi incluída a obra Economia brasileira. Em segundo, porque essa não é apenas uma obra, mas uma coleção. Ou seja, é a primeira vez que as cinco provas são oferecidas em conjunto, todas estruturadas de forma homogênea e sob coordenação única. A harmonia das obras, indubitavelmente, organiza a mente daqueles que têm um prazo curto para seus estudos. Em terceiro, porque o nosso compromisso é fazer atualizações anuais e aperfeiçoamentos sistemáticos das versões anteriores, uma vez que o nosso objetivo final é o de facilitar os estudos e, consequentemente, o aproveitamento dos candidatos. Ainda que tenhamos nos empenhado em explicar didaticamente todos os 5 quesitos das 15 questões das provas dos últimos 14 anos (11 no caso de economia brasileira), erros remanescentes podem ocorrer e devem, assim, ser corrigidos para o melhor desempenho do aluno. Por último, e mais relevante, porque a equipe técnica foi escolhida de maneira criteriosa. Para isso, considerou-se não só a formação de excelência dos professores (dos 9 autores, 8 são doutores), mas também a experiência em sala de aula. A qualificação deste time é,

indiscutivelmente, uma das melhores do Brasil. Além disso, para facilitar ainda mais a jornada exigente de estudo dos alunos, cada um dos 5 volumes que compõem esta coleção está segmentado por temas, que se constituíram nos capítulos de cada livro. Elaboramos, também, tabelas temáticas e estatísticas para que o aluno possa identificar, ao longo do tempo, os conteúdos mais solicitados. O estudo, dessa forma, pode ser direcionado aos tópicos mais cobrados, a fim de aumentar sobremaneira as possibilidades de êxito do aluno. O destaque final é para o cuidado adicional da inclusão de adendos, explicações mais extensas e revisões das ementas, no caso de macro, em razão da literatura ser mais dispersa do que as outras matérias. Tudo isso, claro, para orientar a rotina de estudos do aluno. Cabe aqui uma ressalva. Em papel (ou seja, em cada obra) teremos a resolução das 10 últimas provas. As demais, estarão no site da editora. Com relação à quinta edição, consequentemente os exames ANPEC 2006 – ANPEC 2015 estão resolvidos nos livros. As demais provas (ANPEC 2002 – ANPEC 2005), no site. Com todo este conjunto de provas/soluções em mãos, não há dúvida de que o aluno que vem estudando pelos livros didáticos solicitados na bibliografia ANPEC estará muito mais bem preparado do que outro que não possua a coleção. É duro estudar, mas, certamente, vale muito a pena. E, neste caso, a nossa coleção ajuda consideravelmente. Desejo, assim, a você, leitor, um ótimo ano de estudo. Qualquer comentário, dúvida ou sugestão, por favor, escreva para o e-mail: [email protected]. Certamente você fará uma ótima contribuição para os futuros estudantes em deixar-nos saber a sua opinião. Será um prazer respondê-lo. Cristiane Alkmin J. Schmidt Organizadora

© 2015, Elsevier Editora Ltda. Todos os direitos reservados e protegidos pela Lei no 9.610, de 19/02/1998. Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser reproduzida ou transmitida sejam quais forem os meios empregados: eletrônicos, mecânicos, fotográficos, gravação ou quaisquer outros. Copidesque: Vânia Coutinho Santiago Revisão: Gabriel Pereira Editoração Eletrônica: SBNigri Artes e Textos Ltda. Epub: SBNigri Artes e Textos Ltda. Elsevier Editora Ltda. Conhecimento sem Fronteiras Rua Sete de Setembro, 111 – 16o andar 20050-006 – Centro – Rio de Janeiro – RJ – Brasil Rua Quintana, 753 – 8o andar 04569-011 – Brooklin – São Paulo – SP – Brasil Serviço de Atendimento ao Cliente 0800-0265340 [email protected] ISBN: 978-85-352-4658-2 ISBN (versão eletrônica): 978-85-352-4659-9 Nota: Muito zelo e técnica foram empregados na edição desta obra. No entanto, podem ocorrer erros de digitação, impressão ou dúvida conceitual. Em qualquer das hipóteses, solicitamos a comunicação ao nosso Serviço de Atendimento ao Cliente, para que possamos esclarecer ou encaminhar a questão. Nem a editora nem o autor assumem qualquer responsabilidade por eventuais danos ou perdas a pessoas ou bens, originados do uso desta publicação. CIP-BRASIL. CATALOGAÇÃO-NA-FONTE SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ

E82 5.ed.

Estatística: questões comentadas dos concursos de 2006 a 2015 / Cristiane Alkmin Junqueira Schmidt (org.). – 5. ed. – Rio de Janeiro: Elsevier, 2015. 368 p. (Questões / ANPEC) ISBN 978-85-352-4658-2

1. Estatística – Problemas, questões, exercícios. 2. Serviço público – Brasil – Concursos. I. Schmidt, Cristiane Alkmin Junqueira. II. Associação Nacional dos Centros de Pós-Graduação em Economia. III. Série. 15CDD: 519.5 19003 CDU: 591.2

Dedicatória Dedicamos esta série, composta por cinco volumes, à nossa querida Escola de Pós-Graduação em Economia (EPGE) da Fundação Getulio Vargas (FGV), sediada na cidade do Rio de Janeiro. De todos os ensinamentos adquiridos – tanto técnicos, como éticos –, talvez o mais importante tenha sido a busca honesta e constante pela excelência. Os autores

Agradecimentos Gostaríamos, em primeiro lugar, de agradecer ao ilustre economista Fabio Giambiagi por ter dedicado algumas importantes horas do seu escasso tempo a fim de orientar-nos nesta primeira publicação. Depois, agradecemos aos assitentes de pesquisas Camilla Alves Lima dos Santos, Daniel Asfora, Fernando Vieira, Iraci Matos, Janaina Ferreira Machado, João Lucas Thereze Ferreira, Laura Simonsen Leal, Luis Fabiano Carvalho, Nathan Joseph Canen, Pedro Scharth, Rafael Pinto, Reinan Ribeiro Souza Santos, Roberto Bandarra Marques Pires, Vinícius Barcelos que, de forma exemplar, colaboraram na célere digitação das questões e soluções, assim como na colaboração gráfica de todos os volumes. Por fim, agradecemos aos alunos dos cursos do CATE e da EPGE/FGV-RJ do ano de 2010 pelos comentários e sugestões. Quaisquer erros encontrados no material são de inteira responsabilidade dos autores.

Autores da coleção Autores desta obra: Rodrigo Leandro de Moura (Matemática e Estatística) é doutor e mestre em Economia pela Escola de Pós-Graduação em Economia da Fundação Getulio Vargas (EPGE/FGV-RJ) e bacharel em Economia pela Universidade de São Paulo (USP-RP). É pesquisador e professor na FGV, lecionando disciplinas de Estatística, Econometria, Economia do Trabalho, Microeconomia, além de já ter lecionado Estatística/Matemática preparatória para o exame da Anpec. Atualmente desenvolve estudos no IBRE/FGV nas áreas de mercado de trabalho, educação e regulação econômica (petróleo). Já realizou estudos para o IPEA sobre mercado de trabalho, educação e previdência. Já participou de congressos nacionais e internacionais e tem diversas publicações acadêmicas e capítulos de livros em coautoria com professores renomados, como James J. Heckman (Nobel de Economia), Flávio Cunha, Aloísio Araujo, Marcelo Neri e para a Organização Internacional do Trabalho (OIT) e já fez projetos para a Fundação Ayrton Senna, contribuindo para o Movimento Todos pela Educação. Rafael Martins de Souza (Estatística) é Doutor em Economia pela Escola de Pós-Graduação em Economia da Fundação Getulio Vargas (EPGE/FGV-RJ), Mestre em Ciências Estatísticas pela Universidade Federal do Rio de Janeiro (UFRJ) e Bacharel em Ciências Estatísticas pela Escola Nacional de Ciências Estatísticas ​(ENCE) do Instituto Brasileiro de Geografia e Estatística (IBGE). Atualmente trabalha como Coordenador de Pesquisa na Diretoria de Análise de Políticas Públicas (DAPP) da FGV. Anteriormente trabalhou no Grupo Libra como Econometrista e foi Pesquisador da ENCE, onde lecionou as disciplinas de Econometria, Modelos Lineares Generalizados e Métodos Não Paramétricos. Também foi professor de Análise Microeconômica e Econometria do IBMEC-Rio. Prestou serviço de consultoria em Estatística e Econometria a diversas empresas e instituições. Rafael tem experiência em modelagem econométrica de índices de inflação, indicadores de atividade econômica, análise de riscos financeiros, entre outras áreas. Participou de diversos congressos nacionais e internacionais e possuiu publicações em periódicos tais como a International Review of Financial Analysis e a Applied Economics. Autores das demais obras da série: Cristiane Alkmin Junqueira Schmidt (Microeconomia) tem mestrado e doutorado em ciências econômicas pela EPGE/FGV/RJ e foi visiting scholar na Universidade de Columbia (EUA) em 2013. É coordenadora e professora para MBAs da FGV/RJ e para o Global MBA de Manchester Business School, respectivamente. É parecerista da Revista de Direito Administrativo (RDA – FGV Direito Rio), coautora com Fabio Giambiagi do livro Macroeconomia para Executivos, organizadora e uma das autoras do compêndio de cinco livros intitulado Questões Anpec e economista do Itaú. No Brasil, foi secretária adjunta da Seae/MF, gerente geral de

assuntos corporativos da Embratel, representante da área internacional do Ibre/FGV e diretora do departamento econômico do Family Office do Grupo Libra. Além disso, foi consultora para empresas nacionais e organismos internacionais, como o Banco Mundial. No exterior, foi gerente estratégica junto ao board da Cementos Progreso e diretora executiva da ONG Pacunam, ambos na Guatemala; e foi diretora do departamento econômico da Compañia de Comércio e Exportación e diretora adjunta da Autoridade de Desenvolvimento Local, ambos em Porto Rico. Além disso, lecionou na América Central em escolas de prestígio regional. Paulo C. Coimbra (Microeconomia) é doutor (2009) e mestre (2003) em Economia pela Escola de Pós-Graduação em Economia da Fundação Getulio Vargas – RJ (EPGE/FGV-RJ) e é Bacharel em Ciências Econômicas (1990) pela Faculdade de Economia da Universidade Santa Úrsula (FE/USU). Atualmente exerce o cargo de Professor Adjunto na Faculdade de Economia da Universidade Federal de Juiz de Fora (FE/UFJF), atuando inclusive no Programa de PósGraduação em Economia Aplicada (PPGEA/UFJF). Sua larga experiência como docente, lecionando disciplinas de economia e finanças, inclui passagens em renomadas instituições como a Fundação Getulio Vargas (EPGE/FGV-RJ) e a Pontifícia Universidade Católica (PUC-RJ). Uma das linhas de pesquisa onde atua baseia-se na percepção de que a presença de incerteza (no sentido de Frank Knight) pode dificultar as escolhas dos agentes (quer sejam escolhas individuais, sob iterações estratégicas ou de portfólios), que o motiva a investigar os impactos da incerteza (ou ambiguidade) nas escolhas dos agentes. Suas linhas atuais de pesquisa concentramse nas áreas de economia e finanças, com ênfase em teoria econômica, economia matemática, microeconomia aplicada e finanças aplicadas. Desenvolvimento econômico, economia do trabalho, organização industrial e outros temas em finanças (destacadamente finanças comportamentais, finanças corporativas e modelos de apreçamento com o uso de derivativos) também fazem parte dos seus interesses de pesquisa. É articulista do Instituto Millenium e é colunista (sobre derivativos) do portal de notícias InfoMoney e do portal de finanças GuiaInvest e mantém o blog http://pccoimbra.blogspot.com, onde publica seus posts com temas ligados à economia e finanças. Bruno Henrique Versiani Schröder (Macroeconomia) é mestre em Economia pela Escola de Pós-Graduação em Economia da Fundação Getulio Vargas (EPGE/FGV-RJ) e bacharel em Ciências Econômicas pela UFRJ. Aprovado em concursos públicos, com destaque para os cargos de Técnico em Planejamento e Pesquisa do IPEA, Especialista em Regulação da ANCINE e Analista do Banco Central do Brasil. Professor do curso de Graduação em Economia da EPGE, leciona as disciplinas de Macroeconomia, Microeconomia, Finanças e Estatística/Econometria em cursos preparatórios no Rio de Janeiro. Laureado com o XIV Prêmio do Tesouro Nacional e o 31o Prêmio BNDES de Economia, atualmente, é docente em Economia, exerce o cargo de Especialista em Regulação da ANCINE e está prestes a começar suas funções no Banco Central do Brasil. Victor Pina Dias (Macroeconomia) é doutor e mestre em Economia pela Escola de PósGraduação em Economia da Fundação Getulio Vargas (EPGE/FGV-RJ) e bacharel em Ciências

Econômicas plea UFRJ. Foi aprovado nos seguintes​ concursos: Técnico de Nível Superior da Empresa de Pesquisa Energética, Analista do IBGE, Economista do BNDES e Analista do Banco Central do Brasil. Já lecionou em cursos preparatórios para a ANPEC. Atualmente, é professor de Macroeconomia do IBMEC/RJ e economista do BNDES. Jefferson D. Pereira Bertolai (Matemática) é doutor e mestre em Economia pela Escola de Pós-graduação em Economia da Fundação Getúlio Vargas (EPGE/FGV-RJ) e bacharel em Economia pela Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto, Universidade de São Paulo – FEARP/USP. Em 2013, tornou-se professor do Departamento de Economia da Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto, Universidade de São Paulo (FEARP/USP). É pesquisador em Teoria Monetária e Bancária e em Métodos Computacionais Recursivos em Macroeconomia. Lavinia Barros de Castro (Economia brasileira) é doutora em Economia pela UFRJ (2009) e doutora em Ciências Sociais pela UFRRJ (2006), com doutorado sanduíche na Universidade de Berkeley — Califórnia. Leciona economia brasileira em cursos de graduação do IBMEC desde 1999 e em cursos de MBA da Coppead, desde 2007. É economista do BNDES desde 2001, atualmente na área de pesquisa econômica. É co-organizadora e coautora, entre outros, do livro Economia Brasileira Contemporânea (1945-2010), vencedor do Prêmio Jabuti, 2005, com segunda edição lançada em 2011, pela Campus Elsevier. André Villela (Economia brasileira) é bacharel (UFRJ, 1989) e mestre (PUC-Rio, 1993) em Economia e Ph.D. em História Econômica pela Universidade de Londres (London School of Economics, 1999). Sua tese, intitulada “The Political Economy of Money​ and Banking in Imperial Brazil, 1850-70”, recebeu o Prêmio Haralambos Simeonides​, conferido pela ANPEC, em 1999. Desde 2001 é Professor Assistente da EPGE/FGV, onde leciona disciplinas na área de História Econômica para alunos da Graduação​. É co-organizador e coautor, entre outros, do livro Economia Brasileira Contemporânea (1945-2010), vencedor do Prêmio Jabuti, 2005, com segunda edição lançada em 2011, pela Campus Elsevier.

Prefácio Conheci Cristiane Alkmin J. Schmidt em 2000, quando, por indicação de Fernando Holanda Barbosa, a convidei para ser a coordenadora da área de produtos industriais da Secretaria de Assuntos Econômicos (SEAE) do Ministério da Fazenda, da qual eu era o titular. Egressa do curso de doutoramento da FGV/EPGE, por onde se titulou mais tarde, chamou-me a atenção sua energia, determinação, capacidade de organização e de atrair novos valores para trabalhar junto com ela, o que lhe rendeu um desempenho extraordinário em seu primeiro emprego, paralelamente ao de professora da graduação do curso de economia do IBMEC. E são estas qualidades de organização, coordenação e capacidade de atrair gente competente para trabalhar com ela que aparece neste livro de exercícios de estatística originário das provas da ANPEC que está sendo publicado com outros três (macroeconomia, microeconomia e matemática). Juntamente com dois experimentados professores de curso preparatório para concurso da ANPEC, Rodrigo Leandro de Moura e Rafael Martins de Souza, egressos da FGV/EPGE, Cristiane organizou as questões dos concursos da ANPEC por tópicos, facilitando em muito o trabalho de preparação dos alunos, à medida que o assunto vai sendo coberto nas aulas teóricas. Engana-se, entretanto, quem imagina ser a preparação de candidatos aos concursos da ANPEC a única serventia deste livro. Ele será certamente uma obra de referência para os professores dos cursos de graduação e de pós-graduação na escolha de seu material de ensino, na medida em que cada exercício contém uma explicação detalhada de sua solução. Será, portanto, útil para estes alunos como material de estudo, detalhadamente organizado, capaz de, adicionalmente, permitir ao estudante aferir a qualidade do curso em que está matriculado, já que o concurso da ANPEC é um dos mais abrangentes em termos de assunto coberto, além de ser extremamente concorrido. Claudio M. Considera Professor do Departamento de Economia da Universidade Federal Fluminense (UFF), ex-Secretário da SEAE/MF e ex-Diretor de Pesquisas do IPEA (Instituto de Pesquisa Econômica e Aplicada).

Apresentação Como Professor de Econometria da EPGE-FGV, tenho acompanhado as contínuas exigências aos alunos para o ingresso nos centros de pós-graduação em Economia no Brasil desde 1993. Pode-se perceber o crescente grau de exigência dos exames da ANPEC. Compreender a teoria é condição necessária para ingresso em um centro de excelência, mas não é condição suficiente. É também importante saber resolver problemas práticos com a devida rapidez, particularmente quando se trata de matérias das áreas quantitativas. O livro organizado por minha ex-aluna Cristiane Alkmin J. Schmidt se apresenta como um importante material de estudo para o exame da ANPEC. Não há no mercado um compêndio como este. Os autores se propuseram a revê-lo anualmente, incorporando os novos exames e melhorando o material anterior, o que recomenda não só a sua leitura hoje, como também no futuro. Devido ao material e à sua forma de abordagem, além de recomendá-lo aos economistas que venham a fazer o exame da ANPEC, recomendo-o também aos alunos de outros cursos e aos alunos de Economia que não pretendem fazer o concurso ANPEC, mas que desejam prestar concursos públicos de forma geral. Cristiane possui excelente formação quantitativa adquirida no curso de doutorado da EPGEFGV. É detalhista, assertiva e soube formar uma equipe de excelência, que trabalhou nesse livro. Além dela, há outros dois alunos da EPGE-FGV que participam do livro – Rodrigo Moura e Rafael Martins de Sousa. Esse grupo de excelentes ex-alunos da Escola não só tem formação teórica de alto nível como também tem experiência em sala de aula – fator fundamental para dar a didática necessária em um livro como esse. Parabéns pelo livro à organizadora e aos seus coautores. João Victor Issler Professor Titular de Economia da EPGE/FGV-RJ

Sumário

Carta ao Leitor Dedicatória Agradecimentos Autores da coleção Prefácio Apresentação Capitulo 1 - Probabilidade Revisão de conceitos Prova de 2006 Questão 3 Questão 12 Questão 13 Prova de 2007 Questão 1 Questão 13 Questão 14 Prova de 2008 Questão 1 Questão 8 Questão 12 Questão 13 Questão 14 Prova de 2009

Questão 2 Questão 3 Questão 4 Questão 5 Prova de 2010 Questão 3 Prova de 2011 Questão 3 Questão 7 Questão 9 Questão 15 Prova de 2012 Questão 4 Questão 5 Questão 13 Prova de 2013 Questão 2 Questão 6 Questão 9 Prova de 2014 Questão 3 Questão 7 Questão 12 Questão 15 Prova de 2015 Questão 2 Questão 4 Questão 5

Questão 10 Capitulo 2 - Principais Distribuições de Probabilidade Revisão de conceitos Prova de 2006 Questão 2 Questão 10 Prova de 2007 Questão 6 Prova de 2008 Questão 2 Prova de 2009 Questão 2 Questão 6 Questão 7 Prova de 2010 Questão 2 Questão 4 Questão 5 Questão 7 Questão 11 Prova de 2011 Questão 6 Prova de 2012 Questão 6 Questão 14 Questão 15 Prova de 2013 Questão 8

prova de 2014 Questão 8 prova de 2015 Questão 3 Questão 6 Questão 7 Questão 14 Capitulo 3 - Principais Teoremas de Probabilidade Revisão de conceitos Prova de 2006 Questão 5 Questão 14 Prova de 2007 Questão 11 Prova de 2008 Questão 3 Prova de 2009 Questão 8 Prova de 2010 Questão 4 Questão 5 Prova de 2011 Questão 4 Prova de 2012 Questão 9 Questão 10 Questão 13 Prova de 2013

Questão 7 Questão 11 Prova de 2015 Questão 11 Capitulo 4 - Inferência Estatística Revisão de conceitos Prova de 2006 Questão 4 Questão 5 Prova de 2007 Questão 2 Questão 11 Prova de 2008 Questão 3 Questão 4 Prova de 2009 Questão 8 Questão 9 Prova de 2010 Questão 4 Questão 5 Questão 6 Prova de 2011 Questão 1 Questão 4 Questão 6 Prova de 2012 Questão 1

Questão 2 Questão 9 Questão 10 Prova de 2013 Questão 3 Questão 7 Questão 15 Prova de 2014 Questão 9 Questão 11 Prova de 2015 Questão 12 Questão 15 Capitulo 5 - Análise de Regressão I: Modelos de Uma Equação Revisão de conceitos Prova de 2006 Questão 6 Questão 8 Questão 9 Prova de 2007 Questão 4 Questão 8 Questão 15 Prova de 2008 Questão 6 Questão 7 Questão 10 Prova de 2009

Questão 10 Questão 11 Questão 14 Prova de 2010 Questão 8 Questão 9 Questão 10 Questão 13 Questão 14 Prova de 2011 Questão 5 Questão 10 Questão 12 Questão 13 Questão 14 Prova de 2012 Questão 3 Questão 11 Questão 12 Prova de 2013 Questão 4 Questão 12 Questão 14 Prova de 2014 Questão 1 Questão 4 Questão 6 Questão 14

Prova de 2015 Questão 8 Questão 9 Questão 13 Capitulo 6 - Análise de Regressão II: Equações Simultâneas Revisão de conceitos Prova de 2006 Questão 7 Prova de 2007 Questão 12 Prova de 2009 Questão 12 Prova de 2010 Questão 15 Prova de 2011 Questão 2 Prova de 2014 Questão 13 Capitulo 7 - Séries Temporais Prova de 2006 Questão 7 Questão 11 Questão 15 Prova de 2007 Questão 3 Questão 5 Questão 7 Questão 9

Prova de 2008 Questão 9 Questão 10 Questão 11 Questão 15 Prova de 2009 Questão 10 Questão 13 Questão 15 Prova de 2010 Questão 12 Prova de 2011 Questão 8 Questão 11 Prova de 2012 Questão 7 Questão 8 Prova de 2013 Questão 1 Questão 5 Questão 10 Questão 13 Prova de 2014 Questão 5 Questão 10 Capitulo 8 - Números-Índices Revisão de conceitos Prova de 2006

Questão 1 Prova de 2007 Questão 10 Prova de 2008 Questão 5 Prova de 2009 Questão 1 Prova de 2010 Questão 1 Prova de 2014 Questão 2 Prova de 2015 Questão 1 Gabarito Referências Bibliográficas Anexo Notas

1

Probabilidade

REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Conjuntos Definição. Se A e B são mutuamente exclusivos, então A ∩ B = Ø. Propriedade. Lei DeMorgan (Ac ∩ Bc) = (A B)c Função Densidade Teorema. Se X for uma v.a. contínua, com densidade f(x) > 0, a < x < b, então Y = h(X) tem densidade dada por:

Momentos Incondicionais e Condicionais Propriedade. Cov (X,Y) = E (XY) – E (X) E (Y), Var (X) = E (X2) – E2 (X), Var (aX ± bY) = a2Var (X) + b2Var(Y) ± 2abCov(X,Y), Cov (aX + b, cY + d) = acCov (X,Y), em que, X e Y são variáveis aleatórias e a, b, c, d são constantes. Prova. Provando primeiro a propriedade da covariância: Cov(X, Y) = E{[X – E(X)][Y – E(Y)]} = E[XY – XE(Y) – E(X)Y + E(X)E(Y)] = E(XY) – E[XE(Y)] – E[E(X)Y] + E[E(X)E(Y)] = E(XY) – E(Y)E[X] – E(X)E[Y] + E(X)E(Y)] onde utilizamos o fato de que: (i) em E[XE(Y)], E(Y) é uma constante dentro dos colchetes (ou seja, a média após calculada se torna uma constante) e, portanto, podemos passar o número E(Y) para fora dos colchetes, deixando apenas X dentro; (ii) em E[E(X)Y] vale analogamente a mesma estratégia; e (iii) em E[E(X)E(Y)], E(X) e E(Y) são médias que também se tornam constantes, tal que o produto de constantes é da mesma forma uma constante e, consequentemente, a média de uma constante é a própria constante. Assim:

Cov(X, Y) = E(XY) – E(Y)E[X] – E(X)E[Y] + E(X)E(Y) Cov(X, Y) = E(XY) – E(X)E(Y) Se fixarmos Y = X, temos a versão desta propriedade para a variância, ou seja: Cov(X, X) = E(X . X) – E(X)(X) Var(X) = E(X2) – (E(X))2 Assim, vamos calcular Var(aX + bY), a qual pode ser escrita, de acordo com a propriedade acima, como: Var(aX + bY) = E[(aX + bY)2] – [E(aX + bY)]2 = E[a2 X2 + 2abXY + b2 Y2] – [E(aX) + E(bY)]2 Usando o fato de que E(kz) = kE(Z) (ou seja, quando multiplicamos uma variável por uma constante, a sua média também é multplicada por esta mesma constante), seja Z = X, Y, XY, X2 ou Y2 e k = a, b, ab, a2 ou b2, temos que:

Para provar que Var(aX-bY), basta fixar –b = c e usar a expressão acima: Var(aX+cY) = a2Var(X) + c2Var(Y) + 2acCov(X,Y). Substituindo de volta c = –b: Var(aX-bY) = a2Var(X) + b2Var(Y) – 2abCov(X,Y). Para provar a última propriedade utilizar a primeira propriedade já provada,

Lei das Expectativas Iteradas (LEI). EX[E(Y | X ) ] = E[Y].

, vamos .

Uma prova dela para o caso de variáveis aleatórias contínuas segue adiante:

O subscrito X é para não deixar dúvida de que está se tomando a segunda expectativa sobre o suporte de X. A prova é análoga para o caso discreto, substituindo as integrais pelos somatórios. A propriedade (teorema) da Identidade da Variância Condicional é definida para duas variáveis aleatórias, X e Y, quaisquer, como: Var(X) = EY[Var(X | Y)] + VarY[E(X | Y)] ou simplesmente Var(X) = E[Var(X | Y)] + Var[E(X | Y)] Propriedade. V(Y | X) = E(Y² | X) – [E(Y | X)]² Prova: A variância condicional é definida como: Var(Y | X) = E[(Y – E(X | Y))2 | X] = E{(Y2 – 2YE(Y | X) + [E(Y | X)]2 | X} = E(Y2 | X) – 2E{YE(Y | X) | X} + E{[E(Y | X)]2 | X} = E(Y2 | X) – 2E(Y | X)E{Y | X} + [E(Y | X)]2 onde utilizamos o fato de que: (i) em E{YE(Y | X) | X}, E(Y | X) é uma função que depende dos valores que X assume e não dos valores que Y assume, e, portanto, como a esperança E{YE(Y | X) | X} é sobre o suporte de Y, E(Y | X) é uma constante nesta operação e pode ser passada para fora e; (ii) em E{[E(Y | X)]2 | X} vale o mesmo raciocínio, e, portanto, é uma constante e a média (sobre o suporte de Y) será a própria constante. Assim: Var(Y | X) = E(Y2 | X) – 2[E(Y | X)]2 – [E(Y | X)]2 Var(Y | X) = E(Y2 | X) – [E(Y | X)]2 Definição. A correlação entre X e Y é dada por:

Propriedade.

Prova: Pela definição de correlação temos:

Encontrando a covariância e as variâncias: Cov(aX + b, cY + d) = acCov(X,Y) Var(aX + b) = a2Var(X) Var(cY + d) = c2Var(Y) E substituindo na expressão da correlação, temos que:

Desigualdade de Jensen Teorema: Seja X uma variável aleatória e g(.) uma função côncava, então:

Caso contrário, se a função for convexa:

Probabilidade Condicionada e Independência Probabilidade condicional A probabilidade condicional é a probabilidade de ocorrência de um evento dada a ocorrência de outro evento. O exemplo clássico é o do jogo de dados não viciados: suponhamos que o evento A seja definido como a face do dado ser 3. Nesse caso, a probabilidade do evento A sem qualquer condicionalidade é 1/6 (o número de faces com número 3, dividido pelo total de faces). Acrescentemos agora que saibamos que ocorreu o evento B que é definido como “sair número ímpar”. Nesse caso, restringimos o nosso universo para três faces e a probabilidade do evento A ocorrer aumenta para 1/3. Mais precisamente, podemos denotar a probabilidade condicional como sendo:

Regra de Bayes Para todo evento B tal que P(B) > 0 e uma dada partição do espaço amostral (A1, ..., An), temos que:

Lei da Probabilidade total Seja

partição de um conjunto de eventos U. Considere o evento B

U. Então:

Ou, equivalentemente:

Definição. Dois eventos A e B são independentes quando: P(A ∩ B) = P(A)P(B) ou P(A | B) = P(A) Proposição. Se A e B são eventos independentes, logo, os seguintes pares são também independentes:

(a) A e Bc, (b) Ac e B, (c) Ac e Bc. Provando o item a. Note que o conjunto B pode ser escrito como: A = (A ∩ B) (A ∩ Bc), sendo estes 2 conjuntos disjuntos. Então: P(A) = P(A ∩ B) + P(A ∩ Bc) P(A ∩ Bc) = P(A) – P(A ∩ B) P(A ∩ Bc) = P(A) – P(A)P(B) P(A ∩ Bc) = P(A)(1 – P(B)) P(A ∩ Bc) = P(A)P(Bc) onde, na terceira linha, usamos o fato de A e B serem independentes implicar P(A ∩ B) = P(A)P(B). Logo, P(A ∩ Bc) = P(A)P(Bc) implica que os eventos A e Bc são, necessariamente, independentes. Proposição. Sejam A, B e C três eventos quaisquer. Então se A, B e C são independentes, então: P(A ∩ B ∩ C) = P(A)P(B)P(C) Além disso, se A, B e C são dois a dois independentes, ou seja, se vale: P(A ∩ B) = P(A)P(B), P(A ∩ C) = P(A)P(C) e P(B ∩ C) = P(B)P(C), e se vale: P(A ∩ B ∩ C) = P(A)P(B)P(C) então, A, B e C são independentes. Definição. X e Y são variáveis independentes se, e somente se: f (x) = f (x | y) ou: f (x , y) = f (x) f (y) Propriedade. Se X e Y são independentes, então Cov(Y, X) = 0. Se W e Z são independentes, e X = g(A) e Y = g(B), ou seja, X e Y são funções dos eventos A e B, então X e Y são também independentes e, portanto, não correlacionados. Teorema. X e Y independentes se, e somente se, E(Y|X) = E(Y).

Prova. Provando que independência entre X e Y implica E(Y | X) = E(Y), para o caso contínuo:

Como X e Y são independentes, vale f(y, x) = f (y) f(x). Substituindo acima:

Provando a volta: E(Y | X) = E(Y) implica também uma hipótese de independência entre Y e X, pois a expressão: E(Y | X) = 0 utilizando a LEI (Lei das Expectativas Iteradas) pode ser escrita como: E[E(Y | X)] = E[0] E(Y) = 0 Assim, para o caso contínuo, podemos escrever que:1

Podemos resolver as integrais por partes:

Assim, de forma análoga para a integral ∫yf'(y)dy, podemos substituir, na expressão acima,

e obter:

Logo, Y e X são independentes. Propriedade Se A e B são mutuamente exclusivos e exaustivos, temos que A ∩ B = e A B = S, onde S é um espaço amostral. Uma propriedade é que quando P(A) > 0 e P(B) > 0, então: (i) Se A e B são mutuamente exclusivos, eles não podem ser independentes.​ (ii) Se A e B são independentes, eles não podem ser mutuamente exclusivos. Vamos provar o item i, por contradição.2 Suponha que A e B são mutuamente exclusivos, mas são independentes. Logo: Pr(A ∩ B ) = Pr(A)Pr(B), por serem independentes. Como são mutuamente exclusivos, sabemos que (A ∩ B ) = . Assim: Pr(A ∩ B ) = Pr() = 0 implicando que: Pr(A)Pr(B) = 0 contradição com o fato de que: P(A) > 0 e P(B) > 0. Logo, prova-se que, quando P(A) > 0 e P(B) > 0, se A e B são mutuamente exclusivos, eles não podem ser independentes.

PROVA DE 2006 Questão 3 Julgue as afirmativas. Em uma função densidade de probabilidade conjunta f(x,y), para as variáveis aleatórias contínuas X e Y: Ⓞ A função densidade de probabilidade marginal de X é:

.

① Se F(y) é a função distribuição de probabilidade marginal de Y, então f(y) = dF(y)/dy, para F(y) derivável em todo o y. ② X e Y serão independentes se f(x) = f(x | y). ③ EX[E(Y | x ) ]= E[Y]. ④ Se X e Y são independentes, VY [E(X | y ) ]= V[X].

Resolução: (0) Falsa. A densidade marginal de X é obtida através de:

.

(1) Verdadeiro. Afirma-se corretamente que F deve ser diferenciável em todo domínio (para y), ou seja, F D1. Valendo tal condição, podemos obter a função densidade de probabilidade diferenciando a função densidade acumulada (também chamada função distribuição). (2) Verdadeira. Esta é a definição de independência enunciada na Revisão de Conceitos. (3) Verdadeira. Lei Enunciada e provada na Revisão de Conceitos. (4) Falsa. Conforme enunciado na Revisão de Conceitos, a propriedade (teorema) da Identidade da Variância Condicional é definida para duas variáveis aleatórias, X e Y, quaisquer, como: Var(X) = EY[Var(X | Y)] + VarY[E(X | Y)] ou simplesmente Var(X) = E[Var(X | Y)] + Var[E(X | Y)] O subscrito Y é para reforçar que a operação fora dos colchetes é sobre o suporte de Y. O que, às vezes, pode ser confundido é: o segundo termo não seria zero, pois E(X | Y) é uma constante? Cuidado, pois esta expectativa depende da densidade condicional f (x | y) a qual é uma função de x e y. E, consequentemente, a variância não será necessariamente zero. (A não ser que a densidade condicional resultante, f(x | y), não dependa de y.) Assim, se X e Y são independentes, não necessariamente teremos que E[Var(X | Y)] = 0, ou seja, Var(X | Y) = 0 (o que implicaria Var(X) = VarY[E(X | Y)]). O que sabemos é que, como X e Y são independentes, então E(X | Y) = E(X), pois:

onde, na terceira igualdade, utilizamos o fato de X e Y serem independentes. O mesmo vale para Var(X | Y) = Var(X), pois: Var(X | Y) = E(X2 | Y) – E(X | Y)2 = ∫ x2 f(x | y)dx – E(X)2 = ∫ x2 f(x)dx – E(X)2 = E(X2) –E(X)2 = Var(X). Assim, podemos escrever o teorema acima, para X e Y independentes, como:

Var(X) = EY[Var(X | Y)] + VarY[E(X | Y)] ou simplesmente Var(X) = EY[Var(X)] + VarY[E(X)] Em relação ao último termo, VarY[E(X)], note que E(X) não depende de y; neste caso, temos que VarY[E(X)] = 0, pois E(X) é uma constante. Uma prova disso é:

onde, na penúltima igualdade, usamos o fato de que: ∫ f (y)dy = 1. Substituindo de volta, na expressão acima de Var(X), podemos afirmar que: Var(X) = EY[Var(X)] = EY[Var(X | Y)] Logo, a afirmação é falsa.

Questão 12 Em uma região, 25% da população são pobres. As mulheres são sobrerrepresentadas neste grupo, pois constituem 75% dos pobres, mas 50% da população. Calcule a proporção de pobres entre as mulheres. Multiplique o resultado por 100 e omita os valores após a vírgula.

Resolução: Para simplificar a notação, utilizaremos as seguintes abreviações: P = Pobre, M = Mulher​. Assim, pela definição de probabilidade condicional: . Podemos escrever o numerador também de outra forma: .

Substituindo de volta na primeira equação obtemos: .

Omitindo os valores após a vírgula, a resposta será 37.

Questão 13 Seja X uma variável aleatória contínua com função densidade:

Calcule Prob(1 ≤ X ≤ 2). Multiplique o resultado por 100 e desconsidere os valores após a vírgula.

Resolução: Para responder a questão, primeiramente devemos obter o valor de k. Para isso, usaremos o fato de que:

Assim:

Desconsiderando os valores após a vírgula a resposta será 33.

PROVA DE 2007 Questão 1 Sejam X, Y e Z três variáveis aleatórias. Julgue as proposições: Ⓞ E(E (Y | X )) = E(X) ① Se Y = cX, então Var(Y) = c² Var(X) ② Var (X + Y) = Var (X) + Var(Y) + 2Cov(X, Y) ③ Se Z = X² + Y, então E(Z | X ) = 0 ④ Se Z = X² + Y, então E(ZX) = 0

Resolução: (0) Falsa. O correto seria E[E(Y | X)] = E(Y), que é a LEI. Ver explicação enunciada na Revisão de Conceitos. (1) Verdadeira. Propriedade da Variância, já enunciada na Revisão de Conceitos.

Seja: Var(aX ± bY) = a2Var(X) + b2Var(Y) ± 2abCov(X , Y) Se Y = 0 e a = c, então: Var(aX) = c2Var(X) + b2Var(0) ± 2abCov(X , 0) A variância de uma constante é zero, ou seja, Var(0) = 0 e a covariância entre uma variável e uma constante também é zero, ou seja, Cov(X , 0) = 0. Assim: Var(cX) = c2Var(X) Desse modo, a constante dentro da variância pode sempre ser passada para fora elevando-a ao quadrado. Uma outra prova desta propriedade seria utilizar a propriedade da variância: Var(cX) = E[(cX)2 – [E (cX)]2 = E[c2 X2] – [E (cE(X)]2 = c2E[X2] – c2[E(X)]2 = c2{E[X2] – [E(X)]2} = c2 Var(X) (2) Verdadeira. Enunciado na Revisão de Conceitos. (3) Falsa. Se Z = X2 + Y E(Z | X) = E(X2 | X) + E(Y | X) = X2 + E(Y | X), onde na segunda igualdade utilizamos a propriedade E(g(X)h(Y) | X) = g(X)E(h(Y) | X). Assim, E(Z | X) não será necessariamente igual a zero. (4) Falsa. Se Z = X2 + Y E(ZX) = E(X3 + XY) = E(X3) + E(XY) que não é necessariamente igual a zero.

Questão 13 Um jogador tem R$2.000,00, aposta R$1.000,00 de cada vez e ganha R$1.000,00 com probabilidade 0,5. Ele para de jogar se perder os R$2.000,00 ou ganhar R$4.000,00. Qual é a probabilidade de que ele perca todo o seu dinheiro após no máximo 5 rodadas de jogo? Multiplique o resultado por 8.

Resolução: Esta questão pode ser resolvida montando a “árvore” do jogo, conforme mostrado a seguir. Mas note que o jogador só pode perder todo seu dinheiro uma vez na segunda jogada ou duas vezes na quarta jogada.

Assim, a P(de perder todo dinheiro) = (0.5)2 + (0.5)4 + (0.5)4 = 0.375. Multiplicando tal resultado por 8 obtemos: 0.375 × 8 = 3, que é o resultado pedido.

Questão 14 No começo do dia, uma máquina de refrigerantes armazena um montante aleatório Y de líquido (medido em galões). No decorrer do mesmo dia, um montante aleatório X é descartado pela máquina. Como a máquina não é carregada, X ≤ Y. A distribuição conjunta de X e Y é:

Calcule a probabilidade de que menos de meio galão seja descarregado no decorrer de um dia, dado que a máquina contém um galão no início do mesmo dia. Multiplique sua resposta por 100.

Resolução: Primeiro, devemos obter a densidade marginal de y:

Assim, a densidade condicional será:

.

Logo:

Multiplicando o resultado por 100 obtemos o valor de 50.

PROVA DE 2008 Questão 1 Julgue as alternativas que se seguem. Se X e Y são duas variáveis aleatórias: Ⓞ V(Y | X) = E(Y² | X) – [E(Y | X)]². ① Se E(Y) = E(X) = E(YX) = 0, então E(Y | X) = 0. ② V(Y) > V(Y | X) se Y e X forem linearmente dependentes. ③ Se E(Y | X) = b0 + b1X, então E(Y) = b0. ④ Se E(Y | X) = b0 + b1X +b2Z e Y = b0 + b1X +b2Z + u, em que u é uma variável aleatória, então E(u | X) = 0.

Resolução: (0) Verdadeira. Propriedade enunciada na Revisão de Conceitos. (1) Falsa. A afirmação E(Y) = E(X) = E(YX) = 0 implica que Cov(Y, X) = 0, ou seja, Y e X são não correlacionados. Isso implicará independência (que por sua vez implica E(Y | X) = E(Y) – prova dada na Revisão de Conceitos) somente se Y e X forem normais. E aí teríamos E(Y | X) = E(Y) = 0 pois afirma-se no início que E(Y) = 0. (2) Verdadeira. Se Y e X são linearmente dependentes, ou seja: Y = aX + b + ε, a ≠ 0 onde, E(ε | X) = 0 E(εX) = 0 Var(ε | X) = Var(ε) Então:

ou seja, Var(X | X) = 0, pois quando condicionamos em X, este se torna fixo, isto é, como uma constante. Logo: Var(Y) > Var(Y | X) (3) Falsa.

(4) Falsa. Y = b0 + b1X +b2Z + u E(Y | X) = b0 + b1X + b2E(Z | X) + E(u | X) = b0 + b1X + b2Z E(u | X) = b2(Z – E(Z | X))

Questão 8 Sejam X, Y e Z variáveis aleatórias não negativas. Julgue as afirmativas: Ⓞ Se X > Y, então, E(X | Z) > E(Y | Z). ① (cov(X, Y))² ≤ var(X)var(Y). ② Se Z = X + Y, então, corr(Z, X) = corr(Y, X). ③ Se W 1 e W 2 são variáveis aleatórias de Bernoulli, independentes, com P(W 1)=P(W 2)= p, Z é uma variável aleatória com distribuição binomial em que Z = W 1 + W 2. ④ Se F(Y) = 1 – e-y, y ≥ 0, P(Y > 3| Y > 1) = P(Y > 2).

Resolução: (0) Falsa. Note que:

Mesmo que X > Y, Z pode assumir algum valor específico z tal que f(y | z) = f (x | z) = 0, o que implica que E(X | Z = z) = E(Y | Z = z) = 0. Assim, a afirmativa E(X | Z) > E(Y | Z) não é válida para todo z. (1) Verdadeira. Sabemos que:

Elevando ao quadrado teremos:

(2) Falsa. Se: Z=X+Y Então: E(Z) = E(X) + E(Y) ZX = X2 + XY E(ZX) = E(X2) + E(XY) Logo: Cov(Z, X) = E(ZX) – [E(Z)E(X)] = E[(X + Y)X] – E[(X + Y)E(X)] = E(X2 + XY) – E(X + Y)E(X) = E(X2) + E(XY)– [E(X) + E(Y)]E(X) = E(X2) + E(XY)– [E(X)]2 – E(X)E(Y) = Cov(X, Y) + Var(X) De forma que:

(3) Verdadeira. Veja o capítulo referente às Principais Distribuições de Probabilidade. (4) Verdadeira. .

Mas P(Y > 3, Y > 1) = P(Y > 3) + P(Y > 1) – P(Y > 1) = P(Y > 3). Assim:

Questão 12 Duas variáveis aleatórias X e Y são conjuntamente distribuídas de acordo com a função de densidade:

Calcule P(0 < Y < ¼ | X = ½). Multiplique o resultado por 100 e despreze os decimais.

Resolução: Primeiro devemos obter a densidade condicional f(y | x), pois calcularemos uma probabilidade condicional. Primeiramente, f(x):

Para x = 1/2:

Assim:

e, multiplicando por 100, obtemos 25.

Questão 13 Uma seguradora verificou que, se um motorista acidentou o carro no ano de 2005, a probabilidade de que ele repita o acidente em 2006 é de 60%; e que se ele não acidentou o carro em 2005, a probabilidade de que isso aconteça em 2006 é de 30%. Assuma que as probabilidades sejam estáveis ao longo do tempo. Pergunta-se: Tendo o motorista se acidentado em 2005, qual a probabilidade de que ele venha a se acidentar novamente em 2007? Multiplique o resultado por 100.

Resolução: Chame de A de “acidente” e NA de “não houve acidente”. Dado que o acidente ocorre em 2005, todos os eventos possíveis serão: A06 – A07 NA06 – A07 A06 – NA07 NA06 – NA07 onde, por exemplo, A06 representa que houve acidente em 2006. A probabilidade pedida se refere aos dois primeiros eventos, assim: PR(A07 | A05) = PR(A06 e A07 | A05) + PR(NA06 e A07 | A05) Analisando cada um dos termos do lado direito: Como as probabilidades são estáveis ao longo do tempo – por exemplo – Pr(A07 | A06 e A05) = Pr(A07 | A06) –, então o fato de ter ocorrido acidente em 2005 não afeta a probabilidade de ocorrer acidente em 2007, dado que ocorreu em 2006. Assim: Pr(A07 | A06 e A05) = Pr(A07 | A06), e usando na expressão abaixo:

O mesmo raciocínio é válido para Pr(NA06 e A07 | A05) e, portanto:

Substituindo de volta na expressão acima:

Observação: Montando a árvore do jogo, conforme figura abaixo, a linha em negrito é a probabilidade pedida no enunciado, que será: 0.62 + 0.4 0.3 = 0.48

Questão 14 Empresas, em certa região, contam com duas linhas de financiamento: uma com taxa de 5%a.a. e outra com taxa de 20%a.a., dependendo do histórico de crédito. Sabe-se que 1/3 das empresas pagam juros de 5%. Destas, metade é familiar. No grupo de empresas que paga 20%, metade é familiar. Pergunta-se: Qual a taxa de juros média (em %a.a.) paga pelas empresas familiares naquela região? (desconsidere os decimais).

Resolução: Note que a média deve ser feita entre as firmas familiares. Para a taxa de juros de 5%, 1/3 do total das empresas paga esta taxa de juros, e, destas, 1/2 é familiar. Logo, estas firmas familiares, que pagam 5%, representam 1/6 do total. Para a taxa de juros de 20%, 2/3 do total das empresas pagam esta taxa de juros, e, destas, 1/2 é familiar. Logo, estas firmas familiares, que pagam 20%, representam 2/6 do total. Para restringirmos o universo das empresas familiares, devemos normalizar os pesos, ou seja, para o cálculo da média, o primeiro grupo terá o peso de (1/6)/(1/6 + 2/6) = 1/3. O segundo grupo terá peso (2/6)/(1/6 + 2/6) = 2/3. Assim, a média será:

Observação: Outra forma de se fazer é:

ou seja, a probabilidade das firmas pagarem 5% de juros é 1/3. Chamando F de empresas familiares, teremos:

que é a probabilidade de uma firma pagar 5%, dado que é do grupo familiar, obtida a partir das outras probabilidades mostradas no enunciado, sendo que Pr(F) é a probabilidade de uma firma ser familiar. Podemos, analogamente, obter também:

que é a probabilidade de uma firma pagar 20%, dado que é do grupo familiar, obtida a partir das outras probabilidades mostradas no enunciado. As probabilidades (mesmo as condicionais)

devem somar 1, ou seja:

Para obter a taxa de juros média paga pelas empresas familiares, temos que tomar a média apenas entre tais empresas:

PROVA DE 2009 Questão 2 Sobre a Teoria das Probabilidades, indique as alternativas corretas e falsas: Ⓞ Sejam 3 eventos A, B e C. Então, podemos demonstrar que P(A | B) = P(C | B)P(A | B ∩ C) + P(C | B)P(A | B ∩ C), assumindo que todos os eventos têm probabilidade positiva. ① Se dois eventos A e B são independentes, os eventos A e B não serão necessariamente independentes. ② Se A, B e C são três eventos, tais que A e B são disjuntos, A e C são independentes e B e C são independentes, e supondo-se que 4P(A) = 2P(B) = P(C) e P(A B C) = 5P(A), pode-se dizer que P(A) = 1/6. ③ Se uma família tem exatamente n crianças (n ≥ 2), e assumindo-se que a probabilidade de que qualquer criança seja menina é igual a 1/2 e todos os nascimentos são independentes, pode-se afirmar que, dado que a família tem, no mínimo, uma menina, a probabilidade da mesma ter, no mínimo, um menino, é igual a (1 – (0,5)n–1)/(1 – (0,5)n). ④ Se A, B e C são eventos com probabilidade não nula, definidos em um espaço amostral S, então P(A ∩ C | B ∩ C) = P(A ∩ B | C) / P(B | C).

Resolução: O item (3) está resolvido no capítulo Principais Distribuições de Probabilidade. (0) Verdadeira. Note que o lado direito de P(A | B) = P(C | B)P(A | B ∩ C) + P(C | B)P(A | B ∩ C ), pode ser escrito como:

Note que (A ∩ B ∩ C) e (A ∩ B ∩ C) são disjuntos e sua união é igual a (A ∩ B). Logo, P(A ∩ B) = P[(A ∩ B ∩ C) (A ∩ B ∩ C)] = P(A ∩ B ∩ C) + P(A ∩ B ∩ C) Substituindo esta expressão, teremos: ,

então, provamos que o lado direito da expressão apresentada no item se iguala ao lado esquerdo. (1) Falsa. Proposição enunciada e provada na Revisão de Conceitos. (2) Verdadeira. Note que: P(A B C) = P(A) + P(B) + P(C) – P(A ∩ C) – P(B ∩ C) Faça um diagrama de Venn e note que, como A e B são disjuntos, não é necessário descontar a dupla contagem quando somamos as probabilidades de cada evento. Assim: P(A B C) = P(A) + P(B) + P(C) – P(A)P(C) – P(B)P(C) 5P(A) = P(A) + 2P(A) + 4P(A) – P(A)4P(A) – 2P(A)4P(A) P(A)[2 – 12 P(A)] = 0 P(A) = 1/6 ou P(A) = 0 Então, podemos dizer que P(A) = 1/6. (4) Verdadeira. Pela definição de probabilidade condicional:

Questão 3 Considere duas variáveis aleatórias X e Y. Suponha que X seja distribuída de acordo com a seguinte função de densidade:

Suponha ainda que

Calcule E(Y). Multiplique o resultado por 100.

Resolução: Para calcular E(Y), vamos usar a Lei das Expectativas Iteradas (LEI):

Questão 4 A roleta é um jogo bastante popular em cassinos. Uma roleta típica possui 18 valores vermelhos, 18 verdes e 2 pretos. Suponha que para entrar no jogo um apostador deva pagar R$2 a cada rodada, ganhando 0,50 caso o resultado da jogada seja vermelho, R$1 caso o resultado seja verde, R$10 caso seja preto. Qual é o lucro líquido do apostador após 100 jogadas? Multiplique por 76 e some 100 ao resultado.

Resolução: Anulada. Possivelmente por dois motivos: 1) A questão deveria mencionar o lucro líquido esperado. O lucro líquido é uma variável aleatória que depende, fundamentalmente, dos resultados oferecidos pela roleta. Então, só podería​mos determinar uma função de probabilidade para o lucro esperado. 2) A resposta da questão (obtida sob a hipótese de que se pede o lucro líquido esperado) é negativa, o que não permite a marcação correta no cartão de respostas. O lucro líquido esperado a cada rodada é obtido pelo ganho esperado a cada rodada menos o investido para jogar em cada rodada. Calculando-se o ganho esperado para cada rodada, que depende da probabilidade da ocorrência de cada cor em cada rodada, temos: E(G) = R$ 0,5P(Vermelho) + R$ 0,5P(Verde) + R$ 0,5P(preto) =

Considerando que seu investimento em cada rodada é de R$2, o seu lucro líquido esperado

será R$ 2 – R$ 1,237 = – R$ 0,763. Ou seja, na verdade, um prejuízo esperado. Após 100 rodadas, o seu lucro esperado será de – R$ 76,3. Multiplicando-se este resultado por 76, temos R$ 76,3 . 76 = – R$ 5.800. Somando-se 100 ao resultado, obtêm-se – R$ 5.700.

Questão 5 Sobre variáveis aleatórias, indique se as afirmativas são corretas ou falsas: Ⓞ Se X é uma variável aleatória contínua com fdp dada por f(x) = x/12 se 1 < x< 5 e f(x) = 0 para outros valores, então a densidade de Y = 2X – 3 é g(y) = (y + 3)/24 se – 1 < y < 7 e g(y) = 0 para outros valores. ① Se X e Y tiverem um coeficiente de correlação igual a ρ(X,Y), e definindo Z = aX + b e W = cY + d, então ρ(X,Y) = ρ(Z,W) somente se a > 0 e c > 0. ② Se X possui uma distribuição Normal, com média µ e variância σ², então Z = aX + b possui distribuição Normal com média aµ e variância (a)² σ². ③ Se a função de distribuição de probabilidade conjunta para duas variáveis aleatórias X e Y é definida como f(x, y) = 0,01; 0 ≤ x, y ≤ 10 e f(x, y) = 0 para qualquer outro valor, então, X e Y são variáveis aleatórias independentes. ④ Se duas variáveis aleatórias X e Y têm covariância nula, então elas são independentes.

Resolução: (0) Falsa. Para obtermos a densidade de Y, utilizaremos, primeiramente, a densidade acumulada:

Diferenciando para obter a função de densidade de probabilidade de y:

Aplicando os extremos que x pode assumir, para saber os extremos que y pode assumir: se x = 1, então y = 2x – 3 = 2 . 1 – 3 = –1, e se x = 5, então y = 7. Logo:

Observação: Outra forma de se fazer é usar a seguinte propriedade: Se X for uma v.a. contínua, com densidade f(x) > 0, a < x < b, então Y = h(X) tem densidade expressa por:

dado que h seja monotônica e diferenciável para todo x. Assim, como Y = 2X – 3, então h–1 (y) será:

Além disso:

Substituindo h–1 (y) e

na expressão da propriedade acima, teremos:

Aplicando os limites de x para obter os limites de y, obtemos a mesma expressão anterior. (1) Falsa. Note que: ρ(Z, W) = ρ(aX + b, cY + d) =

Assim, p(x,y) = p(z,w), se ac > 0, ou seja, quando a > 0 e c > 0 ou a < 0 e c < 0. Observação: Essa propriedade foi enunciada e provada na revisão de conceitos. Bastava fixar c=d=0 e verificar que é válida quando ab>0. Esta desigualdade ocorre quando a>0 e c>0 ou quando a 7) sendo que X e Y seguem a distribuição do enunciado. Vamos verificar quais os valores de X e Y possíveis cuja soma é maior do que 7, e suas respectivas probabilidades: X

Y

X+Y

P(X)

P(Y)

P(X,Y)=Pr(X)Pr(Y)

3

5

8

1/8

1/4

1/32

5

3

8

1/4

1/8

1/32

4

4

8

1/4

1/4

1/16

4

5

9

1/4

1/4

1/16

5

4

9

1/4

1/4

1/16

5

5

10

1/4

1/4

1/16

soma

10/32=5/16

Notemos que na última coluna usamos o fato de que X e Y são independentes, o que implica que P(X, Y) = P(X)P(Y). Logo, P(X + Y > 7) = 5/16.

Questão 15 Num torneio de squash entre três jogadores, A, B e C, cada um dos competidores enfrenta todos os demais uma única vez (isto é, A joga contra B, A joga contra C e B joga contra C). Assuma as seguintes probabilidades: P(A vença B) = 0,6, P(A vença C) = 0,7, P(B vença C) = 0,6 Assumindo independência entre os resultados das partidas, compute a probabilidade de que A vença um número de partidas pelo menos tão grande quanto qualquer outro jogador. Multiplique o resultado por 100.

Abaixo estão listados todos os resultados possíveis das partidas. Por motivo de síntese, simbolizamos, por exemplo, o evento (A vence B) por (A . B). A.B

A.B

A.B

A.B

B.A

B.A

B.A

B.A

A.C

A.C

C.A

C.A

A.C

A.C

C.A

C.A

B.C

C.B

B.C

C.B

C.B

C.B

C.B

C.B

onde cada coluna representa os resultados possíveis dos jogos dos competidores entre si. Por exemplo, a primeira coluna diz que o jogador A venceu suas duas partidas contra os jogadores B e C, enquanto o jogador B venceu o jogador C. O placar dos números de vitórias em cada combinação anterior é apresentado na tabela abaixo, seguindo a ordem de vitórias de A, B e C, respectivamente. Seja o evento E =(A vence um número de partidas pelo menos tão grande quanto qualquer outro jogador). Os resultados que satisfazem o evento E são marcados em negrito na tabela anterior. Assim,

De onde se conclui que 100 ∙ P(E) = 64.

PROVA DE 2012 Questão 4 Uma companhia de seguros classifica os motoristas em três grupos: X, Y e Z. A expe​r iência indica que a probabilidade de um motorista do grupo X ter pelo menos um acidente em um ano é de 0,4, enquanto as probabilidades correspondentes para os grupos Y e Z são 0,15 e 0,1, respectivamente. Dos motoristas que contratam seguro, 30% são classificados no grupo X, 20% em Y e os 50% restantes no grupo Z. Assuma que, em cada grupo, os acidentes nos anos subsequentes ocorrem independentemente. É correto afirmar que: Ⓞ A probabilidade de um novo cliente sofrer um acidente no primeiro ano é 0,65. ① A probabilidade de um cliente do grupo Z não sofrer um acidente em 2 anos é 0,36. ② A probabilidade de um novo cliente não sofrer nenhum acidente em 2 anos é 0,6575. ③ Se um novo cliente não tiver nenhum acidente nos 2 primeiros anos, a probabilidade dele pertencer ao grupo X é inferior a 0,2. ④ A probabilidade de um novo cliente sofrer um acidente no segundo ano é inferior a 0,3, dado que ele sofreu um acidente no primeiro ano.

Resolução: (0) Falso. Seja A o evento: ocorre pelo menos um acidente em um dado ano. Evidentemente, , seu evento complementar, é: não ocorre acidente em um dado ano. Sejam X, Y e Z os eventos: o motorista que contratou o evento é do grupo X, Y e Z, respectivamente. Desta forma, P(X) = 0,3; (X) = 0,3; P(Y) = 0,2; P(Z) = 0,5; P(A|X) = 0,4; P(A|Y) = 0,15; P(A|Z) = 0,1. Pelo teorema de Bayes, tem-se: P(A) = P(A|X)P(X) + P(A|Y)P(Y) + P(A|Z)P(Z) = 0,2. Assim, a probabilidade de ocorrer pelo menos um acidente no primeiro ano é 20%.

(1) Falso. P( |Z) = 1 – P(A|Z) = 0,9 Como o enunciado estabelece que acidentes nos anos subsequentes ocorrem de forma independente, a probabilidade do cliente Z não sofrer acidentes em 2 anos, ou seja, a probabilidade deste cliente não sofrer acidentes nem no primeiro, nem no segundo ano é . (2) Verdadeiro. Pelo enunciado, temos:

Portanto,

Assim, pelo Teorema da Probabilidade Total:

(3) Verdadeiro.

(4) Verdadeiro. Seja A2 o evento: não ocorre acidentes no segundo ano. Seja A1 o evento: não ocorre acidente no 1o ano, temos:

Questão 5 Sejam X e Y duas variáveis aleatórias independentes com E[X] = 4, E[Y] = 5, Var[X] = 1 e Var[Y] = 2.

São corretas as afirmativas: Ⓞ E[XY] = 9. ① E[1/y] = 1/5. ② E[X2] = 16. ③ Cov(X,Y) = 0. ④ Var[XY] = (E[Y])2Var(X) + (E[X])2Var(Y) + Var(X)Var(Y) = 59.

Resolução: (0) Falso. Como X e Y são independentes, então

. Logo: , logo

.

(1) Falso. Para responder esta pergunta de forma geral devemos usar a Desigualdade de Jensen. Note que h(y) = 1/y é uma função estritamente convexa. A desigualdade de Jensen estabelece que , neste caso. Ainda, a Desigualdade de Jensen estabelece que

, caso

seja estritamente côncava. Por fim, se a concavidade e

a convexidade não puderem ser garantidas de forma estrita, as duas desigualdades passam a ser válidas de forma não estrita também. Assim, poderíamos afirmar que:

Logo, a afirmação é falsa. (2) Falso.

(3) Verdadeiro. Veja que

Como X e Y são independentes, , o que torna a afirmativa verdadeira.

(4) Verdadeiro. Para duas variáveis aleatórias independentes, a variância do produto delas é dada pela fórmula enunciada, pois:

onde utilizamos na segunda igualdade da primeira linha os seguintes resultados: (i) se X e Y são independentes então X2 e Y2 também serão, logo Cov(X2,Y2) = 0 e E(X2Y2) = E(X2)E(Y2); (ii) se X e Y são independentes então Cov(X,Y) = 0 e E(XY) = E(X)E(Y). E na segunda linha, utilizamos a primeira propriedade da variância, enunciada na Revisão Conceitual, na parte Momentos Incondicionais e Condicionais. Substituindo os valores dados no enunciado, temos:

Questão 13 Sejam W1 e W2 variáveis aleatórias discretas independentes com a seguinte função de probabilidade: Seja Y = W1 + W2. Julgue as seguintes afirmativas: Ⓞ

.



.

② Pela desigualdade de Tchebyshev,

③ Usando os dados acima, obtemos que

.

.

④ Y é uma variável aleatória discreta que assume os seguintes valores {0,1,2,3,4,5}.

Resolução: Os itens (2) e (3) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (0) Verdadeiro.

(1) Verdadeiro.

Sendo

temos:

Como W1 e W2 são variáveis aleatórias independentes,

(4) Falso. Como , e W1 e W2, assumem valores 0, 1 ou 2, então Y pode assumir no máximo valor 4 e, portanto, não pode assumir o valor 5.

PROVA DE 2013 Questão 2 Suponha que uma companhia administre três fundos mútuos. Denote por Ai o evento associado a um acréscimo de valor do i-ésimo fundo mútuo em um determinado dia (i = 1,2,3). Sabe-se que P(A1) = 0,55 P(A2) = 0,60 P(A3) = 0,45 P(A1 A2) = 0,82 P(A1 A3) = 0,7525 P(A2 A3) = 0,78 P(A2 ∩ A3|A1) = 0,20 É correto afirmar que: Ⓞ Os eventos A1e A2 são independentes. ① A probabilidade dos fundos 1 e 2 aumentarem de valor, dado que o fundo 3 aumentou de valor, é 0,33. ② A probabilidade dos fundos 1 e 2 aumentarem de valor é 0,33. ③ Os eventos A1, A2, e A3 são independentes. ④ A probabilidade dos fundos 1 e 2 não aumentarem de valor em um determinado dia é 0,18.

Resolução: (0) Verdadeiro. Pela Lei De Morgan (enunciada na Revisão de Conceitos), sabemos que: (A1 A2)C = A1C ∩ A2C Como podemos obter a Pr(A1C ∩ A2C), Pr(A1C) e Pr(A2C), podemos verificar se A1C e A2C são independentes. Nesse caso, A1 e A2 também serão, pela proposição enunciada na Revisão de Conceitos. Para que A1C e A2C sejam independentes devemos ter: Pr(A1C ∩ A2C) = Pr(A1C) Pr(A2C) Verificando se tal igualdade é válida: Pr(A1C ∩ A2C) = Pr(A1 A2) = 1 – Pr(A1 A2) = 1 – 0,82 = 0,18

Pr(A1C)Pr(A2C) = [1 – Pr(A1)][1 – Pr(A2) = 0,45 0,4 = 0,18 Logo A1C e A2C são independentes e, portanto, A1 e A2 também serão. (1) Falso. Queremos calcular P(A1 ∩ A2|A3). Pela definição de probabilidade condicional, sabemos que:

(2) Verdadeiro. Como os eventos são independentes (provado no item (0)), podemos simplesmente multiplicar as probabilidades dos dois eventos para obter a probabilidade dos dois eventos ocorrerem simultaneamente. Isso nos dá: Pr(A1 ∩ A2) = P(A1)P(A2) = 0,6 0,55 = 0,33. (3) Falso. O exercício nos deu P(A2 ∩ A3|A1) a partir dela podemos testar essa hipótese de independência. Se houver independência, teremos que:

em que, na terceira igualdade, usamos o fato de que os três eventos devem ser conjuntamente independentes. Testemos então a hipótese: P(A2) P(A3) = 0,33 ≠ 0,2 = P(A2 ∩ A3|A1) Como os valores deram diferentes, os três eventos não são independentes. (4) Verdadeiro. A probabilidade de ambos não aumentarem de valor será um menos a probabilidade de ambos aumentarem de valor. Mas isso foi obtido no item (0): Pr(A1 A2)C = 1 – Pr(A1 A2) = 1 – 0,82 = 0,18 Observação: Outra forma de solucionar é a seguinte: Pr(A1 A2)C = Pr(A1C ∩ A2C) = Pr(A1C)Pr(A2C) = (0,45)(0,4) = 0,18 em que, a primeira igualdade decorre da Lei De Morgan e a segunda, da independência entre A1 e A2, que pela proposição enunciada na revisão de conceitos – na parte de Probabilidade Condicional e Independência – implica também na independência entre A1C e A2C.

Questão 6 Considere X, Y e Z variáveis aleatórias com distribuição conjunta caracterizada por ƒX,Y,Z (x, y, z) e distribuições marginais caracterizadas por ƒX(x), ƒy(y) e ƒZ(Z). Sejam a, b, c e d constantes. Julgue as seguintes afirmativas: Ⓞ O resultado g(E[X]) = E[g(X)] se verifica para g(X) = X2. ① Se X e Y são independentes, E[aX + bY + c] = aE[X] + bE[Y] + c. ② Se X, Y e Z são independentes, Var[aX + bY + c + d + Z] = a2Var[X] + b2Var[Y] + Var[Z]. ③ Cov(X, aY + bZ) = Cov(X, Y) + Cov(X, Z). ④ E[(aX) (cY)] = ac E[XY].

Resolução: (0) Falso. g(X) = X2 é uma função convexa, dessa forma, pela desigualdade de Jensen (enunciada na Revisão de Conceitos), E[g(X)] > g(E[X]). (1) Verdadeiro. Na operação de esperança, podemos sempre separar os termos em adição e tirar as constantes de dentro da operação, para qualquer X e Y: E[aX + bY + c] = E[aX] + E[bY] + E[c] = aE[X] + bE[Y] + c. Para o caso específico de assumirmos X e Y independentes, a propriedade se mantém. (2) Verdadeiro. Como as variáveis são independentes, os termos de covariância serão nulos: Var[aX +bY + c + d + Z] = Var[aX] + Var[bY] + Var[c] + Var[d] + Var[Z] + abCov[X, Y] + aCov[X, Z] + bCov[Y, Z] = a2Var[X] + b2Var[Y] + Var[Z]. (3) Falso. Cov(X, aY + bZ) = E(X(aY + bZ)) – E(X)E(aY + bZ) = E(aXY) – E(X)E(aY) + E(bXY) – E(X)E(bZ) = a[E(XY) – E(X)E(Y)] + b[E(XZ) – E(X)E(Z)] = a Cov(X, Y) + b Cov(X, Z) (4) Verdadeiro (Discordância do Gabarito da Anpec). Podemos tirar a constante do produto: E[(aX) (cY)] = ac E[XY] Observação: Provavelmente o formulador da questão queria colocar a seguinte expressão: E[(aX) (bY)] = aE(X) bE(Y) Nesse caso, isso só será verdade se X e Y forem não correlacionados. Como não temos essa informação, podemos apenas afirmar que:

E[(aX) (bY)] = aE(X) bE(Y) + Cov(aX, bY)

Questão 9 Uma firma de consultoria econômica possui um modelo para prever recessões. O modelo prevê corretamente uma recessão com probabilidade de 80% quando ela está realmente a caminho, e com probabilidade de 10% quando ela não está a caminho. A probabilidade não condicional de a economia passar por uma recessão é de 20%. Se o modelo prevê uma recessão qual é a probabilidade de que ela realmente esteja a caminho? Multiplique o resultado por 100 e arredonde para o número inteiro mais próximo.

Resolução: Denotemos: P(rec) = 0,2 a probabilidade de a economia passar por uma recessão; P(ñrec) = 0,8 a probabilidade de a economia não passar por uma recessão; P(MP|rec) = 0,8 a probabilidade de o modelo prever uma recessão quando ela realmente está a caminho e; P(MP|ñrec) = 0,1 a probabilidade de o modelo prever uma recessão quando ela não está a caminho. Queremos encontrar:

Temos que encontrar a probabilidade de um modelo prever uma recessão: P(MP) = P(MP|rec) P(rec) + P(MP|ñrec) P(ñrec) P(MP) = 0,8 × 0,2 + 0,1 × 0,8 = 0,24 Agora podemos calcular o resultado pedido:

O enunciado nos pede para multiplicar o resultado por 100 e arrendondá-lo para o inteiro mais próximo, logo a resposta será: R = 67.

PROVA DE 2014 Questão 3 A tabela abaixo oferece informações sobre uma determinada cidade. A População Economicamente Ativa (PEA) de 120 habitantes que está em busca de emprego ou participando do mercado de trabalho

possui a seguinte distribuição: Empregado

Desempregado

Possui curso superior

40

10

Não possui curso superior

40

30

Com base nessas informações, é correto afirmar que:

Resolução: Para a resolução da questão, chamemos o evento ‘Possui curso superior’ de X e o evento ‘Empregado’ de Y. e passam a ser seus respectivos eventos complementares. (0) Falso. Somando os valores da coluna ‘Desempregado’ obtém-se 40. O enunciado afirma que a PEA compreende 120 habitantes. Resulta que a taxa de desemprego é:

Que é diferente dos 25% que o enunciado afirma. (1) Verdadeiro. A pergunta resume-se a indivíduos com curso superior, ou seja, basta observar a primeira linha da tabela. Há 10 desempregados entre todos os 50 da primeira coluna. Logo, a probabilidade de um indivíduo com ensino superior ser desempregado é . Observação: Formalmente, a probabilidade de interesse é:

Ou seja, a probabilidade de estar desempregado dado que possui curso superior. A probabilidade da interseção dos dois eventos é 10 dividido pelo total da população. A probabilidade de possuir curso superior é 50 – soma dos valores da primeira linha na tabela – dividido pelo total da população. Substituindo os valores na equação acima:

(2) Falso. A probabilidade de um indivíduo ter curso superior dado que está empregado é dada pela proporção de indivíduos com essa característica na primeira coluna. No total, há 80 indivíduos na primeira coluna e 4 0deles possuem curso superior. Assim, a probabilidade seria enunciado.

, igual à probabilidade de não ter curso superior, e não maior, como diz o

Observação: Novamente, poderíamos resolver formalmente:

Usando a tabela da mesma forma que na resolução formal do item anterior:

(3) Falso. Basta somar os valores na linha ‘Possui curso superior’, na tabela acima. Fazendo isso, e dividindo pelo total da PEA, temos:

Diferente do um terço sugerido pelo enunciado. (4) Verdadeiro. A pergunta é condicionada a estar desempregado, logo basta observar a segunda coluna. Nesta coluna, há 30 indivíduos sem curso superior e 40 no total. Logo, a probabilidade pedida no enunciado é dada por

.

Observação: De maneira formal,

O numerador da fração acima é a probabilidade do indivíduo não possuir curso superior e estar desempregado, ou seja, o valor na segunda linha e segunda coluna da tabela, dividido pelo total da PEA. O denominador é simplesmente a soma dos elementos da segunda coluna, dividido pelo total da PEA. Assim:

.

Questão 7 Sejam X e Y duas variáveis aleatórias, enquanto a, b, c e d são quatro constantes diferentes de zero. Julgue as proposições: Ⓞ Var (aX+b)=a2Var(X). ① Var (aX – cY) = aVar(X) + cVar(Y) – 2Cov(X,Y). ② Cov(aX + bY, cX + dY) = acVar(X) + bdVar(Y) + (ad + bc) Cov(X,Y). ③ Corr(aX + b, cX + d) = Corr(X,Y). ④ Se X e Y são independentes, então Var(Y/X)=Var(Y).

Resolução: (0) Verdadeiro. Pela definição de variância:

(1) Falso. Sendo X e Y duas variáveis aleatórias quaisquer:

que é diferente do que o item afirma. (2) Verdadeiro. Pela propriedade distributiva da covariância:

Utilizando os fatos de que

e

temos: Cov(aX + bY,cX + dY) = acVar(X) + bdVar(Y) + (ad + bc)Cov(X,Y) Exatamente como afirma o enunciado. (3) Falso. O lado direito da equação, no item, fala de Corr (X,Y), mas sequer existe Y do lado esquerdo. Observação: Se do lado esquerdo no enunciado fosse

, teríamos a

seguinte solução: , como consta na Revisão de Conceitos na parte dos Momentos Incondicionais e Condicionais. E a questão continuaria sendo falsa. (4) Falso. Inicialmente o gabarito era verdadeiro, pois provavelmente o formulador da questão tratou o enunciado do item como sendo variância condicional. Neste caso, pela definição, exposta na revisão de conceitos:

A independência de X e Y afirmada no enunciado implica

e

, pois se Y e X são independentes, Y² e X também são (Casella e Berger, 2011, p. 184). Assim: Var(Y | X) E [Y2] – E[Y]2 = Var(Y) o que tornaria o item verdadeiro. No entanto, note que a barra do termo Var(Y/X) não é vertical, o que configura que trata-se de uma variância de uma variável aleatória (Y) dividida por outra (X). Para provarmos que é falsa a afirmativa, basta tomarmos um contraexemplo. Suponha que e e sejam independentes entre si. Sabe-se da revisão de conceitos do capítulo 2 que:

Sabe-se também dessa mesma revisão de conceitos que a variância dessa variável será:

Denote

– note que X e Y também são independentes, uma vez que Y e Z

foram assumidas independentes (Casella e Berger, 2011, p. 184). Assim: .

Questão 12 Suponha que as ocupações são agrupadas em 3 níveis: alto (A), médio (M) e baixo (B). Seja A1 o evento que a ocupação do pai é o nível alto, M1 o evento que a ocupação do pai é nível médio, e B1 o evento que a ocupação do pai é nível baixo. De forma análoga, seja A2 o evento que a ocupação do filho é o nível alto, M2 o evento que a ocupação do filho é nível médio e B2 o evento que a ocupação do filho é nível baixo. Temos a seguinte matriz de probabilidades condicionais: A2

M2

B2

A1

0,45

0,48

0,07

M1

0,05

0,70

0,25

B1

0,01

0,50

0,49

Nesta tabela, temos as probabilidades condicionais da ocupação do filho dada à ocupação do pai. Por exemplo, Pr[A2/A1]=0,45. Suponha que na geração de pais 10% estão em A, 40% em M e 50% em B.

Julgue as seguintes afirmativas: Ⓞ A probabilidade de um pai e um filho estarem ambos em ocupações de baixo nível é 0,49. ① A probabilidade de um filho estar em uma ocupação de alto nível é 15%. ② Se a ocupação do filho é A2, a probabilidade do pai ter ocupação A1 é 0,45. ③ Se a ocupação do pai é baixa, a probabilidade da ocupação do filho ser alta é 0,01. ④ A probabilidade de pai e filho ambos terem ocupações de alto nível é 0,045.

Resolução: (0) Falso. A observação importante nesta questão é que as probabilidades nas células são condicionais e não interseções. Assim, a probabilidade de um pai e um filho estarem ambos em ocupações de baixo nível é obtida pela definição de probabilidade condicional, definida na revisão de conceitos

Onde

foi extraído da tabela e

é dado no enunciado. Conclui-se que o

enunciado é incorreto. (1) Falso. Para encontrar a probabilidade sugerida,

, deve-se usar a lei da

probabilidade total, enunciada na revisão de conceitos:

Que é diferente de 0,15, negando a afirmativa. (2) Falso. Lembrando que a tabela nos dá

, pede-se a condicional oposta, ou seja,

. Deve-se fazer uso da Regra de Bayes, apresentada na revisão de conceitos. Temos:

onde se fez uso do resultado de

, encontrado no item anterior. Novamente, o enunciado

é incorreto. (3) Verdadeiro. Pede-se

. Basta encontrar a célula da coluna

com a linha

na

tabela, que de fato apresenta o valor 0,01. (4) Verdadeiro. Repare que agora o enunciado pede probabilidade condicional, na revisão de conceitos, nota-se:

. Pela definição de

O que está de acordo com o enunciado.

Questão 15 Julgue as afirmativas abaixo: Ⓞ Suponha que X seja uma variável aleatória distribuída de acordo com a função densidade: f(x)=(1/2)x, em que 0≤x≤2. A probabilidade de que x se situe entre 0 e 1 é igual a 0,5. ① Se X é uma variável aleatória distribuída de acordo com a função densidade f(x)=(1/2)x, em que 0≤x≤2, então Var(X)=2/9. ② Suponha que Y seja uma variável aleatória distribuída de acordo com a função densidade: f(y)=2y -3, em que y≥1. Então E(Y)=3. ③ Suponha que Y seja uma variável aleatória distribuída de acordo com a função densidade: f(y)=2y -3, em que y≥1. Então a mediana de Y é . ④ Considere a seguinte função densidade de probabilidade conjunta para as variáveis Z e W: f(z,w)=2-z-w, 0≤z≤1, 0≤w≤1. Podemos dizer que as variáveis Z e W são independentes.

Resolução: (0) Falso. Integrando a função densidade para encontrar a função de probabilidade acumulada (função distribuição) de x, temos:

Basta então computar

.

(1) Verdadeiro. Para encontrar a variância de X pode-se, por exemplo, calcular E (X) e E (X2):

Então, como Var (X) = E (X2)− E (X)2, temos:

(2) Falso. Calculando a esperança:

(3) Verdadeiro. Sendo

o valor da mediana, obtê-lo-emos a partir da seguinte equação:

(4) Falso. A condição de independência, segundo a revisão de conceitos, é que: . Estabelecendo a distribuição marginal para uma variável arbitrariamente, temos:

A marginal de z é análoga:

Testando a condição de independência:

Logo, a condição de independência não é satisfeita.

PROVA DE 2015 Questão 2 Considere a distribuição de probabilidade conjunta das variáveis aleatórias X e Y: X

Y

-1

0

1

-1

1/5

0

1/5

0

0

1/5

0

1

1/5

0

1/5

Com base nessas informações, é correto afirmar: Ⓞ E[X]=0; ① A covariância entre X e Y é igual a zero; ② As variáveis aleatórias X e Y são independentes; ③ Se T = X + 5, a covariância entre T e Y é maior do que zero; ④ Defina V = 2X e Z = 3Y. Então, podemos dizer que a correlação entre V e Z é igual a zero.

Resolução: (0) Verdadeiro. Uma forma direta de resolver seria:

Observação: O cálculo acima, envolve a aplicação da fórmula:

,

em que,

é a função de probabilidade conjunta de (X,Y) e

é a função de

probabilidade marginal de X. O cálculo acima aplicou diretamente a primeira igualdade da fórmula, ou seja, sem obter a função de probabilidade de X. Se procedêssemos dessa forma, teríamos que obter inicialmente:

Logo:

(1) Verdadeiro.

Mas,

(2)

Falso.

, como obtido no item 0. Então:

Note

que

e

que

,

ou

seja,

, portanto X e Y não são independentes. (3) Falso. , em que, a segunda igualdade foi obtida através da propriedade para covariância enunciada na parte Momentos Incondicionais e Condicionais da Revisão de Conceitos deste capítulo e, , obtido no item 1. (4) Verdadeiro. , em que a segunda igualdade foi obtida através da propriedade para covariância enunciada na

parte Momentos Incondicionais e Condicionais da Revisão de Conceitos deste capítulo e, , obtido no item 1.

Questão 4 Em uma determinada cidade, 60% dos moradores são mulheres e 40% são homens. Entre as mulheres, 80% estão empregadas e 20% estão desempregadas. Entre os homens, 90% estão empregados e 10% estão desempregados. Obtenha a probabilidade de uma pessoa escolhida aleatoriamente nessa cidade ser mulher, dado que está desempregada, e multiplique o resultado por 100.

Resolução A partir do que nos foi fornecido no enunciado, podemos montar a seguinte tabela da distribuição de probabilidade conjunta:

,

em que, H é o evento “o indivíduo selecionado é do sexo masculino”, M é o evento “o indivíduo selecionado é do sexo feminino”, PO é o evento “o indivíduo selecionado está ocupado”, PD é o evento “o indivíduo selecionado está desocupado”. A questão pede a probabilidade de que uma pessoa seja mulher dado que ela está desempregada, portanto: . Ao multiplicar o valor encontrado por 100, chegamos ao resultado final, que é 75.

Questão 5 Sejam X e Y variáveis aleatórias, com a seguinte função densidade de probabilidade conjunta: f(x, y) = (x + y), para 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, com f(x, y) = 0, caso contrário. Julgue as afirmativas abaixo: Ⓞ Sendo f (x) a distribuição marginal de X, podemos dizer que f (x) = x + (1/2) para 0 ≤ x ≤ 1; ① Prob(0 ≤ X ≤ 0,5) = 1/2; ② Prob(0,5 ≤ X ≤ 1) = 5/8; ③ ④

; .

Resolução: (0) Verdadeiro. A distribuição marginal de X é dada por:

Assim, podemos dizer que

para

.

(1) Falso.

(2) Verdadeiro. Como

e

são eventos disjuntos, cuja união,

, gera o suporte de X (ou seja, todo espaço amostral de X cuja probabilidade é positiva), então:

Do item anterior, temos que: . Como X é uma variável aleatória contínua, incluir ou não um dos extremos do intervalo (ou ambos) no cálculo da probabilidade não afeta o resultado, ou seja: . Substituindo na equação da Lei da Probabilidade Total enunciada acima:

(3) Falso. Devemos obter a função densidade de probabilidade condicional f(y|x). Para isso, utilizamos a função densidade de probabilidade conjunta f(x,y) do enunciado da questão e a distribuição marginal de X, f(x), obtida no item 0:

(4) Falso. Utilizando a última fórmula da densidade condicional obtida no item anterior:

Observação: Note que a segunda integral da primeira linha da expressão acima é exatamente a mesma integral calculada no item 1, apenas com a troca de variável de x para y. Logo, o valor obtido é o mesmo.

Questão 10 Considere a seguinte função de massa de probabilidade:

, para

e

. Julgue as seguintes afirmativas: Ⓞ A distribuição marginal de X é



e

;

;

② ③

; ;

④ X e Y são variáveis aleatórias independentes.

Resolução: (0) Falso. Não é necessário fazer conta para notar que a especificação da distribuição marginal de X está incompleta, pois está faltando a . Mesmo assim, podemos obter de forma completa a distribuição marginal de X através de:

Logo, a distribuição marginal de X é:

(1) Verdadeiro. A esperança de Y é obtida através de:

Antes, precisamos obter a distribuição marginal de Y,

. Aplicando a mesma

fórmula do item 0, mas agora para Y: . Assim:

Substituindo de volta na expressão da esperança de Y:

(2) Falso. Pela propriedade da variância enunciada na revisão de conceitos:

Substituindo

obtida no item anterior e .

(3) Falso. Pela propriedade da covariância:

obtida acima, encontramos:

Pelas probabilidades do item 0, obtemos:

Pela função de probabilidade conjunta do enunciado (note que não é necessário calcular, pois as diversas combinações já foram obtidas nos itens 0 e 1), obtemos:

Substituindo os valores obtidos na equação da covariância:

.

(4) Falso. Como a correlação de X com Y é diferente de zero, elas não são correlacionadas e, portanto, elas são dependentes. Observação: Essa afirmação é apenas a contraposição (ou negação) do seguinte teorema: Se X e Y são independentes, logo X e Y são não correlacionadas.

2

Principais Distribuições de Probabilidade

REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Distribuições Distribuição Bernoulli Seja Y uma v.a. Bernoulli com parâmetro p. A média de uma Bernoulli é E(Y) = p e a variância é Var(Y) = p(1 –p). Distribuição Binomial A distribuição binomial apresenta a seguinte função de probabilidade:

Observação: A distribuição Binomial é obtida como a soma de n variáveis aleatórias que seguem distribuição de Bernoulli independentes entre si. Portanto, sua média é np e a variância é np(1 – p). Distribuição Hipergeométrica Seja uma população de N objetos (por exemplo, bolas), dos quais r têm o atributo A (por exemplo, azuis) e (N-r) têm o atributo B (por exemplo, brancas). Um grupo de n elementos é escolhido aleatoriamente sem reposição. Então, a v.a. discreta X que contenha k elementos desse grupo com o atributo A terá probabilidade dada por:

Os pares (k, pk) constituem a distribuição hipergeométrica de probabilidades. A média e a variância serão dadas por: E(X) = np, onde

Distribuição de Poisson Considere a distribuição binomial dada anteriormente com parâmetros n e p. Então, para n grande e p pequeno, podemos aproximar a função de probabilidade da binomial por:

em que, λ = np. Tal função de probabilidade, para k = 0,1,…, é denominada distribuição de Poisson. Formalmente, uma v.a. X tem tal distribuição com parâmetro λ > 0 se:

Observação: A distribuição de Poisson se aplica bem ao cálculo de eventos raros, como (i) o número de chamadas recebidas em um determinado período de tempo ou (ii) o número de gols em uma partida de futebol. Proposição: Seja X uma v.a. Poisson, com parâmetro λ. Sua média e variância são iguais a λ. Prova: A média da variância será calculada como:

onde o último somatório é simplesmente a densidade da Poisson, que deve somar um. Para a variância, devemos usar a propriedade:

Var(X) = E(X2) – E2(X) Falta calcular o primeiro termo do lado direito:

Denotando x = k-1, teremos:

onde usamos o fato de que

é a média da Poisson calculada acima.

Proposição: Se Xi ~ Poisson(λi), i = 1,..., k, e independentes, então:

Distribuição Geométrica Suponha que em um ensaio de Bernoulli, o evento A ocorra com probabilidade p. Considere a repetição do ensaio de forma independente até que o evento A ocorra pela primeira vez. Afirma-se, então, que a v.a. discreta X será o número de repetições do experimento até que ocorra o evento A pela primeira vez e terá função de probabilidade dada por: Pr(X = k) = (1 – p)k–1p, k = 1,2,… em que k é o número de repetições do ensaio até a ocorrência do evento A pela primeira vez. É comum que se confunda essa distribuição com a distribuição binomial. Note que no caso da Binomial, o número de repetições (no caso da binomial denotado por n e no caso da geométrica por k) é dado e na distribuição Geométrica é a variável aleatória. A média e variância são expressas por:

Essa distribuição apresenta a seguinte propriedade:

ou seja, esta propriedade diz que a distribuição geométrica não tem memória. Esta propriedade vale também no sentido inverso, ou seja, se a equação acima for válida para uma v.a. discreta para s e t inteiros positivos então essa v.a. terá distribuição Geométrica. Distribuição Multinomial Seja um espaço amostral S, e uma partição de S dada por

tal que A ∩ Aj = 0, i ≠ j.

A probabilidade de um evento Ai ocorrer é dada por pi = P(Ai), constante durante as n repetições de um experimento. Seja Ai uma v.a. discreta, que pode assumir valor ni, o número de vezes que ocorre Ai nestas repetições do experimento. Então a função de probabilidade é dada por:

onde Distribuição Uniforme Se X U[α, β], a f.d.p. é dada por:

A média de X é

e a variância é

.

Distribuição Normal A v.a. contínua X tem distribuição normal com parâmetros

e

,

, se sua f.d.p. é dada por:

, para

.

e

Como notação, podemos representar como

.

A média e variância da distribuição Normal são dadas pelos parâmetros

e

.

Algumas propriedades da distribuição Normal: 1.

.

2. Os pontos de in.exão da fdp da Normal são 3.

O

máximo

da

fdp

é

obtida

. quando

e

é

igual

a: .

4. A distribuição é simétrica, ou seja, o coeficiente de assimetria é igual a zero. 5. Aproximadamente 68% da área sob a curva normal se encontra entre os valores cerca de 95%da área se encontra entre entre

,

e cerca de 99,7% da área se encontra

.

6. Seja duas v.a. normalmente distribuídas e independentes, tal que, . Então qualquer combinação linear Y de )

também

será

normalmente

e e

distribuída

(por exemplo, tal

que

. 7. Logicamente a distribuição Normal também é preservada sob transformações lineares: se , então , então

. Assim, se

e

, a normal padronizada.

8. O achatamento da distribuição é determinado por

.

Distribuição Lognormal Se a variável X = lnY segue uma distribuição Normal (μ, σ2), então, Y segue uma distribuição lognormal A média e a variância são dadas por:

As propriedades da distribuição Log-Normal são:

1. A distribuição Log-Normal é assimétrica à direita. 2. Se Xi, i = 1, …, k, seguem distribuições lognormais, com parâmetros μi independentes entre si, então

também segue uma lognormal com parâmetros

, e e

.

Caso normal bivariada (Independência ↔ correlação nula) O par (X, Y), variável aleatória contínua, bivariada, terá uma distribuição Normal bivariada se sua função densidade de probabilidade (f.d.p.) conjunta for igual a:

onde ρ = Corr(X, Y). Esta f.d.p. é definida por 5 parâmetros: μx R, μy R, σx > 0, σy > 0 e |ρ| < 1. Ou seja, os dois primeiros momentos definem totalmente a distribuição Normal. Propriedade: No caso de X e Y serem normalmente distribuídas de forma conjunta, então ρ = 0 X e Y independentes. Prova: Se fixarmos ρ = 0, a f.d.p. acima se resume a:

ou seja, pudemos escrever a f.d.p. conjunta como o produto das marginais. Logo, X e Y são independentes. Isso ocorre pois as médias (primeiros momentos) e desvios padrões e correlação (segundos momentos) definem a distribuição Normal. Ou seja, todo tipo de associação entre X e Y é linear, dado pelo coeficiente de correlação ρ. Proposição:

Se

(Y,

X)

seguem

uma

distribuição

Normal

bivariada,

então:

. Assim, E(Y | X) = a + bX, que é nada menos que uma regressão linear, em que e

. Uma forma de entender a média de Y | X é simplesmente

lembrar do método de mínimos quadrados ordinários (MQO) para uma regressão linear simples, ou seja: ,

isto é, b é o parâmetro verdadeiro (populacional) da inclinação de uma regressão linear simples: y = a + bX + u, onde E(u | X) = 0. E: , ou seja, a é o parâmetro verdadeiro (populacional) do intercepto da regressão.

Distribuição Exponencial A v.a. contínua X tem distribuição exponencial com parâmetro α > 0 se sua f.d.p. for igual a:

A média e a variância são dadas por: E(X) = α, Var(X) = α2. As propriedades desta distribuição são: 1. A distribuição exponencial é asssimétrica à direita, ou seja, a média > mediana > moda. 2. Para qualquer s, t > 0 temos que: Pr(X > s + t|X > s) = Pr(X > t), s > 0, t > 0 ou seja, a distribuição exponencial não tem memória, propriedade semelhante em relação à distribuição geométrica. Esta propriedade vale também no sentido inverso, ou seja, se a equação acima for válida para uma v.a. contínua para s e t positivos, então esta v.a. terá distribuição Exponencial. Distribuição Qui-Quadrada Se X χ2n , então E(X) = n e Var(X) = 2n. Proposição: Seja

, i = 1,..., n, independentes. Então

. Ou seja, a

soma de variáveis qui-quadradas independentes gera também uma qui-quadrada cujos graus de liberdade são a soma dos graus de liberdade de cada qui-quadrada. A Distribuição t de Student A v.a. contínua X tem uma distribuição t de Student com v graus de liberdade se sua f.d.p. for dada por:

em que Γ(.) é uma função gama. A média e a variância são dadas por: E(X) = 0,

Observação: Tal como a distribuição normal, a distribuição t é simétrica, mas é mais “achatada” (densa nas caudas) que a distribuição normal, ou seja, a distribuição normal tem menor dispersão em relação à média. Equivalências Sejam Y N(0,1) e X X2(r) independentes. Então

Seja Xi, i = 1,..., n, normais padronizadas independentes. Então

.

segue uma qui-

quadrada com n graus de liberdade. Denote Xi χ2(ni), i = 1,2 independentes. Então, Z F(v1, v2), tal que

.

Aproximações entre Distribuições Aproximação da Binomial para a Normal X b(n, p), para n tendendo para infinito, então Y ≈ N(np, np(1 – p)). Como a distribuição da binomial é discreta, ao fazer a aproximação pela Normal, é bom efetuar a correção de continuidade para obter aproximações mais precisas, ou seja: P(X ≤ x) ≈ P(Y ≤ x + 1/2) P(X ≥ x) ≈ P(Y ≥ x – 1/2) onde Y ≈ N(np, np(1 – p)). Aproximação da Hipergeométrica para a Binomial Se X hip(N, r, n), quando N for grande em relação a n, então X ≈ b(n, p). Isso é válido, porque a distribuição binomial é feita através de amostragem com reposição,​ enquanto a hipergeométrica é feita através de amostragem sem reposição. Se N for grande, a (não)reposição não fará grandes diferenças. Em geral, segundo alguns livros, a aproximação será boa se n / N ≤ 0,1.

Aproximação da Binomial para a Poisson Se X b(n, p), para n → ∞ e np constante, ou ainda, n → ∞, p → 0, tal que np → λ, então X → Poiss(λ). Assim, a binomial aproxima-se pela Poisson quando n for grande e p for pequeno (alguns livros adotam o critério: np ≤ 7). Assim, se a hipergeométrica é aproximada para uma binomial, ela também pode ser aproximada para uma Poisson (desde que para um n grande que seja válido b(n, p) ≈ Poiss(λ), o parâmetro N seja maior ainda). Aproximação da t-Student para a Normal Seja X~N(0,1) e Y~tv. Então, quando ν → ∞, . Ou seja, conforme aumentam os graus de liberdade, a distribuição t-student se aproxima da Normal.

PROVA DE 2006 Questão 2 São corretas as afirmativas: Ⓞ Seja Y uma variável aleatória com distribuição Binomial, com parâmetros n e p, em que 0 ≤ p ≤ 1. Então, sendo n grande e p pequeno, a distribuição de Y aproxima-se de uma Poisson cuja média é np. ① Se Y é uma variável aleatória Normal, com média 0 e variância 1; se X segue uma Qui-​quadrado com r graus de liberdade; e se Y e X são independentes, então

segue uma distribuição t com r graus de liberdade.

② Sejam X e Y variáveis aleatórias distribuídas segundo uma Normal bivariada. Suponha que E(X) = mX, E(Y) = mY , ,

e que a correlação entre X e Y seja r XY . Então, Z = aX + bY, em que a e b são

constantes diferentes de 0, segue uma distribuição Normal com média amX + bmY + abmX mY e variância a2sX2 + b2sY 2 + 2abr XY . ③ Sejam Y e X variáveis aleatórias com distribuições Qui-quadrado com p e q graus de liberdade, respectivamente. Portanto,

segue uma distribuição F com p e q graus de liberdade.

④ Sejam X e Y variáveis aleatórias conjuntamente distribuídas segundo uma Normal bivariada. Suponha que E(X) = mX, E(Y) = mY ,

,

e que a correlação entre X e Y seja r XY . Então, E(Y|X) = mY +

r XY (x – mX).

Resolução: (0) Verdadeira. Na Revisão de Conceitos, foi enunciada tal aproximação. (1) Verdadeira. É uma equivalência exata, ou seja, combinação de uma Normal padronizada e uma Qui-quadrado é exatamente uma t-Student (Ver Revisão de Conceitos – na parte de Equivalências), ou seja: Sejam Y N(0,1) e X X2(r), independentes. Então

.

(2) Falsa. Se (X, Y) são v.a. distribuídas segundo uma Normal bivariada, então as densidades marginais de X e Y são também normais, tal que, Assim,

e

.

, ou seja, Z é uma

combinação linear de duas normais, sendo também uma Normal. Logo, média e variância estão incorretas. (3) Falsa. O único erro na afirmativa é que Y e X devem ser independentes. (4) Falsa. A média condicional é:

faltando o termo

no item da questão.

Questão 10 Julgue as afirmativas: Ⓞ Se a variável aleatória Y segue uma distribuição Bernoulli com parâmetro p, então E(Y) = p. ① Uma soma de variáveis aleatórias Binomiais segue uma distribuição Bernoulli. ② A distribuição Geométrica é um caso especial da distribuição Binomial. ③ Uma distribuição Lognormal é assimétrica à direita. ④ A variância de uma distribuição uniforme entre 0 e 2 é igual a 0,5.

Resolução: (0) Verdadeira. Ver Revisão de Conceitos – distribuição Bernoulli. (1) Falsa. O correto seria: Uma soma de v.a.s independentes, com distribuição de Bernoulli e com a mesma probabilidade, segue uma distribuição Binomial. (2) Falsa. O gabarito da Anpec mudou corretamente de verdadeiro para falso. Poder-se-ia argumentar que a distribuição geométrica é um caso particular da binomial, pois se X = k, então, nas primeiras (k – 1) repetições A não ocorre, ocorrendo na j – ésima. Mas deve-se notar que na binomial o número de repetições é predeterminado (exógeno) e a v.a. (endógena) é X = k, o número de sucessos. Na Geométrica, a v.a. (endógena) é o numero de repetições. (3) Verdadeira. A distribuição lognormal é assimétrica à direita, ou seja, a média é maior que a mediana que é maior que a moda. Seu gráfico, para dois exemplos, pode ser visualizado abaixo:

(4) Falsa. Se X U[α, β], a f.d.p. é dada por:

. A média de X é

. Então, se α = 0 e β = 2, então

a variância é

e

. Caso

não se lembre da média e variância da uniforme, podemos calcular a variância diretamente. A densidade será

. Então:

PROVA DE 2007 Questão 6 Seja X uma variável aleatória com distribuição de Poisson dada por correto afirmar que:

É

Ⓞ ① ② ③ ④

E(X) =λ e var (X) = λ2. E(X²) = λ + λ2. E(X) = e–λ. E(X) = Var (X) = λ. E(X) = λ/2 e Var(X) = λ.

Resolução: (0) Falso. A média e a variância de uma v.a. com distribuição de Poisson é igual a λ, ou seja, E(X) = Var(X) = λ. Ver Revisão de Conceitos – distribuição de Poisson. (1) Verdadeiro. E(X2) = Var(X) + E(X)2 = λ + λ2. (2) Falso. Resposta dada no item (0). (3) Verdadeiro. Resposta dada no item (0). (4) Falso. Resposta dada no item (0).

PROVA DE 2008 Questão 2 Julgue as afirmativas: Ⓞ Se X é uma variável aleatória Gaussiana com média μ e variância σ², então

segue uma

distribuição Qui-quadrado com 4 graus de liberdade. ① Se X segue uma distribuição Qui-quadrado com n graus de liberdade, então E(X) = n e V(X) = 2n. ② Uma distribuição uniforme no intervalo [0,10] tem variância igual a 25/3. ③ Sejam X1, X2 ..., Xn, n variáveis aleatórias independentes com distribuição Normal com média μ e variância σ². Seja

, em que

e

, então, Z segue uma distribuição Normal

com média 0 e variância 1 para qualquer valor de n. ④ Sejam X1 e X2 duas variáveis aleatórias independentes, com distribuição qui-quadrado com n1 e n2 graus de liberdade, respectivamente. Então

segue uma distribuição F com n1 e n2 graus de liberdade.

Resolução: (0) Falsa. Veja que Z é a soma de 4 variáveis normais padronizadas ao quadrado exatamente iguais, o que poderia nos levar a pensar, erradamente, que seria uma χ24 . Mas, conforme enunciado na Revisão de Conceitos (parte de Equivalências), para que a soma de normais padronizadas ao quadrado seja uma Qui-quadrado, necessitamos afirmar que tais variáveis aleatórias normais sejam independentes, o que é impossível, pois todas são exatamente iguais e, portanto, completamente dependentes.

Observação: Outra forma de ver a questão é que o correto seria afirmar apenas que:

(1) Verdadeira. Conforme enunciado na Revisão de Conceitos (Distribuição Qui-Quadrada), se X χ2n , então E(X) = n e Var(X) = 2n. (2) Verdadeira. Podemos aplicar a fórmula da variância da uniforme diretamente, conforme já mostrada na Revisão de Conceitos:

(3) Falsa. Note que o correto seria que:

enunciado cita que

segue uma Normal padronizada. Mas o

, ou seja, usa o desvio padrão amostral (S2) e não o

populacional (σ2). Logo, Z segue uma distribuição tn–1. Z só se aproximará para uma Normal quando n for para infinito. Outro erro é que deveríamos ter n ≥ 2, pois para n = 1 não é possível calcular S. (4) Verdadeira. Esta é uma equivalência exata entre distribuições Qui-quadrado e F, mostrada na Revisão de Conceitos.

PROVA DE 2009 Questão 2 Sobre a Teoria das Probabilidades, indique as alternativas corretas e falsas: Ⓞ Sejam 3 eventos A, B e C. Então podemos demonstrar que P(A | B) = P(C | B)P(A | B ∩ C) + P(C | B)P(A | B ∩ C), assumindo que todos os eventos têm probabilidade positiva. ① Se dois eventos, A e B, são independentes, os eventos A e B não serão necessariamente independentes. ② Se A, B e C são três eventos tais que A e B são disjuntos, A e C são independentes e B e C são independentes, e, supondo-se que 4P(A) = 2P(B) = P(C) e P(A B C) = 5P(A), pode-se dizer que P(A) = 1/6. ③ Se uma família tem exatamente n crianças (n ≥ 2), e assumindo-se que a probabilidade de que qualquer criança seja menina é igual a 1/2, e todos os nascimentos são independentes, pode-se afirmar que, dado que a família tem, no mínimo, uma menina, a probabilidade de ela ter, no mínimo, um menino, é igual a (1 –(0,5)n – 1) / (1 – (0,5)n). ④ Se A, B e C são eventos com probabilidade não nula, definidos em um espaço amostral S, então P(A ∩ C | B ∩

C) = P(A ∩ B | C) / P(B | C).

Resolução: Os itens (0), (1), (2) e (4) estão resolvidos no Capítulo Probabilidade. (3) Verdadeira. Vamos chamar de: A: número de meninos maior ou igual a 1 B: número de meninas maior ou igual a 1 Então: Ac: número de meninos igual a 0. Bc: número de meninas igual a 0. Então, pede-se:

Note que o item se trata de uma distribuição binomial, pois temos n nascimentos (experimentos) independentes, onde podem ocorrer dois resultados: nascer menino ou menina. O denominador da expressão acima é fácil de calcular:​

Em relação ao numerador, note que, pela Lei De Morgan (enunciada na Revisão de Conceitos do capítulo de Probabilidade): (A ∩ B) = (Ac Bc)c Logo: P(A ∩ B) = P(Ac Bc)c = 1 – P(Ac Bc)c P(A ∩ B) = 1 – P(Ac) – P(Bc) + P(Ac ∩ Bc). O que é a probabilidade do último termo: (Ac ∩ Bc)? É o número de meninos e meninas ser igual a zero. Tal evento é um conjunto vazio, pois o número de meninos mais o número de meninas que a família tem é igual a n ≥ 2 e, portanto, nunca ambos podem ser iguais a zero. Logo: P(Ac Bc) = P(Ø) = 0. Assim, como P(Bc) = 1 – P(B) = (0.5)n (ver cálculo feito acima), podemos, de forma análoga, calcular P(Ac) = (0.5)n. Substituindo na expressão acima: P(A ∩ B) = 1 – P(Ac) – Pr(Bc) = 1 – (0.5)n – (0.5)n = 1 – 2(0.5)n

= 1 – 2(0.5)(0.5)n – 1 = 1 – (0.5)n – 1. Assim:

Questão 6 Seja Y i , i = 1, ... , n, uma variável aleatória tal que Y i = 1, com probabilidade p e Y i = 0, com probabilidade 1-p. Defina

. Responda se cada uma das afirmativas abaixo é verdadeira ou

falsa: Ⓞ Y i, i = 1, ... , n, possui distribuição Poisson com média p. ① X possui distribuição binomial com parâmetros n e p. ② V(Y i) = V(X) = p. V(X) significa variância de X. ③ Se n → ∞ e p permanecer fixo, então

converge para distribuição Normal com média 0 e variância

1. ④ E(Y 2) = p2.

Resolução: (0) Falsa. Não atende às condições da binomial se aproximar para uma Poisson, conforme enunciadas na Revisão de Conceitos: np constante e n →∞ ou n →∞, p → 0, np → λ. (1) Verdadeira. A variável aleatória Yi é uma Bernoulli. A soma de Bernoullis independentes, com a mesma probabilidade p, é uma binomial, conforme enunciado na Revisão de Conceitos. Em questões de anos anteriores, quando se mencionava que Yi era uma v.a. de Bernoulli, então subentendia-se que tais variáveis deveriam ser independentes entre si. (2) Falsa. Var(X) = np(1 – p) e Var(Yi) = p(1 – p). (3) Verdadeira. É a aproximação da binomial para a Normal (Ver Revisão de Conceitos – na parte de Aproximações entre Distribuições). (4) Falsa. E(Y2) = 12 . p + 02 . (1 – p) = p.

Questão 7

Sejam X1, X2, ..., Xn variáveis aleatórias independentes e normalmente distribuídas com média μ e variância 1. Defina as variáveis aleatórias

,e

. É correto afirmar que:

Ⓞ Se R = X1, quando X1 >0, P(R ≤ 1) = Φ(1 – μ) / (1 – Φ(0 – μ)), em que Φ(c) é a função de distribuição de uma variável aleatória Normal Padrão. ① Z é uma variável aleatória com distribuição χ 2 com n graus de liberdade. ② Se W = exp(X), E(W) = μ + σ2/2. ③ nX é uma variável aleatória normalmente distribuída com média nμ e variância n.

④ A variável aleatória W i =

, em que Y i = (Xi – μ) possui distribuição F com n1 e n2 graus de liberdade, em

que n1 = 2 e n2 = 2n.

Resolução: (0) Falso. Note que estamos calculando uma probabilidade condicional, pois R é uma Normal truncada em X1 > 0: P(R ≤ 1) = P(X1 ≤ 1 | X1 > 0) = P(X1 – µ ≤ 1 – µ | X1 – µ > µ) = P(Z ≤ 1 – µ | Z > – µ) = P(– µ < Z ≤1 – µ) / P(Z > – µ) = [Φ(1 – µ) – Φ(– µ)] / (1 – Φ (µ)) = [Φ(1 – µ) + Φ(µ) – 1] / Φ(µ) (1) Falso. Seria correto para:

ou seja, para a soma de n normais padronizadas. (2) Falso. E(W) = exp(μ + σ2/2), onde W é lognormal. (3) Verdadeiro. nX = Σi Xi é apenas uma soma (ou combinação linear) de variá​veis aleatórias normais independentes. Logo, será também Normal, com parâmetros​:

.

(4) Falso. Pois Z não é uma Qui-quadrado (ver item 1).

PROVA DE 2010 Questão 2 Suponha que X e Y sejam variáveis aleatórias independentes, com distribuições de Bernoulli com parâmetros p e q, isto é,

Defina Z = aY + bX, para a e b constantes. E[ ] e V[ ] representam, respectivamente, expectativa e variância. Julgue as afirmativas abaixo: Ⓞ E[Z | X = 2] = ap + 2b. ① V[Z]= a2q + b2p. ② Se p = q, o coeficiente de correlação entre Z e X é igual a

.

③ Se b = 0, Z e X são independentes. ④ E[Y | Z = a + b] = 1.

Resolução: (0) Falsa. A esperança será: E[Z | X = 2] = aE[Y | X = 2] + 2b Como X e Y são variáveis aleatórias independentes, então podemos afirmar que: E[Y | X] = E[Y]. Uma prova dessa afirmação para o caso contínuo foi feita na Revisão de Conceitos do capítulo de Probabilidade. Para o caso discreto seria: , na qual usamos o fato de X e Y serem independentes, que implica p(yi |x) = p(yi). Logo, E[Z | X = 2] = aE[Y] + 2b E[Z | X = 2] = aq + 2b. diferente da expressão dada no item. (1) Falsa. Como Y e X são independentes: V[Z | = V[aY] + V[bX] V[Z | = a2V(Y) + b2V(X) V[Z | = a2q(1 – q) + b2p(1 – p),

diferente da expressão dada no item. (2) Verdadeira. Cov(Z, X) = Cov(aY + bX, X) = aCov(Y, X) + bCov(X, X) = a . 0 + bV[X] = bp(1 – p) Logo, o coeficiente de correlação será:

Como p = q:

(3) Verdadeira. Se b = 0, então: Z = aY. Como Y e X são independentes, então qualquer função de Y, por exemplo h(Y) = aY, será também independente de X. (4) Verdadeira. Se Z é igual a a + b, então Y = 1 e X = 1. Como Y e X são independentes, para a média de Y, não importa o valor que X assume (como afirmado no item 0) então: E[Y | Z = a + b] = E[Y | Y = 1, X = 1]

= E[Y | Y = 1] = 1.

Questão 4 Responda se verdadeiro ou falso: Ⓞ A diferença entre as medianas de uma distribuição F(a, b) e de uma distribuição χ diminui à medida que b → ∞. ① O Teorema Central do Limite justifica a afirmação: “Seja T uma variável aleatória, tal que T~tk–1, em que t representa uma distribuição t de Student, com k – 1 grau de liberdade, em que k é fixo. Então T converge em distribuição para uma Normal Padrão.” ② Sejam

e

. Ambos os estimadores podem ser demonstrados para σ2,

supondo uma amostra aleatória de X~N(μ, σ2). ③ Uma moeda justa foi jogada 300 vezes e observou-se cara em 188 destas. A Lei dos Grandes Números justifica a afirmação: P(cara na 301a jogada|188 caras em 300 jogadas) 5165,615) = 0,05. Em que Z é uma variável aleatória com distribuição χ 25000. Suponha que n = 5001. Defina (Xi –

e S2 =

)2/(n – 1). Se S² = 5,3, pode-se rejeitar a hipótese nula de que σ² = 5 ao nível de significância de 5%.

Resolução: O item (4) está resolvido no capítulo Inferência Estatística. (0) Falsa. Seja σ = 1. Recorde o seguinte resultado, conforme em Larson (1982, p. 273): se X1 é independente de X2, então h(X1) é independente de h(X2) para qualquer função h(.). Ainda, sabemos que: Xi ~ N(0,1) garante que: Xi2 ~ χ12, ou seja, uma variável aleatória normal padrão elevada ao quadrado é uma qui-​quadrado com um grau de liberdade (essa equivalência foi enunciada na Revisão de Conceitos para n variáveis normais padrões independentes; aqui basta aplicar n = 1). Usando o resultado enunciado acima, temos que X12 é independente de X22. Como a soma de duas variáveis χ12 tem distribuição χ22 (conforme proposição enunciada na Revisão de Conceitos – na parte da distribuição qui-quadrada), segue que: X 1 2 + X 2 2 ~ χ2 2 , ou seja, a soma de variáveis aleatórias qui-quadradas independentes também é independente com graus de liberdade dados pela soma dos graus de liberdade de cada uma. Pelo mesmo resultado acima, podemos dizer que X12 + X22 é independente de X32. Dada a discussão acima, sabemos que:

pois é provado que a razão de variáveis aleatórias qui-quadrado independentes divididas pelos seus graus de liberdade tem distribuição Fn1,n2, sendo n1 e n2 os graus de liberdade do numerador e denominador, respectivamente (equivalência mostrada na Revisão de Conceitos).

Neste caso, n1 = 2, n2 = 1. (1) Falso. Note que agora σ2 não é necessariamente igual a 1, mas podemos obter a variável normal padronizada e a distribuição qui-quadrado da seguinte forma:

Contudo, estas duas variáveis são dependentes. Tanto o numerador quanto o denominador dependem de X1. Por isto, não podemos afirmar que a razão: tem distribuição t-student, pois mesmo sendo a razão de uma normal padrão pela raiz quadrada de uma variável aleatória com distribuição qui-quadrado dividida por seus graus de liberdade, o numerador e o denominador não são independentes (exigência para se obter tal equivalência, conforme enunciado na Revisão de Conceitos). (2) Falso. A variável Z é a mesma definida no item 1. Ou seja, tem distribuição qui-quadrado com 2 graus de liberdade. A média de Z é dada por: E(Z) = v = 2 Desta forma: E(Z – 2)3 é o terceiro momento centrado na média. Tal momento é o numerador do coeficiente de assimetria que é definido como:

Como a distribuição qui-quadrado é assimétrica, então o numerador será diferente de zero. (3) Verdadeiro. Note que esta variável pode ser escrita como:

Observação: Apenas para verificar o valor da média e variância, note que: E(HX1) = Cov(H, X1) + E(H) E(X1) Como H e X1 são independentes e E(X1) = 0, então:

E(HX1) = 0 Em relação à variância:

PROVA DE 2012 Questão 6 Julgue as afirmativas: Ⓞ Suponha que X1,X2, ..., Xn sejam variáveis aleatórias independentes e identicamente distribuídas com distribuição de Bernoulli com parâmetro p. Então,

possui uma distribuição binomial com parâmetros n e p.

① Suponha que uma variável aleatória X tenha uma distribuição t de Student com n graus de liberdade. Então, Y = X2 tem uma distribuição F com 1 e n graus de liberdade. ② Sejam X1 e X2 variáveis aleatórias independentes com distribuições de qui-quadrado com v 1 e v 2 graus de liberdade, respectivamente. Então X = X1 + X2 possui uma distribuição de qui-quadrado com v 1+ v 2 graus de liberdade. ③ Suponha que X seja uma variável aleatória com distribuição log normal com parâmetros µ e σ. Então Y = log(X)~N(µ, σ2). ④ Suponha que X seja uma variável aleatória com distribuição log normal com parâmetros µ e σ. Então, a esperança de X é igual a µ.

Resolução: (0) Verdadeiro. Por definição, uma variável aleatória com distribuição Binominal conta o número de sucessos em n experimentos de Bernoulli independentes. (1) Verdadeiro. Por definição, temos: , onde

e

, onde

Assim,

e

, onde

.

.

, ou seja, Y será uma razão entre uma qui-

quadrado com 1 de liberdade e uma qui-quadrado de n graus, e, consequentemente, seguirá uma F1,n. (2) Verdadeiro. É possível provar que a soma de duas variáveis aleatórias independentes com distribuições qui-quadrado com v1 e v2 graus de liberdade possuirá, também, distribuição

qui-quadrado com v1 + v2 graus de liberdade. (3) Verdadeiro. Esta é a definição de uma variável aleatória log normal. Além disso, é possível deixar a relação entre a distribuição normal e a log normal mais clara: Sendo X uma variável aleatória com distribuição normal com parâmetros µ e σ, seguirá uma distribuição log normal de parâmetros µ e σ. Sendo X uma variável aleatória com distribuição log normal com parâmetros µ e σ, seguirá uma distribuição normal com parâmetros µ e σ. (4) Falso. Se X é uma variável aleatória com distribuição log normal de parâmetros µ e σ, pode-se provar que

.

Questão 14 Seja (X,Y) um vetor de variáveis aleatórias com distribuição normal bivariada, tal que E[X] = E[Y] = 0, Var[Y] = Var[X] = 1 e o coeficiente de correlação entre X e Y (ρ) é igual a 0,8. Podemos afirmar que: Ⓞ A distribuição marginal de X é uma distribuição normal com média 0 e variância 1. ① Se Z = X + Y, Z é uma variável aleatória que possui distribuição normal com média 0 e variância 2. ② As variáveis aleatórias X e Y são independentes. ③ Seja W = –X, podemos afirmar que W tem a mesma função de densidade de X. ④ A variável aleatória tem uma distribuição qui-quadrada com 1 grau de liberdade.

Resolução: (0) Verdadeiro. Como pode ser visto em Meyer (1983, Teorema 9.3) para a normal bivariada: “a) As distribuições marginais de X e Y serão e , respectivamente.” (1) Falso.

(2) Falso. Como pode ser visto em Paul L. Meyer, Teoria da Probabilidade 2a ed. no Teorema 9.3 para a normal bivariada: “b) O parâmetro ρ, que aparece acima, será o coeficiente de correlação entre X e Y.” Como , X e Y não são independentes. Observação: Foi provado na Revisão de Conceitos que correlação nula implica independência somente para o caso da normal. (3) Verdadeiro. Se X possui uma distribuição normal, por simetria da normal.

segue a mesma distribuição,

(4) Verdadeiro. Se

, então

.

Questão 15 Suponha que o número de vezes durante um ano que um indivíduo pega uma gripe seja modelado por uma variável aleatória com distribuição de Poisson com esperança igual a 4. Adicionalmente, suponha que uma nova droga baseada na vitamina C reduza a esperança para 2, para 80% da população (e que a variável aleatória ainda siga uma distribuição de Poisson), mas que não tenha nenhum efeito para os 20% restantes. Julgue as seguintes afirmativas: Ⓞ A probabilidade de um indivíduo que toma a nova droga, e é parte da população que se beneficia dela, pegar duas gripes em um ano é . ① A probabilidade de um indivíduo que não se beneficia da nova droga pegar duas gripes em um ano é

.

② A probabilidade de um indivíduo que não se beneficia da nova droga pegar no máximo duas gripes em um ano é . ③ A probabilidade de um individuo que toma a nova droga, selecionado aleatoriamente na população, pegar duas gripes em um ano é . ④ Suponha que um individuo escolhido aleatoriamente na população tenha pego duas gripes durante um ano em que ele tomou a nova droga. A probabilidade de ele fazer parte da parcela que se beneficia da nova droga é .

Resolução: Primeiramente note que a distribuição de Poisson é caracterizada por:

(0) Falso. Seja X a variável aleatória que conta o número de gripes, em um ano, que uma pessoa que tomou a nova vacina pegou. Sendo assim, , de forma que:

(1) Falso. Seja Y a variável aleatória que conta o número de gripes, em um ano, que uma pessoa que não tomou a nova vacina pegou. Sendo assim, , de forma que (2) Verdadeiro. Seja Y a variável aleatória que conta o número de gripes, em um ano, que uma pessoa que não tomou a nova vacina pegou. Sendo assim, , de forma que

. O resultado será: .

(3) Verdadeiro. Veja que:

(4) Falso. Aplicando o teorema de Bayes temos que:

Vimos em (0) que vimos em (3) que

, sabemos pelo enunciado que

e

, portanto: .

PROVA DE 2013 Questão 8 Em um dia de verão, você está sentado em um parque olhando as pessoas passarem. A probabilidade de uma pessoa estar andando de bicicleta é p, e a probabilidade de uma pessoa estar andando a pé é 1-p. As probabilidades dos eventos são independentes. Defina Y como o número de pessoas andando de bicicleta até que n pessoas passem por você. Defina Z como o número de pessoas andando de bicicleta que passam por você antes da primeira pessoa andando a pé passar por você. Com base nas informações acima, podemos afirmar que: Ⓞ Y tem uma distribuição binomial com parâmetros n e p. ① Z tem uma distribuição de Bernoulli com parâmetro p. ② A distribuição condicional de Y dado Z é:

③ A distribuição conjunta de Y e Z é

④ Y e Z são variáveis aleatórias independentes.

Resolução:

(0) Verdadeiro. Y é a soma de múltiplos eventos independentes, cada um com distribuição de Bernoulli. Logo Y terá distribuição binomial. (1) Falso. A distribuição da variável aleatória Z segue uma distribuição geométrica com parâmetro (1 – p). Observação: 1. Note que o sucesso aqui é o evento “alguém passar andando a pé”. 2. Nesse caso estamos contando o número de fracassos antes do primeiro sucesso. No caso clássico definimos uma variável aleatória, digamos X, que conta o número de tentativas até o primeiro sucesso. Note que Z = X – 1. (2) Verdadeiro. Sabendo o valor de z, temos que: (i) Se n ≤ z, todas as n primeiras pessoas passaram andando de bicicleta, dado que os primeiros passaram de bicicleta. Então: ƒY|Z(Y|Z) = 1 para y = n ≤ z, y, z

.

(ii) Se z ≤ y ≤ n, z ≠ n, então as z primeiras pessoas e, depois, mais y – z ≥ 0 pessoas passaram de bicicleta. Sabemos que a pessoa z + 1 passou a pé pela definição da variável Z. Então temos n – (z + 1) pessoas restantes, cada uma com probabilidade p de estar andando de bicicleta e (1 – p) de estar andando a pé. A soma desses n – (z + 1) seguirá distribuição binomial (por definição). Ou seja, como já sabemos que as z primeiras pessoas andaram de bicicleta, queremos saber a probabilidade de que as y – z pessoas seguintes andaram de bicicleta nesse total de n – (z + 1). Então, aplicando a definição da densidade de uma distribuição binomial, teremos: ƒY|Z(Y|Z) = ƒY(y – z) =

para z ≤ y ≤ n,z ≠ n, y, z

(iii) Nos casos restantes, temos probabilidade condicional igual a zero. No caso (i), com n ≤ z, y < n terá probabilidade 0 de ocorrer, dado que as z primeiras pessoas andavam de bicicleta (e, consequentemente, todas as n pessoas já foram vistas andando de bicicleta). Já no caso (ii), com z < n, y < z também ocorre com probabilidade 0, dado que as z primeiras pessoas andavam de bicicleta e não é possível que um número y de pessoas menor que z seja visto andando de bicicleta. (3) Verdadeiro. No primeiro caso, n ≤ z garante que y = n. A probabilidade de esse caso ocorrer é a probabilidade de termos n ≤ z. Como Z segue uma geométrica, aplicamos a definição de sua função densidade. Ou ainda, de forma sucinta, aplicando a definição de densidade condicional para o primeiro intervalo: ƒY,Z(Y,Z) = ƒY|Z(Y|Z)ƒZ(z) = pz(1 – p) para y = n ≤ z, y, z

.

O segundo caso é análogo ao segundo caso do item anterior, mas agora também precisamos considerar a probabilidade da ocorrência de Z. Ou seja, aplicando a definição de densidade condicional:

para z ≤ y ≤ n, z ≠ n, y, z

.

Nos casos restantes, de modo análogo ao item anterior, temos probabilidade zero de ocorrência, ou seja, a densidade condicional é nula. Logo, a densidade conjunta será nula também. (4) Falso. A probabilidade incondicional de Y é dada por: , para 0 ≤ y ≤ n, y

.

Repare que a probabilidade condicional de Y não é igual à sua probabi​lidade incondicional, logo elas não são independentes. Por exemplo, P(Y = n) = ƒY(n) = pn ≠ 1 = ƒY|Z(y = n|Z).

PROVA DE 2014 Questão 8 Julgue as afirmativas abaixo: Ⓞ Suponha que

, i=1,2,....,n, sejam variáveis aleatórias independentes, cada uma delas com distribuição normal

padrão, com média igual a 0 e variância igual a 1. Então,

tem distribuição qui-quadrado com n graus

de liberdade. ① Suponha que Z seja uma variável aleatória com distribuição normal padrão, e que X tenha uma distribuição quiquadrado com n graus de liberdade. Então,

tem distribuição t de student com n graus de liberdade.

② Suponha que T seja uma variável aleatória com distribuição t de student com n graus de liberdade. Então, o quadrado de T tem distribuição F com 1 e n graus de liberdade. ③ Suponha que X seja uma variável aleatória com distribuição qui-quadrado com n graus de liberdade. Então, o quadrado de X tem distribuição F com 1 e n graus de liberdade. ④ Suponha que W e V sejam variáveis aleatórias que possuem distribuições qui-quadrado independentes, com graus

de liberdade m e k, respectivamente. Então,

tem distribuição F com graus de liberdade m e k.

Resolução: (0) Verdadeiro. Como exposto na revisão de conceitos a soma dos quadrados de n variáveis aleatórias independentes, cada uma com distribuição normal padrão, segue distribuição QuiQuadrada com n graus de liberdade, exatamente como prevê o enunciado. (1) Falso. Como consta na revisão de conceitos, essa variável T segue distribuição t de Student se e somente se a variável aleatória com distribuição normal padrão, em seu numerador, e a variável aleatória com distribuição qui-quadrada, em seu denominador, são independentes. Como esta condição não é mencionada no enunciado, o item é falso. (2) Verdadeiro. Na revisão de conceitos, observa-se que a divisão de variáveis aleatórias independentes, cada uma com distribuição qui-quadrada, divididas pelos seus respectivos graus de liberdade segue distribuição F (v1, v2), onde v1 e v2 são os graus de liberdade, respectivamente, do numerador e do denominador. Observamos, também pela definição da t de Student na revisão de conceitos, que o quadrado de uma variável aleatória que segue esta última distribuição é:

na qual o numerador é uma variável aleatória com distribuição normal padronizada ao quadrado, ou seja, uma variável aleatória qui-quadrada dividida pelo seu grau de liberdade (igual a um), bem como o denominador (com grau de liberdade igual a n). De forma complementar, sabemos que as v.a.’s no numerador e denominador são independentes, do contrário T não seguiria uma t de Student, e, portanto, seus quadrados também são independentes. Como T2 consiste exatamente na divisão de Qui-quadradas divididas pelos seus graus de liberdade (1 e n), pode-se afirmar que esta variável segue distribuição F com parâmetros 1 e n, como diz o enunciado. (3) Falso. Pelo item 2, concluímos que o quadrado de uma variável aleatória com distribuição t de Student é que segue uma distribuição F com 1 e n graus de liberdade e não o quadrado de uma variável aleatória com distribuição qui-​quadrada. Outra possibilidade, já utilizada no item 2, é que a divisão de variáveis alea​tórias independentes com distribuições qui-quadradas segue uma distribuição F com v1 e v2 graus de liberdade. Neste caso, bastaria que o grau de liberdade da variável do numerador fosse igual a um e do denominador fosse igual a n.

(4) Verdadeiro. A explicação é a mesma do item (2), com exceção de que agora o enunciado informa diretamente que W e V são variáveis aleatórias independentes, cada uma com distribuição qui-quadrada.

PROVA DE 2015 Questão 3 Seja X uma variável aleatória cuja função densidade de probabilidade é dada por: , em que –α ≤ x ≤ α e α > 0 Podemos afirmar que: Ⓞ A probabilidade de que x se situe entre –α e –α/4 é igual a 3/8; ① A mediana de X é igual a zero; ② A probabilidade de que x se situe entre –α/2 e α/2 é igual a 3/4; ③ E[X]=0; ④ A variância de X é igual a

.

Resolução: (0) Verdadeiro. A probabilidade de que x se situe no intervalo

é dada pelo valor

da seguinte integral:

(1) Verdadeiro. A distribuição é uniforme, portanto a média é igual à mediana que é igual à moda. Como a média é zero, também o será a mediana. (2) Falso. Podemos ver facilmente que:

(3) Verdadeiro. A distribuição, como sabemos, é uniforme, ou seja,

. Pela

fórmula enunciada na revisão de conceitos, temos:

(Em outras palavras, a distribuição é uniforme e centrada em zero, portanto sua média, será zero.)

Observação: Outra forma de se fazer a questão, seria calculando a integral, que dará o mesmo resultado:

(4) Verdadeiro. Na revisão de conceitos pode ser encontrada a fórmula para a variância da distribuição uniforme. Desse modo, como , temos:

Observação: Outra forma de se resolver a questão, seria como descrito abaixo:

Como

, obtido no item 3, então:

Questão 6 Seja X uma variável aleatória com distribuição de Poisson, com função densidade de probabilidade dada por

e

enquanto Y é uma variável aleatória com

distribuição binomial, com função densidade de probabilidade dada por:

.

É correto afirmar que: Ⓞ

; ;

① ② ③ ④

; ; .

Resolução: (0) Falso. X tem distribuição Poisson, cuja média e variância são iguais a λ, como enunciado na revisão de conceitos. (1) Falso. Ver item 0. (2) Verdadeiro. Ver item 0.

(3) Verdadeiro. Y tem distribuição binomial com média np e variância np(1 – p), como enunciado na revisão de conceitos. (4) Falso. Ver item 3.

Questão 7 Sejam X1 e X2 variáveis aleatórias independentes, cujas distribuições são representadas por e

. Considere a seguinte combinação linear:

, em

que a e b são constantes. É correto afirmar que: Ⓞ Y tem distribuição normal; ① Y tem média igual a ② Y tem variância igual a

; ;

③ A distribuição de X1 é simétrica em torno de zero; ④ Se b = 0, Y tem variância igual a .

Resolução: (0) Verdadeiro. Como X1 e X2 são variáveis aleatórias independentes e seguem distribuição normal, a combinação linear delas também será normal. (1) Verdadeiro. Como X1 e X2 são variáveis aleatórias independentes:

(2) Falso. Como X1 e X2 são variáveis aleatórias independentes então, elas são não correlacionadas, ou seja . Portanto:

(3) Falso. Como, a distribuição de X1 é normal, logo ela é simétrica, e será em torno de sua média, que é igual a . Colocado de outra forma, a distribuição será simétrica ao redor de zero se e somente se , o que não está garantido. (4) Falso. Se b = 0, e utilizando a fórmula obtida no item 2, a variância de Y será:

Questão 14 Dois números são selecionados de forma aleatória entre 0 e 1. Os dois eventos independentes são definidos da seguinte forma: e . Qual a probabilidade ? Multiplique o resultado por 100.

Resolução: O enunciado da questão é mal formulado. Assim, assume-se que X e Y sejam os dois números selecionados aleatoriamente entre 0 e 1. Como os dois eventos são independentes,

Basta então trabalhar apenas com X. Como este número é selecionado aleatoriamente entre 0 e 1, qualquer valor tem a mesma chance de ser escolhido. Logo, X tem distribuição uniforme, ou seja . Sua densidade será . Logo:

Multiplicando o resultado por 100, chegamos ao resultado final que é 50.

3

Principais Teoremas de Probabilidade

REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Este resumo se baseou em Meyer (1983). Teorema de Tchebycheff. Teorema: Seja X v.a. tal que, E(X) = µ, c R. Então, se E(x – µ)2 < ∞ e ε for qualquer número maior do que zero, teremos:

Proposição: Algumas formas equivalentes são: (i) Para c = µ teremos:

(ii) Para c = µ, ε = kσ, teremos:

Esta equação mostra como a variância mede o “grau de concentração” da probabilidade próxima de E(X) = µ. Assim, sem sabermos a distribuição de X, este teorema nos dá um limite mínimo e máximo da v.a. estar distanciada kσ da média. Teorema: Se σ2 = 0 então: P[X = µ] = 1

ou seja, X = µ , com “probabilidade 1”. Neste caso X é chamada uma v.a. degenerada e portanto assume somente um valor e logicamente com probabilidade igual a 1. Lei (Fraca) dos Grandes Números (LGN) Formulação de Bernoulli: Sejam n repetições independentes de um experimento e seja X o número de vezes que ocorre o evento A (sucesso). Seja fA a frequência relativa que este evento ocorre. A média e a variância da v.a. X será E(X) = np e Var(X) = np (1 – p). Caso a v.a. seja frequência

, ou seja, não seja mais o número de vezes que A ocorre, mas sua relativa,

então

e .

A probabilidade populacional deste evento A ocorrer será P. Então, pela equação da Desigualdade de Tchebycheff teremos:

ou

Outra formulação da LGN: Teorema: Suponha uma sequência de variáveis aleatórias

iid (identicamente e

independentemente distribuídas), com E(Xi) = µ e Var(Xi) = σ2 < ∞. Seja que X também é uma v.a. pois é função de

). Assim E(X) = µ e

para todo ε > 0 teremos:

Prova: Aplicando a desigualdade de Tchebycheff à v.a. X teremos:

(Note . Então,

Sua probabilidade complementar será:

Tomando o limite n → ∞ teremos:

ou seja:

ou seja, a média amostral converge em probabilidade para a média populacional. Teorema do Limite Central (TLC) Teorema (Meyer, 1983, p.292, versão mais geral): Seja independentes com E(Xi) = µi e Var(Xi) = σ2i . Seja teremos:

uma sequência de v.a. . Sob certas condições gerais1

A convergência em distribuição é caracterizada pela convergência das funções distribuições (ou funções distribuições acumuladas, fda). Assim, a expressão anterior diz que o limite da fda de Zn, quando n tende para infinito, é igual à fda de uma normal padronizada. Outras formas de se escrever a expressão anterior é:

onde

. Para uma amostra suficientemente grande vale:

Uma outra versão mais simples do TLC exige além da independência que cada variável tenha a mesma distribuição. Essa versão segue abaixo: Teorema: Para uma amostra aleatória de variáveis aleatórias independentes X1,...,Xn, com a mesma distribuição, vale: , ou, ainda, manipulando o lado esquerdo: ,

com

. A relação acima diz que a expressão do lado esquerdo se aproxima de

uma Normal padronizada, conforme n → ∞. Assim, para uma amostra grande o suficiente, podemos dizer que vale aproximadamente:

, ou, ainda, manipulando o lado esquerdo:

.

PROVA DE 2006 Questão 5 São corretas as afirmativas: Ⓞ O Teorema de Tchebycheff é útil para se calcular o limite inferior para a probabilidade de uma variável aleatória com distribuição desconhecida quando se tem apenas a variância da população. ① Um estimador não tendencioso pode não ser consistente. ② Um estimador consistente pode não ser eficiente. ③ Sejam Y 1,...,Y n variáveis aleatórias independentes com média µ e variância finita. Pela Lei dos Grandes Números, E(m) = µ, em que m =

.

④ Sejam Y 1,...,Y n variáveis aleatórias independentes com média µ e variância finita. Pelo Teorema do Limite Central, a distribuição da média amostral m converge para uma distribuição Normal.

Resolução: Os itens (1) e (2) estão resolvidos no capítulo Inferência Estatística. (0) Falsa. É necessário saber também a média. (3) Falsa. E(m) = µ é válido pela própria propriedade da esperança, ou seja, . (4) Falsa. O TLC mais geral (MEYER, 1983, p. 292), enunciado na Revisão de Conceitos, não exige que as variáveis aleatórias tenham a mesma distribuição, apenas que sejam independentes. No caso desse item, as variáveis aleatórias têm a mesma média e variância. Assim:

Portanto, a versão mais geral do TLC, para o caso deste item, se resume a:

O item afirma que a média amostral (m = Y) segue uma distribuição Normal. O erro aqui é bem sutil. O que o TLC afirma é que o lado esquerdo da expressão acima (e não a média amostral) converge para uma distribuição Normal quando n tende para o infinito. Observação: O que poderíamos dizer é que, a partir da expressão acima, Y segue aproximadamente uma Normal para um n grande, ou seja: Y ≈ N(µ, σ2 / n).

Questão 14 O tempo de utilização de um telefone celular durante um dia qualquer é uma variável aleatória Normal, com média desconhecida e desvio padrão de 10 minutos. Por quantos dias se deve anotar os tempos de utilização do celular para que o intervalo de confiança de 95% para a média tenha amplitude de 2 minutos? Transcreva para a folha de respostas apenas a parte inteira do resultado.

Resolução: Essa questão foi anulada. Calculando o IC, teremos:

A amplitude de todo o intervalo deve ser de 2 minutos. Assim, devemos ter que:

Então, a parte inteira do resultado seria 384. Por isso, a questão foi anulada.

PROVA DE 2007 Questão 11 Julgue as afirmativas: Ⓞ O valor p de um teste de hipótese é a probabilidade de a hipótese nula ser rejeitada. ① O poder de um teste de hipótese é a probabilidade de se rejeitar corretamente uma hipótese nula falsa. ② Considere n variáveis aleatórias independentes. Pela Lei dos Grandes Números, quando n cresce, a média amostral converge em distribuição para uma variável aleatória Qui-​quadrada. ③ Pela desigualdade de Chebyshev, a probabilidade mínima de que o valor de uma variável aleatória X esteja contido no intervalo µ ± σh é 1-1/h².

④ Se duas variáveis aleatórias X e Y têm covariância nula, então elas são independentes.

Resolução: Os itens (0) e (1) estão resolvidos no capítulo Inferência Estatística. (2) Falsa. Por dois motivos: (i) Para aplicarmos a LGN as variáveis devem ser iid, ou seja, faltou dizer que são identicamente distribuídas, e (ii) a média amostral converge em probabilidade para a média populacional. (3) Verdadeira. Pela Desigualdade de Tchebycheff, enunciada na Revisão de Conceitos, observe que:

(4) Falsa. O inverso é válido, ou seja, duas variáveis aleatórias independentes têm covariância nula. A afirmação só seria válida se X e Y fossem distribuídas segundo uma Normal bivariada.

PROVA DE 2008 Questão 3 Sejam X1, X2, ... Xn n variáveis aleatórias independentes, igualmente distribuídas, com distribuição Poisson dada por

.

Julgue as afirmativas: Ⓞ Pela Lei dos Grandes Números ① Suponha que n > 5.

③ Pelo Teorema Central do Limite,

Resolução:

é um estimador consistente de E(Xi). é um estimador tendencioso de λ2.





aproxima-se da distribuição Normal quando n tende para o infinito.

é um estimador consistente de V(Xi).

é o estimador de máxima verossimilhança do parâmetro λ.

Os itens (1) a (4) estão resolvidos no capítulo Inferência Estatística. (0) Falsa. É pelo TLC que a média se aproxima da Normal quando n tende para o infinito, ou seja: T ≈ N(λ, λ / n).

PROVA DE 2009 Questão 8 Verifique se as afirmativas abaixo são verdadeiras: Ⓞ Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma determinada medida governamental é dada por = ∑ Xi /n. O menor valor de n para o qual a desigualdade de Tchebycheff resultará em uma garantia que P(|

– p| ≥ 0,01) ≤ 0,01 é 200.000.

① Quando o número de graus de liberdade δ cresce, a distribuição

aproxima-se de uma distribuição normal com

média δ e desvio padrão 2δ. ② Um intervalo de confiança de 99% para a média µ de uma população, calculado para uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%. ③ Seja X1, X2, ..., Xn uma amostra aleatória simples proveniente de uma população com distribuição de Pareto, cuja função de densidade é dada por f(x) = θ (1 + x)–(θ

,

+ 1)

0 < x < ∞, θ > 1. Então o estimador de máxima verossimilhança para θ é

.

④ Se existente, todo estimador de máxima verossimilhança calculado para uma amostra aleatória possui distribuição Normal em grandes amostras.

Resolução: (0) Falsa. Lembrando que a variância da proporção é:

Logo:

Assim:

onde p é a probabilidade de uma pessoa ser favorável a uma determinada medida governamental. Para termos n = 200000 dependerá de p. Assumindo que torna

a

variância

máxima

(cenário

(1) Falsa. O TLC não vale para aproximar a

mais

conservador),

, valor que temos

que

para a normal, visto que ela é o quadrado de

normais padronizadas. A aproximação que podemos afirmar é que:

PROVA DE 2010 Questão 4 Responda se verdadeiro ou falso: Ⓞ A diferença entre as medianas de uma distribuição F(a,b) e de uma distribuição χ diminui à medida que b → ∞. ① O Teorema Central do Limite justifica a afirmação: “Seja T uma variável aleatória, tal que T~tk–1, em que t representa uma distribuição t de Student, com k – 1 graus de liberdade, em que k é fixo. Então T converge em distribuição para uma Normal Padrão”. ② Sejam

e

. Ambos estimadores podem ser demonstrados

consistentes para σ2, supondo uma amostra aleatória de X~N(µ, σ2). ③ Uma moeda justa foi jogada 300 vezes e observou-se cara em 188 destas. A Lei dos Grandes Números justifica a afirmação: P(cara na 301a jogada|188 caras em 300 jogadas) 4) = 0,23. ④ Suponha que X seja uma variável aleatória com distribuição t de Student com n graus de liberdade. À medida que n aumenta, a distribuição de X se aproxima de uma normal padrão.

Resolução: (0) Falso. A média da distribuição de cada Xi será dada por:

ou seja, cada Xi tem a mesma média, visto que são variáveis aleatórias identicamente distribuídas, segundo o enunciado. A média amostral quando n → 11, será:

O que poderíamos afirmar é que, pela Lei dos Grandes Números (LGN), a média amostral deve convergir em probabilidade para a média populacional, quando n tende para inifinito, ou seja:

A afirmativa está errada quando: (i) não menciona convergência em probabilidade, (ii) menciona que converge para 11, quando na verdade seria para 6 (caso mencionasse convergência em probabilidade). (1) Verdadeiro. De acordo com o teorema do limite central, presente na Revisão de Conceitos:

em que, µ = p e σ2 = p(1 – p). (2) Verdadeiro. Primeiramente, a média da distribuição será:

Outra forma de se obter é simplesmente aplicar a fórmula da média (presente na Revisão de Conceitos) para uma distribuição uniforme no intervalo [α, β], cuja média é (α + β)/2. Nesse caso α = 0 e β = θ. Assim, o estimador não será viesado se a sua esperança for igual ao seu valor real. Assim sendo:

ou simplesmente usando a propriedade já conhecida que

, em que µ é a média da

distribuição, sendo nesse caso µ = θ/2. Logo:

(3) Falso. A distribuição t de student com v graus de liberdade tem média 0 e variância

, em que v = 4. Pela desigualdade de Tchebycheff, vale:

.

(4) Verdadeiro. Essa é uma propriedade da distribuição t de Student.

PROVA DE 2015 Questão 11 Sejam

e

. Julgue as seguintes afirmativas:

Ⓞ Xn converge em distribuição para X e Xn converge em probabilidade para X; ① Xn converge em distribuição para X; ② Xn converge em probabilidade para X; ③

;



.

Resolução: (0) Falso. Primeiro veja que Xn converge em distribuição para X. Para provar isso, note que:

ou seja, a média e a variância de Xn convergem para as de X. Como ambas têm distribuição normal, e esta é definida apenas pela média e variância, logo Xn converge em distribuição para X. Ou ainda, mais formalmente, escrevendo as funções de densidade de Xn, nota-se que:

.

Tomando o limite:

ou seja,

converge para

funções de distribuição Xn, para todo

, para todo

, o que implica que as

,convergem para a função de distribuição de X,

,

. Assim, pode-se afirmar que Xnconverge em distribuição para X.

Por outro lado, embora assintoticamente Xn e X tenham a mesma distribuição, faltam informações no enunciado que permitam provar que quando .

Utilizando a Desigualdade de Tchebycheff enunciada na revisão de conceitos:

Como não foi fornecido a Cov(Xn, X), não sabemos qual é o seu limite e, mesmo assim, o seu valor teria de ser igual a 2, para que

. Portanto, não podemos afirmar

que Xn converge em probabilidade para X.” (1) Verdadeiro. Xn converge para X em distribuição, como discutido no item 0. (2) Falso. Xn converge para X somente em distribuição, como discutido no item 0. (3) Falso. Note que a expressão quando

(4) Falso. Como calculado no item 0,

é equivalente a , que já foi discutida no item 0.

4

Inferência Estatística

REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Estimador Consistente Definição. Um estimador

do parâmetro θ, baseado em uma amostra aleatória de

tamanho n, é dito consistente se:

ou ainda:

Proposição. Um estimador

é consistente se:

ou

onde EQM( n)=Var( n)+viés²( n), e o viés( n)= E[ n]– θ. Estimadores de Máxima Verossimilhança (EMV) Propriedades dos EMVs. (i) podem ser viesados (em geral são); (ii) são consistentes;

(iii) são assintoticamente não viesados; (iv) têm distribuição assintótica normal; (v) são assintoticamente eficientes; (vi) princípio da invariância: eles são invariantes, ou seja, suponha que

seja um

estimador de MV de θ. Assim, uma estimativa de MV de g(θ) é g( ), para qualquer função g(.). Estimadores da Variância Populacional Propriedade.

é

um

estimador

é um estimador não viesado de σ2. Prova: Seja o estimador:

Reformulando-o:

viesado

de

σ2

e

Tomando sua esperança, temos:

e sabemos que E(Xi – µ)2 = Var(Xi) = σ2 e

. Assim:

Logo, tal estimador é viesado. Se fosse S2 tendencioso. Pois:

onde

não seria

. Tomando a esperança:

.

Proposição. σˆ2 é um estimador consistente.

Assim:

Seja S2

um estimador de σ2, que é não viesado. Não provaremos

aqui, mas pode ser demonstrado que:

Como σˆ2

S2, então:

E, portanto:

Assim, mostramos que σˆ2 é assintoticamente não viesado e sua variância é assintoticamente nula. Portanto, apesar de σˆ2 ser viesado, ele é um estimador consistente. Intervalo de confiança Definição. O Intervalo de Confiança (IC) para um parâmetro µ com nível de confiança de 1 – a, quando conhecemos a variância populacional (σ2), pode ser expresso como:

A “probabilidade” deste IC pode ser escrita como:

onde za/2 corresponde ao valor da tabela da normal padronizada cuja área acima dele é

igual a a/2 e, pela simetria da distribuição, a área abaixo de –za/2 é igual também a a/2. Assim, a área entre estes dois valores é igual a 1 – a. Importante: µ não é uma variável aleatória, mas um parâmetro. A interpretação correta da expressão acima é para o caso de zα/2 = 1.96 e α = 0.05: se construíssemos uma quantidade grande de intervalos de confiança da forma

, todos com

amostras de tamanho n, então 95% deles conteriam o parâmetro µ. Ou, ainda, se repetíssemos a amostragem de n observações um número muito grande de vezes (infinito), em 95% dessas repetições o IC conteria o valor verdadeiro da média populacional. A rigor, não podemos dizer que essa seria a probabilidade de que o intervalo​, já construído, contenha µ. Pois, se ele já foi construído, ele contém ou não contém µ, e, assim, a probabilidade deste evento seria um ou zero, respectivamente. Teste de Hipóteses Definição (P-Valor). O p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste. Definição (Erro do tipo I) O erro do tipo I é o evento de rejeitar a hipótese nula quando esta é verdadeira. A probabilidade α de se cometer tal erro é: α = P(Erro do tipo I) = P(rejeitar H0 | H0 é verdadeira) Esse α é o nível de significância e é definido a priori, ou seja, é arbitrário. Observação: Em testes de hipóteses simples, α é justamente a probabilidade do Erro tipo I. Mas em testes de hipóteses compostas é o máximo de tal probabilidade. Definição (Erro do tipo II) O erro do tipo II é o evento de não rejeitar a hipótese nula quando ela é falsa. Definição (Função poder) A função poder (ou potência) de um teste é a probabilidade de se rejeitar corretamente a hipótese nula quando esta é falsa. Ou seja, Poder = 1-Pr(Erro Tipo II). Assim, supondo que a hipótese nula seja: µ = µ0 a função poder depende do valor que µ assuma, quando µ ≠ µ0.

Proposição. Um teste de hipóteses é dito não viesado se: 1–β>α Poder do teste > P(Erro I) = significância, ou seja, α+β α. Poder do teste > P(Erro I) = significância, ou seja, α + β < 1. Assim, não necessariamente, a soma destes parâmetros é igual a um. (3) Falsa. O nível de confiança é determinado pelo construtor do teste. O p-valor é determinado por uma função da amostra obtida. (4) Verdadeira. Apesar de ser impreciso, podemos interpretar tal p-valor como sendo 1,5% o menor nível de significância máximo pelo qual a hipótese nula seria rejeitada.

Questão 5 São corretas as afirmativas: Ⓞ O teorema de Tchebychev é útil para se calcular o limite inferior para a probabilidade de uma variável aleatória com distribuição desconhecida quando se tem apenas a variância da população. ① Um estimador não tendencioso pode não ser consistente. ② Um estimador consistente pode não ser eficiente. ③ Sejam Y 1,...,Y n variáveis aleatórias independentes com média µ e variância finita. Pela Lei dos Grandes Números, E(m) = m, em que m =

.

④ Sejam Y 1,...,Y n variáveis aleatórias independentes com média µ e variância finita. Pelo Teorema do Limite Central, a distribuição da média amostral m converge para uma distribuição Normal.

Resolução: Os itens (0), (3) e (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (1) Verdadeira. A propriedade de não viés não tem uma associação direta com a propriedade de consistência. Um teorema útil, enunciado na Revisão de Conceitos, para mostrar que um estimador ˆθ é consistente, é verificar se:

O máximo que podemos dizer é que um estimador não tendencioso satisfaz a primeira condição acima, mas não podemos dizer que tal estimador atenderá necessariamente a segunda condição. (2) Verdadeira. Da mesma forma que no item 1, a propriedade de consistência não tem uma associação direta com a propriedade de eficiência. Ou seja, um estimador pode ser consistente, mas não apresentar a menor variância possível na classe de estimadores que está sendo comparado.

PROVA DE 2007 Questão 2 Considere uma amostra aleatória de n variáveis x1, x2, ..., xn, normalmente distribuídas com média µ e variância σ². Sejam Ⓞ ① ② ③ ④

e

. É correto afirmar que:

x e s2 são estimadores de máxima verossimilhança de µ e σ², respectivamente. x e s2 são não viesados. x e s2 são consistentes. Apenas x é consistente. Apenas x é não viesado.

Resolução: (0) Verdadeiro. Seja X uma v.a populacional cuja distribuição é uma normal, e dada uma amostra desta v.a. de tamanho n, podemos obter os valores dos parâmetros da normal (μ e σ²) que maximizam a função de verossimilhança. Ela é dada por:

Para simplificar, vamos maximizar uma transformação monotônica crescente desta função, que não altere o máximo:

Obtendo as CPOs:

Assim, este último estimador da variância é viesado, enquanto o da média é não viesado. (1) Falso. s2 é viesado, como foi provado na Revisão de Conceitos. (2) Verdadeiro. Ver Revisão de Conceitos – estimador consistente e estimador da variância populacional para uma prova de que o estimador da variância enunciado nesta questão é consistente, apesar de viesado. Agora, segue uma prova de que o estimador Foi provado no item (0) de 2003.2 que

é consistente:

é não viesado, logo:

O outro requisito para ser consistente é que o limite da variância seja nulo. Sabemos que . Logo, seu limite será:

Portanto,

é um estimador consistente da média populacional.

(3) Falso. Veja item anterior. (4) Verdadeiro. Veja item 1.

Questão 11 Julgue as afirmativas: Ⓞ O valor p de um teste de hipótese é a probabilidade de a hipótese nula ser rejeitada. ① O poder de um teste de hipótese é a probabilidade de se rejeitar corretamente uma hipótese nula falsa. ② Considere n variáveis aleatórias independentes. Pela Lei dos Grandes Números, quando n cresce, a média amostral converge em distribuição para uma variável aleatória Qui-​quadrada. ③ Pela desigualdade de Chebyshev, a probabilidade mínima de que o valor de uma variável aleatória X esteja contido no intervalo µ ± σh é 1-1/h². ④ Se duas variáveis aleatórias X e Y têm covariância nula, então elas são independentes.

Resolução: Os itens (2), (3) e (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (0) Falsa. Conforme visto na Revisão de Conceitos (teste de hipóteses), o p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste. (1) Verdadeira. Conforme visto na Revisão de Conceitos, poder de um teste é igual a 1 – β, onde β = P(Erro do tipo II), ou seja, rejeitar corretamente uma hipótese nula falsa.

PROVA DE 2008 Questão 3 Sejam X1, X2, ..., Xn, n variáveis aleatórias independentes, igualmente distribuídas, com distribuição Poisson dada por

.

Julgue as afirmativas: Ⓞ Pela Lei dos Grandes Números

① Suponha que n > 5.



③ Pelo Teorema Central do Limite,

aproxima-se da distribuição normal quando n tende para o infinito.

é um estimador consistente de E(Xi).

é um estimador tendencioso de λ2.

é um estimador consistente de V(Xi).



é o estimador de máxima verossimilhança do parâmetro λ.

Resolução: O item (0) está resolvido no capítulo Principais Teoremas de Probabilidade. (1) Falsa.

Utilizando a propriedade enunciada na Revisão de Conceitos (estimador consistente): lim E(T) ≠ 2λ E: .

Assim, .

Logo, o limite da esperança de T não converge para a média (λ) nem a variância de T não converge para zero. Então, T não é estimador consistente. (2) Verdadeira.

Assim,

onde, na segunda linha, utilizamos o fato de que Var(X) = σ2 / n = λ / n e E(X) = µ = λ. Assim, E(T) ≠ λ2. Observação: A rigor, este item seria falso, pois dever-se-ia garantir que n > 1. Para n = 1, teríamos que E(T) = λ2. Este seria um contraexemplo do que seria um estimador não viesado. (3) Falsa. É pela LGN, enunciada na Revisão de Conceitos do capítulo dos Principais Teoremas de Probabilidade. (4) Verdadeira. Montando a função de máxima verossimilhança:

Maximizando esta função, obtemos como CPO:

Questão 4 A respeito de testes de hipótese, é correto afirmar: Ⓞ Potência de um teste é a probabilidade de se rejeitar a hipótese nula quando esta for falsa. ① O nível de significância de um teste é a probabilidade de se cometer um erro tipo 1. ② O teste F de significância conjunta dos parâmetros em um modelo de regressão linear é unilateral.

③ Se uma variável é significativa ao nível de 1%, então ela é significativa ao nível de 5%. ④ p-valor = 1 – P(H0 falsa), em que P(A) é a probabilidade do evento A ocorrer.

Resolução: (0) Verdadeiro. Ver Revisão de Conceitos – função poder (teste de hipóteses). (1) Verdadeiro. Ver Revisão de Conceitos – erro tipo I (teste de hipóteses). (2) Falso. O teste F de significância conjunta é sempre bilateral. (3) Verdadeiro. Ao nível de significância de 5%, estamos sendo menos exigentes, ou seja, menos precisos. (4) Falso. Conforme Revisão de Conceitos (teste de hipóteses), o p-valor é a probabilidade, sob a hipótese nula, de que a estatística de teste assuma um valor que dê a mesma ou mais evidência contra a hipótese nula do que o valor assumido por ela no presente teste.

PROVA DE 2009 Questão 8 Verifique se as afirmativas abaixo são verdadeiras: Ⓞ Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma determinada medida governamental é dada por = ∑ Xi /n. O menor valor de n para o qual a desigualdade de Tchebycheff resultará em uma garantia que P(|

– p| ≥ 0,01) ≤ 0,01 é 200.000.

① Quando o número de graus de liberdade δ cresce, a distribuição χ aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ. ② Um intervalo de confiança de 99% para a média µ de uma população, calculado para uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%. ③ Seja X1, X2, ..., Xn uma amostra aleatória simples proveniente de uma população com distribuição de Pareto cuja função de densidade é dada por f(x) = q (1 + x)–(q verossimilhança para q é

, 0 < x < ∞, q > 1. Então o estimador de máxima

+ 1)

.

④ Se existente, todo estimador de máxima verossimilhança calculado para uma amostra aleatória possui distribuição Normal em grandes amostras.

Resolução: Os itens (0) e (1) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (2) Falsa. Ver Revisão de Conceitos – intervalo de confiança. (3) Verdadeira. Devemos montar a função de máxima verossimilhança:

Assim, devemos resolver o problema de maximização. Para isso, façamos uma transformação monótona sobre a função verossimilhança, por exemplo, passando o logaritmo:

Maximizando tal função:

A CPO será:

que é a expressão pedida no item. (4) Verdadeira. Conforme Revisão de Conceitos (EMV), uma das propriedades dos EMVs é o fato de que eles têm distribuição assintótica Normal.

Questão 9 Avalie se as afirmações abaixo são verdadeiras ou falsas: Ⓞ Para uma amostra de tamanho fixo, ao aumentar a probabilidade do erro tipo 1 aumentamos também o poder do teste. ① O valor p é o menor nível de significância para o qual o valor observado da estatística teste é significativo. ② Se a estatística teste é z = 2,75 e o valor crítico é z = 2,326, consequentemente o valor p é maior do que o nível de significância em um teste bicaudal e bilateral. ③ O poder de um teste de hipóteses é a probabilidade de rejeitar corretamente uma hipótese nula falsa. ④ Para um teste de hipótese de média com variância conhecida e igual a 4 para uma amostra aleatória de tamanho 16 e uma região crítica dada por [4,5, ∞[, o poder do teste para Ha: µ=5 é 0,84 (arredondando para duas casas decimais).

Resolução: (0) Verdadeira. Se aumentarmos α, P(Erro I) aumenta, mas diminui a P(Erro II). É o clássico problema da coberta curta, ou seja, se a puxarmos para cobrir a cabeça, descobrimos os pés e vice-versa. A única forma de reduzirmos tal problema seria aumentar a coberta. Ou seja, se aumentarmos a amostra, a variância amostral se reduz (caudas mais finas) e a P(Erro II) pode ser reduzida, sem alterar a P(Erro I). (1) Falsa. Mesmo problema que foi visto em Questão sobre o p-valor, em provas da Anpec, em anos anteriores. Essa é uma interpretação que auxilia no entendimento do p-valor, mas está errada. Uma interpretação correta foi dada no item 4, questão 4, na prova da Anpec de 2008, por exemplo. (2) Falsa. Não se sabe qual é a hipótese nula, de modo que é impossível determinar o p-valor do teste. (3) Verdadeira. Ver Revisão de Conceitos – função poder (teste de hipóteses). (4) Anulada, possivelmente porque esqueceram de informar que X tem distribuição Normal. Além disso, o uso do TLC aqui é inapropriado, devido ao pequeno tamanho da amostra. Supondo que X seja normal, a questão pode ser resolvida como segue: o poder do teste é a probabilidade de se rejeitar H0, dado que ela é falsa, ou seja, dado que Ha é válida. Supondo que Ha é válida, então µ = 5. Assim, devemos calcular:

que seria o poder do teste. Logo, o item seria verdadeiro.

PROVA DE 2010 Questão 4 Responda se verdadeiro ou falso:

Ⓞ A diferença entre as medianas de uma distribuição F(a, b) e de uma distribuição χ diminui à medida que b → ∞. ① O Teorema Central do Limite justifica a afirmação: “Seja T uma variável aleatória, tal que T~tk–1, em que t representa uma distribuição t de Student, com k – 1 graus de liberdade, em que k é fixo. Então T converge em distribuição para uma Normal Padrão”. ② Sejam

e

.

Ambos estimadores podem

ser demonstrados

consistentes para σ2, supondo uma amostra aleatória de X~N(µ, σ2). ③ Uma moeda justa foi jogada 300 vezes e observou-se cara em 188 destas. A Lei dos Grandes Números justifica a afirmação: P(cara na 301a jogada|188 caras em 300 jogadas) 5165,615) = 0,05. Em que Z é uma variável aleatória com distribuição χ 25000. Suponha que n = 5001. Defina (Xi –

e S2 =

)2/(n – 1). Se S² = 5,3, pode-se rejeitar a hipótese nula de que σ² = 5 ao nível de significância de 5%.

Resolução: Os itens (1) a (3) estão resolvidos no capítulo Principais Distribuições. (4) Verdadeiro. A hipótese nula será: H0 : σ2 = 5. A estatística para se testar uma hipótese sobre a variância é dada por:

Substituindo os valores, o valor da estatística é dado por:

Se considerarmos um teste unilateral, ou seja: H1 : σ2 > 5, então a região crítica a um nível de significância de 5% será: [5165.615,∞) segundo os dados do enunciado. Como o valor da estatística foi de 5300, então situa-se dentro desta região e, portanto, rejeitase H0, ao nível de significância de 5%. Observação 1: Se considerarmos um teste bilateral, ou seja: H1 : σ 2 ≠ 5 Então, pelo valor dado no item, podemos construir uma região crítica a um nível de significância de 10%, que será: [0, Zinf] [5165.615,∞) onde desconhecemos o valor crítico Zinf. Então, rejeitamos H0 a 10%. Mas o valor crítico Zsup = 5165.615 não é o correto para um teste bilateral a um nível de significância de 5%. Neste caso, deveríamos ter: P(Z > Zsup) = 0.025 E tal valor será, com certeza, maior do que 5165.615, pois a área a direita deve ser menor. Neste caso, com os dados do item, não podemos concluir se tal hipótese é rejeitada ou não. Assim, o item poderia ter sido anulado. Observação 2: Apenas por curiosidade, para que P(Z > Zsup) = 0.02 o valor de Zsup deve ser igual a 5198. Portanto, rejeitaríamos mesmo assim H0. Mas o aluno não é obrigado a saber esta informação.

PROVA DE 2012 Questão 1 Julgue as afirmativas:

Ⓞ O erro tipo I é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira. ① O erro tipo II é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira. ② O nível de significância de um teste é a probabilidade de rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. ③ Se o p-valor de um teste é maior do que o nível de significância adotado, rejeita-se a hipótese nula. ④ Suponha que o objetivo seja testar a hipótese nula de que a média populacional µ é igual a 0. Se esta hipótese é rejeitada num teste monocaudal contra a hipótese alternativa de que µ > 0, ela também será rejeitada num teste bicaudal contra a hipótese alternativa de que µ ≠ 0, adotando-se o mesmo nível de significância.

Resolução: (0) Falso. Erro é um evento, não uma probabilidade. Assim, erro do tipo I é definido como o evento de se rejeitar a hipótese nula quando a hipótese nula é verdadeira. (1) Falso. O erro do tipo II é o evento de se aceitar a hipótese nula quando ela é falsa. (2) Falso. O nível de significância de um teste é a probabilidade de ocorrência do erro tipo I, no caso de testes de hipóteses simples, e é o máximo dessa probabilidade, no caso de testes de hipóteses compostas. Assim, o nível de significância pode ser definido como o máximo da probabilidade de se rejeitar a hipótese nula quando a hipótese nula é verdadeira. (3) Falso. O valor p é o mais baixo nível de significância em que a hipótese nula pode ser rejeitada. Assim, se o nível de significância adotado é menor que o p-valor do teste, aceita-se a hipótese nula. (4) Falso. A um mesmo nível de significância, o módulo do valor crítico de um teste bicaudal é maior que de um teste monocaudal. O fato de o valor calculado da estatística de teste ter sido maior para o valor crítico no teste monocaudal (rejeitando-se, portanto, a hipótese nula) não implica necessariamente que ele será maior que o valor crítico do teste bicaudal. Assim, não podemos afirmar que a hipótese nula será rejeitada nesse novo teste.

Questão 2 Suponha que as notas de matemática dos alunos em um exame nacional aplicado a todas as escolas do ensino médio sejam normalmente distribuídas com média 500 e variância 1000. Um cursinho faz uma propaganda afirmando que pode melhorar as notas dos alunos em 30 pontos caso eles frequentem um curso noturno que resolve as questões dos exames anteriores. O órgão de defesa do consumidor quer testar se este curso noturno é de fato efetivo. O estatístico deste órgão de defesa do consumidor formula o seguinte problema: seja M a nota que o aluno i obtém após frequentar o curso noturno, suponha que M é normalmente distribuída com média desconhecida µM e variância igual a 1000. O teste de hipótese que ele gostaria de fazer é o seguinte: H0: µM = 500 vs µM > 500. [Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão, então Pr(|Z| > 1,645) = 0,10 e Pr(|Z|>1,96) = 0,05.] Com base nos dados do problema, julgue as seguintes afirmativas: Ⓞ O órgão de defesa do consumidor irá conduzir o estudo usando uma amostra aleatória de 40 alunos que frequentaram este curso noturno. Se µ M = 530, a distribuição do teste escore médio deste grupo de 40 alunos é uma distribuição normal com média 530 e variância 1000. ① Após terminarem o curso, os 40 alunos fazem o exame nacional e obtêm na média uma nota de 520 em

matemática. Neste caso, a estatística do teste sugerido pelo estatístico é

, e podemos

afirmar que temos evidência para rejeitar a hipótese nula do teste proposto pelo estatístico ao nível de 5% de significância. ② Após terminarem o curso, os 40 alunos fazem o exame nacional. Usando as notas destes 40 alunos no exame, calculamos o p-valor do teste sugerido pelo estatístico e obtemos o p-valor de 0,081. Neste caso, podemos rejeitar a hipótese nula ao nível de 5% de significância. ③ Mantendo o nível de significância fixo, para diminuir o poder do teste, o estatístico pode aumentar o tamanho da amostra. ④ Mantendo o tamanho da amostra fixo, se o estatístico quiser aumentar o poder do teste, deve aumentar o nível de significância do teste.

Resolução: (0) Falso. A distribuição do score médio amostral,

, possui esperança e

variância

. Assim,

segue distribuição normal com média 530 e variância 25.

(1) Falso. A estatística do teste sugerido pelo estatístico está errada. O valor calculado correto da estatística é: unilateral à direita, o intervalo de confiança a 5% de significância é se a hipótese nula a esse nível de significância.

. Como esse é um teste . Assim, rejeita-

(2) Falso. O p-valor é o mais baixo nível de significância em que a hipótese nula pode ser rejeitada (Gujarati). Assim, sendo o nível de significância 5% menor que o p-valor do teste, 8,1%, aceita-se a hipótese nula. (3) Falso. Aumentar o tamanho da amostra aumenta o poder do teste, pois aumenta a quantidade de informações disponível. (4) Verdadeiro. O poder do teste é definido como a probabilidade de se rejeitar corretamente a hipótese nula, ou seja, rejeitá-la quando ela é falsa. Desta forma, podemos escrever a função poder como 1 – P(Erro do tipo II). Assim, pode-se aumentar o poder do teste aumentando a probabilidade do erro do tipo I, ou seja, rejeitar a hipótese nula quando ela é verdadeira.

Questão 9 Julgue as seguintes afirmativas: Ⓞ Seja variáveis aleatórias independentes e identicamente distribuídas tais que , então ① Seja

. Se

.

uma sequência de variáveis aleatórias. Esta sequência de variáveis aleatórias converge em

probabilidade para uma constante µ se e somente se esta sequência de variável aleatória converge em distribuição para µ. ② Seja uma amostra aleatória com média e variância . Podemos afirmar que com ③ Seja

, converge para uma distribuição normal com média µ e variância

variáveis aleatórias independentes e identicamente distribuídas com média µ e variância . Seja

para

.

em que

. Neste caso,

é um estimador consistente

.

④ Se Y é uma variável aleatória tal que

, então podemos afirmar que

para

.

Resolução: Os itens (0), (1) e (4) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (2) Falso. Como a média

, a variável aleatória

apresenta média

.

Observação: Além da explicação acima, aplicando o TLC poderíamos dizer que: ,

e, para um n suficientemente grande, poderíamos dizer que W segue aproximadamente uma normal com média

e variância

, mas não

dizer que W converge exatamente em distribuição para uma normal. (3) Verdadeiro. S2 é consistente, apesar de viesado, pois converge em probabilidade para o valor original da variância. Observação: Foi provado na Revisão de Conceitos que este estimador tem média: , cujo limite é

quando n tende para infinito. Sua variância foi mostrada ser igual a:

, cujo limite é zero, quando n tende para infinito. Logo, pela proposição enunciada na Revisão de Conceitos, quando o limite da esperança é igual ao parâmetro populacional verdadeiro e o limite da variância é nulo, então podemos dizer que tal estimador é consistente.

Questão 10 São corretas as afirmativas: Ⓞ Suponha que

sejam variáveis aleatórias independentes e identicamente distribuídas, com

distribuição de Bernoulli com parâmetros p. Então, pela Lei dos Grandes Números, à medida que

,

converge para p. ① Suponha que

sejam variáveis aleatórias independentes e identicamente distribuídas, com

distribuição uniforme no intervalo [0,1]. Seja

,

. Pelo Teorema Central do Limite, à medida que

aproxima-se de uma distribuição normal padrão.

② Suponha que

sejam variáveis aleatórias independentes e identicamente distribuídas e que . Então, se definirmos,

③ Suponha que

,

.

sejam variáveis aleatórias independentes e identicamente distribuídas, com

distribuição log normal com parâmetros µ e σ. Seja µ. ④ Suponha que

é um estimador consistente de

sejam variáveis aleatórias independentes e identicamente distribuídas e que . Então, se definirmos

eficiente de

. Então,

e

,

será um estimador

.

Resolução: Os itens (0), (1) e (2) estão resolvidos no capítulo Principais Teoremas de Probabilidade. (3) Falso. Como cada Xi segue uma distribuição normal, então com parâmetros µ e σ2/n. Assim,

também segue uma normal

segue uma lognormal, cujo valor esperado é:

e a variância será:

Para verificarmos consistência, basta tomar o limite da esperança e variância. No primeiro caso, o limite será igual a e no segundo caso, igual a , que é diferente de

zero. Logo,

não é um estimador consistente de µ (pois seu valor esperado não converge

para tal parâmetro), nem de (pois apesar de seu valor esperado convergir para tal parâmetro, a sua variância não converge para zero). (4) Falso. Como é um estimador viesado de σ2 (como mostrado na Revisão de Conceitos), ele não pode ser um estimador eficiente para σ2. A título de recordação, um estimador eficiente é definido como aquele que é não viesado e possui variância mínima entre todos os estimadores. A variância mínima é definida pelo limite inferior de Cramér-Rao.

PROVA DE 2013 Questão 3 Suponha que o presidente de uma distribuidora de energia afirme que 80% dos seus consumidores estão muito satisfeitos com o serviço que recebem. Pra testar essa afirmação, um jornal entrevista 100 consumidores em um município, utilizando uma amostra aleatória. Entre os consumidores entrevistados, 73 afirmaram que estão muitos satisfeitos. (Dica: na sequência, assuma que o tamanho da amostra é suficientemente grande para que utilizemos a distribuição normal.) É correto afirmar que: Ⓞ Para aferir se a percentagem dos consumidores que estão muito satisfeitos é igual a 80%, é possível empregar um teste de hipótese bicaudal. ① Assumindo que a variância da proporção é conhecida, a um nível de significância de 5%, é possível rejeitar a hipótese que 80% dos consumidores estão muito satisfeitos com o serviço. [Nesta questão, pode ser útil saber que a 5% de significância a estatística é Z = 1,96]. ② Assumindo que a variância da proporção é conhecida, se estivermos interessados em testar se a percentagem dos consumidores que não estão muito satisfeitos com o serviço é menor do que 80%, é possível rejeitar a hipótese nula ao nível de significância de 5%.[Nesta questão pode ser útil saber que a 5% de significância a estatística é Z = –1,645]. ③ Um intervalo de confiança de 95% para a proporção dos consumidores que estão muito satisfeitos com o serviço incluirá o valor 80%. [Nesta questão pode ser útil saber que a 5% de significância a estatística é Z = 1,96]. ④ Suponha que estejamos interessados em testar, a um nível de significância de 5%, se a proporção dos consumidores que estão muito satisfeitos com o serviço é menor do que 80%. A probabilidade do erro tipo II não dependerá do valor da proporção verdadeira de consumidores muito satisfeitos com o serviço.

Resolução: (0) Verdadeiro. A hipótese nula nesse caso será: H0: p = 80% em que p é a percentagem de consumidores satisfeitos. Para se testar tal hipótese, pode-se utilizar um teste bicaudal, cuja hipótese alternativa será: H1: p ≠ 80% Observação: O teste poderia também ser unicaudal? Não, pois não foi mencionado se a preocupação é que p seja maior ou menor que 80%, apenas que seja igual. Assim o teste bilateral é apropriado, pois a alternativa considera a possibilidade de qualquer desigualdade estrita.

(1) Falso. A variância, nesse caso, será: σ2 = p(1 – p) = 0,8 × 0,2 = 0,16

Como Z ficou fora da região crítica, não podemos rejeitar a hipótese nula. (2) Verdadeiro. A estatística Z é a mesma do item anterior. Apenas o valor crítico muda, pois a hipótese alternativa será agora unilateral à esquerda: H1: p < 80%. Assim: Z = –1,75 < –1,645. Como Z ficou dentro da região crítica, rejeitamos a hipótese nula. (3) Verdadeiro. Calculando o limite superior do intervalo de confiança, teremos:

pc1 = 0,73 + 1,96 0,04 = 0,0784 + 0,73 = 0,8084 80,84% Analogamente para o limite inferior: pc2 = 0,73 – 1,96 0,04 = – 0,0784 + 0,73 = 0,6516 65,16% O valor de 80% está contido no intervalo de confiança de 95%, que é [65,16%, 80,84%]. (4) Falso. A hipótese alternativa é a mesma do item (2). A probabilidade de erro do tipo II irá se alterar se a proporção verdadeira de consumidores satisfeitos com o serviço mudar. Ou seja: Pr(Erro Tipo II) = Pr(Aceitar H0|H0 é falsa) = Pr(Aceitar H0|p < 0,8)

Assim, quanto menor o p, menor a chance de se aceitar erradamente H0. Ou ainda, maior a chance de se rejeitar corretamente H0 (maior a potência do teste).

Questão 7 X1,...,Xn é uma amostra aleatória de tamanho N de uma população com E[Xi ] = θ1 e Var[Xi ] = θ2.

Definimos quatro estatísticas:

Em relação às quatro estatísticas, podemos afirmar que: Ⓞ T 2 é um estimador viesado para θ1 e o viés é igual a

.

① Pela Lei dos Grandes Números, T 1 converge em distribuição para uma distribuição normal com média θ1 e variância

.

② A variância de T 3 é menor que a variância de T 1. ③ T 3 é um estimador consistente para

.

④ Usando a desigualdade de Tchebycheff, podemos mostrar que Pr[T 4 ≥ ξ] ≤

.

Resolução: Os itens (1) e (4) estão resolvidos no capítulo de Principais Teoremas de Probabilidade. (0) Verdadeiro. A esperança do estimador será:

O viés do estimador, portanto, será:

(2) Verdadeiro. Para ver isso, basta calcular a variância de cada um dos estimadores:

em que, nas segundas igualdades das duas primeiras expressões, usamos o fato de X1 ,..., Xn ser

uma amostra aleatória, o que significa que tais variáveis aleatórias são independentes e, portanto, cada par de variáveis tem covariâncias nulas. Assim, a variância da soma é a soma das variâncias. (3) Verdadeiro. O estimador será consistente se atender duas condições (enunciadas na Revisão de Conceitos): (i) (ii) ou seja, o estimador será consistente se o limite de sua esperança for igual ao seu valor real (

)

e o limite de sua variância for nulo. Assim: (i)

(ii)

em que, a variância da condição (ii) foi obtida no item anterior. Logo T3 é um estimador consistente de

.

Questão 15 Usando uma base de dados que contém informação sobre 437 firmas, estimamos uma função de produção Cobb-Douglas: (0,003) = 0,99 + 0,64Li + 0,45Ki , (0,003) (0,035) (0,023)

R2 = 0,91 Em que denota o produto (em logaritmo), Li representa o insumo trabalho (em logaritmo) e Ki , o insumo capital (em logaritmo). Baseado no resultado acima, julgue as afirmativas: Ⓞ Considerando que o tamanho da amostra é grande o suficiente para que aproximações assintóticas sejam válidas, é possível rejeitar a hipótese de que o retorno marginal do insumo capital, mantendo o insumo trabalho constante, é igual a zero ao nível de significância de 5%. [Nesta questão, pode ser útil saber que a 5% de significância a estatística é t = 1,645]. ① Mantendo o capital em dado nível, um aumento de 10 para 11 unidades de trabalho causa um aumento no produto de 0,99 + 0,64=163. ② Com base nas informações acima, podemos testar a hipótese de retornos constantes de escala, isto é, a hipótese nula de que βL + βK = 1. ③ Com base nos dados acima, construímos um intervalo de 95% de confiança para βK, [0,41, 0,495]. Supondo que o tamanho da amostra seja grande o suficiente para que aproximações assintóticas sejam válidas, com base

neste intervalo, podemos rejeitar a hipótese nula de βK =

ao nível de significância de 5%.

④ Suponha que estimamos uma nova função de produção que relaciona o produto com capital, trabalho e uma medida das condições climáticas enfrentadas por cada firma. Podemos afirmar que R2 deste modelo será maior que 0,91.

Resolução: (0) Verdadeiro. Fazemos um teste t e comparamos o valor observado da sua estatística de teste com os valores críticos da distribuição Normal, pois, como enunciado no item, o tamanho da amostra é grande. Assim:

Como esse valor é maior que 1,96 (e não 1,645), podemos rejeitar a hipótese de que o retorno marginal do capital seja zero a um nível de significância de 5% e, consequentemente, também rejeitamos a de 10% (que aí sim o valor crítico associado para um teste bilateral é de 1,645 para tal nível de significância). (1) Falso. Como a relação é log-log o aumento deveria ser dado em termos percentuais. Ou seja, um aumento de 10 para 11 unidades de trabalho significa um aumento de 10%, o que implica em um aumento de 10•0,64% = 6,4% sobre o produto. (2) Falso. Para testarmos tal hipótese, devemos calcular a seguinte estatística t:

Assim, a única informação faltante é Cov

. Logo não é possível realizar o teste.

(3) Verdadeiro. Como βK = 2/3 0,667 está fora do intervalo de confiança, podemos rejeitar a hipótese nula ao nível de confiança de 5%. Observação: O intervalo de confiança calculado pode ser verificado:

IC95%(βK) =

= [0,45 – 1,96 0,023, 0,45 + 1,96 0,023] = [0,40492, 0,49508] [0,41, 0,495]. (4) Falso. Ao adicionar novas variáveis ao modelo de regressão, é correto afirmar que o R2 não irá diminuir, porém não é certo que irá aumentar (Veja a prova dessa afirmação, na Revisão de Conceitos – na parte de Coeficiente de Determinação).

PROVA DE 2014 Questão 9 Seja X uma variável aleatória com distribuição normal, com média µ e variância σ2. Considere duas amostras aleatórias independentes de X. Cada uma das amostras tem tamanho n1 e n2, e possuem médias

e

. Podemos usar dois estimadores para a média populacional,

e

. Julgue as seguintes afirmativas a respeito dos estimadores: Ⓞ

é um estimador não-viesado para a média populacional.



é um estimador não-viesado para a média populacional.



possui menor variância que



é um estimador mais eficiente, isto é, possui menor erro quadrático médio que



é um estimador consistente para a média populacional.

. .

Resolução: (0) Verdadeiro. Basta encontrar o valor esperado do estimador:

Onde, da primeira para a segunda linha, faz-se uso do fato de que

, pois

são médias de amostras da mesma variável aleatória. Assim, como o valor esperado do estimador é o próprio parâmetro, demonstra-​se que inexiste viés, de acordo com a afirmação enunciada. (1) Verdadeiro. Pelo mesmo procedimento do item (0):

Onde se fez uso do mesmo fato do item anterior. Portanto, conclui-se que este estimador também é não viesado. (2) Falso. Vamos obter a variância de ambos:

Fazendo-se uso, para obter a segunda igualdade, do fato das duas amostras serem independentes e, portanto, a variável aleatória

é independente da variável aleatória

Utilizando a propriedade da variância da média amostral:

Comparando as duas variâncias e manipulando algebricamente, encontramos:

.

De onde se conclui que a afirmativa é falsa, pois essa condição só ocorre com igualdade. Colocada de forma análoga:

Logo,

é no mínimo igual à variância do outro estimador.

(3) Falso. Como os estimadores são não-viesados – demonstrado nos itens (0) e (1) – o erro quadrático médio é simplesmente a variância. Assim, basta comparar a variância para saber qual é mais eficiente. Como visto no item (3), a variância do estimador não é menor que a do outro estimador, portanto

não é mais eficiente.

(4) Verdadeiro. Consistência do estimador implica em viés e variância que tendem assintoticamente a zero. Como é não-viesado, basta observar se a fórmula da sua variância tende a zero conforme as amostras se expandem. É simples notar que isso de fato ocorre quando as duas amostras crescem indefinidamente​:

Questão 11 Duas turmas do curso de estatística fazem o mesmo exame final. Duas amostras aleatórias de tamanho 9 e 4 são selecionadas da turma A e da turma B, respectivamente. A amostra da turma A teve nota média amostral ( média amostral (

) de 72 e variância amostral (

) de 76 e variância amostral (

A têm distribuição normal com média normal com média

e variância

e variância

) de 16. A amostra da turma B teve nota

) de 25. Vamos assumir que as notas da turma . As notas da turma B têm uma distribuição

.

[Para a resolução desta questão talvez lhe seja útil saber que se t tem distribuição t-student, Pr(|t|>3,15)=0,05, e se Z tem uma distribuição normal padrão, Pr(|Z|>1,96)=0,05 ] Ⓞ O professor da turma A encontra um intervalo de 95% para as notas da sua turma de [53;97]. ① Suponha que queremos testar se os desempenhos das turmas A e B são iguais. Para isso, fazemos o seguinte teste de hipótese:

vs

. Para realizar o teste acima, podemos usar a seguinte

estatística de teste:

.

② A estatística t no item (1) segue uma distribuição t-student com 13 graus de liberdade. ③ Para encontrar a região de rejeição para o teste acima, fixamos o nível de significância α em determinado valor e encontramos o valor crítico que determina a partir de quais valores rejeitamos a hipótese nula. ④ Suponha que o professor da turma A queira testar a seguinte hipótese:

vs

. Neste

caso, se ele utilizar a seguinte estatística de teste

, ele irá rejeitar a hipótese nula a 5% de

significância.

Resolução: (0) Falso. Como sabemos apenas a variância amostral, devemos usar um intervalo de confiança para a t de Student. Temos que os extremos do intervalo de confiança são:

O que estabelece um intervalo de confiança:

(1) Falso. Discordância do gabarito Anpec. Inicialmente note que as amostras das duas turmas devem ser independentes entre si, o que não foi afirmado no enunciado. Assumindo que sejam, repare que, se as amostras seguem distribuição normal, então suas médias também seguem uma distribuição normal:

Adicionalmente, a diferença entre as médias segue:

Padronizando essa variável, podemos definir:

Por outro lado, a normalidade da distribuição de notas implica que:

Logo, podemos definir a variável U como:

Como Y e U são independentes – este é um resultado clássico advindo da independência da média e variância amostral utilizado na derivação dessa estatística de teste –, daí decorre que:

segue uma distribuição t de Student com

graus de liberdade. Sob a

,

temos que:

Representando essa estatística T em função da estatística t do enunciado do item, temos:

A estatística T é a correta para o teste. Logo o a estatística t afirmada no item está incorreta. (2) Falso. O item é incorreto por duas razões. Em primeiro lugar, como exposto no item anterior, a variável t aqui apresentada não segue distribuição t de Student. Adicionalmente,

ainda que seguisse, pela definição de uma t de Student na revisão de conceitos, a variável do item (1) teria graus de liberdade. (3) Verdadeiro. Essa é a descrição exata de como proceder com o teste de hipóteses. Primeiro se constrói a região de rejeição (crítica) a partir de um valor crítico. Se a estatística de teste estiver nessa região rejeita-se a hipótese nula. (4) Verdadeiro. Trata-se de um teste de hipóteses unicaudal. A estatística do teste no enunciado é exatamente a estatística t que deve ser utilizada, visto que não é fornecida variância populacional. Assim, basta substituir os valores apresentados para a turma B e comparar com o valor crítico da t de Student. Vale observar que não é concedido o valor crítico para este teste, pois ele é unicaudal. 3,15 é o valor crítico para o teste bicaudal de nível 5%, o que significa que é o valor crítico para o teste unicaudal de 2,5%. No entanto, é suficiente que a estatística do teste seja significativa a 2,5%, para garantirmos que a afirmativa é verdadeira. Assim:

Mostrando que, de fato, vale o enunciado do item.

PROVA DE 2015 Questão 12 Seja

uma amostra aleatória de tamanho N com distribuição exponencial: ,

Seja

, em que c é um número real.

Julgue as seguintes afirmativas: Ⓞ Podemos afirmar que é um estimador não viesado para θ; ;



② O erro quadrado médio do estimador é

. O erro quadrado médio é minimizado quando c é igual

a 0,5; ③ Se c=1,

é um estimador não viesado para θ;

④ Se c=1,

é um estimador viesado para θ e o seu erro quadrado médio é igual a θ2.

Resolução: (0) Falso. A média de uma exponencial definida no enunciado da questão é igual a θ, ou seja,

, cuja fórmula está enunciada na revisão de conceitos. Assim sendo,

é um

estimador não viesado de θ. Mas:

Logo,

será um estimador viesado de θ, a menos que c = 1, o que não foi garantido no

enunciado. Observação: Caso não fosse lembrada a fórmula da média da exponencial, seria possível calculála:

Fazendo

(1) Falso.

teríamos:

, note que o termo da variância de

não estará

em função de c, portanto não é possível chegar à expressão que a questão afirma ser a variância. Mesmo assim, vamos calculá-la, pois ela será utilizada no próximo item. A partir da revisão de conceitos, a fórmula da variância de uma distribuição exponencial será:

Logo:

Como

é uma amostra aleatória, logo são independentes. Assim:

Observação: Caso não fosse lembrada a fórmula da variância da exponencial, seria possível calculá-la:

Fazendo

Fazendo

teríamos:

teríamos:

Portanto,

.

(2) Falso (Discordância do gabarito da Anpec). A fórmula do Erro Quadrático Médio (EQM), enunciada na revisão de conceitos, é dada por:

Substituindo os valores obtidos nos itens 0 e 1:

O EQM é minimizado quando:

(3) Verdadeiro. Como afirmado no item 0,

será um estimador não viesado para θ apenas

quando c = 1. (4) Falso.

será um estimador não viesado para θ quando c = 1, como afirmado no item 0 e

3. Observação: O EQM, quando c = 1, será, pela equação obtida no item 2:

Questão 15 Sejam X1, X2, X3 e X4 variáveis aleatórias independentes e identicamente distribuídas de uma população com média e variância . Considere os seguintes estimadores para :

Com base nesses três estimadores, são corretas as afirmativas: Ⓞ Os três estimadores são não tendenciosos;

① m1 é o estimador com maior variância; ② Os três estimadores são igualmente eficientes; ③ m3 é o estimador com menor variância; ④ O estimador m2 é não tendencioso e tem menor variância do que o estimador m1.

Resolução: (0) Verdadeiro. Todos os estimadores são não viesados, pois todos eles têm média igual a μ.

(1) Falso. Calculando a variância dos estimadores (note que as variáveis são independentes, logo a variância da soma é a soma das variâncias):

Pode-se constatar que: m3 < m1 < m2 , ou seja, m2 é o estimador de maior variância, e não m1. (2) Falso. Como todos são não viesados, basta comparar as variâncias: m3 < m1 < m2 . m3 é mais eficiente que m1 e m2 por possuir menor variância. Analogamente, m1 é mais eficiente que m2. (3) Verdadeiro. Como foi visto no item 1, m3 é o estimador de menor variância. (4) Falso. m2 é não tendencioso, mas possui maior variância que m1, como visto nos itens 0 e 1, respectivamente.

5

Análise de Regressão I: Modelos de Uma Equação

REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Mínimos Quadrados Ordinários (MQO) Vamos derivar as Condições de Primeira Ordem (CPO) do problema de minimização dos Mínimos Quadrados Ordinários (MQO) para o caso geral do modelo de regressão linear múltipla (RLM): yi = β0 + β1x1i + β2x2i + ... + βkxki + ui, onde temos k variáveis explicativas. Os estimadores MQO são obtidos através do seguinte problema de minimização:

As CPOs serão:

Outra forma útil das CPOs pode ser obtida ao substituirmos o somatório dos resíduos

nas equações acima:

Mais uma forma também útil é separar o somatório de cada equação das primeiras CPOs obtidas:

A primeira CPO acima pode ser escrita ainda como:

Fórmula do Estimador MQO (EMQO) dos regressores em termos de somatório:

em que

é o resíduo de uma regressão de xj contra todos os outros regressores. Esta fórmula

dá outra interpretação do efeito parcial de xj sobre y (que é medido pelo

, o qual é a

derivada parcial de y em relação xj). O resíduo representa a parte de xj que não está correlacionada com os outros regressores. Ou seja, esse resíduo pode ser interpretado como a parte de xj que não está relacionada com os demais regressores. Assim mede o efeito de xj sobre y, isolado o efeito dos demais regressores. A fórmula do coeficiente angular para o caso de regressão linear simples (RLS) se resume a:

Fórmula do Estimador MQO (EMQO) em termos matriciais:

Fórmula da variância do EMQ para um modelo de regressão linear múltipla (RLM) em termos de somatório:

onde aqui

j expressa o estimador do coeficiente da j-ésima variável explicativa, e R2j é o R2 da regressão de xj contra os demais regressores. Se

houver o problema de multicolinearidade, ou seja, se existir correlação alta entre os regressores (por exemplo, correlação alta entre xj e um conjunto dos demais), o R2j será alto e, assim, a variância também será alta. A estatística t, que é

, será baixa, e os estimadores serão pouco

significativos. A estatística F e R2 do modelo de regressão de y contra x não depende da correlação entre os regressores (apenas do SQR e SQT, ou seja, da soma dos quadrados dos resíduos e da variável dependente), de forma que, se tivermos regressores relevantes para explicar y, então a estatística F e R2 indicará que o modelo como um todo terá um alto poder explicativo. Propriedade de Não Viés do EMQO. Considere um modelo de RLM em termos matriciais: y = Xβ + u. Assumindo X não estocástico, tomando a esperança do EMQO em versão matricial, obtemos:

) = E[((X'X)–1 X'y)] = E[(X'X)–1 X'(Xβ + u)] = E[(X'X)–1 X'Xβ] + E[(X'X)–1 X'u)] = β +

E(

E[(X'X)–1 X'u] = β + (X'X)–1 E[(X'u)] = β, onde vale a hipótese E[(X'u)] = 0. Ou seja, se X não for correlacionado com u o EMQO será não viesado. Teorema de Gauss-Markov Teorema de Gauss-Markov: Seja o modelo de regressão linear simples yi = β0 + β1 xi + ui, tal que E(ui) = 0 e V(ui) = σ2 i = 1, ..., n e E(uiuj) = 0 i ≠ j; e xi não estocástico i = 1, ..., n, dentro da classe dos estimadores lineares e não viesados, os EMQ são os que apresentam a menor variância. Prova: Seja a RLS: yi = β0 + β1xi + ui. O EMQ pode ser escrito como:

Tome-se um outro estimador dos

, o qual é linear (pois é uma combinação linear

) e não viesado. Para que seja não viesado, devemos observar que:

Para que este outro estimador seja não viesado, deve-se ter que:

Para ocorrer isso, devem valer as seguintes condições:

e

Assim, o estimador pode ser escrito como:

Como estamos supondo que X é não estocástico (ou seja, fixo), então

visto que wi é função de xi, o qual é não estocástico. Analisando a variância de

:

na qual, na quarta linha, foi usada a hipótese de autocorrelação nula dos erros, ou seja, E(uiuj) = 0, para todo i, j, i ≠ j, e na última linha foi utilizada a hipótese de homocedasticidade, ou seja, E(ui2) = σ2, para todo i. Agora, vejamos qual o wi que gera a menor variância. Para isso:

As CPOs serão:

Passando o somatório na primeira CPO1 acima, teremos:

Substituindo a CPO2 na expressão acima, teremos:

Substituindo wi da CPO1 em CPO3, teremos:

Substituindo

na expressão acima, teremos:

Agora, relembre que:

Então, podemos substituir esta expressão em

Substituindo esta expressão em

, teremos:

, obtendo:

.

Substituindo os valores de λ1 e λ1 na CPO1, teremos:

Então, o próprio di gera a menor variância. Logo,

(EMQ) é o estimador que

possui menor variância, dentro da classe de estimadores lineares não viesados. Coeficiente de Determinação O coeficiente de Determinação pode ser escrito como: ou

E o coeficiente de determinação ajustado será:

Com a inclusão de um novo regressor, o R2 não reduz. Provemos: seja a função RLM amostral:

Quando falamos que adicionamos um regressor no modelo, significa que tal regressor é retirado do erro da regressão, ou seja, se adicionamos xk+1 ao modelo:

. Computando o R2 do

Sendo que no modelo anterior havia, então, primeiro modelo (sem o regressor adicional):

na qual:

o termo do meio

, pois vem da CPO (derivada na Revisão de Conceitos –

MQO) do problema de minimização do MQO (veja comentário a seguir). Assim: ,

na qual SQR2 é o SQR do segundo modelo (adicionado do regressor xk+1). Note que o primeiro termo do SQR1 é uma soma de termos não negativos. Assim, o R2 dos dois modelos será: ,

pois SQR1 ≥ SQR2 (note que o SQT é igual para os dois modelos, porque ambos utilizam a mesma variável dependente). Observação: A expressão

pode ser escrita como: ,

pois dos resíduos

, que vem também de uma das CPOs do MQO (que significa que a média é zero). Assim:

que é zero. Esta última expressão representa a covariância entre o regressor e o resíduo, que é nula. Formas Funcionais Logarítmicas Seja o seguinte modelo: =

0+

1 logx1 +

2 x2

Ele é log-log de y em relação a x1 e é log-linear em relação a x2. β1 mede a elasticidade de y em relação a x1, fixado x2. Vejamos por quê:

onde,

é a elasticidade de y em relação a x1. A interpretação do aumento de 1% em x1 temos um aumento de β1% em y. Em relação a x2, podemos escrever, mantendo x1 fixo:

Se x2 varia discretamente: ∆

=

2 ∆x2

Para termos a medida em termos da mudança percentual exata: ∆

= logy1 – logy2 =

2 ∆x2

1 é que para um

onde a multiplicação por 100 transforma a mudança proporcional em mudança percentual. Quando ∆x2 = 1:

Assim,

2 pode ser interpretado como: um aumento de uma unidade em x2 dá um aumento exato de 100[exp( 2)–1]% em y. Uma medida aproximada para uma mudança pequena em x2 seria 100 coeficiente é, às vezes, denominado como semielasticidade.

2%. Este

Viés de Variável Omitida A omissão de uma variável em um modelo de regressão pode tornar os EMQO viesados e inconsistentes. Segue uma prova formal disso. Seja o modelo verdadeiro: y = β0 + β1x1 + β2x2 + u que satisfaz as hipóteses para que o EMQ seja consistente (tais hipóteses são linearidade dos parâmetros, amostragem aleatória, E(u|x) = 0, não existe multicolinearidade perfeita). Suponha que x2 seja omitida e estime-se:

na qual v = β2x2 + u. O estimador MQO de

será:

.

Substituindo-se o modelo verdadeiro em y, tem-se:

na qual utiliza-se

.

Assim: .

Note que o segundo termo é simplesmente o coeficiente de inclinação da regressão de x2i contra x1i : x2 = δ0 + δ1x1 + ε, na qual assume-se que as hipóteses para o EMQ ser não viesado são satisfeitas. Assim: , Tomando a esperança:

na qual usou-se o fato de os regressores (x1, neste caso) serem não estocásticos (fixo), operando-os como se fossem constantes. Além disso, foi usado o fato de que E[ui] = 0 é uma consequência da hipótese E[ui | x] = 0. Note que:

na qual foi usado o fato de que

, pois:

é exatamente o estimador de MQO de x1 em x2, de forma que sua esperança é dada por

.

Logo: .

Assim, o estimador MQO,

, será viesado. E o termo β2δ1 é geralmente chamado viés de

variável omitida. Há dois casos em que

é não viesado: (i) se β2 = 0, ou seja, se x2 não aparece no modelo

verdadeiro (isto é, não é uma variável relevante); (ii) se a variável omitida (x2) não for correlacionada com x1, ou seja, δ1 = 0. Como

, então δ1 = 0 é a mesma

coisa que Cov(x1, x2) = 0, isto é, x1 e x2 não correlacionados. Dada a prova anterior, um outro aspecto da variável omitida deve ser destacado. Se tivermos um modelo com três variáveis, como, por exemplo:

y = β0 + β1x1 + β2x2 + β3x3 + u Suponha que omitimos x3. Estaremos com uma variavel omitida que gera problemas de endogeneidade, pois ela estará no erro e, assim, o novo erro da regressão será correlacionado com x1 e x2 se x1 e x2 forem correlacionados com x3, ou seja, o EMQ de ambos será viesado e inconsistente. (Desde que também β3 ≠ 0, pois, caso contrário, estaremos omitindo uma variável não relevante para o modelo.) Mas suponha que x1 é correlacionado com x3, mas x2 não é. O estimador de x2 também será viesado se for correlacionado com x1. Ou seja, o viés de endogeneidade contamina também x2, através de x1. Mas, caso x2 não seja correlacionado com x1, então o EMQ de x2 não será viesado e inconsistente.

PROVA DE 2006 Questão 6 Julgue as afirmativas. A respeito dos estimadores de Mínimos Quadrados Ordinários (MQO), em um modelo de regressão linear múltipla: Ⓞ Se a variância do erro não for constante, as estimativas dos parâmetros serão não viesadas. ① Se E(ε) ≠ 0, os estimadores de todos os parâmetros, com exceção do intercepto, serão viesados. ② Se o erro não seguir a distribuição Normal as estimativas por MQO são consistentes. ③ Sob as hipóteses do modelo de regressão clássica, com erros na forma de ruído branco com distribuição Normal, os estimadores de MQO serão os mais eficientes possíveis​. ④ A presença de colinearidade imperfeita entre as variáveis explicativas gera estimadores viesados.

Resolução: (0) Falsa (Discordância do gabarito da Anpec). Não é necessária a hipótese de homocedasticidade para que as estimativas dos parâmetros sejam não viesadas. Mas tem outras hipóteses necessárias que não são mencionadas no item, tais como: linearidade dos parâmetros, amostragem aleatória, E(u | x) = 0 e coli​nearidade não perfeita entre os regressores. Observação: Seria verdadeiro se considerássemos que esses pressupostos fossem válidos. Mas note que, no item 3, a banca do exame teve o cuidado de assumir as hipóteses do modelo de regressão clássica. Isso é mais um motivo para que o item seja falso. (1) Falsa. Todos serão viesados. São necessárias as hipóteses enunciadas na solução do item 0 para que o estimador seja não viesado. Violando E(u) = 0, estaremos violando E(u | x) = 0. Observação 1: A hipótese E(u | x) = 0, implica E(u) = 0. Seja: E(u | x) = 0

Usando a Lei das Expectativas Iteradas, obtém-se: E(u) = E(E(u | x)) = E(0) E(u) = 0 Assim: E(u | x)) = 0 E(u) = 0. Portanto, a negação do lado direito implica a negação do lado esquerdo (esse tipo de lógica é chamada de contraposição), ou seja: E(u) ≠ 0 E(u | x) ≠ 0. Isso gera o problema chamado endogeneidade, ou seja, u será correlacionado com os regressores. Assim, os estimadores dos parâmetros dos regressores serão viesados (e inconsistentes). Como a estimativa do intercepto é função destes estimadores, ou seja:

ele também será viesado. Observação 2: Outra forma de resolução é a seguinte: Suponha que o modelo correto seja, em notação matricial: y = X1β1 + X2β2 + u, no qual a matriz X foi dividida em duas partes, X1 e X2 com k1 e k2 colunas, respectivamente. Se for ignorado o segundo grupo de regressores e estimado o modelo sem X2, obtém-se o estimador:

Tomando-se a esperança na expressão acima, tem-se:

ou seja, a não ser que X1'X2 = 0, ou β2 = 0,

será viesado. No caso específico desta questão, a

variável omitida é a constante, de forma que X2 = (1, ..., 1)'. Assim, o estimador só não será viciado se as observações forem centradas em zero ou se o verdadeiro valor do intercepto for igual a zero. (2) Falsa. Seria verdadeiro se valessem as hipóteses enunciadas no item 1.

(3) Verdadeira. Os estimadores MQO são os mais eficientes na classe de estimadores não viesados (note que não precisa ser somente na classe de estimadores lineares, pois entre as hipóteses do modelo linear clássico inclui-se a normalidade dos erros). (4) Falsa. Colinearidade imperfeita não gera estimadores viesados. Presença de colinearidade imperfeita não é quebra de pressuposto. Como visto em Questões​ anteriores, a sua única consequência no modelo de regressão linear é o aumento da variância dos estimadores. Se houver colinearidade perfeita (ou seja, se uma ou mais variáveis explicativas forem combinações lineares das demais), não é possível obter os estimadores de MQO, pois a matriz X'X é não inversível.

Questão 8 Em um modelo de regressão múltipla, com erros que seguem uma distribuição Normal, identifique se os itens são corretos: Ⓞ Os testes de heterocedasticidade de Breush-Pagan e de White podem ser calculados mediante regressões auxiliares com os quadrados dos resíduos. ① Caso a forma funcional da heteroscedasticidade seja conhecida, mínimos quadrados ponderados, estimados de modo interativo, serão menos eficientes que o estimador de Máxima Verossimilhança. ② Empiricamente não há como distinguir um modelo de expectativas adaptativas de primeira ordem de um modelo de ajustamento parcial de primeira ordem. ③ Se houver uma variável dependente defasada entre as variáveis explicativas, o teste apropriado para a autocorrelação de primeira ordem dos resíduos é o h de Durbin, e não o teste de Breush-Godfrey. ④ Os métodos de estimação do coeficiente de autocorrelação Cochrane-Orcutt e Durbin são diferentes em pequenas amostras.

Resolução: (0) Verdadeiro. Os dois testes rodam regressões auxiliares dos resíduos ao quadrado contra os regressores apenas (teste BP) ou contra também seus termos ao quadrado e com interação entre eles (teste de White) ou ainda contra apenas os valores ajustados da variável dependente da regressão original (caso especial do teste de White). Para mais detalhes consulte Jonhston (1997, p.166-167). (1) Verdadeiro. Como a forma funcional da variância é conhecida, deve-se incorporar esta informação no processo de estimação. Com o MQP, que é estimado de modo interativo, esta informação é desperdiçada. Observação: Outra forma de interpretar é a seguinte: podemos escrever as expressões de tais estimadores como: ,

onde MQG (Mínimos Quadrados Generalizados) é uma forma mais geral do que o MQP. (2) Falso. Esta questão é muito bem tratada por Gujarati (2006, p. 539-544). Empiricamente, ambos os modelos produzem o mesmo modelo de estimativa final, exceção feita ao termo de

erro, pois o modelo de expectativas adaptativas apresentará autocorrelação serial nos resíduos. (3) Falso. A estatística h de Durbin é uma modificação da estatística DW usada para fazer o teste de Durbin-Watson sob as hipóteses clássicas. A estatística h de Durbin permite testar autocorrelação em regressões que tenham termos estocásticos como regressores, como é o caso de defasagens da variá​vel dependente. Contudo, o teste h de Durbin tem a restrição de só testar padrões de correlação serial dadas por um AR(1). O Teste de Breush-Godfrey não sofre nenhuma das restrições que os testes de h de Durbin e Durbin-​Watson sofrem, ou seja, não precisa de modificação para se testar presença de autocorrelação serial em modelo com regressores estocásticos nem para testar autocorrelação de ordem superior a 1. Observação: Veja Johnston e Dinardo (1997, p. 179-87) para uma abordagem de tais testes. (4) Verdadeiro. Conforme apresentado em Johnston e Dinardo (1997, p. 80), a estatística de Durbin-Watson é dada por:

na qual et é o resíduo da regressão por MQO. Para n grande se torna, aproximadamente:

em que

é o coeficiente de autocorrelação amostral entre et e et – 1. Logo,

para pequenas amostras, os métodos de Durbin e Cochrane-Orcut são diferentes.

Questão 9 O método dos Mínimos Quadrados Ordinários foi empregado para estimar o modelo de regressão abaixo, cujo objetivo é explicar as variações de renda entre 526 indivíduos de uma amostra aleatória: ln(renda) = 0,362+ 0,094 educ + 0,014 exper – 0,178 sexo – 0,010 exper x sexo + u

(0,128) (0,008) (0,002) (0,058) (0,002) R2 = 0,368 n = 526 em que sexo é uma variável dicotômica (valor 1, se for mulher, e 0, caso contrário), educ é o número de anos de escolaridade (0 ≤ educ ≤ 17), exper são anos de experiência profissional (0 ≤ exper ≤ 40) e u é a estimativa do erro. Os números entre parênteses são os erros padrões das estimativas, robustos à heterocedasticidade. Com base nos resultados acima, é correto afirmar: Ⓞ Ao nível de significância de 5%, o efeito de um ano a mais de experiência profissional para indivíduos do sexo

masculino é estatisticamente maior do que o efeito para mulheres. ① Para um indivíduo com 10 anos de escolaridade, 1 ano adicional de estudo acarreta um aumento da renda de aproximadamente 9%. ② O efeito na renda de um aumento de 1 ano na experiência profissional para as mulheres é 1% menor do que para os homens. ③ Pela inspeção dos resultados da estimação fica claro que os erros do modelo são heterocedásticos. ④ Se a um nível de significância de 5%, o valor crítico do teste F para a regressão for 2,37, os coeficientes angulares serão conjuntamente diferentes de zero.

Resolução: (0) Verdadeiro. Basta calcular: E[ln renda | sexo = 0; educ; exp] – E[ln renda | sexo = 1; educ; exp] = 0.178 + 0.01 exp Esta é a diferença no lnrenda entre homem e mulher. Mas a questão pede o impacto de um ano a mais de experiência de homens em relação a mulheres. Logo, tiramos a diferença entre:

que é justamente o coeficiente da interação entre exper e sexo. O teste t será:

pertencendo à região crítica (– ∞, – 1,96) (1,96, ∞), ao nível de significância de 5%. (1) Verdadeiro. O efeito médio é de aproximadamente: 0,094 . 100% = 9,4%, que, arredondando, é aproximadamente 9%. Observação: O efeito exato seria de: [exp0,094 – 1]100% = 9,85% Veja o comentário do item 2, questão 7, da prova da Anpec de 2004, para uma explicação mais detalhada. (2) Falso. (Neste item discorda-se do gabarito da Anpec). Um ano a mais de experiência para mulheres gera um ganho de 100% (0.014 – 0.01) = 100% (0.004) = 0.4%. Um ano a mais de experiência para homens gera um ganho de 100%(0.014) =1.4%. O efeito para as mulheres não é 1% menor, mas sim 1 ponto percentual menor, que em termos percentuais representa uma queda de mais de 70%.

(3) Falso. Para detectar heterocedasticidade é necessário realizar algum teste específico, como o teste de White ou Breusch-Pagan (já citados na prova deste mesmo ano, no item 0 da questão 8) ou adotar algum procedimento de inspeção visual. (4) Falso. Calculando a estatística F:

Note-se que a rejeição de H0 implica que pelo menos um coeficiente angular é diferente de zero e não necessariamente todos.

PROVA DE 2007 Questão 4 Considere o modelo de regressão múltipla: por moeda,

é a renda real esperada,

média zero e variância constante. Nem

, em que Mt é a demanda real é a taxa de juros esperada e ut é o erro aleatório com

, nem

são observáveis, mas podem ser construídas da

seguinte forma:

Seja L o operador defasagem tal que LXt = Xt–1. Y t e Rt são a renda real e a taxa de juros observadas no instante t. É correto afirmar que: Ⓞ O modelo, em sua versão observável, é:

.

① É necessária uma técnica de estimação não linear para o modelo observável. ② O modelo é linear nos parâmetros. Portanto, a técnica de Mínimos Quadrados Ordinários deve ser utilizada para a estimação. ③ O modelo observável apresenta erros autocorrelacionados. ④ O modelo observável apresenta heterocedasticidade.

Resolução: (0) Verdadeiro. A partir das equações de Yt e Rt obtemos:

Substituindo no modelo original:

(1) Verdadeiro. Ver item abaixo. (2) Falso. O modelo não é linear nos parâmetros. Note que podemos escrevê-lo como:

(3) Verdadeiro, se considerarmos o modelo a ser estimado. Observe que para escrever o modelo com um número finito de defasagens, temos que tomar as diferenças da equação:

como se segue: Mt – γ1Mt–1 = (α – γ1α) + β1(1 – γ1)Yt – β2(1 – γ2)γ1Rt–1 – β2(1 – γ2)γ2 γ1Rt–2 – β2(1 – γ2) γ 22γ1Rt–3 + ... + (ut – γ1ut–1), γ2(Mt–1 – γ1Mt–2) = γ2(α – γ1α) + β1(1 – γ1)γ2Yt–1 – β2(1 – γ2)γ1γ2Rt–2 – β2(1 – γ2)γ 22γ1Rt–3 – β2(1 – γ2)γ 23γ1Rt–4 + ... + γ2(ut–1 – γ1ut–2). Tirando a diferença da primeira em relação à segunda expressão acima, obtemos: [Mt – γ1Mt–1 – γ2(Mt–1 – γ1Mt–2)] = [(α – γ1α) – γ2(α – γ1α)] + β1(1 – γ1)(Yt – γ2 Yt–1) – β2(1 – γ2)γ1Rt–1 + [(ut – γ1ut–1) – γ2(ut–1 – γ1ut–2)]. Claramente, o termo de erro do modelo a ser estimado apresenta autocorrelação serial. (4) Falso. Note que na construção do item anterior não se constrói estrutura de heterocedasticidade nos termos de erro.

Questão 8 Julgue as afirmativas: Ⓞ Heterocedasticidade ocorre quando o erro aleatório em um modelo de regressão é correlacionado com uma das variáveis explicativas. ① Quando o erro aleatório em um modelo de regressão é correlacionado com alguma variável explicativa, os estimadores de mínimos quadrados não são consistentes. ② Na presença de heterocedasticidade, estimadores de Mínimos Quadrados Ordinários são ineficientes.

③ Os testes t e F usuais não são válidos na presença de heterocedasticidade. ④ Na presença de heterocedasticidade, estimadores de Mínimos Quadrados Ordinários são não viesados, mas são inconsistentes.

Resolução: (0) Falsa. Este fenômeno chama-se endogeneidade. Heterocedasticidade é o fato dos termos de erro terem variância diferente. (1) Falsa (Discordância do Gabarito da Anpec). Veja na Revisão de Conceitos, na parte Viés de Variável Omitida, que quando o erro é correlacionado com alguma​ (mas não necessariamente todas) variável explicativa, tal correlação contamina o coeficiente de tal variável tornando-o viesado e inconsistente. No entanto, os coeficientes das demais variáveis serão também contaminados apenas no caso destas variáveis estarem correlacionadas com a variável explicativa endógena. Então, é incorreto dizer que os estimadores de MQO não são consistentes necessariamente. Eles podem ser, caso não haja correlação dos demais regressores com o que é endógeno. (2) Verdadeira. Viola-se uma das hipóteses do Teorema de Gauss-Markov. Para uma prova de tal teorema, onde a hipótese de homocedasticidade é usada (e, portanto, necessária). Veja na Revisão de Conceitos, o Teorema de Gauss-Markov. (3) Verdadeira. Como já feito anteriormente, as variâncias se tornam viesadas e os testes t e F se tornam inválidos. (4) Falsa. A hipótese de homocedasticidade não é necessária na prova dos EMQ serem não viesados e consistentes.

Questão 15 A regressão abaixo foi estimada com o objetivo de explicar a diferença de salários entre homens e mulheres. As seguintes variáveis foram utilizadas: sal = salário médio por hora, em reais; homecas = 1 se homem e casado; = 0, caso contrário; mulhcas = 1 se mulher e casada; = 0, caso contrário; mulhsol = 1 se mulher e solteira; = 0, caso contrário; edu = número de anos de educação formal; exper = número de anos de experiência profissional; empre = número de anos com o atual empregador. Entre parênteses encontram-se os erros padrões calculados por Mínimos Quadrados Ordinários (MQO). = 0,300 + 0,200 homecas – 0,200 mulhcas – 0,100 mulhsol + 0,0800 edu + (0,100) (0,055) (0,050) (0,050) (0,006) + 0,0200 exper + 0,0300 empre (0,005) (0,006) Suponha que um indivíduo do sexo masculino, com 15 anos de experiência profissional, se case. Ceteris paribus, qual a variação percentual esperada no seu salário dois anos após seu casamento em relação ao seu salário de solteiro? Suponha que o número de anos de educação formal do indivíduo não se tenha alterado e que ele não tenha trocado de emprego.

Resolução: O que o item pede é a seguinte variação: {E[log(sal) | homecas = 1, mulhcas = 0, mulhsol = 0, educ, exper = 17, empre = t + 2] – E[log(sal) | homecas = 0, mulhcas = 0, mulhsol = 0, educ, exper = 15, empre = t} = 0.2 + 0.02 ∙ 17 + 0.03 ∙ (t + 2) – 0.02 ∙ 0 – 0.02 ∙ 15 – 0.03 ∙ t = 0.02 + 0.04 + 0.06 = 0.3 Multiplicando por 100% teremos o impacto de 30%.

PROVA DE 2008 Questão 6 Um econometrista estimou o seguinte modelo de regressão para explicar a renda de 526 indivíduos: log(renda) = 0,510 – 0,310gênero + 0,080educ + 0,030exper – 0,001exper 2 + u (0,099) (0,036) (0,03) (0,005) (0,00010) R2 = 0,441, n = 526 em que gênero é uma variável dicotômica (=1 se mulher, =0 caso contrário), educ é o número de anos gastos com educação, exper é a experiência profissional do indivíduo, medida em anos. Os desvios padrões dos coeficientes estão entre parênteses. Com base nesses resultados, julgue as afirmativas: Ⓞ O efeito de um ano a mais de experiência profissional na renda média de um indivíduo do sexo masculino é 0,030 unidades monetárias. ① As mulheres recebem salários 31% mais baixos que os dos homens, em média. ② De acordo com o modelo estimado, a hipótese de que o efeito médio de um ano a mais de educação na renda dos indivíduos seja diferente de 10% é rejeitada ao nível de significância de 5%. ③ Se V(u|gênero, educ, exper) = a² +b²educ, então os estimadores de mínimos quadrados são tendenciosos. Nota: V(u|X) é a variância de u condicionada a X, a e b são parâmetros. ④ Em uma regressão do resíduo u em função de educação e gênero, o R² será zero.

Resolução: (0) Falsa. O impacto será medido da seguinte forma: E[logrenda | gênero = 0, exper + 1, educ] – E[logrenda | gênero = 0, exper, educ] = [0.030(exper + 1) – 0.001(exper + 1)2] – [0.030(exper) – 0.001(exper)2] = 0.030 – 2 0.001 exper – 0.001 = 0,029 – 0.002 exper note-se que na primeira linha foi medido o efeito para os homens de um ano a mais de experiência, mantido fixo o nível educacional. Assim, o efeito seria sobre o log da renda média (e não sobre a renda média) e dependeria do nível de experiência. Se fôssemos medir em termos de derivada parcial, o efeito seria:

em que tal efeito mediria o impacto de uma variação infinitesimal da exper sobre o log da renda. Poder-se-ia afirmar que para níveis de experiência baixo, tal efeito sobre o log da renda (e não sobre o nível da renda) seria de aproximadamente 0.030. Contudo, o efeito sobre o nível médio da renda, como pedido no item, seria de aproximadamente 100% 0.03 = 3% (e não de 0.03). Observação: Novamente, se o objetivo fosse medir o efeito exato, obteríamos, de acordo com a Revisão de Conceitos (Formas Funcionais Logarítmicas): [exp(0.03) – 1] 100% = 3.045% (1) Falsa. O valor aproximado é exatamente o coeficiente da variável gênero, pois: E[logrenda | gênero = 1, exper, educ] – E[logrenda | gênero = 0, exper, educ] = 0.31 1 – [0.31 0] = 0.31, é o impacto sobre o log da renda. O impacto sobre o nível da renda será de 100% (– 0.31) = – 31%. Observação: A mudança percentual exata, seguindo o comentário do item acima, seria: 100[exp(0.31) – 1]% = – 26.65% (2) Falsa. A hipótese nula será: Parâmetro de educ = 0.1 Assim, construímos o teste t, substituindo o coeficiente da variável educ pela sua estimativa, obtendo assim:

na qual

, pois a adição ou subtração de uma constante não

altera o valor da variância. Logo, como a região crítica para um teste bilateral, ao nível de confiança de 5%, é dada por (–∞, –1,96) (1,96, ∞) e o valor observado da estatística de teste não pertence a este intervalo, então não rejeita-se H0.

Observação: a rigor, o item já seria falso desde o começo, pois é incorreto afirmar que se rejeita a hipótese alternativa e a hipótese apontada no item (efeito ≠ 10%) é a hipótese alternativa. (3) Falsa. O que o enunciado está dizendo, basicamente, é que os erros são heterocedásticos (pois a variância depende das observações da amostra para a variável de educação e, portanto, a variância se altera ao longo da amostra). Como provado na Revisão de Conceitos (MQO), não é necessário fazer hipótese sobre a variância para provar a não tendenciosidade dos estimadores MQO. (4) Verdadeira. O resíduo u contém toda a informação sobre y que não está presente nos regressores incluídos na equação (neste caso, gênero, educ e exp). Assim, caso se rode uma regressão de u contra estes regressores, o R2 será zero. Observação: Uma forma de visualizar isso matematicamente é verificar que algumas das CPOs do problema de minimização dos erros na obtenção do EMQ (veja a Revisão de Conceitos – MQO) são: , na qual onde xj é um regressor (note que j varia de 1 a k, ou seja, temos k CPOs ao total, sendo k o número de regressores), que pode ser escrita como:

na qual, na primeira linha, subtraiu-se uma expressão que é igual a zero, pois

, que é

a CPO do estimador do intercepto. Assim, a expressão da última linha mostra a covariância amostral entre o regressor e o resíduo, que é zero. Logo, pelas CPOs do MQO, não existe correlação entre o resíduo e os regressores. Portanto, uma regressão do resíduo contra tais regressores implicará que os coeficientes estimados serão nulos e, portanto, tais regressores não terão nenhum poder explicativo sobre o resíduo, culminando em um R2 nulo.

Questão 7 Considere a regressão múltipla: y = β0 + β1 x1 + β2 x2 + β3 x3 + u cujos parâmetros tenham sido estimados pelo método dos Mínimos Quadrados Ordinários. Julgue as

afirmativas: Ⓞ Se E(u| x 1, x 2, x 3) = 0 e o modelo não é perfeitamente colinear, então os estimadores não são viesados. ① Se o R2 = 1, então y é uma combinação linear de x 1, x 2 e x 3. ② O R2 ajustado aumenta ao se incluir uma variável adicional, caso tal variável seja significativa ao nível de 5%. ③ Se o modelo satisfaz as hipóteses do teorema de Gauss-Markov, então

1 é o estimador linear não viesado de

β1 com menor variância possível. ④ Se omitirmos x 3 da regressão, os estimadores de β0, β1 e β2 podem ser viesados.

Resolução: (0) Verdadeira. A não colinearidade perfeita garante que o estimador existe (X′X é inversível), e a ortogonalidade dos erros em relação aos regressores garante que os estimadores são não viesados, conforme mostrado na Revisão de Conceitos (MQO). (1) Verdadeira. Se:

Então:

Logo,

(2) Verdadeira (discordância do gabarito da Anpec). O teorema a respeito deste ponto diz que se for adicionado um novo regressor à regressão, então:

Ao se incluir uma variável significativa a 5%, estamos dizendo que sua estatística t é maior do que 1.96 em módulo, logo o R2 aumenta. Veja Wooldridge (2006, p. 190-91). Observação: Um teorema mais geral diz que: se adicionarmos um grupo de variáveis à regressão, então:

(3) Verdadeira. Já enunciado e provado na Revisão de Conceitos (MQO). (4) Verdadeira. Note que a afirmação é verdadeira por causa da palavra “podem”. Veja a Revisão de Conceitos (Viés de Variável Omitida).

Questão 10 Julgue as afirmativas: Ⓞ Na presença de heterocedasticidade nos erros de um modelo de regressão linear, os estimadores de Mínimos Quadrados Ordinários são ineficientes. ① Para testar a presença de autocorrelação de primeira ordem em um modelo y t = α + β y t-1 + εt usa-se o teste de Breusch-Godfrey. ② Quando os erros da regressão são autocorrelacionados, os estimadores de mínimos quadrados são eficientes. ③ A omissão de uma variável relevante em um modelo de regressão linear pode gerar autocorrelação nos erros. ④ A regressão entre duas variáveis integradas de primeira ordem, isto é I(1), é sempre espúria.

Resolução: O item (4) está resolvido no capítulo Séries Temporais. (0) Verdadeira. Já discutido. A condição de homocedasticidade dos erros é uma hipótese do Teorema de Gauss Markov. Veja a Revisão de Conceitos (MQO). (1) Verdadeira. Veja o item 3, questão 8, da prova da Anpec de 2006. (2) Falsa. O fato dos erros serem autocorrelacionados viola uma das hipóteses do Teorema de Gauss-Markov. Para uma prova de tal teorema, onde a hipótese de homocedasticidade é usada (e, portanto, necessária), veja a Revisão de Conceitos (MQO). (3) Verdadeira. Pois o novo erro será: εi = βkxki + ui, na qual ui é o erro da regressão com a variável relevante. Calculando a autocovariância do novo erro ε, teremos: Cov(εi , εj) = Cov(βkxki + ui, βkxkj + uj) Cov(εi , εj) = β k2Cov(xki , xkj) + βkCov(xki , uj) + βkCov(xkj , ui) + Cov(ui , uj) Mesmo que os erros da regressão original (u) sejam não autocorrelacionados (ou seja, Cov(ui , uj) = 0) e o regressor omitido não seja correlacionado com tal erro (ou seja, Cov(xki , uj) = Cov(xkj , ui)), tem-se que: Cov(εi , εj) = β k2Cov(xki , xkj) Assim, a omissão de uma variável relevante (ou seja, com seu coeficiente βk ≠ 0) pode fazer

com que o novo erro (ε) seja autocorrelacionado, se Cov(xki , xkj) ≠ 0.

PROVA DE 2009 Questão 10 Com relação aos testes de hipótese, é correto afirmar: Ⓞ Em uma regressão com várias variáveis explicativas, se individualmente os coeficientes não forem significativos, o teste F de significância conjunta também não terá a hipótese nula rejeitada. ① A estatística de Dickey-Fuller para testar a presença de raiz unitária em séries temporais possui sempre distribuição Normal. ② Considere o seguinte modelo de regressão linear: y = β0 + β1X + u, em que u é o erro da regressão, y é a variável dependente e X é a variável explicativa. Caso o erro seja heteroscedástico, a estatística t usual para testarmos a hipótese H0 : β1 = 0 contra a alternativa H1 : β1 ≠ 0 não é mais válida. ③ Considere o seguinte modelo de regressão linear y = β0 + β1X + u, em que u é o erro da regressão, y é a variável dependente e X é a variável explicativa. Para testarmos a hipótese H0 : β1 = 0 contra a alternativa H1 : β1 > 0, devemos utilizar um teste t unilateral. ④ O teste t em regressões envolvendo variáveis não estacionárias não será válido caso a regressão seja espúria.

Resolução: Os itens (1) e (4) estão resolvidos no capítulo Séries Temporais. (0) Falso. Pode acontecer de individualmente os coeficientes não serem significativos e o teste F de significância conjunta ter a hipótese nula rejeitada, o que é, justamente, um indicativo de problema de multicolinearidade. Este ponto é discutido na Revisão de Conceitos, na parte de Mínimos Quadrados Ordinários. (2) Verdadeiro. No caso de heterocedasticidade, o estimador da variância do parâmetro será viesado, tornando a estatística t usual inválida. Isso se deve ao fato de que a variância é estimada assumindo-se que ela é constante quando não é. Observação: Uma forma de corrigir tal estatística para o caso de heteroscedasticidade é usar a correção de White para a variância. (3) Verdadeiro. Por definição.

Questão 11 Suponha que o modelo linear abaixo descreva as relações entre quatro variáveis aleatórias escalares: y, X, Z e v. E(y | X, Z) = β0 + β1X + β2Z (Equação 1) X = α0 + α1Z + v, E(v | Z, X) = E(v | Z) = E(v | X) = E(v) = 0 (Equação 2) Suponha, ainda, que β0 ≠ 0, β1 ≠ 0, β2 ≠ 0, α0 ≠ 0 e α1 ≠ 0. Indique se cada uma das afirmações abaixo é verdadeira ou falsa: Ⓞ E(y | Z) = β0 + β2Z. ① Seja y = β0 + β1X + β2Z + u. Então E(u | X, Z) = 0. ② E(X | Z) = α0 + α1Z.

③ Seja y = θ0 + θ1Z + ε, em que θ0 = β0 + β1α0 e θ1 = β1α1 + β2. Portanto, E(ε | Z) ≠ 0. ④ Considere uma amostra de n observações das variáveis aleatórias y, X e

Z.

O

estimador

é um estimador não tendencioso para θ1 = β1α1 + β2.

Resolução: (0) Falsa. Pela Lei das Expectativas Iteradas, podemos dizer que: E(y | Z) = E(E (y | X, Z) | Z). O termo dentro da primeira esperança do lado direito é a equação 1 do enunciado, ou seja: E(y | Z) = E(β0 + β1X + β2Z | Z) E(y | Z) = β0 + β1E(X | Z) + β2Z Substituindo a equação 2, temos que: E(y | Z) = β0 + β1(α0 + α1Z + v | Z) + β2Z E(y | Z) = β0 + β1α0 + β1α1Z + β1E(v | Z) + β2Z E(y | Z) = β0 + β1α0 + β1α1Z + β2Z que é diferente da expressão dada no item. (1) Verdadeira. Seja: y = β0 + β1X + β2Z + u Tomando a esperança condicional em X e Z, obtém-se: E(y | X, Z) = β0 + β1X + β2Z + E(u | X, Z) Comparando com a equação 1 do enunciado devemos ter: E(u | X, Z) = 0 (2) Verdadeira. Tomando a esperança condicional em Z da equação 2, teremos: E(X | Z) = α0 + α1Z + E(v | Z) = α0 + α1Z, onde, na última igualdade, utilizamos a hipótese E(v | Z) = 0 dada no enunciado.​ (3) Falso. Note que a esperança de y condicional em Z já foi obtida no item 0, ou seja: E(y | Z) = β0 + β1α0 + β1α1Z + β2Z

onde θ0 = β0 + β1α0 , θ1 = β1α1 + β2 . Assim, ao tomarmos a esperança condicional em Z da equação do y dada no item 3: E(y | Z) = θ0 + θ1Z + E(ε | Z) e compararmos com a expressão acima, devemos ter, necessariamente, E(ε | Z) = 0. (4) Verdadeiro. Como vimos no item 3, o modelo: E(ε | Z) = θ0 + θ1Z é o modelo dado no enunciado, tal que E(ε | Z) = 0. Assim, substituindo yi = θ0 + θ1Zi + εi no estimador T, teremos:

Tomando a esperança condicional de T em X e Z, avaliamos se o estimador é tendencioso ou não:

onde, na passagem para a última linha, usamos o resultado E(εi | Z) = 0, já obtido no item 3. Observação: Na passagem da segunda para a terceira linha, quando estávamos abrindo o estimador T, foi utilizado o seguinte resultado:

Questão 14 O método dos Mínimos Quadrados Ordinários foi empregado para estimar o modelo de regressão abaixo, cujo objetivo é explicar as variações de renda entre 487 indivíduos: log(renda) = 0,883 – 0,169gênero + 0,004educ + 0,014exper – 0,009exper . gênero + (0,073) (0,059) (0,0003) (0,002) (0,002) R2 = 0,458, n = 487 em que gênero é uma variável dicotômica (valor 1 se for mulher e 0 caso contrário), educ é o número de anos de escolaridade e exper é a experiência profissional, também medida em anos. Os números entre parênteses são os erros-padrão das estimativas. Com base nos resultados acima, é correto afirmar: Ⓞ A 5%, o efeito de um ano a mais de escolaridade para indivíduos do sexo masculino é estatisticamente maior do que o efeito para mulheres. ① O efeito na renda de um ano a mais de experiência profissional para as mulheres é 0,9% menos do que para os homens. ② O modelo acima não pode ser estimado por mínimos quadrados, pois há uma interação entre as variáveis exper e gênero. ③ Para um mesmo nível de escolaridade e experiência profissional, a renda média dos homens é superior à das mulheres. ④ Para um indivíduo com 10 anos de escolaridade, 1 ano adicional de estudo acarreta um aumento da renda de aproximadamente 14%.

Resolução: (0) Falso. No item 0, questão 9, da prova da Anpec de 2006, já foi vista esta afirmação, mas em termos do impacto para experiência. Tal efeito não é possível de se medir, pois necessitaríamos de uma variável de iteração educ x gênero. Se considerássemos tal variável no modelo (com coeficiente igual a β, por exemplo), o efeito pedido no item seria igual a:

Ou seja, justamente o coeficiente da variável de iteração dá o impacto pedido no item 0. Logo, não é possível medir o efeito pedido no item sem incluir a variável no modelo.

(1) Anulada. Este item é idêntico ao item 0, questão 9, da prova da Anpec de 2006, e o impacto será:

Ou seja, como era esperado, o impacto pedido no item é justamente o coeficiente da variável de interação exper x gênero. Tal coeficiente dá o impacto em termos do log da renda. Uma outra forma de verificar, caso exper fosse uma variável contínua, seria: ,

ou seja, o impacto pedido seria de exatamente – 0.009 sobre o log da renda ou – 0.009x100% = – 0.9% sobre o nível da renda. No entanto, como exper é uma variável discreta, não teremos uma variação infinitesimal no denominador, assim, podemos dizer apenas que o impacto será aproximadamente igual a – 0.9%. Provavelmente, o item foi anulado por essa razão. Apesar de que, em outros anos, um item similar a este foi considerado verdadeiro e não foi anulado. Por exemplo, veja o item 1 na questão 6 da prova da Anpec de 2008. (2) Falso. Variáveis de interação sempre podem ser incluídas nos modelos de regressão, se isso não gerar multicolinearidade perfeita entre as variáveis exper x gênero, exper e gênero, o que impossibilitaria a obtenção do estimador MQO. (3) Verdadeiro. Considere o caso em que ambos tenham exper = 0. Para medir, se a renda média dos homens é maior do que das mulheres, devemos olhar para o coeficiente da variável gênero, visto que as outras variáveis estão fixas. Tal coe​ficiente é significativo, pois a estatística t será: t = – 0.169/0.059 = – 2.86, que é maior, em módulo, do que 1.96, que é o valor crítico da normal para um nível de significância de 5% (podemos considerar a Normal pois o tamanho amostral é relativamente grande, n = 487). Assim, como o sinal é negativo, isso implica que as mulheres ganham menos do que os homens em média. A situação é reforçada para graus de experiência diferentes de zero. Neste caso, o efeito seria: {E[lnrenda | gênero = 1; educ; exp] – E[lnrenda | gênero = 0; educ; exp]} =

= – 0.169 – 0.009 exper o qual depende do nível de experiência. Note que o efeito, para qualquer nível de experiência, será negativo (visto que o valor de exper é não negativo), ou seja, a renda média dos homens é superior à das mulheres. Conforme o nível de experiência vai aumentando, a renda média dos homens aumenta mais do que a das mulheres. (4) Falso. O impacto de um ano a mais de educação sobre o log da renda é para qualquer nível educacional igual a 0.004, visto que educ é uma variável linear. Como educ é uma variável discreta, podemos dizer que o impacto será aproximadamente igual a 0.004 x 100% = 0.4%.

PROVA DE 2010 Questão 8 Considere as seguintes afirmações referentes ao modelo de regressão linear clássico com regressores estocásticos: yi = β0 + β1x1i + β2x2i + εi , i = 1, … , n, em que E[ε | x1, x2] = 0 e Var[ε | x1, x2] = σ 2. Ⓞ Os estimadores de Mínimos Quadrados Ordinários dos parâmetros são eficientes dentro da classe de estimadores lineares de β0, β1 e β2, mesmo se os erros da regressão não forem normalmente distribuídos. ① Se a hipótese de homoscedasticidade for violada, os estimadores de Mínimos Quadrados Ordinários de β0, β1 e β2 serão viesados. ② Suponha β0, β1 e β2 que sejam estimados por Mínimos Quadrados Ordinários. Denote por regressão para i-ésima observação. Então

o valor previsto da

.

③ Se omitirmos x 2i da regressão, o estimador de Mínimos Quadrados Ordinários de β1 será necessariamente inconsistente. ④ Os estimadores de Mínimos Quadrados Ordinários dos parâmetros não são eficientes se a hipótese de ausência de autocorrelação dos erros for violada.

Resolução: (0) Verdadeira. As hipóteses necessárias para serem os Melhores Estimadores Lineares Não Viesados são: Linearidade dos parâmetros, amostragem aleatória, E(u | x) = 0, não colinearidade perfeita e homocedasticidade. Ou seja, não é necessário que os erros sejam normalmente distribuídos para que o EMQ seja eficiente na classe de estimadores lineares não viesados. Caso seja imposta a hipótese de normalidade dos resíduos, tem-se que o EMQ é eficiente na classe dos estimadores não viesados, não necessariamente lineares. (1) Falsa. Novamente, veja a prova de que os EMQO são não viesados na Revisão de Conceitos. Não é necessária a hipótese de homocedasticidade. (2) Verdadeira. A função de regressão amostral será:

Somando-se para toda a amostra:

Sabe-se que, das CPOs do EMQ (derivadas na Revisão de Conceitos), o somatório dos resíduos é zero, ou seja, Logo:

O que gera o resultado desejado. (3) Falsa. Uma vez que x2i pode ser irrelevante no modelo (ou seja, β2 = 0), ou então não correlacionado com x1i . Veja a Revisão de Conceitos (Viés de Variável Omitida) para uma prova deste ponto. (4) Verdadeira. O Teorema de Gauss-Markov necessita de tal hipótese na demonstração que os EMQ são eficientes. Veja a comprovação de tal teorema na Revisão de Conceitos.

Questão 9 Responda se verdadeiro ou falso: Ⓞ O estimador de Mínimos Quadrados do coeficiente angular em uma regressão simples com constante faz uma média ponderada da razão entre desvios da variável explicada de sua média e desvios da variável explicativa de sua média, tendo como ponderador a diferença da explicativa de sua média. ① O estimador de Mínimos Quadrados do coeficiente angular em uma regressão simples, com a constante erroneamente omitida, será consistente se a média da variável explicativa for zero e se o erro for independente da explicativa e possuir média zero. ② Considere o modelo y = α + β1x 1 + β2x 2 + ε, com exogeneidade estrita das explicativas e erro com média zero. O modelo é estimado em dois estágios: primeiro, uma regressão de y em x 1, salvando-se o resíduo (e1); segundo, uma regressão de e1 em x 2. A estimativa do coeficiente angular da segunda regressão será igual à estimativa de β2 na regressão múltipla. ③ Em um modelo de regressão simples sem constante, em que o coeficiente angular é estimado por Mínimos Quadrados, os resíduos têm média amostral zero por construção. ④ Se x e y têm distribuição conjunta Normal, com correlação ρ = 0,80, v será independente de x, em que v é o desvio de y com relação a sua média condicional, isto é, v = y – (γ 0 + γ 1x), sendo γ 0 e γ 1 parâmetros.

Resolução: (0) Falso. O EMQO pode ser reescrito como:

Assim, o EMQO é a média ponderada da razão entre desvios da variável explicada de sua média e desvios da variável explicativa de sua média, tendo como ponderador a diferença ao quadrado da explicativa de sua média em relação à SQT da explicativa. (1) Verdadeiro. Caso contrário, será viesado e inconsistente. (2) Falso. É bastante comum que dois regressores sejam correlacionados. Dessa forma, caso a regressão seja realizada conforme apresentada, como x2 é excluí​da da primeira regressão, o efeito de x2 sobre y que é “compartilhado” com x1 será totalmente atribuído a x1. Então, na segunda regressão proposta, o coeficiente estimado de x2 será menor do que o que seria estimado incluindo-se x1 e x2 concomitantemente na regressão. (3) Falso. Pois, neste caso, haveria apenas uma condição de primeira ordem do problema de minimização. A condição não seria imposta, o que faz com que a soma dos resíduos possa ser (e quase sempre será) diferente de zero. (4) Verdadeiro. Como v é combinação linear de variáveis aleatórias normais, v também tem distribuição normal. Calculando-se a covariância entre x e v tem-​se que: Cov(x, v) = Cov(x, y – γ0 + γ1x) = Cov(x, y) – Cov(x, γ0 + γ1x) = Cov(x, y) – Cov(x, γ1x)

Como x e v têm distribuição normal conjunta, a condição acima garante a independência.

Questão 10 Considere um modelo de demanda por um produto de consumo, estimado com dados de séries de tempo mensais (t), para várias regiões (i): lnqit = – 0,27 – 0,83lnpit + 0,33(lnpit * vet) – 0,38 vet + 1,15br it + 0,57(br it * vet) + 2,11 lnyit (0,02) (0,15) (0,12) (0,20) (0,75) (0,10) (0,88) R2 = 0,24 n = 870 em que lnq representa o logaritmo natural da quantidade consumida (em mil litros), lnp, o logaritmo natural do preço do produto por litro, ve, uma variável que representa se o mês é de verão (0 em outros casos), br, se no período havia uma promoção de compra com brinde gratuito (0 em outros casos), e lny o log da renda média dos consumidores. Os desvios padrões estão entre parênteses. O tamanho da amostra valida o uso de resultados assintóticos com pequeno erro.

Ⓞ ① ② ③ ④

Se os preços forem convertidos para preços em mil litros, os coeficientes de lnp e lnp* ve irão aumentar. No verão a demanda tende a ser menos preço-elástica, a 5% de significância. Os coeficientes estimados indicam que os preços são maiores no verão. O baixo valor de R² sugere que as estimativas dos coeficientes são inconsistentes por omissão de explicativas. Conforme o valor dos coeficientes, é possível concluir que, em média, as vendas são menores no verão.

Resolução: (0) Falso. A conversão das variáveis de preço por litro em preço por mil litros fará com que uma nova variável, pit , seja usada no lugar de pit , ou seja, pit = 1000pit . Tomando o logartimo desta última igualdade, temos: ln(pit) = ln(1000pit) = ln(1000) + ln(pit). Assim, ln(pit) = ln(1000pit) – ln(1000). Logo, neste caso, o coeficiente da nova variável de preço será o mesmo. Os coeficientes da constante e da variável dummy serão alterados. Lembrese que no modelo log-log os coeficientes podem ser interpretados como elasticidades, então, sua interpretação permanece a mesma. Veja item 0 da questão 10 de 2005. (1) Verdadeiro. O coeficiente da log do preço no verão é significativamente diferente de zero ( , Z0,975 quantil de probabilidade 0,025 da Normal padrão, lembre-se de que a amostra é grande). Como este coeficiente é positivo, ele faz com que a demanda seja menos preço-elástica. Ou seja: Elasticidade “não verão” = – 0.83 Elasticidade “verão” = – 0.83 + 0.33 = 0.5 Logo |εverão| < |εnão verão|. (2) Falso. Não é possível determinar se o preço é maior no verão ou nas outras estações, pois necessitaríamos da equação de oferta. O preço de equilíbrio é determinado justamente a partir do ponto de equilíbrio de oferta e demanda. (3) Falso. O baixo coeficiente de determinação indica que o modelo explica apenas 24% da variação da variável dependente. (4) Falso. O coeficiente da variável indicadora de verão é não significativamente diferente de zero (

, o que implica que a variável indicativa de verão não é

significativa a 5% de significância). Observação: De toda forma, só poderíamos concluir sobre a quantidade demandada e não vendida.

Questão 13

Considere a regressão y = Xβ + ε. Suponha que tenhamos uma amostra de tamanho 4 e que:

.

Compute a estimativa eficiente de β.

Resolução: O estimador de mínimos quadrados generalizados de β é dado por: . Computando a estimativa de β para os valores obtidos na amostra temos:

. Observação: Utilizamos o fato de que se uma matriz é bloco diagonal, por exemplo,

,a

sua inversa é dada pela matriz bloco diagonal formada pelas inversas de cada matriz, por exemplo

. Neste exercício, teríamos:

Questão 14 Considere o modelo de regressão linear múltipla com regressores estocásticos: yt = β1x1t + β2x2t + εt, no qual εt não é autocorrelacionado e tem média e variância condicionais a x1t e x2t iguais a zero e σ 2, respectivamente. Por simplicidade, suponha que as variáveis são expressas como desvios com

relação às respectivas médias. É correto afirmar que: Ⓞ Se β2 = 0 e incluirmos x 2t na regressão, o estimador de Mínimos Quadrados Ordinários de β1 será viesado. ① Se não conseguirmos observar x 1t, mas apenas x 1t * = x 1t + ut, em que é um erro de medida, e se substituirmos x 1t por x 1t* na regressão, o estimador de Mínimos Quadrados Ordinários de β1 ainda assim será consistente. ② Se x 2t = y t–1 e relaxarmos a hipótese de que os erros εt’s não são autocorrelacionados, o estimador de Mínimos Quadrados Ordinários de β2 será consistente, porém não será eficiente. ③ A variância do estimador de Mínimos Quadrados Ordinários diverge para infinito à medida que a correlação entre x 1t e x 2t aproxima-se de 1. ④ Denote por

o resíduo da regressão de Mínimos Quadrados Ordinários. A hipótese de que o erro εt é

correlacionado com x 1t pode ser testada utilizando a estatística

.

Resolução: (0) Falso. Tem-se o que se chama de inclusão de variável irrelevante. A inclusão de variáveis irrelevantes não altera as boas propriedades do estimador de MQO. (1) Falso. É possível provar – veja Johnston e Dinardo (1997, p. 155) – que o estimador de MQO será viesado e inconsistente. (2) Falso. O estimador não será consistente, apesar de ser ineficiente, conforme afirmado no item. Para mais detalhes, veja Johnston e Dinardo (1997, p. 177-178). Observação: A maneira de estimar de forma eficiente é através da aplicação do método dos mínimos quadrados generalizados, como na questão 13 acima, sendo que a matriz Ω deve contemplar a estrutura de autocorrelação dos termos de erro. (3) Verdadeiro. Este problema é conhecido como o problema da multicolineariedade. Para valores do coeficiente de correlação ρ < 0,9, a correlação entre x1 e x2 não inflaciona as variâncias dos estimadores de MQO a ponto de comprometer suas estimativas. Contudo, para valores de ρ superiores a 0,9, a correlação começa a afetar significativamente as variâncias dos estimadores. No caso-limite, ρ = 1, os estimadores de MQO não existem. Neste caso, diz-se que há colineariedade perfeita e x1 pode ser escrito como combinação linear de x2. Observação: Outra forma de visualização é usar a fórmula da variância

e R21 é o R2 da regressão de x1 contra x2. Quanto maior a correlação entre x1 e x2, R21 → 1 e, portanto, Var ( ) → ∞. (4) Falso. A hipótese de endogeneidade poderia ser testada usando-se um teste de multiplicador de Lagrange (ou teste LM) ou o de Hausman. Para detalhes sobre estes testes,

veja Johnston e Dinardo (1997, p. 256-257).

PROVA DE 2011 Questão 5 Considere o seguinte modelo de regressão: yi = β1 +β2 xi + ui , i = 1, … , n Suponha que xi é não estocástico e que E[ui ] = 0, E[ui 2 ] = σ2, E(ui , uj) = 0 para todo i ≠ j. Considere os dois estimadores alternativos de β2.

e

Onde

e

são as médias amostrais de x e y respectivamente. É correto

afirmar que: Ⓞ b2 em geral é um estimador não viesado de β2. ① é um estimador não viesado de b2 se e somente se β1 = 0. ②

é mais eficiente do que b2 se b1= 0.

③ b2 é um estimador não viesado de b2 se, para qualquer amostra de tamanho n, ④ b2 é um estimador não viesado de b2 se, para qualquer amostra de tamanho n,

Resolução: (0) Falso. O estimador b2 pode ser escrito como:

Tomando a esperança: .

Como xi é não estocástico (ou seja, fixo), então E(xiui) = 0 . Logo:

= 0. = 0.

Ou seja, precisaríamos que b1 = 0 ou que

= 0 (veja item 3) para que tal estimador fosse não

viesado. (1) Falso. Note primeiramente que o modelo de regressão pode ser escrito como:

.

O estimador

pode ser escrito como:

Tomando esperança: .

Para que

seja não viesado, não é necessária a hipótese que b1 = 0. Assim, apesar da volta

ser verdadeira (ou seja, se b1 = 0, então E[

] = b2), a ida é falsa. Se

é não viesado (como é

de verdade, como verificamos acima), então não necessariamente b1 = 0. (2) Falso. O estimador b2 é o EMQO para o modelo quando b1 = 0. Como ele já leva isso em consideração, será mais eficiente do que b2, que não leva em consideração. (3) Verdadeiro. Do item 0, sabemos que:

Do item, se

= 0 , então:

E[b2] = b2 ou seja, b2 é um estimador não viesado. (4) Falso. Vimos no item 0 que precisaríamos que b1 = 0 ou viesado.

= 0 para que b2 seja não

Questão 10 [Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão, então Pr(|Z| > 1,645) = 0,10 e Pr(|Z| > 1,96) = 0,05.] Considere as seguintes estimativas obtidas pelo método de mínimos quadrados ordinários para o modelo de regressão abaixo (desvios padrões entre parênteses): ln(salário) = 0,600+0,175 sindicato + 0,090 sex + 0,080 educ + 0,030 exper – 0,003 exper 2 + û (0,201) (0,100) (0,050) (0,032) (0,009) (0,001) R2 = 0,36 em que educ e exper denotam, respectivamente, o número de anos de estudo e o número de anos de experiência profissional, sindicato é uma variável dummy que assume o valor 1 se o trabalhador for sindicalizado e 0 caso contrário e sexo é uma variável dummy igual a 1 se o trabalhador for do sexo masculino e igual a 0 se for do sexo feminino. O resíduo da regressão é o termo û. Todas as suposições usuais acerca do modelo de regressão linear clássico são satisfeitas. É correto afirmar que: Ⓞ Supondo que o tamanho da amostra seja grande o suficiente para que aproximações assintóticas sejam válidas, é possível rejeitar, ao nível de significância de 5%, a hipótese nula de que os salários de trabalhadores sindicalizados e não sindicalizados são iguais. A hipótese alternativa é que os trabalhadores sindicalizados ganham mais do que os não sindicalizados. ① Supondo que o tamanho da amostra seja grande o suficiente para que aproximações assintóticas sejam válidas, é possível rejeitar, ao nível de significância de 5%, a hipótese nula de que os salários de homens e mulheres são iguais. A hipótese alternativa é que os salários de homens e mulheres são diferentes. ② Um ano adicional de experiência eleva o salário em 3%. ③ Se incluirmos um regressor adicional entre as variáveis explicativas, o R² não diminuirá. ④ Supondo que os erros tenham distribuição normal e que o tamanho da amostra seja 206, é possível rejeitar, ao nível de significância de 5%, a hipótese de que os coeficientes da regressão, com exceção do intercepto, são simultaneamente iguais a zero (F0,95; 5,200 = 2.2592).

Resolução: (0) Verdadeiro. Note que se trata de um teste unilateral, ou seja: H0 : bsindicato = 0 Ha : bsindicato > 0 Assim, a estatística t calculada será:

ou seja, a estatística t calculada situa-se na região crítica (acima do valor crítico, notemos que assintoticamente a estatística t tem distribuição normal). Logo, rejeitamos H0. (1) Falso. Note que se trata de um teste bilateral, ou seja: H0 : bsexo > 0 Ha : bsexo ¬ 0 Assim, a estatística t calculada será:

ou seja, a estatística t calculada situa-se na região de aceitação (abaixo do valor crítico). Logo, não se rejeita H0. (2) Falso. Primeiro note que a estatística t calculada das variáveis exper e exper2 são significativas. Notemos que: texper = 3.3 texper2 = –3 e, portanto, rejeita-se H0, ao nível de 5%, pois estes valores são maiores do que 1.96 em valores absolutos. Assim, a afirmação é falsa por alguns motivos: 1. A afirmação não deixa claro que o efeito é sobre o salário “em média”. 2. Se considerarmos apenas o coeficiente da variável exper, então o impacto exato seria de [exp(0,03) – 1]100%. Poderíamos dizer apenas que o impacto seria de aproximadamente 3%. 3. Por fim, se considerarmos também o coeficiente da variável exper2, então o impacto para uma variação infinitesimal seria de

Em termos de nível salarial, o impacto seria aproximadamente igual a [0.03 – 0.006 exper]100%. O impacto exato seria obtido a partir de:

Assim, o impacto exato seria igual a

(3) Verdadeiro. Sempre que adicionamos um novo regressor, o R2 permanece igual ou aumenta. Uma prova deste teorema foi feita na prova de 2003, questão 6, item 2. (4) Verdadeiro. A estatística F será:

ou seja, a estatística está acima do valor crítico e, portanto, encontra-se na região crítica. Logo é possível rejeitar a hipótese nula de que todos os coeficientes dos regressores são simultaneamente iguais a zero, a um nível de significância de 5%.

Questão 12 Considere o modelo de regressão linear múltipla yt = β1 x1t +β2 x2t+εt no qual

Por simplicidade, assuma que as variáveis são expressas como desvios em relação às respectivas médias. É correto afirmar que:

Ⓞ Se β2 ≠ 0 e excluirmos x 2t da regressão, o estimador de mínimos quadrados ordinários de β1 será, em geral, inconsistente. ① Suponha que x 2t medido com erro, isto é, que x 2t* = x 2t + u2t , e que E[x 2t| x 1t , x 2t] = 0, E[u2tεt|x 1t, x 2t] = 0 e E[x 2t2| x 1t , x 2t] = σu2. Se substituirmos x 2t por x 2t*, o estimador de mínimos quadrados ordinários de β1 será inconsistente. ② Os estimadores de mínimos quadrados ordinários de β1 e β2 serão não viesados, porém não serão eficientes, se y t for uma variável binária, assumindo apenas dois valores, 0 ou 1, e σ² = 1. ③ Seja c uma constante diferente de zero. Defina mínimos quadrados ordinários (MQO) em uma regressão de

. Os estimadores de tcontra

e

coincidem com os estimadores de

MQO em uma regressão de y t contra x 1t e x 2t. ④ A hipótese de que o erro tem média 0 pode ser testada utilizando a estatística

, em que

é o

resíduo da regressão por mínimos quadrados ordinários.

Resolução: (0) Verdadeiro. Este é o clássico problema de variável omitida. Se omitirmos x2t da regressão, tal variável irá para o erro. O estimador de MQO de b1 será inconsistente se b2 ≠ 0 (ou seja, omitimos uma variável relevante) e Cov(x2t, x1t) ≠ 0 (os regressores forem correlacionados). Os regressores serem correlacionados é o caso geral, ou seja, na prática, dificilmente teremos Cov(x2t, x1t) = 0. Observação: Mas, vale ressaltar que, se tivermos Cov(x2t, x1t) = 0, então os estimadores seriam consistentes. (1) Verdadeiro. A hipótese E[u2t| x1t, x2t] = 0 é a hipótese de erro clássico nas variáveis, segundo Wooldridge (2006, p. 289-290). Assim, como provado nesta citação, o EMQO de b1 é inconsistente, sendo que o plim(b1) é menor em termos absolutos do que b1. Ou seja, existe um viés de atenuação do efeito. (2) Verdadeiro. Neste caso, estamos em um modelo de probabilidade linear (MPL). E, como mostrado em Wooldridge (2006, p. 233-234), teremos heterocedasticidade e, portanto, apesar do EMQO ser ainda não viesado, não será mais eficiente. (3) Verdadeiro. Usando notação matricial, sabemos que

= (X'X)–1 X'Y, sendo que

éa

matriz que contém os valores de (x1t, x2t), y o vetor que contém os valores de y1t , t = 1,... , T e b = (b1, b2)'. No caso das variáveis modificadas, a matriz de regressores seria: e o vetor da variável independente seria

, e o EMQ seria agora:

(4) Falso. Usando a mesma notação matricial acima, podemos escrever:

Assim,

também pode ser escrito em forma matricial como (1, ..., 1)

, sendo que (1, ..., 1) é uma matriz linha 1 × T. Com a notação matricial, a obtenção da distribuição de teste da distribuição passa pela obtenção da distribuição de . Como os erros têm distribuição normal, sabemos que além disso

também tem distribuição normal e

tem distribuição normal (condicionada em

). Desta forma,

para usarmos a estatística de teste proposta deveremos saber a sua média e variância. Calculando-se a esperança de

condicionalmente em

, temos:

supondo-se que o modelo esteja corretamente especificado.

Aqui devemos lembrar que

e e não são independentes. Assim:

Lembrando que:

e: V(e |

) = σ2I.

Obviamente, a variância da estatística de teste proposta depende de σ2 que é desconhecido. Logo, não é possível utilizá-la para testar a hipótese desejada. No entanto, podemos utilizar um estimador para σ2 , por exemplo:

Assim, a estatística seria um teste t:

ou seja, faltou dividir a estatística pelo erro padrão.

Questão 13

Considere o seguinte modelo de regressão linear clássico em que as variáveis são expressas como desvios em relação às respectivas médias: yi = αxi + ui , i = 1, …, n e E[ui ]=0, E[ui 2 ] = σ², E(ui , uj ) = 0 para todo i ≠ j Suponha, por simplicidade, que xi é um regressor escalar não estocástico. Propõe-se estimar α através da razão entre as médias amostrais de yi e xi:

Calcule a variância de α. Multiplique o resultado por 100. (Sabe-se que σ ² = 100, n = 100 e ).

Resolução: Conforme dado na questão:

Computando-se a variância de

, temos:

Como x1 é não estocástico:

Assim:

Observação: Como x1 é não estocástico (ou seja, fixo), sua variância é nula, e assim, utilizamos o fato de que:

Logo:

onde na terceira igualdade usamos o fato de que a amostra é aleatória e, portanto, y1, ..., yn são independentes. Tal expressão foi utilizada acima.

Questão 14

Considere a seguinte regressão y = Xβ+ε em que y, X e ε são vetores de dimensão n x 1 e β é um escalar. Adicionalmente, suponha que E(ε | X) = 0 e que

Compute a variância condicional em X do estimador de mínimos quadrados ordinários de β. Multiplique o resultado por 100.

Resolução: O estimador da variância do EMQO de b pode ser derivada a partir de:

Substituindo y pelo modelo de regressão:

Devemos calcular

para obtermos a matriz de va​riância e

covariância (neste exemplo, tal matriz será um escalar pois

Calculando essas matrizes:

é apenas um estimador):

Assim, substituindo esses resultados na fórmula da variância:

PROVA DE 2012 Questão 3 Usando uma base de dados que tem informação de 65.535 trabalhadores, queremos verificar se existe desigualdade salarial entre os setores da economia. Consideremos que a economia está dividida em 4 setores: indústria, comércio, serviços e construção. Cada um dos trabalhadores está em um dos quatro setores e eles são mutuamente exclusivos. Seja Y i o salário mensal do trabalhador i e definimos para cada setor uma variável binária que é igual a 1 se o trabalhador está em determinado setor e 0 caso contrário. Estimando um modelo linear de regressão, obtemos o seguinte resultado:

(0,02) (0,008) (0,0001) (0,0005) (0,001) (0,003) (0,005) R2 = 0,83 em que educ representa o numero de anos de estudos de cada trabalhador, idade é medida em anos, Homem é uma variável binária que assume valor igual a 1 se i é homem e 0 caso contrário, DI

representa a dummy para indústria, DC para o comércio e DCons para o setor de construção. Entre parênteses encontra-se o erro padrão. Baseado nas informações acima julgue as seguintes afirmativas: [Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão, então Pr(|Z| > 1,645) = 0,10 e Pr(|Z| > 1,96) = 0,05.] Ⓞ Com base nos resultados acima é possível rejeitar ao nível de 5% de significância a hipótese nula de que o salário do setor da indústria é igual ao salário do setor de serviços para trabalhadores com o mesmo nível educacional, a mesma idade e do mesmo sexo. A hipótese alternativa é que os salários nestes setores sejam diferentes. ① Com base nos resultados acima é possível rejeitar ao nível de 5% de significância a hipótese nula de que o salário no setor de construção é igual ao salário no setor de comércio, mantendo educação, idade e sexo fixos. A hipótese alternativa é que os salários nestes setores sejam diferentes. ② Com base nos resultados acima, é possível rejeitar ao nível de 5% de significância a hipótese nula de que o salário nos 4 setores da economia são iguais, mantendo constante educação, idade e sexo. ③ Os resultados do modelo acima permitem testar a hipótese nula de que o retorno salarial entre homem e mulher é diferente para cada nível educacional, ao nível de 5% de significância. ④ Com base nos resultados acima, podemos testar a hipótese de que o intercepto do modelo linear de salário em função da educação, idade e setor para homem é diferente do intercepto do mesmo modelo linear de salário para mulher.

Resolução: (0) Verdadeiro. Nomeando o regressor da dummy para indústria, o que o enunciado pergunta é se é significativo a 5%. Assim, rodamos o seguinte teste:

Como o valor calculado da estatística de teste não pertence à região crítica, ao nível de significância estabelecido de 5%, [–1,96, 1,96], rejeita-se H0. (1) Falso. Chamando de o coeficiente da dummy DC e o coeficiente da dummy DCons, deveria ser testada a hipótese de igualdade entre os dois coeficientes citados, como efetuado abaixo:

Repare que o valor crítico do teste depende de

. Como o exercício não

disponibilizou essa informação, não é possível testar a hipótese proposta.

(2) Falso. O que o enunciado pede é um teste F com 3 restrições de exclusão (de que os três coeficientes das dummys dos setores da indústria, comércio e construção sejam iguais a zero). Para realizar o teste, seria necessário estimar o R2 do modelo restrito (que exclui essas dummys), além de termos os dados dos valores críticos do teste F. Assim a questão é falsa, pois não podemos testar a hipótese sem que as estatísticas necessárias estejam disponibilizadas. (3) Falso. Para testar tal hipótese é necessário efetuar a inclusão da variável de interação das variáveis de gênero e nível educacional. O modelo nesta forma pressupõe que os efeitos da educação são iguais entre homens e mulheres. (4) Verdadeiro. Como a dummy de gênero foi colocada de forma aditiva, ela atuará como mudança de intercepto no modelo caso seja significativa. Assim, basta aplicar o seguinte teste (sendo

o regressor da dummy para gênero):

O valor é muito significativo, logo rejeita-se H0, e portanto o intercepto do modelo linear para homens é diferente do intercepto do modelo linear para mulheres.

Questão 11 Suponha que um pesquisador esteja interessado em investigar os determinantes da delinquência juvenil e tenha acesso aos seguintes dados provenientes de 100 cidades de um dado país: A, o número de internações por 1000 adolescentes; P, o número de residências por 1000 domicílios na cidade com renda abaixo da linha da pobreza; S, o número de residências por 1000 domicílios na cidade com apenas um dos pais. O pesquisador estima a seguinte regressão: Em que u é um termo de erro que satisfaz todas as hipóteses usuais do modelo de regressão. A correlação populacional entre P e S é 0,96. Julgue as seguintes afirmativas: Ⓞ A alta correlação populacional entre P e S dará origem ao problema conhecido como multicolinearidade. ① Multicolinearidade não torna viesados os estimadores de mínimos quadrados ordinários dos coeficientes, mas faz com que eles sejam inconsistentes. ② As estimativas dos desvios padrões serão viesadas e provavelmente subestimarão os valores verdadeiros. ③ Na presença de multicolineariedade, os testes t e F não são validos. ④ Se ao invés de uma alta correlação populacional entre P e S, houvesse uma alta correlação populacional entre A e P ou entre A e S, o problema de multicolinearidade seria ainda pior.

Resolução: (0) Verdadeiro. O problema da multicolinearidade é exatamente a alta correlação entre as variáveis explicativas, no caso P e S. A multicolinearidade é chamada de imperfeita quando a

correlação entre um grupo de regressores está em (–1,1). A multicolinearidade perfeita ocorre quando a correlação assume os valores –1 ou 1. (1) Falso. A multicolinearidade imperfeita não torna os estimadores de MQO viesados nem inconsistentes. A multicolinearidade perfeita impede que os estimadores de MQO sejam obtidos, pois a matriz X΄X deixa de ser inversível. (2) Falso. A presença de multicolinearidade não afeta a propriedade de que a estimativa da variância do erro ( ) seja não viesada. Apesar de ela elevar esta estimativa, a mesma continua não viesada (para esta dada amostra e variáveis). No entanto, a estimativa do desvio padrão do erro (que é a variância da estimativa de ) é viesada, pois a esperança da raiz de não é igual à raiz da esperança (Wooldridge, 2006, p. 57). Além disso, podemos determinar a direção do viés, através da desigualdade de Jensen enunciada na revisão de Conceitos do Capítulo de Probabilidade. Seja a estimativa do desvio padrão:

Sabemos que, pela desigualdade de Jensen: E(f(x)) < f(E(x)), em que f(.) é uma função estritamente côncava. Neste caso, a função é E( E

, onde

. Substituindo na expressão acima:

)<
1,96) se

tornaria estatisticamente não significativo no segundo modelo com o mesmo erro padrão (a estatística t seria 0,01/0,01 = 1 < 1,96), o que não é possível apenas se alterando a unidade de medida do regressor. (4) Verdadeiro. Como visto no item (2), o ESS e TSS não serão alterados pela mudança de medida da renda per capita. Dessa forma o R2, definido como

, tampouco irá se

alterar.

Questão 12 Considere o seguinte modelo de regressão: yi = β + ui , i = 1, ..., n no qual E(ui ) = 0, Var(ui ) = σ2xi e E(ui uj) = 0 i ≠ j. Suponha também que os xi s são não estocásticos para todo i = 1,..., n . Denote por βgls o estimador de mínimos quadrados generalizados de β. Sabe-se que σ2 = 1 e Calcule Var(

.

). Multiplique o resultado por 100.

gls

Resolução: O formato da heterocedasticidade é conhecido. Assim, é possível aplicar o método do mínimos quadrados generalizados (MQG) ou generalized least squares (GLS), que corrige o problema da heterocedasticidade. O método consiste em multiplicar o modelo por um termo apropriado que torne o erro homocedástico, ou seja:

Assim, trata-se de um modelo de regressão linear simples sem intercepto cujo erro terá variância constante:

O método agora consiste em estimar o parâmetro do modelo modificado por meio do MQO. O estimador nesse caso será:

em que as variáveis independente e dependente não são expressas em termos de desvios de suas médias pois o modelo modificado não inclui constante. A fórmula da variância é a mesma que de uma regressão linear com intercepto. A diferença é que o denominador não é a soma dos quadrados totais do regressor – a qual é calculada em termos de desvios da média – mas apenas a soma dos quadrados do regressor – ou seja, sem ser em termos de desvios da média (a derivação da variância está na observação abaixo após a solução). Assim:

em que na segunda igualdade usamos

e Var(ui*) = σ2 e na terceira e quarta

igualdades substituímos os dados fornecidos no enunciado. Observação:

em que, na segunda igualdade usamos o fato de yi, i = 1, ..., n, ser uma amostra aleatória (apesar do enunciado não ter explicitado) e que di é função apenas de xi, que não é estocástico (aleatório) e, portanto, pode ser tratado como uma constante. Por fim na penúltima igualdade usamos o fato de que Var(yi*) = Var(ui*), visto que a única variável aleatória que yi* depende no modelo é ui*. Calculando o somatório:

Substituindo de volta na expressão acima, temos a fórmula do estimador da variância do coeficiente angular para o caso do modelo não ter intercepto:

Questão 14 Usando a base de dados que contém informações sobre 65.000 indivíduos, estimamos o retorno da educação usando a educação da mãe do indivíduo como instrumento para educação do indivíduo i, obtendo o seguinte resultado: = 320,89 + 67,21Xi + 5,49Wi , R2 = 0,46 (220,75) (38,68) (1,60) no qual Y i representa a renda do indivíduo i, Xi o número de anos de estudo do indivíduo i, Wi a idade do indivíduo i e Zi representa a educação da mãe. O termo em parênteses representa o desvio padrão respectivo. Baseado nas informações acima, julgue as seguintes afirmativas: Ⓞ Para a educação da mãe (Zi) ser um bom instrumento para a educação do filho (Xi), ele deve atender a duas condições: (1) Cov(Xi, Zi) ≠ 0 e (2) Cov(Xi, ui) = 0. ① Com base nos resultados acima, podemos testar a condição (1) Cov(Xi, Zi) ≠ 0, isto é, que a educação da mãe é correlacionada com a educação do filho. ② Com base nos resultados acima, é possível rejeitar a hipótese de que educação da mãe tem um efeito parcial significativo na renda mensal do indivíduo ao nível de significância de 5%. ③ Suponha que a educação do pai seja correlacionada com a educação da mãe e tenha uma correlação não nula com a renda mensal do indivíduo. Neste caso, educação da mãe continua sendo um instrumento válido para a educação do indivíduo. ④ Se houver uma correlação positiva entre idade e educação da mãe, a educação da mãe deixa de ser um instrumento válido para educação do indivíduo.

Solução: (0) Falso. A condição (1) está certa, mas a (2) está errada. A condição correta seria que Cov(Zi, ui) = 0, ou seja, que o instrumento não seja correlacionado com o erro. Se Cov(Xi, ui) = 0, como afirmado no item, então Xi não é endógeno e não necessita de instrumento. (1) Falso. Seria necessário que os resultados do 1o estágio dos mínimos quadrados de dois estágios (MQ2E ou 2SLS em inglês), ou seja, da regressão de Xi contra Zi e Wi, fossem reportados. Assim, bastaria aplicar o teste t para a significância de Zi. (2) Falso. Seria necessário estimar outro modelo, incluindo a variável de educação da mãe.

Como tais resultados não foram incluídos, nada se pode auferir. (3) Falso. A educação do pai é correlacionada com a renda do indivíduo e não foi incluída no modelo. Logo, ela está contida no erro. Como a mesma é correlacionada com a educação da mãe, a condição Cov(Zi, ui) = 0, mencionada na solução do item (0), não é mais satisfeita. Assim, o instrumento não é mais válido. (4) Falso. A correlação entre Zi e Wi não invalida o instrumento. A validade do mesmo depende apenas das duas condições mencionadas na solução do item (0).

PROVA DE 2014 Questão 1 Neste exemplo, queremos prever o peso do indivíduo i usando somente sua altura,

, no qual Y é o peso do indivíduo e X a altura. Assumimos que ,

,

,

é uma amostra aleatória, e

. Após coletar a

informação de peso e altura de 100 indivíduos, obtemos a seguinte tabela:

18

8

95

1200

4800

Estimando o modelo por Mínimos Quadrados Ordinários, calcule o valor da estimativa obtida para

.

Multiplique o resultado por 10.

Resolução: A questão oferece a equação a ser estimada:

E afirma que valem todas as hipóteses do modelo de regressão linear simples. Assim, de acordo com a revisão de conceitos, o estimador de MQO de é:

para essa equação

Utilizando os dados fornecidos pelo problema, temos:

Como a questão pede que se multiplique o resultado por 10, obtém-se 40, que é o resultado pedido.

Questão 4 Usando dados de uma amostra aleatória da população com 80.000 indivíduos, é estimada uma regressão pelo método de Mínimos Quadrados Ordinários. Os resultados dessa regressão são mostrados abaixo, em que os erros-padrão são mostrados entre parênteses: [Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão, então P(|Z|>1,645)=0,10 e P(|Z|>1,96)=0,05] ln(salário) = 0,30+ 0,10 escol + 0,03 idade - 0,15 mulher – 0,05(mulher x escol) (0,10) (0,04) (0,01) (0,03) (0,05) R2 = 0,45 e n=80.000, em que escol representa o número de anos de estudo, idade é a idade do indivíduo em anos e mulher é uma variável dummy igual a 1 se o trabalhador for do sexo feminino e igual a 0 se for do sexo masculino. Todas as suposições usuais acerca do modelo de regressão linear clássico são satisfeitas. Com base nos resultados acima, e supondo que a amostra é suficientemente grande para que aproximações assintóticas sejam válidas, é correto afirmar que: Ⓞ É possível rejeitar, ao nível de significância de 10%, a hipótese nula de que o coeficiente associado a variável escol é igual a zero. A hipótese alternativa é a de que o coeficiente associado a variável escol é diferente de zero. ① A média dos salários dos homens é maior do que a média dos salários das mulheres. ② Cada ano adicional de escolaridade deve elevar os salários em 10%. ③ O coeficiente de interação (mulher x escol) é significante (hipótese alternativa de que é diferente de zero) ao nível de 10%. ④ É possível rejeitar, ao nível de significância de 5%, a hipótese nula de que o coeficiente associado a variável idade é igual a zero. A hipótese alternativa é que o coeficiente associado a variável idade é maior do que zero.

Resolução: (0) Verdadeiro. Sendo o coeficiente de escol 0,10, A estatística do teste é:

Onde 1,645 é o valor crítico para o teste estipulado. Logo, a estatística do teste está na região crítica e o coeficiente é estatisticamente significante a 10%. (1) Falso. Em primeiro lugar, o coeficiente da variável dummy mulher é significante a qualquer um dos níveis habituais de significância, pois a estatística t do teste é:

Isso significa que o intercepto é diferente para cada gênero. Assim, podemos reescrever a equação do enunciado como duas, uma para cada gênero. Então, tirando a média dessas equações, encontramos:

Onde a primeira equação é para homens e a segunda para mulheres, e onde o traço sobre a variável significa a média amostral. Assim,

, por exemplo, é a média da escolaridade dos

homens. Tirando a diferença dessas equações, fica claro que a afirmação do item é verdadeira se e somente se:

Como não sabemos as médias dos regressores entre os gêneros, também não podemos afirmar que a desigualdade acima vale. Portanto, a questão é falsa. Observação: Atenção neste item, pois ele se refere à média das amostras e não diretamente às estimativas dos coeficientes mulher e (mulher x escol) pois não é mencionada significância estatística. Se fosse esse o caso, seria mais correto mencionar que, ceteris paribus, os homens ganham em média mais do que as mulheres, mas que o efeito depende da escolaridade. Ou seja, tomando a última expressão e considerando a mesma média de idade e escolaridade teríamos:

Homens sem escolaridade (

) ganham em média 15% a mais do que mulheres sem

escolaridade. Mas esse efeito cresce com a escolaridade. (2) Falso. O efeito é de aproximadamente 10%. Como enunciado na revisão de conceitos, o efeito exato é:

Observação: De fato, o efeito é de aproximadamente 10% para os homens, como indicado

acima, e de 5% para as mulheres. Este segundo efeito é calculado observando a existência da interação entre mulher e escol, que indica que o efeito da educação sobre o salário das mulheres é menor que sob o salário dos homens (coeficiente negativo). (3) Falso. Novamente, basta encontrar a estatística do teste:

Onde 1,645 é o valor crítico para o teste proposto. Logo, o coeficiente não é estatisticamente significante. (4) Verdadeiro. O detalhe deste item é que o teste sugerido é unilateral. Assim, o valor crítico continua sendo 1,645, ainda que o nível de significância seja diferente daquele requisitado nos itens (3) e (0). Calculando a estatística t e comparando com o valor crítico:

Logo, é possível rejeitar a hipótese nula, como sugere o enunciado. Interessante notar que, mesmo se o estudante utilizasse o valor crítico errado a hipótese nula seria rejeitada.

Questão 6 Suponha que queremos estimar como a renda de um indivíduo varia ao longo do ciclo de vida. Queremos testar a teoria de que a renda do indivíduo cresce a partir do momento que ele entra no mercado de trabalho até uma idade média, e depois começa a decrescer até o final do ciclo de vida. Usando dados de uma pesquisa anual para 14.368 trabalhadores, estimamos o seguinte modelo: , em que Y i é o logaritmo da renda mensal do indivíduo i, X1i é a idade do indivíduo i, X2i é uma variável binária que é igual 1 se o indivíduo é homem e X3i representa o número de anos de estudo do indivíduo i. Estimando o modelo por Mínimos Quadrados Ordinários, obtemos o seguinte resultado, em que os valores em parênteses abaixo dos coeficientes representam os erros-padrão: [Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição normal padrão, então P(|Z|>1,645)=0,10 e P(|Z|>1,96)=0,05]

. Ⓞ Se a teoria descrita acima é verdadeira, esperamos que o sinal de β1 seja positivo e o sinal de β4 negativo. ① Neste modelo, o intercepto do modelo para homens é β0 + β2, e o do modelo para mulheres é somente β0. ② O resultado indica que, mantendo tudo mais constante, o aumento de 1 ano da idade do indivíduo aumenta a sua renda em 45%. ③ Temos evidência de que a equação de salários dos homens apresenta um intercepto diferente do modelo para mulheres. ④ Com os resultados do modelo, podemos afirmar que idade e educação têm um efeito conjunto significativo no logaritmo do salário, isto é, temos evidência para rejeitar a hipótese nula

.

Resolução: (0) Verdadeiro. A teoria diz que a renda do indivíduo deve primeiro crescer até certa idade e, a partir de então, decrescer. Esta hipótese é compatível com uma parábola côncava na idade do indivíduo, portanto, o termo linear deve ser positivo (logo, β1 > 0) e o termo quadrático deve ter coeficiente negativo (ou seja, β4 < 0). (1) Verdadeiro. Como X2 é uma variável dummy que assume valor 1 para indivíduos do sexo masculino, pode-se traçar uma equação separada para este gênero, na qual o intercepto será, com efeito, β0 + β2. E para obtermos o modelo para as mulheres, basta fixar X2 = 0 e teremos que o intercepto será β0. Ou seja,formalmente teremos os seguintes modelos para homens e mulheres, respectivamente:

(2) Falso. O efeito da idade é dependente do nível, o que é captado pelo termo quadrático, portanto a afirmação não pode ser verdadeira. Formalmente, o efeito seria:

Assim, deve-se fixar o valor da idade (X1i) e efetuar um teste t. Observação: Vale notar que, mesmo no caso da idade nula (X1i = 0), o efeito de 45% seria apenas aproximado, como observado na Questão 2, item (2). (3) Verdadeiro. Como visto no item 1, os interceptos dos modelos dos homens e das mulheres são, respectivamente, β0 + β2 e β0 . Para eles serem diferentes, basta testar se o coeficiente β2 é significante a qualquer nível de significância usual. Basta ver a estatística t:

(4) Falso. Precisaríamos de um modelo restrito para efetuar um teste F de significância conjunta de dois parâmetros. Como não temos esta informação, os resultados do modelo não nos permitem afirmar nada, tornando o item falso.

Questão 14 Considere o modelo de regressão linear simples

,

no qual

é uma amostra aleatória,

,

,

,

. Temos um vetor de variáveis aleatórias Zi com dimensão rx1, com r≥1, tal que . Além disso,

.

Baseando-se nas informações acima, julgue as seguintes afirmativas: Ⓞ O estimador de Mínimos Quadrados Ordinários para β1 será consistente, mas ineficiente.​ ① Se r=1, podemos identificar o parâmetro populacional β1 como

.

② Se r≥1, o estimador de Mínimos Quadrados em dois estágios será um estimador consistente​. ③ Se r≥1, o estimador de Mínimos Quadrados em dois estágios será um estimador não-​v iesado e eficiente.

④ Se r=1, o estimador de variável instrumental para βV/1 será

.

Resolução: Nota: Nada é dito sobre a covariância entre Zi e Xi. No entanto, como se trata de uma questão de variáveis instrumentais, suporemos que as duas variáveis são correlacionadas. Essa hipótese é importante exceto para o item (0). É uma das condições necessárias para que uma variável possa ser utilizada como instrumental, além de exogeneidade em relação ao erro – o que é garantido no enunciado. (0) Falso. Como

, de acordo com o enunciado, a estimação de MQO’s

violaria a hipótese de não-endogeneidade do regressor Xi. Logo, o estimador de MQO será inconsistente. Observação: O estimador por MQO em termos matriciais é:

em que, na segunda igualdade da primeira linha substituímos o modelo verdadeiro (populacional). Aplicando o limite em probabilidade (plim):

Como

,pois eles são correlacionados segundo o enunciado, temos que: ,

ou seja, o estimador por MQO é inconsistente. (1) Falso. Calculando a covariância populacional de Z com Y, temos:

Como

, podemos identificar o valor do parâmetro β1 a partir de variáveis

observáveis:

Observação: Esta derivação também consta em Wooldridge (2006, p.457). (2) Verdadeiro. De acordo com Wooldridge (2006, pg. 489), há 4 condições para que o estimador de MQ2E seja consistente. Que haja linearidade nos parâmetros, que a amostragem seja aleatória e mais duas hipóteses que têm de ser checadas: se cada variável instrumental Zi deve ser não-correlacionada ao erro (o que é garantido no enunciado), e, como há apenas uma variável endógena, deve haver ao menos uma exógena correlacionada a ela. Na Observação acima, argumentamos que é de se supor que há correlação entre as duas variáveis. Logo, o estimador é consistente. (3) Falso. Se a correlação entre Zi e Xi for baixa, haverá viés, como exposto em Wooldridge (2006, pg. 462). Como não sabemos a intensidade da correlação entre a variável instrumental e a variável explicativa endógena, desta forma não temos garantia da inexistência de viés. Sabendo que um estimador só é eficiente se for não viesado, também não podemos garantir a sua eficiência. (4) Verdadeiro. O estimador de variável instrumental, de acordo com a revisão de conceitos, é

exatamente o do enunciado.

PROVA DE 2015 Questão 8 Considere o modelo de regressão abaixo: ,

, em que

e

Considere os seguintes estimadores:

e β~1 =

em que

É correto afirmar que: Ⓞ

é um estimador não tendencioso de

;

① Se

,

é um estimador consistente de

② Se

,

não é um estimador consistente de



é um estimador não tendencioso de

④ Se

,

; ;

;

.

Resolução: (0) Falso.

,

em que, o termo

foi passado para for a da esperança pois a mesma foi

condicionada em xi e, consequentemente, esse termo pode ser considerado uma constante. Utilizando esse mesmo argumento na continuação do cálculo da esperança acima (mais

especificamente, utilizaremos

e

na passagem da quarta

para a quinta linha abaixo):

(1) Verdadeiro. Se

, pela última fórmula do item 0:

.

Logo, é um estimador não tendencioso de variância do estimador:

. Para avaliar consistência, calculemos a

,

em que, o termo

foi passado para for a da variância ao quadrado pois a mesma foi

condicionada em xi e, consequentemente, esse termo pode ser considerado uma constante. Adicionalmente, os termos xi na expressão da variância condicional também são consideradas constantes, bem como e

que

são

parâmetros

populacionais

fixos.

Logo:

. Assim:

,

em que, na última igualdade, foi assumido que os erros são não correlacionados entre si e, consequentemente, a variância da soma é igual a soma da variância. Assim:

Utilizando a proposição enunciada na revisão de conceitos para verificação de consistência do estimador:

Logo,

é consistente.

(2) Falso. No Wooldridge (2006, cap 5, p. 160) foi provada a propriedade de consistência do estimador de mínimos quadrados para o caso de regressão linear simples. A prova e a propriedade se mantêm, mesmo se o valor populacional do intercepto for nulo. (3) Verdadeiro. A propriedade de não viés do estimador de mínimos quadrados ordinários (EMQO) foi enunciada e provada na parte de Mínimos Quadrados Ordinários (MQO) na Revisão de Conceitos, logo antes do Teorema de Gauss Markov. (4) Falso. Pelos itens 0 e 3, sabemos que:

Pela Lei das Expectativas Iteradas, enunciada na revisão de conceitos do cap. 1:

Logo, mesmo se assumir ainda que

, não podemos garantir que

. Seria necessário

.

Questão 9 Julgue as seguintes afirmativas: Ⓞ Colinearidade quase perfeita na matriz de variáveis explicativas causa um viés no estimador de Mínimos Quadrados Ordinários; ① Colinearidade quase perfeita na matriz de variáveis explicativas causa um viés no estimador da variância do estimador de Mínimos Quadrados Ordinários; ② Colinearidade quase perfeita na matriz de variáveis explicativas gera uma perda da propriedade de eficiência do estimador de Mínimos Quadrados Ordinários; ③ Colinearidade quase perfeita faz com que o erro-padrão de algumas estimativas dos coeficientes de Mínimos Quadrados Ordinários seja grande; ④ Colinearidade quase perfeita faz com que o estimador de Mínimos Quadrados Ordinários deixe de ser linear.

Resolução: (0) Falso. A colinearidade perfeita impede a obtenção de estimadores de mínimos quadrados ordinários. Observação: Mas, sob colinearidade quase perfeita, ainda se pode obter estimadores de mínimos quadrados não viesados. Verifique a prova desta propriedade na parte de Mínimos Quadrados Ordinários (MQO) na Revisão de Conceitos, logo antes do Teorema de Gauss Markov, e note que a prova não envolve colinearidade alta ou baixa.

(1) Falso. Os estimadores da variância do estimador de MQO são ainda não viesados para o dado conjunto de regressores. Seu cálculo não é afetado por correlação alta ou baixa entre os regressores. (2) Falso. Os estimadores de MQO são ainda eficientes para o dado conjunto de regressores. Seu cálculo não é afetado por correlação alta ou baixa entre os regressores. Verifique a prova do Teorema de Gauss-Markov desta propriedade na parte de Mínimos Quadrados Ordinários (MQO) na Revisão de Conceitos e e note que a prova não envolve colinearidade alta ou baixa. (3) Verdadeiro. Sob colinearidade quase perfeita, a variância do estimador é grande. Isso pode ser observado, por exemplo, através da fórmula da variância, enunciada na revisão de conceitos: ,

em que k é o número de regressores, coeficiente de determinação da regressão de colinearidade quase perfeita, o

,

e

éo

contra os demais regressores. Sob

é próximo de um, inflando a variância do estimador.

(4) Falso. O estimador de MQO ainda será linear sob colinearidade quase perfeita. Note o estimador de MQO, enunciado na revisão de conceitos: ,

em que,

,

é o resíduo da regressão de

contra os demais regressores. Ou

seja, para se obter o estimador de MQO como linear em relação a

não utilizou-se nenhuma

condição em relação a colinearidade não ser quase perfeita. Apenas a hipótese de não colinearidade perfeita é necessária para que seja possível se obter o estimador.

Questão 13 O governo gostaria de estimar o efeito do Programa Saúde da Família sobre a taxa de internação por difteria das crianças entre 0 e 4 anos de idade. Para isso, ele gostaria de estimar o seguinte modelo de regressão: , no qual Y i é a taxa de internação do município i, Xi é uma variável binária que é igual a 1, se o

município i participa do programa, e 0, caso contrário. Usando os dados para o Brasil em 2013, temos os seguintes resultados:

,

. Neste caso,

municípios que participaram do Programa e

é a média da taxa de internação para os

é a média da taxa de internação para os municípios

que não participaram do Programa. Além disso, 70% dos municípios brasileiros participam do Programa Saúde da Família. Você estima o modelo acima por Mínimos Quadrados Ordinários. Qual o valor obtido para o coeficiente associado a Xi ?

Resolução: O modelo acima é a função de regressão populacional. Reescrevendo-o em termos da função de regressão amostral: , em que,

e

populacionais

são os estimadores de Mínimos Quadrados Ordinários dos parâmetros e

acima para

em que,

, respectivamente, e e

e

é o resíduo da regressão. Avaliando a função

, obtemos, respectivamente:

são os valores de Y condicionados em

e

, respectivamente.

Avaliando em termos da média amostral, obtemos, respectivamente: ,

em que

e

são as médias média da taxa de internação para os municípios que

participaram do Programa e

é a média da taxa de internação para os municípios que não

participaram do Programa. Este resultado deriva das condições de primeira ordem quando da obtenção do estimador de MQO, como mostrado na parte de Mínimos Quadrados (MQO) na Revisão de Conceitos. Substituindo os valores de

e

dados no enunciado, obtemos:

6

Análise de Regressão II: Equações Simultâneas

REVISÃO DE CONCEITOS Apresentamos a seguir uma breve Revisão de Conceitos deste tópico. É importante ressaltar que a revisão aqui apresentada não é exaustiva, mas tem a função apenas de servir de suporte para a demonstração de algumas soluções. Por isso, recomendamos, antes da resolução, o estudo das referências citadas no fim do livro. Identificação Condição de Ordem Abaixo apresentamos uma condição necessária para identificação: Sejam: M endógenas incluídas no sistema m endógenas incluídas na equação K exógenas incluídas no sistema k exógenas incluídas na equação Então uma condição necessária é que: K – k ≥ m – 1, ou seja, o número de variáveis exógenas (predeterminadas) excluídas da equação deve ser pelo menos tão grande quanto o número de variáveis endógenas menos um. Condição de Posto A seguir apresentamos uma condição necessária e suficiente para identificação: Em um sistema de equações com M endógenas, uma equação é identificada se o posto da submatriz de coeficientes, construída a partir dos coeficientes (das variáveis endógenas e exógenas) excluídos da equação analisada, e incluídos em alguma das demais equações do modelo, for igual a (M – 1).

PROVA DE 2006 Questão 7 Considere o modelo:

Y t = aZt + bY t-1 + e1t (equação I) Zt = lZt-1 + e2t (equação II) em que a, b e l são parâmetros e:

Suponha também que |l|< 1 e |b|< 1. São corretas as afirmativas: Ⓞ A condição |l|