Monday 18 December 2017

Teste interações em stata forex


Stata: análise de dados e software estatístico Kenneth Higbee, StataCorp Vou ilustrar o que está acontecendo com um exemplo simples, usando regressão. Exploraremos as hipóteses testadas à medida que mudamos o nível base (omitido) quando ocorremos uma interação em um modelo simples de dois fatores. Para este exemplo simples, cada fator tem apenas dois níveis. A conclusão chave é que, apesar do que alguns podem acreditar, o teste de um único coeficiente em um modelo de regressão quando as interações estão no modelo depende da escolha dos níveis de base. Mudando de uma base para outra, muda a hipótese. Além disso, a hipótese de um teste envolvendo um único coeficiente de regressão geralmente não é a mesma que a hipótese testada por um teste ANOVA F de um efeito principal de um fator. Isso pode ser contra-intuitivo à primeira vista, mas é verdade. Pegue os seguintes dados: temos uma tabela 2 vezes 2 com datamdash não balanceado, tamanhos de amostra diferentes (4, 3, 2 e 8) em cada célula. Referiremos a tabela 2 vezes 2 acima e comparamos seus valores e meios com aqueles em outras tabelas de regressão. Essas comparações podem nos ajudar a entender melhor as hipóteses que estão sendo testadas. Letrsquos começa por pensar na matriz de design superdimensionada X. Queremos calcular os coeficientes de regressão b inv (XX) (Xy), mas, devido às colinearidades em X (A1 A2 cons. B1 B2 contras), muitas das colunas de X devem ser omitidas para ter uma matriz de classificação completa que Podemos inverter. Ou a coluna A1 ou A2 precisa ser omitida (ou possivelmente os contras), mas letrsquos não explorar isso agora). A coluna que omitimos corresponde ao que chamamos de nível base para esse fator. Da mesma forma, para B1 e B2mdashone devem ser omitidos para evitar a colinearidade com a constante. Das quatro colunas de X para a interação A by B, três delas devem ser omitidas (dado que estamos mantendo uma das colunas A, uma das colunas B e contras). Poderíamos optar por omitir o primeiro nível de A e B (as colunas A1 e B1 de X) e as colunas correspondentes a AB que coincidem com essas seleções (neste caso, as primeiras 3 colunas da parte de X para AB ). O comando acima é equivalente a Statarsquos padrão de escolher o primeiro nível para ser a base quando você simplesmente digita ou ainda mais sucintamente. Em todos os casos de regressão nesta FAQ, adicione a opção allbaselevels para obter uma tabela de regressão mais detalhada que indique exatamente qual As colunas da matriz X foram omitidas. Depois que o conceito é perfeitamente claro, você pode optar por não usar a opção allbaselevels porque parece excessivamente detalhado. Em vez de escolher A no nível 1 e B no nível 1 para a base, podemos fazer outras três opções para a base: A no nível 1, B no nível 2 A no nível 2, B no nível 1 A no nível 2, B em Nível 2 Você pode obter essas três outras opções com esses comandos: Execute essas quatro regressões, examine os coeficientes e compare-os com os meios mostrados na tabela acima. Letrsquos começam com os níveis de base padrão. Apenas para ser claro sobre quais colunas são descartadas da matriz X que mostramos acima, primeiro digite o comando: então, por uma questão de brevidade aqui, olhamos para uma versão condensada da mesma tabela de regressão. O coeficiente cons, 25,5, corresponde à média da célula A1, B1 em nossa tabela 2 vezes 2. Em outras palavras, a constante na regressão corresponde à célula em nossa tabela 2 vezes 2 para os níveis de base escolhidos (A em 1 e B em 1). Obtemos a média da célula A1, B2 em nossa tabela 2 vezes 2, 26.33333, adicionando o coeficiente cons ao coeficiente 2.B (25.5 0.833333). Obtemos a média da célula A2, B1 na nossa tabela 2 vezes 2, 33, adicionando o coeficiente cons ao coeficiente 2.A (25.5 7.5). Obtemos a média da célula A2, B2 em nossa tabela 2 vezes 2, 49, adicionando o coeficiente cons ao coeficiente 2.A, o coeficiente 2.B e o coeficiente 2.A2.B (25.5 7.5 0.8333 15.1667 ). Letrsquos concentra-se no coeficiente 2.A, que é igual a 7.5. O que corresponde a Ele corresponde à célula A2, B1 menos a célula A1, B1. Olhando para a nossa tabela 2 vezes 2, seria 33 menos 25,5. Quando você olha o teste para esse coeficiente de regressão único, você está testando essa hipótese: com B configurado para 1. Existe uma diferença entre o nível 2 de A e o nível 1 de A. Agora escolha uma das outras três regressões que usa uma combinação de bases diferente para os dois fatores. Nós escolhemos o último. Apenas para ter certeza de que você é claro sobre o que foi omitido da matriz X, digite o comando: então, por brevidade, aqui está a mesma regressão mostrada de forma mais compacta: Aqui, o coeficiente cons, 49, é igual à média para a célula A2, B2 Da nossa mesa 2 vezes 2. Isso corresponde à nossa escolha do nível 2 como nosso nível de base para A e B. Obtemos a média da célula A1, B2, 26.3333, adicionando o coeficiente cons ao coeficiente 1.A, (49 -22.6667). Obtemos a média da célula A2, B1, 33, adicionando o coeficiente cons ao coeficiente 1.B, (49 -16). Recebemos a média da célula A1, B1, 25,5, adicionando todos os quatro coeficientes (49 -22.6667 -16 15.1667) Letrsquos observam de perto o coeficiente 1.A, que é -22.6667. Esse coeficiente corresponde à célula A1, B2 menos a célula A2, B2. De nossa tabela 2 vezes 2, isso seria 26.3333 menos 49. Quando você olha o teste para esse coeficiente de regressão único, você está testando a hipótese: com B ajustado para 2. Existe uma diferença entre o nível 1 de A e o nível 2 de A. A hipótese para o teste do coeficiente 1.A neste modelo não é equivalente à hipótese para o teste do coeficiente 2.A no modelo de regressão anterior. Ambos estão testando A. Mas no primeiro caso, é um teste de A com B definido como 1. Neste segundo caso, é um teste de A com B definido como 2. No primeiro teste, o valor de p foi 0.710. No segundo, o valor p é 0.165. Estes são valores de p diferentes muito diferentes para este conjunto de dados, mas isso não é chocante porque eles estão testando diferentes hipóteses. Eu poderia ilustrar o que os coeficientes representam nas outras duas regressões (onde escolhemos outras combinações dos níveis de A e B para ser a base), mas vou abster-se porque faria uma longa FAQ até mais. O teste de ANOVA do efeito principal de A é um teste diferente de ambos os testes de coeficiente mostrados acima. O teste do efeito principal de A dá um valor p de 0,2496. Você obtém o mesmo valor de p para o efeito principal de A, independentemente de você digitar o comando anova como mostrado acima ou escolher diferentes níveis de base. Os seguintes comandos fornecem todos os mesmos testes F: como você obtém o teste F de efeito principal ANOVA para o termo A dos coeficientes de regressão subjacentes. Observe a opção simbólica de teste após anova. Para cada uma das regressões, podemos obter o mesmo teste F para o efeito principal de A como mostrado pela ANOVA acima. Digite os seguintes comandos: Consulte o teste A, tabela simbólica para ver por que os testes acima estão configurados como eles são. Se você não tem certeza de como eu sabia digitar b2.A2.B, use a opção Coeflegend de regredir. Eu admito que usando a combinação linear de coeficientes de regressão b2.A 0.5b2.A2.B (escolhendo a primeira regressão como um exemplo) para produzir o teste F para o efeito principal A rsquos não é óbvio ou intuitivo. Letrsquos olha a álgebra quando os primeiros níveis de A e B são os níveis de base para nossa regressão: você acha que 0,5 (A2, B1 A2, B2) menos 0,5 (A1, B1 A1, B2) é igual a b2.A 0.5b2. A2.B. O teste F em ANOVA para o efeito principal de A é testar a seguinte hipótese: a média da célula significa que quando A é 2 menos a média da célula significa quando A é 1 0. Uma demonstração similar pode ser mostrada para os outros três Modelos de regressão onde outros níveis de base foram selecionados. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Stat ao dar um presente Regressão com o Stata Capítulo 6: Mais sobre interações de variáveis ​​categóricas Versão preliminar Esta é uma versão preliminar deste capítulo. Comentários e sugestões para melhorar este rascunho são bem-vindos. Esquema do capítulo 6.1. Análise com duas variáveis ​​categóricas 6.2. Efeitos simples 6.2.1 Analisando efeitos simples usando xi3 e regredindo 6.2.2 Codificação de efeitos simples 6.3. Comparações simples 6.3.1 Análise de comparações simples usando xi3 e regressão 6.3.2 Codificação de comparações simples 6.4. Interação parcial 6.4.1 Analisando interações parciais usando xi3 e regredindo 6.4.2 Codificação de interações parciais 6.5. Interação contrastada 6.5.1 Análise de contrastes de interação usando xi3 e regressão 6.5.2 Codificação de contrastes de interação 6.6. Meios ajustados de computação 6.6.1 Meios ajustados de computação via anova 6.6.1 Meios ajustados de computação através de regressão 6.7. Mais detalhes sobre o significado dos coeficientes 6.8. Efeitos simples através de codificação falsa versus codificação de efeito 6.8.1 Exemplo 1. Efeitos simples de anos em níveis de mealcat 6.8.2 Exemplo 2. Efeitos simples de mealcat em níveis de ano. Nota: Esta página faz uso dos programas xi3 e postgr3 que Não são mais mantidos e foram removidos dos nossos arquivos. As referências a xi3 e postgr3 serão deixadas nesta página porque ilustram princípios específicos de codificação de variáveis ​​categóricas. Para este capítulo, usaremos o arquivo de dados elemapi2 que usamos em capítulos anteriores. Vamos nos concentrar nas variáveis ​​mealcat. E collcat como eles se relacionam com a variável de resultado api00 (desempenho no api no ano 2000). A variável mealcat é as refeições variáveis ​​divididas em três categorias, e a variável colabora é a variável somecol dividida em 3 categorias. Podemos pensar em mealcat como sendo o número de estudantes que recebem refeições gratuitas e quebrados em baixo. Médio e alto. O algoritmo variável pode ser pensado como o número de pais com alguma educação universitária, e podemos pensar que está sendo dividido em baixo. Médio e alto. Para a nossa análise, pensamos que tanto o mealcat como o collcat podem estar relacionados a api00. Mas também é possível que o impacto do mealcat possa depender do nível do collcat. Em outras palavras, pensamos que pode haver uma interação dessas duas variáveis ​​categóricas. Neste capítulo, analisaremos como essas duas variáveis ​​categóricas estão relacionadas ao desempenho da api na escola, e também analisaremos a interação dessas duas variáveis ​​categóricas. Veremos que há uma interação dessas variáveis ​​categóricas e se concentrará em diferentes formas de explorar ainda mais a interação. Em primeiro lugar, usaremos o arquivo de dados elemapi2. Vamos modificar o rótulo do mealcat para ver mais claramente alguns dos pontos que estaremos demonstrando mais adiante neste capítulo. 6.1. Análise com 2 variáveis ​​categóricas Uma maneira tradicional de analisar isso seria realizar uma análise de variância fatorial 3 por 3 usando o comando anova, conforme mostrado abaixo. Os resultados mostram um efeito principal do collcat (F4.5, p-0.0117), um efeito principal do mealcat (F509.04, p0.0000) e uma interação de collcat por mealcat. (F6.63, p0.0000). Podemos usar o comando de ajuste para mostrar os meios ajustados quebrados por collcat e mealcat. Podemos mostrar um gráfico dos meios ajustados, conforme mostrado abaixo. Usamos o comando separado para fazer três variáveis ​​correspondentes aos três níveis de collcat (ou seja, yhat1 corresponde ao valor previsto quando o collcat é baixo). Podemos então mostrar o gráfico com os três níveis de collcat representados como três linhas separadas. Agora, deixamos cair as variáveis ​​yhat yhat1 yhat2 yhat3 no caso de querermos usar essas variáveis ​​mais tarde. Nós podemos fazer essas mesmas análises usando o comando regress. Abaixo, usamos o comando de regressão com xi3 para ver o efeito do collcat. Mealcat e a interação dessas duas variáveis. Usamos o comando de teste para testar os dois termos associados ao collcat para obter o efeito principal do collcat. Da mesma forma, usamos o comando de teste para obter o teste geral do mealcat. Finalmente, usamos o comando de teste para testar a interação do collcat pelo mealcat. Primeiro, note que os resultados dos comandos de teste correspondem aos do comando anova acima. Isso ocorre porque o codcat e o mealcat foram codificados usando uma codificação de efeito simples, um esquema de codificação onde os contrastes somam para 0. Nós indicamos que queríamos uma codificação de efeito simples usando g. collcat e g. mealcat no comando de regressão com xi3 (ver Capítulo 5 Para mais informações sobre esquemas de codificação disponíveis através do comando xi3). Se este tivesse sido codificado usando codificação falsa, e. I. collcat. Então os resultados dos comandos de teste para mealcat e somecat do comando regressão não corresponderam aos resultados anova. Além da simples codificação de efeitos, poderíamos ter usado e. . H. . R. . uma. . B. . Ou o. E os resultados dos comandos de teste teriam correspondido ao comando anova, embora o significado dos testes individuais tenha sido diferente. Este ponto será explorado com mais detalhes mais adiante neste capítulo. Podemos obter os meios ajustados usando o comando predizer para obter os valores previstos, chamando-os de pred e depois olhando a média de pred quebrada por collcat e mealcat. Podemos mostrar um gráfico de meios celulares como mostrado abaixo. Usamos a mesma estratégia que fizemos ao fazer o gráfico acima. Agora, descartamos as variáveis ​​pred pred1 pred2 pred3 caso desejemos usar esses nomes de variáveis ​​mais tarde. Observe que poderíamos ter produzido o mesmo gráfico e a tabela de valores previstos usando o comando postgr3. O gráfico da célula significa ilustra a interação entre o collcat e o mealcat. O gráfico mostra os três níveis de collcat como três linhas diferentes e os três níveis de mealcat como os três valores no eixo x do gráfico. Podemos ver que o efeito do collcat difere com base no nível de mealcat. Por exemplo, quando o mealcat é baixo, as escolas onde o collcat é 3 têm as pontuações api00 mais baixas, em comparação com as escolas que são médias ou altas em mealcat. Onde escolas com colaboraço de 3 têm as pontuações mais altas de api00. Vamos investigar essa interação ainda mais, observando os efeitos simples do collcat em cada nível de Foodcat. 6.2. Efeitos simples Descobrimos que o efeito principal do colabro foi significante, mas devido a uma interação, o efeito do colate depende do nível de comida. Podemos querer perguntar se o efeito do collcat é significativo em cada nível de mealcat. 6.2.1 Analisando efeitos simples usando xi3 e regredindo Para analisar os efeitos simples de colate nos diferentes níveis de Foodcat. Usaremos o símbolo em vez de indicar que queremos que os termos de interação reflitam os efeitos simples do collcat em cada nível de mealcat. Usaremos a codificação Helmert para o collcat. Que será discutido mais adiante. Podemos obter o efeito simples do collcat quando o mealcat é baixo (ou seja, 1) através do comando de teste abaixo. Isso mostra que o efeito do collcat quando o mealcat é baixo é significante. Usamos o comando de descrição abaixo para ver o significado desses termos e ver que esses dois termos representam as duas comparações em collcat quando o mealcat é 1. Por exemplo, no termo Ico2Wme1. O 2 significa que esta é a segunda comparação em collcat e o 1 significa que é quando mealcat é 1. Podemos testar o efeito simples de collcat quando o mealcat é 2 através do comando de teste abaixo. Isso mostra que o collcat é significativo quando o mealcat é 2. Também podemos testar o efeito simples do collcat quando o mealcat é 3 através do comando de teste abaixo. Isso mostra que o collcat é significativo quando o mealcat é 3, se usarmos um nível alfa de 0,05. Devemos notar que, uma vez que estamos fazendo uma série de testes adicionais, você pode querer considerar o uso de correções post hoc, como uma correção de bonferoni para evitar erros de Tipo I. Em resumo, os três efeitos simples do collcat em cada nível de Foodcat foram significantes. No entanto, o efeito do collcat quando o Foodcat foi 3 pode não ser significativo se usássemos um critério post hoc para avaliar seu significado. 6.2.2 Codificação de efeitos simples Embora o xi3 crie a codificação para você, é útil ver a codificação que ele cria para produzir esses efeitos simples. A codificação para a Foodcat usou codificação simples, e sua codificação é exatamente como vimos no capítulo 5. Abaixo, usamos o comando tablist para mostrar a codificação do mealcat. Você pode baixar tablist dentro do Stata digitando findit tablist (veja Como eu usei o comando findit para procurar programas e obter ajuda adicional para obter mais informações sobre o uso do findit). Nós vemos que a codificação de mealcat é exatamente como seria de esperar do capítulo 5. Solicitamos a codificação do Helmert para o collcat. E podemos olhar para a codificação do collcat para ver que os termos Icollcat1 Icollcat2 são realmente codificados usando codificação Helmert. Devemos notar que esses termos não são usados ​​na análise, mas são usados ​​pelo xi3 para criar os efeitos simples mostrados na próxima seção. Agora que vimos o helmert codificando o collcat. Podemos ver como isso é usado para criar os efeitos simples do collcat em cada nível de mealcat. Primeiro, olhamos para as duas comparações de collcat no mealcat de 1. Note que a codificação é a mesma que vimos acima, mas somente quando o mealcat é 1, caso contrário, essas variáveis ​​são codificadas 0. Da mesma forma, observamos os termos que formam Os efeitos do collcat quando o mealcat é 2, e vemos que as variáveis ​​são codificadas da mesma maneira quando o mealcat é 2, e de outra forma. Finalmente, vemos o mesmo padrão para os termos que formam o efeito do collcat quando o Foodcat é 3. Isso ilustra como o xi3 codifica as variáveis ​​para permitir a análise de efeitos simples. Se você quisesse, você poderia criar variáveis ​​manualmente de acordo com esta estratégia para realizar uma análise de efeitos simples. 3. Comparações simples Nas análises acima, analisamos o efeito simples do collcat em cada nível de mealcat. Por exemplo, analisamos o efeito geral do collcat quando a Foodcat foi 1. Este é o efeito simples do collcat no mealcat 1. Como o collcat tem mais de dois níveis, talvez desejemos fazer mais comparações entre os três níveis de colabora dentro do mealcat 1. Comparações simples nos permitem fazer essas comparações. 6.3.1 Analisando Comparações Simples Usando xi3 e regredindo Nas análises acima, usamos a codificação Helmer para o colate. Nós escolhemos essa codificação para que possamos comparar o grupo 1 com os grupos 2 e 3 e, em seguida, comparar os grupos 2 e 3. Por exemplo, se quisermos comparar o collcat 1 versus 2 e 3, gostaríamos de analisar o efeito Ico1Wme1. E se desejássemos comparar os grupos 2 e 3 do collcat quando o mealcat for 1, então analisaríamos o efeito Ico2Wme1. Como xi3 cria rótulos para cada termo que ele cria, podemos usar o comando de descrição para verificar se estamos usando os termos corretos. Na verdade, vemos que esses termos são como esperávamos. Podemos usar o comando de regressão para ver os efeitos para esses termos. Vemos que o collcat 1 não é significativamente diferente de 2 e 3 no mealcat 1 (t.96, p.337), mas o collcat 2 é significativamente diferente do collcat 3 no mealcat 1 (t3.10, p0.002). 6.3.2 Codificação de comparações simples Podemos ver que a codificação de comparações simples é a mesma que a codificação de efeitos simples. Por exemplo, podemos ver que a codificação de Icollcat1 e Icollcat2 é codificada usando codificação Helmert. Então, o termo termo Ico1Wme1 representa a comparação de 1 de colabro versus colateador 2 e 3 quando o alimento é 1. Assim, a codificação é a mesma que a codificação para Icollcat1 quando o mealcat é 1 e 0 caso contrário, veja abaixo. 6.4. Interação parcial Uma interação parcial permite que você aplique contrastes a um dos efeitos em um termo de interação. Por exemplo, podemos desenhar a interação do collcat pelo mealcat como este abaixo. Estes são chamados de interações parciais porque os coeficientes de contraste são aplicados a um dos termos envolvidos na interação. 6.4.1 Analisar interações parciais usando xi3 e regredir Como mostrado acima, desejamos comparar os grupos 1 versus 2 e 3 no collcat. E depois compare os grupos 2 e 3 no collcat. Isso implica codificação Helmert em collcat. como mostrado abaixo. A codificação para mealcat é escolhida como codificação de diferença direta (para fins de análises posteriores), mas poderia ter sido qualquer forma de codificação de efeito. Examine todos os termos criados pelo comando xi3 usando o comando de descrição. A interação parcial de colate comparando grupos 1 contra 2 e 3 por mealcat é composta pelos termos de interação Ico1Xme1 e Ico1Xme2. Porque estes são os termos da interação que comparam os grupos 1 versus 2 e 3 no collcat. Abaixo, usamos o comando de teste para testar essa interação parcial. Achamos que essa interação é significativa. Igualmente para comparar grupos 2 e 3 em collcat por mealcat. Nós testamos os dois termos da interação que envolvem a comparação dos grupos 2 e 3 no collcat. Achamos que essa comparação também é significativa. 6.4.2 Codificação de interações parciais Os termos Ico1Xme1 e Ico1Xme2 são apenas o produto de seus respectivos efeitos principais. A codificação para o mealcat é realmente irrelevante, desde que seja utilizada alguma forma de codificação que venha a 0. Abaixo você pode ver que Ico1Xme1 é apenas Icollcat1 Imealcat1. E você pode ver que Ico1Xme2 é apenas Icollcat1 Imealcat2. 6.5. Interacções entre contrastes Acima, vimos que uma interação parcial permite aplicar coeficientes de contraste a um dos termos em uma interação bidirecional. Um contraste de interação permite aplicar coeficientes de contraste a ambos os termos em uma interação bidirecional. Por exemplo, no que diz respeito ao collcat, dizemos que desejamos comparar os grupos 2 e 3, e no que diz respeito ao mealcat, desejamos comparar os grupos 1 e 2. A tabela desta é a seguinte. Se olharmos para o gráfico dos valores previstos (repetidos abaixo), construímos antes, ele compara as linhas pontilhadas e pontilhadas (colate 2 versus 3) pelo mealcat 1 versus 2, e novamente novamente por mealcat 2 versus 3. 6.5.1 Analisando Contrastes de interação usando xi3 e regressão. Porque gostaríamos de comparar os grupos 1 versus 2 e, em seguida, os grupos 2 versus 3 no mealcat. Isso implica codificação de diferença para forwardcat (que comparará 1 versus 2, depois 2 versus 3). Para o collcat, desejamos comparar os grupos 2 e 3, para que possamos usar a codificação Helmer para essa comparação como fizemos acima (uma vez que isso irá comparar 1 versus 2 e 3, depois 2 versus 3). Se não tivermos certeza do termo que queremos usar, podemos usar o comando de descrição para mostrar os rótulos para os termos de interação. A primeira comparação de interação de interesse é testada por Ico12Xme1. E este termo é significativo. Como esperamos, as linhas vermelha e verde não são paralelas quando comparamos o mealcat 1 e 2. A segunda comparação de interação de interesse é testada pelo Ico2Xme2. E este termo não é significativo. Olhando para o gráfico, podemos ver que as linhas vermelha e verde são principalmente paralelas entre o mealcat 2 e 3. 6.5.2 Codificação dos contrastes de interação O termo Ico2Xme1 é apenas o produto dos respectivos efeitos principais, conforme mostrado abaixo. 6.6 Computação ajustada significa 6.6.1 Computação ajustada significa através de anova Primeiro, mostramos como você pode calcular meios ajustados usando o comando anova. Usamos o mesmo modelo que usamos, incluindo o mealcat. Colabora e a interação dessas duas variáveis. Depois de executar o anova, podemos usar o comando de ajuste para obter os meios ajustados quebrados por collcat e mealcat. Estes valores ajustados calculam o significado que seria esperado se cada escola na amostra estivesse na média para a variável emer. Note-se que é possível calcular meios ajustados com emer em outros valores além da média, por exemplo, se tivéssemos colocado emer50, teria calculado significa ajustar cada escola como se tivesse uma média de 50. 6.6.2 Calculando os meios ajustados através da regressão Agora, ilustramos como obter os mesmos meios ajustados se você fosse para a análise através do comando regressão. Primeiro, realizamos a análise de regressão que é equivalente ao comando anova acima. Para criar os meios ajustados, desejamos assumir que todas as escolas estão em média na variável emer. Fazemos isso atribuindo a média de emer à variável emer. Mas primeiro fazendo uma cópia de emer como temer para que não destruamos o conteúdo dessa variável. Agora, nós criamos você como o valor previsto. Como o valor de emer está configurado para a média de emer. Este será o valor previsto, assumindo que todas as escolas estão na média para emer. Agora, podemos observar a média de Yhat, quebrada por collcat e mealcat. Que você pode ver corresponde aos meios ajustados que encontramos com o comando de ajuste seguindo o comando anova acima. Em seguida, deixamos cair a variável emer e yhat, já que não precisamos mais dessas variáveis, e renomear temer de volta para emer para que a variável emer volte ao modo como era antes desse processo. 6.63 Computação Meios ajustados via post3 O comando postgr pode ser usado para simplificar o processo de calcular os meios ajustados (isto é, os valores previstos quando são mantidas outras variáveis ​​constantes). Vamos assumir que você executou a mesma regressão como mostrado acima. Em seguida, você pode mostrar o gráfico dos meios ajustados e a tabela de meios ajustados usando o postgr3 como mostrado abaixo. Abaixo, mostramos apenas os meios adequados, e você pode ver que eles correspondem aos calculados acima. Devemos sublinhar que é importante usar o comando xi3 (em vez de xi) antes de usar o postgr3 porque, em seguida, o postgr3 sabe quais as variáveis ​​devem ser mantidas constantes (neste exemplo emer) e quais variáveis ​​não devem ser constantes (neste exemplo, Imealcat2 Através do Ico3Xme3). 6.7 Mais detalhes sobre o significado dos coeficientes Até agora, discutimos uma variedade de técnicas que você pode usar para ajudar a interpretar as interações de variáveis ​​categóricas em regressão, mas não foram detalhadamente sobre o significado dos coeficientes nessas análises. Vamos considerar isso ainda mais. Considere a análise abaixo usando o collcat e o mealcat. Usando contrastes simples em ambas as variáveis. Podemos produzir os meios ajustados, conforme mostrado abaixo. Estes serão úteis para interpretar o significado dos coeficientes. Nós deixamos cair a variável yhat, já que não precisamos mais, caso desejemos usar novamente esse nome de variável. Vamos considerar o significado do coeficiente para Icollcat2. A codificação para esta variável compara o grupo 2 com o grupo 1, portanto, esse coeficiente corresponde a média (collcat2) - média (collcat1). Note-se que estes são os meios não ponderados, então calculamos a média para o collcat2 como a média das três células correspondentes ao collcat2. Isto é (825.651636.605508.833) 3. Se compararmos o resultado abaixo com o coeficiente para Icollcat2, vemos que eles são os mesmos. Do mesmo modo, o coeficiente para Icollcat3 é significante (collcat3) - mean (collcat1), calculado abaixo. O valor abaixo corresponde ao coeficiente para Icollcat3. Da mesma forma, o coeficiente para Imealcat2 funciona como significante (mealcat2) - significa (mealcat1), veja abaixo. E o coeficiente para Imealcat3 é médio (mealcat3) - significa (mealcat1), veja abaixo. Para obter o significado dos coeficientes para os termos de interação, precisamos multiplicar a codificação de contraste dos principais efeitos que criaram os termos de interação. Por exemplo, o termo Ico2Xme2 é o produto de Icollcat2 e Imealcat2. Podemos formar uma tabela 3 por 3 mostrando a codificação para Icollcat2 à esquerda e Imealcat2 ao longo do topo, e depois multiplique estes termos juntos e coloque os produtos nas células da tabela, veja abaixo. Podemos então multiplicar esses termos no Células por meio das células e obtemos o valor do coeficiente para Ico2Xme2. Em outras palavras, vemos que esse coeficiente corresponde aos meios das células (1,2) e (2,1) menos células (1,1) e (2,2). Podemos passar pelo mesmo processo para verificar o significado dos coeficientes para os outros três termos de interação. Verificamos se Ico2Xme3 é 6.177. Verificamos também que Ico3Xme2 é 101.051. E verificamos que Ico3Xme3 é 82.577. 6.8 Efeitos simples através de codificação falsa versus codificação de efeito Você pode se perguntar por que fomos ao esforço de usar o xi3 para criar e testar esses efeitos em vez de apenas usar codificações falsas, como se obtivéssemos com o comando xi. Comparamos como obter efeitos simples usando o comando xi3 através da codificação de efeito para como obtermos efeitos simples usando xi com codificação falsa. Esperamos mostrar que é muito mais fácil usar codificação de efeito via xi3 e que a interpretação dos coeficientes é muito mais intuitiva. 6.8.1 Exemplo 1. Efeitos simples de anos em níveis de mealcat Vamos usar um exemplo do Capítulo 3 (seção 3.5). Nesse exemplo, analisamos uma análise usando mealcat e yrrnd e a interação dessas duas variáveis. Primeiro, nós analisamos como fazer uma análise de efeitos simples, analisando os efeitos simples de cada nível de mealcat usando o comando xi3 com efeito de codificação. Para que nossos resultados correspondam aos do Capítulo 3, faremos do grupo 3 da mealcat a categoria de referência. Agora, podemos obter o efeito simples de andrrnd no mealcat 1, inspecionando o coeficiente para Iyr1Wme1. O efeito simples de andrrnd no mealcat 2, inspecionando o coeficiente para Iyr1Wme2 e o efeito simples de yrrnd no mealcat 3, inspecionando o coeficiente para Iyr1Wme3. Agora, execute a mesma análise usando xi com codificação falsa. Novamente, nós faremos explicitamente que o terceiro grupo para a Foodcat seja a categoria omitida. Para formar um teste de efeitos principais simples, precisamos fazer uma tabela como a que se mostra abaixo, que relaciona os meios das células com os coeficientes na regressão. Consulte o Capítulo 3, seção 3.5 para obter informações sobre como esta tabela foi construída. Comece por analisar como obter o efeito simples de Yrrnd quando o Foodcat é 3. Olhando para a tabela acima, podemos ver que gostaríamos de comparar contras contra Byrrnd. Podemos fazer isso com o comando lincom como mostrado abaixo. Nós vemos que os contras caem, produzindo apenas o ano. Em vez disso, podemos usar o comando de teste para testar se o coeficiente para yrrnd é 0. Observe que esse resultado corresponde ao resultado que encontramos com o comando xi3 também testando o efeito simples de yrrnd quando o mealcat é 3. Observe que o coeficiente para o ano Corresponde ao teste do efeito de yrrnd quando todas as outras variáveis ​​são definidas para 0 (a categoria de referência), ou seja, quando o mealcat é definido como a categoria de referência. Você pode ser tentado a interpretar o coeficiente para o ano como a diferença geral entre as escolas de todo o ano e as escolas sem ano, mas neste exemplo vemos que ele realmente corresponde ao efeito simples de Yrrnd. Ao usar codificações falsas, as pessoas geralmente interpretam mal os efeitos da ordem inferior para se referirem a efeitos gerais em vez de efeitos simples. Agora, vamos olhar para o efeito simples de yrrnd quando mealcat 1. Olhando para a tabela acima vemos que isso envolve a comparação dos coeficientes para yrnd 1 versus yrrnd 0 quando mealcat 1, isto é, comparando contras e Imealcat1 ImeaXyrrn1 contra contras Imealcat1. Removendo os termos que abandonam, podemos fazer o comando de teste abaixo. Nós também podemos obter o efeito de yrrnd quando mealcat é 2, como mostrado abaixo. These examples illustrate that it is more complicated to form simple effects when using dummy coding, and also that the interpretation of lower order effects when using dummy coding may not have the meaning that you would expect. 6.8.2 Example 2. Simple effects of mealcat at levels of yrrnd Example 1 looked at simple effects for yrrnd . a variable with only two levels In this example, lets consider the simple effects of mealcat at each level of yrrnd . Because mealcat has more than two levels, we can see what is required for doing tests of simple effects for variables with more than two levels. First, lets show how to get these simple effects using the xi3 command using effect coding. We can get the simple effect of mealcat at yrrnd 0 just as we did earlier in this chapter. And we likewise get the simple effect of mealcat at yrrnd 1 as shown below. We can now test the simple effects of mealcat at each level of yrrnd via dummy coding. The simple effect of mealcat when yrrnd is 0 requires two test statements since it is a 2 degree of freedom test. We can do this by testing mean(mealcat1) mean(mealcat2) and also testing mean(mealcat2) mean(mealcat3). We can look at the table above and see that mean(mealcat1) mean(mealcat2) is Imealcat1 - Imealcat2 (after cons drops out) and mean(mealcat2) mean(mealcat3) is Imealcat2 after cons drops out. So, we can perform this test using the two test commands below. Note that the effects Imealcat1 and Imealcat2 do not correspond to overall effects of the variable mealcat but are the simple effects when yrrnd is set to 0, the reference level. Again we see that the terms that we might be tempted to call main effects and think of as overall effects really are simple effects when dummy coding is used. The second test command uses the accum option to accumulate the tests to get the 2 degree of freedom test that corresponds to the simple effect of mealcat when yrrnd is 0. Likewise, we can look at the table above to form the comparisons needed to obtain the simple effects of mealcat when yrrnd is 1. Using this example we hoped to illustrate that when performing simple effects for a variable with more than two levels can be quite tricky and requires constructing multiple test commands, one test command for every degree of freedom in the simple effect. As you can see, constructing these terms can be very tricky and possibly error prone. Without a method for double checking results, it is very possible to make a mistake when constructing terms and form the wrong comparison. By comparison, using effect coding with xi3 . forming comparisons can be much easier and the interpretation of the lower order effects is much more intuitive. The lower order effects do correspond to the overall effects of the variable, for example the effect of yrrnd . when using effect coding, does correspond to the overall unweighted mean for the year round schools compared to the non-year round schools. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment