Thursday, 19 October 2017

Egen Group In Stata Forex


Eu tenho um conjunto de dados onde cada linha é um par firme, ano com um firmid que é uma string. Ele não exclui nada, uma vez que não há duplicatas (eu originalmente criou o conjunto de dados depois de executar duplos dropid ano firmid, força). Por enquanto, tudo bem. Eu quero criar um painel que requer um firmid que é numérico. Então eu corro Mas os valores de tempo repetidos no erro do painel aparece. Além disso, lista um monte de duplicatas. Parece que egen, group () não está gerando grupos únicos. Minha pergunta é: por que, e como faço para criar grupos únicos de forma robusta? Estou usando o Stata, e estou tentando calcular o preço médio das empresas rivais em um mercado. Eu tenho dados que se parece com: E eu estou tentando calcular o preço médio de cada empresa rivais, então eu quero gerar um novo campo que é a média dos valores das outras empresas em um mercado. Parecia: Para fazer a média por grupo, eu poderia usar o comando egen: Mas isso não excluiria o preço próprio das empresas na média e, do meu conhecimento, usando o qualificador if só mudaria as observações que ele operava Sobre os grupos em que foi calculada a média. Existe uma maneira simples de fazer isso, ou eu preciso criar loops e gerar cada média manualmente perguntou Mar 6 12 às 4:16 Este é um fio velho ainda de interesse, assim que os materiais e as técnicas negligenciadas primeira vez rodada ainda se aplicam. A técnica mais geral é trabalhar com totais. No seu mais simples, total de outros total de todos - este valor. Em uma estrutura egen que vai parecer a função total () de egen ignora os valores em falta em seu argumento. Se houver valores em falta, não queremos incluí-los na contagem, mas podemos usar missing () que rende 1 se não estiver faltando e 0 se estiver faltando. Egen s count () é outra maneira de fazer isso. Código dado anteriormente dá a resposta errada se faltas estão presentes como eles estão incluídos na contagem N. Mesmo se um valor está faltando, a média dos outros valores ainda faz sentido. Se nenhum valor está faltando, a última linha acima simplifica para Até agora, isso possivelmente parece não mais do que uma pequena variante no código anterior, mas se estende facilmente ao uso de pesos. Presumivelmente, queremos uma média ponderada de outros preços dado algum peso. Podemos explorar o fato de que total () funciona em expressões, o que pode ser mais complicado do que apenas nomes de variáveis. Na verdade, o código acima fez isso já, mas muitas vezes é esquecido. Como antes, se preço ou peso está sempre ausente, você precisa de código mais complicado, ou apenas para garantir que você exclua essas observações dos cálculos. Consulte também o Stata FAQ Como faço para criar variáveis ​​resumindo para cada propriedades individuais dos outros membros de um grupo para uma discussão mais abrangente. (Se os números ficam grandes, trabalhe com duplo s.) Stata: Análise de Dados e Software Estatístico Caso 1. Eu quero criar o ID da variável contendo 1, 2, 3. n é a maneira Stata de se referir ao número de observação. Em um conjunto de dados de 10 observações, n assume os valores 1, 2. 10. Caso 2. Eu já tenho uma variável de id, e eu tenho várias observações por id, mas eu quero uma nova variável de identificação contendo 1 para o primeiro id, 2 para o segundo, e assim por diante. Tais perguntas surgem frequentemente com dados de painel e em outras circunstâncias. Talvez a variável identificador seja uma string mdash id números 1A038, 2B217. Mdash e você precisa de identificadores numéricos mdash 1, 2. mdash porque alguns comandos Stata exigem deles. Talvez o id original seja mdash numérico do formulário 102938, 149384, 150394. mdash mas você quer desenhar um gráfico usando o identificador como um dos eixos e deseja que os pontos de dados sejam igualmente espaçados. Resposta 1. Para criar uma nova variável newid a partir da variável existente oldid. Se oldid é string ou numeric, type A nova variável newid conterá 1 para o primeiro valor de oldid. 2 para o segundo valor, e assim por diante. Resposta 2. Para criar uma nova variável newid da variável existente oldid. Se oldid é seqüência ou numérico, tipo Ambas as respostas produzem os mesmos resultados: as quatro linhas de resposta 2 são o que egen faz. No entanto, vale a pena entender a resposta 2. Começamos com o identificador do identificador existente, que pode ser uma variável numérica ou uma variável de cadeia. Este comando coloca as observações na ordem de oldid. Este comando cria uma nova variável newid que é 1 para a primeira observação para cada indivíduo e faltando em contrário. N é o modo Stata de se referir ao número de observação em um conjunto de dados de 10 observações, n toma os valores 1, 2. 10. Quando n é combinado com por. No entanto, n é o número de observação dentro de grupo, neste caso, dentro oldid. Se houvesse três observações oldid 1 seguidas por duas observações oldid 2 no conjunto de dados, n assumiria os valores 1, 2, 3, 1, 2. Assim, por. - benzóico. Se n1 é uma maneira de se referir à primeira observação em cada grupo. Veja as seções de U indexadas por varlist: prefix. Por oldid: gen newid1 se n1 define newid para 1 na primeira observação de cada oldid. Este comando substitui newid por sua soma cumulativa ou corrente. Este comando coloca valor em falta em newid. Onde oldid continha valor em falta. Esta etapa é provavelmente desnecessária porque se oldid realmente é uma variável ID, ele nunca deve conter faltando de qualquer maneira. Vamos ver como isso funciona para um conjunto de dados simples. Os valores em falta (.) Não fazem diferença para uma soma cumulativa. Nesse contexto, eles são tratados como numericamente iguais a 0.

No comments:

Post a Comment