If you're seeing this message, it means we're having trouble loading external resources on our website.

Se estiveres protegido por um filtro da Web, certifica-te de que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Posição do vídeo:0:00Duração total:10:05

Transcrição do vídeo

. Onde nos paramos no último vídeo, eu tipo lhe fiz uma pergunta. "Encontre um intervalo no qual nós estejamos razoavelmente confiantes... nós falaremos um pouco mais sobre porquê eu tenho que lhe falar de uma maneira um pouco vaga aqui... razoavelmene confiante de que existe a chance de 95% de que a verdadeira média populacional, que é p, que é a mesma coisa que a média da distribuição amostral da média amostral. Então existe a chance de 95% de que a verdadeira média... e deixe-me colocar isso aqui. Isso também é a mesma coisa que a média da distribuição amostral da média amostral neste intervalo. E para fazer isso deixe-me lançar algumas idéias. Qual é a probabilidade de que se eu pegar a amostra e eu irei tirar a média para esta amostra, então a probabilidade de que uma média amostral aleatória esteja dentro do intervalo de dois desvios padrões da média amostral, da nossa média amostral? Então qual é esta probabilidade bem aqui? Agora vamos olhar para nossa distribuição. Então esta é a nossa distribuição, isso bem aqui é nossa média amostral. Talvel eu deva fazer isso em azul, porquê é a cor bem aqui. Esta é a nossa média amostral. E então qual é a probabilidade de que uma média amostral aleatória esteja contida dentro de duas vezes o desvio padrão? Bem, uma amostra aleatória é uma amostra desta distribuição. Ela é uma amostra da distribuição amostral da média amostral. Então literalmente, qual é a probabilidade de encontrar uma amostra dentro de dois desvios padrões da média? Isso é um desvio padrão... e isso bem aqui é outro desvio padrão. Em geral, se você ainda não memorizou isso não é uma coisa ruim de memorizar, de que se você tem uma distribuição normal, a probabilidade de pegar a amostra dentro de dois desvios padrões é 95%... e se você quiser ser ainda mais acurado, isso são 95,4%. Mas você poderia dizer isso é grosseiramente... ou talvez eu possa escrevê-lo desse jeito... isso é grosseiramente 95%. E realmente é isso que isso importa, porquê nós temos essa palavra um pouco bizarra aqui chamada razoavelmente confiante, e de qualquer maneira nós temos que estimar o desvio padrão. De fato, nós poderíamos dizer... se nós quisermos... que isso irá ser igual a exatamente 95,4%. Mas em geral, dois desvios padrão... 95%... isso é o quê as pessoas entendem por equivalente. Agora esta assertiva é exatamente a mesma coisa que a probabilidade de que a média amostral, de que a média amostral... não a média amostral, a probabilidade de que a média da distribuição amostral esteja dentro de dois desvios padrão da distribuição amostral de x, que também irá ser o mesmo valor, isso irá ser igual a 95,4%. Estas assertivas são exatamente iguais. Se x estiver contido em dois desvios padrão disso, então isso, então a média, está dentro de dois desvios padrão de x. Estas são duas maneiras de se falar a mesma coisa. Agora nós sabemos que a média da distribuição amostral é a a mesma coisa que a média da distribuição populacional, que é a mesma coisa que o parâmetro p... a proporção de pessoas ou a proporção da população que é um 1. Então essa coisa aqui é a mesma coisa que a média populacional. Então essa assertiva bem aqui, nós podemos trocá-la com p. Então a probabilidade de que p esteja dentro de dois desvios padrão da distribuição amostral de x é de 95,4%. Agora nós não sabemos qual é este número bem aqui. Mas nós o estimamos. Lembre-se, nossa melhor estimativa disso é o desvio padrão verdadeiro, ou é o verdadeiro desvio padrão da população dividido por 10. Nós podemos estimar o verdadeiro desvio padrão da população com nosso desvio padrão amostral, que foi 0,5... 0,5 dividido por 10. Nossa melhor estimativa do desvio padrão da distribuição amostral da média amostral é 0,05. Então agora nós podemos dizer... e eu irei trocar de cor... que a probabilidae de que o parâmetro p, a proporção da população dizendo 1 está dentro do intervalo de duas vezes... lembre-se, nossa melhor estimativa disso bem aqui é 0,05 da nossa média amostral que nós sabemos ser igual a 95,4%. E então nós poderíamos dizer que a probabilidade de que p esteja dentro de 2 vezes 0,05 irá ser igual a... 2,0 irá ser 0,10 da nossa média que é igual a 95... e agora deixe-me ser um pouco cauteloso aqui. E não posso dizer "igual" agora, porquê bem aqui se nós sabíamos isso, se nós sabíamos este parâmetro da distribuição amostral da média amostral, nós poderíamos dizer que isso são 95,4%. Nós não sabemos isso! Nós estamos apenas tentando encontrar a melhor estimativa para isso. Então o que eu irei fazer agora é apenas dizer "isso é grosseiramente... e apenas para mostrar que nós temos mesmo este nível de acuidade, eu irei dizer "grosseiramente 95%". Nós estamos razoavelmente confiantes de que é aproximadamente 95% porquê nós estamos usando esta estimativa para abstrair da nossa amostra, e se a amostra estiver de fato distorcida, isso irá resultar um número realmente estranho. Então esta é a razão pela qual nós tivemos que ser um pouco mais exatos no que nós estivemos fazendo. Mas esta é a ferramenta para ao menos dizer o quão bom é nosso resultado. Então isso será por volta de 95%. Ou nós poderíamos dizer que a probabilidade de que p esteja dentro de 0,10 da nossa média amostral, é o que de fato nos conseguimos. Então qual foi a média amostral que nós obtivemos? Ela foi 0,43. Então nós estamos entre 0,1 de 0,43, o que significa que nós estamos entre 0,43 mais ou menos 0,1 de é também, grosseiramente, nós estamos razoavelmente confiantes disso em torno de 95%. E eu gostaria de ser bem claro. Tudo que eu comecei por todo esse caminho disso aqui em marrom ao amarelo e todo esse magenta, eu apenas estou reafirmando a mesma coisa de dentro disso. Isso se torna um pouco mais relaxado uma vez que eu vim do desvio padrão exato da distribuição amostral para uma estimativa para ele. E isso é porque isso apenas se tornou... eu tipo coloquei este sinal de igual apertadinho aqui para dizer que nós estamos razoavelmente confiantes... e eu tive mesmo que dispor de um pouco da precisão. Mas nós apenas encontramos nosso intervalo. Um intervalo que nós podemos estar razoavelmente confiantes de que existe a probabilidade de 95% de que p esteja dentro dele, e isso ira´ser 0,43 mais ou menos 0,1. Ou um intervado de... nós temos um intervalo de confiança. Nós temos o intervalo de 95% de confiança e nós poderíamos dizer 0,43 menos 0,1 é 0,33. Se nós escrevermos isso como um percentual, nós poderíamos dizer 33% para... e se nós somarmos o 0,1... 0,43 mais 0,1... nós temos 54%... a 53%. E então nós estamos 95% confiantes. Então nós não estamos dizendo de maneira precisa de que a probabilidade desta proporção seja 95%, mas que nós estamos 95% confiantes de que a verdadeira proporção esteja entre 33% e 55%. Este p está nesta faixa bem aqui. Ou de outra maneira, e você irá ver isso em muitas pesquisas que são feitas, as pessoas dizem que fizeram uma pesquisa e que nós tivemos que 43% irão voltar no número 1, e número 1 neste caso é o candidato B. . E então do outro lado, uma vez que todo mundo restanta votou para o candidato A, 57% irão votar para A. E então eles irão colocar a margem de erro. E você irá ver isso em qualquer pesquisa que você assistir pela TV. Eles irão colocar uma margem de erro. E a marge de erro é outra maneira de descrever este intervalo de confiança. E eles irão dizer que a margem de erro neste caso é de 10% o que significa de que há um intervalo de confiança de 95%, se você for para mais ou menos 10% deste valor bem aqui. E eu realmente gostaria de enfatizar, você não pode ficar certo de que existe a chance de 95% de que o resultado verdadeiro esteja dentro dos 10% disso, porquê nos tivemos que estimar o desvio padrão da média amostral. Mas esta é a melhor medida que nos podemos fazer com a informação que você possui. Se você for pesquisar 100 pessoas, Esta é a melhor confiança que você poderá ter. E este número de fato é bastante elevado. Então se você tiver que olhar para isso você irá dizer, que grosseiramente há uma chance de 95% de que o valor verdadeiro deste número está entre 33% e 53%. Então existe de fato a chance de que o candidato B possa vencer, mesmo se sabendo que apenas 43% dos nossos 100 entrevistados iriam votar nele. Se você quiser tornar isso mais preciso você terá que usar uma amostra maior Você pode imaginar. Ao invés de pegar 100 amostras, ao invés de n ser 100, se você fizer n igual a 1.000 e então você poderia pegar este número bem aqui, você poderia pegar este número aqui e dividí-lo pela raiz quadrada de 1.000 ao invés da raiz quadrada de 100. E então nós estamos dividindo por 33 ou o que seja. E então o tamanho do desvio padrão para nossa distribuição amostral irá diminuir. E então a distância de dois desvios padrões irá ser um número menor, e então você terá uma margem de erro menor. E talvez você queira pegar uma margem de erro pequena o suficiente de maneira que você possa de fato saber quem irá vencer a eleição. .