If you're seeing this message, it means we're having trouble loading external resources on our website.

Se estiveres protegido por um filtro da Web, certifica-te de que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Posição do vídeo:0:00Duração total:15:15

Transcrição do vídeo

. Nós vimos em muitos vídeos que nós começamos com uma distribuição doida qualquer. Ela não precisa ser doida, ela pode ser uma boa distribuição normal. Mas para realmente chegar ao ponto de que você não precisa ter uma distribuição normal, eu preferi usar estas doidas. Então digamos que você tem algum tipo de distribuição doida que se parece com isso. Isso pode ter qualquer aparência. Então nós vimos por muitas vezes que você pegou amostras destas distribuição doida. Então digamos que você irá pegar amostras para n igual a 10. Então nós pegamos 10 instâncias da nossa variável aleatória, tiramos a média e então fazemos um gráfico desta média. Nós fazemos um gráfico da nossa média. Nós pegamos 1 instância aqui. Nós continuamos fazendo isso. E nós fazemos isso de novo. Nós pegamos 10 amostras desta variável aleatória, tiramos a média delas, e colocamos no gráfico novamente. Você a coloca no gráfico novamente... e eventualmente você faz isso por um gazilhão de vezes... em teoria um número infinito de vezes... e você irá aproximar a distribuição amostral da média amostral. n igual a 10 não irá ser uma distribuição normal perfeita, mas ela irá se aproximar. Ela será perfeita apenas se n for infinito. Mas digamos que nós eventualmente... todas as nossas amostras que pegamos de monte... das médias que vão formando pilhas, e essas pilhas bem aqui... e enventualmente irá se aproximar a alguma coisa que se parece com isso. E nós vimos no vídeo anterior que uma... se dizemos... nós iremos fazer isso novamente e desta vez digamos que este n é igual a 20... um, a distribuição que nós temos irá ser mais perto da normal. E talvez em vídeos futuros nós nos aprofundemos ainda mais em coisas como Curtose e Assimetria. Mas aqui isso irá ser mais normal. Mas ainda mais importante aqui ou eu penso que mais obviamente para nós, nós dissemos que neste experimento nós iremos ter um desvio padrão menor. Então todos eles terão a média amostral. Digamos que a média aqui é, eu não sei... digamos que a média aqui é 5. Então a média aqui irá ser 5. A média da nossa distribuição amostral da média amostral irá ser 5. E não faz diferenção qual será nosso n. Se nosso n for 20, isso irá continuar a ser 5. Mas nosso desvio padrão irá ser menor que qualquer um desses cenários. E nós vimos isso apenas por experimentação. Isso deveria parecer assim. Isso irá ser mais normal, mas isso irá ter um desvio padrão mais justo. Então talvez isso irá se parecer com isso. E se nós fizermos isso com uma amostra ainda maior... vamos fazer isso em uma cor diferente... se nos fizermos isso com um tamanho amostral ainda maior, n é igual a100, e o que nós iremos ter é algo que se encaixa ainda melhor na distribuição normal. Nós pegamos uma centena de instâncias desta variável aleatória, tiramos a média delas e jogamos no gráfico. Uma centena de instâncias desta variável aleatória, tirar a média delas e jogá-las no gráfico. E nós continuamos fazendo isso. Se nós continuarmos com isso, o que nós iremos ter é algo que é ainda mais normal do que qualquer um desses. Então nós continuamos a aproximar ainda mais a uma verdadeira distribuição normal. Mas ainda mais óbvio aos humanos, isso irá ficar ainda mais justo. Entã isso irá ter um desvio padrão muito pequeno. Isso irá ficar parecido com isso. E eu irei mostrar a você no aplicativo de simulação no próximo ou num vídeo ainda posterior. Então duas coisas acontecem. Se você aumenta seu espaço amostral para cada momento que você tirar a média, duas coisas acontecem. Você irá ficar mais normal e o seu desvio padrão irá diminuir. Então que pode aparecer: e existe uma fórmula? Então se eu souber o desvio padrão... então este é o meu desvio padrão de apenas minha função original de densidade de probabilidades, isso é a média da minha função de densidade de probabilidade. Então se eu sei que o desvio padrão e eu sei o n... n irá mudar dependendo de quantas amostras eu irei pegar a cada vez que eu fizer a média amostral... se eu souber qual é o meu desvio padrão padrão, ou talvez eu saiba minha variância, certo? A variância é apenas o desvio padrão ao quadrado. Se você não se lembrar disso você talver irá querer rever os vídeos. Mas eu souber a variância da minha distribuição original e se eu souber qual o valor de n... quantas amostras eu irei pegar toda vez antes de eu tirar a média deles de maneira a colocar no gráfico uma coisa da minha distribuição amostral da minha média amostral... e existe uma maneira de predizer qual será a média destas distribuições? E então... Desculpe-me, o desvio padrão destas distribuições. E para que você não se confunda entre isso e isso, deixe-me dizer "a variância". Se você souber a variância, você poderá calcular o desvio padrão. Um é apenas a raiz quadrada do outro. Então esta é a variância da nossa distribuição original. Agora para mostrar que isso é a variância da nossa distribuição amostral da nossa média amostral, nós iremos escrevê-la bem aqui. Esta é a variância da nossa média da nossa média amostral. Lembre-se da amostra... nossa verdadeira média é isso aqui. A letra grega Mu é nossa verdadeira média. Isso é igual à média, enquanto um x com uma linha sobre ele significa a média amostral. . Então aqui... o que nós estamos dizendo é que isso é a variância da nossa média amostral, que isso irá ser a verdadeira distribuição. Isso não é uma estimativa. E existe alguma... você sabe, se nós por alguma magia soubéssemos a distribuição... existiria alguma variância verdadeira aqui. E por causa da média... então isso tem uma média... isso bem aqui, nós podemos apenas pegar nossa notação certa... isso é a média da nossa distribuição amostral da média amostral. Então isso é a média das nossas médias. E acontece apenas disso ser a mesma coisa. Isso é a média das nossas médias amostrais. Isso irá ser a mesma coisa que isso, especialmente se nós fizermos as tentativas mais e mais vezes. Mas de qualquer maneira, o fundamental deste vídeo: existe alguma maneira de calcular esta variância, dada a variância da distribuição original e o nosso n? E nós descobrimos que sim. Eu não irei fazer a demonstração aqui. Eu realmente quero lhe deixar a intuição disso. Eu penso que você já tem o senso de que cada tentativa que você faz... se você faz uma centena, irá ser mais provável que quando você tire a média deles, você se aproxime da verdadeira média do que se você usar um n = 2 ou um n = 5. Apenas será menos provável de que você fique longe, certo, se você pegou 100 tentativas ao invés de pegar 5. Então eu penso que você sabe de alguma maneira que isso será inversamente proporcional a n. Quanto maior for seu n, menor será o desvio padrão. E agora isso é colocado da maneira mais simples possível. Isso é uma das coisas mágicas em matemática. E um dia eu irei fazer a prova disso para você. Eu quero lhe dar primeiro o conhecimento operativo. Em estatística, eu estou sempre me remoendo quando eu deveria ser formal, lhe dando provas rigorosas, mas eu acabei chegando à conclusão de que é mais importante lhe dar primeiro o conhecimento operacional em estatística e então, depois, uma vez que você já tiver fazendo isso, nós podemos ir realmente à matemática profunda disso e provar isso para você. Mas eu penso que provas experimentais são tipo, tudo o que você precisa por enquanto, usando estas simulações para mostrar que isso é realmente verdade. Então isso nos diz que a variância da nossa distribuição amostral da nossa média amostral é igual à variância da nossa distribuição original... este cara bem aqui... dividido por n. Isso é tudo o que isso é. Então se isso bem aqui tem uma variância de... digamos que isso aqui tem uma variância de 20... eu estou apenas marcando este número... e então digamos que nosso n = 20. Então a variância da nossa distribuição amostral da nossa média amostral para um n = 20... bem, nós iremos apenas pegar isso... a variância bem aqui... nossa variância são 20... dividida por nosso n... 20. Então nossa variância irá ser 20 dividido por 20 que é igual a 1. Isso é a variância da nossa distribuição de probabilidades original e isso é o nosso n. Qual irá ser o valor do nosso desvio padrão? Isso irá ser a raiz quadrada disso, correto? O desvio padrão irá ser ser a raiz quadrada de 1. Bem, isso irá ser 1. Então nós também podemos escrever isso. Nós podemos fazer a raiz quadrada em ambos os lados disso e dizer que o desvio padrão da distribuição amostral... padrão... o desvio padrão da distribuição amostral da média amostral sempre será chamado de desvio padrão da média. E isso também é chamado... eu irei escrever isso aqui... o desvio padrão da média. . Todas essas coisas que eu apenas mensionei, elas todas apenas significam o desvio padrão da distribuição amostral da média amostral. Isso é a razão disso ser confuso, porquê você usa a palavra "média" e "amostra" várias vezes... E se isso o confunde, deixe-me que eu saiba. Eu farei um outro vídeo ou pause e repita este até que compreenda. Mas se nõs apenas fizermos a raiz quadrada em ambos os lados, o erro padrão da média, ou o desvio padrão da distribuição amostral da média amostral é igual ao desvio padrão da nossa função original... da nossa funcão de densidade de probabilidades original... que poderia ser bem anormal, dividida pela raiz quadrada de n. Eu apenas fiz a raiz quadrada em ambos os lados desta equação. Pessoalmente, ou gostaria de lembrá-lo disso: que a variância é apenas inversamente proporcional a n. E então eu gostaria de voltar para isso. Porque isso é uma coisa muito simples para a minha cabeça. Você apenas pega a variância e a divide por n. Oh! E se eu quiser o desvio padrão, eu apenas faço a raiz quadrada de ambos os lados e eu tenho esta fórmula. Então aqui está o desvio padrão... quando n é 20... o desvio padrão da distribuição amostral da média amostral irá ser 1. Aqui, quando n = 100, nossa variância aqui quando n = 100. Então nossa variância da média amostral da distribuição amostral da nossa variância da média... ou a média amostral, nós poderíamos chamar assim... irá ser igual a 20... a variância desse cara... dividida por n. Então isso é igual... n = 100... então isso é igual a 1/5. Agora o desvio padrão deste cara, ou o desvio padrão da distribuição amostral da média amostral... ou o desvio padrão da média irá ser a raiz quadrada disso. Então 1 sobre a raiz quadrada de 5. E então este cara irá esta um pouco abaixo de 1/2 do desvio padrão, enquanto este cara tem um desvio padrão de 1. Então você vê, isso é definitivamente mais estreito. Agora eu sei o que você está dizendo. "Bem, Sal... você apenas deu uma fórmula e não "necessariamente eu acredito em você". Bom, vamos ver se nós podemos provar para nós mesmos usando a simulação. Então apenas para diversão, deixe-me fazer uma... eu irei apenas bagunçar um pouco esta distribuição. Então esta é minha nova distribuição. E deixe-me pegar um n de... Deixe-me pegar duas coisas que são fáceis de fazer a raiz quadrada, porquê nós estamos buscando os desvios padrão. Então nós pegamos um n = 16 e um n = 25. Vamos fazer 10.000 tentativas. Então neste caso, em cada uma das nossas tentativas, nós iremos pegar 16 amostras daqui, tirar a média delas, marcar no gráfico aqui e então fazer um gráfico de frequências. E aqui nós iremos fazer 25 de cada vez e então tirar a média delas. Eu irei fazer uma vez animado, apenas para relembrar. Então eu estou pegando 16 amostras, marcando elas aqui. Eu pego 16 amostras como descrito nesta função de densidade de probabilidades... ou 25 agora, marcando elas bem aqui embaixo. Agora se eu fizer isso 10.000 vezes, o que eu terei? Muito bem, então aqui, apenas visualmente, você pode dizer que quando n for maior, o desvio padrão aqui será menor. Isso é mais juntinho. E agora, deixe-me escrever toda essa coisa. Vamos ver se eu posso lembrar isso aqui. Então nesta distribuição aleatória que eu fiz, meu desvio padrão foi 9,3. E eu irei lembrar isso. Nosso desvio padrão para a coisa original foi 9,3. E então o desvio padrão aqui foi 2,3 e o desvio padrão aqui foi 1,87. Vamos ver se isso está em conformidade com a nossa fórmula. Então eu irre por isso para fora da tela por um instante e eu irei retornar e fazer alguma matemática. Então eu tenho isso na minha outra tela, e então eu posso rememorar estes números. E então na tentativa que nós acabamos de fazer, minha distribuição excêntrica teve um desvio padrão de 9,3. Quando n é igual a... deixe-me fazer isso em outra cor... quando n era igual a 16, apenas fazendo o experimento... fazendo uma porção de tentativas e tirando a média e fazendo todas essas coisas, nós obtivemos o desvio padrão da distribuição amostral da média amostral ou o erro padrão da média, e nós experimentalmente determinamos como 2,33. E então quando n = 25, nós tivemos o erro padrão da média como sendo igual a 1,87. Vamos ver se isso está em conformidade com as nossas fórmulas. Então nós sabemos que a variância, ou nós sempre podemos dizer a variância da média ou o erro padrão... a variância da distribuição amostral da média amostral é igual à variância da nossa distribuição original dividida por n... fazer a raiz quadrada em ambos os lados, e então obter o erro padrão da média como sendo igual ao desvio padrão da nossa distribuição original, dividida pela raiz quadrada de n. Então vejamos se isso funciona para essas duas coisas. Então se eu tiver que pegar 9,3... vamos fazer para este caso. Então 9,3 dividido pela raiz quadrad de 16, correto? N = 16. Então dividido pela raiz quadrada de 16, o que são 4, e o que eu obtenho? Então 9,3 dividido por 4. Deixe-me pegar uma pequena calculadora aqui. Vejamos. Nós temos... deixe-me limpar isso... nós queremos dividir 9,3 dividido por 4. 9,3 três dividido por nossa raiz quadrada de n... n foi 16. Então dividido por 4 é igual a 2,32. Então isso é igual a 2,32 o que pode ser emendado para 2,33. Isso foi depois de 10.000 tentativas. Talvez bem logo depois disso eu vá verificar o que acontece se nós fizermos 20.000. Ou 30.000 tentativas quando nós pegamos amostras de 16 e tiramos a média delas. Agora vamos olhar para isso. Aqui nós podemos pegar 9,3... então deixe-me desenhar uma pequena linha aqui... Deixe-me rolar isso, isso ficará melhor. Então nós pegamos nosso desvio padrão da nossa distribuição original. Então... apenas esta fórmula que nós resolvemos bem aqui nos dirá... que nosso desvio padrão deve ser igual ao desvio padrão da nossa distribuição original... 9,3 dividido pela raiz quadrada de n, dividida pela raiz quadrada de 25, correto? 4 foi apenas a raiz quadrada de 16. Então isso é igual a 9,3 dividido por 5. E digamos, isso é 1,87. Então deixe-me pegar de volta minha calculadora. Então eu pego 9,3 dividido por 5 e o que eu tenho? 1,86, o que é muito próximo de 1,87. Nós tivemos neste caso, 1,86. Então como você pode ver, o que nós obtivemos experimentalmente foi quase exatamente... e isso ocorreu depois de 15.000 tentativas... o que nós esperávamos. Vamos fazer outros 10.000. Então nós faremos outras 10.000 tentativas. Bem, nós ainda estamos batendo bola. Nós não iremos... talvez eu não possa ter esperança de obter o número exato de qualquer maneira. Mas como você pode ver, na esperança de que isso possa satisfazer... de que a variância da distribuição amostral da média amostral irá ser igual à variância da nossa distribuição original, não importa o quão excêntrica esta distribuição seja... dividida pelo tamanho da minha amostra... pelo número de amostras que você pega para cada cesto na qual você tira a média... eu espero que esta seja a melhor maneira de pensar sobre isso. Você sabe, algumas vezes isso pode se tornar confuso porquê você está pegando amostras de médias baseadas em amostras. Então quando alguém lhe diz sobre o tamanho amostral, você sabe... este tamanho amostral do número de vezes que eu peguei médias, ou o número de coisas que eu estou tirando médias há cada vez? E você sabe, não dói em você para eu deixar isso claro. Normalmente, quando eles falam sobre o tamanho amostral eles estão falando sobre n. E, ao menos na minha cabeça, quando eu penso nas tentativas que você pega de tamanho amostral de 16, você tira a média delas... esta é uma tentativa e então você a joga no gráfico. Quando você faz isso novamente, você está fazendo uma nova tentativa. E você vai e vai indo... Mas de qualquer maneira, isso faz tudo mais claro e então você agor entende também como obter o erro padrão da média. .