If you're seeing this message, it means we're having trouble loading external resources on our website.

Se estiveres protegido por um filtro da Web, certifica-te de que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Posição do vídeo:0:00Duração total:13:20

Transcrição do vídeo

. Na esperança de que agora nós tenhamos um conhecimento operacional respeitável da distribuição amostral da média amostral. E o que eu gostaria de fazer neste vídeo é explorar um pouco mais em como esta distribuição muda à medida que nós mudamos nosso tamanho amostral n. Eu irei escrever n bem aqui embaixo. Nosso tamanho amostral n. Então um pouco como revisão, nós vimos anteriormente que nós podemos mesmo começar com alguma distribuição maluca, talvez se pareça algo assim... Eu irei fazer uma distribuição discreta. Realmente para modelar algo em algum ponto você tem que tornar isso discreto. Isso poderia ser uma distribuição discreta bem granular. Mas digamos que é algo maluco que se pareça com isso. Isso claramente não é uma distribuição normal. Mas nós vimos no primeiro vídeo que se você pegar, digamos... amostras de tamanho 4. Então se você pegou 4 números desta distribuição, 4 números aleatórios onde digamos, isso tem a probabilidade de 1, 2, 3, 4, 5, 6, 7, 8, 9. Se você pegou 4 números por vez e tirou a média deles... deixe-me fazer isso aqui... se você tomou 4 números por vez... digamos que nós usamos esta distribuição para gerar 4 números aleatórios, correto? Nós estamos muito propensos a pegar um 9. Nós definitivamente não iremos ter sem 7s e nem 8s... Nós definitivamente não teremos nenhum 4. Nós poderemos ter 1s e 2s... 3 é bastante propenso... 5 é bem propenso também... Então nós iremos usar esta função para tipo gerar números aleatórios para nós. E nós pegamos amostras de 4 e então nós tiramos a média delas. Então digamos que nossa primeira média é... eu não sei... digamos que foi um 9, um 5, outro 9 e então um 1. Então o que é isso? Isso são 14 mais 10. 24 dividido por 4. A média desta primeira tentativa, para esta primeira amostra de 4, irá ser 6, correto? Eles somam 24, dividido por 4. Então você poderia marcar isso bem aqui. Nossa média desta vez foi 6. Apenas assim. E nós iremos continuar com isso... E nós vimos no passado que se você continuar com isso, isso irá começar a parecer com algo como uma distribuição normal. Então talvez nós façamos isso novamente, e a média dê novamente 6. Talvez nós façamos de novo e a média seja 5. Nós fazemos de novo e a média foi 7. Nós fazemos de novo e a média deu 6. E então se você fizer isso por toneladas... uma tonelada de vezes, nossa distribuição deve-se parecer algo que se parece bastante com uma distribuição normal. Então estas caixas são realmente pequenas. Então nós fazemos apenas um bocado destas tentativas, em algum ponto isso irá se parecer bastante com uma distribuição normal. Obviamente estes são valores médios. Isso não será uma distribuição perfeitamente normal porquê você nunca pode pegar algo menor que zero, ou algo menor que 1, como média. Você não poderá ter um zero como média. E você não irá ter nada maior que 9. Então isso não irá ter caudas infinitamente longas, mas ao menos para a parte central da nossa distribuição normal deverá ser uma boa aproximação. Neste vídeo o que eu gostaria de pensar é o que acontece se nós mudarmos o n. Então neste caso n foi 4. n é o nosso tamanho amostral. Toda vez que nós fazemos uma tentativa nós pegamos 4 e nós fazemos a média deles e então nós marcamos aqui. Nós poderíamos ter n igual a 10. Nós poderíamos haver tomado 10 amostras disso... desta população... você poderia dizer... ou desta variável aleatória... tirar a média deles... e então marcá-los bem aqui. E no último vídeo nós rodamos a simulação. Eu irei retornar a esta simulação num segundo. Nós vimos um bocado de coisas. E eu irei lhe mostrar isso agora com um pouco mais de profundidade. Quando n é muito pequeno, isso não aproxima muito bem à distribuição normal. Então quando n é pequeno... eu digo, pegue o caso extremo... O que acontece quando n é igual a 1? Isso literalmente apenas significa que eu peguei uma instância desta variável e tirei a média dela. Bem, isso apenas continuará a ser aquela coisa. Então se eu apenas pegar um punhado de tentativas da coisa e marcar sobre o tempo, com o que isso irá se parecer? Bem isso definitivamente não irá se parece com uma distribuição normal. Isso irá se parecer... você irá ter um bocado de 1s e você irá ter um punhado de 2s... Você irá ter mais 3s como aqui... Você nãão irá ter nenhum 4. Você irá ter um punhado de 5s... Você irá ter alguns 6 e isso irá se parecer com isso... E você irá ter um punhado de 9s... Então aí está sua distribuição amostral da média amostral para um n de 1, isso irá se parecer... não me importa quantas tentativas você irá fazer, isso não irá se parece com uma distribuição normal. Então o Teorema do Limite Central, embora eu tenha lhe falado que se você fizer um bocado de tentativas, que ele irá se parecer com uma distribuição normal, isso definitivamente não ocorre para n = 1. À medida que n fica maior, isso começa a fazer sentido. E então vamos se nós tivermos n = 2... e eu estou fazendo apenas de cabeça, eu não sei realmente como esta distribuição iria ficar... mas então, ainda assim ainda seria difícil que isso ficasse exatamente igual a uma distribuição normal. Mas quando você pega uma cobertura maior... tipo, você poderia pegar mais... você sabe, você poderia pegar coisas de tudo isso aqui em cima. Mas você pode pegar apenas duas em cada uma das cestas que você irá fazer a média. Nós iremos pegar 2 números, certo? Então? Você nunca irá por exemplo... você nunca irá ter um 7,5 na sua distribuição amostral da média amostral para n = 2 porquê é impossível tirar um 7 e é impossível tirar um 8! Então você jamais irá ter um 7,5 como... então talvez quando você marcasse isso, talvez ele ficasse assim. Mas irá haver uma falha em 7,5 porque isso é impossível! E talvez isso ficasse parecido com isso... Então isso ainda não forma uma distribuição normal quando n é igual a 2. Então existe uma porção de coisas interessantes aqui. E uma coisa... e eu não mencionei isso da primeira vez porquê eu realmente queria que você tivesse o senso visceral de que o Teorema do Limite Central é... O Teorema do Limite Central diz que conforme n se aproxima... conforme ele se aproxima do infinito, então lá você terá realmente a distribuição normal. . Mas para efeitos do dia a dia, você não deve ter que fazer isso muito maior que n = 2. Se você tiver n = 10 ou n = 15, você estará bastante próximo da distribuição normal. Então isso converge rapidamente para a distribuição normal. Agora a outra coisa é que obviamente você quer muitas, muitas tentativas. Então isso é o seu tamanho amostral. Isso é o seu tamanho amostral. Isso é o tamanho de cada uma das suas cestas. Logo no primeiro vídeo que eu fiz isso, eu peguei um tamanho amostral de 4. E a simulação que eu fiz no último vídeo, nós fizemos tamanhos amostrais de 4 e 10 e outras coisas... Isso é o tamanho amostral de 1. Então este é nosso tamanho amostral. Então, à medida que isso se aproxima do infinito, sua distribuição amostral da amostra da média amostral irá se aproximar da distribuição normal. Agora para poder ver visualizar a distribuição normal e também para provar isso para você mesmo, você teria que fazer isso muitas, muitas... lembre-se, a distribuição normal acontecer, isso é em essência a população, ou isso é a variável aleatória. Isso lhe diz todas as possibilidades. Na vida real, nós raramente conhecemos todas as possibilidades. De fato na vida real, nós dificilmente sabemos as funções geradoras da probabilidade pura... Apenas se nós as estivermos escrevendo, ou se estivermos escrevendo um programa de computador Normalmente nós fazemos amostras e nós tentamos estimar as coisas. Então normalmente existe alguma variável aleatória e então talvez nós iremos fazer um bocado de... nós iremos fazer um bocado de amostras, nós iremos tirar suas médias e nós as iremos marcar e nós iremos obter algum tipo de distribuição normal. Digamos que nós pegamos amostras de 100 e nós tiramos a média delas. Nós iremos obter uma distribuição normal. E em teoria, se nós fizermos as médias centenas de milhares de vezes, nosso conjunto de dados irá se aproximar muito da distribuição amostral pura da média amostral. Essa coisa é a verdadeira distribuição. Isso é a verdadeira distribuição da média real. Ela tem uma média pura. Então a média da distribuição amostral da média amostral... nós a iremos escrever assim... Observe que eu não escrevi isso apenas o x com... o que é isso... isso está nos dizendo que isso é a média REAL da população... isso é a média REAL da variável aleatória. Se você olhar para cada uma das possibilidades de todas as amostras que você pode tirar da sua distribuição original, de alguma outra distribuição aleatória original, e você pegou todas as possibilidades deste, vejamos... tamanho amostral. Veja que nós estávamos lidando com o mundo no qual o tamanho amostral era 10. Se você fizer todas as combinações de 10 amostras de alguma distribuição original e você tirar a média delas, isso deve descrever esta função. É claro que em realidade, se você não sabe a distribuição original, você não pode fazer infinitas amostras disso e então você não irá conhecer cada combinação! Mas se você fizer isso com 1.000... se você fizer a amostragem 1.000 vezes, então 1.000 vezes você pegou 10 amostra de alguma distribuição e fez 1.000 médias e então as marcou, então nós estaremos chegando bastante perto... Agora o próximo ponto que eu quero abordar é o que acontece conforme n... nós sabemos que à medida que n se aproxima do infinito, isso se torna uma distribuição mais normal, mas como eu já disse, n = 10 é bastante bom e n = 20 é ainda melhor! E eu tratarei isso no próximo vídeo. .