If you're seeing this message, it means we're having trouble loading external resources on our website.

Se estiveres protegido por um filtro da Web, certifica-te de que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Posição do vídeo:0:00Duração total:10:52

Transcrição do vídeo

. No vídeo anterior, nós aprendemos algo que é talvez, a idéia mais profunda em estatística. E isso é o Teorema do Limite Central. E a razão disso ser tão interessante é que nós podemos iniciar com qualquer distribuição que tem variância e média bem definidas. E eu já fiz isso... eu escrevi o desvio padrão nesses últimos. Isso deve ser a média. E digamos que isso tem alguma variância. Eu posso escrever isso assim. Ou eu posso escrever o desvio padrão ali. Mas como isso é uma média e um desvio padrão bem definidos, eu não me preocupo com a forma desta distribuição. O que eu posso fazer é pegar amostras, no último vídeo, digamos de tamanho 4. Então nesta média que eu peguei, literalmente, quatro instâncias desta variável aleatória. Isso é um exemplo. Eu peguei as médias deles. E eu considero esta média amostral da minha primeira tentativa. Ou, você poderia dizer, para minha primeira amostra. Eu sei que isso é bastante confuso porquê você poderia considerar isso uma amostra. Um conjunto a ser uma amostra. Ou você pode considerar cada um destes membros da... Cada membro do conjunto como uma amostra. Então isso pode ser um pouco confuso aqui. Mas eu tenho esta primeira média amostral. E então eu continuo fazendo isso mais e mais. Na minha segunda amostra, meu tamanho amostral é 4. Eu peguei quatro instâncias desta variável aleatória. Eu tirei a média delas. Eu tenho uma nova média amostral. E o fascinante no Teorema do Limite Central é, se eu continuar marcando a distribuição de frequências da minha média amostra, isso começa a se aproximar de algo que fica parecido com a distribuição normal. E isso irá ficar ainda melhor na aproximação dess distribuição normal à medida que n cresce. E então nós já temos uma pequena terminologia no nosso cinturão de trabalho, essa distribuição de frequências bem aqui, que eu desenhei. Ou aqui ou bem aqui, que eu comecei a desenhar. Isso é chamado... e isso é um pouco confuso porquê nós usamos demais a palavra "amostra". Que isso é chamado a distribuição amostral da média amostral. E vamos dissecar isso um pouco. Apenas porquê esta longa descrição dessa descrição começa a fazer um pouco de sentido. Quando nós dizemos que isso é a distribuição amostral, isso está nos dizendo que isso foi derivado de... essa é a distribuição de alguma estatística, que nesse caso, ocorreu de ser a média amostral. E nós estamos tirando isso de amostras da nossa distribuição original. Então cada um desses... então este é minha primeira amostra. Meu tamanho amostral é 4. Eu estou usando a estatística da média. E agora eu posso fazer isso com outras coisas. Eu posso ter feito a moda ou o intervalo, ou outra estatística... Mas a distribuição amostral da média amostral é a mais comum delas. Isso é provavelmente para mim a melhor maneira de começar a ensinar sobre o Teorema do Limite Central. E ainda, francamente, distribuição amostral. Então é assim que isso é chamado. E apenas como um pouco de pano de fundo... e eu irei provar isso para ti experimentalmente, não matematicamente. Mas eu penso que o experimental é, em algum nível, mais satisfatório do que estatística. E aqui eu terei a média amostral como nossa distribuição amostral, bem aqui. Então isso foi a média amostral. Mas nós veremos no próximo vídeo que isso irá ser... isso irá começar a se aproximar da distribuição normal. Mesmo tendo que minha distribuição original... de que isso foi tipo, gerado de algo completamente não-normal... Então vamos fazer isso com este aplicativo bem aqui. E apenas para lhe dar os créditos disso, isso.. eu penso que foi desenvolvido na Universidade de Rice... Isso veio de onlinestatbook.com. E esse é o aplicativo deles, que eu penso que realmente é um aplicativo interessante... porque ele realmente lhe ajuda a visualizar o que é uma distribuição amostral da média amostral. Então eu posso literalmente criar minha própria distribuição customizada aqui... Então deixe-me fazer apenas algo bem maluco. Então você pode usar isso em tese com uma função de densidade de probabilidades contínua ou discreta. Mas o que eles têm aqui poderia ter 1 de 32 valores. E eu apenas estou configurando as diversas probabilidades para obter qualquer um desses 32 valores. Então claramente isso bem aqui não é uma distribuição normal. Isso parece um pouco bimodal, mas ela não tem caudas longas... Mas o que eu quero fazer antes, é apenas usar uma simulação para entender, ou entender melhor, o que a distribuição amostral nos mostra... Então o que eu irei fazer... eu irei fazer... nós iremos começar com 5 por vez. Então meu tamanho amostral irá ser 5. E então quando eu clico em "animar", o quê isso irá fazer é pegar cinco valores amostras da minha função de distribuição de probabilidades. Isso ira pegar cinco amostras e você irá ver elas quando eu clicar em "animar". Isso irá tirar a média delas e marcar a média aqui em baixo. E então eu irei clicar novamente nisso. Isso irá fazer isso novamente... Então lá vamos nós... Eu peguei cinco amostras daqui. Eu tirei a média delas. E isso atingiu aqui. O que eu fiz? Eu cliquei... Oh! Eu queria limpar isso. Deixe-me tornar este um embaixo, nulo. Então deixe-me fazer isso novamente. Então eu irei pegar 5 a cada vez. E então eu peguei cinco amostras daqui. E então eu peguei esta média. E marquei a média aqui. Deixe-me fazer isso novamente. Cinco amostras desta função de distribuição de probabilidades, desenhada bem aqui. Eu poderia continuar fazendo... isso iria tomar algum tempo, mas como você pode ver, eu marquei isso bem aqui. Agora, eu posso fazer isso milhares de vezes. E isso iria demorar para sempre... Digamos que eu quero fazer isso apenas 1.000 vezes. Então isso... este programa, apenas para ficar claro, ele está de fato gerando os números aleatórios. Isso não é como um programa enganador. Ele está apenas gerando os números aleatórios segundo esta função de distribuição de probabilidades. Isso irá pegar cinco por vez, fazer sua média e marcar as médias. Então se eu clicar 10.000, ele irá fazer isso por 10.000 vezes. Então isso irá pegar 5 números daqui por 10.000 vezes. E encontrar suas médias por 10.000 vezes. E então marcar as 10.000 médias aqui. Então vamos fazer isso. E lá vamos nós... Observe, isso já não se parece com uma distribuição normal. E, como eu disse, a média original da minha distribuição maluca aqui foi 14,45. E a média de, depois de fazer 10.000 amostras ou 10.000 tentativas, minha média aqui são 14,42. Então eu já estou me aproximando bastante da média ali... Meu desvio padrão, você pode observar, é menor que isso. Nós iremos falar sobre isso em um vídeo futuro. E esta assimetria e curtosidade... Estas são ideias... estas coisas que nos ajudam a mensurar como é a distribuição normal. E nós falamos um pouco sobre isso no passado. E agora deixe-me agora divergir um pouco. Porquê isso é interessante... E estes são conceitos bastante simples... Assimetria literalmente nos diz... então isso é... deixe-me fazer isso numa cor diferente. Se isso é uma distribuição normal perfeita, e claramente meus desenhos ficam bem longe da perfeição... Se isso é uma distribuição perfeita, isso deveria ter uma assimetria de zero. Se você tem uma assimetria positiva, isso significa que você tem uma cauda direita mais comprida do que você espera... Então algo com uma assimetria positiva se parece com isso. Isso deveria ter uma cauda comprida à direita... Então isso poderia ser uma assimetria positiva, que a faz um pouco menos que o ideal para uma distribuição normal. E uma assimetria negativa deveria se parecer com isso. Isso tinha uma longa cauda à esquerda. Então assimetria negativa deve se parecer com isso... Então isso é uma assimetria negativa. Se você tiver problemas para se lembrar disso, apenas se lembre em qual direção a cauda está indo. Esta cauda está indo na direção negativa. Esta cauda está indo na direção positiva. Então algo não tem assimetria, o que significa que isso é bem comportado e simétrico em torno desta média. Agora curtose... o que parece ser uma palavra esquisita, é similarmente não tão esquisita como ideia. Curtose... Então, de novo, se você tiver que desenhar uma distribuição perfeitamente normal... Lembre-se, nenhuma distribuição é perfeitamente normal! Você poderia ter médias e desvios padrão diferentes. Digamos que isso é uma distribuição normal perfeita. Se eu tenho curtose positiva, o que irá acontecer aqui... eu irei ter caudas mais gordas. Deixe-me desenhar isso um pouco melhor... Eu irei ter caudas mais gordas, mais eu irei ter um pico mais pontudo. Eu não quis desenhar isso tão pontudo! Deixe-me desenhar assim... Eu ire ter caudas largas e eu irei ter um pico mais pontudo que numa distribuição normal. Então isso, bem aqui, isso é uma curtose positiva. Então algo que tem uma curtose positiva, dependendo de quanto isso é positivo, isso lhe diz que isso será um pouco mais pontudo que numa distribuição normal de verdade. Curtose positiva. E curtose negativa tem caudas menores, mas ela é mais suave perto do meio. Então ela se parece assim... Então algo assim deveria ter uma curtose negativa... . Então talvez em um vídeo futuro, eu vá explorar isso em maiores detalhes. Mas no contexto da simulação, isso está apenas nos dizendo o quão normal esta distribuição é. Então quando nosso tamanho amostral tem n igual a 5, e nós fizemos 10.000 tentativas, nós chegamos bastante próximos de uma distribuição normal. Deixe-me fazer outras 10.000 tentativas apenas para ver o que acontece... Isso se parece ainda mais com uma distribuição normal. Nossa média agora é exatamente o mesmo número. Mas nós ainda temos um pouco de assimetria e um pouco de curtose. Agora vejamos o que acontece se nós fizemos a mesma coisa com um tamanho amostral maior. E nós podemos mesmo fazê-los simultaneamente... Então aqui n é igual a 5. Vamos fazer aqui n igual a 25. Deixe-me limpá-los... Eu irei fazer a amostra... distribuição amostral da média amostral. E quando eu rodar 10.000 tentativas... Então eu irei fazer uma tentativa animada, apenas se lembre o que está acontecendo... Então eu estou literalmente pegando 5 amostras daqui... Tirando a média deles... Agora eu estou tirando 25 amostras daqui... Tirando suas médias... E então marcando-os bem aqui em baixo... Então aqui o tamanho amostral são 25. E aqui são 5. Eu farei isso mais uma vez... Eu pego 5, tiro a média e marco... Pego 25, tiro a média e então marco bem aqui embaixo. Isso é um tamanho amostral maior. Agora esta coisa como eu já fiz... eu irei fazer por 10.000 vezes... . E isso é interessante... lembre-se, nossa primeira distribuição era de fato realmente doida, uma distribuição muito anormal... Mas uma vez nós tendo feito isso... Opa! Eu não queria fazer isso tão grande! Mas uma vez que nós... rolar um pouco para cima... Então aqui, que é interessante... Ambos se parecem um pouco normais... Mas se você observar a assimetria e a curtose quando nosso tamanho amostral é maior, ele fica mais normalizado. Isso tem uma assimetria menor de quando nosso tamanho amostral era de apenas 5. E isso tem uma curtose negativa menor de quando nosso tamanho amostral era 5... Então isso é uma distribuição mais normalizada. E uma coisa que nós iremos explorar mais tarde em vídeos futuros, não é apenas que é mais normal em sua forma, mas isso também se ajusta melhor à média. E você também pode pensar quanto isso faz sentido... Quando nosso tamanho amostral é maior, nossa chance de obter algo realmente distante da média é menor. Porquê existe uma propensão muito pequena se você tirar 25 amostras ou 100 amostras de quando você pega um bocado de coisa fora disso... um bocado de coisa fora disso. Você está mais propenso a pegar um conjunto de coisas mais razoável. Então faz sentido que sua média... sua média amostral é menos propenso de Nós iremos falar um pouco mais a respeito disso no futuro. Mas na esperança de que isso o satisfaça, ao menos experimentalmente. Eu não provei isso a você com rigor matemático, o que tenho esperança de que façamos no futuro. Mas na esperança de que isso o satisfaça, ao menos experimentalmente, de que o Teorema do Limite Central realmente se aplica a qualquer distribuição. Eu quero dizer que isso é uma distribuição maluca. Eu o encorajo a testar este aplicativo em onlinestatbook.com e experimentar com outras distribuições malucas para crer por si mesmo. Mas a coisa interessante é que estamos nos aproximando de uma distribuição normal, mas à medida que meu tamanho amostral aumenta, existe uma adequação maior à distribuição normal. .