Chegue à conclusão certa com a análise inferencial
Publicados: 2020-03-23Somos todos culpados de tirar conclusões precipitadas de vez em quando.
Seja para se convencer de que ninguém vai comprar uma passagem para a conferência que você trabalhou tanto para planejar ou que chegar ao aeroporto com duas horas de antecedência simplesmente não é tempo suficiente, todos nós já fizemos isso.
Fora de nossas vidas diárias, é fácil tirar conclusões imprecisas no trabalho, não importa o setor. Quando fazemos isso, estamos essencialmente generalizando, mas e se você pudesse fazer essas generalizações com mais precisão? É possível quando você executa testes de análise inferencial.
O que é análise inferencial?
A análise inferencial é usada para extrair e medir a confiabilidade das conclusões sobre uma população com base em informações coletadas de uma amostra da população. Como a análise inferencial não amostra todos em uma população, os resultados sempre conterão algum nível de incerteza.
Ao mergulhar na análise estatística, muitas vezes o tamanho da população que estamos procurando analisar é muito grande, tornando impossível estudar todos. Nesses casos, os dados são coletados usando amostras aleatórias de indivíduos dentro de uma população específica. Em seguida, a análise inferencial é usada nos dados para chegar a conclusões sobre a população geral.
Como muitas vezes é impossível medir uma população inteira de pessoas, a análise inferencial depende da coleta de dados de uma amostra de indivíduos dentro da população. Essencialmente, a análise inferencial é usada para tentar inferir de uma amostra de dados o que a população pode pensar ou mostrar.
Existem duas maneiras principais de fazer isso:
- Estimando parâmetros: pegar uma estatística de uma amostra de dados (como a média da amostra) e usá-la para concluir algo sobre a população (a média da população).
- Testes de hipóteses: O uso de amostras de dados para responder a questões de pesquisa específicas.
Na estimativa de parâmetros, a amostra é utilizada para estimar um valor que descreve toda a população, além de um intervalo de confiança. Em seguida, a estimativa é criada.
No teste de hipóteses, os dados são usados para determinar se são fortes o suficiente para apoiar ou rejeitar uma suposição.
Análise descritiva versus análise inferencial
Os dois principais tipos de análise estatística que as pessoas usam com mais frequência são a análise descritiva e a análise inferencial. Por causa disso, não é incomum que os dois sejam confundidos, mesmo que forneçam aos analistas de dados diferentes insights sobre os dados coletados.
Embora não seja possível mostrar a imagem completa, quando usados juntos, eles fornecem uma ferramenta poderosa para visualização de dados e análise de previsão, pois dependem do mesmo conjunto de dados.
A análise estatística descritiva fornece informações que descrevem os dados de alguma forma. Isso às vezes é feito com tabelas e gráficos feitos com software de visualização de dados para explicar o que os dados apresentam. Este método de análise estatística não é usado para tirar conclusões, apenas para resumir as informações.
A análise estatística inferencial é o método que será utilizado para tirar as conclusões. Ele permite aos usuários inferir ou concluir tendências sobre uma população maior com base nas amostras analisadas. Basicamente, ele pega dados de uma amostra e tira conclusões sobre uma população ou grupo maior.
Esse tipo de análise estatística é frequentemente usado para estudar a relação entre variáveis dentro de uma amostra, permitindo conclusões e generalizações que representam com precisão a população. E, diferentemente da análise descritiva, as empresas podem testar uma hipótese e chegar a várias conclusões a partir desses dados.

Vamos pensar desta forma. Você está em um jogo de beisebol e pergunta a uma amostra de 100 fãs se eles gostam de cachorro-quente. Você poderia fazer um gráfico de barras de respostas sim ou não, o que seria uma análise descritiva. Ou você pode usar sua pesquisa para concluir que 93% da população (todos os fãs de beisebol em todos os estádios de beisebol) gostam de cachorros-quentes, o que seria uma análise inferencial.
Tipos de testes de análise inferencial
Existem muitos tipos de testes de análise inferencial que estão no campo da estatística. Qual deles você escolhe usar dependerá do tamanho da amostra, da hipótese que está tentando resolver e do tamanho da população que está sendo testada.
Análise de regressão linear
A análise de regressão linear é usada para entender a relação entre duas variáveis (X e Y) em um conjunto de dados como forma de estimar a variável desconhecida para fazer projeções futuras sobre eventos e metas.
O principal objetivo da análise de regressão é estimar os valores de uma variável aleatória (Z) com base nos valores de suas variáveis conhecidas (ou fixas) (X e Y). Isso é normalmente representado por um gráfico de dispersão, como o abaixo.

Uma das principais vantagens de usar a regressão em sua análise é que ela fornece uma visão detalhada dos dados e inclui uma equação que pode ser usada para análise preditiva e otimização de dados no futuro.
A fórmula para análise de regressão é:
Y = a + b(x)
A → refere-se ao intercepto y, o valor de y quando x = 0
B → refere-se à inclinação, ou subida ao longo do percurso
Análise de correlação
Outro teste de análise inferencial é a análise de correlação, que é usada para entender até que ponto duas variáveis são dependentes uma da outra. Essa análise essencialmente testa a força da relação entre duas variáveis e se sua correlação é forte ou fraca.
A correlação entre duas variáveis também pode ser negativa ou positiva, dependendo das variáveis. As variáveis são consideradas “não correlacionadas” quando uma mudança em uma não afeta a outra.
Um exemplo disso seria preço e demanda. Isso ocorre porque um aumento na demanda causa um aumento correspondente no preço. O preço aumentaria porque mais consumidores querem algo e estão dispostos a pagar mais por isso.
Em geral, o objetivo da análise de correlação é encontrar o valor numérico que mostra a relação entre as duas variáveis e como elas se movem juntas. Como a regressão, isso normalmente é feito utilizando software de visualização de dados para criar um gráfico.

Relacionado: saiba mais sobre os prós e contras das correlações versus regressão, incluindo as diferenças e qual método sua empresa deve usar.
Análise de variação
O método estatístico de análise de variância (ANOVA) é usado para testar e analisar as diferenças entre duas ou mais médias de um conjunto de dados. Isso é feito examinando a quantidade de variação entre as amostras.
Em termos mais simples, ANOVA fornece um teste estatístico para saber se duas ou mais médias populacionais são iguais, além de generalizar o teste t entre duas médias.
Saiba mais: Um teste t é usado para mostrar quão significativas são as diferenças entre dois grupos. Essencialmente, permite compreender se as diferenças (medidas em médias) podem ter acontecido por acaso.

Este método permitirá o teste de grupos para ver se há uma diferença entre eles. Por exemplo, você pode testar alunos de duas escolas de ensino médio diferentes que fazem o mesmo exame para ver se uma escola de ensino médio é mais alta do que a outra.
A ANOVA também pode ser dividida em dois tipos:
- Unidirecional: Apenas uma variável independente com dois níveis. Um exemplo seria uma marca de manteiga de amendoim.
- Bidirecional: Duas variáveis independentes que podem ter vários níveis. Um exemplo seria uma marca de manteiga de amendoim e as calorias.
Um nível é simplesmente os diferentes grupos dentro da variável. Assim, usando o mesmo exemplo acima, os níveis das marcas de manteiga de amendoim podem ser Jif, Skippy ou Peter Pan. Os níveis de calorias podem ser suaves, cremosos ou orgânicos.
Análise de covariância
A análise de covariância (ANCOVA) é uma combinação única de análise de variância (ANOVA) e regressão. A ANCOVA pode mostrar quais informações adicionais estão disponíveis ao considerar uma variável independente, ou fator, por vez, sem influenciar outras.
É frequentemente usado:
- Para uma extensão de regressão múltipla como forma de comparar várias linhas de regressão
- Para controlar covariáveis (outras variáveis) que não são o foco principal do seu estudo
- Para uma extensão da análise de variância
- Estudar combinações de outras variáveis de interesse
- Para controlar fatores que não podem ser randomizados, mas que podem ser medidos
A ANCOVA também pode ser usada para pré-teste ou pós-teste de uma análise quando a regressão à média afetar sua medição pós-teste da estatística.
Como exemplo, digamos que sua empresa crie novos produtos farmacêuticos para o público que reduzem a pressão arterial. Você pode realizar um estudo que monitore quatro grupos de tratamento e um grupo de controle.
Se você usar ANOVA, poderá dizer se o tratamento, de fato, reduz a pressão arterial. Ao incorporar a ANCOVA, você pode controlar outros fatores que podem influenciar o resultado, como vida familiar, ocupação ou uso de outros medicamentos prescritos.
Intervalo de confiança
Um intervalo de confiança é uma ferramenta usada na análise inferencial que estima um parâmetro, geralmente a média, de uma população inteira. Essencialmente, é quanta incerteza existe em qualquer estatística específica e é normalmente usada com uma margem de erro.
O intervalo de confiança é expresso com um número que reflete a certeza de que os resultados da pesquisa ou pesquisa são os esperados se fosse possível pesquisar toda a população.
Por exemplo, se os resultados de uma pesquisa ou pesquisa tiverem um intervalo de confiança de 98%, isso definirá o intervalo de valores que você pode ter 98% de certeza que contém a média da população. Para chegar a essa conclusão, três informações são necessárias:
- Nível de confiança : Descreve a incerteza associada a um método de amostragem
- Estatística: dados coletados da pesquisa ou pesquisa
- Margem de erro : quantos pontos percentuais seus resultados serão diferentes do valor real da população
Teste qui-quadrado
Um teste qui-quadrado, também conhecido como teste x2, é usado para identificar a diferença entre os grupos quando todas as variáveis são nominais (também conhecidas como uma variável com valores que não têm valor numérico), como sexo, diferença salarial, filiação política e assim por diante.
Esses testes são normalmente usados com tabelas de contingência específicas que agrupam observações com base em características comuns.
As perguntas que o teste do qui-quadrado poderia responder podem ser:
- O nível de educação e o estado civil estão relacionados para todas as pessoas nos Estados Unidos?
- Existe uma relação entre a intenção do eleitor e a filiação a partidos políticos?
- O gênero afeta quais feriados as pessoas preferem?
Normalmente, esses testes são feitos usando o método de análise estatística chamado amostragem aleatória simples para coletar dados de uma amostra específica para potencialmente chegar a uma conclusão precisa. Se usarmos a primeira pergunta listada acima, os dados podem se parecer com:
Nome | Status | Educação | |
1 | Melissa | Divorciado | Doutorado ou Superior |
2 | Casey | Casado | diploma de bacharel |
3 | Ângela | Casado | GED |
4 | Alyssa | Viúva | diploma de bacharel |
5 | Jenna | Nunca se casou | GED |
Essas tabelas de contingência são utilizadas como ponto de partida para organizar os dados coletados por meio de amostragem aleatória simples.
Vantagens da análise inferencial
Há muitas vantagens em usar a análise inferencial, principalmente porque ela fornece um excedente de informações detalhadas – muito mais do que você teria após executar um teste de análise descritiva.
Essas informações fornecem aos pesquisadores e analistas insights abrangentes sobre as relações entre duas variáveis. Ele também pode mostrar conscientização sobre causa e efeito e previsões sobre tendências e padrões em todos os setores.
Além disso, uma vez que é tão amplamente utilizado no mundo dos negócios, bem como na academia, é um método universalmente aceito de análise estatística.
Limitações da análise inferencial
Quando se trata de estatística inferencial, existem duas limitações principais.
A primeira limitação vem do fato de que, como os dados analisados são de uma população que não foi totalmente medida, os analistas de dados nunca podem ter 100% de certeza de que as estatísticas calculadas estão corretas. Como a análise inferencial é baseada no processo de usar valores medidos em uma amostra para concluir os valores que seriam medidos da população total, sempre haverá algum nível de incerteza quanto aos resultados.
A segunda limitação é que alguns testes inferenciais exigem que o analista ou pesquisador faça uma suposição fundamentada com base em teorias para executar os testes. Semelhante à primeira limitação, haverá incerteza em torno dessas suposições, o que também significará algumas repercussões na confiabilidade dos resultados de alguns testes estatísticos.
Não tire conclusões precipitadas
Antes de chegar a uma conclusão potencialmente imprecisa em relação aos dados, certifique-se de aproveitar as informações que aguardam em um teste de análise inferencial.
Não importa o tipo de conclusão que você deseja chegar, ou a hipótese com a qual você começa, você pode se surpreender com os resultados que um teste de análise inferencial pode trazer.
Procurando um software de análise estatística para interpretar melhor todos os seus conjuntos de dados? Ou talvez uma ferramenta que torne simples e conclusivas até mesmo a análise estatística mais complexa? Confira nossa lista de avaliações imparciais no G2!