Marca do OAgregador
Início
Search

Rádio OA

Pode conter a opinião do autor
Este conteúdo é um repost de

O peso do primeiro gol: uma análise dos gols do Brasileirão de 2014 a 2022

Será que quem faz o primeiro gol tem mesmo mais chances de levar a vitória? Vamos analisar essa questão e descobrir se ela se aplica ao nosso Brasileirão
Publicado em 3 de abril de 2024
por Eliéser Ribeiro

Ah, meus amigos e minhas amigas, você já ouviu falar daquele famoso clichê de “quem dá o primeiro soco ganha a briga”, não é mesmo? É um clichê que todo mundo conhece, daqueles que aparecem em filmes, livros e histórias por aí. Mas, veja só, eu estava pensando aqui nos números do campeonato brasileiro… Me surgiu uma dúvida: será que quem faz o primeiro gol tem mesmo mais chances de levar a vitória? Vamos analisar essa questão e descobrir se ela se aplica ao nosso Brasileirão.

Foi assim que comecei minha jornada em busca da resposta para essa pergunta intrigante. Eu sabia que precisava de dados concretos para analisar a relação entre marcar o primeiro gol e as chances de vitória no Campeonato Brasileiro. Felizmente, encontrei um banco de dados valioso organizado pelo incrível Adão Duque no Kaggle, abrangendo os campeonatos de 2014 a 2022.

No entanto, antes de iniciar minha análise, percebi a necessidade de realizar um processo de tratamento nos dados a fim de garantir sua qualidade e consistência. Foi então que optei por utilizar o Alteryx Designer 2021.4, um software robusto e confiável para o tratamento de dados. Com ele, podemos desenvolver fluxos de dados visualmente e operar cada uma das ferramentas de forma intuitiva.

Agora a história fica ainda mais interessante! Depois de conseguir os dados do Brasileirão percebi que havia duas bases de dados que poderiam me ajudar a desvendar o mistério dos primeiros gols e as chances de vitória.

A primeira base de dados trazia informações gerais sobre as partidas. Tinha coisas como o ID da partida, a rodada em que ela aconteceu, a data e o horário, os times mandante e visitante, o vencedor da partida (ou um caractere de traço “-” caso tenha sido um empate) e o placar final.

Já a segunda base de dados era focada nos gols. Nela, tinha o ID da partida novamente, a rodada correspondente, o clube que fez o gol, o nome do atleta que balançou as redes e, para completar, o minuto em que o gol foi marcado durante o jogo.

Agora você deve estar se perguntando: “E aí, o que você fez com tudo isso?”. Bom, a minha ideia era cruzar essas informações para descobrir se os times que marcavam o primeiro gol tinham uma vantagem maior de vencer a partida. Era como montar um quebra-cabeça emocionante e cheio de informações.

PRIMEIRO DESAFIO: TRATAMENTO DE VARIÁVEL STRING
Cara, foi uma verdadeira jornada mexendo nesses dados! Para começar, utilizei a ferramenta Join para unir as duas tabelas, ligando as variáveis ID e ID da partida. Foi assim que consegui fazer com que elas conversassem entre si, sabe?

Depois disso, precisei fazer alguns ajustes nas variáveis. Utilizei a ferramenta Select para remover as variáveis repetidas e renomear outras que precisavam de um nome mais intuitivo. Porém, aí enfrentei meu primeiro grande desafio: o minuto do gol estava armazenado como uma string! E pior ainda, quando o gol acontecia com acréscimos, a informação vinha assim, tipo “45+3”. E eu te digo, fazer cálculos com uma variável string não rola.

Foi então que mergulhei de cabeça no estudo de fórmulas e expressões regulares para tentar separar esses dois números. Mas, olha só, o momento de virada aconteceu quando decidi lançar mão da poderosa ferramenta “Texto para Coluna” do Alteryx. Com ela, selecionei a variável problemática, defini o delimitador como “+” e consegui dividir a informação em duas colunas: uma com o tempo regular e outra com o acréscimo. Foi um verdadeiro salva-vidas, meu amigo!

SEGUNDO DESAFIO: TRATAMENTO DE DATA E OPERAÇÃO DE FÓRMULAS
Mas aí veio mais um desafio. A variável de data também estava em formato de string, o que o Alteryx não consegue interpretar bem. Mas calma, eu tinha uma carta na manga! Utilizei a ferramenta “Data e Hora” para transformar essa variável em um formato datetime, que o Alteryx entende numa boa.

Agora, com os dados todos arrumadinhos e em formatos corretos, estou pronto para partir para a próxima etapa dessa análise emocionante. Mal posso esperar para compartilhar os resultados com você e descobrir se os primeiros gols realmente têm um impacto nas chances de vitória no Campeonato Brasileiro.

Agora vem a parte que eu acho mais legal: operar as fórmulas do Alteryx! Primeiro, tratei a variável de acréscimos, substituindo os valores nulos por 0. Em seguida, criei uma nova variável chamada “minutogol”, que representa a soma do “tempo regular” + “acréscimo”. Depois, foi a vez de dar um trato na variável do vencedor. Substituí o caractere “-” por “Empate”, para deixar mais claro nos resultados. Ah, e também criei uma variável chamada “ano” utilizando a função DateTimeYear, que extrai o ano da variável “Data” que eu já havia transformado anteriormente. 

TERCEIRO DESAFIO: DEFININDO NUMA NOVA TABELA QUANDO ACONTECIA O PRIMEIRO GOL
Depois de enfrentar o segundo desafio, surgiu uma nova questão em relação à organização dos dados no banco de dados. Como os registros estavam organizados por gols, eu precisava identificar quando exatamente o primeiro gol ocorria em cada partida. Para solucionar isso, recorri à poderosa ferramenta “Sumarizar” do Alteryx.

Utilizando essa ferramenta, agrupei os dados por IDs únicos e selecionei a variável “minutogol”, escolhendo a função “Mínimo”. Isso gerou uma nova tabela com os IDs únicos e uma nova variável chamada “Min_minutogol”, fornecendo o tempo do primeiro gol em cada partida.

Em seguida, fiz outro “join” utilizando essa nova tabela com o restante das informações, a fim de incorporar a variável “Min_minutogol” à tabela de trabalho. Com isso feito, foi hora de colocar minhas habilidades em fórmulas novamente em ação.

Desta vez, criei duas novas variáveis cruciais para a resolução de nosso problema. A primeira delas foi a “primeiro_gol”, na qual desenvolvi a expressão condicional: se “Min_minutogol” é igual a “minutogol”, então atribua “Sim”, caso contrário, atribua “Não”. Essa variável nos permite identificar se o primeiro gol foi marcado ou não em cada partida.

QUARTO DESAFIO: ORGANIZAR UMA VARIÁVEL QUE DISTRIBUA AS PROBABILIDADES
A segunda variável criada foi chamada de “status”. E aqui está o pulo do gato, a chave para responder nossa grande pergunta: quem faz o primeiro gol tem mais chances de vencer? Neste momento, dediquei uma grande energia e enfrentei meu terceiro desafio. Afinal, se um time marca o primeiro gol, ele tem três resultados possíveis: vitória, derrota ou empate.

Da mesma forma, se ele não marca o primeiro gol, essas mesmas opções se aplicam. Precisava traduzir essa lógica em um script para criar a nova variável e fazer tudo funcionar perfeitamente. Criar um script eficiente para calcular as probabilidades era o ponto mais importante de todo o processo.

QUINTO E ÚLTIMO DESAFIO: CALCULAR AS PROBABILIDADES
Depois de realizar a etapa de preparação dos dados com o Alteryx, parti para as análises e cálculos estatísticos. Utilizei novamente a ferramenta Sumarizar. E agora caminho para fora do Alteryx e vamos realizar as contas na calculadora.

Foquei em calcular as proporções e analisar as probabilidades relacionadas ao primeiro gol e aos diferentes resultados (vitória, derrota ou empate). Utilizei a ferramenta Sumarizar novamente, desta vez agrupando os dados pela variável “primeiro_gol” e, posteriormente, pela variável “status”. Contei a ocorrência de cada resultado para obter informações precisas sobre as probabilidades envolvidas.

Para determinar se ter feito o primeiro gol teve alguma vantagem para obter um resultado positivo (vitória), é necessário calcular as taxas de vitória para os casos em que o primeiro gol foi marcado e para os casos em que o primeiro gol não foi marcado. 

Dados os valores fornecidos, temos:

Para os jogos em que o primeiro gol foi marcado (Sim):

Total de jogos com primeiro gol marcado: 320 + 613 + 2.184 = 3.117

Total de vitórias com primeiro gol marcado: 2.184

Taxa de vitória com primeiro gol marcado: (2.184 / 3.117) * 100 ≈ 70.13%

Portanto, a equipe que marcou o primeiro gol teve uma taxa de vitória de aproximadamente 70.13% nos jogos analisados.

Para os jogos em que o primeiro gol não foi marcado (Não):

Total de jogos com primeiro gol não marcado: 859 + 1.021 + 2.989 = 4.869

Total de vitórias com primeiro gol não marcado: 2.989

Taxa de vitória com primeiro gol não marcado: (2.989 / 4.869) * 100 ≈ 61.42%

Portanto, a equipe que não marcou o primeiro gol teve uma taxa de vitória de aproximadamente 61.42% nos jogos analisados.

Comparando as taxas de vitória, podemos observar que ter feito o primeiro gol (Sim) resultou em uma taxa de vitória de aproximadamente 70.13%, enquanto não ter feito o primeiro gol (Não) resultou em uma taxa de vitória de cerca de 61.42%. Com base nos dados fornecidos, ter feito o primeiro gol parece ter uma ligeira vantagem em termos de alcançar um resultado positivo (vitória).

Observação: Com base na análise dos dados, podemos concluir que a probabilidade de vitória é de 100% tanto para as equipes que fizeram o primeiro gol quanto para aquelas que não o fizeram.

CONCLUINDO
Sabe aquela história do primeiro gol que todo mundo fala? Aquele ditado de que quem marca o primeiro gol já tem meio caminho andado para a vitória? A conclusão foi interessante. Olhando os números, vi que quem fazia o primeiro gol realmente tinha uma taxa de vitória um pouco maior, por volta de 70%. Mas sabe o que foi surpreendente? Os times que não marcavam o primeiro gol não ficavam muito atrás, não. A taxa de vitória deles era de cerca de 61%.

Ou seja, o primeiro gol pode até dar uma vantagem inicial, mas não é garantia de vitória. O futebol é cheio de reviravoltas e os times têm a capacidade de reagir, de correr atrás do prejuízo e buscar o empate ou até mesmo a virada. É como se aquela história do primeiro soco para ganhar a briga não fosse tão definitiva assim.

No fim das contas, o futebol é um esporte imprevisível, cheio de emoções e surpresas. O primeiro gol pode dar uma motivação extra, mas não define o resultado final. É a combinação de habilidade, estratégia e determinação que faz a diferença.


Eliéser Ribeiro é sociólogo de dados, mestre em Sociologia, especialista em IA,
especialista em pesquisa e análise de dados. Trabalha com Python, R, SQL, Power BI, Tableau.

Cede gentilmente seus artigos para o Portal OAgregador.

Ficha Técnica

Editor Chefe: Luiz Fernando
Supervisão: Rafaela Prado
Redação: Kássio Kran

Fotos em destaque é do Rissatti FC da cidade de Ceres
Créditos: Wendell Rocha

Os comentários do OAgregador ainda não estão disponíveis. Nossa equipe esta trabalhando para desenvolver um sistema de comentários seguro.

A história do Cineclubismo em Goiás remonta aos anos 60. Venha conhecer.
O apoio ao esporte e em especial ao futebol, historicamente tanto em Ceres quanto em Rialma, só prospera se tiver a mão do prefeito.
Os Cineclubes Goianos apresentam sua programação de março.

Ao decidir navegar pela Rede OAgregador, você confirma que leu e concorda com a nossa Política de Privacidade.

oa

Não perca
nenhum conteúdo

Siga a rede OAgregador na sua rede social favorita e seja alertado sobre novos conteúdos para você:

oa

Não perca
nenhum conteúdo

Siga a rede OAgregador na sua rede social favorita e seja alertado sobre novos conteúdos para você: