PODCAFÉ TECH

Andre Yukio | Machine Learning é Matemática Pura!

podcafe.tech Season 6 Episode 230

Send us a text

No episódio de hoje do PodCafé Tech, recebemos Andre Yukio,
fundador da Universidade dos Dados e especialista em Ciência de Dados,
Aprendizado de Máquina e Estatística.
Com mais de 10 anos de experiência no mercado, Yukio já atuou em bancos,
grandes empresas, startups e consultorias para organizações
globais. Agora, lidera uma das plataformas de formação em
dados mais completas do Brasil.

📣 Curta, comente e compartilhe com alguém que vai se beneficiar dessas
informações!

☕ Temas que você vai encontrar neste episódio:

- 📊 Carreira em dados:
como Yukio construiu sua trajetória entre matemática, economia e
tecnologia.
- 🤖 Machine Learning: aplicações reais e desafios na adoção em empresas
brasileiras.
- 📈 Educação acessível em dados: a missão da Universidade dos Dados.
- 🌍 Mercado de trabalho: como se destacar e construir uma carreira
sólida em ciência de dados.
- 🧠 Aprendizado contínuo: insights sobre estatística, análise de dados
e impacto da IA no futuro do trabalho.

💡 Frase do episódio:
“A verdadeira transformação em dados não acontece só na tecnologia, mas
na forma como capacitamos pessoas para pensar estatística e machine
learning no dia a dia.” – Yukio

🔗 Conecte-se com o convidado: https://www.linkedin.com/in/andreyukio/
🔗 Conheça a Universidade dos Dados: https://www.linkedin.com/company/universidade-dos-dados/

🔗 Links oficiais do PodCafé Tech:  
📷 Instagram: https://www.instagram.com/podcafetech  
🔗 LinkedIn: https://www.linkedin.com/company/podcafetech  
🎵 Spotify: https://open.spotify.com/show/2A7HkYbsbEhzEpCTfYqmqD

🛍️ LOJA DO PODCAFÉ  
Camisetas, canecas, adesivos e mais: https://www.podcafe.tech

🎙 Hosts - Dyogo Junqueira - Anderson Fonseca - Guilherme Gomes

☕ Este episódio é um oferecimento da ACS Pro, especialista
em soluções de TI e inovação.

PodCafé Tech é um podcast onde Mr Anderson, Guilherme Gomes e Dyogo Junqueira, recebem convidados para falar de uma forma descontraída sobre Tecnologia, Segurança e muito mais.


YouTube: youtube.com/@podcafetech

Instagram: instagram.com/podcafetech

Linkedin: linkedin.com/company/podcafe

Speaker 1:

MÚSICA. Muito bem, muito bem, muito bem. Estamos começando mais um Podcafé, tech Podcast, tecnologia e cafeína. Meu nome é Anderson Fonseca, o Mr Anderson, e em matemática você passa a vida inteira procurando o X E quando tu acha o safado, você tem que substituir ele. Não faz sentido isso.

Speaker 2:

Aqui é Guilherme Gomes da SESPRO E Anderson você tem que substituir ele. Não faz sentido isso. Aqui é Guilherme Gomes da CES Pro E Anderson, você tem dado em casa.

Speaker 1:

Aqui é Diogo Junqueira. Pior eu tenho em todo lugar.

Speaker 3:

Aqui é Diogo Junqueira, senhor da CES Pro e da CES Cyber Pro. Pra nós é um prazer receber o convidado de hoje. Vou deixar ele mesmo se apresentar.

Speaker 4:

Fala aí pessoal. Eu sou o André Yuquil. Me apresento aí nas redes como Yuquil, Cientista de dados e especialista. Acho meio arrogante, Mas falo um pouco de Machine Learning e Data Science de modo geral.

Speaker 3:

Manja a parada, Vamos dizer ele não quer falar especialista, então ele manja da parada. Vamos dizer assim né Muito bom, Mas, Mr Alcâncio, você tem que falar um pouco do UQ aqui, cara Entrar pro pessoal, conhecer o tema. Que história é essa da lojinha velho, Cara para tudo e entre em podcafétech.

Speaker 1:

Eu sempre aponto aqui porque eu fico Assim é T-E-C-H, entendeu Podcafétech. Sou entrando e lá você vai encontrar a loja do Pó de Café onde você encontra essas fantásticas camisetas, e de fato são fantásticas. Abraço pro Rafa, nosso designer aqui arrebenta faz na mão não é GPT, galera não é GPT. Tá, isso aqui é feito na mão, na garra, na unha, na unha também tá lá não é assim.

Speaker 2:

Na verdade é feito no computador, mas é a mão é o equipamento caro que ele põe no computador.

Speaker 1:

Ele usa uma caneta eletrônica.

Speaker 3:

É exato.

Speaker 1:

De fato usa E assim, cara baita trabalho arte bacana tá lá disponível e tem um plus.

Speaker 2:

Temos um plus.

Speaker 1:

Essa loja tem um propósito 100% do que é arrecadado na loja vai para a NAY Autismo. arrecadado na loja vai para a NAY Autismo, uma instituição na qual nós depositamos toda a nossa confiança e compartilhamos com eles lá 100% do que é arrecadado.

Speaker 3:

O jogo vai explicar um pouco mais sobre a NAY É isso aí é o Núcleo de Arte e Inclusão Autista, uma organização que traz o pessoal do universo autista para colaboração de arte, cultura, teatro, música, enfim. Uma organização sensacional auxilia muito essa questão da causa autista, as famílias da causa autista. Então é composto por pessoas muito sérias, voluntárias, profissionais da área. Então assim é um projeto que eu acredito muito, tem um apelo pessoal muito grande com o pessoal e a gente fez essa lojinha sensacional que tem imã, geladeira, tem tudo o que você pensar pra atender a grande demanda de gente que sempre pediu camiseta, etc. Entrega pra vocês e 100% do lucro vai pra essa instituição. Então, galera, quem quiser conhecer entra lá. Podcafetech, que tem o link também pra instituição, que você pode conhecer, doar direto pra instituição, doar seu tempo também, participar dos espetáculos se você estiver em Goiânia, região, e assim por diante.

Speaker 1:

Maravilha, acesse também wwwacessprocombr, a empresa que está aqui oferecendo esse maravilhoso podcast pra você, e vamos mergulhar de cabeça no mundo dos dados, ou dar uma cabeçada. Isso aí, vamos lá. Alguma coisa assim.

Speaker 3:

Conta pra gente um pouco da sua história, cara se apresenta aí pro pessoal conhecer quem é o Yuquil cara. Como é que você chegou aí na questão da Universidade dos Dados que você é o fundador dela? com certeza teve um início ali na tecnologia. Conta pra gente um pouco mais da sua história, cara C ali na tecnologia Conta pra gente um pouco mais da sua história, cara.

Speaker 4:

Certo, eu sou formado em matemática, né. Então eu já tinha um pouco aí de ideia de que podia atuar ou no mercado financeiro ou com tecnologia. E aí acabou que quando eu resolvi sair das escolas, né Eu comecei dando monitoria em escola nos primeiros anos de faculdade. Eu fui pro mercado, aí eu fui parar no Itaú, trabalhei ali um pouco na área financeira deles, só que era uma área muito operacional, assim muito Ninguém vai botar sei lá um júnior para fazer uma operação de 2 milhões com a Petrobras.

Speaker 3:

Não vai, não vai, não vai Por questões um pouco óbvias, talvez Exato.

Speaker 4:

Então você acaba ficando muito ali só no VBA e aquela programação mais de automatizar a rotina. E aí eu já não curtia muito aquilo. Acabei indo pro HSBC pra buscar algo novo. E aí eu fui parar na área de riscos e aí eu conheci risco de crédito, que é basicamente data science voltado pro crédito. E aí que eu comecei a mergulhar nessa área de dados. E no mesmo período, além de eu ter migrado pra área de dados, eu comecei também o mestrado. E aí eu falei pô, vai que um dia eu quero dar aula alguma coisa, já vou ter o mestrado, então eu vou começar a produzir conteúdo na internet. E aí comecei, fiz um blog, Só um comentário.

Speaker 1:

você fez o caminho contrário Porque o cara que tá em matemática ele já pensa vou dar aula, vou fazer.

Speaker 3:

Cara, o cara Ele foi lá vamos para o mercado primeiro e depois volta.

Speaker 4:

Exato. Aí eu meio que pensei tipo ah, eu não quero ficar trabalhando para empresas assim até meus 60, 70 anos, sabe-se lá quando. Então, talvez da aula, que era o que eu gostava, pudesse ser uma solução. E aí eu comecei a produzir conteúdo na internet. No começo eu chamava o blog de StatSite E aí depois eu fui adotar o nome Universidade dos Dados, aí eu comecei a produzir conteúdo, aí fui pro Instagram, aí no Instagram você cria proximidade com a galera, né O pessoal troca ideia na DM e tudo mais.

Speaker 2:

E aí, quando você começou a produzir conteúdo, você falou que foi na época do HSB E por quê O que?

Speaker 3:

surgiu. Ah, vou produzir conteúdo. Esse é um gatilho interessante, né?

Speaker 4:

É, eu fui lá em 2016,. eu acho Nossa então faz Nessa de produção de conteúdo de dados. eu me sinto orgulhoso que eu acho que eu sou um dos pioneiros ali. Sensacional, cara, e principalmente conteúdo técnico, porque a galera que é muito técnica, muito boa matematicamente, eles já estão ganhando muito bem no mercado. eles não querem compartilhar.

Speaker 3:

Achar assim vamos lá bem, no mercado. eles não querem compartilhar. É Galera que quer compartilhar, ó, quem não produz conteúdo. galera não tem ideia de quão complexo e difícil é Então assim. e a galera faz isso de forma de doação pra galera que quer, porque você tá começando ali, porque você tá doando um monte de conteúdo, conhecimento seu para outra pessoa. É um ato muito foda que a galera às vezes não entende, tanto que isso é difícil entende então realmente é difícil achar pessoas que querem fazer isso, mesmo que você quiser rentabilizar isso até você conseguir ter uma relevância pra fazer.

Speaker 2:

Isso é um trabalho muito árduo, principalmente algo nichado, algo muito técnico, e aí você sempre percebe que quem quem continua fazendo conteúdo por muito tempo é o cara que faz porque gosta, não por.

Speaker 1:

Tô com uma ideia fantástica Eu vou fazer aqui uma rede. Eu vou monetizar pra todo mundo que ama a matemática, entendeu.

Speaker 2:

Todo o público que ama a matemática. Boa velho As três pessoas, Três seguidores.

Speaker 3:

Nessa sala de produção. Aqui acho que só é você que vai conversar Até um comentário interessante.

Speaker 4:

assim eu sou analista de sistemas e eu tenho paixão por algoritmo, mas não sou um cara apaixonado por matemática, não é cálculo é estruturação de raciocínio mas aí eu acho que entra também um pouco na distinção do algoritmo que a gente entende em Data Science e o algoritmo do cara da ciência da computação, programador de sistemas, que geralmente é aquelas árvores binárias. Esses algoritmos aí que são usados muito pensando na lógica, numa outra estrutura, numa arquitetura, e a gente em Machine Learning a gente pensa muito em algoritmo, né Como a máquina, aprendendo que é essencialmente uma fórmula matemática. Assim Uma fórmula matemática pode ficar bastante complexa, mas é matemática, ali Parte de. Normalmente eu sempre costumo falar pros meus alunos que ó, não precisa se assustar, machine learning é matriz, matriz você já viu no colégio, você vai só avançar um pouquinho e é isso. Então, assim a gente acaba entrando um pouco nesse mundo desses algoritmos, aqui na parte de dados. E quando eu tinha começado assim essa parte matemática de machine learning e tudo mais, pouca gente falava, porque os caras que falavam eles estavam no mestrado, no doutorado, eles estavam.

Speaker 3:

Eu não tinha tempo. Quem faz mestrado gente?

Speaker 4:

toma tempo pra caralho, é estuga demais não é fácil produzir conteúdo é toma tempo pra caralho é seu sábado, seu domingo, seu final de semana e assim por diante e é pra você e quando é um conteúdo muito técnico que você vai checar lá várias vezes, será que eu não tô falando nenhuma besteira mais avançada.

Speaker 3:

Eu falei assim, uma frase básica, uma das frases. Mais se o João, meu filho, estivesse aqui, né Ele é mais lendário do que o Anderson. Uma vez ele estava num acal com o Anderson, ele estava em vovó no carro e eu simplesmente cheguei pro Anderson e falei assim puta que pariu Mr Anderson matemática básica e fala a mesma coisa pra gente, a gente já percebe que o Anderson não é bom em matemática.

Speaker 1:

Não, mas não é isso.

Speaker 3:

Era uma temática básica, eu falando pra ele fazer porque eu tava dirigindo. ele falou pô, faz isso assim na calculadora e o cara tipo assim travando O que acontece é o seguinte até a forma como o meu cérebro funciona.

Speaker 1:

Isso eu percebi bem por causa da Laura inclusive. Eu e a Laura fizemos teste de QI os dois juntos E nós dois alcançamos o mesmo nível de resultado. E quando a gente começou a discutir sobre o teste, a forma como eu desenvolvo os cálculos e tudo mais é completamente visual. Pra mim um cálculo é um pedacinho de negócio que junta com outro pedacinho que forma um objeto. Então assim eu calculo área visualmente é tudo desse jeito E ela é tudo números. E assim a minha cabeça não funciona em números, funciona em imagens, nitidamente a gente percebe isso no dia a dia E aí assim começa a falar número, número.

Speaker 1:

Eu preciso transformar isso pra minha linguagem de imagem e às vezes eu chego nos resultados que ninguém entende onde é que eu tô querendo chegar, mas opa beleza, encontro a terceira explicação disso.

Speaker 4:

Então mas isso também era uma parada que eu achava foda de fazer conteúdo na internet, que meio que na internet vão ter vários tipos de professores e você se adapta a algum deles, então isso é uma coisa que eu acho muito, muito da hora.

Speaker 3:

Hoje em dia, Cada um tem a sua maneira de aprender Exato exato.

Speaker 4:

Tem livro que o pessoal na matemática ama, que é o de cálculo lá do Guido Orizzi, que eu não me adaptei de jeito nenhum. Eu achava esquisito o jeito que ele abordava. Eu fui pra outro livro na época. Então na internet eu acho que tem essa possibilidade também. E como eu gostava muito de dar aula, eu vou tentar explicar jeito didático. E eu não tenho muito essa amarra do cara do mestrado doutorado, que é aquela coisa de seguir certinho o livro e tem que ter tudo.

Speaker 4:

Putz, eu, pra simplificar, eu simplificava mesmo. Ó, é basicamente isso que nem quando eu falei aqui ah, machine learning é uma atriz e vai desenvolver um pouco melhor isso, então eu curtia muito dar aula, então eu curti produzir conteúdo. E aí foi crescendo lá pra 2020, 2021, já tinha uma galera seguindo pedindo pra ah, você dá mentoria, você dá consultoria, você tem curso, e eu, putz, não tenho, eu não via muito motivo pra fazer algo assim, porque eu não, eu não tinha ainda nada de muito incrível na cabeça de novo. E aí que quando eu pensei no clube de assinaturas, que foi quando a universidade do Zado começou a virar mais empresa mesmo, mais escola e não só produção de conteúdo, foi porque eu falei tá, eu vou fazer um negócio diferente aqui. Então vou criar aqui uma comunidade um pouco mais informal. Vou também adicionar conteúdos que são mais avançados, porque hoje o mais fácil é eu entregar ali só o básico rapidinho pro alunouno, pra ele se sentir pronto, encher ele de certificado e falar tá aí, ó, você tá pronto nosso curso é aceitado, mas aí a hora que for pra vida real não é bem assim né exato.

Speaker 4:

E aí eu queria putz criar algo novo, mesmo, tanto que a nossa comunidade no Discord ela é muito ativa. Eu tô lá sempre, sério, cara correria, assim eu passo lá pelo menos 20 minutinhos todo dia, que seja pra falar de anime com a galera de musculação qualquer coisa que o pessoal consuma lá, porque eu quero trocar ideia e eu quero ter essa proximidade com os alunos, e aí então meio que nasceu assim a Universidade dos Dados, de certa forma.

Speaker 3:

O que que é? Vamos lá a galera. Você falou Clube Usinatum, a galera tá curiosa O que é. Explica pra gente o que é a Universidade dos Dados.

Speaker 4:

Cara A galera tá curiosíssima aqui agora A Universidade dos Dados. ela é basicamente uma escola de dados mesmo.

Speaker 3:

Desruptível completamente A gente começou ali.

Speaker 4:

Eu comecei como produção de conteúdo sozinho E aí eu falei não, eu vou criar um curso aqui que é o Clube de Assinaturas, que é uma plataforma de ensino como todas que existem aí Alura, cursera e tudo mais, só que é um preço bem acessível. Quando eu lancei, dois anos atrás, era R$23,90, tipo ninguém cobrava isso. Era sempre muito mais, tanto que o pessoal que tem outras escolas e troca ideia comigo fala cara, isso é um absurdo, você tem que cobrar pelo menos R$997,00, que é um.

Speaker 1:

Não sei de onde saiu esse número, mas todo infoprodutor gosta, yukio, yukio, tu tá killing o mercado, entendeu, tu tá quebrando os caras. 1997 é um número. A concorrência vai se parar, irmão.

Speaker 3:

Ontem eu tava definindo um negócio. Eu falei 1999, aí alguém de março falou 1997.

Speaker 1:

Eu falei é 1997. Você lembra ontem né? Ah, não É verdade.

Speaker 2:

Você falou não sei porque eu também não, o pessoal coloca esse valor onde a gente definiu algo em 1997 tem um porquê, então a gente tem que mudar. Em 1996 tem um porquê.

Speaker 1:

Mas não vamos discutir isso agora. Não, eu quero discutir uma outra parada que você falou que assim machine learning é matriz. E aí eu tô, minha cabeça, eu falei caraca, peraí, machine learning é matriz e. E até uma parte da lógica eu consigo ir. O resto eu vou pedir você completar o raciocínio, porque eu não sei o que vem depois disso. Vamos lá, eu pego lá uma matriz mil por dez. Eu vou ter mil amostras, mil linhas e dez variáveis dez colunas, que são as variáveis.

Speaker 2:

Certo, tá, mas e aí como é que eu conecto isso com o machine?

Speaker 1:

learning e 10 variáveis, 10 colunas, que são as variáveis? Certo, tá, mas e aí, como é que eu conecto isso com o Machine Learning? Até aqui eu fui A matriz.

Speaker 3:

Você entendeu. A matriz é legal. Você sabe que você falou isso. Ele teve que processar essa informação. Faz uns 4 minutos que você falou isso Ele tava processando, desenhando, vamos responder essa e voltamos pra Universidade de Dados. É porque você tava processando essa. Eu buguei pelo seguinte. Claro que você bugou, é matemática. Sabe qual foi a minha pergunta na?

Speaker 1:

verdade O que eu quero saber, vou te contar o que eu quero saber.

Speaker 3:

Não, não deixa eu responder.

Speaker 1:

Eu comecei a me questionar se nessas linhas não dá pra colocar outras matrizes, pra amostra ser uma matriz. E aí você começa a botar uma coisa dentro da outra, e aí você cabe. Vamos deixar ele explicar.

Speaker 2:

Vamos lá o que eu tava aqui, eu já não tava entendendo muito. Agora você já matou o resto, mas entendeu.

Speaker 4:

A minha dúvida.

Speaker 3:

Eu não entrei por ali, mas é onde minha cabeça tá agora.

Speaker 4:

Preocupa, não as dúvidas. A gente vaie É porque lembra que quando você vê matriz você tá. Não, quando você vê matriz é que quando a gente vê no colégio é meio jogado, mas matriz serve pra resolver sistemas lineares. Então, pensando no modelo mais simples que nem você falou, as colunas são as features, as linhas são a amostra, então são os seus clientes e ali vai ter uma última coluna com o resultado esperado, ali né, porque o que que é machine learning É você olhar pros dados e tentar entender o comportamento daquilo. Por exemplo, pega um banco, imagina que o banco não tem nada de machine learning E ele dá empréstimo a rodo, ali pro pessoal. Alguns pagam, outros não pagam. O que que o modelo, o que que a máquina vai fazer, ela vai olhar pra esse histórico e falar tá, deixa eu tentar entender aqui qual que é o perfil de quem paga e qual que é o perfil de quem não paga. Você pode pensar isso de um jeito bem simples, tipo ah, tem idade, aí A média de quem paga é de 40 anos, a média de quem não paga é de 25. Opa, então parece que a idade quanto mais velho, maior a chance dele pagar. Ah, qual que é a profissão dele? Ah, certa profissão aqui tem um percentual de 80% de pagadores e a profissão B tem um percentual de 30% Opa.

Speaker 4:

Então parece que a profissão, a primeira profissão, aí é mais propensa a pagar. Só que aí, óbvio que a máquina vai tentar resolver esse sistema e aí vai conseguir a solução exata, ali de quanto cada variável vai pesar no resultado final, mas ali de quanto cada variável vai pesar no resultado final. Mas essencialmente machine learning é isso, é você olhar pro passado e falar olha, eu quero que você entenda como eu chego, eu quero que você entenda aqui a variável alvo que seria pagar ou não pagar, a partir dessas features, dessas variáveis, e aí você vai resolver esse sistema. Então essencialmente é isso, é assim que funciona machine learning e é por isso que é um negócio que quando surgiu criou tanto hype em cima, porque pô, se eu consigo prever algum evento, eu posso me antecipar e fazer alguma coisa.

Speaker 1:

Aí é o seguinte machine learning, por exemplo na linguagem vai funcionar mais ou menos da mesma forma, porque assim eu começo a pegar uma palavra que começa com A e termina com R. Normalmente o que tem no meio é tal coisa, né Ele vê a possibilidade daquilo. Então, assim, quando você tem uma construção de uma frase, ele começa a ver estatisticamente essa frase aqui começou desse jeito e vai terminar daquele jeito. Né, é assim que ele vai fazendo predição das paradas.

Speaker 4:

Assim que o GPT funciona, o chat GPT funciona, ele está, é assim que ele vai fazendo predição das paradas. Assim que o GPT funciona, o chat GPT funciona, ele tá também prevendo a próxima palavra. Por isso que também geralmente o pessoal da área mesmo já não A gente é até empolgado com as novidades porque as coisas avançam muito rápido, mas a gente não tem esse mesmo hype talvez da galera assim, de uma pessoa Do povão assim.

Speaker 3:

Do padrão, né O cidadão médio ali.

Speaker 4:

Porque a gente sabe que não é, que é uma máquina ali, que ela tá pensando que ela vai realmente entender algo. Ela tá É quase que uma máquina de formar frases que fazem sentido, tanto que eu postei esses dias eu A geração Z tem usado muito o chat GPT pra tomar decisões na vida, usado como psicólogo e tudo mais, e eu até postei zoando olha que interessante pegar uma máquina que aprendeu a criar frases e usar ela pra algo totalmente subjetivo e muito sensível que é ser um psicólogo, um tomador de decisões da vida. Então, mas assim o machine learning e aí os LLMs, os modelos aí que estão surgindo, essencialmente são isso, estão olhando pro passado, olhando padrões. Beleza, entendi esse padrão. A partir disso eu consigo antecipar. Então o banco ele enxergou que certos clientes são mais arriscados. Então ou ele vai cobrar juros mais alto, ou ele vai ter uma cobrança mais incisiva, ou ele vai te negar o crédito ou vai te negar o crédito.

Speaker 1:

Acho, bacana isso pro profissional, profissional de tecnologia que tá lá. Ter esse entendimento de como a coisa é formada é como um cozinheiro saber pra que serve pimenta. Entendeu Exato. Você conhece os ingredientes e você começa a fazer a composição que faz sentido né Exato.

Speaker 4:

E é por isso que eu abordava tanto a questão matemática porque, como a área foi inflando e virando uma área da moda, como o Dev já foi, e como várias outras.

Speaker 1:

Desculpa matemática não é área da moda, não né.

Speaker 4:

Não, não, mas dados explodiram em todo o mundo.

Speaker 3:

Dados dados e ah machine learning é tal hype assim todo mundo quer. Agora não é algo tão simples, até porque envolve uma série de conhecimento que nem você tá aprovando aí E aí. pra simplificar a gente, voltar no Clube de Estatuto, que é algo completamente disruptivo que você explicou, que é mais ou menos como os outros mas eu li um pouco no website e achei um pouco diferente Conta pra mim aí. Como é que tem pô inventoria, tem algumas outras coisas nesse clube tem planos mensais anuais Então anuais.

Speaker 3:

Então, assim me explica como é que você formou esse produto realmente cara?

Speaker 4:

Quando começou era quase que uma newsletter paga, só que eu ia fornecer ali uns conteúdos diferenciados pra galera que era ó, eu vou te ensinar aqui algumas coisas, porque o que acontece também a área explodiu muito e aí a gente aprende muito pela internet. Hoje, só que se alguém postar algo errado, uma meia dúzia de pessoas na internet. Hoje, só que se alguém postar algo errado, uma meia dúzia de pessoas, esse erro também se propaga.

Speaker 3:

E propaga mais rápido, porque a galera gosta mais de criticar do que de. É simples, entendeu? Você quer viralizar, quer ser posto na coisa errada.

Speaker 4:

Exato. E aí começou muitos erros começaram a se tornar verdade na área e aí eu também comecei ó tá, esse clube aqui vou soltar newsletters aí pra galera, materiais que eu vou corrigir esses erros, vou dar conteúdos diferentes. Um conteúdo que eu sempre menciono pra galera é, por exemplo o pessoal fala muito a correlação, não é causalidade. Analistas de dados, cientistas de dados adoram essa frase, mas aí você pergunta pro cara tá, e o que é causalidade? Como que você obtém isso? Aí a galera não sabe. Aí eu falei ah, eu vou ensinar isso também porque eu aprendi no mestrado, foi uma área que eu me especializei. Então a ideia era ser algo diferenciado e também acessível, bem barato ali pra todo mundo conseguir pagar.

Speaker 3:

E assim é muito acessível, cara, assim é impressionante pelo que tá incluso que tem pô encontros mensais, acesso à comunidade. Nós estamos falando aqui de plano mensal. Vou fazer um jabá aqui porque é foda R$39,90 o anual R$12,35,15,. Cara O negócio, assim é realmente muito acessível pelo conteúdo que você tá oferecendo.

Speaker 4:

É, foi uma coisa que ajudou até a impulsionar, porque a galera quando vê né pô cobra tão barato por tudo isso. daqui a galera mesmo divulga né Vira aquela empresa que é querida por quem consome e tudo mais. Isso é uma coisa que a gente sempre prezou. Eu tento manter uma estrutura ali o mais enxuta possível. Então começou comigo. só primeiro ano Você era o eu empresa ali, é exato Aí. depois eu tive uma sócia minoritária aí que tá ajudando na parte CRM, contato com os alunos e algumas burocracias E eventualmente também contrato professores, porque eu não sei todos os assuntos também.

Speaker 2:

Entendi, você precisa de apoio pra deixar o conteúdo mais plural.

Speaker 3:

Entendi Bacana, cara Sensacional, e assim esse hoje é o seu Passou lá e tal Esse hoje é o seu passou lá e tal esse hoje é o seu full job. É a Universidade dos Dados ou você ainda mantém paralelamente alguma coisa?

Speaker 4:

como é que é, eu mantenho algumas coisas. Assim eu meio que saí do mercado de certa forma pra ser autônomo, pra trabalhar por conta, porque eu queria me dedicar 100% à Universidade dos Dados. Só que aí da consultoria que eu ia sair, ele já pô, mas pelo menos faz X horas aqui por semana pra ajudar, não deixasse sair completamente.

Speaker 3:

Não sai, não sai só um pouquinho, né cara, fica aqui um pouquinho, por favor.

Speaker 4:

Aí a gente fez um contrato lá. Aí aparecem amigos às vezes com pô tem essa oportunidade nessa consultoria, eu putz. então tá, vamos fazer porque parece um projeto legal. Universidade dos Dados eu também dou algumas consultorias, também tô fazendo atuando agora criando agentes de ar, essas soluções com IAP, que também vi uma oportunidade, gostei, gosto da área. Então assim o que mais consome meu tempo é a Universidade dos Dados é de 50%, 70% do meu tempo, mas eu vou me empenhar em um monte de projeto que eu gosto E vamos lá.

Speaker 3:

Você falou um pouco da relação de dados, da moda né Taga E tem muita glamorização realmente assim, do cientista de dados, né Do analista ali de dados. E o que realmente o mercado quando abre essas vagas, a vaga do momento dados machine learning está pra caramba Porque o pessoal entendeu que sem as informações corretas você tá realmente adivinhando ali as coisas e não tá indo pro caminho certo, né, e aí o profissional falta.

Speaker 3:

Não tem esse profissional, ele tá aglomerizado, tá lá em cima. Mas o que é que o mercado espera? Porque às vezes o cara realmente e aí é um diferencial que você pode explicar o cara chega lá e acha que fez lá, comprou um curso lá no YouTube, ouviu uma coisa, fala ah, eles querem especializar, tirar a certificação, e chega lá no mercado, não é isso que ele quer na prática, né Colocar na realidade. Como é que funciona o mercado Tá?

Speaker 4:

eu sempre resumo pros meus alunos mentorados assim essencialmente o cara quer que você pegue dados, use pra trazer retorno pra ele De algum jeito. Se vai ser com modelo, se vai ser com inferência, se vai ser com estatística, se vai ser com gráfico, você precisa fazer isso. Então eu sempre falo pro aluno primeira coisa que tudo que você vai aprender aqui de ferramenta de conhecimento técnico é pra gerar resultado. Então você tem que saber por que você tá fazendo aquilo, você tem que saber aonde que isso vai, o que vai impactar, o que vai trazer de resultado. Então, essa atenção ao negócio, eu acho que é algo que tem faltado um pouco. E é curioso porque a parte técnica também está um pouco mais carente do que anos atrás, porque o mercado de tecnologia é sempre assim, né, desde a primeira bolha lá de 2001,. É, ah, estoura uma bolha, todo mundo tira dinheiro. De repente todo mundo começa a jogar dinheiro pras empresas. As empresas contratam ao rodo, independente do critério, aí depois estoura outra bolha e volta, aí vai sempre indo assim.

Speaker 3:

Eu acho que é É normal, é seasonal, é bem cíclico, né É cíclico.

Speaker 2:

E é previsível inclusive.

Speaker 3:

Exato, Inclusive a Machine Learning. Ia aí que a gente ia conseguir prever talvez quando acontece Exato.

Speaker 4:

E aí eu acho que agora, como passou essa, veio essa onda de vamos contratar tudo que tiver aí, não importa, vamos baixar a régua. Agora tá fazendo muita falta o profissional mais técnico. Não que de novo o negócio vem em primeiro lugar. Mas esse discurso de o negócio vem em primeiro lugar às vezes ele não é acompanhado por você. Precisa entender a questão técnica também. Então um cara que sabe lidar com ferramentas também acaba sendo importante, porque hoje a gente aprende de forma muito superficial, o pessoal aprende de uma forma muito passiva, talvez pelo que a gente tem de tecnologia, não sei, mas acho que o perfil do estudante eu atuo aí com educação desde pelo menos 2008 eu acho que mudou muito e talvez até por a gente não ter que correr atrás, que nem antes que nossa consulta a Barça, consulta isso, aquilo vai fuçando até achar a informação.

Speaker 4:

Então esse profissional também que é curioso, proativo e que vai aprender o que for preciso da questão técnica, ele também está muito em falta. Então eu acho que você precisa precisar juntar tanto aquele cara que tem um comportamental muito bom, que tem comunicativo e foca ali no resultado, quanto o cara que vai correr atrás e vai aprender E não dá para dizer que tipo você pode ser só um e não ser o outro. Acho que no mercado de dados é impossível assim, porque cara só o que você vai falar de gente. Para descobrir onde estão as informações você já tem que ser um pouco mais desenrolado.

Speaker 3:

Sim, porque senão não adianta né cara, e às vezes, se você não conseguir ser desenrolado, você não vai atingir o objetivo do negócio né. E aí talvez em meio da próxima pergunta, por que muitas vezes muita empresa ainda vai lá, contrata um profissional de dados, tá cheio de gráfico, mas na hora de tomar decisão ainda não toma baseada em dados ou seja não é data-driven.

Speaker 4:

Isso é uma questão que eu reflito bastante. Eu vivo viajando nisso de pô.

Speaker 3:

Tem que ficar mais deitadinho aqui e tal Tá cheio de dashboard lindão. mas na hora que tomar decisão Exato. Não importa, você faz tudo que é planilha, mas na hora é a planilha do chefe que importa e a decisão é dele. e pronto, Exato. Você lá, meu caro, eu vou pra cá. Não dá pra entender.

Speaker 4:

Eu acho que a galera subestima um pouco a força dos dados, o poder dos dados. Né, você vê, cara, sei lá, eu gosto muito de academia, treinar musculação, apesar de não parecer, eu gosto pra caramba. E uma coisa você vê, assim a galera não se convence com estudo científico. Ah, mas isso não importa, porque lá na hora é outra coisa. Ou então, ah, não, mas cada um, cada um Sendo que na verdade não O ser humano, tem um comportamento médio, ali pelo menos que dá pra você estimar, e aí a galera não confia. Pode ter um estudo que mostra que, ó, esse exercício vai hipertrofiar muito mais do que esse outro. E pro cara não. Então acho que a galera tem um pouco de dificuldade de entender que Mindset realmente, alice, eu acho.

Speaker 4:

É, eu acho que a mentalidade da galera meio que não É muito difícil assim, tanto que eu fico maluco quando eu vejo alguém de dados falando tipo assim ah não, mas porque a experiência vale mais do que qualquer coisa. Ou você, às vezes você não precisa de dados, você fez aquilo várias vezes, só que não a experiência, ela. Você não consegue às vezes dar a atenção certa pra todas as variáveis, às vezes você tem um viés de olhar mais pra um lugar do que pro outro, sem controle nenhum.

Speaker 3:

É muito difícil de você, realmente saber E pode ser emocional, a experiência sempre pode ser emocional, exato também.

Speaker 4:

Tem muita coisa impactando. Tem vários livros de da área de dados, tem o andar do bêbado, o free economics, que eles mostram É excelente, é um dos meus favoritos E você vê que, como que a gente não consegue, a gente não tem um raciocínio muito analítico, mesmo assim estatístico, a gente foca muito.

Speaker 1:

Ah, eu tiro aí o próprio exemplo que você deu lá, que as pessoas tendem a fazer correlação, e isso não quer dizer as pessoas tendem a fazer correlação e isso não quer dizer que a causalidade seja aquela, entendeu?

Speaker 3:

Exato. Eu tenho uma história ótima disso.

Speaker 1:

Estava até num podcast que a gente gravou aqui. Tinha uma rede que todo dia, seis horas da tarde, ela parava E assim parava, um pouco, daqui a pouco voltava Os caras. Assim, caraca, Tentaram fazer um bilhão de correlações com um monte de coisa pra achar Qual era o motivo daquilo. E não achava, Até que chegou o ponto que a pessoa sentou lá e ficou olhando pro roteador. Agora eu vou descobrir o que tá acontecendo. Seis da tarde vai parar esse negócio.

Speaker 3:

Essa merda vai tá aqui.

Speaker 1:

Chegou a doninha da limpeza, puxou a tomada, ligou o aspirador de pó terminou. E assim nunca consegui fazer a correlação, porque?

Speaker 3:

não tinha dado suficiente para isso. Não era uma variável presente Exato.

Speaker 2:

Ei, você aí já se inscreveu no nosso canal, já ativou o sininho das notificações E aquele comentário E as nossas redes sociais. Você já seguiu a dos apoiadores da CES Pro, da CES Cyber Bora lá. Tá tudo aqui na descrição.

Speaker 4:

Eu vi um dia desses um post de um menino comparando as estatísticas do Ronaldinho Gaúcho, quando ganhou lá a bola de ouro, com algum outro jogador de mediano, pra bom lá da Europa eu esqueci quem que era E ele falava olha, olha aqui os dados, o Ronaldinho Gaúcho tem seis gols, só teve seis gols. Esse cara fez sei lá vinte e poucos. Ele teve o Ronaldinho Gaúcho teve cinco assistências, esse cara teve aqui quinze. E tá vendo como o futebol de antigamente era fácil e ele não era tudo isso. Então aí também entra no outro Você olhou pra duas variáveis ali. Você não olhou sei lá quantas vezes a bola passou pelo Ronaldinho Gaúcho, quantas vezes ele tirou o time de algum sufoco ali, porque ele era mais driblador, resolvia sozinho. Então tem uma série de coisas que acontecem também assim, do uso dos dados que a galera Ignorou uma coisa importante que futebol não é número, é entretenimento.

Speaker 1:

Você vê o Ronaldinho jogando, o coração dispara, o cara emociona a plateia Também.

Speaker 4:

Isso tem um outro impacto também no clube, na motivação dos jogadores. Então normalmente não é que assim certas coisas não são tão dos dados né Você vê muito jornalista esportivo falando ah, mas futebol não é número, não é número. O problema é quais números vocês vão olhar.

Speaker 1:

Se eu olhar dois, assistência e gols, Dá pra converter tudo em número no fim do dia. Né Tá aí o machine learning pra provar isso.

Speaker 2:

É. E assim, pra quais dados eu tô olhando? Se eu olhar só pra dois dados, não necessariamente eu vou tá tendo. Eu vou tá fazendo uma comparação justa, porque existem N outras variáveis que impactam também na própria geração desses dois números e que nem ele comentou. Porra, quantas vezes ele tirou o time de um sufoco, quantas vezes ele puxou 3 ou 4 marcadores pra próximo dele e isso dificultou a quantidade de gols que ele marcou, mas no final das contas ele era um jogador melhor por causa disso.

Speaker 1:

E nem sempre a gente vai estar com os dados ali pra executar a análise.

Speaker 2:

No fim do dia nem tudo é fácil de quantificar também.

Speaker 1:

Né Assim, por exemplo, quando você vai construir processos, por exemplo, às vezes tem coisas que a gente faz no dia a dia que você não consegue converter aquilo em número facilmente e depois pô, como é que eu transformo isso num processo pra que ele seja reproduzido? né, e assim essa interpretação, essa atividade, toda a gente sabe que tudo fica melhor com matemática, tudo funciona melhor com matemática. Né você tem ali, sei lá, você pega um. Eu lembro que eu vi esse exemplo uma vez. Eu adorei que era um batom a pessoa vai e passa um batom e ele não tem uma aderência muito boa contra outra marca que passa e pô ele adere e tal Aí o cara falou assim sabe qual é a diferença de um para o outro? Matemática? Alguém fez os cálculos mais avançados, conseguiu sabe colocar uma aderência maior e aí entra para todo mundo. Então, assim está tudo ligado de alguma forma. Né, e esse profissional você tem ajudado ali. O que você tem de história dessa galera Onde é que eles estão se metendo, isso é uma boa pergunta Legal.

Speaker 4:

Eu acho que uma parada que é legal de falar, porque sempre tem aquela ideia de que o cara vai trabalhar com dados, ele tem que vir das exatas E isso não é mais realidade.

Speaker 3:

Isso é muito bom, muito bom mesmo que a galera tá lá. Porra, eu odeio matemática. E aí Exato, vamos desmistificar isso, aí vamos tirar o coisa da o elefante da sala. Né.

Speaker 4:

Sim, eu acho que dá pra primeiro, que dá pra você vir de qualquer área. Eu tive um mentorado uma vez, que ele era mecânico antes, e aí a gente trabalhou ali no perfil dele portfólio, todas essas coisas. Ele entrou no mercado, assim Tem gente que Pô eu tive um aluno Ele era mecânico de automóvel.

Speaker 1:

Mesmo O cara era mecânico ou mecânico.

Speaker 4:

Não mecânico ou mecânico mesmo Caramba, cara, tanto que eu falava pra físico. O cara tem que ver a sua resiliência também, sabe Porque isso conta pro profissional. Então, primeira coisa, acho que dá pra você vir de qualquer área Essa galera. Hoje quem tá entrando no mercado mais recentemente tá indo muito pra parte de análise de dados, porque análise de dados hoje é diferente de 10 anos atrás. Quando eu comecei, antes a gente em análise de dados a gente olhava muito pra estatística, mesmo pra modelos, às vezes via modelo também, mas era um cara que era muito bom programador e muito bom em matemática. Hoje o analista de dados tá até tendo uma confusão ali, uma mescla com o BI que o cara. Ele é muito mais voltado pra visualização dashboards, essas coisas, que o cara é muito mais voltado para visualização dashboards, essas coisas.

Speaker 4:

Então, assim, se você souber entender os gráficos, entender ali como interpretar o que aquilo está te dizendo, você não precisa ser um mestre na estatística para entrar nessa área E você vira quase que um analista de negócios 2.0, porque você está ali no front, você está mexendo com o produto, o negócio todo o tempo, só que você tem ali um apoio dos dados, do que você conseguiu extrair de informação. Então acho que a galera está começando muito por essa área E muitos começam como analista para tentar migrar depois para a data science. Porque de novo machine learning?

Speaker 3:

Já que você falou dessa migração, é legal você explicar para, Porque tem ouvinte aí que talvez não vai saber a diferença. né Você explicou um pouco aí pra pessoal entender.

Speaker 4:

Legal Na área de dados a gente tem assim, tem vários cargos, mas os principais, assim que tem mais em abundância aí é engenheiro de dados, que é basicamente o cara que vai coletar os dados e tratar eles pra deixar eles minimamente preparados pro analista, pro cientista de dados. Aí depois esse cara que coleta e organiza e tudo mais, a gente vai pro analista de dados, que é o cara que vai gerar informações mais rápidas, gera um dashboard, algum indicador, faz alguma, tenta testar, faz um teste AB rapidinho ali alguma modificação do produto. Ele é esse cara e aí entra pro terceiro, ali que é o cientista de dados, que ele normalmente faz estudos mais robustos. Então ele vai fazer um modelo de machine learning que leva ali pelo menos umas duas semanas. Ele vai fazer um estudo de inferência causal pra entender se A causa B, mesmo que aí envolve um certo tipo de dado, um certo tipo de evento.

Speaker 4:

Então esse cara, ele acaba sendo dos três, o que mais usa matemática, o que mais vai ter trabalhos assim de médio, longo prazo. Então assim as três profissões estão bem, estão em alta. O engenheiro, ele vai ser cada vez mais exigido porque agora a gente tem, além dele, integrar ali o pipeline dele com os modelos, com os testes, ab. Ele vai ter ali agentes, vai ter LLMs vai ficar uma bagunça e esse cara vai ter que dar um jeito ali de organizar isso. O analista de dados como eu disse, ele é praticamente um analista de negócios 2.0, que ele vai estar em qualquer empresa. Qualquer empresa vai precisar desse cara.

Speaker 4:

Então ele vai estar ali o tempo todo ajudando um product manager, ajudando um gestor qualquer ali a fazer, a extrair algumas informações rápidas. E aí o cientista de dados, ele é um cara mais para o médio e longo prazo. Por isso tem empresas menores que não tem. Mas eu sempre falo que a galera às vezes, porque toda tecnologia vem que nem a mesmo, ah, vira um hype absurdo. Machine learning foi assim, né veio, virou um hype absurdo. Aí agora começa a onda contrária que é não, você nem precisa tanto de machine learning. Aí começam a subestimar. A gente sempre fica nisso superestima, subestima.

Speaker 2:

Ser humano, então tudo.

Speaker 4:

É os hypes, né A gente vê as ondas Ciclos.

Speaker 4:

E aí não tem esse equilíbrio. E aí hoje já tá num momento que o pessoal fica ah, mas acho que não precisaria tanto de machine learning, você não vai usar isso. Só que machine learning, os cientistas dados, por que ele ainda existe, por que que empresas grandes gastam tanto com esses caras E fortunas, né Fortunas é dos três, fica entre o engenheiro e o cientista. Quem ganha mais? assim, normalmente Esse cara, ele é dele que sai.

Speaker 4:

Aquelas aqueles cases absurdos de putz implementaram sei lá uma mudança X e trouxe 10 milhões de retorno, porque as mudanças que um modelo causa tem um impacto muito grande. Assim pega um modelo típico que toda empresa tem hoje em dia de churn quando o meu cliente vai cancelar a assinatura, se você sabe quando ele vai cancelar, que ele tá propenso a cancelar, você oferta um desconto, você retém o cara, você vai obter ali um valor ali pelos próximos meses que você reteve. Então geralmente tem impactos muito grandes. A Netflix fez isso né Com o modelo de recomendação, usou o modelo de recomendação Hoje. Eu lembro que uma época eles falavam que 90 e poucos por cento do que era visto era pela recomendação E eles conseguem prender a galera ali.

Speaker 3:

Eu, por exemplo, é um exemplo clássico. Eu sou muito preguiçoso, acho clássico eu sou muito preguiçoso com as coisas que eu vou assistir. Cara, eu chego lá porque eu não gosto de perder muito tempo. Se eu vou assistir trem, eu aperto o botão e eu confio no algoritmo. Se ele aparecer ali recomendado pra mim deve ser. Deve ser pra mim. Eu não vou ficar lá Se eu não sei o que eu vou assistir. Eu aperto o que eles recomendam e funciona, cara.

Speaker 2:

E às vezes você, fun Cara, sabe o que é o negócio. Se eu tiver que parar pra decidir o que eu vou assistir, eu vou gastar muito tempo Aí eu já tô puto comigo mesmo.

Speaker 3:

Eu valorizo o meu tempo. Vou fazer uns testes.

Speaker 2:

Eu vou tentar confiar no algoritmo Se eu gastei 20 minutos escolhendo o que eu ia assistir.

Speaker 3:

Eu já não quero mais assistir. Eu já perdi o meu tempo. Cara, eu lá emmo. Se alguém falou que é recomendado pra mim, é ele que entende.

Speaker 1:

A análise do algoritmo é a seguinte Não tem que ser bom nos primeiros cinco minutos, porque depois disso ele dorme.

Speaker 2:

Eu não durmo.

Speaker 3:

Inclusive ele sabe porque, tipo assim ele tem um dos algoritmos dele.

Speaker 1:

Você ainda tá aí. Que é isso aqui. Se tu chegou no você e ainda tá aí, é porque você já passou.

Speaker 3:

Exato mas aí ele já tá aprendendo. Como é que?

Speaker 2:

eu sou Não, mas eu faço isso com o banco. Por exemplo, Vou comprar alguma coisa Se o banco tá liberando dinheiro, se o banco quer o banco se escuta de dinheiro, os caras que têm de dinheiro te dão crédito pra que você vai usar, porque eu vou discutir com ele.

Speaker 3:

Eu uso esse mesmo conceito para uma outra coisa, exato Isso é muito mais produtivo, mais arriscado, mais arriscado seu. O meu arrisco assistiu a porcaria do Netflix, vamos lá Você falou um negócio legal.

Speaker 1:

Agora que é pô quanto ganha um cientista de dados? que é bastante, Dá um chute aí de salário, Só de exemplo exemplo Ó, um iniciante vai tirar ali entre chutando por baixo.

Speaker 4:

é que agora surge algumas empresas pequenas oferecendo mixaria, mas mixaria mesmo muito abaixo.

Speaker 1:

Mas na média.

Speaker 4:

Na média ali o cara vai tirar entre 4 e 5 mil. Se você começa numa empresa grande, eu não tenho certeza, mas eu acho que Itaú, bradesco, nubank pagam em torno de 6,. Já vi gente ganhando 6,500 de largada Iniciante ali.

Speaker 4:

Iniciante você já tá melhor do que 90% do país, sim, e ali em média deve tá na faixa de uns 9 mil, assim, tipo eu acho difícil um cara que tem um, entrou na área e tem ali um esforço mínimo, assim não vou dizer que Um bom profissional É um profissional médio, assim o cara que não vai talvez não seja o mais estudioso, mais dedicado, mas ele não é um cara desleixado. Eu acho difícil ele não tirar pelo menos 9 mil na área, assim, porque é muito fácil. Assim. Eu tenho pô teve um aluno que mandou mensagem esses dias, o Guilherme, acho que era o nome dele. Bom, ele também não vai saber, que O pessoal não vai saber, então eu posso falar os valores, é Guilherme.

Speaker 3:

Mas ele Arroba a data, tô brincando.

Speaker 4:

Ele conseguiu o primeiro emprego na área de dados. ele tinha entrado no clube de assinaturas. O clube tem há dois anos E ele tá ganhando hoje 11 mil.

Speaker 3:

Então assim Opa churrasco na casa do Guilherme.

Speaker 1:

Isso é uma coisa sobre um aluno, seu mecânico que foi pra dados e tal Pô. os seus cursos são altamente acessíveis.

Speaker 2:

A pessoa consegue um investimento baixo.

Speaker 1:

E é assim. Às vezes o cara tem um desejo de uma transição de carreira, se identifica com dados. Pode parecer que não, mas por exemplo o mecânico tem tudo a ver com a área de dados. Porque assim o mecânico tem tudo a ver com a área de dados? Porque assim o cara.

Speaker 2:

Eu estou tentando entender.

Speaker 1:

O mecânico, ele é um investigador, Ele é um Sherlock Holmes irmão. Chega lá o carro está dando A gente descobre quando tem aquele barulho, meu amigo.

Speaker 3:

Ele tem que descobrir por que aquele barulho. Tem que catalogar ali no tanto de conhecimento que ele tem. Descobre quando tem aquele barulho, meu amigo. Ele tem que descobrir por que é aquele barulho. Tem que catalogar ali, no tanto de conhecimento que ele tem, tudo aquilo que? é aquele barulho.

Speaker 1:

Ele tem que pegar por cento de mil causas e pegar e fazer o caminho reverso. Ele faz engenharia reversa, ele pega o dado que ele recebe é uma mixaria.

Speaker 1:

As vezes chega assim não tá ligando e essa informação normalmente é isso ou então tem barulho aonde não sei não tá ligando aí o cara te pergunta qual barulho vocês viram esse vídeo, também sensacional, e é um negócio que tem tudo a ver as vezes você tá pensando numa transição de carreira e você não percebe o quanto que a experiência que você tem numa coisa que aparentemente não tem nada a ver com o conhecimento da matemática e dos dados pode pô inconstruir o cara.

Speaker 3:

Aí, eu tenho que mudar já e falar uma outra questão, cara, que eu acho que acontece muito ainda. Eu não sei se vocês vão concordar, mas tem muita gente que não entende os fundamentos baixos de estatística, lógica, etc. E vai direto para soluções, vai direto ali mexer ali informagráfico etc. Mas não tem a menor ideia da lógica, de estatística, etc. E tá lá fazendo gráficos, montando painel, etc. Cara, esse negócio pode dar certo, pode dar ruim Por que você pensa nisso, porque pra minha opinião aquele cara ali a tendência de não funcionar tá muito grande.

Speaker 4:

É arriscado, embora eu já apliquei isso em alguns alunos. Mas por quê Muito? porque o cara sei lá, às vezes largou o emprego ou tá ganhando muito mal e quer entrar na área. Aí eu tava.

Speaker 3:

É uma gambi. Você aplicou pra ele fazer Cara. você vai fazer isso pra você aprender a gambi. É você trocou a ordem dos fatores. Vamos pra aqui, pra você já entrar no mercado, enquanto depois E a vaga tá ali, porque essa vaga sempre vai ter o construtor ali de imposto, etc.

Speaker 4:

Falei cara, pelo amor de Deus. Depois você volta nos fundamentos.

Speaker 1:

É o cara pô. Quero desesperadamente ser músico. Tá bom, aprende aqui faroeste caboclo, não pô? Aprende a tocar pandeiro Segura a atenção da galera. Um pouquinho entendeu.

Speaker 2:

Enquanto isso você vai estudando. É o cara do pandeiro.

Speaker 4:

Pandeiro é só o básico.

Speaker 4:

Porque a gente também não tem muitos profissionais júniors que vão chegar muito formados, assim Tem os caras que vêm de exato. Então tem uma base diferente. Mas é Se o cara consegue aprender a ferramenta ali pra pelo menos suprir o que o júnior vai fazer ali no dia a dia, e ele tiver forte vontade pra depois correr atrás. Eu sempre falo pra eles isso mano, depois você tem que correr atrás. Porque isso mano, depois você tem que correr atrás porque senão esse é justamente o profissional que o pessoal fica falando ah, a IA vai substituir a gente. Se substituir o primeiro vai ser esse cara que só tá fazendo mexendo ferramenta, apertando o botão. Então você tem que depois voltar pra base, estudar coisas, estudar lógica, estudar fundamentos matemáticos, álgebra e estatística essas coisas todas, mas eu às vezes faço esse caminho inverso muito pra colocar o aluno rápido e ó ele O cara ir lá e fazer auxiliar o cara Exato.

Speaker 3:

O cara está ajudando o cara na vida dele, também Sensacional, e o que o cara Aí tem que falar tem que. Outro tema extremamente polêmico, principalmente porque a IA tá aí, tá evoluindo todos os dias na velocidade, e eu tô na tecnologia há muito tempo. Nunca vi algo evoluir tão rápido né, porque todos os dias é um lançamento atrás do outro. Não para né. O que você vê você como da área realmente ali em cinco anos hoje, com a evolução das IAs, das tecnologias generativas que estamos aí no mercado, a questão do profissional de dados, do cientista de dados qual vai ser o papel nele nessa bagunça toda?

Speaker 4:

Legal. Eu acho que vai mudar um pouco, porque o cientista de dados eu não sei se todo mundo está familiarizado, mas ele tem ali três áreas de atuação que se combinam, que é a matemática, matemática, barra estatística, programação e negócios Ele é o cara que junta essas três coisas. Hoje é comum ter alguém que é muito matemática e muito negócio e pouco programação, ou muito programação, muito negócio mas pouco matemática. Isso é comum. Tem gente que vem da ciência da computação que às vezes tem uma propensão maior a entender mais de software, de certos fundamentos, e o cara da matemática que vai mais pros números.

Speaker 4:

Eu sempre fui esse cara dos números, mas eu acho que o futuro vai mudar e a gente vai começar a ter Esses três pesos não vão ser mais iguais. O peso da programação acho que vai vir muito, porque é o que eu falei, a gente vai começar a integrar muitos modelos diferentes, muitas arquiteturas misturadas ali, diferentes dependências, ali de programa A e B. Então o cara para orquestrar isso, saber como botar um modelo, por exemplo, de machine learning em produção e esse modelo funcionar direito, isso vai importar muito mais do que importa hoje.

Speaker 2:

O projeto vai ter que ter um resultado. Ele tem que conectar, fazer essas duas bases conversarem e tudo mais. Exato, vai acabar precisando também dessa parte mais robusta de tecnologia.

Speaker 4:

E até fundamento de engenharia de software, que às vezes a gente dá ciência de dados, a gente às vezes, principalmente quem vem da matemática, economia, estatística, às vezes a gente não dá tanta atenção Versionamento, né teste, nossa teste. É muito raro alguém que sai da matemática, da economia, da estatística saber colocar ali um teste no meio de um programa, não importa o quão robusto seja o sistema do cara, o código não vai estar modular, não vai usar orientação a objetos, não vai usar teste. Então acaba que a gente perdeu algumas das boas práticas, porque antigamente era não preciso de alguém que conheça esse modelo e faça ele rodar de algum jeito. Ali O resultado final era o que importava. É só que aí a coisa agora, quando vai integrar com muitas ferramentas, agentes de ar, os prompts que a galera vai colocar em cada agente, vai misturar muita coisa. Então a tendência é essa parte da engenharia ter cada vez mais peso. E aí eu acho que os cientistas da computação, a galera da programação vai decolar mais ainda, porque eu já sinto eles muito bem.

Speaker 4:

Hoje em dia Eu sempre falo com os meus colegas que são matemáticos, economistas também, que eu acho muito estranho como muita gente da engenharia e da ciência da computação se sai melhor do que um estatístico e um matemático E eu teria tudo para defender a minha classe. Falaram não, nós somos bons matemáticos, sei o quê. Mas eu vejo muito engenheiro e cientista da computação assim decolando porque eles se importam com algumas questões de software, se importam com algumas questões de arquitetura, e isso no dia a dia acaba fazendo muita diferença. Fora que é uma galera principalmente da engenharia que é muito assim, o cara é solucionador de problema, ele dá um jeito ali, ele vai caçar alguma coisa.

Speaker 4:

Eu não sei tem uma, uma característica ali, algumas soft skills diferentes. Nessa galera, eu sinto pelo menos, e eu acho que pro futuro, se os matemáticos estatísticos não mexerem um pouco nisso, pode ficar pra trás. Eu acho que pro cara muito, muito bom, sei lá PhD em matemática que tá fazendo pesquisa lá na Amazon, tudo bem, não vai importar, ele vai sempre ter oportunidade. Mas pros outros eu acho que é fundamental a gente começar a olhar mais pra só Então, nesse aí no futuro.

Speaker 3:

Cara, ainda a gente fala um pouco das empresas que tomam decisões ali por feeling, né. E na sua opinião hoje o que tem que fazer pra implementar culturas analíticas na empresa? A empresa realmente tomar a decisão baseada em dados e não no feeling do chefe?

Speaker 4:

ou no?

Speaker 3:

feeling do cara do RH ou no feeling de fulano, sem realmente pô os dados estão aqui e eu tô indo pra lá por quê? Eu vejo isso muito em qualquer lugar, cara, e assim não faz sentido pra mim. Eu sou um cara que gosto de ver os números e depois eu tomo a minha decisão. Não importa, sabe, me dá número. Nós discutimos sobre isso hoje.

Speaker 1:

Eu não quero nem saber cara.

Speaker 3:

Meu perfil é ideias, eu cara me dê, pra mim cara me dá número, Aí eu tomo uma decisão baseada nisso e qualquer coisa que tiver que fazer. E aí eu fico louco com alguém tomar. Ah, cara, eu acho que tipo assim, Acho que vai chover, Tipo assim acho que vai chover Você tem a porra da previsão do tempo.

Speaker 2:

Vamos olhar. Entendeu, Cara, depende Se vai que ele contratou o cacique e cobra coral O cacique e cobra coral.

Speaker 3:

Entendeu, vai fazer não, mas isso é um lance.

Speaker 2:

Um abraço. O Cassio e o Cobo Coral É uma instituição muito séria, ganha muito dinheiro Rock in Rio contrata.

Speaker 3:

ele sabe pra quê? Pra não chover no Rock in Rio.

Speaker 4:

É sério. Isso É muito sério. Eu juro por Deus. Curiosidade.

Speaker 1:

Eu achava que era sacanagem.

Speaker 3:

É sensacional E quer que eu te fale.

Speaker 4:

Sabe quem foi um dos fundadores? Paulo Coelho, que isso Juro por Deus. Eu tô falando isso, não é piada. A dança da não chuva.

Speaker 3:

E quer que eu te fale uma parada? Tipo assim Carnaval do Rio, rock in Rio.

Speaker 1:

Essas galeras contratam Campeonato de futebol.

Speaker 2:

Caralho velho, a hora Aí eu fui cara, eu fui no site velho E ele contou essa porra.

Speaker 3:

nós estávamos numa praia, cara, e ia chover. a previsão falava cadê o cacique que comeu a caralho, entendeu?

Speaker 2:

Vamos fazer uma vaquinha aqui. Caralho, a gente queria tanto É o índio que faz não chover A gente queria tanto que não chovesse, vez que eu tava quase acreditando, entendeu.

Speaker 1:

Vamos lá, vamos continuar.

Speaker 3:

Existe. isso É muito. Essa era a piada do negócio mas é um fato.

Speaker 4:

Eu vou procurar depois.

Speaker 3:

É um absurdo de ciência qualquer.

Speaker 4:

Não legal mas.

Speaker 1:

Respeita o cacique.

Speaker 2:

Eu não brinco não senão vai começar só a chover em cima da gente Dizendo o Google é uma organização esotérica que afirma controlar o clima. Que loucura Vamos deixar o link aqui na descrição.

Speaker 1:

E desafios de matemáticos aprovaram o contrário.

Speaker 3:

Como estatísticas, estatísticas Como é que é o nome da estatística, que a gente gosta de falar muito dentro do Jornal Nacional. Você recomenda muito dele.

Speaker 1:

O que era chamado.

Speaker 3:

É sempre.

Speaker 1:

O matemático Oswaldo Souza, o Oswaldo, o que era chamado o matemático Oswald Souza. Oswald Souza, um ídolo ali do.

Speaker 3:

Jornal Nacional. Sempre a opinião dele era importada. Né vamos lá de cultura, data-driven.

Speaker 4:

Eu acho que assim uma das primeiras coisas é você mostrar a importância daquilo mesmo, realmente mostrar que faz a diferença. Eu tinha uma atividade que eu dava em palestras, workshops, que era assim eu passava pra, eu mostrava foto de três personagens e falava pra quem você recomendaria sei lá, esse livro, acho que, de meditação e esse livro de economia. Aí o pessoal chutava ah, pra ele, pra ela, sei lá aleatório. Aí eu colocava alguma informação tipo idade, aí depois eu colocava renda, e aí o pessoal ia mudando as respostas Até que eu ia, por exemplo, sei lá, o último, sensacional, isso.

Speaker 4:

O último evento que ele fez né que ele participou. E aí putz o cara foi sei lá num congresso da Febraban, lá bancário, e outro foi sei lá num retiro. Aí o pessoal opa pera aí então pra esse do retiro. Então a ideia é ir mostrando quanto mais dados você tem quanto mais dados você tem, mais preciso fica a sua decisão.

Speaker 3:

Porque a primeira decisão? por quê? Porque eu acho que a cara dele combina com esse livro. Basicamente é isso, é a decisão do machismo. É o meu feeling.

Speaker 4:

E eu também colocava muitas das questões que a gente acreditava muito e que os dados vieram e mostraram que era o contrário. Sabe, tem um paper, é que hoje ele é mais polêmico.

Speaker 3:

Assim, porque de metodologia e tal Gostão de polêmica, vamos lá.

Speaker 4:

E o tema também é polêmico. Opa, gostamos das duas coisas, vamos lá E foi bom. acho que todo mundo sabe que Nova York era muito tinha alta criminalidade anos 70, 80, e lá pros anos 90 foi melhorando até esse momento comentavam nos jornais de por que que melhorou Aí o pessoal. ah, teve um policiamento ali um pouco mais rigoroso.

Speaker 3:

Mais constensivo vamos chamar.

Speaker 4:

Teve ali implementação de tecnologia e tudo mais, e assim. Matematicamente esse paper hoje é um pouco mais contestado, mas o que eles conseguiram provar é que a maior parte veio da legalização do aborto, porque aí famílias menos estruturadas acabam não tendo filho e aí acabava que diminuía.

Speaker 1:

Reduziu ao longo do tempo o caralho.

Speaker 4:

E deixando bem claro que não é sugerir usar a mão.

Speaker 3:

Isso é correlação e não dá pra provar que seja causalidade.

Speaker 4:

Na verdade dá Porque? qual? Porque eu não lembro muito desse paper?

Speaker 3:

porque ele faz muito tempo mas o que a gente faz, Eu já ia concordar com o paper, porque eu já Faz sentido mas Faz sentido, mas segura a sua concordância.

Speaker 1:

Faz sentido, mas não vamos sair por aí opinando né.

Speaker 2:

Vamos só ler o Conta mais sobre o paper Lembrando é o paper. Tá gente, não é a gente que tá falando isso não.

Speaker 4:

É uma informação. informações do paper Steven Levitt pra quem quiser ler.

Speaker 3:

depois Vamos deixar o link, deixa a produção link.

Speaker 4:

Eu inclusive quero ler esse paper É legal O que a gente faz na economia, quando a gente quer saber se uma política pública teve impacto ou não, por exemplo, vamos dizer ali polícia, né Se polícia realmente diminui significativamente o crime ou não. Quanto que um policial consegue adicionar um policial ao corpo consegue diminuir de criminalidade. Eu não posso chegar e falar eu vou botar a polícia nesses bairros, nesses outros não, e vou ver qual que é a diferença. Como se fosse um laboratório. Não pode, não seria eticamente correto.

Speaker 4:

Então o que a gente faz, a gente busca eventos que meio que simulam experimentos, assim, e aí óbvio que incluindo alguns controles. Mas o que aconteceu, por exemplo na Inglaterra acho que em Londres Teve um atentado terrorista lá E aí o que aconteceu, colocaram mais polícia, não tinha a ver com a criminalidade de roubo e qualquer outro tipo assalto, não, eles só colocaram porque teve um ataque terrorista. Isso é quase que um experimento controlado. É quase como se eu falasse olha, vou colocar polícia aqui, não vou colocar aqui, e vou ver qual que é o impacto. Então a gente aproveita de eventos que funcionam quase como um experimento ali, e aí, óbvio, adiciona alguns controles, uma certa rigidez estatística e a partir disso a gente consegue chegar à resposta de que A causa B?

Speaker 2:

Os eventos que já aconteceram ou que pra você conseguir.

Speaker 3:

E se olhar o paper, cara, se encaixam no seu padrão de pesquisa E se você olhar o paper assim, infelizmente, ou não pode, famílias que às vezes não deram atenção suficiente ali pra aquele filho e aí, etc. E pode causar um filho que não foi criado da forma mais correta e a marginalização acaba indo pro clima E ficar sem recursos, exato uma série de coisas.

Speaker 1:

Então assim entra a questão social. É um monte de coisas. Então faz sentido a estatística, O fim da história é assim se você fizer a matemática certinho, certinho, certinho, você vai concordar com o Thanos. Entendeu?

Speaker 3:

Não essa já complica, mas enfim É difícil. Sabe quando foi uma falha do Thanos, né Ele foi muito aleatório.

Speaker 2:

A justificativa do aleatório é a tentativa de ser justo e não é equilíbrio.

Speaker 1:

Mas sabe o que eu lembrei aqui, cara? Eu lembrei do filme Tropa de Elite, que tem uma cena engraçadíssima dos policiais arrastando o corpo de um bairro pro outro, porque aí ia contar na estatística do outro batalhão.

Speaker 3:

Ah, sim, mas isso é um fato. Né na estatística do outro batalhão. Ah sim, mas é isso, isso é um fato. Né É um morto, joga lá de lá. Joga lá de lá, e realmente é um fato. A polícia tem que contar. Todo mês tem que contar a estatística de crime de quem tem que reportar isso aí. Isso é um negócio louco, né? E realmente eles.

Speaker 4:

Ninguém quer até ficar com o número. Problema parecido. Quando eles começaram a remunerar professor com base na performance dos alunos? Aí, tem professor mostrando respostas pra aluno.

Speaker 3:

Não, isso é loucura. Isso é loucura loucura. Meu aluno é só 10, vai ver se é 10, meu salário é 10.

Speaker 1:

Vou dar um outro exemplo polêmico aqui. Imagina um governo passado desse mesmo presidente. Ele fez uma coisa muito engenhosa que é o seguinte quando vieram os programas de assistência, de assistencialismo, você tinha ali uma quantidade X de cidadão que tinha uma renda de um dólar por mês. Ele falou não peraí, deu a grana pros caras. Esses caras saíram da linha de pobreza e o gráfico ficou bonitão do dia pra noite. Ele resolveu o problema. Pronto, tá aí, saiu da linha da pobreza não sei quantos milhões.

Speaker 3:

Caraca esse cara já que é pra polemizar, é o seguinte vamos lá se é pra polemizar essa questão de gráficos e estatísticas, cara, é por isso que tem que tomar muito cuidado pra analisar a fonte. Qualquer estatística que você vê, em qualquer noticiário, em qualquer coisa, se você não tá vendo a fonte e entender a metodologia como foi feita, ela pode ser manipulada. Ela pode se levar pra O número pode te levar a tomar uma decisão errada. Quantas?

Speaker 2:

vezes a gente já não viu que o gráfico que mostra que o número menor tá maior no gráfico que o número maior e tal Não e não é isso, é porque, tipo assim, se o senhor não tem a amostragem? se não tem a fã, não sabe ali a origem. Aí é importância. Eu não sei a qualidade dos dados.

Speaker 3:

Cara, você não pode levar em consideração aquela estatística, então assim tem que tomar muito cuidado com dados também, isso que é legal da parte da ciência, porque na ciência se alguém solta um artigo e tá manipulado, isso já aconteceu bastante, tipo o cara solta, só que a galera vai lançando deles. Vai lançando, e aí é o lance. Só que aí vamos lá.

Speaker 1:

O cidadão médio às vezes e o noticiário se vai manipular, vai ter viés.

Speaker 3:

Aí já era em uma nova geração é complicado demais porque eu vi a estatística. Que estatística é essa baseada em que? qual é a fonte de dados? a pessoa que entende que os dados vêm de algum lugar e aquilo lá tem que ter uma qualidade, tipo de amostragem, uma série de coisas. Mostrar um gráfico pra mim sem eu ver, eles sabem tanto que eu sou crítico. Eu pego a planilha. Não apresenta tabela pra mim não.

Speaker 3:

Porque tabela é ir lá. E Cara, eu não quero ver a tabela, eu quero ver a planilha, eu quero ver o dado ali, eu quero ver da onde tá vindo aquilo ali.

Speaker 1:

Vou contar uma coisa interessante sobre isso, sobre a questão de manipulação de dados. Eu morei na Argentina por cinco anos E aí vez eu tava com um amigo lá, ele falou vou te ensinar uma coisa.

Speaker 3:

Aqui vamos comer no McDonald's. Hoje vou te ensinar uma parada.

Speaker 1:

Era brasileiro, esse amigo é, chegamos na fila do McDonald's. Ele falou assim acha o Big Mac aí no cardápio? eu olhei, pô não tinha Big Mac no cardápio. O hambúrguer mais barato custava 50 pesos, um hambúrguerzinho simples 50 pesos, um hamburguerzinho simples 50 pesos. E eu pô tá, ele vamos pedir um Big Mac, aí quero um Big Mac, aí pô 20 pesos. Ele não só não estava no cardápio, como ele era ridiculamente mais barato que tudo ele falou. Eis a questão o Big Mac ele é usado pra índices de de inflação. Não mentira que eles faziam Mac, ele é usado pra índices de inflação.

Speaker 3:

Não mentira que eles faziam isso lá Tô te falando. Ele é subsidiado porque o índice Big Mac é um índice global, Exatamente, E aí não tinha no cardápio e ele era muito mais barato.

Speaker 1:

Peronismo raiz, e ele era muito mais barato.

Speaker 3:

Caramba, velho Eu como era estudante lá na época passei o resto da vida direto Caramba, velho isso que eu chamo de manipulação Só pra me dar o índice Big.

Speaker 1:

Mac Tradicional na economia. Eu vivi isso, eu vi, comprei o Big Mac desse formato.

Speaker 3:

Então subsidiar o Big Mac é Nossa cara. Estamos chegando no nosso tempo aqui. Mr Anderson, eu acho que cara dá pra falar bastante tem muito papo.

Speaker 1:

É um assunto vasto, mas acho que abriu a cabeça da galera pra muita coisa. Acho que criamos boas oportunidades aqui. André you kill foi massa mas vou deixar contigo agora o microfone pras suas considerações finais cara.

Speaker 3:

Deixa a link abaixo um vida abraço pra mãe, pra pai, pro irmão. Isso o que você quiser, fica à vontade, amigo, vai lá, andrés.

Speaker 4:

Vou agradecer aí primeiro pelo convite. Pô, eu gosto demais de falar de dados. Eu sou o nerdola dos dados, cara, eu gosto muito assim. Eu leio paper de assuntos que não tem nada a ver com a minha vida, com machine learning, porque eu fico pirado assim nessas coisas. E aí, quem quiser conhecer o projeto na Universidade dos Dados, acessa ali universidadedosdadoscom Toda a sede, aí é arroba, universidadedosdados, você vai encontrar. E lá, mesmo se você não quiser assinar o clube, a gente tem conteúdo técnico gratuito, conteúdo bom.

Speaker 3:

Então acho que vocês vão gostar bastante Sensacional, galera, e olha só quiser conversar com ele. Os links, além do link da Universidade de Dallas, os links do LinkedIn do Equil, as redes sociais, vão estar todos aqui na descrição do episódio. Parabéns, equil, por essa iniciativa de realmente massificar um negócio que é tão complexo, né Entregar isso aí de uma forma. Eu vi aqui que tem mais de 1.400 alunos já pra você estar com certeza transformando a vida de muita gente também E alimentando um mercado que precisa cada vez mais analisar dados, tomar decisões analíticas e não no achismo. Obrigado demais, cara. O convite tá aberto aqui. Com certeza Vamos conversar outras vezes aí fazer um debate sobre informação da AdMastilani e, tendo alguma coisa pra contar pra gente, pode voltar. É isso aí, até mais.

Speaker 4:

Valeu, quero café, quero café.

People on this episode