Meu nome é Saullo Oliveira e atualmente sou um cientista de dados com doutorado em andamento no Laboratório de Bio-Informática e Computação Bio-Inspirada (LBiC), sob orientação do Prof. Dr. Fernando J. Von Zuben.
Minha pesquisa foca em modelar algoritmos para Multi-Task Learning que também estimam como as tarefas estão relacionadas, a partir de características comuns entre elas. Dessa maneira, podemos interpretar como as tarefas foram relacionadas pelo modelo enquanto melhoramos a performance de cada tarefa individualmente.
Meus interesses gerais de pesquisa abrangem:
- aprendizado multi-tarefa
- modelos esparsos
- otimização convexa
Formação
- Doutorado em Engenharia da Computação
2015 - Em andamento
Universidade Estadual de Campinas - UNICAMP
Faculdade de Engenharia Elétrica e de Computação - FEEC
Departamento de Engenharia de Computação e Automação Industrial - DCA
Laboratório de Bioinformática e Computação Bio-Inspirada - LBiC - Mestrado em Engenharia da Computação
2013 - 2015
Universidade Estadual de Campinas - UNICAMP
LBiC - DCA - FEEC - Graduação em Tecnologia de Bancos de Dados
2007 - 2009
Faculdade de Tecnologia de Indaiatuba - Fatec-ID
Habilidades
Linguagens de Programação
- Python
- SQL
- Bash
- R
APIs
- scikit-learn
- pandas
- Numpy
- TensorFlow
- Keras
- matplotlib
- seaborn
Outras
- Produtização de Sistemas de Machine Learning com Docker e Kubernetes
- Design e Arquiquetura de Bancos de Dados
- Governança de Dados
- Test Driven Development
- Profiling e Otimização de Código
Machine Learning
Domínio em técnicas como Least Squares e variantes (Ridge Regression), Lasso e variantes (Group Lasso, Fused Lasso, etc), Regressão Logística, Support Vector Machines (SVM), k-NN, Decision Trees, Redes Neurais, entre outros.
Na área de agrupamentos (clustering), tenho domínio em ferramentas como K-means, Spectral Clustering, Agglomerative Clustering, DBSCAN, Mistura de Modelos, entre outros.
Em meu mestrado e início do doutorado, também trabalhei com bi-agrupamentos (biclustering) e Formal Concept Analysis (FCA).
Algumas ferramentas utilizadas incluem InClose (espaço discreto), RInClose (espaço contínuo), Triclustering, MicroCluster, entre outros.
Essa é minha área de pesquisa atual. Dá pra brincar 😉.
- MLP
- RBF
- ELM
- Echo State Networks
- Recurrent Networks
- Constructive Networks
- Kohonen Maps
- Auto-Encoder
- Convolutional Networks
- U-net
Gradient Descent (e variantes), ISTA, FISTA, ADMM, entre outros. Essa é uma área de meu interesse atualmente.
Aqui o limite é a imaginação… (completo depois)
Tenho experiência com todo o processo (Pipeline) na área, incluindo diversas formas de seleção de parâmetros, análise e interpretação dos resultados, … …