Como o Brasil distribuiu insumos para o COVID? Publicando uma EDA com Datapane
Utilizando dados abertos, plotly e datapane para gerar visualizações online
Motivação e Introdução
A Pandemia e o SUS
A pandemia do COVID-19 pressionou o nosso sistema de saúde mais do que ele já é normalmente pressionado. O SUS responde pelo atendimento de mais de 70% da população brasileira, que não tem acesso à rede privada de saúde.
De acordo com estudo da AMIB, publicado em Março de 2020, o Brasil possui 45.848 leitos de UTI, sendo que destes cerca de 49% (22.844) estão no SUS. Claramente o percentual de leitos de UTI não acompanha o percentual da população que depende do sistema público.
Até a data deste post, já tivemos mais de 195 mil mortes devido ao COVID e mais de 7 milhões de casos confirmados. Calcule 70% disto para ter uma ideia aproximada da pressão sofrida pelo SUS com a pandemia.
O Projeto e Técnicas Utilizadas
Este projeto tem como objetivo realizar uma análise exploratória de dados sobre a distribuição de insumos para o combate ao COVID no Brasil.
A análise exploratória de dados é um passo fundamental para entender um conjunto de dados. Mas, mais importante que criar um código eficiente com muitos dados, é saber comunicar os resultados.
A biblioteca Plotly auxilia na produção de gráficos interativos e com visual atraente. Estes gráficos podem ser visualizados diretamente no Jupyter notebook ou publicados na Web.
Neste post vou mostrar uma possibilidade de publicação dos gráficos usando a plataforma Datapane.
Origem dos Dados
Os dados de distribuição de ventiladores mecânicos e EPIs foram coletados do Portal Brasileiro de Dados abertos, conforme os links a seguir: Ventiladores e EPIs.
A descrição a seguir é uma versão resumida da análise feita. O código completo pode ser acessado aqui.
Instalando os Pacotes
Primeiro passo será instalar o pacote Plotly para as visualizações e o Datapane para a publicação do relatório:
!pip install datapane!pip install plotly
Para as visualizações mostradas aqui, será necessário importar os seguintes pacotes:
#Interactive visualizations
import plotly.offline as py
import plotly.express as px
import plotly.graph_objs as go
Para publicar o relatório na plataforma do Datapane:
#Report Publishing
import datapane as dp
Conhecendo as Bases de Dados
A base original de distribuição de ventiladores possui 10 variáveis:
Para a nossa análise, as informações mais importantes serão os fornecedores de equipamentos, destino, valores, data e quantidades.
Já a base de distribuição de EPIs possui 7 variáveis:
Para a análise serão fundamentais os dados de quais insumos foram fornecidos (na variável Material) e as quantidades de cada insumo.
Arrumando as Bases de Dados
A bases de dados tinham alguns pontos a serem ajustados antes da criação dos gráficos. Abaixo será apontado um resumo das principais correções feitas, para ver em mais detalhes, acesse o código completo deste projeto.
Base de dados de ventiladores
- Dados duplicados foram deletados
df_vent.duplicated().sum()
Out[106]:
491df_vent = df_vent.drop_duplicates()
- DESTINO indicava uma doação de ventiladores feita ao Líbano e essa linha foi deletada.
- Os nomes dos fornecedores foram corrigidos nos casos em que havia repetições e outros foram agrupados (nos casos em que a quantidade de ventiladores daquele fornecedor era muito pequena). Isso foi feito para melhorar a visualização final dos dados:
df_vent['FORNECEDOR'].unique()
df_vent['FORNECEDOR'] = df_vent['FORNECEDOR'].replace(['MAGNAMED-REQUISIÇÃO', 'MAGNAMED/REQUISIÇÃO', 'VYAIRE LTV 1200 USA', 'VYAIRE LTV 2200 USA', 'L C DADDE COM AT INST MAT MEDICO EPP', 'Leistung' ], ['MAGNAMED', 'MAGNAMED', 'VYAIRE', 'VYAIRE', 'APOLLO MEDICAL', 'LEISTUNG' ])
Como alguns itens só aparecem uma vez, eles serão agrupados para melhorar a visualização final:
df_vent['FORNECEDOR'].value_counts()
df_vent['FORNECEDOR'] = df_vent['FORNECEDOR'].replace(['APOLLO MEDICAL', 'KTK/VAYIRE', 'SUZANO/Resmed', 'SUZANO/Zhongxun Medical', 'LEISTUNG/VYAIRE', 'UTI'], 'VÁRIOS')
- Criação de uma coluna REGIÃO para poder visualizar os dados para cada região do Brasil:
- Criação de coluna contendo o mês de cada entrega:
df_vent['DATA DE ENTREGA'] = pd.to_datetime(df_vent['DATA DE ENTREGA'], errors='coerce')df_vent['MÊS'] = pd.DatetimeIndex(df_vent['DATA DE ENTREGA']).month
Base de dados de EPIs
- Dados duplicados foram deletados
- Criação de coluna contendo o mês de cada entrega:
Visualizações Finais
Para publicar as figuras criadas, é necessário executar o comando abaixo para fazer o login na plataforma Datapane. Desta forma, ao executar o comando para publicar o gráfico, um link será gerado para a sua publicação na plataforma:
dp.login(token='seu_token')
Ao registrar-se na plataforma Datapane um token será gerado para ser usado nas publicações. Este token é encontrado na página do seu perfil.
Para visualizar as imagens individulmente de forma que seja possível colocar cada imagem separadamente no post, foram criados relatórios separados para algumas imagens selecionadas.
Para não estender muito o post, será apresentado somente uma vez o código usado para gerar o relatório no datapane. Para ver os códigos de geração dos plots, acesse o código completo no github.
Figura 1 — Distribuição de Ventiladores por Tipo
Há ventiladores que são próprios para transportar o paciente. Outros são específicos para ficar estacionários, no leito de UTI. Visualizando a distribuição por tipo de ventilador:
Código para gerar e o relatório:
dp.Report(dp.Plot(fig1), dp.Table(df_gp_tp)).publish(name='Distribuicao de Ventiladores por Tipo para COVID no Brasil', open=True)
Figura 2 — Gasto Mensal por Região para a Aquisição de Ventiladores
Quanto foi gasto mensalmente em cada região para a aquisição de ventiladores? Podemos ver no gráfico de linhas abaixo que a região Sudeste foi a primeira a ter um pico nos investimentos em equipamentos, seguida da região Norte, Centro Oeste, Sul e Nordeste. Cabe ressaltar que a região Nordeste já apresentava uma tendência de aumento de investimentos nos primeiros meses da pandemia. O volume de investimentos por região parece ter seguido a taxa de avanço da pandemia. Cabe lembrar que as regiões Sudeste e Norte tiveram seus picos de casos e mortes já nos primeiros meses. O avanço nas regiões Sul e Centro-Oeste acentuou-se mais perto da metade do ano.
Figura 3 — Distribuição por região
Como era de se esperar, a região Sudeste foi a que mais recebeu ventiladores.
Figura 4 — Custo Unitário dos Ventiladores Por Região
O custo unitário médio dos ventiladores por região variou pouco, entre 55k e 51k, tendo a região Norte como aquela que mais gastou por unidade de equipamento e a região nordeste a que menos gastou.
Figura 5 — Quantidade de ventiladores distribuídos por fornecedor
Magnamed, fabricante nacional de equipamentos médicos fundada em 2005, foi o fornecedor que mais distribuiu ventiladores mecânicos para equipar os SUS na luta contra o COVID-19. Em segundo lugar temos a Vyaire, empresa de origem estadounidense e alemã, que foi responsável, junto com a Magnamed, pelo fornecimento da maioria dos ventiladores distribuídos este ano.
Figura 6 — Tipos e quantidades de EPIs Distribuídos
Relatório Geral
Para ver mais visualizações deste projeto, acesse o relatório com todos os gráficos disponível abaixo: