240 likes | 484 Views
Relacionamento Nominal de Banco de Dados Record Linkage. Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br. A Visão da DIDES/GEPIS. Melhorar a comparabilidade, qualidade, integridade e a utili dade da informação em saúde suplementar , a partir
E N D
Relacionamento Nominal de Banco de DadosRecord Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br
A Visão da DIDES/GEPIS Melhorar a comparabilidade, qualidade, integridade e a utilidadeda informação em saúde suplementar, a partir da integração de uma ampla variedade de fontes de informação e recursos públicos e privados em todos os níveis (local, regional,nacionale internacional) através da adoção de uma política de informação uniforme e de uso de padrões.
PROCESSO DE LINKAGE • O processo de linkage: • coleta informações e pesquisa unidades de observação de duas ou mais fontes diferentes com o objetivo de combinar dados. • é uma técnica importante para o desenvolvimento, produção, análise e avaliação de dados estatísticos. • um de seus primeiros usos foi na pesquisa do câncer. • esta técnica auxilia na produção de grandes bancos de dados para estudos prospectivos observacionais. • pode ser considerada uma técnica estatística em virtude da falta de padronização dos diferentes bancos de dados. Assim, as informações são conseguidas a partir de inferências.
Propósito do Record Linkage Record linkage é uma técnica de integração entre sistemas existentes, combinando dados de 2 bancos de dados ou mais, verificando a sobreposição desses dados, construindo assim um data warehouse. Linkar registros pessoais acuradamente é difícil, mesmo quando os dados estão adequados; é extremamente complexo quando os dados são anônimos, como nos registros dos sistemas de dados vitais. Alguns países utilizam identificação de registros pessoais que podem ser utilizados na técnica de linkage (social security number nos EUA e número nacional na Nova Zelândia), embora deva haver preocupação com a individualidade do cidadão. (Musen & van Bemmel, 1997)
Epidemiologia • Refere-se aos estudos retrospectivos e prospectivos da distribuição e dos determinantes da prevalência das doenças em pessoas e animais, envolvendo o estudo dos fatores que propiciam a ocorrência das doenças, inquéritos e investigação epidemiológica. • Inclui subtemas como: • análise da situação de saúde, • estrutura epidemiológica de grupos populacionais, • bioestatística, • métodos epidemiológicos, • sistemas de informação em saúde, • indicadores de saúde, • estudos populacionais, • estatística vital, • epistemologia em epidemiologia, • determinantes da saúde e da doença, etc.
SIEPI O Sistema de Informações Epidemiológicas (SIEPI) é um banco de dados de uso interno na ANS cujo objetivo é conhecer a situação de saúde da população beneficiária de planos privados de saúde, fornecendo subsídios para que o Sistema Único de Saúde (SUS) conheça e promova melhorias no setor, desenvolvendo e fomentando políticas e estratégias voltadas às ações de proteção e promoção à saúde da população.
SIEPI • A captação dos dados para a construção dos indicadores epidemiológicos sobre a situação de saúde da população beneficiária de planos privados é realizada a partir de grandes bancos de dados nacionais ao cruzar com os sistemas de informação da ANS. • Grandes bancos de dados nacionais: SIH, SINASC, SIM, SINAN, APAC, SIAB • Banco de dados da ANS: SIB – Sistema de Informações de Beneficiários • Utiliza a técnica de Record Linkage
SIEPI e record linkage Operadoras Bancos do MS ANS SIH-SUS SIEPIBanco de Dados para análise SIB Sistema de Informações de Beneficiários SINASC SIM CIH RECORD LINKAGE
Record linkage do SIB com o SIH-SUS • Sistema de Informações Hospitalares do SUS • O SIH-SUS contém informações que viabilizam efetuar o pagamento dos serviços hospitalares prestados pelo SUS, através da captação de dados em disquete das Autorizações de Internação Hospitalar - AIH - relativas a mais de 1.300.000 internações/mês. • Sendo o sistema que processa as AIHs, dispõe de informações sobre recursos destinados a cada hospital que integra a rede do SUS, as principais causas de internações no Brasil, a relação dos procedimentos mais freqüentes realizados mensalmente em cada hospital, município e estado, a quantidade de leitos existentes para cada especialidade e o tempo médio de permanência do paciente no hospital. • Fonte:DATASUS
SIEPI e record linkage do SIB com o SIM • Sistema de Informações sobre Mortalidade (SIM) • Coleta dados sobre óbitos e fornece informações sobre o • perfil de mortalidade nos diferentes níveis do SUS. • Permite que os dados sejam agregados ou desagregados • por estados, município, bairro ou endereço residencial. • Record Linkage (conhecido como “Batimento”): • SIM – 2002, 2003 e 2004 • SIB – fevereiro/2006
SIEPI e record linkage do SIB com o SIM NOME - SEXO - DATA DE NASCIMENTO – NOME DA MÃE Registro no SIB Adelina Fernandez F 05/05/45 Maria Portela Souza Registro no SIM Adelina Maria Fernandez F 05/05/44 Maria Portela Souza Fonetização do nome: primeiro nome + último nome + nome do meio ADELINAFERNANDEZMARIA MARIASOUZAPORTELA compara os 7 primeiros caracteres
SIEPI e record linkage do SIB com o SIM • Números de registros do SIB e do SIM: • SIB: 123.129.176 (ativos e inativos) • SIM-2002: 958.380 (retirados os inválidos) • SIM-2003: 979.548 (retirados os inválidos) • SIM-2004: 1.000.489 (retirados os inválidos) • Maiores dificuldades: • duplicidade de registros e ausência de dados • homônimos • mesmos beneficiários em diversos planos • grafias incorretas nos nomes (abreviaturas, variações) • diagnósticos diferenciados do mesmo óbito.
SIEPI e record linkage do SIB com o SIM • SIB e SIM são bases que não possuem identificações unívocas em comum (CPF, RG). • Principais etapas para o batimento: • 1 - Padronização dos nomes dos beneficiários , fonetizando-os, de forma a poder-se efetuar uma comparação onde erros de grafia não influam, causando falsos não-batimentos. • 2 - Padronização das datas e do sexo do beneficiário. • 3 - Blocagem sobre as seguintes informações: sexo, data de nascimento e os 7 (sete) primeiros caracteres do nome fonetizado • 4 - Batimento e pontuação dos pares
SIEPI e record linkage do SIB com o SIM • Sistema de Pontuação: • A - Nome Fonético Completo – 100 pontos • B – Nome Fonético da mãe - > 80% - 20 pontos • C – UF:igual – 5 pontos
Resultados analisados e disponibilizados no SIEPI SIB x SIM • As informações estão agrupadas (Data Warehouse/ANS) nos seguintes temas: • dados demográficos, onde são apresentadas as AIH identificadas distribuídas por UF, sexo, faixa etária e classificação da operadora; • acesso e utilização de serviços de saúde, com informações sobre o procedimento principal realizado no SUS, a especialidade do procedimento principal e a especialidade da AIH identificada; • morbidade, com o diagnóstico principal da internação, agrupados por lista tabular de morbidade da CID10 e grupo de causa da CID10 • mortalidade hospitalar, onde são apresentados os óbitos hospitalares identificados em AIH do SUS.
SIEPI 2003 – SEXO E FAIXA ETÁRIA • De acordo com os dados, observamos que praticamente a metade dos óbitos ocorreram em usuários com mais de 70 anos. Incluindo a faixa imediatamente anterior (60-69 anos), esta proporção chega a 65%. • Há maior proporção de óbitos para o sexo masculino em praticamente todas as faixas etárias, com exceção da faixa de mais de 70 anos. • Interessante observar a grande discrepância de óbitos em beneficiários jovens do sexo masculino em relação às jovens do sexo feminino. Este achado é compatível com a distribuição de óbitos na população geral.
SIEPI 2003 – GRUPO DE CAUSA E SEXO • A análise dos dados disponíveis no SIEPI demonstra uma maior prevalência de óbitos por doenças circulatórias, neoplasias, doenças respiratórias e causas externas. • Houve alguma diferença em relação ao sexo quanto aos óbitos por neoplasias (mais mulheres) e por doenças circulatórias (mais mulheres). • Houve uma grande discrepância quanto ao sexo no grupo de causas externas – muito mais homens que mulheres, seguindo a tendência da população em geral.
SIEPI 2003 – GRUPO DE CAUSA E REGIÃO • Os dados demonstram algumas diferenças entre as regiões: • as regiões Sul e Sudeste possuem maior proporção de óbitos por neoplasias; • as regiões Norte e Nordeste apresentam menores proporções de óbitos por doenças circulatórias; • óbitos relacionados à gravidez têm proporção maior na região Norte; • causas mais definidas são mais comuns nas regiões Norte e Nordeste; • causas externas são mais comuns na região Centro-Oeste.
PRÓXIMOS TRABALHOS • Novos record linkages (SIB x SINASC) • Ampliar parceria com a SVS/MS • Estudos para validação do algoritmo (comparação com o LinkPlus – CDC (Centers for Disease Control and Prevention – www.cdc.gov - Department of Health and Human Services - Estados Unidos) • Maior disseminação da técnica em congressos e universidades
IMPORTÂNCIA DA QUALIDADE DA INFORMAÇÃO • Existem dificuldades com a falta de padronização dos dados dos grandes bancos (DATASUS e ANS). • Esta deficiência faz com que as informações obtidas tenham vieses, dificultando a interpretação dos dados. • O projeto TISS – Troca de Informações em Saúde Suplementar objetiva suprir a deficiência de falta de padronização na saúde suplementar.