280 likes | 286 Views
IDRC u2013 Open research data initiative [109059-013] supported this study.<br>Su00e9rie integrante do curso sobre datasets<br>Material traduzido por Jose Dutra O Neto, Ildeberto A Rodello<br>Apoio: IDRC u2013 Open research data initiative [109059-013]
E N D
Tutoriaisnagestão de dados Módulo 6: Proteção dos dados Melhores práticas recomendadas para proteção de dados, backups e preservação de dados CC Image courtesy of Erica Marshall of muddyboots.org on Flickr
Tópicos a seremabordadosnesta aula • Principais conceitos de preservação digital • Backups: Coisas a considerar • Preservação de dados • Melhores práticas recomendada CC Image courtesy of TonyHall on Flickr
Objetivos de aprendizagem • Após concluir esta lição, o participante será capaz de: • Definir as diferenças entre backups e arquivamento de dados • Identifique problemas significativos relacionados ao backups de dados • Identifique por que os planos de backup são importantes e como eles podem se encaixar em procedimentos de backup maiores • Discuss what data preservation covers • Discutir o que a preservação de dados cobre • List several recommended practices • Listar várias práticas recomendadas CC Image courtesy of paul.klintworth on Flickr
Proteção de dados, backups, arquivamento e preservação: resumo das diferenças • Proteção de dados • Includes topics such as backups, archives, and preservation; also includes physical security, encryption, and others not addressed here • Inclui tópicos como backups, arquivamento e preservação; também inclui segurança física, criptografia , etc. • Terms “backups” and “archives” are often used interchangeably, but do have different meanings • Os termos " backups " e " arquivos " são frequentemente usados com o mesmo sentido, mas têm significados diferentes • Backups: uma cópia (ou cópias) do arquivo original é feita antes que o original seja substituído • Arquivamento: preservação do arquivo • Preservação de dados • Inclui arquivamento, além de processos como recuperação de dados, reformatação de dados, conversão de dados e metadados
Detalhando: backups versus arquivamento • Backups • Usado para salvar informações periodicamente, caso a versão atual seja destruída ou perdida • Os backups são cópias de arquivos armazenados por curto ou longo prazo • Realizado com uma periodicidade frequente • Arquivamento • Usado para preservar dados para referências históricas ou potencialmente durante eventuais desastres • Arquivos geralmente são a versão final, armazenados por longo prazo e geralmente não são regravadas por outras cópias • Often performed at the end of a project or during major milestones • Frequentemente realizado no final de um projeto ou durante os principais pontos de controle É uma boa idéia ter várias cópias dos seus backups e arquivos, em vários locais, caso uma cópia falhe.
Por que fazer backups? • Limitar a perda de dados, alguns dos quais podem não ser reproduzíveis • Economize tempo, dinheiro, produtividade • Ajude a se preparar para desastres • Exclusões acidentais • Incêndios, desastres naturais • Bugs de software, falhas de hardware • Reproduzir resultados do passado (caso sejam baseados em arquivos mais antigos) • Responder a pedidos de dados • Limitar de responsabilidade sobre os dados CC Image courtesy of Brian J Matis on Flickr
Backups: O que considerar? • Quais são as políticas existentes que podem afetar como e quando você faz backups de seus dados? • As políticas podem diferir entre os grupos; qual tem precedência? • Os backups já fazem parte de um plano maior de gerenciamento ou contingência de dados? • Quem é responsável pela execução dos backups? • Essas várias políticas atendem às suas necessidades?
Backups: O que considerar? • Com que frequência você deve fazer backups para capturar alterações significativas? • Continuamente? Diariamente? Semanal? Mensal? • Custo x benefício • Que tipo de backup você deve executar? • Parcial: fazendo backup apenas dos arquivos que foram alterados desde o último backup • Completo: fazendo backup de todos os arquivos • Com que frequência e que tipo dependerá de que tipo de dados você possui e de quão únicos são • E os arquivos não digitais (como papéis)? • Considere digitalizar tudo
Backups: O que considerar? • Onde você fará backup dos seus arquivos? • Pode depender dos requisitos do projeto, etc.. • Disco externo pessoal, armazenamento centralizado para computador ou nas nuvens( Dropbox, Onedrive, Google drive, etc. ). • Metadados são necessários ao usar esses sistemas? • Os arquivos são copiados individualmente ou como um arquivo grande (compactados) • Boas práticas seria manter backups em locais diferentes dos dados de origem
Considerations • Como os backups são realizados? • Podem funcionar manualmente para arquivos únicos, mas exige que o usuário lembre-se de executar backups regulares e pode levar muito tempo • Os backups automatizados podem ser executados de forma automática • O que faço se precisar obter um arquivo de backups? • O modo de backup pode determinar como o arquivo pode ser recuperado • Você deve saber como obter arquivos de backups, onde eles estão localizados e com quem entrar em contato • Você precisa conhecer essas informações com antecedência, pois com frequência precisa de um arquivo de um backup em caso de urgência! • Compreender o processo de backup faz parte da criação das melhores práticas de gerenciamento de dados
Considerações • Como você verifica se um backup foi executado com sucesso? • A maioria dos softwares de backup possui um arquivo de log que contém detalhes do backup (quais arquivos, quando o backup foi criado) • No entanto, não confie apenas no arquivo de log • Mesmo que um arquivo de log indique que o backup foi bem-sucedido, você ainda precisará checar o backup para garantir que os arquivos estejam lá e acessíveis • Teste restaurá-lo em outro local • Falhas de hardware e software podem ocorrer após a realização de backups e arquivos de log • Verifique se o seu sistema está fazendo backup dos arquivos corretos
Considerações • Se você estiver trabalhando com alguém, como um grupo de TI, que ajude a gerenciar e executar backups, confirme e verifique se o processo de backup foi concluído com êxito • mo você verifica se um backup foi executado com sucesso? • Como as verificações manuais de todos os arquivos em seu backup provavelmente não são possíveis, você deve utilizar outros métodos, como verificar tamanhos de arquivo, data e checksum • Checksum são cálculos matemáticos com base nos dados armazenados em um arquivo específico. Se o checksum calculados em ambos os arquivos (original e cópia) corresponderem, é provável que o arquivo seja o mesmo e não tenha sido modificado/corrompido quando copiado ou armazenado.
Considerações • Existem backups dos backups? • Necessário para dados de alto valor agregado • Geralmente, cópias diferentes de backups são mantidas em locais diferentes • Quanto tempo você mantém seus backups? • Depende da situação específica e deve ser determinado em conjunto com as partes interessadas e os gerentes dos recursos • Entenda diretrizes, políticas e regras relevantes para retenção de dados • Quais são as soluções de armazenamento e de acesso a longo prazo que são relevantes para o projeto? O que fazer quando o financiamento termina ou a equipe principal deixa de trabalhar no projeto? • Alterações no status do projeto, financiamento ou equipe principal são razões importantes para ter um entendimento completo das opções e requisitos relacionados ao armazenamento e ao acesso aos dados
Dados navida real • Uma empresa de design estava lidando com seus próprios backups. O sistema estava funcionando e o software de backup estava relatando que os dados foram copiados com sucesso. Images courtesy of Heather Henkel
Dados navida real • O administrador verificou o backups imediatamente depois de concluídos e foram executados com sucesso CC Image courtesy of angielauw on Flickr
Dados navida real Depois que um vírus de computador apagou a maioria dos arquivos, eles pegaram os seus backups. Infelizmente, eles descobriram que os backups estavam em branco e todos os dados haviam desaparecido. Somente após alguma investigação eles descobriram que as fitas do computador (que continham os backups) foram colocadas contra uma parede que tinha um elevador do outro lado. Quando o elevador passou, os ímãs do interior apagaram todas as fitas Se eles tivessem verificado seus backups corretamente, provavelmente teriam notado isso antes de ocorrer uma emergência
Consideraçõesfinais • Você pode ler dados de backups mais antigos? • Mídia muda. Talvez você não consiga ler versões e formatos mais antigos, como disquetes, unidades Jazz e Zip, arquivos WordPerfect etc. • A mídia pode degradar-se rapidamente, inesperadamente ou inconsistentemente • Mesmo que você possa abrir um arquivo hoje, isso não significa que você poderá daqui a um mês • Como você descarta dados desatualizados? • Tome a decisão de copiar ou arquivar Lembre-se: faça backup dos dados que você não pode perder!
Preservação de dados • Ao gerenciar e preservar bem seus dados, a recuperação de dados pode não ser necessário. Por quê? • Adição de metadados relevantes, nomeação adequada de arquivos (pode ajudar a evitar a perda do arquivo no sistema), utilização de formatos de arquivo adequados (permite abrir o arquivo sem precisar convertê-lo), backups (limita a perda de arquivos) e tipos de mídia (limita a degradação de arquivos), você pode limitar ou impedir a necessidade de recuperar os dados • Um bom plano de gerenciamento de dados é outra ferramenta para ajudar a limitar a necessidade de recuperação dos dados.
Processos relacionados à preservação de dados • Inclui backups e arquivamento, além de processos como conversão de dados, reformatação de dados e recuperação de dados • Os arquivos mais antigos podem não estar mais em um formato utilizável e podem exigir conversão ou "recuperação" antes que os dados possam ser usados. • A reformatação de dados, conversão e backup se tornam ainda mais importantes à medida que os projetos são concluídos e / ou não são mais financiados. • Os dados podem ter sido mantidos no final do projeto, mas se ninguém estiver gerenciando os dados, eles podem ser deixados em formatos que não são mais utilizáveis ou em locais que não são mais acessíveis. • Além disso, a preservação de dados requer planejamento, estrutura e gerenciamento e avaliação contínua
Formatos de preservação e estratégias de versão • Conversões e formatos de dados • Use formatos não proprietários ou formatos padrão • Converta arquivos de texto de .doc ou .xls para .txt, arquivos de imagem para .tiff ou .pdf • Verifique os arquivos após convertê-los, pois podem ocorrer perda de dados, metadados e formatação • Versão • Use números e letras consecutivos para ajudar a acompanhar as alterações em um arquivo ao longo de várias edições e revisões. Isso o ajudará a diferenciar rapidamente entre arquivos com nomes semelhantes. • Nome dos arquivos • Use nomes de arquivos que sejam consistentes, descritivos e concisos para encontrar e identificar rapidamente o arquivo em uma época posterior. • Renomeie arquivos que tenham um nome de arquivo padrão quando exportados, como "image.jpg" ou "archive.zip"
Práticas recomendadas • Crie uma política de preservação que identifique claramente: • papéis, • responsabilidades, • onde é feito o backup dos dados, • com que frequência os arquivos são backupeados, • como acessar os arquivos, • formatos de arquivo recomendados a serem usados e • políticas para migrar dados para garantir que os dados não sejam perdidos devido à degradação da mídia ou alteração de formatos ou programas • Revise sua política de preservação e reveja periodicamente para garantir que ela ainda seja válida e aplicável • Atualize contatos, se apropriado
Práticas recomendadas • Minimize ou remova a dependência de usuários para executar backups manuais próprios (se possível) • Implementar backups padronizados e automáticos • Se possível, coloque especialistas encarregados dessa tarefa (equipe de informática), pois eles têm maior probabilidade de manter-se atualizados sobre atualizações de software, problemas de hardware, práticas recomendadas etc. • Não assuma que backups estão sendo executados para você • Você não deseja descobrir posteriormente que nenhum backup foi executado por você • Se você estiver usando software de terceiros (como Yahoo ou Google Mail), o que acontece se eles perderem seus arquivos? • Use formatos não proprietários e formato não padrão • Converta arquivos de texto de .doc ou .xls para .txt, arquivos de imagem para .tiff ou .pdf
Práticas recomendadas • Verifique seus backups manualmente • Comece olhando os arquivos de log, pois eles podem indicar que o backup foi bem sucedido • Não confie apenas nos arquivos de log - eles podem estar incorretos ou os dados podem ter sido corrompidos após a transferência dos dados • Veja as datas e os tamanhos dos arquivos para ver se eles correspondem; compare o checksum do arquivo original e do arquivado • Verifique se você pode ler arquivos de backups e arquivos antigos. • Tenha várias versões de backups em vários formatos e em vários locais • Um bom gerenciamento de dados limitará a quantidade de recuperação de dados em caso de necessidade
Dados navida real • Em 2011, um erro de software fez com que alguns usuários do Gmail perdessem o acesso ao email. Felizmente, o Google tinha backups! CC Image courtesy of Sybren A. Stüvel
Resumo • Preservação de dados mais do que apenas fazer backup e arquivar seus dados • Ao planejar uma estratégia de preservação, é necessário considerar com que frequência os backups devem ser executados, local onde fazer backup, acessibilidade aos backups e quanto tempo deve manter os arquivos • Há muitas razões pelas quais precisamos realizar backups, principalmente para evitar a perda de dados • Teste com frequência os backups antigos!
Referencias • Stanford University Libraries, Data Management Plans (Stanford University Libraries), https://library.stanford.edu/research/data-management-services, (accessed 9/21/2016) • Albanesius, Chloe, Google: Storage software update led to e-mail bug, http://www.pcmag.com/article2/0,2817,2381168,00.asp (accessed 09/21/2016) • Van den Eynden, Veerle, Corti, Louise, Woollard, Matthew, Bishop, Libby and Horton, Laurence, Managing and Sharing Data, http://www.data-archive.ac.uk/media/2894/managingsharing.pdf , and companion materials, https://www.ukdataservice.ac.uk/manage-data/handbook (accessed 09/21/2016) For more information about physical security, encryption, and data disposal, visit: http://www.data-archive.ac.uk/media/2894/managingsharing.pdf
The full slide deck may be downloaded from: http://www.dataone.org/education-modules Suggested citation: DataONE Education Module: Data Protection. DataONE. Retrieved Sept 21, 2016. From http://www.dataone.org/sites/all/documents/L06_DataProtection.pptx Copyright license information: No rights reserved; you may enhance and reuse for your own purposes. We do ask that you provide appropriate citation and attribution to DataONE.