230 likes | 328 Views
Fundamentos da Representação de Informações em Computadores. Prof. Carlos H. Marcondes marcon@vm.uff.br. Representação e magia. Pinturas pré-históricas, grutas de Altamira (Espanha) e Lascaux (França). Caracter instrumental da representação.
E N D
Fundamentos da Representação de Informações em Computadores Prof. Carlos H. Marcondes marcon@vm.uff.br
Representação e magia Pinturas pré-históricas, grutas de Altamira (Espanha) e Lascaux (França)
Caracter instrumental da representação • Manipula-se a representação por que é mais econômico que manipular a realidade diretamente • O resultado da manipulação da representação é subsídio para a praxis sobre a realidade • Similaridade: Representação e Realidade Manipulação = Simulação computador é a máquina capaz de simular a realidade
Representação de conceitos no computador Representação computacional Realidade Carro Representação simbólica (codificação, linguagem) Objeto, conceito Representação por imagens
Representação de informações no computador • Representação por IMAGENS – formatos “mapa-de-bits” (bitmap): .BMP, .PCX, .GIF, .TIFF, .JPEG • Representação simbólica – uso da linguagem, caracteres são CODIFICADOS – códigos ASCII e EBCDIC • Cada caracter é representado por um código de 8 bits
- 1 bit : 0 -21=2 1 - 2 bits: 00 -22=4 10 01 11 00 - 3 bits: 000 -23=8 100 010 001 110 101 011 111 000 Possibilidades de codificação de informações em função do conjunto de sinais
Caracteres codificados permitem a busca por um padrão de bits ligados e desligados A palavra “BRASIL” 01000010-01010010-01000001-01010011-01001001-01001100 B R A S I L
FORMATOS para representação de informações • Um FORMATO é um específico arranjo de informações, formando um arquivo digital • Um FORMATO contém informações voltadas para pessoas (conteúdo) e informações voltadas para os programas que processam estes conteúdos • Ex: formato WINWORD (.DOC) • Conteúdo – - o caráter “A” • Informações para o programa - tipo de fonte - cor - normal, negrito ou itálico - etc, etc, etc Formatos proprietários – exclusivos de um fabricante. Ex: .DOC, PDF Formatos abertos - padronizados. Ex. HTML, XML, JPEG, GIF X
#NJoão da Silva #EPetrobras #Mjoao@petrobras.com.br ## #NMaria da Conceição #EBanco do Brasil #Mmaria@bb.com.br ## João da Silva, Petrobras e joao@petrobras.com.br são os Conteúdos, #N, #E, #M e ## são o Informações de codificação dos elementos do Vocabulário , de modo que minha mala direta possa ser comprendida por um programa
Arquivos em formato “mapa de bits”: como reconhecer um caracter? A a A a Aa a a A ? ? ? ? ?
Processo de digitalização A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨ Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII
Processo de digitalização Imagens são formadas por pontos Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade podem ser controladas na tela. As imagens são formadas com a combinação de grande número de pixels. O termo é usado para referir-se a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels). Pixels são representados por 1 ou mais “bits” Bitonal ou preto-e-branco: 1 bit por pixel: pontos pretos: “1” pontos brancos: “0” Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por pixel) Colorido 8 bits por pixel: 256 cores 12 bits por pixel : 4096 cores 24 bits por pixel : 16.800.000 cores (“true color”)
Correspondência Arquivo “mapa-de-bits”, imagem na tela do computador Imagem na Tela 10 X 20 Arquivo “mapa-de-bits” 0000000000 0000000000 0000000000 0111111110 0100000010 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0000000000 0000000000 0000000000 0000000000
Processo de digitalização - RESOLUÇÃO • Relação entre número de pontos de uma imagem (Pixels) / Área • Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada • A resolução é uma medida da LEGIBILIDADE de uma imagem
Processo de digitalização - RESOLUÇÃO • Corresponde à capacidade de detalhamento de uma imagem, quanto maior a resolução da imagem, maior será a sua capacidade de exibir detalhes.
Processo de digitalização RESOLUÇÃO - aplicação da digitalização em DOCUMENTOS Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi) Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la Resolução razoável para documentos: 300 dbi
Processo de digitalização • Como não existe um código único para cada caracter, as imagens dos caracteres são desenhadas! Aa Aa Aa aa A a, • nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo
Processo de digitalização • Os sistemas de gerenciamento de imagens eletrônicas de documentos – GED - associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca. • Estes sistemas são a combinação das tecnologias de bancos de dados com a digitalização de documentos através do uso de escaners Imagem digitalizada de um documento Tipo | Num. | Setor | Data | Assunto | Registro de um banco de dados: pontos de acesso para recuperação