300 likes | 431 Views
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação. Tópicos Especiais em TI 2. Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 26novembro2007. http://toti2.wordpress.com. Aula 26nov2007. Assunto Folksonomias. Aula 26nov2007.
E N D
Universidade Federal de Pernambuco Centro de Artes e Comunicação Departamento de Ciência da Informação Tópicos Especiais em TI 2 Fábio Mascarenhas e Silva fabiomascarenhas@yahoo.com.br 26novembro2007 http://toti2.wordpress.com
Aula 26nov2007 Assunto Folksonomias
Aula 26nov2007 Folksonomia Tradução do termo folksonomy que é um neologismo criado em 2004 por Thomas Vander Wal, a partir da junção de FOLK (povo, pessoas) com TAXONOMY . Para Wal, Folksonomia é o resultado da atribuição livre e pessoal de etiquetas (tagging) a informações ou objetos (qualquer coisa com URL), visando à sua recuperação. A atribuição de etiquetas é feita num ambiente social (compartilhado e aberto a outros). O ato de etiquetar é do próprio usuário da informação, i.e., não é o autor nem o profissional de indexação que indexam o recurso da Web.
Aula 26nov2007 Folksonomia Etiquetagem significa atribuir etiquetas (tags) aos recursos da Web. Trata-se de uma indexação livre em linguagem natural, não são adotadas regras e/ou políticas de indexação e não há controle de vocabulários, ou seja, não há uma tradução dos termos para uma linguagem artificial/documentária. Os conteúdos são indexados livremente pelos usuários do recurso, podendo representar assuntos ou quaisquer outros elementos de metadados tais como tipo ou formato.
Aula 26nov2007 Folksonomia Em outra visão, Folksonomia é o resultado da etiquetagem dos recursos da Web num ambiente social (compartilhado e aberto a outros) pelos próprios usuários da informação visando a sua recuperação. Destacam-se portanto três fatores essenciais: 1) é resultado de uma indexação livre do próprio usuário do recurso; 2) objetiva a recuperação a posteriori da informação; 3) é desenvolvida num ambiente aberto que possibilita o compartilhamento e, até, em alguns casos, a sua construção conjunta.
Aula 26nov2007 CATARINO, M. E.; BAPTISTA, A. A. Folksonomia: um novo conceito para a organização dos recursos digitais na Web. DataGramaZero – Revista de Ciência da Informação, Rio de Janeiro, v. 8, n. 3, jun. 2007. Disponível em: < http://www.dgz.org.br/jun07/Art_04.htm>. Acesso em: 21 ago. 2007.
Aula 26nov2007 CATARINO, M. E.; BAPTISTA, A. A. Folksonomia: um novo conceito para a organização dos recursos digitais na Web. DataGramaZero – Revista de Ciência da Informação, Rio de Janeiro, v. 8, n. 3, jun. 2007. Disponível em: < http://www.dgz.org.br/jun07/Art_04.htm>. Acesso em: 21 ago. 2007.
Aula 26nov2007 Alguns sites que usam folksonomias CiteUlike – www.citeulike.org Connotea - http://www.connotea.org Flickr - http://www.flickr.com Youtube – www.youtube.com Delicious - http://del.icio.us/
Aula 26nov2007 Folksonomia (algumas vantagens) • cunho colaborativo/social da Folksonomia, ou seja, organização de conteúdos dos recursos digitais da Web pelos usuários que compartilham com outros as suas etiquetas, que podem ficar disponíveis para serem ou não adotadas na classificação de um mesmo recurso por outros usuários; • possibilidade de formar, automaticamente, comunidades em torno de assuntos de interesse na medida em que, ao utilizar serviços de folksonomia, o usuário tem acesso aos outros usuários que têm os mesmos interesses identificados através das etiquetas;
Aula 26nov2007 Folksonomia (algumas vantagens) Não há uma regra preestabelecida de controle dos vocabulários. Esta característica pode ser vista como uma vantagem na medida em que os usuários dos recursos expressam, ao etiquetar estes conteúdos, a sua estrutura mental em relação àquela informação: há uma liberdade de expressão que possibilita abarcar todas as formas de ver um mesmo conteúdo, respeitando as diferenças culturais, interpretativas, etc.
Aula 26nov2007 Folksonomia (algumas desvantagens) • Um dos maiores problemas é a falta de controle do vocabulário, que é resultado da característica de liberdade na classificação dos conteúdos; • A liberdade para atribuição de etiquetas proporciona pouca precisão na recuperação da informação. Um mesmo termo pode ter significados diferentes para os diversos usuários que atribuíram as etiquetas; • As palavras-chave atribuídas pelos usuários são freqüentemente ambíguas, muito personalizadas e inexatas; • há pouco ou nenhum controle de sinônimos ou homônimos, também não são impostas regras de indexação: são utilizados termos no singular ou plural, simples ou compostos, palavras sem sentido que não têm significado, exceto para um grupo específico de usuários.
Aula 26nov2007 Folksonomia (algumas desvantagens) • O não uso de instrumentos de terminologia tais como listas de cabeçalhos de assunto ou tesauros, e de regras gerais para a aplicação das palavras-chave, singular ou plural, termos simples ou compostos causam vários problemas que poderão afetar a recuperação da informação; • Com relação aos aspectos semânticos e cognitivos da classificação, a etiquetagem precisa resolver problemas que são inerentes ao processo de criação de relações semânticas entre palavras. Os três principais destes problemas são: polissemia, sinonímia e variação de nível básico.
Aula 26nov2007 MODELOS DE METADADOS
Aula 26nov2007 PADRONIZAÇÃO NA INTERNETa) PADRÕES DE FATO - se produz quando um produto se estabelece de tal forma que a compatibilidade se mede por referência a ele. Ex: OpenURL (Ex-libris)b) PADRÕES FORMAIS – aquelas formalmente estabelecidas por lei ou por uma instituição reconhecida pela formulação de padrões (ISO).c)UM TIPO MISTO DAS ANTERIORES, DENOMINADO PADRÕES FORMAIS DE FATO – formado por todos aqueles que, sem ser reconhecidos por uma instituição normalizadora, foi instituído ou recomendado por uma instituição com responsabilidade e participação internacional no desenvolvimento da Internet.Ex: W3C
Aula 26nov2007 PADRÕES SEGUNDO O NÍVEL DE IMPLANTAÇÃOa) PADRÕES RECONHECIDOS E ESTÁVEIS – teoricamente o nível de estabilidade de um padrão e seu reconhecimento deveria estar vinculado diretamente a formalização. Na Internet o processo é inverso: primeiro se reconhece e se estabiliza seu uso, depois se formaliza. O HTML, no momento que começa a ser formalizado coincide com sua obsolescência;b) PADRÕES DEPENDENTES OU UTILIZADOS POR UM PEQUENO NÚMERO DE PROVEDORES OU EMPRESAS DE INFORMÁTICACorresponde , em princípio, aos padrões formais de fato ou especificações de acesso público cuja implantação é potestativa para o mercado de software.C) PADRÕES PROPRIETÁRIOS – Este seria o caso de, por exemplo, as HCL (Listas de Controle de Indexação) que utilizam exclusivamente a ferramenta para a edição e gestão de metadados METABROWSER
Aula 26nov2007 Metadados de propósitos geraisDestinados a representação e descrição de documentos eletrônicos que, independentemente de sua temática e/ou finalidade informativa, proporcionam dados de diversos tipos sobre os recursos.Metadados de propósitos específicosEsses formatos almejam ajustar-se a temática e particularidade da informação eletrônica a qual se referem.
Aula 26nov2007 Metadados embutidos Metadados separados Metadados Metadados Metadados Metadados Metadados Metadados Metadados Metadados Metadados Metadados
Aula 26nov2007 DC (Dublin Core)Concebido originalmente para a descrição de recursos Web por parte do próprio autor do DLO, foi aos poucos adotado por bibliotecas, museus, etc;Foi desenhado inicialmente para ajudar os motores de busca a encontrar e recuperar páginas Web e posteriormente evoluiu como um formato para o intercâmbio e recuperação de informação no espaço digital.
Aula 26nov2007 Apesar do Dublin Core se adaptar para descrever qualquer tipo de recurso eletrônico, as diversas comunidades de usuários da rede e as distintas áreas de aplicação requerem diversos elementos e níveis de complexidade. Por isto muitas instituições e organismos estão desenvolvendo esquemas de metadados complementares, baseados, em alguns casos, no próprio DC (edNa, AGLS).
Aula 26nov2007 MODELOS DE METADADOS ESPECÍFICOS PARA UM TIPO/FORMATO DE INFORMAÇÃODestacam-se os utilizados para representação de multimeios.Ex: Multimedia Content Description Interface (MPEG 7) http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htmMODELOS DE METADADOS ESPECÍFICOS PARA UMA ÁREA TEMÁTICAInicialmente ressalta o risco de abrir a possibilidade de os usuários desenvolverem seus próprios modelos de metadados ou então adaptarem de alguns como o Dublin Core.Ex: Educação, Informação Governamental e Informação Geoespacial.
Aula 26nov2007 EDUCAÇÃO IMS (Instructional Management Systems)- Estrutura de metadados composto de categorias, elementos de dados e tipos de dados contidos em uma estrutura hierárquica. http://www.imsglobal.org/metadata/index.htmlOutros: edNa (baseado no modelo DC) http://www.edna.edu.au/edna/go/resources/metadataINFORMAÇÃO GEOESPACIALRessalta-se o CSDGM (Content Standard for Digital Geospatial Metadata) criado pela FGDC em 1994 e que em 2000 serviu de modelo para uma norma ISO específica a estes fins.http://www.fgdc.gov/metadata/csdgm/
Aula 26nov2007 INFORMAÇÃO GOVERNAMENTALPreocupação dos governos relacionado aos E-GOVs, alguns vem desenvolvendo seus próprios modelos, destacam-se:GILS (Um dos principais, desenvolvido pelos EUA, converge dados de várias agências do país ) http://www.gils.net/prof_v2.htmlAGLS (Governo Australiano)http://www.naa.gov.au/records-management/create-capture-describe/describe/AGLS/index.aspx
Aula 26nov2007 • A arquitetura e-PING (Padrões de Interoperabilidade de Governo Eletrônico) define um conjunto mínimo de premissas, políticas e especificações técnicas que regulamentam a utilização da TIC na interoperabilidade de serviços de Governo Eletrônico, estabelecendo as condições de interação com os demais poderes e esferas de governo e com a sociedade em geral. • www.eping.e.gov.br
Aula 26nov2007 • ORGANIZAÇÃO E INTERCÂMBIO DE INFORMAÇÕES • Lista de Assuntos do Governo (LAG) • Catálogo de Padrão Dados (CPD) • Padrão de Metadados do Governo (e-PMG)
Aula 26nov2007 Lista de Assuntos do Governo (LAG) Primeiro nível 01 Agricultura, Extrativismo e Pesca 02 Ciência, Informação e Comunicação 03 Comércio, Serviços e Turismo 04 Cultura , Lazer e Esporte 05 Defesa e Segurança 06 Economia e Finanças 07 Educação 08 Governo e Política 09 Habitação, Saneamento e Urbanismo 10 Indústria 11 Justiça e Legislação 12 Meio Ambiente 13 Pessoa, Família e Sociedade 14 Relações Internacionais 15 Saúde 16 Trabalho 17 Transportes e trânsito
Aula 26nov2007 Nome do dado Descrição Faz parte de Tipo de elemento Formato lógico Tem partes Versão Esquema XML Status Validação Data de aceitação Valores Valor default Proprietário Baseado em Verificação Comentários Data de Publicação Catálogo de Padrão Dados (CPD) Cabeçalho Corpo
Aula 26nov2007 e-PMG Em desenvolvimento pelo Grupo Organização e Intercâmbio de Informações da e-PING – Padrões de Interoperabilidade de Governo Eletrônico. Construção colaborativa: Arquivo Nacional, Banco do Brasil, Caixa Econômica Federal, CGU, Dataprev, Embrapa, IBGE, Ministério da Fazenda, Ministério do Planejamento, Proderj, Senado Federal, Serpro, TCU, UFPr, ... Sociedade Tem como base o Dublin Core
Aula 26nov2007 Desafio: acomodar e compatibilizar os múltiplos padrões de metadados
Aula 26nov2007 QUESTÕES- os metadados devem contemplar todos os elementos que permitam ao usuário examinar a relevância potencial de um documento sem a necessidade de visualizar o objeto completo;- os registros devem ser compatíveis com um motor de busca que por sua vez seja compatível com um protocolo de busca e recuperação de informação na Internet (ex: Z39.50); e, é necessário que estes componentes se conformem, simplifiquem ou descrevam de forma padronizada e a nível internacional;- não é necessário seguir um único padrão, pois ele seria insuficiente para todos os fins;- Os metadados não devem originar-se de iniciativas isoladas (informações governamentais, geoespaciais, etc) que respondam a necessidades de recuperação de informação pontuais dentro de cada área.