360 likes | 513 Views
UNICODE e URI. Como fazer ?. Escrever termos , Usar termos em frases, Fazer afirmações usando os termos, Montar classificações dos termos, Criar regras de geração de novas afirmações, provar a veracidade de novas afirmações, Saber quem afirmou, classificou,fez regras e provou
E N D
Como fazer ? • Escrevertermos, • Usar termos em frases, • Fazer afirmações usando os termos, • Montar classificações dos termos, • Criar regras de geração de novas afirmações, • provar a veracidade de novas afirmações, • Saber quem afirmou, classificou,fez regras e provou • ter confiança nas afirmações.
Escrevertermos, usar termos em frases,Fazer afirmações usando os termos,Montar classificações dos termos,Criar regras de geração de novas afirmações, provar a veracidade de novas afirmações,Saber quem afirmou, classificou,fez regras e provou • ter confiança nas afirmações Escrever Termos
Escrever • Como escrever na web Semântica? • Usando linguagem escrita • Que línguas? Todas. • Inglês: I'm an engineer. • Português: Eu gosto de samba canção • Espanhol: El coche esta lleno de agua. • Russo: Росси́йская Федера́ция(Federação russa)
Chines: 中國 (China) صفحهٔ اصلی • Koreano(?):中华人民共和国 • Vienamita(?): Trono Quốc • הרפובליקה העממית של סין • 中华人民共和国
Problemas • Como representar cada caractere no computador que basicamente só armazena e processa números? • R: Atribuindo um número a cada caractere. • Qual o número que representa o caractere “M” ou “民”? • R:Depende da existência de um padrão
Unicode • O padrão Unicode fornece um número único para todo caractere não importando a plataforma, a língua ou o programa. • Antes de ser criado o Unicode existiam centenas de sistemas de codificação para os caracteres.
O padrão foi adotado por empresas como: Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, etc. (http://www.unicode.org).
O Padrão Unicode, Versão 5.0 fornece codigos para 99.089 caracteres do alfabetos mundiais, dos conjuntos de ideogramas e as coleções de símbolos
O que é unicode? • Arábico ما هي الشفرة الموحدة "يونِكود" ؟ • Hindu: यूनिकोड क्या है? • Japonês: ユニコードとは何か?
Escrevertermos, usar termos em frases,Fazer afirmações usando os termos,Montar classificações dos termos,Criar regras de geração de novas afirmações, provar a veracidade de novas afirmações,Saber quem afirmou, classificou,fez regras e provou • ter confiança nas afirmações Escrever Termos
Termos • Termos representam as “coisas” sobre as quais vamos escrever na web semântica • Termos representam também o que vamos escrever sobre essas “coisas” • Os termos são chamados de RECURSOS no contexto da web. • Os termos ou RECURSOS precisam ter uma forma de serem IDENTIFICADOS
URI - Uniform Resource Identifier • Identificadores de recursos uniformes ou Uniforms Resource Identifiers (URI) fornecem um meio simples e extensível de IDENTIFICAR RECURSOS.
Uma URI é um identificador consistindo numa seqüência de caracteres que seguem uma rega de sintaxe .
Recurso • A especificação de URI não define ou limita o que é um recurso • Qualquer coisa identificável por uma URI pode ser um recurso • Pode-se atribuir uma URI a qualquer coisa • Qualquer coisa que tem uma URI “esta na web”.
Exemplo de recursos • Documento eletrônico • Uma imagem • Uma fonte de informação • Um serviço • Uma coleção de recursos
Exemplo de recursos • O prof. Fernando Gauthier • O presidente Lula • A UFSC • O avião do Lula • O cachorro Rex
Exemplo de recursos • A Teoria da Relatividade • O Mito da Caverna de Platão • A Entropia da Informação • A UML • A intersecção de dois conjuntos difusos
Exemplo de recursos • A Amizade • O Namoro • O sexo tântrico • A raiz quadrada de (-1)
Identificador • Engloba a informação necessária para distinguir o que esta sendo identificado de todas as outra coisas no contexto da identificação. • Identificar se refere ao propósito de distinguir um recurso dos demais não importando como isso é conseguido (pelo nome, pelo endereço, pelo contexto)
Para efeitos de exemplos vamos considerar uma URI qualquer seqüência de caracteres latinos • The generic URI syntax consists of a hierarchical sequence of components referred to as the scheme, authority, path, query, and fragment. • URI = scheme ":" hier-part [ "?" query ] [ "#" fragment ] • hier-part = "//" authority path-abempty • / path-absolute • / path-rootless • / path-empty
Exemplos de URI • ftp://ftp.is.co.za/rfc/rfc1808.txt • http://www.ietf.org/rfc/rfc2396.txt • ldap://[2001:db8::7]/c=GB?objectClass?one • mailto:John.Doe@example.com • news:comp.infosystems.www.servers.unix • tel:+1-816-555-1212 • telnet://192.0.2.16:80/ • urn:oasis:names:specification:docbook:dtd:xml:4.1.2
Sobre identificador • Não se deve assumir que o identificador define ou engloba a identidade do que é referenciado • Ex: “A mensagem de fax número 25” não foi completada satisfatoriamente.
Sobre identificador • Tampouco deve ser assumido que um sistema usando URI vai acessar o recurso identificado. • Ex:O professor Gauthier tem “conta corrente no BB número 123456-7”
Sobre identificador • O recurso identificado pode não ser de natureza única • Ex: “O responsável pela torre de controle” deve autorizar a decolagem. (vária no decorrer do dia) • Ex: “O relator do processo” deve apresentar seu parecer antes de iniciar a discussão do item de pauta. (existe um conjunto limitado de relatores)
Uniforme • (AURELIO) • 1.Que só tem uma forma. • 2.Que não varia. • 3.Semelhante, análogo, idêntico. • Fato de ser uniforme significa que não varia ou que só tem uma forma de identificar recursos
Uniformidade permite: • Diferentes tipos de identificadores de recursos serem utilizados no mesmo contexto, ainda que a forma de acessar os recursos seja diferentes • ftp://ftp.is.co.za/rfc/rfc1808.txt • http://www.ietf.org/rfc/rfc2396.txt
Forma análoga de interpretar semanticamente a convenção sintática comum dos diferentes tipos de identificadores de recursos • ftp://ftp.is.co.za/rfc/rfc1808.txt • Protocolo ftp • http://www.ietf.org/rfc/rfc2396.txt • Protocolo http
Uniformidade permite: • Introduzir novos tipos de identificadores de recursos sem interferir na forma em que os identificadores existentes são usados • ftp://ftp.is.co.za/rfc/rfc1808.txt • gauthier://www.ietf.org/rfc/rfc2396.txt
Reusar os identificadores em muitos contextos diferentes e, assim, que novas aplicações controlem ou reusem os identificadores pré-existentes
URL • Um tipo de URI muito comum é a URL (Uniform Resource Locator ) ou Localizador de Recurso Uniforme • Este tipo de URI não só identifica mas localiza o recurso permitindo que o computador o encontre • http://www.inf.ufsc.br/~gauthier).
Outro tipo de URIs, porem, somente identificam o recurso, • exemplo: “mid:” • identifica uma mensagem eletrônica • não é possível localiza-la a partir deste identificador.
URIs são descentralizadas • Ninguém controla sua criação a forma em que são usadas enquanto alguns esquema de URIs dependem de controle centralizado e outros são completamente descentralizados. • Não é necessária permissão de alguém para criar uma URI podendo-se inclusive criar URIs para itens dos quais não se é proprietário.
Uma prática comum para criar URIs é começar com descrevendo o objeto a ser identificado numa página web e utilizar a URL como identificação do objeto. • http://www.inf.ufsc.br/~gauthier/PlanodeNegocios/ • identifica a disciplina Plano de Negócios ministrada pelo Prof. Gauthier.
A Internet Engineering Task Force (http://www.ietf.org) controla a sintaxe das URIs