770 likes | 870 Views
Ciência da Web Carlos J. P. Lucena Novembro de 2009. INCT - Instituto Brasileiro de Pesquisa em Ciência da Web. Missão. Fazer avançar a pesquisa científica em temas associados à Ciência da Web;
E N D
Missão • Fazer avançar a pesquisa científica em temas associados à Ciência da Web; • Educar profissionais e pesquisadores, para garantir inovação e promover colaboração interdisciplinar; • Transferir conhecimento para todos os setores da sociedade através de programas educacionais abrangentes; e • Transferir conhecimento para a indústria e o setor de serviços através de programas específicos, incluindo residências no Instituto.
Motivação I • A Web é vista com frequênciaporespecialistasem CS comoumaaplicaçãoque“roda” sobre a rede • No entanto, ela tem seusprotocolospróprios, algoritmos e princípiosarquiteturais. • A Ciênciada Web estáligadaaoconceito decomportamentoemergente: como e porqueprincípios simples e outroscomportamentoslevam a estruturascomplexas e outrosfenômenos e como é possívelprevê-los de forma antecipada ? • A Web precisa ser estudada e compreendidacomo um fenômeno e tambémcomoumaentidade à qual se deveaplicarengenhariaparaviabilizar o seucrescimentofuturo e disponibilizar novas funcionalidades
Motivação II • Emuma agenda paraCiênciada Web o termociência é usado com doissentidos. • As ciênciasfísicas e biológicasanalisam o mundo natural e investigam leis microscópicasquequandoextrapoladaspara o âmbitomacroscópicosãocapazes de gerar o comportamentoobservado. • CiênciadaComputação, emboraparcialmenteanalítica, é principalmentesintética: estáinteressadaemcriar novas linguagens e algorítmoscapazes de produzirnovosresultadoscomputacionais. • A Ciênciada Web é umacombinação dos doisenfoques: a Web é um espaçocriadopelaengenhariamas, no entanto, humanossãooscriadores das páginas Web e seus links e suainteraçõesformampadrõesemergentesnaescalamacroscópica.
Motivação III • As interações no nível macroscópico, são governadas por convenções e normas sociais • A Ciência da Web, portanto, deve ser inerentemente interdisciplinar. • Seu objetivo é buscar entender o crescimento da Web e criar procedimentos para permitir nela a ocorrência de padrões novos, mais poderosos e mais benéficos
Berners-Lee, T. et al. Creating a science of the Web. Science 311 (2006). Web Ontem e Hoje • Ontem: Conteúdo textual expresso em HTML, trocado via HTTP, e visto em navegador simples apontando uma URL • Hoje: Variedade de ferramentas para acessar conteúdo mais rico • Gráficos vetoriais escaláveis, Semantic Web, dispositivos multimodais, e descrição de serviços • Conteúdo expresso em XML, trocado por novos protocolos (HTTP 1.1 e SOAP) e são endereçados por esquemas URI
Uma Agenda de Pesquisa para a Ciência da Web • Uma Visão com cinco dimensões • Pessoas e Sociedade, • Tecnologias de Software para Aplicações na Web, • Gerenciamento dos Dados da Web, • Infraestrutura da Web • Fundamentos da Ciência da Web Communications of the ACM July 2008
Pessoas e Sociedade • O instituto contribuirá para um melhor entendimento da forma como as pessoas interagem com os recursos da Web, da dinâmica das redes sociais, e dos impactos da Web sobre os indivíduos. • Tratará de interfaces para usuários com necessidades especiais. • Contribuirá para a análise de como atividades políticas utilizam a Web e como pesquisa em economia pode valer-se de dados extraídos da Web.
Tecnologias de Software para aplicações na Web • As atividades do instituto contribuirão para o desenvolvimento de aplicações na Web envolvendo milhares de processos independentes. • As atividades cobrirão ainda a criação de novas técnicas para desenvolver mundos virtuais para colaboração na Web, incluindo o e-learning como uma das aplicações alvo.
Gerenciamento de Dadosna Web • Esforços para resolver problemas cruciais na busca de dados e da organização de conteúdo na Web. • Ferramentas e técnicas para gerenciar dados multimídia na Web, para consultar bancos de dados disponíveis na Web, para dotar as páginas da Web de semântica e para desenvolver novos modelos de busca de dados na Web.
Infraestruturada Web • As pesquisas investigarão o projeto e implementação de novas arquiteturas de redes de computadores que viabilizarão a Web do futuro. • Contribuirão ainda para estender aplicações na Web para operar em plataformas computacionais móveis.
Fundamentos em Ciência da Web • Investigar propriedades do grafo da Web, para desenvolver novos métodos combinatórios, envolvendo o grafo, para investigar meta-heurísticas no contexto da matemática da Web • Investigar técnicas de modelagem que endereçam questões ligadas ao robustez e a interações complexas entre as aplicações da Web e seus usuários.
Equipe de Pesquisa • O Instituto congrega cerca de 106 pesquisadores doutores, com alto perfil de produção, liderados por 6 pesquisadores sênior. A equipe de pesquisa conta com: • 7 pesquisadores com nível máximo de bolsa de produtividade do CNPq (1A), • 3 detentores Ordem Nacional do Mérito Científico na classe Grã-Cruz, • 6 detentores Ordem Nacional do Mérito Científico na classe Comendador, • 4 membros da Academia Brasileira de Ciências, • e um total de 55 bolsistas de produtividade de pesquisa do CNPq.
Instituições • Departamento de Informática da PUC-Rio; • Programa de Engenharia de Sistemas e Computação da UFRJ; • Instituto de Computação – UNICAMP; • UERJ; • UENF; • UNIRio; • UFRn; • Rede Nacional de Pesquisa
Colaboração Internacional • DERI - Digital Enterprise Research Institute (http://www.deri.ie): reconhecido como um dos institutos líderes em pesquisa em Ciência da Web • L3S Research Center (http://www.l3s.de): este laboratório foca no desenvolvimento de métodos estado da arte para alavancar as áreas de Conhecimento, Informação e Aprendizado. • The David R. Cheriton School of Computer Science, U. of Waterloo (http://www.cs.uwaterloo.ca • LIP6 – Laboratoire d’Informatique de Paris VI (http://www.lip6.fr) • LERO - Home - Lero is the Irish Software Engineering Research Centre - http://www.lero.ie/
Programa de Pesquisa • Programa em 5 camadas: • Pessoas e Sociedade • Tecnologias de Software para Aplicações na Web • Gerenciamento de Dados da Web • Infraestrutura da Web • Fundamentos da Ciência da Web
Pessoas e Sociedade • Projeto da Interação • Redes Sociais • A Web e o Indivíduo • A Web e Política • A Web e Economia
Pessoas e SociedadeProjeto da Interação. • Para se considerar a Web como um objeto de estudo propriamente, é necessário entender o design da Web num contexto de desenvolvimento de aplicações abertas e escaláveis, seus requisitos arquiteturais e de dados, e as interações que ela possibilita • O design da interação é um tópico de pesquisa que requer a compreensão da Web como uma estrutura computacional que molda a interação com e entre os seus usuários. • Uma aplicação Web deve ser entendida como uma “máquina social”, no sentido de que inclui uma tecnologia subjacente, mas também as regras, políticas e estruturas organizacionais utilizadas para gerenciar tecnologia.
Pessoas e SociedadeProjeto da Interação.. 1 -Comunicação direta entre pessoas 2- Comunicação entre pessoas (ou grupos) mediada por computador (CMC) 4 -Comunicação do designer para os usuários 3- Interação humano- computador (IHC) 5- Comunicação entre aplicações Perspectivas de interação na Web.
Pessoas e Sociedade • Projeto da Interação • Redes Sociais • A Web e o Indivíduo • A Web e Política • A Web e Economia
Pessoas e SociedadeRedes Sociais. • Redes sociais são conjuntos de ligações que podem organizar igualmente e democraticamente pessoas, grupos e instituições em torno de um objetivo comum • É importante obter um melhor entendimento sobre os usuários da Web. • Contribuições esperadas deste sub-tópico incluem um conjunto de modelos em três eixos: • Interpessoal: modelos de construção de confiança e reputação na Web; modelos de formação e dissolução de redes sociais e grupos de trabalho; • Pessoal: modelos de motivação para contribuição de conteúdo para projetos de grupo ou pessoais; • De Interação: modelos de métodos e ferramentas preferidas para contribuição, interação e organização de grupos em diferentes situações.
Pessoas e SociedadeRedes Sociais.. Análise e Balanceamento de Redes Sociaisverificação de que elas são organismos vivos, alterando-se, evoluindo e permitindo que informações e conhecimentos circulem entre seus membros. Problemas estruturais presentes na formação da rede social deverão ser detectados e novos relacionamentos (entre os membros de uma rede social) serão propostos. Modelagem Intencional de Redes Sociais – Considerando a variedade de modelos envolvidos em redes sociais (e.g. modelos emergentes de reputação, confiança, motivação e formação de grupos na Web), torna-se necessário criar um framework para o desenvolvimento de ferramentas que integre todos os modelos, bem como fornecer mecanismos para reputação, incentivos, avaliação de autoridade e recomendações para grupos e parcerias.
Pessoas e SociedadeRedes Sociais.. Incorporação de Características Autonômicas no Controle das Redes Sociais – Tendo em vista que as redes sociais evoluem e podem se tornar complexas, analisá-las e gerenciá-las pode se tornar uma tarefa impossível. Possíveis problemas, como a desconexão entre membros e a ausência ou distorção de comunicação, podem afetar a interação, tornando a rede um mecanismo não-flexível. A principal idéia é que os recursos – sejam de software ou hardware – obedeçam à regra de self-CHOP, que significa auto-configuração (self-configuration), auto-cura (self-healing), auto-otimização (self-optimization) e auto-proteção (self-protection), podendo assim observar e responder às mudanças do ambiente nos quais estão inseridos.
Pessoas e SociedadeRedes Sociais... Redes Sociais Científicas - A colaboração científica possui um potencial para resolver problemas científicos complexos e promover vários compromissos políticos, econômicos e sociais, como a democracia, desenvolvimento sustentável, além da integração e entendimento culturais. Esta área de estudo visa identificar – de maneira quantitativa e qualitativa – como os profissionais deste meio interagem, criando mecanismos de identificar, avaliar e analisar as redes sociais construídas no cenário científico Redes Sociais Temporais e Móveis – Alguns relacionamentos e interações são realizados por um período de tempo definido, em um determinado local. Acompanhar, entender e analisar tais interações, as informações espaço-temporais relacionadas a tais redes, bem como prover mecanismos de socialização é um outro objetivo desta pesquisa.
Pessoas e Sociedade • Projeto da Interação • Redes Sociais • A Web e o Indivíduo • A Web e Política • A Web e Economia
Pessoas e SociedadeWeb e o Indivíduo. Comunidades, virtuais ou não, são redes de relacionamentos baseados em um ou mais conjuntos de afinidades. ambientes são desenvolvidos especificamente para servir de infra-estrutura para a formação de redes de relacionamentos (dos mais diversos tipos). Alguns exemplos são o Orkut, o MySpace, o Second Life e congêneres. Esses ambientes são freqüentemente usados em associação com outros, desenvolvidos com objetivos comerciais: MSM, Google Talk, Skype ....
Pessoas e SociedadeWeb e o Indivíduo.. • Averiguar com usuários da Web: • o que os usuários conhecem a respeito de comunidades virtuais, • de que modo, na visão deles, elas são criadas (a partir de quais programas/ambientes, como são divulgadas e recrutados os primeiros participantes), • quais as motivações que eles crêem estar por trás dessa criação, • quais as comunidades virtuais com as quais já entraram em contato, • quais as comunidades às quais pertencem, como chegaram a elas, • que tipos de relacionamentos elas albergam,
Pessoas e Sociedade • Projeto da Interação • Redes Sociais • A Web e o Indivíduo • A Web e Política • A Web e Economia
Pessoas e SociedadeWeb e Política. Neste sub-tópico queremos estudar a ação política, tanto organizada pelos partidos políticos, como de movimentos populares. A Internet e em particular a Web, acredita-se, são instrumentos cada vez mais importantes na mobilização política. Como ferramenta eleitoral no Brasil, a Web tem se mostrado uma ferramenta crescentemente importante mas ainda em um estágio inicial de uso no pais. O objetivo desta linha é acompanhar o uso da Web nas eleições municipais de 2012 e nas majoritárias de 2010.
Pessoas e Sociedade • Projeto da Interação • Redes Sociais • A Web e o Indivíduo • A Web e Política • A Web e Economia
Pessoas e SociedadeWeb e Economia. A web revolucionou a economia mundial de diversas formas. A partir dela foi criado um enorme complexo de indústrias, provendo infraestrutura, tecnologia de informação, e conteúdo. Em diversas áreas, como no mercado financeiro, em bolsas de valores, em comércio e compras entre empresas,transações mediadas pela web se tornaram freqüentes, e drasticamente afetaram a organização e a eficiência desses mercados. Mercados baseados na web oferecem uma oportunidade de pesquisa valiosa para economistas, tanto como um objeto de estudo como um recurso para a obtenção de dados. Diferentemente de mercados tradicionais, transações mediadas pela web deixam um traço; em mercados líquidos, um grande volume de informação sobre transações individuais rapidamente se acumula na deep web. Essas são fontes de dados que permitem um análise detalhada do comportamento econômico e a operação de instituições de mercado.
Programa de Pesquisa • Programa em 5 camadas: • Pessoas e Sociedade • Tecnologias de SW para Aplicações na Web • Gerenciamento de Dados da Web • Infraestrutura da Web • Fundamentos da Ciência da Web
Tecnologias de SW para Aplicações Web • Um enfoque multiagentepara o desenvolvimento de aplicações web autonômicas • Projeto e Implementação de Aplicações Dirigidas a Modelos • Implementação e Design de Workflows Autonômicos • Segurança e Resiliência de Aplicações Web • Ambientes Colaborativos Virtuais na Web
Tecnologias de SW para Aplicações na WebUm enfoque Multiagente. • Aplicações web atuais apresentam diversas tarefas que necessitam de interação humana para serem executadas. • A inclusão de novas funcionalidades que fornecem propriedades de autonomia a estas aplicações web podem trazer várias vantagens, provendo a automação (ou semi-automação) de tarefas que precisam de intervenção humana e a incorporação de serviços inteligentes. • Existem diversos exemplos que ilustram esse cenário, tais como: • (i) descoberta automática de novas fontes de dados quando a fonte de dados atual falha; e • (ii) descoberta e incorporação automática de novos serviços que podem surgir em ambientes dinâmicos.
Tecnologias de SW para Aplicações na WebImplementação e Design. • Este projeto de pesquisa é baseado na hipótese de que workflows podem adquirir comportamentos autonômicos, melhorando assim o seu desempenho e assegurando a sua completa execução. • A aplicabilidade deste trabalho não se restringe apenas à esfera comercial. Workflows autonômicos podem ser utilizados no cenário científico para o gerenciamento de workflows científicos, como os executados em ambientes de grades computacionais.
Tecnologias de SW para Aplicações Web • Um enfoque multi agente para o desenvolvimento de aplicações web autonômicas • Projeto e Implementação de Aplicações Dirigidas a Modelos • Implementação e Design de Workflows Autonômicos • Segurança e Resiliência de Aplicações Web • Ambientes Colaborativos Virtuais na Web
Tecnologias de SW para Aplicações na WebSegurançae Resiliência. • (i) lidar com dados de entrada provenientes de várias fontes, • (ii) prover respostas em tempo real, • (iii) adaptar-se a preferências definidas pelo usuário. • Deve fazer tudo isso, ao mesmo tempo em que a Web passe a disponibilizar novos serviços e novas alternativas de projeto e implementação • O ambiente Web torna os sistemas fundamentalmente mais complexos, trazendo novos desafios à segurança e à resiliência das aplicações Web-based.
Tecnologias de SW para Aplicações na WebSegurançae Resiliência. • O objetivo é desenvolver software recuperável , que possa ser resiliente aos defeitos endógenos e exógenos porventura existentes. • Os defeitos estão muitas vezes presentes em partes que são exercitadas com pouca freqüência [Humphrey, 2008], por exemplo, os trechos de códigos dedicados a detecção e tratamento de exceções em runtime- uma vez que estes tendem a ser insuficientemente testados, ou, muitas vezes, não são nem sequer testados.
Tecnologias de SW para Aplicações Web • Um enfoque multiagentepara o desenvolvimento de aplicações web autonômicas • Projeto e Implementação de Aplicações Dirigidas a Modelos • Implementação e Design de Workflows Autonômicos • Segurança e Resiliência de Aplicações Web • Ambientes Colaborativos Virtuais na Web
Tecnologias de SW para Aplicações na WebAmbientes Colaborativos. • Como meio de realização de e-science, a Web pode ser concebida como um i.e., Problem Solving Environment (PSE), i.e. um sistema de software avançado que provê as facilidades computacionais necessárias para resolver uma classe de problemas científicos complexos. • Essas facilidades incluem métodos de solução avançados, seleção automática e semi-automática de métodos de solução, e maneiras de incorporar novos métodos de solução. Além disso, PSEs usam a linguagem da classe de problemas alvo, de modo que os usuários podem executá-los sem conhecimento especializado a respeito da tecnologia de hardware e software que está por baixo. • Como ambientes relevantes, que unem Colaboração e Visualização, aparecem os Ambientes Virtuais Colaborativos (CVEs – Collaborative Virtual Environments), que são definidos como simulações de mundos reais ou imaginários onde a ênfase é prover a equipes distribuídas um espaço virtual comum, onde os participantes podem se encontrar, co-existir e colaborar, enquanto interagem com o ambiente, compartilham informações e manipulam artefatos em tempo real
Tecnologias de SW para Aplicações na WebAmbientes Colaborativos. • Nos últimos anos, a convergência de jogos e cinema tem sido vista como uma grande oportunidade para criar sistemas Storytelling Interativo onde os autores, o público e agentes virtuais se engajam em um processo colaborativo para criar e contar narrativas dinamicamente. • O presente projeto visa investigar o uso de técnicas de Storytelling Interativo para dar suporte a aplicações Web baseadas no conceito de narrativas. O projeto foca no suporte a aplicações Web em duas áreas principais: mundos virtuais e a produção de conteúdo cultural e de Educação à distância. Em ambas as áreas, os elementos descritos semanticamente serão reaproveitados na composição de novos artefatos, usando mecanismos de planejamento automático e de personalização de conteúdo.
Programa de Pesquisa • Programa em 5 camadas: • Pessoas e Sociedade • Tecnologias de Software para Aplicações na Web • Gerenciamento de Dados da Web • Infraestrutura da Web • Fundamentos da Ciência da Web
Gerenciamento de Dados na Web • Compartilhamento, Reuso e anotações de dados multimeios • Acesso à Deep Web • Desenvolvimento da Web Semântica • Descoberta de Conhecimento na Web
Gerenciamento de Dados na WebCompartilhamento ... • Os muitos problemas a serem lidados incluem, por exemplo, o projeto de novas estruturas de dados, esquemas de indexação e mecanismos para a busca e recuperação de dados. • Não somente existem grandes volumes de dados, mas temos também de lidar com vídeo, som, imagens, a serem processadas em tempo real, em uma multitude de web sites. • Ferramentas e serviços estão rompendo fronteiras de domínio e limites locais como uma conseqüência imediata da interoperabilidade progressiva entre dados e protocolos, aliados a um grau de conectividade cada vez maior
Gerenciamento de Dados na WebCompartilhamento ... • Um tópico importante de pesquisa está relacionado a mecanismos de recuperação de dados multimídia na Web que sejam, ao mesmo tempo, eficientes (performance) e efetivos (encontrem dados relevantes). Em particular, dois tópicos devem ser explorados: como descrever dados de forma compacta e como anotá-los de modo a melhorar sua semântica. • Uma possível direção é a chamada content-based retrieval, uma área com um número crescente de aplicações. Originalmente restrita a imagens, esta área vem progressivamente sendo estendida de modo a lidar com outros tipos de mídia, em especial video (incluindo pesquisa em visão computacional). • Este tipo de pesquisa é baseada na noção de similaridade – dado um grande conjunto de itens multimidia (imagens, em geral), o usuário quer recuperar os ítens que sejam mais similares a um dado ítem de entrada.
Gerenciamento de Dados na Web • Compartilhamento, Reuso e anotações de dados multimeios • Acesso à Deep Web • Desenvolvendo a Web Semântica • Descoberta de Conhecimento na Web
Gerenciamento de Dados na WebAcesso à Deep Web • Contrastando com a “Surface Web” composta de páginas estáticas, a “Deep Web” compõe-se de dados armazenados em bancos de dados, páginas dinâmicas e dados multimídia, entre outros tipos de objetos. • Algumas estimativas sugerem que o tamanho da Deep Web é muitas vezes maior do que o da Surface Web – a Deep Web teria cerca de 92.000 terabytes de dados enquanto que a Surface Web teria apenas 167 terabytes, em dados de 2003. • Os banco de dados da Deep Web tipicamente estão pouco representados nos mecanismos de busca devido à dificuldade de localizar, acessar e indexar os bancos de dados. • Os dados na Deep Web não estão disponíveis sob forma de páginas HTML estáticas, os mecanismos de busca tradicionais não podem descobrir os dados armazenados nos bancos de dados apenas seguindo os hyperlinks, mas tais mecanismos são obrigados a interagir com as interfaces de consulta.