660 likes | 858 Views
Sistemas de Recomendação. Hilário Tomaz E Renê Gadelha. Agenda. Introdução Coleta de Informações Estratégias de Recomendação Técnicas Sistemas de Recomendação Exemplos de aplicações Comentários Finais. Motivação. Cenário atual Grande volume de informação é apresentado ao usuário
E N D
Sistemas de Recomendação Hilário Tomaz E Renê Gadelha
Agenda • Introdução • Coleta de Informações • Estratégias de Recomendação • Técnicas • Sistemas de Recomendação • Exemplos de aplicações • Comentários Finais
Motivação • Cenário atual • Grande volume de informação é apresentado ao usuário • Problema: • Discernir o que é relevante dentre as opções • Identificação automática das necessidades do usuário
Definição de Sistemas de Recomendação • Conjunto de estratégias e técnicas destinadas a identificar e recomendar itens relevantes para usuários • E.g., produtos, pessoas, informações, etc... • Utiliza Filtragem de Informação para identificar informações relevantes e recomendá-las
Recomendação Processo de indicação já bastante conhecido na relação social entre seres humanos Tenta garantir satisfação dos usuários Aumenta a lucratividade das Empresas
Arquitetura Padrão (SCHAFER, 2000)
Coleta de Informação • Através da coleta de dados sobre o usuário, é possível conhecer melhor suas preferências • Para se recomendar itens a um usuário, primeiramente é necessário ter informações sobre • Dados pessoais • Dados comportamentais • É necessário identificar o usuário dentro do sistema • Identificação no Servidor • Identificação no Cliente
Coleta de Informação • Após identificar o usuário, é possível coletar dados sobre ele • A coleta pode ser: • Explícita (Customização) • usuário indica espontaneamente o que é importante para ele • Implícita • através de ações (dados de navegação) do usuário, inferem-se informações sobre suas necessidades e preferências • páginas consultadas, produtos visualizados, tempo de permanência, ...
Privacidade • Para que se possa recomendar itens de forma personalizada para os usuários, é necessário constantemente coletar dados sobre eles • o que muitas vezes é feita de forma implícita • Isso acaba levantando questões sobre a privacidade desses dados
Privacidade • Preocupações do Usuários: • Divulgação de dados fornecidos às empresas • Spam • Medidas: • Adotar uma política de privacidade adequada à Coleta de Dados
Estratégias de Recomendação • Diferentes estratégias podem ser usadas para personalizar ofertas para um usuário • Listas de recomendação • Avaliações de usuários • Recomendações do Usuário • "Usuários que se interessaram por X também se interessaram por Y" • Associação por conteúdo
Listas de Recomendação • Consiste em manter uma lista de itens organizados por interesse • "Itens mais vendidos” • "Idéias para presentes“ • Não necessita de uma análise profunda dos dados dos usuários para montar as listas
Listas de Recomendação • Vantagem • Fácil Implementação • Desvantagem • Recomendação não é específica para um determinado usuário
Avaliações de Usuários Utiliza o feedback dos usuários sobre um determinado produto Usuário além de comprar um produto, deixa um comentário sobre o item adquirido Utiliza as avaliações dos usuários para estabelecer a reputação de um item, ou produto
Avaliações de Usuários • Vantagem • Fácil Implementação • Avaliação de outros clientes podem influenciar novos consumidores • Desvantagem • Depende que o usuário forneça sua opinião sobre o item adquirido • Veracidade das opiniões fornecidas
Recomendações do Usuário • Baseia-se nas sugestões feitas especificamente para um determinado usuário • Dois tipos de recomendação são possíveis: • Preferências Implícitase Explícitas
Recomendação por Associação • “Usuários que se interessaram por X também se interessaram por Y” • A recomendação é obtida através de técnicas capazes de encontrar em uma base de dados associações entre itens avaliados por usuários • comprados, lidos e outros
Associação por Conteúdo • Estratégia baseada no conteúdo de determinado item, por exemplo, um autor, um compositor, um editor, entre outros • Necessário realizar uma análise mais complexa das informações dos produtos e usuários • Ex: Os livros A e B de determinado autor são frequentemente vendidos em conjunto
Técnicas de Recomendação Filtragem Baseada em Conteúdo Filtragem Colaborativa Filtragem Híbrida Filtragem Baseada em outros Contextos
Filtragem baseada em Conteúdo • Tem por objetivo relacionar descritores dos itens com as preferências dos usuários • Interesses dos usuários • podem ser fornecidos pelo próprio • coletados automaticamente através de ações como seleção e aquisição de itens
Filtragem baseada em Conteúdo Interesses dos usuários são transformados em vetores de termos e suas respectivas frequências nos itens
Filtragem baseada em Conteúdo • Outras abordagens • Sistemas de recuperação booleanos • Sistema de filtragem probabilística • Processamento de linguagem natural • Utilizar aprovação do usuário após cada recomendação • O perfil do usuário é constantemente atualizado • novas aquisições, rejeições, etc...
Filtragem baseada em Conteúdo • Limitações: • Alta similaridade entre itens pode confundir o mecanismo de recomendação • Conteúdo desestruturado dificulta a identificação do perfil do usuário ou do item • Não proporciona apresentação de conteúdo novo ao usuário
Filtragem Colaborativa Não necessita reconhecimento automático do conteúdo dos itens Baseado na troca de experiências entre usuários que possuem interesses comuns Relevância da recomendação é obtida pelo grau de “confiança” em outro usuário
Filtragem Colaborativa 1- calcular similaridade entre usuários 2- selecionar similares para predição 3- normalizar as avaliações e predizer de acordo com pesos dos vizinhos
Filtragem Colaborativa • Limitações: • Um novo item nunca é recomendado até que um usuário o avalie • Número de usuários pequeno em relação ao número de itens implica pontuações esparsas • Um usuário exótico terá dificuldades para encontrar outros usuários com gostos similares
Filtragem Híbrida Descoberta de novos relacionamentos entre usuários Recomendação de itens diretamente relacionado ao histórico Bons resultados para usuários incomuns Precisão independente do número de usuários
Filtragem baseada em outros contextos • Descoberta de novas características do usuário proporciona maior acerto nas recomendações • Características • Preferências • Competências • Informações demográficas • Traços de Personalidade
Descoberta de Conhecimento em Base de Dados (DCBD) “Um processo de extração não trivial de informações potencialmente úteis, as quais não são previamente conhecidas e encontram-se implícitas em grandes coleções de dados” (Zaiane, 2000) Utiliza técnicas e ferramentas de mineração de dados
Descoberta de Conhecimento em Base de Dados (DCBD) • Em uma pesquisa realizada em uma grande loja de departamento nos EUA, alguns fatos foram observados: • 20% dos consumidores que compram fraldas também compram cerveja • 80% dos consumidores que compram fraldas e cerveja em uma compra, voltam para comprar carne e carvão na sexta-feira
Descoberta de Conhecimento em Base de Dados (DCBD) • Tipos de Descoberta: • Regra de Associação • Classificação • Agrupamento
Classificação • Em um sistema de recomendação poderíamos utilizar a classificação: • Identificar a classe de itens novos em categorias pré-definidas • Classificar usuários pelos seus perfis
Classificação • Supondo que um sistema de recomendação guarde algumas informações sobre os seus usuários (status na universidade, país e área de interesse) • Prever que tipo de usuário estaria mais interessado em qual área de pesquisa
Agrupamento • Permitir a formação de grupos de indivíduos que possuam características em comum • Um dos métodos de agrupamento mais utilizado é ok-means • Um sistema de recomendação pode empregar estes agrupamentos para oferecer itens apropriados de acordo com as características de cada grupo
Avaliação de SR • Necessário verificar se as predições são aceitáveis para o propósito do SR • Principais métricas que podem ser adotadas na avaliação • Precision • Recall • Coverage