160 likes | 283 Views
YouTube 2 Día 35, 11 abril 2014. Cultura computacional en español SPAN 4350 Harry Howard Tulane University. Organizaci ón del curso. Las grabaciones y las presentaciones están disponibles en: http://www.tulane.edu/~howard/SPAN-NLP/
E N D
YouTube 2Día 35, 11 abril 2014 Cultura computacional en español SPAN 4350 Harry Howard Tulane University
Organización del curso • Las grabaciones y las presentaciones están disponibles en:http://www.tulane.edu/~howard/SPAN-NLP/ • La versión en inglés del tema es http://www.tulane.edu/~howard/CompCultES/control.html • Las notas están en el Gradebook de Blackboard. SPAN 4350 - Harry Howard - Tulane University
Experimento:Shayra Burgos-García <sburgosg@tulane.edu> jueves 27 de marzo:: a partir de las 2pm (2 sujetos) sábado 29 de marzo:: a partir de la 1pm (2 sujetos) domingo 30 de marzo:: a partir de la 1:30pm (2 sujetos) jueves 3 de abril:: a partir de las 2pm (2 sujetos) SPAN 4350 - Harry Howard - Tulane University
Repaso SPAN 4350 - Harry Howard - Tulane University
El proyecto final SPAN 4350 - Harry Howard - Tulane University
YouTube SPAN 4350 - Harry Howard - Tulane University
View source y buscar el texto <div class="comment-text" dir="ltr"> <p>excelente cancion, no me gusta el video,considero que es una estrategia facilista utilizada en su mayoria por regguetoneros, se supone que la diferencia es que en generos como el de esta cancion y este grupo es que si se puede utilizar la imaginacion de una manera creativa...en definitiva no me gusta el video es como devolverse en la evolucion de lo que nos caracteriza..ademas eso de utilizar viejas (bien buenas no nos digamos mentiras) como con el solo objetivo del placer sexual no aguanta :/</p> </div> SPAN 4350 - Harry Howard - Tulane University
youtube.py # -*- coding: utf-8 -*- from bs4 importBeautifulSoup import re, requests # seleccionar el video y bajar sus comentarios youtube = 'http://www.youtube.com/all_comments?v=' video = 'w_hdJU-tK8o' feed = requests.get(youtube+video).text # sacar el markup de los comentarios sopa = BeautifulSoup(feed) comentarios_etiquetados = sopa.findAll('div', {'class': 'Ct'}) printcomentarios_etiquetados[0] printlen(comentarios_etiquetados) # quitar el markup comentarios = [] for e in comentarios_etiquetados: comentarios.append(BeautifulSoup(str(e)).get_text()) printlen(comentarios) print comentarios[0] SPAN 4350 - Harry Howard - Tulane University
youtube.py # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup urlStart = 'http://gdata.youtube.com/feeds/api/videos/' urlEnd = '/comments?&start-index=1&max-results=50&v=2' video = 'w_hdJU-tK8o' feed = requests.get(urlStart+video+urlEnd).text html = BeautifulSoup(feed) comentariosEtiquetados = html.findAll('content') comentarios = [] for c in comentariosEtiquetados: noBOM = BeautifulSoup(str(c)).get_text().replace(u'\ufeff', '') comentarios.append(noBOM.encode('utf8')) # for c in comentarios: print c print 'número de comentarios = '+str(len(comentarios)) SPAN 4350 - Harry Howard - Tulane University
Resultados 1.093 Vírgenes..... U,u Awwww... uffff... =D <3 Me encanta :3 #posnoschorreamos u,u <3 Ughh. I am so in love with this song. ►....♪♫ Jiji exactamnte exocitica............ Aishhhhhhhhhhhhhhhhhhh ! :Q jijiijijijiijiijij <3 Its the best song I can ever hear Super bakano Me encantaaaa!!! ... Me encanta simplemnt prfcta! Malo Chingona la.neta :) PINCHE ROLÓN, 913 virgenes 3:37 THAT FACE XD ♡ ♡ ♡ ♡ ♡ Chimba de cancion *-*Dema nice k bakano etc número de comentarios = 50 SPAN 4350 - Harry Howard - Tulane University
Prueba • Sacar los comentarios de un video de YouTube que te guste y mételos en un diccionario con la fecha y el usuario. SPAN 4350 - Harry Howard - Tulane University
http://www.tulane.edu/~howard/CompCultES/twitter.html#how-to-tell-streamlistener-to-send-tweets-to-a-databasehttp://www.tulane.edu/~howard/CompCultES/twitter.html#how-to-tell-streamlistener-to-send-tweets-to-a-database Bases de datos SPAN 4350 - Harry Howard - Tulane University
¿Redes? El próximo día SPAN 4350 - Harry Howard - Tulane University