90 likes | 208 Views
De volta à sintaxe de Matias Aires. Helena Britto (Unicamp) helenabritto@mpcnet.com.br. Rumo à anotação sintática.
E N D
De volta à sintaxe de Matias Aires Helena Britto (Unicamp)helenabritto@mpcnet.com.br www.ime.usp.br/~tycho/participants/hbritto_page
Rumo à anotação sintática... ...para treinamento do analisador (parser) automático, desenvolvido no âmbito do projeto Padrões Rítmicos, Fixação de Parâmetros e Mudança Linguística(Coord Charlotte Galves, FAPESP) 1999 Inserido em um projeto de pesquisa que visa sobretudo a estudar a relação entremudança prosódica e mudança sintática no período do português comumente denominado clássico, o objetivo do Corpus Tycho Brahe é disponibilizar publicamente dados históricos do português europeu anotados de tal maneira que os estudiosos de sua história possam recuperar rápida e inambigüamente informações categoriais e estruturais pertinentes a análises morfo-sintáticas da língua. Segundo a metodologia proposta no Penn Corpus of Middle English, a etiquetagem morfológica dos textos constitui o primeiro passo deste processo de anotação, servindode base para a codificação sintática subseqüente. (InGalves e Britto, 1999) 2002 O Corpus Tycho Brahe conta atualmente com 2,000,000 de palavras, e o processo de anotação sintática inicia-se em parceria com a Universidade da Peinsilvânia www.ime.usp.br/~tycho/participants/hbritto_page
Anotação sintática de Matias Aires... ...para primeiro treinamento do analisador (parser) automático, por Helena Britto Matias Aires (1705-1763) www.ime.usp.br/~tycho/participants/hbritto_page
Primeiros resultados do parser trecho do primeiro arquivo de saída do parser, sem ainda qualquercorreção semi-automática (IP (NP (D O) (N amor) (ADJ puro)) (, ,) (NP (ADJ belíssima) (NPR Genoveva)) (, ,) (SR é) (ADJP (Q muito) (ADJ raro))) (IP (NP (D A) (N ocasião) (PP (P de) (IP (VB encontrá-lo) (, ,) (PP (P para) (IP (NP (CL vos)) (VB fazer) (NP (D a) (N pintura))))))) (, ,) (SR é) (ADJP (Q muito) (ADJ dificultosa))) (IP (NEG Não) (VB sabeis) (CP (CP (C que) (IP (NP (D o) (N amor)) (VB passa) (PP (P em) (NP (N ideia))))) (CONJP (CONJ e) (CP (C que) (, ,) (IP (IP (SR sendo) (ADJP (ADJ semelhante) (PP (P à) (NP (N visão) (PP (P dos) (NP (N espíritos))))))) (, ,) (NP (Q todo) (D o) (N mundo)) (VB fala) (PP (P dele)) (, ,) (PP (ADV talvez) (P sem) (IP (HV haver) (PP (P no) (NP (N mundo))) (NP (CP (WNP (WPRO quem)) (IP (NP (NP (CL o))) (VB conheça))))))))))) www.ime.usp.br/~tycho/participants/hbritto_page
Anotação e análise sintáticas Enriquecendo o rol de tópicos de estudos em Teoria Gramatical Notas sobre clivadas Dados IE se muda,é só de espécie. (In Matias Aires 1705-1763)Dados II*Essas coisas que eu disse foi para mostrar que... *Isso que eu disse foi para mostrar que...*O que eu disse foi para mostrar que ... (In Matias Aires 1705-1763) [[O que eu disse]i [eu disse cvi] foi para mostrar que...][eu disse o que eu disse foi para mostrar que ...] Princípio Apenas o constituinte clivado nunca pode ser não realizado foneticamente, pois, para além do componente interpretativo, porta informação relevante para o componente fonético- fonológico; sobre o restante da construção o princípio não se aplica www.ime.usp.br/~tycho/participants/hbritto_page
Das clivadas... ... a critério para distinção entre estas e sentenças that (IP-MAT (NP-SBJ (D-F A) (N vaidade)) (VB-P+SE-1 parece-se) (NP-SE (SE *ICH*-1)) (Q muito) (PP (P com) (NP (D o) (N amor-próprio))) (, ,) (CP-ADV (CONJS se) (IP-SUB (NP-SBJ (EX *exp*) (CP-THT *EXP*-9)) (SR-P é) (CP-THT-9 (C que) (IP-SUB (NP-SBJ *pro*) (NEG não) (SR-P é) (NP-ACC (D o) (ADJ mesmo)))))) (. ;)) www.ime.usp.br/~tycho/participants/hbritto_page
A sintaxe do senão I Como adverbial (CP-QUE (CONJ e) (PP (P com) (NP (N efeito))) (, ,) (WADVP-12 (WADV quando)) (IP-MAT (ADVP *T*-12) (NP-SBJ-8 *pro*) (NP-SE *-8 (SE se)) (VB-D viu) (CP-ADV (IP-SUB (NP-SBJ elliptical) (SENAO senão) (ADV agora))) (, ,) (IP-INF (VB+SE-5 sentar-se) (NP-SE (SE *ICH*-5)) (PP (P+D no) (NP (ADJ mesmo) (NPR Trono))) (NP-SBJ (NP (NP (D-F a) (NPR Soberania)) (CONJP (CONJ e) (NP (D-F a) (NPR Benignidade)))) www.ime.usp.br/~tycho/participants/hbritto_page
A sintaxe do senão I Como partícula de foco (...) (ADV já) (NP-1 (CL me)) (NEG não) (VB-P posso) (IP-INF (NP-ACC *ICH*-1) (VB emendar) (PP (P por) (NP (D-F esta) (N vez)))) (, ,) (PP (SENAO senão) (P com) (IP-INF(VB prometer) (, ,) (CP-THT (C que) www.ime.usp.br/~tycho/participants/hbritto_page