460 likes | 616 Views
O Conceito de Unidade Lexical. Jorge Baptista Universidade do Algarve Faculdade de Ciências Humanas e Sociais Laboratório de Engenharia da Linguagem Instituto Superior Técnico Centro de Automática da Universidade Técnica de Lisboa. jbaptis@ualg.pt http://w3.ualg.pt/~jbaptis.
E N D
O Conceito de Unidade Lexical Jorge BaptistaUniversidade do AlgarveFaculdade de Ciências Humanas e Sociais Laboratório de Engenharia da LinguagemInstituto Superior TécnicoCentro de Automática da Universidade Técnica de Lisboa jbaptis@ualg.pt http://w3.ualg.pt/~jbaptis
1. Unidade x Léxico x Sistema • ‘first things first’ • a definição de unidade lexical depende de e ao mesmo tempo determina o objecto de estudo da linguística • diferentes perspectivas de abordagem ao fenómeno da linguagem acarretam diferentes visões da forma como ela está organizada e o papel que o léxico nela desempenha
definir as unidades de um sistema é sempre o resultado de uma posição teórica de partida sobre a natureza do sistema, a metodologia para o analisar, os resultados que se espera obter, etc.
a visão do léxico como lista de formas e de propriedades, independente dos outros componentes da linguagem é, em si mesma, decorrente da ideia de que a linguagem se pode organizar em vários níveis/módulos/componentes relativamente independentes uns dos outros
a minha proposta: • reflexão em conjunto sobre o objecto de estudo da linguística • observação sobre a complexidade de noção de unidade lexical • reflexão sobre consequências para o ensino da língua (com especial referência ao ensino da língua materna) à luz dos pontos anteriores
2. Acesso à Língua via Linguagem • (prévio) distinção entre língua (conhecimentointeriorizado e partilhado pelos membros de uma comunidade linguística) e linguagem (realização/manifestação exteriorizada dessa competência) • ninguém nasce ensinado, e muito menos a saber falar uma língua: a aprendizagem da língua materna faz-se pela exposição a uma língua
a descrição linguística só pode ser feita a partir das realizações concretas (discursos), já que não se pode aceder directamente à língua (conhecimento interiorizado e partilhado pela comunidade)
é a partir da caracterização dos discursos que é possível construir a ‘abstracção’ teórica que constitui a noção de língua • isto não significa que não existe língua, apenas que ela não é directamente observável, pelo que tem de ser concebida como um objecto teórico
não é possível falar da linguagem sem utilizar a própria linguagem (as línguas naturais não têm uma metalinguagem externa) • por essa razão, só é possível caracterizar os discursos em termos de semelhanças e diferenças, ou seja, em termos combinatórios
a descrição dos discursos procede em dois níveis básicos: • a determinação dos sons da linguagem e das respectivas restrições combinatórias, de um modo que não interfere no significado das expressões • a determinação de sequências de sons e das respectivas restrições combinatórias de um modo que afecta/está ligado ao significado das expressões
Exemplo: • a cadeia sonora pode ser decomposta em unidades discretas (fones) meramente na base da percepção de que duas sequências de sons são entendidas como iguais ou diferentes [vi pátu] [vi gátu]
para tal, o significado da expressão – ou mesmo a sua existência na língua – é (praticamente) irrelevante: [pÉt] [gÉt]
os fones enquanto propriedades físicas da cadeia sonora não formam unidades discretas (p. ex. vogais) • o seu valor linguístico é função destas oposições distintivas: são elas e a estrutura das relações entre si que definem os fonemas da língua – as suas unidades discretas • a partir das combinações em que entram é que é possível determinar elementos portadores de significado
Exemplo: [vi pátu] [vi u pátu] leva a considerar a existência de dois elementos : [ ] [u ] ou, em alternativa: [ ~ ] (nasalidade) [ _ ] (ausência de nasalidade)
na medida em que estes se opõem regularmente a outros elementos: [vi pátu] [viupátu] [viumpát] [viuS pátuS] [ve pátu] [veu pátu] [veum pát] [vê pát] ... é possível constituir conjunto de oposições:
pátuS pátu pát um pátS S umS u S uS
as regularidades combinatórias observáveis levam, por seu turno, a agrupar sequências de sons em classes: (X-o, -a, -os, -as)N (W-o, -as, -a, -amos, ... -r)V (o, um)Det X • Todas as categorias gramaticais tradicionais podem ser obtidas desta forma
3. Unidades lexicais vs. palavras gramaticais • distinção entre elementos lexicais “plenos” e elementos lexicais de natureza gramatical • candidatos ao estatuto de elementos gramaticais: ‘morfemas-presos’ (de tempo-modo-aspecto e pessoa-número), preposições, pronomes, determinantes, etc.
Que estatuto atribuir aos elementos gramaticais ? • [dificuldades:] ausência de uma metalinguagem externa; (não-) pertinência do critério referencial • intuitivamente, há uma distinção clara entre: carro, ler, aberto, depressa e : de, um, -mos, ele
os elementos gramaticais constituem um conjunto finito, de dimensão (relativamente) reduzida, enumerável em extensão e evoluem lentamente, • os elementos ‘lexicais’ são a priori em número muito maior, que evolui em função da realidade extralingística, podem sempre ser acrescentados por neologia ou cair em desuso
por outro lado, é evidente que os elementos gramaticais veiculam um determinado tipo de informação: O Zéleuo livro = O Zé[LER+ passado+ perfeito] o livro • o facto de em Português esta informação ser veiculada por ‘morfemas presos’ é acidental; noutras línguas estas informações são expressas por palavras independentes (com acentuação própria)
da mesma forma, nas combinações com verbo auxiliar + verbo, a informação gramatical é veiculada por um ‘morfema livre’: O Zé(está+ anda+ continua) aler o livro O Zé(acabou + parou) deler o livro O Zé(começou + desatou) aler o livro
em contrapartida, há claramente elementos que, consoante a combinação em que entram: • não veiculam nenhuma informação : O Zé leu o livro O Zé gostade + o livro em que de é claramente aqui uma preposição (‘que vem antes de’) • veiculam de facto uma informação precisa: O Zé veiodeFaro
A distinção entre ‘morfema preso’ e ‘morfema livre’ também não é suficiente • contracções: dos(= de + os) • palavras compostas: O Zé leu o livroantes deadormecer • contracção de palavras compostas com palavras simples: O Zé leu o livroantes daAna antes da(= antes de + a)
certos sufixos estão sistematicamente relacionadas com frases em que o elemento seu homólogo é uma palavra independente: N0 ter a qualidade de ser Adj = N0 ter a Adj-n-idade
a distinção entre as palavras compostas (que ortograficamente se representam por duas ou mais palavras gráficas / com acento tónico independente) e as palavras simples também não é linear: O Zé vai (amanhã + de manhã) a Lagos a razão pela qual amanhãse escreve sem espaço em branco é acidental, convencional, histórica e meramente ortográfica (poderia, p.ex., escrever-se *à manhã como em à noite)
as palavras compostas, por seu turno, têm o MESMO estatuto, como unidades lexicais, que as palavras simples • a composição afecta TODAS as categorias gramaticais: O Zé leu um (livro + romance policial )N O Zé é muito (charmoso + bem-parecido)Adj Isso só depende de (nós + a gente)Pron O Zé caminhou (por + ao longo de)Prepo caminho O Zé comeu (dois + vinte e dois)Numbolinhos O Zé leu o livro (por + em virtude de)Conjquerer saber mais sobre o assunto ...
o número de palavras compostas é claramente muito superior ao número de palavras simples • os dicionários usuais, em grande medida, subestimam o número de palavras compostas e registam apenas as que são semanticamente opacas
a determinação de uma unidade lexical composta faz-se com base no facto de apresentar restrições combinatórias relativamente às propriedades que seria à partida possível observar em sequências livres formadas pelas mesmas categorias gramaticais
finalmente, certas combinações verbo-nome devem ser consideradas como um ‘bloco’: O Zé (foi para os anjinhos + está a fazer tijolo + bateu a bota + esticou o pernil + já não está entre nós + está na paz do Senhor + ...) O Zé e a Ana (juntaram os trapinhos + deram o nó + ... )
o seu significado não é composicional, i.e. não pode ser calculado com base na soma do significado que, noutros contextos, cada uma das palavras poderia apresentar • apresentam fixidez combinatória, i.e. não permitem as variações formais que se esperaria encontrar, dada a estrutura e a natureza sintáctica dos elementos desta combinatórias
No caso destas ‘frases fixas’ o problema principal é que a unidade lexical não é apenas uma mera combinação de palavras, mas sim uma frase, com um verbo, com flexão relativamente livre e um sujeito também ele distribucionalmente livre (humano).
parece, pois, que o léxico deverá conter não só as palavras simples, mas também as palavras compostas e todos os elementos gramaticais que contribuem para a informação veiculada pelo discurso • haverá uma forma de estruturar o léxico num sistema descreva a linguagem, tendo em conta essa sua composição?
4. Linguagem e Informação • a ideia principal de Harris é a que a linguagem veicula informação • o conceito matemático de informação, tal como este autor o adopta para a descrição da linguagem, está ligado à observação de os elementos da língua não se combinam indiferentemente uns com os outros, apresentando importantes desvios a partir da equiprobabilidade combinatória
estes desvios criam aquilo a que se chama a redundância da informação do sistema • ela baseia-se nas restrições combinatórias observáveis entre os elementos do sistema • as combinações de elementos baseiam-se numa assimetria fundamental: a noção de operador e de argumentos, decorrente da ordem parcial de entrada das palavras numa frase
operadores são palavras que requerem a presença de uma ou mais palavras (os seus argumentos) para entrarem na frase • as unidades lexicais são, pois, de dois tipos fundamentais: as palavras que funcionam como operadores e as palavras que não podem funcionar como operadores (argumentos elementares)
operadores argumentos elementares livro cadeira mesa árvore sol Zé ler em alto ___________ gosta de ante de de 1ª ordem • os discursos são o resultado de operações (funções) dos operadores sobre os seus respectivos domínios de argumentos. de 2ª ordem
daqui decorre que a estrutura do léxico incluirá, além dos argumentos elementares (tipicamente nomes concretos), todas as restantes entradas lexicais (operadores) • uma vez que estes operadores determinam uma construção, essas entradas lexicais não são propriamente PALAVRAS, mas sim FRASES, mais concretamente:FRASES ELEMENTARES
cada operador determina a construçãosintáctica da respectiva frase elementar: • número de argumentos, • tipo de argumentos, • preposições que introduzem os complementos • natureza distribucional dos argumentos • propriedades transformacionais da construção
palavras derivadas entram muitas vezes em relações parafrásticas, de natureza transformacional: O Zé leurapidamente o documento = O Zé fez uma leiturarápida do documento
tal faz pensar que a unidade lexical nem sequer será a palavra associada a uma categoria gramatical • a categoria seria uma das formas de actualização sintáctica da mesma unidade lexical, transformacionalmente relacionadas: LE.R (-r V; -ituraN; -itorN; -gívelAdj) RAPID.O (-oAdj; -amenteAdv)
desta perspectiva resulta que não há uma fronteira clara entre léxico, sintaxe e semântica • cada unidade lexical (predicativa) tem de conter informação sobre a sua construção, as suas propriedades distribucionais e as suas propriedades transformacionais
Cada frase elementar é a expressão de um único predicado semântico • a análise de um discurso é, pois, a sua decomposição nas frases elementares que lhe deram origem e a respectiva ordem parcial de entrada dos vários operadores
O Pedro prefere ler BD a ouvir música Quantos PREDICADOS tem esta frase? preferir (Pedro1, ler , ouvir) ler (Pedro2, BD) ouvir (Pedro3, música) Pedro1 = Pedro2 Pedro1 = Pedro3
ler Onn preferir Onoo ouvir Onn Pedro1 Pedro2 BD Pedro3 música O Pedro prefere ler BD a ouvir música NB: representação muito simplificada
Bibliografia Baptista, J. 1994. Estabelecimento e Formalização de Classes de Nomes Compostos. Dissertação de Mestrado em Linguística Portuguesa Descritiva apresentada à Faculdade de Letras da Universidade de Lisboa. Lisboa : FLUL (não publicada). Gross, G. 1988. Degré de figement des noms composés. Langages 90: 57-72. Paris: Larousse. Gross, G. 1990. Définition des noms composés dans un léxique-grammaire. Langue Française 87: 84-90. Paris: Larousse. Gross, G. 1996. Les expressions figées en français. Paris: Ophrys. Gross, M. 1975. Méthodes en syntaxe. Paris: Hermann. Gross, M. 1981. Les bases empiriques de la notion de prédicat sémantique. Langages 63: 7-52. Paris: Larousse. Gross, M. 1982. Simple sentences.Text Processing. Proceedings of Nobel Symposium 51, S. Allén (Ed.): 297-315. Stockholm: Almqvist & Wiksell International. Gross, M. 1988. La phrase élementaire et ses composants. Discussion de quelques exemples. La prédication séconde.Travaux de Linguistique 17:13-32. Paris/Gembloux: Duculot. Gross, M. 1991. Lexique et Syntaxe. Travaux de Linguistique 23: 106-132. Bruxelles: Duculot. Gross, M. 1996. Lexicon Grammar. In Brown, K e J. Miller (Eds.) Concise Encyclopedia of Syntactic Theories. Cambridge: Pergamon: 244-259. Harris, Z. S. 1976. Notes du Cours de Syntaxe. Maurice Gross (Trad.).Paris: Édition du Seuil. Harris, Z. S. 1981. Papers on Syntax. Henry Hiz (Ed.). Dordrecht: D.Reidel Publishing Company. Harris, Z. S. 1991. A theory of Language and Information. A Mathematical Approach. Oxford: Clarendon Press. Leeman, D. 1999. L’Unité lexicale dans la perspective harrissienne, in G. Petit (ed.) 1999. LINX 40: 117-136. Paris: Univ. Paris 10. Marques Ranchhod, Elisabete, Uma imagem da Gramática. Rev. Fac. Letras 15: 109-120. Lisboa: FLUL.