280 likes | 360 Views
Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org http://dtil.unilat.org. Rappel des faits connus sur la diversité linguistique (DL). La moiti é des langues risquent de dispara î tre.
E N D
Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org http://dtil.unilat.org Colloque Vox Internet II - Paris, 26-27 mars 2010
Rappel des faits connus sur la diversité linguistique (DL) • La moitiédes langues risquent de disparaître. • 96% des langues parlées par 4% des habitants de la planète. • 70% des langues parlées dans 20 pays, pour la plupart, les plus démunis. Sources: CIRAL, Crystal, Unesco Colloque Vox Internet II - Paris, 26-27 mars 2010
Rappel des faits connus • 98% des langues ne couvriraient que des besoins affectifs et locaux. • < 150 langues disposent de la protection d’une entité publique. • Entre 10% et 33% (les sources diffèrent) des langues seraient écrites. Sources: CIRAL, Crystal, Unesco Colloque Vox Internet II - Paris, 26-27 mars 2010
Rappel des faits connus • Plus de 60 % des pays de la planète ont pour langue officielle l’anglais (~22 %), le français (~15 %) l’espagnol (~10 %), l’arabe (~10 %), le russe ou le portugais. • 6 langues (DE, EN, ES, FR, JA et RU) produiraient les 2/3 des titres du monde, dont l’anglais, 28 %. • 30 langues publient annuellement au moins1 000 titres. Sources: CIRAL, Calvet Colloque Vox Internet II - Paris, 26-27 mars 2010
Diversité linguistique et cyberespace Colloque Vox Internet II - Paris, 26-27 mars 2010
Diversité linguistique par région Source : Ethnologue Colloque Vox Internet II - Paris, 26-27 mars 2010
Nombre d’internautes par région Source : Internet World Stats 2009 Colloque Vox Internet II - Paris, 26-27 mars 2010
Comparaison répartition internautes/diversité linguistique Colloque Vox Internet II - Paris, 26-27 mars 2010
Quelques données anecdotiques… mais non moins éclairantes • En 2005, l’islandais (240 000 locuteurs) était reconnu par Google, mais pas le kiswahili (30 millions de locuteurs) ou le hindi (300 millions de locuteurs). • Aujourd’hui, le hindi est reconnu, mais aucune langue africaine, américaine ou océanienne ne l’est, sur un ensemble de < 50 langues. Son interface est disponible en 120 langues • Nombre de langues dans Wikipédia : moins de 300 Colloque Vox Internet II - Paris, 26-27 mars 2010
Langues des internautes Source : Internet World Stats 2009 Colloque Vox Internet II - Paris, 26-27 mars 2010
Présence de l’anglais dans le Web 100 % 0 % 95 96 97 98 99 00 01 02 03 04 0506 07 08 09 Colloque Vox Internet II - Paris, 26-27 mars 2010
Les langues romanes dans la Toile • Tableau évolution 1998-2007 Source: FUNREDES-Union latine Colloque Vox Internet II - Paris, 26-27 mars 2010
D’autres études… • Autres langues très présentes selon d’autres études : chinois, japonais, suédois, arabe, etc. • Attention aux interprétations : *Nombre d’utilisateurs ≠ Nombre de pages ; • Il existe d’autres méthodes, mais basées sur des techniques de sondages (peu représentatifs) ou d’algorithmes linguistiques de moteurs de recherche (peu fiables). Colloque Vox Internet II - Paris, 26-27 mars 2010
Évolution langues romanes (et allemand) entre 1998-2007 — Web http://dtil.unilat.org/public/12_annees_langues_internet.pdf Colloque Vox Internet II - Paris, 26-27 mars 2010
Production et productivité par région Production = % de pages produites dans la langue Productivité = Production / % internautes parlant cette langue Colloque Vox Internet II - Paris, 26-27 mars 2010
Recul des langues moins répandues ? • En 2003, seuls 3,22 % des 1374 sites africains étudiés, la langue de communication était une langue africaine [Diki-Kidiri, 2003] • Selon le Language Observatory Project (Japon) : La tendance à favoriser les langues dominantes semble reprendre Colloque Vox Internet II - Paris, 26-27 mars 2010
Langues de « prestige » et « spirale des langues » « Lorsque les locuteurs d’une langue de moindre diffusion utilisent la langue, “de prestige” à > 50 % du temps, il y a de fortes chances que la génération suivante l’emploie à 100 % du temps » (Dixon) « Moindre valeur, moindre usage ; moindre usage, moindre valeur » (Leáñez Aristimuño) Colloque Vox Internet II - Paris, 26-27 mars 2010
Équipement des langues Leáñez Aristimuño • Langues « équipées » : • couvrent tous les secteurs importants pour la majorité de ses locuteurs. • Langues facilement« équipables » : • plusieurs secteurs majeurs couverts, mais il reste encore de nombreuses lacunes ; • population, moyens matériels disponibles et valorisation de la langue permettent de combler ses lacunes. • Langues difficilement « équipables » : • ne couvrent qu’une faible partie des secteurs nécessaires ; • faible population et/ou faibles moyens et/ou faible valorisation de la langue. Colloque Vox Internet II - Paris, 26-27 mars 2010
Quelques constatations • Grosso modo, les 30 premières langues reconnues par Google en 2005étaient les grandes productrices de littérature traditionnelle et ont une présence visible dans la connaissance. • Après une progression des langues moins diffusées, on constate un tassement et une régression sur le Web. • Les grandes langues de communication connaissent également une situation similaire, mais moins grave, car elles paraissent être prédatrices vis-à-vis des premières. • La tendance plus « commerciale » du Web constaté ces dernières années pourrait expliquer ces deux derniers phénomènes. • La productivité de pages Web des langues « équipées » paraît être liée aux conditions socioéconomiques des locuteurs et non pas aux langues elles-mêmes. Colloque Vox Internet II - Paris, 26-27 mars 2010
Quelques questions • Le cyberespace n’est-il pas que le reflet de la présence des langues dans la connaissance et dans le commerce ? • Les langues moins équipées souffrent-elles d’un manque de prestige dans le Web par le fait de ne pas être vecteurs de commerce ? • La régression constatée des langues équipées est-elle due à la même situation vis-à-vis de l’anglais ou est-elle provoquée par les nouvelles tendances des moteurs de recherche ? • Pour les langues équipées, est-ce l’alphabétisation numérique qui produit des internautes producteurs au Nord et consommateurs au Sud ? Colloque Vox Internet II - Paris, 26-27 mars 2010
Quelques questions • Comment une langue dite « orale » peut-elle emprunter les voies du cyberespace ? • Comment éviter la spirale des langues ? • L’Internet confère-t-il « du prestige » à une langue ? • …et tant d’autres questions… Colloque Vox Internet II - Paris, 26-27 mars 2010
Comment assurer la présence d’une langue dans le cyberespace ?Marcel Diki-KidiriPublication en français, anglais, russe, espagnol et portugais (UNESCO-Union latine)http://unesdoc.unesco.org/images/0014/001497/149786f.pdf Colloque Vox Internet II - Paris, 26-27 mars 2010
Comment assurer… ? M. Diki-Kidiri • Élaboration de ressources linguistiques • Sélection de textes, transcription phonétique, analyse et notation de phonèmes et de tons, élaboration d’une orthographe, ouvrage de référence (« grammaire ») • Développement terminologique • Élaboration de ressources informatiques • Systèmes d’écriture et orthographes • Jeux et polices de caractères, codage des caractères • Localisation des logiciels • Élaboration de contenus culturels • Textes, son, images • Voies d’accès au cyberespace (sites-blogs, messagerie, messagers, téléphonie, vidéos, etc.) • Développer la communauté des utilisateurs (actions tant socioculturelles que politiques) • Cet ouvrage a ouvert la voie… Colloque Vox Internet II - Paris, 26-27 mars 2010
Maaya - 2007-2009 • Coalition dynamique pour la diversité linguistique au sein du Forum sur la gouvernance de l’Internet (IGF) (Rio — 2007 et Hyderâbâd – 2008) • Sous-modération du point Diversité linguistique de la ligne C8 du plan d’action du SMSI • Congrès mondial sur la traduction spécialisée (La Havane – décembre 2008) • Forum international sur le multilinguisme (Bamako - janvier 2009) • Colloque Langues et cyberespace (Barcelone – juin 2009) Colloque Vox Internet II - Paris, 26-27 mars 2010
Le réseau Maaya propose, entre autres, ces objectifs : (après le Forum de Bamako et en accord avec la Coalition dynamique pour la diversité linguistique, s’appuyant sur la ligne C8 du SMSI) • Création de conditions pour l’usage des langues locales dans la gestion locale • Recensement des ressources techniques et humaines de toutes les langues parlées • Recensement des langues non outillées convenablement • Sensibilisation aux enjeux de l'inclusion numérique • Utilisation éthique de l'information en matière linguistique • Participation universelle dans les décisions sur la gouvernance des TIC • Site centralisateur d'outils linguistiques libres et gratuits • … Colloque Vox Internet II - Paris, 26-27 mars 2010
Et notamment : • Sommet mondial du multilinguisme —En préparation avec l’UNESCO • - « Manuel didactique sur les enjeux des langues dans le cyberespace » • Parrainé par l’UNESCO et demandes en cours auprès de l’UIT et l’ONU • 30 articles en coopération et sur la base d’un cahier des charges • Une trentaine d’auteurs de 25 pays différents • En PDF, papier, cédérom et produits dérivés • Anglais-français en simultané • Très probablement d’autres langues onusiennes • Invitation à sa traduction pour d’autres langues • Système de veille sur le comportement des langues dans le cyberespace - Demande en cours Colloque Vox Internet II - Paris, 26-27 mars 2010
Présence des langues dans le cyberespace Daniel Prado Directeur DTIL - Union latine dtil@unilat.org http://dtil.unilat.org Colloque Vox Internet II - Paris, 26-27 mars 2010