La langue au cœur du numérique Jocelyn Pierre Délégation générale à la langue f

La langue au cœur du numérique Jocelyn Pierre Délégation générale à la langue française et aux langues de France Les enjeux culturels des technologies de la langue Février 2007 La langue au cœur du numérique Les enjeux culturels des technologies de la langue Jocelyn Pierre, ingénieure de recherche du ministère de la Culture et de la Communication Février 2007 Le document est téléchargeable sur : www.dglf.culture.gouv.fr Préface Les technologies de la langue sont une composante majeure de la société de l’information. Qu’elles soient disponibles sur le marché ou en cours de développement, ces technologies offrent des ressources inestimables pour tous ceux qui ont à produire, transformer, recher- cher ou comprendre des « données ». Outils d’analyse et de connaissance de la langue, de reconnaissance et de synthèse vocales, moteurs de recherche sémantiques, logiciels de traduction… sont appelés à modifier en profondeur nos modes d’agir professionnels, comme nos actes les plus quotidiens. Leur développement n’est pas sans conséquences sur les politiques de la langue. Le rapport établi par Jocelyn Pierre dresse un panorama détaillé des outils et des disposi- tifs de soutien existants, aux plans national comme international. Mais il va plus loin, car il propose un cadre de nature à mieux coordonner l’action publique. En effet, il est indispen- sable aujourd’hui d’améliorer la recherche dans ce secteur, de lui trouver de nouveaux débouchés et de favoriser l’appropriation des outils disponibles par le plus large public. Le rapport met aussi en évidence la responsabilité particulière des institutions européennes, qui doivent s’impliquer davantage dans les activités de recherche et de développement. Parce qu’elles transforment et facilitent l’usage comme la diffusion des langues, qu’elles contribuent à modifier les rapports de force et d’influence qui existent entre elles, les tech- nologies de la langue intéressent très directement le ministère de la Culture et de la Communication, garant de la politique de notre pays en faveur de la diversité culturelle et linguistique. Dans un secteur où nos entreprises sont particulièrement performantes et créatrices d’em- plois, il revient en effet à notre ministère - aux côtés des différentes institutions et adminis- trations concernées - de mettre en évidence à quel point les industries de la langue servent le renforcement de l’usage du français dans la vie sociale et la promotion de la diversité lin- guistique dans les situations de communication internationale. Xavier North Délégué général à la langue française et aux langues de France 3 4 Sommaire Enjeux et propositions La langue au cœur du numérique 8 La langue au cœur du numérique culturel 9 De l’industrie de la langue à l’industrie de la connaissance 9 Les nouvelles formes de l’intelligence collective 10 La dimension culturelle de l’ingénierie linguistique 11 Une nouvelle grammaire numérique 12 Le plurilinguisme comme idéal technologique 13 L’action publique : les atouts à jouer 14 Les trois piliers traditionnels de l’action publique 14 Une politique publique en retrait 16 La langue : des solutions et non pas un problème 18 Créer la fonction 18 Militer pour un Technolangue 2 19 S’appuyer sur une instance de coordination et d’impulsion 21 Mettre à disposition des ressources linguistiques 23 Appuyer la présence française dans les chantiers internationaux de normalisation 23 Accompagner la prise en charge de l’aide à la recherche et à l’innovation 25 Assurer la promotion de l’utilisation des applications innovantes 19 Quelques grands projets qui font l’actualité du secteur 29 Engager la bataille du multilinguisme à l’occasion de la présidence française 32 État des lieux 35 Les outils 36 Les points de rencontre entre les langages informatique et humain 36 Des terminologues zélés 36 L’inventaire 37 Des technologies, entre connaissances et applications 39 Les activités de recherche 40 La constitution de ressources informatiques 41 La constitution de ressources linguistiques 41 5 Les activités d’appui à la recherche 42 La fabrication des technologies, entre recherche et intégration 46 Les grandes familles d’outils 46 Les avancées récentes 49 Des technologies « diffusantes » 50 Les moteurs de recherche et les services de veille 52 Les outils du multilinguisme et de la traduction 53 Les interfaces de communication homme / machine 54 Les acteurs 55 Les développeurs d’outils et de services linguistiques informatiques 56 Les programmes de soutien à la R&D et à l’industrialisation du secteur 59 Les guichets français 60 Les guichets européens 67 Bibliographie 75 Lettre de mission 75 Liste des personnes rencontrées 80 Liste des sigles utilisés 83 Remerciements 86 6 « Where is the wisdom we have lost in knowledge ? Where is the knowledge we have lost in information ? »* T.S.Eliot, « The Rock », 1934 Malgré l’immensité et l’évidence des enjeux dans tous les secteurs, à l’heure où le numé- rique devient omniprésent et où la langue devient centrale dans les processus informa- tiques, mais où la recherche sur les technologies et sur les usages est dans le creux de la vague, la prise en charge institutionnelle du dossier se cherche. Sans accepter la fatalité et sans nier la réalité, l’objectif est de réagir. La rencontre de l’informatique et de la linguistique a, depuis près de 50 ans, donné lieu à de nombreuses recherches, développements technologiques et intégration dans des servi- ces applicatifs. Les objectifs traditionnels recherchés étaient la traduction, l’interrogation de bases de données en langage naturel, le dialogue optimal entre l’homme et la machine, la reconnaissance et la synthèse de la parole. Depuis environ 10 ans, la croissance de l’in- ternet et sa convergence avec les autres médias devenus numériques (le téléphone, la télé- vision, la radio, la presse) ont suscité l’apparition de nouveaux besoins. Des techniques de traitement des données textuelles ont fait leur apparition pour sélectionner, classer, struc- turer, etc. l’ensemble des informations disponibles sous forme numérique, qu’elle soient écrites, orales ou multimédias, monolingues ou multilingues. Ce document a vocation à offrir un diagnostic d’actualité sur les technologies de la langue (chapitre 3) et le paysage institutionnel dans lequel s’inscrivent les activités économiques qui les génèrent (chapitre 4) ; à lancer quelques pistes d’interrogation sur l’actualité des missions du ministère de la Culture et de la Communication au vu du développement actuel de ces technologies (chapitre 1) et à envisager des pistes d’actions afin que leur dévelop- pement soit utilement soutenu par les pouvoirs publics, le ministère de la Culture et de la Communication en particulier (chapitre 2). * Où est la sagesse que nous avons perdue avec la connaissance ? Où est la connaissance que vous avons perdue avec l’informa- tion ? Enjeux et propositions 8 La langue au cœur du numérique Les nouvelles tâches dévolues aux ordinateurs, de plus en plus complexes, ont une dimension langagière croissante au détriment des simples fonctions de calcul. Compte tenu du triple rôle de mémorisation, de cognition et d’échange de la langue, au fur et à mesure du développement de l’informatique, le langage humain tend à y pren- dre une place de plus en plus centrale et essentielle. Le mouvement ira en s’accélérant puisque l’objectif de notre système économique et politique actuel, fondamentalement technologique, est de repousser la limite de la division du travail entre humains et ordina- teurs. Le numérique tend à devenir le dénominateur commun de notre société dite « de l’in- formation ». L’information numérique, textuelle (écrite ou orale, plurilingue) ou codée (parce que sonore ou visuelle), est désormais massivement présente et au cœur des acti- vités économiques et sociales. La croissance exponentielle des informations disponibles sur les différents supports, publics ou privés, (télévision, radio, internet, bases de données, archives) est combinée à leur hétérogénéité (texte, voix, image et vidéo). Elle provient du passage de la production des contenus des méthodes analogiques aux méthodes numé- riques, de la numérisation des contenus existants et de la convergence, c’est-à-dire l’ad- dition et la combinaison, de l’ensemble des réseaux (et donc des secteurs d’activités affé- rents) jusqu’ici séparés. Elle provient aussi de la libre mise à disposition d’outils logiciels permettant à l’ensemble des utilisateurs de devenir des producteurs de contenus. Dès lors, intégrées à une multitude d’applications qui rendent des services tels que la veille informationnelle, la gestion documentaire, la traduction, la formation, la communication homme/machine, etc. les « technologies de la langue » sont massivement et de façon croissante, sollicitées pour assurer les tâches complexes que sont la production, l’accès, l’analyse, la transformation et la diffusion des contenus numériques multimédias et multi- lingues présents sur les réseaux. Le développement des « technologies du langage humain » pour reprendre le terme anglais1 comme la régulation des effets de ce développement passe inexorablement par l’invention d’une nouvelle grammaire numérique. Cette nécessai- re invention invite à un double recentrage de la politique culturelle autour de la place centrale de la langue dans le traitement informatique des contenus (1re partie) et de la politique (multi)linguistique par le biais de l’outillage informatique de la langue (2e par- tie). 1 Human language technologies ou HLT. 9 La langue au cœur du numérique culturel Pour comprendre l’impact de la vague numérique sur le secteur culturel et sur la politique culturelle, il est possible d’avoir en tête les débats de ces dernières années sur uploads/Science et Technologie/ 116-la-langue-au-coeur-du-numerique-les-enjeux-culturels-des-technologies-de-la-langue.pdf

  • 19
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager