Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

107 WANG Yongkang Université Sun Yat-sen, Chine pierrewang@126.com Key words :

107 WANG Yongkang Université Sun Yat-sen, Chine pierrewang@126.com Key words : evaluation ; language testing ; TFS8. 测试在许多领域，尤其在教育领域，与评估密切相关。文章依据语言测试理论对中国的法语专八考试进行分析。在分析中将关注它的效度、信度和难度。我们试图找出该考试的长处和不足，并为它的改进提出一些建议。关键词：评估；语言测试；法语专八。 Introduction Aujourd’hui, l’évaluation est sans aucun doute devenue un enjeu social, politique et économique. Elle a pénétré dans de nombreux domaines de notre vie. Dans le domaine de l’éducation, on ne peut même plus parler d’enseignement sans parler d’évaluation. Le test est un aspect essentiel de l’évaluation de l’enseignement. Grâce à l’ouverture de la Chine vers l’extérieur et au développement de son éducation supérieure, il existe en Chine quelque 951 écoles supérieures dotées d’un département ou d’une section de langue française. Dans ce contexte, l’évaluation de l’enseignement du français de ces établissements joue un rôle très important. On a ainsi commencé à tester Synergies Chine n° 7 - 2012 pp. 107-116 Validité, fiabilité et difficulté : une analyse du TFS8 en Chine Le test est étroitement lié à l’évaluation dans de nombreux domaines dont l’éducation en particulier. À partir de la théorie de test de langues, une analyse sur le TFS8 en Chine sera effectuée dans cet article. Sa validité, sa fiabilité et sa difficulté seront notre principale préoccupation au cours de l’analyse. Nous voulons ainsi en étudier les avantages et les inconvénients tout en donnant quelques conseils dans l’optique de son amélioration. Mots-clés : évaluation ; test de langues ; TFS8. Testing is closely related to evaluation in many areas, education in particular. Based on the language testing theory, an analysis of the TFS8 in China is made with an emphasis on its validity, its reliability and its difficulty. The author examines the advantages, as well as the disadvantages of this test, and proposes some advice for its improvement. 108 le niveau de français des étudiants au niveau national à travers le TFS4 et le TFS8 (Test national de français destiné aux étudiants spécialisés en études françaises – niveau IV et niveau VIII). Dans cet article, nous allons analyser le TFS8 pour apporter une certaine contribution à l’amélioration de l’évaluation de l’enseignement du français en Chine. 1. Mesure, test et évaluation On confond souvent les termes « mesure », « test » et « évaluation » en les utilisant comme synonymes. Notre attention aux similarités superficielles entre ces trois termes tend cependant à obscurcir les caractéristiques distinctives de chacun. Il est donc nécessaire de bien les distinguer. Selon Bachman, « la mesure dans les sciences sociales est le processus de quantification des caractéristiques des personnes, conformément aux procédures et règles explicites. Cette définition comprend trois caractéristiques distinctives: quantification, caractéristiques et règles et procédures explicites. » (1990 : 18-19). Pour ce qui est du test, d’après Carroll, « un test psychologique ou éducatif est une procédure destinée à obtenir un certain comportement à partir duquel on peut faire des inférences sur certaines caractéristiques d’un individu » (cité par Bachman, 1990 : 20). En ce qui concerne l’évaluation, pour Weiss, « l’évaluation peut être définie comme la collecte systématique d’informations dans le but de prendre des décisions. » (ibid., p. 22). Un aspect de l’évaluation est la collecte d’informations fiables et pertinentes. Il faut noter que l’évaluation n’implique pas nécessairement le test et que le test n’est pas nécessairement une évaluation. C’est seulement quand les résultats des tests sont utilisés comme base pour prendre une décision que l’évaluation est impliquée. 2. Notions importantes de l’évaluation et du test Nous présentons maintenant quelques notions très importantes de l’évaluation et du test de langues. 2.1 Validité « La validité est la qualité d’une activité d’évaluation qui fait que cette activité mesure exclusivement et exactement ce qu’elle est censée mesurer, ce pour quoi elle a été conçue. » (Tagliante, 2005 : 23) La validité implique deux aspects : 1) ce que l’on mesure exactement ; 2) quel degré l’on atteint dans l’évaluation. Par exemple, si nous voulons mesurer la compétence communicative des élèves à travers un examen, pour avoir une bonne validité, le contenu de l’examen doit spécifiquement concerner la compétence communicative et non d’autres compétences ; de plus, l’examen peut bien tester et distinguer la compétence communicative des élèves. En réalité, les activités de l’enseignement s’organisent souvent en vertu d’un programme d’enseignement rédigé par des personnes ou un service autorisé. La validité de l’évaluation est liée étroitement à ce programme. Des équations mathématiques statistiques pourraient nous Synergies Chine n° 7 - 2012 pp. 107-116 109 servir à mesurer la validité, nous ne les citons pas, puisque nous ne les utilisons pas dans cet article. 2.2 Fiabilité Ce terme (reliability en anglais) concerne la stabilité du résultat d’un test. « La fiabilité est donc une mesure de la précision, la cohérence, la crédibilité ou l’équité des notes résultant de l’administration d’un examen particulier. » (Henning, 2001 : 74) Si on teste un groupe d’élèves à deux ou plusieurs fois par les mêmes items pendant peu de temps, les élèves peuvent obtenir des résultats similaires, c’est-à-dire qu’il existe une cohérence entre les résultats, on peut dire que le test a une très bonne fiabilité. On utilise le « coefficient de fiabilité » pour voir la corrélation entre les deux résultats du test de mêmes items et aux mêmes élèves. Plus le coefficient est grand, plus la fiabilité est forte. Pour calculer le coefficient de fiabilité, il existe plusieurs formules mathématiques statistiques qu’il n’est pas nécessaire de citer dans cet article. Il y a beaucoup de facteurs qui menacent la fiabilité : quantité d’items, difficulté des épreuves, environnement du test, émotion et état des élèves, émotion et état des correcteurs, changement de correcteurs, critères de notation, etc. Il faut noter que, dans cet article, nous utilisons les termes de validité et de fiabilité dans leur sens large et non pas dans le sens statistique pour analyser la validité et la fiabilité du TFS8. 2.3 Difficulté Les tests qui sont trop faciles ou trop difficiles pour un groupe de candidats spécifiques présentent souvent une fiabilité faible. La caractéristique la plus importante d’un item à être déterminée avec précision est sa « difficulté ». « La difficulté d’items est déterminée comme la proportion de réponses correctes, signifiée par la lettre p » (Henning, 1987 : 49). La formule pour la difficulté d’items est : P = N Cr ∑ (Formule 1)2 où p est la difficulté (proportion correcte), ΣCr est la somme des réponses correctes et N est le nombre des candidats. Nous pouvons simplement utiliser une autre formule : P = X X (Formule 2)3 où p représente la difficulté, X est la moyenne des notes obtenues à l’item et X est la note totale de l’item. En ce qui concerne la difficulté, « les items pourraient se diviser en trois classes : items difficiles, items à difficulté moyenne et items faciles » (Shu, 2009 : 72)4 : Validité, fiabilité et difficulté : une analyse du TFS8 en Chine 110 - Pour les items difficiles : p est entre 0 et 0.3 ; - Pour les items à difficulté moyenne : p est entre 0.3 et 0.7 ; - Pour les items faciles : p est entre 0.7 et 1. Dans les examens, il vaut mieux que les items aient une difficulté moyenne pour avoir une bonne validité. 3. Analyse du TFS8 3.1 Présentation du TFS8 Conçus selon le Programme national de l’enseignement supérieur spécialisé du français pour les deux premières années (1988) et le Programme national de l’enseignement supérieur spécialisé du français pour les deux dernières années (1997, ci-après Programme pour les deux dernières années), le TFS4 et le TFS8 s’organisent respectivement à partir de 2004 et 2009. Dans cet article, nous allons analyser seulement le TFS8 en nous limitant uniquement au test de 2009 publié dans le Guide du test national de français destiné aux étudiants spécialisés en études françaises – niveau VIII (TFS8), car les autres n’ont pas encore été publiés. D’ailleurs, le seul test serait déjà représentatif, puisque la structure des items reste presque la même. Depuis 2011, la partie I du test a subi une légère modification à propos de laquelle nous exprimerons certaines objections. Nous citons ci-dessous la structure du test (en 2009 et en 2010) : Partie Forme d’items Détail Note I Dictée Écrire un texte d’après l’enregistrement. 10 points II Compréhension orale Section A : Lire d’abord 10 questions et les réponses suggérées, écouter ensuite 10 dialogues et choisir enfin la bonne réponse pour chaque question. 5 points Section B : Lire d’abord 10 questions et les réponses suggérées, écouter ensuite un texte et choisir enfin la bonne réponse pour chaque question. 5 points III Vocabulaire et grammaire Section A : Lire les phrases et choisir le mot ou l’expression dont le sens est le plus proche de celui de la partie soulignée. 10 points Section B : Compléter un texte avec les mots et expressions qui conviennent (des mots ou des expressions sont suggérés pour chaque trou). 10 points IV Version Traduire un texte français en chinois 12.5 points V Thème Traduire des phrases chinoises en français 12.5 points VI Compréhension écrite Lire 4 textes et choisir uploads/Management/ analyse-tfs8.pdf