RECHERCHE SUR LE SITE

Références
bibliographiques
avec le catalogue


En plein texte
avec Google

Recherche avancée
 

Tous les ouvrages
numérisés de cette
bibliothèque sont
disponibles en trois
formats de fichiers :
Word (.doc),
PDF et RTF

Pour une liste
complète des auteurs
de la bibliothèque,
en fichier Excel,
cliquer ici.
 

Collection « Les sciences sociales contemporaines »

Une édition électronique réalisée à partir de l'article de Richard FOURNIER, “L’analyse du discours sur les identités en milieux communautaires à travers la structure mathématique du modèle ANOVEP.” in ouvrage sous la direction de Jacques Hamel et Joseph Yvon Thériault, LES IDENTITÉS. Actes du colloque l’ACSALF du 12 au 14 mai 1992, pp. pp. 549-582. Montréal: Les Éditions du Méridien, 1994, 585 pp. [La présidente de l’ACSALF, Mme Marguerite Soulière, nous a accordé le 20 août 2018 l’autorisation de diffuser en accès libre à tous ce livre dans Les Classiques des sciences sociales.]

[549]

Les identités.
Actes du colloque de l’ACSALF du 12 au 14 mai 1992.
SIXIÈME partie :
CONTRIBUTION DE LA MÉTHODOLOGIE QUANTITATIVE
À L'ÉTUDE DE L'IDENTITÉ

L’analyse du discours sur les identités
en milieux communautaires à travers
la structure mathématique
du modèle ANOVEP
.”

Par
Richard FOURNIER

- Mais le second procédé, Socrate, quel est-il ?
- Il consiste à diviser à nouveau l’idée suivant ses éléments, suivant ses articulations naturelles, en tâchant de n'y rien tronquer...
Phèdre, 266 a

[550]
[551]

On convient que le caractère dynamique d’une culture agit sur l’image de soi qu’entretient l’acteur social, qu’il s’agisse de l’individu ou du groupe. Je voudrais présenter dans cet exposé une façon mathématique de modéliser une telle interaction au moyen de l’analyse de contenu, quitte à revenir en conclusion sur certaines incidences de cette entreprise.

Le point de départ est une recherche-action ayant entraîné d’utiliser l’analyse de contenu de demandes de subventions d’organismes communautaires. L’interaction entre culture (ou modèles culturels) et image de soi apparaît alors comme un phénomène de communication se déployant, en particulier, sur le plan pragmatique de la communication réussie. Il s’agit ici, en effet, pour un groupe volontaire d’éducation populaire, par exemple, d’élucider et d’exprimer par écrit, en réponse aux questions ouvertes de formulaires administratifs, les objectifs, projets, pratiques et activités qui le définissent, et de le faire en fonction d’une régulation externe savoir recueillir le maximum admissible d’un programme public de financement. L’idée d’employer l’analyse de contenu des réponses en ce cas renvoie donc au postulat que les dynamismes culturels, tant dans leur effet, tels les associations volontaires ou les mouvements sociaux, que dans les structures mentales qui les supportent, structure cognitive du stéréotype, par exemple, ou structure argumentative de l’idéologie, renvoient ainsi à la production ou l’expression des identités sociales, sinon à la constitution d’un sujet.

Je laisserai cependant de côté l’aspect problématique de cette notion de sujet. C’est un problème qui heurte les esprits, en effet, dès que l’on parle tout simplement, si on peut dire, de communication, de science ou de société [1]. À plus forte raison lorsqu’il est question, comme ici, de la culture pédagogique : presque partout en effet retrouve-t-on alors, à la [552] façon dont J. Duchastel le décrivait naguère à propos de la contre-culture, “l’interpellation du sujet comme catégorie mentale du fonctionnement idéologique” [2]. Néanmoins, j’assumerai tout au cours de cet exposé que le groupe, réalité sociale, constitue de ce fait un sujet épistémique, siège d’activités de connaissance. Je considérerai aussi que, sous un tel mode de sujet, le groupe existe sur le même pied, mais autrement, que celui où se trouve un autre sujet épistémique, savoir la personne qui, croyant quelque peu se détacher du groupe par la méthode de l’analyse de contenu, opère sur les significations du discours tenu par le premier. Cela étant, ce que je me propose d’envisager, c’est une façon de modéliser cette dernière activité de connaissance en appliquant certaines notions mathématiques de base à l’opération familière de quantifier un corpus au moyen d’un système de catégories. Le bénéfice espéré est d’en arriver à mieux saisir la structure de ce qui se passe lorsque prend place, à travers l’acte de coder un corpus, la rencontre entre une culture savante, celle du codeur ou de l’analyste, et une culture différente. Par ce biais d’une présentation delà structure mathématique du modèle ANOVEP, on verra que c’est à une réflexion sur les fondements mathématiques de l’analyse de contenu que nous sommes conviés.

Par ailleurs, je vais m’attacher à réfléchir à l’aspect communautaire de la construction des identités dans le contexte d’une société marquée au coin de la bureaucratie et de la technologie, lorsque cette construction est touchée par la relation État-citoyen. Je le ferai alors en particulier par référence à certaines des possibilités techniques - informatiques et sociologiques - d’analyse d’un discours social que révèle l’application du modèle. Au départ, en effet, le modèle ANOVEP se situe au point de rencontre de l’analyse de contenu et de la sociologie de la connaissance. Cependant, l’application du modèle dans un logiciel d’aide à la décision se trouve à concerner ou à interroger directement ce que nous savons ou rêvons de savoir de l’aptitude de certains agents sociaux - administrations publiques ou groupes populaires - à vivre l’introduction delà bureautique dans les organisations, au chapitre en particulier de l’information de gestion. À cet égard, l’application du modèle renvoie à la participation des milieux communautaires à certaines des modalités d’institutionnalisation de leur propre discours sur eux-mêmes. En sorte que mon exposé adoptera finalement un double point de vue - formalisation, d’une part, et action pratique de l’autre - accordé au titre un peu long que je lui ai attribué.

[553]

Le plan que je suivrai comprend trois étapes.

En premier lieu, je me propose de ramener le kaléidoscope des pratiques de l’analyse de contenu à l’essentiel d’une définition centrale de la méthode, définition que je cernerai à partir de trois notions (paragraphe 1.1). Cela permettra de relever un aspect foncier des problèmes classiques de fiabilité et de validité des données et de fidélité des mesures. Il s’agit du problème de savoir pourquoi et comment valider l’interprétation au codage dans le cas de l’analyse à codeur unique (paragraphe 1. 2). Cette première partie de mon exposé portera donc le titre de Réflexions sur une certaine objectivité scientifique. La perspective, en retour, nous préparera à envisager l’interprétation au codage à travers la théorie de l’information et la théorie des graphes respectivement.

En conséquence, la partie suivante, intitulée Une structure mathématique de l’objectivation, étudie un graphe ANOVEP pour y distinguer trois aspects : 1- Comment une structure de monoïde fait une place à la polysémie d’un corpus (paragraphe 2.1) ; 2- Comment la fonction du nombre trouvé au codage rencontre l’idée de quantification à l’origine de la méthode (paragraphe 2.2) ; 3- Quel genre de calculs pratiques permet le grille d’analyse ainsi construite (paragraphe 2.3).

À ce moment, nous pourrons alors passer, sous l’angle de L'étude des identités en évaluation de programme, à des applications de l’analyse de contenu, troisième partie de l’exposé, au domaine de l'étude des identités sociales. À ce titre, nous verrons tout d’abord comment le modèle ANOVEP permet de déterminer les effets de sens que contiennent des tableaux d’avantages comparatifs, point de vue de l’économiste, établis à partir d’un codage des définitions que donnent d’eux-mêmes des organismes populaires (paragraphe 3.1). Ce qui nous conduira à vouloir estimer la nature de ces effets de sens à la lumière du cadre conceptuel de l’analyse qui les a produits. Pour ce faire, nous retournerons à la mesure dans ANOVEP des associations sémantiques d’un corpus (paragraphe 3.2).

En conclusion de l’exposé, deux voies de réflexion, l’une théorique, l’autre pratique, viendront suggérer en quoi cette application du modèle dans un logiciel d’aide à la décision renvoie d’une part aux sciences cognitives, de l’autre à la sociologie d’un certain “espace public de discussion”.

[554]

1. Réflexions sur une certaine objectivité scientifique

1.1. De quelle analyse parlons-nous ?

Nous parlons d’une analyse de contenu traditionnelle ou classique. Celle-ci consiste à dénombrer des unités de sens sur un corpus à partir d’indicateurs (d’ordre morphologique, syntaxique, sémantique ou pragmatique, si l’analyse est linguistique, par exemple) et à ranger ces unités dans un système de catégories. L’usage de telles catégories, établies soit a priori soit a posteriori, renvoie ainsi à construire un cadre conceptuel par où analyser les significations.

Telle qu’on la connaît, l’analyse de contenu est donc premièrement une forme d’analyse computationnelle, puisqu’on dénombre des éléments d’un corpus. En deuxième lieu, elle postule, selon cette logique, qu’il n’y a pas un infini des énoncés ou que le corpus, comme on pourrait le formuler, est un corpus clos. Il n’y a pas, comme l’exprimait Harris, de non-achèvement du texte [3].

À ce propos cependant, je préfère pour ma part m’en tenir à parler de corpus clos, puisque le propre de la démarche de l’analyse dans un contexte de communication, comme nous le verrons, est précisément de faire d’un corpus clos un corpus ouvert [4]. Il n’y a sans doute pas un infini des énoncés, en raison de l’opération de découpage par laquelle un corpus est constitué en message à recevoir ; mais, pour trois raisons à mon avis, on doit du même coup postuler un état de non-achèvement du corpus, sinon du texte en tant qu’espace caractéristique de l’analyse.

La première tient à la nature même du symbole et des systèmes symboliques, dont le propre est de révéler et de cacher en même temps [5]. La seconde vient de l’aspect pragmatique de la communication, en vertu duquel le niveau sémantique d’un message le dispute aux nécessités de l’action : rhétorique, logique argumentative, etc. [6] La troisième raison n’est rien d’autre, à mon sens, que la raison constitutive d’un corpus. Pour exister en effet comme matière de l’analyse, un texte, une image ou un objet doivent se présenter entachés d’une polysémie virtuelle. Cela provient du fait même que l’esprit ne peut avoir présentes à lui-même ses propres catégories au moment où il opère. En mathématiques, par exemple, il y a là une sorte d’exigence transcendantale, la notion de mathesis. [7] Et, sur le plan de la théorie sociologique, on peut penser que l’analyse de contenu fournit ainsi une illustration du théorème de Gödel, à l’effet qu’une structure théorique, par exemple un système de catégories quelconque, est toujours interprétable par une structure supérieure. Mais [555] on prendra note que l’application même du théorème suppose un corpus ouvert à la polysémie.

1.2. Comment déterminer
la validité des données ?


À tout événement, dans ce contexte de l’analyse de contenu traditionnelle apparaissent entre autres les problèmes classiques de la fiabilité (reliability) et de la validité des données, et celui de la validité des mesures. Par fiabilité, on entendra la capacité de l’instrument, en l’occurrence la grille d’analyse et les manipulations qu’elle permet, de reproduire les résultats obtenus. La validité, quant à elle, regarde plutôt l’aptitude de l’analyse à produire des résultats généralisables. Elle concerne la vertu des données et des mesures à refléter ce qu’on entend bien arriver à mesurer par les concepts (validité interne) [8]. On distinguera ensuite entre validité de contenu et validité de construit [9].

Ces notions renvoient toutes au schème de la méthode expérimentale. On veut établir l’objectivité d’une démarche. Pour s’en assurer, en ce qui concerne la validité interne (lien entre les indicateurs et les concepts), on utilisera des coefficients de fidélité. La logique de tels coefficients (t de Kendall, coefficients ad hoc, etc.), quels que soient les paramètres utilisés, est inévitablement fondée sur le contrôle du travail d’un codeur par celui de ses pairs, que le codage soit manuel ou automatisé dans un logiciel d’indexation.

Mais, qu’arrive-t-il lorsque l’analyse ne dispose que d’un seul codeur ? Voilà une hypothèse qui se réalise, à notre connaissance, dans au moins deux situations de recherche, toutes deux pour l'instant étroitement rattachées, par ailleurs, à l’exploitation de données dites textuelles. La première est reliée à l’emploi d’un logiciel d’analyse automatique pour explorer un corpus. Elle survient lorsque l’analyste s’attache à transformer ou à établir un système de catégories initiales à partir des caractéristiques du contenu que ces catégories livrent à l’observateur à mesure qu’on les exploite. C’est une façon de faire que l’on voit se développer, par exemple, dans le sillage des méthodes d’analyse qualitative dites phénoménologiques [10].

La seconde situation touche le domaine de l’information de gestion. Elle surgit lorsqu’on veut se servir de l’analyse de contenu dans une organisation pour construire et alimenter une base de données qualitatives (croyances, valeurs, idéologies, attitudes, etc.) destinée à soutenir la prise de décision, comme en évaluation de programme par exemple. C’est exactement le mandat à l’origine de la présente recherche [11]. Car l’évaluation [556] de programme doit nécessairement disposer de données cumulatives d’un cycle administratif à l’autre, et comparables. Cependant, le coût de se doter à répétition d’équipes de codeurs, afin d’assurer la production de coefficients de fidélité, rend à toutes fins pratiques la méthode inopérante.

Il y a donc ici un double intérêt, scientifique et économique, à poser les deux questions suivantes : comment, dans le cas de l’analyse à codeur unique, en arriver, à l'instar des coefficients de fidélité de l’épistémologie traditionnelle, à pouvoir déterminer au moyen d’une métrique la part d’interprétation au codage qui se glisse dans l’activité cognitive de la personne chargée de coder ou d’indexer un corpus ? Et de là, en deuxième lieu : comment déterminer le rendement d’un système de catégories au codage ? C’est la préoccupation qui fonde le modèle ANOVEP, comme l’indique son acronyme (ANalyse Organique de la Variabilité en Évaluant des Proportions / ANalysis Of Variability in Evaluating Proportions).

Par rapport à l’épistémologie traditionnelle, la principale propriété opératoire du modèle est de travailler sur graphe avec des indices, ainsi qu’on le verra à l’instant.

2. Une structure mathématique de l’objectivation

2.1. Le codage sur graphe

L’analyse de contenu traditionnelle procède par décompte fréquentiel. La méthode qu’avance le modèle propose de travailler plutôt avec des indices et, pour autant, d’appliquer ce procédé de calcul à établir un indice de mesure du rendement des catégories au codage, solution théorique du problème de méthode signalé. La construction de la grille passe ainsi de la théorie des graphes, pour calculer des trajets, à la théorie de l’information, pour établir ses indices. C’est cette démarche que je voudrais récapituler brièvement.

D’abord la théorie des graphes. Supposons que chaque grille de codage qu’on pourrait obtenir d’un corpus équivaut à une partie de l’ensemble de tous les couples formés d’un élément du départ, l’unité de sens, et d’un élément de l’arrivée, l'unité d’enregistrement. L’observation est conséquente avec la multiplicité théorique des codages possibles du matériel.

On verrait en ce cas qu’une telle partie correspond chaque fois à la définition d’un graphe, c’est-à-dire du schéma constitué par un ensemble de points (sommets) et un ensemble de flèches (arcs) les réunissant, représentation intuitive de la relation de base décrivant l’application. [557] Puisque chaque grille de codage est ainsi assimilable à un graphe, la conséquence pratique est qu’on se trouve à calculer le corpus dès qu’on prend les moyens de décrire des chemins entre des points. C’est un premier élément dont se sert le modèle.

FIGURE 1

fig_p_557_st_50_low

Si l’on suppose en outre, du fait que les catégories doivent être hiérarchisées [12], qu’une théorie de la décision entre en jeu dans l’établissement et le remplissement d’une grille, on peut supposer que la structure conceptuelle de l’information procurée par la grille prend la forme d’un graphe arborescent de puissance deux, selon la formule P(E) = 2IEI d’un arbre de décision binaire [13]. C’est un second élément du modèle. Dans celui-ci, un tel arbre possède plusieurs sommets ou plusieurs propriétés remarquables, mais la propriété qui nous intéresse ici regarde le fait que chaque sommet pendant de l’arbre représente la définition d’un indicateur relevé au texte. La portion de graphe de la figure 1 illustre ce postulat. Les indicateurs se trouvent au dernier niveau à droite.

[558]

Arrêtons-nous à ce niveau. Dans ANOVEP, le principe d’organisation logique du thésaurus par indicateurs binaires est le groupe de Klein (carré sémiotique de Greimas, carré logique de Piaget, carré d’Aristote) ou diagramme commutatif [14]. En s’aidant d’une étude de la structure de diagramme commutatif, on pourrait alors montrer comment la grille ainsi construite permet de contourner la contrainte apparente qu’impose le binarisme au réel, et tenir compte de la sorte de la polysémie d’un corpus. C’est ce que je devais indiquer ailleurs [15]. Je rappellerai simplement ici qu’en raison de la loi de composition de l’arbre binaire P(E) = 2IEI, il y a relation d’équivalence entre les sommets de même niveau [16]. Cette relation d’équivalence sur les mots qui servent d’indicateurs induit en retour sur les classes une loi de composition (l’application composée ∫’ ο φ = ψ ο ∫), et cette loi est celle d’un raisonnement de type : “Nicole est la conjointe de Claude ; Claude est le père de Francine ; Nicole est la mère de Francine” [17].

C’est ce raisonnement qu’illustre la diagonale du diagramme ci- après, figure 2.

FIGURE 2
CODAGE SUR GRAPHES : diagramme commutatif de deux variables.
Dimension 1

fig_p_558_st_50_low

[559]

Elle équivaut à formaliser, en tant que loi de composition interne d’un ensemble doté d’une opération associative, savoir l’addition des unités en analyse computationnelle, l’opposition ternaire entre un terme ou entre une chose, d’une part, son contraire, de l’autre, et, quelque part entre les deux, un terme ou une chose contradictoire, opposition tout aussi présente à la langue naturelle ou à la vie courante que l’opposition binaire. Dans la vie courante, par exemple, on pourra envisager le “chaud” (x) avec le “froid” (-x), sans doute, mais en même temps aussi avec le “tiède” (-1/x) ou avec le “frais” 1/x), etc. Sur le plan subjectif, la tolérance à l’ambigüité caractéristique de la vie quotidienne rejoint de cette façon la polysémie objective (syn. virtuelle) d’un corpus.

Du point de vue de l’analyse, au moment de coder une unité de sens par jugement de présence ou d’absence d’un attribut, il résulte de l’emploi de cette structure un avantage concret important. Pour mieux en prendre conscience, retournons aux quatre indicateurs de la figure 1. Il y a lieu de noter toutefois que le codeur ne connaît pas la figure telle que nous la voyons. Puisqu’il s’agit sur celle-ci de représenter la structure des données dans la machine, les indicateurs n’apparaîtront pas au codeur en forme d’arbre, mais de lignes et de colonnes sur la feuille de codage ou sur l’écran de saisie à sa disposition.

Cela étant dit, par hypothèse correspondent alors à ces quatre indicateurs quatre cases vides. Pour décider, par jugement de présence ou d’absence, où ranger, dans l’une des cases à l’exclusion des autres, telle mention de l’indicateur qu’il a trouvée au texte, le codeur prendra donc lui aussi ces cases par paires : ou bien “chaud” (x) ou “froid” (-x), comme dans notre exemple de la diagonale, ou bien “tiède” (-1/x) ou “frais” (1/x) ; ou bien “population en général” (indicateur 1) ou “mouvement social” (indicateur 2), ou bien “catégorie sociale” (indicateur 3) ou “milieu social” (indicateur 4).

Mais, une fois prise la décision, le résultat de l’opération de classification est assimilable à celui de la discrimination opérée par le codeur à travers la polysémie constitutive d’un corpus, lorsque son jugement, pour s’extraire de l’ambiguïté, passe du “chaud” (x) au “tiède” (-1/x), du “froid” (-x) au “frais” (1/x) ou l’inverse ; ou encore lorsqu’il va de la “population en général” à une “catégorie sociale”, d’un “mouvement social” à un “milieu social”, ou l’inverse.

On peut noter en passant que, sous la forme d’un raisonnement “si alors...” (si indicateur 1 ou 2, alors variable “ensemble” ; si indicateur 3 ou 4, alors variable “individus”), la représentation des catégories obtenue [560] de cette façon à chaque niveau n-1 du graphe permet de réaliser un calcul du corpus avec des variables dont la construction aura pris en compte la polysémie constitutive de ce dernier [18]. Une telle approche est au fondement d’un ANOVEP-Expert [19]. La grille d’analyse est alors définie comme la structure de la représentation des connaissances nécessaires à la construction de l’objet [20].

La structure de groupe à la base du graphe renvoie donc ainsi, référence ou pas à la méthodologie des systèmes experts, aux fondements de l’idée de quantification en analyse de contenu. L’axiomatique d’une telle structure de thésaurus, en effet, est le codage par application. Il y a plusieurs façons de le démontrer. Je prendrai celle qui colle le plus étroitement aux caractéristiques de la définition que nous avons donnée de l’analyse traditionnelle. Nos habitudes de travail en effet n’ont pas souvent fait appel à l’examen de cette dimension de l’analyse traditionnelle, étant donné qu’elle suppose une certaine familiarité avec la théorie des ensembles et la notion mathématique de fonction. Et, sans doute, si on demeure toujours aussi sollicité ailleurs, pourra-t-on passer outre à la démonstration que je vais présenter aux paragraphes 2.2 et 2.3 ci-dessous, pour courir au but de l’exposé, l’étude des identités à l’aide de l’analyse de contenu. Cependant, cet apparent détour par l’exposition d’un codage par application nous conduit, pour qui s’intéresse à ce genre de réflexions sur les méthodes quantitatives, directement aux sources de la méthode de l’analyse de contenu et de l’opération de quantifier un corpus.

2.2. Le codage par application

La façon de quantifier un corpus en analyse traditionnelle distingue entre unité de sens et unité d’enregistrement [21] et admet entre les deux la relation par laquelle sont dénombrées des unités de sens. On suppose de la sorte une relation entre a, un indicateur ou une unité de sens et b, un nombre (le nombre 1) ou une unité d’enregistrement. Par la suite, le dénombrement des unités d’enregistrement conduit l’analyste à calculer des fréquences et, de là, à reconstruire des significations (par cooccurrence, proximité, etc.). C’est l’idée de quantifier un corpus.

Je me propose donc ici de donner une formulation mathématique de cette relation, postulat de base de l’analyse traditionnelle. Je le ferai à l’aide de la théorie des ensembles, qui est le point de départ du graphe ANOVEP en tant que technique de construction de la grille en analyse de contenu [22]. Nous constaterons alors que cette façon de quantifier un corpus qu’adopte l’analyse traditionnelle revient à pratiquer un codage par [561] application, du nom que prend en mathématiques la correspondance relevée entre unité de sens et unité d’enregistrement.

Nous verrons de ce fait comment une semblable façon de mesurer ou de calculer un corpus fait déjà place à la variabilité d’un codage tel qu’il en va dans la vie réelle. Nous comprendrons aussi sur quoi le modèle appuie sa prétention d’offrir un moyen de déterminer cette variabilité, lorsqu’il propose parmi les outils ANOVEP un coefficient de mesure du rendement des catégories au codage.

Soit d’abord un corpus, l’ensemble A, et une grille de codage, l’ensemble B. L’analyse traditionnelle affirme que :

  tel que R(a,b)

qui se lit “pour tout a, élément ou unité de sens appartenant au corpus, il existe au moins un b ou une unité d’enregistrement dans la grille de codage tel que a est en relation avec b”.

Cette correspondance porte le nom d’application [23]. On dit aussi que cette application est une fonction [24] : pour tout a, il existe b=f (a), image de a par l’application f. L’application se note aussi f-1(b) : quel que soit b dans B, la fonction f-1(b) = l’ensemble des éléments de A tel que f(a)=b.

D’autre part, l’application ainsi décrite est une bijection ou correspondance bi-univoque [25]. Par là on veut signifier :

a) qu’à deux éléments distincts de l’ensemble de départ A ou deux unités de sens distinctes a et a' correspondent deux éléments distincts de 1’ensemble d’arrivée B ou deux unités d’enregistrement distinctes b et b'.

L’ensemble f-1(b) des éléments de A a donc au plus un élément a ;

b) que pour toute unité d’enregistrement b, il existe au moins une unité de sens a tel que b = f (a). De la sorte f -1(b), ensemble des éléments a de A tel que f(a)=b, n’est jamais vide, mais a toujours un élément et, en raison de la condition précédente, un seul.

Mais, par définition, ces deux propriétés de la bijection traduisent aussi l’action de quantifier un corpus selon la relation de l’analyse traditionnelle. En effet, un élément de B (ou une unité d’enregistrement b) sera dit image de a (ou de l’unité de sens élémentaire de A) par l’application f (2ième propriété) et, une fois l’élément a codé, f(a) désigne un élément b sans ambigüité (1ère propriété). L’application en ce dernier cas est dite uniforme, en accord, au reste, avec la réalité : une fois effectué, le jugement du codeur est étanche, puisque en phénoménologie tout jugement est une action ; il n’a plus à être rouvert [26].

[562]

Cependant, la réciproque de cette dernière proposition (1ère propriété) n’est pas vraie, et si f(a) désigne un élément de b sans ambigüité, b peut ne rien désigner de a. Car, étant donné b=f(a), image de a dans l’application f quel que soit a, il peut exister des éléments b dans B tels qu’il n’y ait aucun a dont b soit l’image dans l’application.

En effet, il peut arriver au dépouillement d’un corpus que des unités de sens n’appartiennent pas à la grille et, par conséquent, ne prennent jamais leur place d’unités d’enregistrement b attendues en B. Sans parler encore de polysémie, c’est le cas, par exemple, de toutes les unités de sens (syntagmes, signes, etc.) non dénombrables à l’analyse d’après le cadre conceptuel de l’analyste ou selon ce qu’observe le codeur. Les unités de sens reconnues pertinentes ne forment plus alors qu’un sous-ensemble de toutes les unités d’enregistrement possibles, chacune à son tour étant conçue comme un ensemble singulier.

Ce sous-ensemble des unités pertinentes, sous-ensemble des éléments de B qui appartiennent à l’analyse, se notera f(A)⊂B pour désigner l’ensemble des éléments du corpus qui sont des images de a par f, et ce sous-ensemble constitue l’ensemble dénombrable sur lequel s’appuie l’analyse traditionnelle.

En pratique, cependant, on devrait le noter autrement, puisque l’ensemble des unités pertinentes quantifiées par l’application n’est pas un ensemble fini de B. C’est ici, au contraire, qu’intervient fondamentalement pour l’analyste l’effet de polysémie constitutif d’un corpus. Car, un autre codage du même corpus par le même codeur ou par un autre ne produirait pas nécessairement le même nombre d’unités de sens. À la limite, un codeur opérant en langue étrangère, dans une autre langue (e.g. une langue sifflée) ou dans un autre langage (e.g. la notation musicale) pourrait bien ne relever sur le corpus aucune unité pertinente, soit chaque fois f(a)=?, ensemble vide.

Il y a donc en principe autant d’applications pour chaque unité de sens qu’il y a de nombres entiers ou : f(a) ≠ f (a) ≠ f"(a) ≠....≠ fn(a).

La formule de cette équivalence définit la polysémie d’un corpus en analyse de contenu. Si l’on désigne alors par C l’ensemble de ces applications, ensemble issu de la variabilité du codage, on notera le résultat de l’une de ces applications, ensemble quelconque des unités pertinentes :

[563]

À la notation précédente f-1(b), ensemble des éléments a de A tels que f(a)=b, on devrait donc substituer la notation f-1(c). Et on lira plus justement pour désigner un corpus :

f-1(c)= l’ensemble des a de A tels que b=

Nous pouvons donc conclure que l’expression représente ainsi la définition de l’objectivation d’un contenu par une grille d’analyse, telle que cette objectivation se pratique en analyse traditionnelle au moyen de l’opération qui consiste à transformer un contenu symbolique, texte ou image, en un ensemble dénombrable d’éléments, le tout résultant d’une image du corpus obtenue par application.

Mais en quoi un tel ensemble est-il dénombrable ? Et qu’indique pour l’analyse le fait qu’il soit dénombrable ?

2.3 Mesurer un corpus

D’après la définition , chaque élément de l’ensemble obtenu possède son cardinal, en tant que sous-ensemble de f-1(c). Ce que traduit le fait qu’à chaque indicateur ou unité de sens dont la présence ou l’absence doit être relevée dans le corpus, l’analyse traditionnelle attache un nombre, résultat du comput de la fréquence de l’apparition de l’indicateur. Ce nombre peut être zéro.

Ce nombre est une somme ou valeur attendue. Par exemple, on trouvera 1128 unités d’enregistrement b pour 1128 observations de l’unité de sens a survenues en parcourant le corpus. Le nombre 1128, cardinal de la partie b de l’ensemble B, est la valeur attendue dans B en correspondance bijective avec le nombre de fois où la partie a de A fut rencontrée au corpus, soit 1128 fois. C’est ce nombre, le nombre N trouvé au codage, qui, à titre de valeur attendue décrivant le corpus, sera porté par l’analyse traditionnelle sur la grille de codage, en vertu de l’application R(a,b) par f.

On peut donner une formulation mathématique de cette pratique. Nous dirons alors que chaque nombre N de l’ensemble des entiers représente la réalisation d’un couple (a,b) de l’ensemble de toutes les possibilités de réaliser sur un corpus la bijection f(a) dans le cas d’un indicateur quelconque. En conséquence, sur un graphe ANOVEP chaque nœud de niveau n-1 (pour n=l, 2, 3, ..., n) peut représenter, logique ensembliste, une variable [27]. La relation R(a,b) qui constitue cette variable est chaque fois symétrique, réflexive et transitive [28].

Mais, d’autre part, lorsqu’on ramène les fréquences de chaque nœud du graphe à des proportions (p + q = 1 ; p ≠ 0, q ≠ 0), le nombre entier N [564] de l’analyse traditionnelle appartient désormais à l’ensemble des fréquences relatives exprimées dans les nombres rationnels Q. D’où, dans ANOVEP, l’expression de “nombre Q trouvé au codage” [29].

Ce nombre, comme le précédent dans N, est une mesure [30]. Il exprime, en termes probabilistes, la valeur du cardinal à chaque nœud du graphe, passage à l’approche probabiliste rendu nécessaire ici en raison de la théorie de l’information [31]. Mais l’on voit déjà qu’on ne travaillera plus ici avec les fréquences brutes de l’analyse traditionnelle ; bien plutôt, se basant sur la transformation des fréquences en proportions, c’est en se servant d’indices qu’on va calculer un corpus. ANOVEP utilise à ce jour trois indices. J’en ai rappelé ailleurs la justification [32] ; ils se construisent à partir de trajets sur des graphes et par référence à la théorie de l’information [33]. Précisons simplement ici que l’emploi de la notion d’entropie dans ANOVEP est différent de celui qu’on en fait dans la théorie mathématique des arbres binaires de classification [34].

Nous voici donc à pied d’œuvre, disposant de trois outils, les trois indices, pour aborder une étude des identités sociales à partir de l’analyse de contenu. Je me bornerai à n’employer ici, sauf exception, qu’un seul de ces indices, appelé dans ANOVEP le coefficient MRC de Mesure du Rendement des Catégories au codage ou indice S [35]. Je l’utiliserai pour spécifier quelques résultats d’une analyse de contenu du discours d’un échantillon d’organismes volontaires au chapitre de la définition qu’ils donnent d’eux-mêmes, de leurs pratiques et activités.

Cette démarche analytique constituera en même temps une illustration de l’utilité pratique des considérations formelles que nous venons d’aligner.

3. L’étude des identités en évaluation de programme

Dans ANOVEP, l’indice S varie, sur l’intervalle fermé [0,1 ], entre les deux cas de figure où s’encadre, d’après le schème de la méthode expérimentale, un codage dans un système de catégories : le cas de l’"objectivité parfaite” (S = 0) et celui de la “subjectivité parfaite” (S = 1).

Sur cette base, à l’aide de tableaux extraits d’une application en temps réel d’ANOVEP, je présenterai le résultat d’une suite d’opérations que l’on peut faire lorsque l’analyse de contenu est utilisée comme outil de prise de décision en gestion.

Cette démarche, en deux étapes, me servira à démontrer comment, en reconstruisant le dynamisme des identités à travers le discours d’un [565] corpus, l’analyse peut en arriver à mieux cerner ce dont on parle et, par exemple, discriminer avec une certaine précision, à travers l'interprétation du discours des organismes communautaires, l’effet éventuel d’un contre-discours du codeur.

Le besoin d’une telle analyse, d’autre part, sous certaines conditions est évident. Car, en évoquant la répartition des subventions entre organismes communautaires, on s’entend en effet pour imaginer que certains soient plus avantagés que d’autres. Mais quel genre de pratiques est ainsi avantagé ou désavantagé, par exemple, lorsqu’on parle de subventionner des sessions d’information, des fins de semaine de sensibilisation, des journées d’animation ? Que finance-t-on au juste ? Et, surtout, quant aux objectifs du programme, quelle différence entre ces pratiques, s’il y en aune, pour les membres d’un jury de sélection chargé de répartir les argents ? Pour éclairer semblables interrogations, regardons donc comment se pose la question, une année quelconque, d’après l’analyse de contenu des rapports d’activités (ou “rapports annuels”) d’organismes communautaires. Nous utiliserons pour ce faire la logique d’une courbe de Lorenz.

Cependant, pour respecter le caractère confidentiel d’informations nominatives autrement réelles, l’exemple sera extrait d’un programme fictif. La base de données de ce programme imaginaire, le programme APES d’Aménagement Paysager Extra-Sensoriel, a été construite en interpolant des données réelles d’un échantillon d’organismes, sans possibilité de retrouver la clé de l’interpolation.

3.1. Certains sont plus égaux...

Dans un logiciel d’analyse de contenu développé en application d’ANOVEP, le système MODEPAS [36], les écarts de répartition des ressources entre les participants au programme sont calculés (en différences ou en ratio) pour un certain nombre de critères. Ces critères consistent soit en critères de stratification extraits de la structure de l’échantillon des organismes communautaires concernés. Ou bien ces critères représenteront des variables, dépendantes ou indépendantes, certaines tenues pour importantes dans l’évaluation du programme en cause, d’autres pour les besoins de l’analyse de contenu, mais toujours conformément au schème de la méthode expérimentale.

Le tableau 1 ci-dessous reproduit un résultat de ce calcul. Il s’agit d’un calcul économique qui est aussi un calcul politique. En effet, si on reportait ces données sur un plan cartésien, les montants d’argent en

[566]

TABLEAU 1
APES091 : Aménagement Paysager Extra-Sensoriel

Avantages comparatifs des éléments participants par clientèles cibles (•)
TOUS : 200 éléments

CLIENTÈLE

N

Valeur ($)

Subvention

Élément

% Élém.

% Subv.

% Diff.

Moy. ($)

Rang

Non disponible

4

17 726

2,0

0,8

-1,2

4 407

Interne (membres)

81

776 315

40,5

40,5

-4,6

9 584

2

Externe (non membres)

115

1 366 896

57,5

57,5

+5,8

11 886

1

Externe (non membres)

115

1 366 896

57,5

57,5

+5,8

11 886

1

TOTAL

200

2 160 839

100,0

100,0

0,0

10

804


Avantages comparatifs des éléments participants
par difficultés rencontrées (••)
TOUS : 200 éléments

DIFFICULTÉS

N

Valeur ($)

Subvention

Élément

% Élém.

% Subv.

% Diff.

Moy. ($)

Rang

Horaire, durée

99

988 173

49,5

45,7

-3,8

9 982

6

Hébergement

9

124 927

4,5

5,8

+1,3

13 881

3

Humaines

11

164 288

5,5

7,6

+2,1

12 058

1

Matérielles

27

349 409

13,5

16,2

+2,7

12 941

4

Soutien

5

73 853

2,5

3,4

+0,9

14 771

2

Outils

5

29 292

2,5

1,4

-1,1

5 585

8

Participation

36

350 377

18,0

16,2

-1,8

9 733

7

Préparation

8

80 520

4,0

3,7

-0,3

10 065

5

TOTAL

200

2

160

839

100,0

100,0

0,0


[567]

TABLEAU 1
APES091 : Aménagement Paysager Extra-Sensoriel
(suite)

Avantages comparatifs des éléments participants par suites à donner (•••)
TOUS : 200 éléments

SUITES À DONNER

N

Valeur ($)

Subvention

Élément

% Élém.

% Subv.

% Diff.

Moy. ($)

Rang

Terminé

57

417 135

28,5

19,3

-9,2

7 318

5

Reprendre (non réalisé)

9

127 502

4,5

5,9

+1,4

14167

3

Reprendre tel quel

129

1555 512

64,5

72,0

+7,5

12 058

4

Sur demande

1

21 018

0,5

1,0

+0,5

21018

2

Avec des partenaires

1

0

0,5

0,0

-0,5

0

7

Par engagement personnel

0

0

0,0

0,0

0,0

0

8

Avec personnes ressources

2

5 220

1,0

0,2

-0,8

2 610

6

TOTAL

200

2

160

839

100,0

100,0

0,0


[568]

ordonnée et le nombre d’organismes en abscisse, la diagonale figurerait l’égalité parfaite dans la répartition des ressources entre les organismes communautaires admissibles au programme de subvention. La réalité est autre, comme l’indique la colonne des écarts en plus ou en moins, à droite, sous le titre “Subventions”.

Le tableau décrit les valeurs de répartition des argents entre des éléments ou organismes admis au programme (écarts, montants, nombre d’éléments, direction des écarts, etc.), selon trois critères extraits du discours que ceux-ci tiennent sur eux-mêmes : la clientèle que vise l’organisme, les difficultés rencontrées par l’organisme à réaliser son action et les suites qu’il entend lui donner. Ces valeurs varient selon les critères. On obtiendrait en particulier trois courbes différentes ; cependant, la fiabilité de ces courbes quant au discours des organismes n’est pas nécessairement la même de l’une à l’autre, peut-on croire : c’est là qu’intervient l’emploi de l’indice S.

Lorsque en effet des données textuelles entrent, comme ici, dans la construction des variables, un indicateur de fiabilité de celles-ci peut être ajouté au tableau. Il prend la forme d’un symbole de titre pointé, tel qu’inscrit en haut à droite. Il est gradué selon le degré d’“objectivité” décroissant de la variable au codage : meilleure (•), moyenne (••), moins bonne (•••). On constate ainsi que le tableau calcule les avantages comparatifs pour des variables se situant à chacun de ces endroits du continuum. L’indicateur de fiabilité, indicateur de localisation de la variable, est obtenu en classant les variables par terciles selon la valeur de l’indice S calculé pour chacune.

Cependant, ces résultats sont obtenus sous l’action d’un codage. Ce qui vient d’être pratiqué sur une variable pour en déterminer la teneur en “subjectivité” peut donc l’être éventuellement sur l’ensemble des variables comprises dans un système de catégories. Le tableau 2 reproduit cette dernière opération.

Examinant l’information placée sur ce tableau par rangées (dimensions ou graphes) et par colonnes (niveaux sur le graphe), on se rend compte, en prenant les valeurs de notre indice de “subjectivité”, que nous disposons d’un moyen de pondérer chaque dimension du cadre conceptuel (0,37 ; 0,30 ; 0,42), de même que chaque niveau de celui-ci. En conséquence, au moment où la grille d’analyse est mise en production et qu’elle construit les variables au moyen d’un codage par application, chaque variable de l’analyse peut être introduite au fichier déjà dotée d’un coefficient de subjectivité traduisant le poids de l’interprétation insuflé [569] au codage. C’est l’idée de base du coefficient MRC de Mesure du Rendement des Catégories au codage proposé dans ANOVEP.

TABLEAU 2
APES091 : Aménagement Paysager Extra-Sensoriel

Valeurs moyennes de l’indice S selon le niveau des variables,
par dimension du cadre conceptuel

n = 0

n = 1

n = 2

n = 3

Dim. 1

0,56

0,48

0,24

0,19

0,37

Dim. 2

0,41

0,26

0,27

0,24

0,30

Dim. 3

0,72

0,51

0,26

0,18

0,42

0,56

0,42

0,26

0,21

0,36


À titre d’illustration de l’utilité de cette idée, indiquons seulement qu’on pourrait maintenant revenir, par exemple, sur nos variables du tableau des avantages comparatifs, en le regardant cette fois à la lumière de la pondération de la variable choisie comme critère d’avantage : le critère “Thèmes”, par exemple, si on l’avait retenu, ou le critère “Clientèles”. C’est ce qu’a fait l’analyste en composant le tableau 3. Les indications qu’il en tire lui permettent de développer son analyse : vérifier des intuitions, échafauder une hypothèse, valider un codage, etc.

L’une des conséquences pratiques de l’idée de base d’ANOVEP - l’application de l’indice S sous la forme d’un Coefficient de Mesure du Rendement des catégories au codage - entraîne donc que peut changer notre façon d’apercevoir les catégories ou les variables en analyse traditionnelle. En particulier cette idée de base permet, entre autres, à la démarche analytique de passer d’un corpus clos, produit de la quantification en analyse computationnelle, au corpus ouvert propre à la sémantique (sociologie, anthropologie, etc.) de l’analyste.

C’est ce point de vue que je voudrais illustrer maintenant par une deuxième série de tableaux. On y verra comment l’usage d’un tel coefficient est susceptible en quelque sorte de garantir ou de provoquer le retour analytique au corpus, aidant ainsi à mieux définir la théorie voire le comportement du phénomène sous étude.

L’exemple porte sur un effet de polarisation sémantique à l’intérieur d’un discours. En l’occurrence ici : la polarisation des thèmes de leur action par la définition des activités auxquelles se livrent les organismes [570] communautaires qui nous parlent à l’intérieur de ce programme fictif d’Aménagement Paysager Extra-Sensoriel (APES).

TABLEAU 3
APES091 : Aménagement Paysager Extra-Sensoriel
Avantages comparatifs par thèmes

Différence

Valeur de S

Apprentissage de base

+4,6

0,28

Croissance personnelle

-5,2

0,34

Connaissance relationnelle

+0,7

0,30

Adaptation à la société

-0,1

0,33


Avantages comparatifs par clientèles

Différence

Valeur de S

Interne (membres)

-4,6

0,16

Externe (non membres)

+5,8

0,12

Non disponible

-1,2



3.2. La polarisation des thèmes
par les activités dans un discours d’identité du Nous


Supposons que le décompte des fréquences brutes d’un corpus livre le trait suivant, savoir : que, dans le discours sur eux-mêmes que tiennent des organismes communautaires, ce qu’ils disent du thème de leur action est polarisé par ce qu’ils disent de leurs activités plutôt que par ce qu’ils disent de la clientèle à laquelle ils destinent cette action.

Comment ce trait apparaît-il à l’observation ? Retenons d’abord, à l’aide de l’un des menus de MODEPAS, une association relevée par le logiciel dans le discours des organismes de notre programme APES. Le tableau 4 des valeurs de l’indice C la représente : il s’agit de l’association entre deux dimensions, X et Y, du cadre conceptuel soit la dimension “Modèle d’intervention” des organismes (X) et la dimension “Modèle de développement” (Y) qui les incite à intervenir [37].

[571]

TABLEAU 4
APES091 : Aménagement Paysager Extra-Sensoriel
Mesures d'association : Modèle d'intervention par modèle de développement
TOUS : 200 éléments

Modèle d'intervention

Modèle de développement

Clientèles cibles

Activités

Thèmes

16

168

Pratiques

2

14

Phi--deux 0,001 Coefficient de contingence C 0,032
Phi 0,036 Q (y) Yule 0,200


À un premier niveau de lecture, on remarque qu’entre les cellules individuelles du tableau, il n’y a pas indépendance. Le fait autorise un certain nombre de commentaires. Ainsi, il peut être observé qu’on parle peu des “Thèmes” en relation avec les “Clientèles cibles”, mais beaucoup, dix fois plus, en regard des “Activités” (ou l’inverse). On en conclura [572] donc que les activités prennent le pas sur les clientèles visées, lorsque le discours des organismes décrit les thèmes de leur action.

D’autre part, deuxième observation, on parle peu des “Pratiques”, comparativement aux “Thèmes”, quand on parle des “Activités”, et guère plus quand on parle de “Clientèles cibles”. Si on réunit cette observation à la précédente, il semblerait donc que l’on puisse affirmer que, plus fortement que les “Clientèles”, les “Activités” ont l’heur de polariser à la fois et le discours sur les thèmes et celui sur les pratiques. Ou, pour l’exprimer autrement : que le modèle d’intervention polariserait le modèle de développement par l’entremise de la variable “Activités” (voir tableau).

À un deuxième niveau de lecture, examinantes mesures d’association jointes au tableau, par exemple le Q de Yule, on confirmerait qu’il n’y a pas association parfaite (Q(y) = 1) entre modèle d’intervention et modèle de développement (Q(y) = 0,20). Mais une légère association conditionnelle (C = 0,032 et Phi=0,036) tendrait à confirmer l’impression précédente d’une polarisation du discours par tes activités aux dépens des pratiques ou des thèmes. En sorte que, pour entendre, par exempte, tes organismes parler de développement (pratiques et thèmes), il faudrait peut-être leur demander un discours spécifique laissant de côté leurs activités.

À tout événement, il s’agit des fréquences brutes, et on suppose que 1e codeur, quant à lui, a bien distingué tes deux : pratiques et activités.

Que se passe-t-il lors d’une lecture de nos données par l’indice S ?

Le tableau 5 reproduit l’association entre tes mêmes dimensions, mesurée cette fois à partir de la valeur S attachée aux variables à chaque observation. Au premier niveau de lecture, il n’y a pas indépendance ici non plus ; en conséquence, on peut constater qu’apparemment se trouve en jeu aussi à cette occasion une structure de discours : du sujet ou du codeur, est-on cependant justifié de se demander ?

Voici alors ce qu’on peut relever. D’abord, on parte à peu près également des “Clientèles” et des “Activités” quand on parle des “Thèmes”, contrairement au décompte brut précédent où la proportion penchait en faveur des “Activités” à ce moment. Par ailleurs, on parlera beaucoup des “Pratiques”, à l’inverse de précédemment.

En outre, la volubilité au chapitre des “Pratiques” se produit moins souvent, presque deux fois moins, en relation avec tes “Clientèles cibles” qu’en lien avec tes “Activités”. De ce fait, on pourrait supposer, tel qu’il

[573]

TABLEAU 5
APES091 : Aménagement Paysager Extra-Sensoriel
Mesures d'association : Modèle d'intervention par modèle de développement
TOUS : 200 éléments

Modèle d'intervention

Modèle de développement

Clientèles cibles

Activités

Thèmes

14

13

Pratiques

55

118

Phi--deux 0,021 Coefficient de contingence C 0,140
Phi 0,144 Q (y) Yule -0,396

en allait pour les fréquences brutes, que les “Activités” polarisent ici encore le discours, mais en étant cette fois associées aux “Pratiques”. Le modèle d’intervention influe toujours sur le modèle de développement par le biais des activités, pourrait-on estimer, mais en étant lié aux pratiques (voir tableau). Si l’on veut donc entendre parler de thèmes ou [574] de pratiques (modèle de développement), il faudra ici écouter en même temps un discours sur les activités.

Quant à avancer cette hypothèse, on pourra remarquer à un deuxième niveau qu’on observe une association conditionnelle plus forte (C = 0,140 et Phi = 0,144) que celle obtenue sur les fréquences brutes. Modèle d’intervention et modèle de développement ont donc partie liée dans un seul discours, la place de l’un à l’inverse de celle de l’autre (Q(y) = - 0,396), et le codeur n’avait peut-être pas une idée aussi claire qu’on le croyait de la différence entre pratiques et activités.

Cela n’est qu’un exemple. Mais la comparaison entre les deux tableaux fait suffisamment ressortir en quoi l’emploi d’un coefficient de mesure du rendement des catégories au codage (coefficient MRC) permet alors de conclure sur une vision plus nuancée du discours tenu par le corpus observé, au chapitre du rapport entre modèles d’intervention et modèles de développement. Sans doute, en effet, tel que le proposait au tableau 4 la description du corpus à l’aide des fréquences brutes de l’analyse computationnelle, la polarisation de ce discours par les activités est-elle maintenue, lorsqu’on pondère les variables par leur teneur en “objectivité-subjectivité” (tableau 5). Cependant, on enregistrera du même coup que le codeur (ou le codage) a moins bien distingué qu’on ne le pensait entre pratiques et activités, clientèles cibles et activités.

J’ajoute qu’on n’est pas obligé de mesurer l’association entre elles pour apercevoir l’utilité analytique de disposer d’un fichier pondéré des variables. Par exemple, un autre menu de MODEPAS permet de mesurer en elles-mêmes le rendement des catégories au codage, à partir de la combinaison de l’indice S et du coefficient de variation traditionnel, tel qu’illustré au tableau suivant.

Ce tableau ordonne en terciles les variables d’un cadre conceptuel, une fois appariées les valeurs de l’indice S et celles du coefficient de variation CV. On obtient de la sorte l’équivalent de la description d’un ordre de “subjectivité” ou d’“objectivité” entre n’importe laquelle des variables d’un cadre conceptuel ou d’une analyse [38].

Le principal bénéfice est qu’on dispose alors d’une base mesurable pour choisir de s’intéresser prioritairement à telle ou telle variable ou combinaison de variables, selon l’aspect du corpus qu’on veut mettre en relief : ou bien l’aspect par où le corpus est le plus conforme aux significations des catégories (3e tercile) ou bien le choix contraire (1er tercile). Cette latitude est avantageuse, entre autres, s’il nous faut modifier [575] les catégories soit à la lumière des objectifs de l’analyse, soit en raison de ce qu’on assume comme étant leur rendement analytique.

En ce dernier cas s’ajoute un autre gain, non négligeable dans une situation de recherche-action comme celle à l’origine d’ANOVEP. C’est que le sujet, individuel ou collectif, dont le discours est placé sous analyse, peut lui aussi être consulté sur le rendement des catégories. Puisqu’à partir d’une table des rendements deviennent en effet possibles la discussion et la manipulation voire l’invention sur mesure des catégories et ce, au niveau et au moment même, s’il le faut, de la construction du cadre conceptuel [39].

TABLEAU 6
Rendement au codage des catégories d’une étude
*

Var.

Moy.

CV.

(+/-)

Var.

Moy.

CV.

(+/-)

S003

0,916

0,29

+-

S305

0,229

0,41

= =

S007

0,911

0,31

+-

S306

0,240

0,44

= =

S010

0,906

0,30

+-

S006

0,274

0,74

= +

S103

0,874

0,31

+-

S107

0,276

0,68

= +

S108

0,476

0,27

+-

S211

0,219

0,56

= +

S215

0,332

0,34

+-

S212

0,218

0,55

= +

S011

0,814

0,44

+=

S303

0.225

0.56

= +

S102

0,420

0,40

+=

S201

0,169

0,53

- =

S105

0,385

0,52

+=

S 208

0,176

0,50

- =

S109

0,751

0,42

+=

S302

0,127

0,54

- =

S209

0,342

0,48

+=

S317

0,155

0,51

- =

S210

0,410

0,45

+=

S318

0,154

0,52

- =

S002

0,725

0,56

++

S319

0,160

0,49

- =

S009

0.379

1.15

++

S320

0,154

0,52

- =

S203

0,300

0,39

=-

S001

0,027

4,09

- +

S204

0,301

0,36

=-

S005

0,042

3,00

- +

S313

0,239

0,37

=-

S101

0,164

0,76

- +

S314

0,272

0,39

=-

S104

0,154

0,67

- +

S315

0,244

0,38

=-

S 202

0,206

0,58 •

- +

S316

0,223

0,38

=-

S 207

0,153

0,55

- +

S321

0,238

0,26

=-

S301

0,166

0,58

- +

S322

0,238

0,26

=-

S304

0,163

0,56

- +

Dans la table ci-dessus, la ligne horizontale divise en terciles les valeurs S de l’indice de mesure du rendement des catégories au codage, valeurs disposées par ordre d’« objectivité croissante » de (+-) à (-+). Cet ordre est obtenu en rapportant la valeur moyenne de l’indice S à chaque nœud du graphe, variable du cadre d’analyse (Var.), à celle de son coefficient de variation CV.

* Source : Bilan descriptif des réalisations du programme de soutien à l'éducation populaire autonome en 1988-1989, Document de travail, MEQ, 1990, p. 86-87.


Dans un tel contexte, l’avantage n’est évidemment pas que méthodologique. Car la consultation éventuelle du sujet comporte son [576] effet virtuel au niveau de la compréhension des résultats atteints par le programme et des décisions à prendre en conséquence. Or, dans l’administration publique d’où procède notre application, ces décisions sont le plus souvent de nature financière ou affectent directement les conditions de vie ou la pratique sociale des individus et des groupes concernés.

Conclusion

Tout ceci, sans doute, n’est encore qu’expérimental. Mais je voudrais terminer mon exposé en prenant prétexte de ce débouché d’ANO VEP sur la relation entre l’État et le citoyen pour insister quelque peu sur cette relation, en continuité, d’une part, avec le cadre de l’expérimentation du modèle et, de l’autre, avec le thème du colloque.

Deux réflexions principales à mon sens se dégagent en effet de l’expérimentation d’ANOVEP pour ce qui revient à concrétiser l’usage des méthodes quantitatives dans l’étude des identités.

La première renvoie à l’aspect mathématique du modèle. Comme on l’a vu en prenant connaissance de la structure logico-mathématique qui en décrit l’essentiel, le modèle ANOVEP est fondamentalement une technique de catégorisation (ou de construction de la grille en analyse de contenu) établie en fonction de résoudre ou contourner un problème de méthode assez bien identifié par le cas de figure de l’analyse à codeur unique.

Or, ce fondement du modèle évoque sans doute les notions de classes logiques ou de catégories [40]. Mais il évoque aussi le processus lui-même de la catégorisation en tant que processus cognitif, “processus par lequel un système, en l’occurrence ici une organisation en classes (...) parvient à fournir une réponse lorsqu’on lui présente plusieurs variantes d’un même objet” [41], savoir ici le corpus. “Processus fondamental de la pensée”, la catégorisation ainsi engendre du sens.

À cet égard, on aura remarqué la parenté d’ANOVEP avec l’analyse de système. Comme technique de catégorisation, ANOVEP en effet est une boîte noire [42]. Employé ici à l’étude de l’identité des Nous, le modèle peut aussi bien l’être à corriger des examens de français ou pour analyser des entrevues ou des images. Il n’y a rien là de trop surprenant, puisqu’il se veut, à l’origine et essentiellement, une langue intermédiaire, d’ordre logico-mathématique, à mi-chemin entre la langue naturelle et celle du scientifique [43]. Mais, par rapport à l’analyse traditionnelle, il se place ainsi [577] dans un rôle de médiation entre deux moments : ce qu’à la sortie de l’opération aura produit la représentation qu’on se fait du texte ou de l’image savoir des nombres ou des fréquences, et ce qui reste pris dans l’opération savoir l’interprétation de ce que le texte ou l’image ont voulu dire [44]. Sans doute, à la décharge des méthodes quantitatives, se doit-on de souligner qu’un nombre en soi n’est pas une unité de sens [45]. Mais, en permettant de dépasser le nombre pour travailler avec des indices de façon organique à l’intérieur même de la grille, la langue d’ANOVEP s’établit justement dans cet effort de médiation que représente le passage d’un corpus clos par le nombre à un corpus ouvert par la sémantique de l’analyste, cette dernière supposée quant à elle détenir un sens.

Pour autant, cette caractéristique formelle du modèle nous conduit à ma deuxième réflexion. Celle-ci porte sur l’aspect pragmatique du langage, aspect, comme on sait, rhétorique et politique à la fois. On ne s’étonne plus maintenant en effet de distinguer entre l’apparition de la vérité et la construction de la pertinence. Nous y aura habitués, entre autres, le paradoxe que si la vérité, comme le disait Ricoeur [46], c’est la communauté (et donc qu’il n’ y a communication que s’il y a communauté), il n’en reste pas moins que la communication est la condition de la communauté.

Le paradoxe s’applique immédiatement à l’étude des identités. La communication, comme la vérité en effet, serait universelle en quelque sorte, tandis que son contenu, comme la pertinence, serait singulier. Ainsi caractérisera-t-on les communautés selon des critères de revenu, de sexe, d’habitat, d’âge, d’origine ethnique, de scolarité, d’habitudes mentales, etc. Et, aux yeux de l’anthropologue ou du sociologue, celles-ci seraient finalement des types de pertinence regardant une vérité éternelle que personnifierait, au choix : la patrie de celui qui est de souche, comme on dit, l’abstraction scientifique qui est la guérison de l’inconscient, selon l’expression de Bachelard, l’information “privilégiée” de celui qui est proche du pouvoir, etc., bref, un choix d’ontologie.

En ce sens, il n’est pas dénué d’intérêt que l’application d’ANOVEP à l’évaluation de programme par le biais de l’analyse d’un discours sur les identités se réserve la place de prétendre aussi fonder en méthode une forme d’interaction entre administrateurs et administrés, ayant pour objectif de valider un système de catégories portant sur ce que les sujets prétendent être en eux-mêmes.

Car, pour parvenir à saisir un peu ce qui se passe dans la communication, cet endroit en somme où s’élaborent les identités, individuelles et [578] collectives, ni la technique ni la technologie ne sont, sans doute, des schèmes de vérité. Mais au moins peuvent-ils en être de pertinence. Comme lorsque la possibilité de calibrer la teneur en subjectivité savante d’un discours sur les identités, rêve méthodologique d’ANOVEP, renvoie à susciter la participation des intéressés eux-mêmes à l’élaboration et à la définition des catégories qui les décrivent et les expriment.

[579]
[580]
[581]
[582]


[1] Par exemple, Michel FREITAG, “Éclatement du “social” ou oubli de la société ?”, Société, 3, été 1988 : 9-25.

[2] Jules DUCHASTEL, “La contre-culture, une idéologie de l’apolitisme”, in La transformation du pouvoir au Québec, 1980, Montréal, Éditions coopératives Albert Saint-Martin.

[3] Zeilig S. HARRIS, “Analyse du discours”, Langages, 13, 1969.

[4] Richard FOURNIER, L'éducation populaire à travers la vie associative, I, L’outil d'analyse, 1983, Ministère de l’Éducation du Québec ; Construction d’un modèle pour l’emploi de l'analyse de contenu à codeur unique en évaluation de programme, 1985, Thèse de maîtrise, Université Laval.

[5] Paul RICOEUR, De l’interprétation, 1965, Paris, Seuil.

[6] Cela vaut autant pour l’analyse d’artefacts ou d’idéologies que pour celle d’un poème de Baudelaire. Voir par exemple Marie-Jeanne BOREL, Jean-Blaize GRISE et Denis MIÉVILLE, Essai de logique naturelle, 1983, Berne, Peter Lang.

[7] Jean-Toussaint DESANTI, La philosophie silencieuse, 1975, Paris, Seuil.

[8] Par exemple. Howard FREEMAN et Peter ROSSI, Evaluation. A systematic approach, 1982, Beverly Hills, Sage Publications.

[9] Edward G. CARMINES et Richard A. ZELLER, Measurement in the social sciences, 1980, Cambridge, Cambridge University Press.

[10] Par exemple, Anselm L. STRAUSS, Qualitative analysis for social scientists, 1987, Cambridge, Cambridge University Press.

[11] Richard FOURNIER, L'éducation populaire à travers la vie associative, I, L’outil d'analyse, 1983, Ministère de l’Éducation du Québec ; Construction d’un modèle pour l’emploi de l'analyse de contenu à codeur unique en évaluation de programme, 1985, Thèse de maîtrise, Université Laval.

[12] Voir, par exemple, la méthode décrite dans STRAUSS, op. cit.

[13] R. ASH, Information Theory, 1976, New York, John Wiley and Sons.

[14] Voir référence 4 ci-dessus, 1983, note 45 : 70, et 1985.

[15] Richard FOURNIER, “L’emploi de l’analyse de contenu en évaluation de programme : introduction à la logique d’ANOVEP”. Communication présentée au Colloque thématique de l’ACSALF sur L’évaluation sociale : savoirs, éthiques et méthodes. Sherbrooke, 1991.

[16] Voir référence 4 ci-dessus, 1983, note 15 : 42, et 1985.

[17] Marc BARBUT, Mathématiques des sciences humaines, 1969, Paris, PUF.

[18] Richard FOURNIER, “Schématisation et représentation des connaissances en analyse de contenu appliquée à l’information de gestion”, in A. TURMEL, (Ed.) Sociologie et intelligence artificielle, 1988, Laboratoire de recherche sociologiques. Université Laval : 151-178.

[19] Richard FOURNIER, “Représentation des connaissances et gestion de l’incertitude en analyse de contenu à codeur humain : le modèle ANO VEP”, in B. Moulin et G. Simiand, (Éd.) Informatique cognitive des organisations, 1989, Limonest, l’interdisciplinaire : 491-502.

[20] Richard FOURNIER, “La représentation des connaissances en analyse de contenu appliquée à l’information de gestion dans le modèle ANOVEP”, ICO Québec, 2,4 : 116-127.

[21] Par exemple, Bernard BERELSON, Content Analysis in Communication Research, 1952, Glencoe, Free Press.

[22] Voir référence 4 ci-dessus, 1983, note 12 : 65 et 1985.

[23] Marc BARBUT, Mathématiques des sciences humaines, 1969, Paris, PUF.

[24] Id.

[25] Ibid.

[26] Le jugement est le sens intentionnel d’une activité, l’activité de juger. Une fois l’opération effectuée, “on a affaire, comme l’exprime Suzanne Bachelard (La Logique de Husserl, 1957, Paris, PUF), non plus au sens intentionnel mais au sens lui-même”. Dire ici que le jugement du codeur est étanche (ou ne peut être actualisé que par le souvenir), c’est désigner ce passage accompli par l’acte de juger d’une intention vide à une intention remplie (Erfüllen).

[27] Voir références 4 et 19 ci-dessus.

[28] Id.

[29] Bien que se fondant sur l’affirmation d’un jugement de présence ou d’absence, l’analyse ne dénombre que les jugements de présence. En conséquence, lorsque l’une des cases de la dichotomie est vide (p = 0 ou q = 0), le nombre entier qui représente la valeur de la case complémentaire est un rationnel de dénominateur égal à 1. D’autre part, on devrait dire plus précisément : l’ensemble D des décimaux positifs, sous-ensemble de Q.

[30] L’application fait correspondre à un ensemble d’éléments E un nombre obéissant à certaines conditions, dont : m(F)=0 et m(E)≥0.

[31] Voir la référence 19 ci-dessus.

[32] Richard FOURNIER, “L’emploi de l’analyse de contenu en évaluation de programme : introduction à la logique d’ANO VEP”, in L’évaluation sociale : savoirs, éthiques et méthodes, Colloque thématique de l’ACSALF, Sherbrooke, 1991 ; “Représentation des connaissances et gestion de l’incertitude en analyse de contenu à codeur humain : le modèle ANOVEP”, in B. Moulin et G. Simiand, (Ed.) Informatique cognitive des organisations, 1989, Limonest, l’Interdisciplinaire.

[33] Voir Richard FOURNIER, Construction d’un modèle pour l’emploi de l’analyse de contenu à codeur unique en évaluation de programme, 1985, Thèse de maîtrise, Université Laval.

[34] À cet endroit, H est une règle de bipartition (goodness of fit) et cet emploi fait référence à la théorie des probabilités où H est une fonction de répartition de classe F, telle qu’ étudiée par Fisher (Voir : L. BREIMAN, J. H. FRIEDMAN étal., Classification and Régression Trees, 1984, Belmont, Wadsworth International Group). L’entropie dans ANOVEP renvoie à la théorie de l’information. Dans son premier théorème, Shannon emploie cette fonction de classe F, qu’il nomme entropie d’après Boltzman, pour définir un canal sans bruit par un coût de codage C plus grand ou égal à H (Voir : A.M. MATHAI et P.N. RATHIE, Basic Concepts in Information Theory and Statistics, 1975, London, John Wiley and Sons). H est ainsi utilisée dans ANOVEP par référence au principe d’entropie maximum d’une distribution (Voir : Richard FOURNIER, Construction d’un modèle pour l’emploi de l’analyse de contenu à codeur unique en évaluation de programme, 1985, Thèse de maîtrise, Université Laval).

[35] Richard FOURNIER, Une mesure de rendement du codage en analyse de contenu : l’indice MRC, 1984, Ministère de l’Éducation du Québec.

[36] MODEPAS (Modélisation de Données en Éducation Populaire Autonome Subventionnée) est une application (1989) d’ANOVEP à l’évaluation d’un programme public de financement. Michel Saucier a programmé MODEPAS en APL 6800 sur le Macintosh et l’a adapté au PC avec l’APL de STSC. Hélène Boutet et Steve Aubry ont programmé en SAS les essais d’ANOVEP sur ordinateur central. Sur Macintosh, MODEPAS requiert un espace en mémoire de 4 Mo et un espace de disque de 3 Mo. Sur PC et compatibles, MODEPAS requiert un espace en mémoire de 640K auquel s’ajoutent 3 Mo de mémoire virtuelle prise sur disque ou en mémoire étendue. L’espace de disque est de 3 Mo. Une application d’ANOVEP généralisée (1992) à l’évaluation de programme portera elle-même le nom de MODEPAS II (Modélisation de Données en Évaluation de Programmes d’Activités Suivies).

[37] Le logiciel MODEPAS dichotomise par la médiane, conformément à la tradition (Ithiel DE SOLA POOL, Trends in Content Analysis, 1959, Urbana, University of Illinois Press.)

[38] Richard FOURNIER, Bilan descriptif des réalisations du programme de soutien à l’éducation populaire autonome en 1988- 1989, 1990, Ministère de l’Éducation du Québec. Document administratif.

[39] C’est la signification du terme “Organique” (“built-in”) dans l’acronyme ANOVEP.

[40] Par exemple : Jean PIAGET (sous la direction de), Logique et connaissance scientifique, 1976, Paris, Gallimard ; Bertrand RUSSEL, Signification et vérité, 1969, Paris, Flammarion.

[41] Pauline GRAVEL, Interface, 11, 1991 : 45 et 47.

[42] Richard FOURNIER, L’État interventionniste : l’évaluation qualitative. L’analyse de contenu au seuil d’une nouvelle pratique, 1985, Université du Québec. Communications. Études, no 19.

[43] Richard FOURNIER, L'éducation populaire à travers la vie associative, I, L’outil d'analyse, 1983, Ministère de l’Éducation du Québec ; Construction d’un modèle pour l’emploi de l'analyse de contenu à codeur unique en évaluation de programme, 1985, Thèse de maîtrise, Université Laval.

[44] Richard FOURNIER, Construction d’un modèle pour l’emploi de l’analyse de contenu à codeur unique en évaluation de programme, 1985, Thèse de maîtrise, Université Laval.

[45] Jean REMY et Danielle RUQUOY, Méthodes d’analyse de contenu et sociologie, 1990, Bruxelles, Publications des facultés universitaires Saint-Louis.

[46] Paul RICOEUR, Histoire et vérité, 1955, Paris, Seuil.



Retour au texte de l'auteur: Jean-Marc Fontan, sociologue, UQAM Dernière mise à jour de cette page le samedi 1 février 2020 19:19
Par Jean-Marie Tremblay, sociologue
professeur associé, Université du Québec à Chicoutimi.
 



Saguenay - Lac-Saint-Jean, Québec
La vie des Classiques des sciences sociales
dans Facebook.
Membre Crossref