Informations apportées par cette représentation
des données brutes
Notre objectif est de tester l'influence
du nombre d'espèces plantées sur le nombre d'espèces
observées.
Même un petit tableau de résultats (ci-contre)
est difficile à analyser.
Qualitativement, on peut dire qu'il y a plus d'espèces
observées que d'espèces plantées : des espèces
"invasives" sont venues s'installer.
Mais il est difficile de dire, à la simple vue
du tableau, si l'augmentation de la biodiversité spécifique
dépend du nombre d'espèces plantées.
Une représentation graphique des résultats nous permettra
d'avancer dans notre réflexion.
Feuille de travail sous Open Office
Mener une réflexion préliminaire
Toujours avoir en tête (ou mieux, formuler par écrit)
son objectif. Dans notre exemple, l'objectif est de tester l'influence du nombre
d'espèces plantées sur le nombre d'espèces observées.
C'est à dire qu'on teste l'hypothèse :
Le nombre d'espèces observées dépend
du nombre d'espèces plantées
Ou formulé autrement :
Le nombre d'espèces observées est
fonction du nombre d'espèces plantées
C'est-à-dire :
Nombre d'espèces observées =
f (Nombre d'espèces plantées) y = f (x)
Je sais représenter graphiquement une fonction mathématique
: un repère orthonormé (deux axes perpendiculaires), y
en ordonnées et x en abscisses. Je vais donc placer le nombre
d'espèces observées (NbEspObs) sur l'axe vertical et le nombre
d'espèces plantées (NbEspPlant) sur l'axe horizontal.
Insérer un graphe sur la
feuille de travail
Sélectionner à la souris la plage de données à insérer dans le graphe. Si
les données sont dans des cellules non contiguës, sélectionner
le premier groupe de cellules, puis maintenir la touche "Ctrl"
appuyée en sélectionnant le second groupe de cellules. Puis
:
Microsoft Excel : Insertion / Graphiques
Open Office Calc : Insertion / Diagramme
Libre Office Calc : Insertion / Objet / Diagramme
Choisir le type de graphe
Les principaux tableurs proposent à peu près
les mêmes types de graphes (Voir ci-contre Open Office).
Le choix des types de "diagrammes" d'Open Office Calc
Les deux seuls types qui
correspondent "visuellement" à nos besoins sont "Ligne"
et "XY dispersion" ("Nuage de points" sous Excel).
Testez les deux : vous verrez que seul le type XY permet d'avoir une représentation
proportionnelle des valeurs du nombre d'espèces plantées
sur l'axe des abscisses.
Relier ou non les points du nuage
de points ?
Rappelons que nous souhaitons "représenter
graphiquement des données numériques".
Sous Libre Office : Le tableur propose de relier ou non les points (ligne
droite, courbe en escalier, différentes courbes lissées...)
Chaque point du nuage de points correspond
à une donnée.
Relier les points, c'est tracer une ligne passant par
toutes les données.
Cette ligne sera un ensemble de points. Quelques uns correspondront aux
données, les autres sont "inventés" par le logiciel
: ceux-là ne sont pas des données.
Il y a une infinité de lignes (et d'équations
mathématiques associées à ces courbes) passant par
tous le points du nuage. Chacune d'entre elles est une hypothétique
tendance évolutive, c'est-à-dire un modèle.
Pourquoi laisser le tableur nous en imposer une, qui
ne tient pas compte d'informations dont nous disposons (liées par
exemple au protocole, à nos connaissances scientifiques, à
...) ?
Conclusion : Représenter seulement les
points (les données)
Courbe lissée sous Microsoft Excel
(le diamètre des points est volontairement exagéré)
Sélectionner / Modifier
les données à représenter
Tous les tableurs possèdent un assistant se lançant
automatiquement lors de l'insertion d'un graphe (diagramme).
Par défaut, les valeurs de la colonne sélectionnée
de gauche sont placées en abscisses lors de l'ouverture de l'assistant.
Bien vérifier ce qui s'affiche, en particulier l'attribution des
deux séries de valeurs aux axes x et y (colonnes inversées,
oubli de valeurs lors de la sélection, ...).
Une fois le graphe affiché, il est possible d'en
modifier chaque caractéristique par des clics droit sur les différents
éléments du graphe.
Sous Open Office, modification de l'attribution des séries
de données aux axes x et y
Exploiter le graphe réalisé
Un graphe = un outil de réflexion
Le graphe doit contenir toutes les données du tableau
de résultats et seulement ces données. Vérifier que c'est bien
le cas...
Son intérêt est de visualiser d'un coup d'oeil toutes les données, ce
qui est impossible avec le tableau (surtout si il a des dizaines ou des
centaines de lignes et colonnes!).
=
Quelle(s) information(s) apporte cette représentation
graphique des données brutes ?
Le nuage de points est utilisé pour visualiser
une tendance évolutive de y en fonction de x.
A la vue de ces graphes, on peut supposer que :
Graphe A
y = f(x)
y est une fonction croissante de x
Graphe B
y ≠ f(x)
y n'est pas une fonction de x
Graphe C
y = f(x)
y est une fonction décroissante de x
Seuls des tests particuliers permettent de quantifier la relation
entre les deux variables x et y. Nous en verrons un exemple sur la page
d'aide sur le coefficient R²..
Si on essaie d'appliquer au graphe qui nous a servi d'exemple
sur cette page, il apparaît :
que, peut-être, la relation qui unit le nombre d'espèces
observées au nombre d'espèces plantées est décroissante
puis croissante
mais que le nombre de points est très faible, ce qui augmente le
risque d'erreur (et sans doute interdit toute tentative d'analyse de ces résultats).
Solution : Maintenant que cet exemple simple a permis de maîtriser l'exploitation
de la banque de données, il faudrait recommencer avec un échantillon
contenant des parcelles de type 8 et 16 espèces plantées, et un
nombre beaucoup plus important de parcelles de chaque type !
Vidéo (Windows 7, Microsoft Excel 2007, Open Office Calc 4.1.1.)