A new generalized linear model (GLM) framework for analysing categorical data; application to plant structure and development. - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Thèse Année : 2013

A new generalized linear model (GLM) framework for analysing categorical data; application to plant structure and development.

Une nouvelle famille de modèles linéaires généralisés (GLMs) pour l'analyse de données catégorielles ; application à la structure et au développement des plantes.

Résumé

This thesis aims at proposing a new class of GLMs for a hierarchically-structured categorical response variable such as a partially-ordered variable for instance. A first step consisted of clarifying differences and commonalities between GLMs for nominal and ordinal response variables. On this basis we introduced a new specification of GLM for categorical response variable, weather ordinal or nominal, based on three components: the ratio of probabilities r, the cumulative distribution function F and the design matrix Z. This framework allowed us to define a new family of models for nominal data, similar to the cumulative, sequential and adjacent families of models for ordinal data. Then we defined the class of partitioned conditional GLMs (PCGLMs) using directed trees and (r,F,Z) specification. In our biological context, data takes the form of multivariate sequences associating a categorical response variable (type of axillary production) with explanatory variables (e.g. internode length). In the semi-Markov switching partitioned conditional generalized linear models (SMS-PCGLM) estimated on the basis of these sequences, the underlying semi-Markov chain represents both the succession and lengths of branching zones, while the PCGLMs represent the influence of growth explanatory variables on axillary productions within each branching zone. On the basis of these integrative statistical models, we showed that shoot growth influences specific branching events.
Le but de cette thèse est de proposer une nouvelle classe de GLMs pour une variable réponse catégorielle structurée hiérarchiquement, comme une variable partiellement ordonnée par exemple. Une première étape a été de mettre en évidence les différences et les point communs entre les GLMs pour variables réponses nominale et ordinale. Sur cette base nous avons introduit une nouvelle spécification des GLMs pour variable réponse catégorielle, qu'elle soit ordinale ou nominale, basée sur trois composantes : le ratio de probabilitées r, la fonction de répartition F et la matrice de design Z. Ce cadre de travail nous a permis de définir une nouvelle famille de modèles pour données nominales, comparable aux familles de modèles cumulatifs, séquentiels et adjacents pour données ordinales. Puis nous avons défini la classe des modèles linéaires généralisés partitionnés conditionnels (PCGLMs) en utilisant des arbres orientés et la specification (r,F,Z). Dans notre contexte biologique, les données sont des séquences multivariées composées d'une variable réponse catégorielle (le type de production axillaire) et de variables explicatives (longueur de l'entre-noeud par exemple). Dans les combinaisons semi-markoviennes de modèles linéaires généralisés partitionnés conditionnés (SMS-PCGLM) estimées sur la base de ces séquences, la semi-chaîne de Markov sous-jacente représente la succession et les longueurs des zones de ramification, tandis que les PCGLMs représentent, l'influence des variables explicatives de croissance sur les productions axillaires dans chaque zone de ramification. En utilisant ces modèles statistiques intégratifs, nous avons montré que la croissance de la pousse influençait des événements de ramification particuliers.
Fichier principal
Vignette du fichier
Book.pdf (2.93 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00936845 , version 1 (27-01-2014)

Identifiants

  • HAL Id : tel-00936845 , version 1
  • PRODINRA : 326634

Citer

Jean Peyhardi. A new generalized linear model (GLM) framework for analysing categorical data; application to plant structure and development.. Statistics [math.ST]. Université Montpellier II - Sciences et Techniques du Languedoc, 2013. English. ⟨NNT : ⟩. ⟨tel-00936845⟩
656 Consultations
1345 Téléchargements

Partager

Gmail Facebook X LinkedIn More