Modélisation de l'information spatiale dans des images 3d biomédicales

  • 67 trang
  • file .pdf
Rapport de Stage
Modélisation de l’information spatiale
dans des images 3D biomédicales
Encadrants :
Auteur :
Thomas Boudier (UPMC)
Tran Thi Nhu Hoa
Ludovic Roux (IPAL)
Master 2 - Systèmes Intelligents et Multimédia
Institut de la Francophonie pour l’Informatique
Septembre 2014
Remerciements
Je tiens à remercier dans un premier temps, mon encadrant de stage, Monsieur Thomas
Boudier, pour m’avoir accueilli au sein de l’équipe, pour son soutien tout au long du
stage, sa disponibilité, et ses conseils nombreux et éclairés.
Je remercie également Monsieur Ludovic Roux, Monsieur Lu Shijian pour m’avoir aidé
à me familiariser avec l’environnement de recherche à IPAL, ses conseils mais surtout
pour sa gentillesse et son implication dans mon stage.
Sans oublier mes amis du bureau des étudiants IPAL, pour l’accueil chaleureux, pour
l’ambiance de travail très amicale.
Merci enfin à Mme Coralie Hunsicker pour m’avoir aidé à résoudre toutes les démarches
administratives difficiles qui ont permis la réalisation de mon stage.
Tran Thi Nhu Hoa
Table des matières
Contents iii
List of Figures v
1 Introduction 1
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 IPAL & Partenaires . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Objectif du stage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.1 Contexte du travail . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.2 Objectif du stage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 État de l’art 5
2.1 Rappel de biologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Structure de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2 Cancer du sein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.3 Diabète et insuline . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Analyse de l’organisation spatiale . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Travaux similaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Analyse à l’échelle locale . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 Analyse à l’échelle globale . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.3.1 Statistique spatiale . . . . . . . . . . . . . . . . . . . . . 13
2.2.3.2 Fonctions d’estimation de la distribution . . . . . . . . . 15
2.3 Estimation de la distance . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.1 Distance euclidienne . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.2 Distances géodésiques . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4 Environnement logiciel utilisé . . . . . . . . . . . . . . . . . . . . . . . . . 22
3 Implémentation 24
3.0.1 Modélisation de la structure d’une cellule . . . . . . . . . . . . . . 24
3.0.2 Modélisation à l’échelle locale . . . . . . . . . . . . . . . . . . . . . 25
3.0.2.1 Forme analytique de la cellule . . . . . . . . . . . . . . . 25
3.0.2.2 Formes complexes de la cellule . . . . . . . . . . . . . . . 29
3.0.3 Modélisation à l’échelle globale . . . . . . . . . . . . . . . . . . . . 34
3.0.4 Modélisation à multi-échelles . . . . . . . . . . . . . . . . . . . . . 38
3.0.5 Langage de description de l’organisation spatiale . . . . . . . . . . 42
4 Résultat & Discussion 46
4.1 Résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
iii
Table des matières iv
4.1.1 Résultat de modélisation de la structure d’une cellule . . . . . . . 47
4.1.2 Résultat de modélisation de la distribution de vésicules dans une
cellule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1.3 Résultat des expérimentations à multi-échelles . . . . . . . . . . . 50
4.1.4 Résultat de génération aléatoire des positions des cellules . . . . . 52
4.2 Conclusion et Perspective . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Bibliographie 55
Table des figures
1.1 Image & Pervasive Access Lab (IPAL) logo. . . . . . . . . . . . . . . . . . 1
2.2 Étapes du cancer du sein : Normal cells, Ductal hyperplasia - trop de
cellules. Atypical ductal hyperplasia - trop de cellules qui commencent à
apparaı̂tre anormale (également connu sous le nom ADH) .Ductal carci-
noma in situ - trop de cellules qui se développent comme un cancer mais
sont encore confinés à l’intérieur du conduit (DCIS). DCIS-MI (DCIS
avec micro-invasion) - plusieurs sous-types de DCIS, certains plus graves
que d’autres. Invasive ductal cancer - L’état incontrôlé des cellules qui
ont passé à travers des barrières tissulaires normales. . . . . . . . . . . . . 8
2.3 Les ı̂lots de Langerhans (A-D) Les micrographies confocales montrent des
ı̂lots pancréatiques de Langerhans à partir de sections chez l’humain (A),
le singe (B), la souris (C) et le cochon (D). L’insuline immunoréactive
(rouge) - β cellule, glucagon immunoréactive (vert) - α cellule, et la
somatostatine-immunoréactives (cellules bleues - δ cellule) (d’après [1])
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4 Les relations RCC5D et RCC8D. Les régions sont représentées en des
cercles 2 dimentions (l’objet plus lumineux est X et l’objet foncé est Y). . 12
2.5 La correspondance de Discrete Méréotopologie et Morphologie Mathématique,
défini dans RCC8D (d’après [2]). . . . . . . . . . . . . . . . . . . . . . . . 12
2.6 Algorithme de détection des relations spatiales entre les régions . Cet al-
gorithme 0, 1 est codée pour l’image X et 0, 2 est codé pour Image Y (0 est
le plan arrière, le fond et 1, 2 représente la région pixels). L’histogramme
de la somme (X + Y) ne contient que valeurs de 0 (fond), 1 (région X),
2 (région Y), ou 3 (ces deux régions occupent l’emplacement de ce pixel)
et il peut être utilisé pour trouver la relation RCC5D entre les régions.
Par exemple si le nombre de pixels de l’histogramme 1 et 2 (les valeurs
de régions X et Y) sont tous égaux à 0 et la somme S (valeur égal à 3)
est supérieure à 0, la relation est EQ (d’après [2]). . . . . . . . . . . . . . 13
2.7 Exemple : Illustration 2D de l’extraction de compartiment Promyelocy-
tic Leukemia (PML) (l’image extraite à partir de l’article de David J.
Weston, voir [3]). A) l’image d’origine B) PML est segmenté à partir de
cette image. C) Chaque noyau est remplacé par son centre de gravité.
Une question que nous pouvons poser, les composants (en vert ) PML
sont distribuées au hasard ou ont des relations les uns aux autres. . . . . 14
2.8 Différents types de distribution spatiale. Les positions peuvent être uni-
formément et indépendamment distribués (complètement aléatoire modèle),
ou attraction mutuelle (modèle agrégé) ou répulsion mutuelle (modèle
régulier, uniforme) (d’après [4]). . . . . . . . . . . . . . . . . . . . . . . . 15
v
Liste des figures vi
2.9 G-function, les points observés - événements (events en anglais) : 1, 2,
3,...,12 dans une région d’étude . Pour chaque événement, nous avons
trouvé leur voisin avec la plus proche de distance possible (nearest neigh-
bor). Par exemple : le plus proche de l’événement 1 est l’événement 10
avec la distance rmin = 25.59. (d’après [5]) . . . . . . . . . . . . . . . . . . 16
2.10 Graphe du G-function. La forme de function G nous présente la façon
dont les événements sont espacées dans un modèle (pattern) de points.
(d’après [5]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.11 La F-function est la function de distribution cumulée de la distance entre
les points qui ont été géneré aléatoirement dans la région d’étude (croix
bleues) et leur plus proche événement (points observés - des cercles dans
la figure) (d’après [5]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.12 Le résultat SDI du F-function (graphe en couleur noire) est la mesure de
la distance du vide dans la région d’étude. Cette distance a la tendance à
être grande pour le modèle agrégé et plus petite pour le modèle régulier.
Si le graphe de F-function est situé entre deux graphes avec les valeurs de
confiance 5% et 95%, des événement ont la distribution aléatoire. Si cette
graphe est situé au-dessous du graphe de 5%, c’est-à-dire une distribution
agrégé (cluster) et au-dessus du graphe de 95%, c’est-à-dire régularité
(uniformité) des événements dans la région d’étude. . . . . . . . . . . . . 17
2.13 Le processus de production de carte de distance pour chaque image. . . . 19
2.14 Exemple du calcul de la carte de distance Euclidienne . . . . . . . . . . . 20
2.15 Exemple du calcul de la transformation de distance. En (a) : image binaire
noir et blanc. En (b), il s’agit de la distance euclidienne de chaque pixel
au pixel noir le plus proche. Les valeurs de distance est au carré de sorte
que seules les valeurs entières sont stockées. . . . . . . . . . . . . . . . . . 21
2.16 Exemple du calcul de la carte de distance géodésique, résultat obtenu en
appliquant la fonction ’geodesic’ dans le plugin ’geodesic distance map’
sous le logiciel ImageJ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.17 ImageJ - logiciel d’analyse et de traitement d’image. . . . . . . . . . . . . 22
3.1 Schéma de la structure d’une cellule. . . . . . . . . . . . . . . . . . . . . . 25
3.2 Illustration du calcul 8 relations RCC8 (DC, EC, PO, EQ, TPP, NTPP,
TPPi, NTPPi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3 Illustration du résultat de l’algorithme 2 en 2D. Des relations spatiales
entre les objets S1 , S2 , ..., Sn et entre ces objets et le domaine de recherche
P sont présentés dans la table de relation. Notre but est de produire
aléatoirement ces objets dans le domaine de recherche P et satisfaire ces
règles de relation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.4 Comparaison deux méthodes de production d’un modèle spatial . . . . . 29
3.5 Illustration du résultat de la fonction TPPi 3 calcul du domaine TPPi
possible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.6 Illustration de l’algorithme 4 : calcul du domaine DC possible . . . . . . . 33
3.7 Étapes d’implémentation de l’algorithme 5. . . . . . . . . . . . . . . . . . 34
3.8 Illustration de l’algorithme 6 : calcul du domaine de distribution en se
basant sur le paramètre de distribution α . . . . . . . . . . . . . . . . . . 36
Liste des figures vii
3.9 Illustration d’une étape d’implémentation de l’algorithme 7 pour produire
un modèle agrégé (cluster). État initial : domaine de recherche P + un
objet S1 existant, le but est de génerer un objet S2 qui est associé avec
S1 , à l’extérieur de S1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.10 Scénario 1 : dans la modélisation de la structure d’une cellule, les vésicules
S1 , S2 , ..., Sn sont à l’intérieur de noyau N : le noyau est à l’intérieux de
cellule P , les vésicules sont à l’intérieur de noyau et les vésicules sont
disconnectés les uns aux autres. Si TPPi N , Si (DC, EC) Sj , Si TPPi
P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.11 Scénario 2 : dans la modélisation de la structure d’une cellule, les vésicules
S1 , S2 , ..., Sn sont à l’intérieur de cytoplasme : les vésicules sont à l’intérieur
de la cellule P , l’extérieur du noyau N . Si TPPi P , Si (DC, EC) Sj , Si
DC N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.12 Scénario 3 : dans la modélisation de la structure d’une cellule, les vésicules
S1 , S2 , ..., Sn sont à l’intérieur du cytoplasme P et à l’intérieur ou l’extérieur
du noyau N . Si TPPi P , Si DC, EC Sj , Si DC N ou Si TPPi N . . . . 39
3.13 Scénarios 4 : dans la modélisation de la structure des cellules, la première
étape du cancer du sein (voir la section 2.1.2), cellules normales S1 , S2 , ..., Sn ,
plusieurs cellules ont la connexion externe. Si EC Si+1 , Si TPPi P . . . . 39
3.14 Scénario 5 : dans la modélisation globale, les vésicules S1 , S2 , ..., Sn sont
distribués aléatoirement dans le domaine de recherche P . Si TPPi P ,
S
Rdistribution ∈ {random} . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.15 Scénario 6 : dans la modélisation globale, les vésicules S1 , S2 , ..., Sn sont
distribués régulièrement. (repulsion, uniform), chaque vésicule est le plus
S
loin possible des autres. Si TPPi P , Rdistribution ∈ {unif orm} . . . . . . 40
3.16 Scénario 7 : dans la modélisation globale, les vésicules S1 , S2 , ..., Sn sont
clusterisé (modèle agrégé). Il s’agit des centroids (des vésicules attirent
l’attention des autres) et des autres ont été attirés par les centroids. Si
S
TPP P , Rdistribution ∈ {clustered} . . . . . . . . . . . . . . . . . . . . . . 40
3.17 Scénario 8 : dans la modélisation des protéins : les protéins A sont dis-
tribués aléatoirement, les protéins B sont colocalisés avec les protéins A, B
disjoint A. Comment trouver la distribution des protéins B ? Rdistribution A
B
∈ {random}, B DC A, A, B TPP P , Rdistribution ? . . . . . . . . . . . . 40
3.18 Scénario 9 : dans la modélisation des protéins : les protéins A sont dis-
tribués aléatoirement, les protéins B sont colocalisés avec les protéins A,
B et A se touchent. Comment trouver la distribution des protéins B ?
A
Rdistribution ∈ {random}, B EC A, A, B TPP P , Rdistribution B ? . . . . . . 40
3.19 Scénario 10 : des clusters en membrane, les vésicules S1 , S2 , ..., Sn sont ont
la connection intérieure du membrane. Le problème est comment génèrer
un modèle satisfaisant ces règles spatiaux ? Si TPP P , Rdistribution S ∈
{clustered}. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.20 La conception globale des objets. Il s’agit de cinq objets, structures prin-
cipaux : image, algorithme, request, mereo-topologie, structure. . . . . . 43
3.21 La conception globale des objets et des relations entre les objets. Cette
conception fait le lien entre les objets, strutures et répondre à la question
comment cette connaissance structurelle et spatiale peut être utilisée pour
guider l’interprétation d’images. . . . . . . . . . . . . . . . . . . . . . . . . 44
Liste des figures viii
3.22 Implémentation du langage de description de l’organisation spatiale n3.
Initialement, nous avons défini les ontologies, des règles, et des queries.
Ensuite, l’exécution le logiciel EYE Engine sur ces fichiers n3, nous avons
obtenu un fichier du résultat. Après, nous avons utilisé un programe Java
pour lire les structures dans le fichier du résultat n3 et obtenu des relations
logiques. Enfin, nous avons exécuté le programe sur des images d’entrée
et des requêtes, obtenu des images de sortie. . . . . . . . . . . . . . . . . 45
4.1 L’interface du programme - un plugin ”3D Statistic” avec des options
sous le logiciel ImageJ (2.4). . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2 Choisir l’option 3D Aggregated Pattern dans le plugin ”3D Statistic” sous
le logiciel ImageJ (2.4), une fênetre pour saisir des paramètres d’entrée
comme le nombre des clusters, la taille de la cellule. . . . . . . . . . . . . 47
4.3 Résultat de génération d’un modèle spatial dans le scénario 3.0.4 en 2D. Il
s’agit de 6 vésicules sont à l’intérieur du noyau et 1 noyau est à l’intérieur
de la cellule. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4 Résultat de génération d’un modèle spatial dans le scénario 3.0.4 en deux
dimentions. Il s’agit de 10 vésicules sont à l’intérieur de la cellule et à
l’extérieur du noyau. Le noyau est à l’intérieur de la cellule. . . . . . . . . 48
4.5 Résultat de génération d’un modèle spatial dans le scénario 3.0.4 en deux
dimentions. Il s’agit de 13 vésicules sont à l’intérieur de la cellule et
à l’extérieur du noyau, 2 vésicules sont à l’intérieur de la cellule et à
l’intérieur du noyau. Le noyau est à l’intérieur de la cellule. . . . . . . . . 48
4.6 Résultat dans la modélisation d’une cellule en trois dimentions, il s’agit
de 6 vésicules qui sont à l’intérieur de la cellule et sont disjointes. . . . . . 48
4.7 Résultat de génération du modèle des cellules normales dans la première
étape du cancer du sein (voir la section 2.1.2) . . . . . . . . . . . . . . . 49
4.8 Résultat de génération du modèle spatial en modélisation à l’échelle glo-
bale en exécution le plugin 3D Statistic sous ImageJ. Dans la figure,
nous avons obtenu trois modèles de distribution qui correspondent à trois
scénarios (3.0.4, 3.0.4, 3.0.4). Le graphe de F-function (la couleur bleu) -
la figure (A) est situé entre deux graphes (en couleur vert) 5% et 95% avec
la valeur de confiance de F-function SDI = 0.65 ou 65% c’est-à-dire, la
distribution aléatoire - les vésicules aléatoire. Cette graphe - la figure (B)
est situé au-dessous du graphe de 5% , avec la valeur de confiance de F-
function SDI = 0.02, c’est-à-dire la distribution agrégé (les vésicules clus-
terisés) . Le graphe de F-function (la couleur bleu) au-dessus du graphe
de 95% avec la valeur de confiance de F-function SDI = 1.0 - 100% dans
la figure (C), c’est-à-dire régularité (uniformité) des vésicules uniforme
dans la région d’étude. Les résultats obtenus montrent que les modèles
spatiaux a été produit correctement. . . . . . . . . . . . . . . . . . . . . . 50
4.9 Résultat de génération du modèle spatial en modélisation à multi-échelle,
correspond au scénario (3.0.4) - cluster en membrane. . . . . . . . . . . . 51
4.10 Les différents types de cellules α, β, δ à l’origine. Par convention l’insuline
est produite par les cellules β en couleur rouge, le glucagon est produit
par les cellules α en couleur verte, la somatostatine est produite par les
cellules δ en couleur bleu. . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.11 Le résultat de génération aléatoire les positions des cellules δ (les cellules
δ en couleur bleu, β en couleur rouge, α en couleur verte). . . . . . . . . . 53
Liste des figures ix
4.12 Résultat du F-function (le graphe en couleur bleu) et résultat du G-
function (le graphe en couleur rouge) en estimant la distribution des
cellules δ dans 5 propositions d’organisation spatiale .La valeur SDI de
F-function dans 5 cas : n1 = 0.98, n2 = 0.98, n3 = 0.35, n4 = 0.87,
n5 = 0.87. C’est-à-dire dans deux premiers cas, les cellules δ sont cluste-
risé, les autres cas, les cellules δ sont génerés aléatoirement. . . . . . . . . 53
List of Algorithms
1 Algorithme de Monte Carlo pour tirer un objet aléatoire qui satisfait les
règles de relation R dans le domaine de recherche P . . . . . . . . . . . . . 27
2 Générer de nombreux objets à l’intérieur du domaine de recherche P et
satisfaire les règles de relations RCC en utilisant la méthode de Monte-Carlo 28
3 Fonction TPPi : tirer le domaine du centre d’un objet Si qui est à l’intérieur
du domaine de recherche P et a radius r et la relation Si TPPi P . . . . . 30
4 Fonction DC : tirer le domaine du centre d’un objet Si qui est à l’intérieur
du domaine de recherche P , à l’extérieux des objets existes S et a radius
r et la relation Si DC P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5 Amélioration de l’algorithme 1 de Monte Carlo :génération de nombreux
objets S1 , S2 , ..., Sn à l’intérieur du domaine de recherche P en utilisant la
carte de distance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
6 Fonction de distribution en appliquant la carte de distance. Paramètre de
distribution α ∈ [0, 1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
7 Génération de nombreux objets S1 , S2 , ..., Sn à l’intérieur du domaine de
recherche P , et sont distribué (aléatoire, agrégé, uniforme) en utilisant la
carte de distance. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
8 Algorithme pour réaliser le scénario 10 : des clusters en membrane. . . . . 41
- Function genererCentroidVesicules (cellule P , nbCentroid k) . . . . . . . . 41
- Function genererElementPerCluster (listeCentroid C, n) . . . . . . . . . . 42
x
Chapitre 1
Introduction
1.1 Introduction
1.1.1 IPAL & Partenaires
Figure 1.1: Image & Pervasive Access Lab (IPAL) logo.
L’IPAL, à l’origine Image Processing & Application Laboratory, est créé en 1998 comme
laboratoire international de recherche du CNRS, dans le but de créer un espace de
recherche collaboratif entre les 4 entités suivantes :
1. Le CNRS(Centre national de la recherche scientifique), organisme public français
de recherche scientifique.
2. L’Université Joseph Fourier de Grenoble (UJF)(science, technologie, santé).
3. L’Institut de Recherche en Technologies de l’Information et de la Communi-
cation (I2R) de l’Agence Singapourienne de Science, Technologie et Recherche
(A*STAR).
4. L’Université Nationale de Singapour (NUS).
Aujourd’hui Image & Pervasive Access Lab (IPAL), il est codirigé depuis 2008 par le
professeur Daniel RACOCEANU, pour la partie française, et par le Dr. Joo Hwee LIM
pour la partie singapourienne.
1
Chapter 1. Introduction 2
L’IPAL concentre ses recherches autour de deux thèmes :
1. MIU (Medical Image Understanding), autour de l’exploration cognitive et sémantique
d’images médicales pour l’aide au pronostic et au pronostic ;
2. PAWN (Pervasive Access and Wellbeing Management), autour des environne-
ments intelligents destinés aux personnes âgées dépendantes.
Le projet le plus récent sur le thème des images médicales MIU est le projet MICO,
Microscopie Cognitive Virtuelle. Ce projet a été lancé en 2006, cherche à développer
une plateforme permettant, à partir d’une lame d’histopathologie, la visualisation et le
traitement numérique de cet échantillon.
Ce projet résulte donc de réels besoins exprimés par les pathologistes. L’objectif du
projet MICO n’est pas de remplacer le rôle du pathologiste mais de lui offrir un outil
d’assistance et de validation, permettant à la fois un gain en temps et en justesse de
pronostic. Dans un deuxième temps, le projet vise à offrir aux médecins une interface
pertinente et adaptée à leurs besoins. L’IPAL a développé pour cela une ontologie des-
tinée à représenter les connaissances médicales. Le focus étant sur le cancer du sein,
le modèle d’ontologie est basé sur le Système de Gradation de Nottingham, système
standard de gradation de ce type de cancer.
1.2 Objectif du stage
1.2.1 Contexte du travail
La description des relations spatiales entre objets dans les images fournit une sémantique
forte qui vient enrichir les techniques bas niveau de représentation du contenu visuel des
images. Dans les travaux récents du laboratoire, Nicolas Lomélie et Daniel Racoceanu
ont développé une application [6] qui concerne l’analyse de la structure des images de
microscopies et la modélisation haut niveau des relations spatiales. Notre stage à conce-
voir va continuer sur ce thème et se basera sur quelques articles ([7]), ([4]) concernant
la description de l’organisation spatiale.
Afin de mieux comprendre comment les cellules s’organisent dans les tissus, notamment
lors de la survenue d’un cancer. Nous proposons de concevoir un système de règles pour
Chapter 1. Introduction 3
définir des relations spatiales dans les images, puis de les appliquer afin de re-créer des
structures virtuelles dans des images. L’application principale concernera l’étude des
connaissances concernant la structure de la cellule dans des images histopathologiques.
Ce stage consistera donc en la programmation JAVA pour analyser le système de règles
et pour construire les images découlant de ces règles.
Ce stage est co-encadré par Thomas BOUDIER, Maı̂tre de conférences à l’Université
Pierre et Marie Curie, Ludovic ROUX, ingénieur de recherches à IPAL, ainsi que par
Shijian LU dans le cadre d’une collaboration entre IPAL et I2R. Notre stage se déroule
au laboratoire IPAL, UMI CNRS 2955, Singapour.
1.2.2 Objectif du stage
L’objectif du stage est d’implémenter un système de règles pour définir des relations
spatiales dans les images. Afin de concevoir ce système, il est, dans un premier temps,
important d’avoir une réflexion sur l’étude des connaissances concernant la structure de
la cellule dans des images histopathologiques. Ainsi, il sera nécessaire de comprendre
comment décrire les modèles et leur relations spatiales par des règles logiques et les
concevoir. Ensuite, nous serons en mesure de vérifier et d’estimer ces modèles par des
techniques d’apprentissage.
En principe, nous allons concevoir ce système d’après les étapes d’un processus de
modélisation et simulation. La suite de ce mémoire est organisée en trois parties qui
sont les suivantes :
1. Première partie : état de l’art. Dans un premier temps, nous allons définir le
problème à étudier et l’analyser. Le domain d’application de ce travail est l’ima-
gerie bio-médicale, nous allons nous concentrer sur l’organisation spatiale dans
ces images et trouver comment décrire cette organisation spatiale au niveau des
cellules et des tissus. Ensuite, nous les formulerons par des modèles conceptuels :
des composants et des relations spatiales les uns aux autres.
De plus, les solutions existantes sont présentées en vue de décrire ces modèles.
Les relations spatiales sont considérées à l’échelle locale et à l’échelle globale.
L’analyse de l’organisation spatiale à l’échelle locale concerne la relation relative
de deux objets dans une image ou des images différentes. L’analyse de l’organisa-
tion spatiale à l’échelle globale se concentre sur la distribution de l’ensemble des
objets dans l’espace de recherche : les objets sont distribués de manière aléatoire,
uniforme ou regroupé.
2. Deuxième partie : implémentation. A partir d’un modèle conceptuel, nous al-
lons essayer de visualiser le modèle dans des images deux dimentions et trois
Chapter 1. Introduction 4
dimentions. Particulièrement, nous appliquerons les techniques d’estimation de
distance comme les transformations de distances. Par ailleurs, à partir des ana-
lyses présentées dans la première partie, nous proposons des scénarios d’organi-
sation spatiale et des solutions (contribution de notre travail).
3. Troisième partie : résultat, conclusion et perspectives. Nous montrerons les résultats
obtenus et les analyserons pour valider les solutions que nous avons apportées.
La conclusion, les perspectives, et les références cloturont ce mémoire.
Chapitre 2
État de l’art
Ce chapitre présente la recherche bibliographique sur toutes les méthodes, les tech-
niques, et les travaux préliminaires concernant ce sujet, leurs avantages ainsi que leurs
inconvénients. Cela m’aide à établir un protocole d’étude adapté et fiable pour que la
réalisation du sujet soit menée à terme.
2.1 Rappel de biologie
La cellule est l’unité de structure, fonctionnelle et reproductrice constituant toute partie
d’un être vivant. Chaque cellule est une entité vivante qui, dans le cas d’organismes
multicellulaires, fonctionne de manière autonome, mais coordonnée avec les autres. Les
cellules sont réunies en tissus. L’étude de l’architecture de la cellule est devenu une étape
préalable de la biologie cellulaire et la modélisation bio-médicale.
Dans cette section, nous allons étudier quelques phénomènes, en priorité, nous allons
observer l’organisation spatiale de l’ensemble des cellules dans deux maladies : le cancer
du sein et le diabète. En se basant sur ces connaissances, nous pouvons formaliser les
problèmes et décrire le modèle.
2.1.1 Structure de la cellule
Toutes les cellules contiennent les structures suivantes (plus détaillé voir [8]) :
— Membrane plasmique - sépare la cellule de l’environnement extérieur.
— Cytoplasme - intérieur de la cellule remplie de liquide.
— Les composants nucléaires (noyau et nucléole) - le noyau est une structure cellu-
laire, présent dans la majorité des cellules, et contenant l’essentiel du matériel
5
2. État de l’art 6
(b) Le noyau tel qu’il apparaitrait
si on lui retranchait un segment
(a) Structure d’une cellule : plasma membrane, cytoplasme, (plus détaillé voir [8]).
noyau et nucléole, vésicules (plus détaillé voir [8]).
génétique de la cellule (ADN). Il a deux fonctions principales : contrôler les
réactions chimiques du cytoplasme et stocker les informations nécessaires à la
division cellulaire. Le nucléole est un sous-compartiment cellulaire du noyau et
est le lieu où se produit la transcription des ARN ribosomiques1 (ARNr), qui vont
participer à la construction des protéines, les deux sous-unités des ribosomes.
— Vésicules sont de petits sacs remplis de liquide. Ces sacs peuvent être très petit, et
circule dans le cytosol où elle peut stocker, transporter ou encore digérer des pro-
duits et des déchets cellulaires. Il existe différents types de vésicules : vésicules de
transport qui déplacent des molécules à l’intérieur de la cellule, vésicules synap-
tiques qui stockent des neurotransmetteurs, etc. La vésicule est un composant
très important dans la structure de la cellule. Le processus de modélisation se
concentre souvent sur ce composant.
Dans notre travail, nous allons nous concentrer sur la position relative des vésicules dans
la cellule.
2.1.2 Cancer du sein
Le cancer du sein (plus détaillé voir [9]) est un type de cancer très répandu, surtout
pour les femmes. En principe, cancer est un problème très sérieux car il n’y a pas de
remède efficace, et il est estimé que près de 1 femme sur 8 aux État Unis développera
un cancer du sein invasif au cours de sa vie. Ce type de cancer se forme dans les tissus
du sein, habituellement les conduits et les lobules.
2. État de l’art 7
Étapes du cancer du sein Le cancer du sein, généralement comme toute sorte de
cancer, a des différentes étapes. Ainsi, le cancer du sein peut être ”ductal” ou ”lobular”,
et pour ces emplacements, ”in situ” ou ”envahissants”. En général, 80 % de cas sont le
carcinome ductal. Nous montrerons les différents étapes de cancer dans la figure (2.2).
2. État de l’art 8
Figure 2.2: Étapes du cancer du sein : Normal cells, Ductal hyperplasia - trop de
cellules. Atypical ductal hyperplasia - trop de cellules qui commencent à apparaı̂tre
anormale (également connu sous le nom ADH) .Ductal carcinoma in situ - trop de
cellules qui se développent comme un cancer mais sont encore confinés à l’intérieur du
conduit (DCIS). DCIS-MI (DCIS avec micro-invasion) - plusieurs sous-types de DCIS,
certains plus graves que d’autres. Invasive ductal cancer - L’état incontrôlé des cellules
qui ont passé à travers des barrières tissulaires normales.
2. État de l’art 9
2.1.3 Diabète et insuline
L’insuline est une hormone sécrétée par le pancréas, plus précisément par des cellules
spécialisées situées dans les ı̂lots de Langerhans. Elle agit comme une clé qui ouvre
une porte permettant ainsi l’entrée du glucose (sucre) dans les cellules de l’organisme.
Celles-ci utiliseront le glucose comme carburant ou le mettront en réserve pour une
utilisation future. L’insuline joue donc un rôle de régulateur en maintenant la glycémie
à des valeurs normales. Si le pancréas, pour une raison ou une autre, est incapable de
fournir une quantité suffisante d’insuline ou que celle-ci n’arrive pas à faire son travail,
le diabète apparaı̂t.
Les ı̂lots de Langerhans (plus détaillé voir [10], [11], [1]) sont de petits organes situés
aux pancréas qui sont cruciaux pour l’homéostasie du glucose. Les hormones produites
par les ı̂lots de Langerhans sont sécrétées directement dans la circulation sanguine par
au moins quatre types de cellules :
1. L’insuline est produite par les cellules β (65-80 % des ı̂lots).
2. Le glucagon est produit par les cellules α (15-20 %).
3. La somatostatine est produite par les cellules δ (3-10 %).
4. Le polypeptide pancréatique par les cellules F (ou PP) (1 %).
Dans notre travail, nous essayons d’estimer la distribution et l’interaction entre les types
de cellules α, β, δ. De plus, nous allons proposer d’autres organisation de ces cellules.