Saisir un mot clé:
 
 

Algorithme_ID3

Ce site est un miroir du site http://fr.wikipedia.org/wiki/Accueil

Algorithme ID3

Un article de Wikipédia, l'encyclopédie libre.

L?algorithme ID3 a été développé à l?origine par Ross Quinlan. Il a tout d?abord été publié dans le livre ??Machine Learning?? en 1986.

C?est un algorithme de classification supervisé, c?est-à-dire qu'il se base sur des exemples déjà classés dans un ensemble de classes pour déterminer un modèle de classification. Le modèle que produit ID3 est un arbre de décision. Cet arbre servira à classer de nouveaux échantillons.

L'algorithme C4.5 est une amélioration d'ID3, notamment du point de vue de la facilité d'implémentation.

Sommaire

[] Principe général

Chaque exemple en entrée est constitué d'une liste d'attributs. Un de ces attributs est l?attribut « cible » et les autres sont les attributs « non cibles ». En fait l?arbre de décision va permettre de prédire la valeur de l?attribut « cible » à partir des autres valeurs. Bien entendu, la qualité de la prédiction dépend des exemples : plus ils sont variés et nombreux, plus la classification de nouveaux cas sera fiable.

Un arbre de décision permet de remplacer un expert humain dont il modélise le cheminement intellectuel. A chaque n?ud correspond une question sur un attribut non cible. Chaque valeur différente de cet attribut sera associée à un arc ayant pour origine ce n?ud. Les feuilles de l'arbre, quant à elles, indiquent la valeur prévue pour l?attribut cible relativement aux enregistrements contenus par la branche (indiqués par les différents arcs) reliant la racine à cette feuille.

ID3 construit l'arbre de décision récursivement. À chaque étape de la récursion, il calcule parmi les attributs restant pour la branche en cours, celui qui maximisera le gain d'information. C?est-à-dire l'attribut qui permettra le plus facilement de classer les exemples à ce niveau de cette branche de l'arbre. On appelle ce calcul l'entropie de Shannon dont voici la formule utilisée :

 I_(i) = - \sum^_  f (i,j) \log f (i, j)

[] Algorithme

fonction ID3(exemples, attributCible, attributsNonCibles)
   si exemples est vide alors /* N?ud terminal */
       retourner un n?ud Erreur
   sinon si attributsNonCibles est vide alors /* N?ud terminal */
       retourner un n?ud ayant la valeur la plus représentée pour attributCible
   sinon si tous les exemples ont la même valeur pour attributCible alors /* N?ud terminal */
       retourner un n?ud ayant cette valeur
   sinon /* N?ud intermédiaire */
       attributSélectionné = attribut maximisant le gain d'information parmi attributsNonCibles
       attributsNonCiblesRestants = suppressionListe(attributsNonCibles, attributSélectionné)
       nouveauN?ud = n?ud étiqueté avec attributSélectionné
       
       pour chaque valeur de attributSélectionné faire
           exemplesFiltrés = filtreExemplesAyantValeurPourAttribut(exemples, attributSélectionné, valeur)
           nouveauN?ud->fils(valeur) = ID3(exemplesFiltrés, attributCible, attributsNonCiblesRestants)
       finpour
       
       retourner nouveauN?ud

[] Références

[] Voir aussi

 
Le Texte ci-dessus est disponible sous GNU Free Documentation License.
La source est wikipedia http://fr.wikipedia.org/wiki/Algorithme ID3
Home

Données
A la une
Articles
Formatons en lignes
Téléchargement
Licence GNU
Encyclopedie
Portail logiciels libres

Partenaires

beyrouthsurseine.com
Sonnerie & Logos
Photos-Video
Ringtones-Sonnerie
Actualite.org
Terrain tennis

  
Janvier 2009
L
M
M
J
V
S
D
1 234
567891011
12131415161718
19202122232425
262728293031
     
Tous les Logos et Marques sont déposés, les commentaires sont sous la responsabilité de ceux qui les ont publiés, le reste © technicmania.com