|
info-dec.com
Pays:
| Inscrit le: 29 Oct 2006 |
| Messages: 174 |
| Localisation: France |
|
 |
| Posté le: Mar 10 Avr, 2007 12:23 |
|
 |
 |
 |
 |
Le texte suivant a été pris à partir de cette page: http://spadsoft.com/content/view/51/93/
a solution SPAD Data Mining reprend toutes les fonctionnalités des logiciels SPAD Profiling et SPAD Scoring et intègre en complément les arbres de décisions interactifs, l'analyse des tableaux multiples et la dernière innovation de SPAD : les typologies par arbres de décision (ICT).
Data MiningLes arbres de décision constituent une alternative puissante aux techniques classiques de régression et d'analyse discriminante. Ils permettent d'exprimer les résultats sous forme de règles faciles à interpréter, récupérables et applicables à d'autres données (en particulier sous forme de requêtes dans les grosses bases de données).
Arbres de décision interactifs
* Méthodes CART, CHAID, C4.5
* Validation par échantillon-test (tirage aléatoire ou repéré par une variable), validation croisée (pour de petits échantillons)
* Edition des variables équi-réductrices, équi-divisantes
* Matrice des coûts de mauvais classement , Probabilités a priori
* Critères d'arrêt : nombres de niveaux de l'arbre, effectif minimum pour diviser un segment, seuil de spécialisation
* Analyse automatique ou interactive
* Modification de l'arbre :
o Elagage manuel de l'arbre
o Choix des variables de coupure
o Remonter ou descendre l'arbre d'un niveau
o Regroupement de modalités, valeur-seuil d'une variable continue
* Visualisation :
o Vue d'ensemble de l'arbre avec zoom avant/arrière
o Exploration locale d'un segment et comparaison graphique avec l'ensemble de la population
o Vue données avec échantillon d'apprentissage, échantillon test, échantillon d'élagage
o Caractéristique générale de l'arbre et matrice de confusion
* Edition d'un rapport général sur l'arbre au format html
* Edition des règles de décision en mode " Select " ou " Update " au format SQL selon le SGBD (Oracle, Access…)
Tableaux Multiples
Il n'est pas rare de disposer, non pas d'un tableau de données, mais d'une suite de tableaux : le même tableau à des dates successives, les tableaux de résultats des différents membres d'un jury d'analyse sensorielle, etc. "Savoir tirer le meilleur d'un tableau de données, c'est bien ! - Exploiter à fond plusieurs tableaux liés entre eux, c'est mieux !! ". C'est l'adage qui caractérise aussi bien la méthode STATIS que la méthode AFM.
* Analyse Factorielle Multiple (AFM)
o Exploration des données au delà des analyses de données classiques en exploitant la notion de 'groupes de variables'
o Groupes de variables actives/illustratives, nominales ou continues
o Analyses partielles et analyse globale
o Editeur graphique puissant et interactif
* STATIS
o Alternative à l'AFM
o Méthodes STATIS, STATIS Duale et Triadique de Jaffrenou
o Groupes de variables continues actives
o Analyse temporelle de l'évolution d'une batterie d'indicateurs
o Editeur graphique puissant et interactif
Le logiciel SPAD s'enrichit continûment d'innovations méthodologiques et graphiques dont la dernière méthode de data mining ICT (Interactive Clustering Tree). Disponible dans la version 6.5 du logiciel SPAD, ICT révolutionne l'approche des typologies (i.e. segmentations). Cette méthode extrêmement puissante formalise directement les typologies sous la forme d'arbres de décision. Les conditions d'appartenance aux classes sont alors déterminées par des règles logiques. La typologie gagne ainsi en lisibilité et en facilité d'interprétation. Elle est particulièrement opérationnelle lorsqu'il s'agit d'affecter un nouvel individu à l'une des classes (i.e. segments) ou d'actualiser les classes d'appartenance des individus dont le profil a changé au cours du temps.
Tous les résultats peuvent être automatiquement mis en forme dans Excel. Comme pour toutes les procédures c**çues pour le logiciel, les calculs peuvent être effectués sur la base complète ou sur toute sous-population définie par des filtres logiques, par sélection sur liste ou encore par échantillonnage. Tous les calculs tiendront compte le cas échéant d'une variable de pondération ou de redressement. Le traitement des données manquantes est particulièrement souple et adapté aux différentes procédures statistiques du logiciel SPAD Data Mining.

|
|
|