# 31 Août 2010 # script qui permet de produire le fichier arff à partir du fichier de la base binaire (avec vms ou non) j'utilise le fichier domaine de valeurs pour incrmenter la lecture des items en cas de vm exemple (-1 -2 3) -1 -2 je passe à 3 # commande awk -f produire_fichier_arff_V2.awk Base1.txt domaine_val.txt #Base1.txt: #1 3 5 8 #2 3 5 9 #2 -3 -4 7 9 #2 3 6 9 #-1 -2 3 6 8 #1 4 7 9 #1 3 -5 -6 -7 8 #1 4 6 -8 -9 #domaine_val.txt (seulement les domaines de valeurs de tous les attributs) #1 2 #3 4 #5 6 7 #8 9 #sortie #@RELATION base #@ATTRIBUTE X1 {1,2} #@ATTRIBUTE X2 {3,4} #@ATTRIBUTE X3 {5,6,7} #@ATTRIBUTE X4 {8,9} #@DATA #1,3,5,8 #2,3,5,9 #2,?,7,9 #2,3,6,9 #?,3,6,8 #1,4,7,9 #1,3,?,8 #1,4,6,? BEGIN{cpt=0;cpt2=0;} { #ARGIND est l'identifiant du fichier qu'on est en train de lire if(ARGIND==1) { data[cpt]=$0 cpt++ } if(ARGIND==2) { tab2[cpt2]=$0 cpt2++ } } END{ print "@RELATION base" "\n" for(i=0;i