Rechercher

Réseaux sociaux




Accueil du site > Construction du graphe

Construction du graphe

Requêtes sur les données

Chaque requête sur la base de données génère trois fichiers à l’aide du bouton "Générer les fichiers d’extraction..." :

- TransactionIndiv_annee-mois-jour_heure-min-sec.txt : chaque ligne correspond à une transaction. Chaque ligne est de la forme :

N°transaction;année-mois-jour;<N>numéros des notaires cités</N><T>numéros des tenanciers actifs séparés par des point-virgules</T><S> numéros des seigneurs actifs séparés par des point-virgules</S><TC>numéros des tenanciers confronts séparés par des point-virgules</TC><SC>numéros des seigneurs confronts séparés par des point-virgules</SC>

- TransactionIndiv_ annee-mois-jour_heure-min-sec _legend.txt : Chaque ligne est de la forme :

N°individu - dénomination de l’individu (en général nom prénom) (#N°individu) (date première mention – date dernière mention) paroisse (autres informations)

- TransactionIndiv_ annee-mois-jour_heure-min-sec _legend_date.txt : c’est le fichier « légende » précédent dont les individus ont été classé par ordre croissant de date de première mention.

Construction du graphe

Le graphe des relations sociales entre individus est construit avec le programme java « farmers.jar ».

farmers.jar

Ce programme contient un « help » accessible par la commande « java -jar farmers.jar –help » .

Ce programme prend en entrée un fichier balise du type TransactionIndiv_annee-mois-jour_heure-min-sec.txt En sortie, On obtient une liste d’arêtes typées par un code couleur

  • arête de type tt (2 tenanciers, même transaction) : vert
  • arête de type ttc (1 tenancier et 1 tenancier confront, même transaction) : bleu
  • arête de type tctc (2 tenanciers confronts, même transaction) : jaune
  • arête de type s (2 tenanciers, même seigneur) : rouge
  • arête de type n (2 tenanciers, même notaire) : violet
Exemple d’utilisation de farmers.jar

Les différents paramètres pour lancer le programme sont les suivants :

- fichier_in : Donne l’emplacement et le nom du fichier balise à lire. Il faut donner le chemin d’accès complet. Exemple : -fichier_in=C :/Users/Romain/Documents/TransactionIndiv_annee-mois-jour_heure-min-sec.txt La valeur par défaut est -fichier_in=C :/Users/input.txt

- fichier_out : Le nom du fichier de sortie sur lequel sera écrit la liste des arêtes (s’assurez d’avoir les droits d’écriture dans le répertoire) Exemple : -fichier_out=C :/Users/Romain/Documents/liste_aretes.txt La valeur par défaut est : C :/Users/result.txt Attention : Le nom du fichier de sortie sera légèrement modifié afin de conserver les fichiers précédemment créés par le programme. La date du jour (jour, mois, année, heure, minute, seconde) est concaténée à la fin du nom du fichier. Donc si vous entrez -fichier_out=C :/Users/Romain/Documents/liste_aretes.txt le 21 juillet 2011 à 10H57’44’’, le fichier de sortie sera par exemple : liste_arêtes_2172011105744.txt

- date1 : la date de départ d’analyse Exemple : -date1=1280 La valeur par défaut est 1250

- date2 : la date de fin d’analyse Exemple : -date1=1310 La valeur par défaut est 1360

- poids_tt : Le poids de la relation ’Apparaitre en tant que tenancier dans une meme transaction’. Si le paysan x est le paysan y apparaissent dans une même transaction en tant que tenanciers alors l’arête x y sera répétée poids_tt fois Exemple : -poids_tt=3 La valeur par defaut est 1

- poids_ttc : Le poids de la relation ’Dans une même transaction, un paysan apparait en tant que tenancier et l’autre en tant que tenancier confront’. Si le paysan x est le paysan y apparaissent dans une même transaction, x en tant que tenancier et y en tant que tenancier confront alors l’arête x y sera repetee poids_ttc fois Exemple : -poids_ttc=2 La valeur par défaut est 1

- poids_tctc : Le poids de la relation ’Apparaitre en tant que tenanciers confronts dans une meme transaction’. Si le paysan x est le paysan y apparaissent dans une meme transaction en tant que tenanciers confronts alors l’arete x y sera repetee poids_tctc fois Exemple : -poids_tctc=1 La valeur par défaut est 0 IMPORTANT

- poids_s : Le poids de la relation ’Avoir le même seigneur dans une période donnée’. Si le paysan x est le paysan y ont le même seigneur dans une période donnée (qui est le paramètre périodes) alors l’arête x y sera répétée poids_s fois Exemple : -poids_s=1 La valeur par défaut est 1

- poids_n : même chose que poids_s mais pour les notaires au lieu des seigneurs. La valeur par défaut est la même

periode_s : Periode pendant laquelle deux tenanciers peuvent être lies s’ils ont même seigneur. Ce parametre est introduit pour pallier le fait qu’un seigneur vit plus longtemps qu’un paysan et éviter ainsi de lier deux paysans si leurs dates d’activité sont trop éloignées. Par exemple, si le paysan x a le seigneur s à une date t et le paysan x’ a le seigneur s à une date t’, ce lien sera pris en compte si |t-t’|

- periode_n : meme chose que periode_s mais pour les notaires au lieu des seigneurs. La valeur par defaut est la meme A VOIR AUSSI. Même remarque que précédemment.

- nb_s_max : Nombre maximum d’apparition d’un seigneur pour qu’il puisse etre qualifie de ’petit seigneur’ et puisse etre pris en compte dans les liens sociaux. Si un seigneur apparait plus de nb_s_max fois alors il est considere comme un grand seigneur est n’est pas pris en compte. La valeur par defaut est 100

- nb_n_max : meme chose que nb_s_max mais pour les notaires au lieu des seigneurs. La valeur par defaut est la meme

Exemple d’utilisation :

_ java -jar farmers.jar -fichier_in=C:/Users/Romain/Documents/input.txt -fichier_out=C:/Users/Romain/Documents/output.txt -date1=1290 -date2=1390 -poids_tt=3 -poids_ttc=2 -poids_tctc=1 -poids_s=1 -poids_n=1 -periode_s=16 -periode_n=14 -nb_s_max=150 -nb_n_max=200