Projet Picartext

Vous êtes ici : accueil > Recherche de mots

Recherche d'un mot dans le corpus

Module expérimental de recherche de mots dans le corpus (concordancier).


Mot recherché (exemple : "tchair"):

Méthode de recherche :

Chaîne littérale (ex.: trouve uniquement "tchair")
Correspondance phonétique (ex.: trouve "tcherre", "tchère", "tcher"...)
Correspondance dialectale (ex.: trouve aussi "querre", "queure"...)
Expression rationnelle étendue : voir cette page

Lieu de référence des auteurs :

Nord Pas-de-Calais
Aisne Oise Somme
Hainaut belge

Année de naissance des auteurs : Après Avant

Genres (plusieurs choix possibles) :



Note sur la recherche dans le corpus

Le mot est recherché dans le corpus suivant la méthode sélectionnée :
  1. chaîne littérale : la séquence de lettres est recherchée telle qu'elle a été saisie.
  2. correspondance phonétique : le mot est d'abord converti en sa représentation phonétique à l'aide d'un phonétiseur. C'est cette représentation phonétique qui est recherchée, ce qui permet de ne pas tenir compte de l'orthographe des auteurs.
  3. correspondance dialectale : le mot est converti en une forme abstraite (lemme dialectal) qui neutralise la variation dialectale du picard. Ceci permet de le retrouver sous d'autres formes dialectales.
  4. expression rationnelle étendue : comme les deux précédentes, cette option permet de chercher d'autres variantes, mais en contrôlant leur étendue grâce à un langage de programmation spécifique. Cette option est à réserver aux utilisateurs expérimentés.
Avertissement :Les options 2 à 4 peuvent produire des résultats inattendus. Ceux-ci peuvent être dûs à deux types de problèmes inhérents aux algorithmes utilisés :
  • « bruit » : la recherche retourne trop de résultats. Ceci est particulièrement à attendre pour une recherche par correspondances dialectales, car nous avons prévu de nombreuses variantes possibles. Ex.: la recherche de "tchair" (tomber) retourne des occurences de "coér" (encore), "quart", etc. (le système tend à ignorer les différences de voyelles).
  • « silence » : la recherche ne retourne pas certains résultats attendus. Ceci peut être dû, par exemple, dans une recherche par correspondances phonétiques, à des graphies non conformes aux règles du français. Ex.: la recherche de "keurir" (courir) ne retourne pas la forme "ceurir" utilisée par certains auteurs, car elle est interprétée comme [soerir].
Le mot recherché (et ses variantes éventuelles) est présenté dans un contexte de quelques mots avec mention de l'auteur. Le symbole <p> représente un saut de paragraphe.



Conception et réalisation : Alain DAWSON, Yayoi NAKAMURA-DELLOYE
Contact : lesclap(a)u-picardie.fr
Dernière mise à jour : 11/01/2015