Analyse Allemand
Analyse Anglais
Analyse Chinois
Analyse Français

Analyse Allemand

Grâce à Tree-tagger, lors de l'ouverture de la base, un dictionnaire des lemmes est automatiquement généré. Ceci facilite notre tâche, plus besoin de reprendre l'expression régulière utilisée dans le script, on retrouve plus rapidement les deux traductions du verbe « devoir » dont nous souhaitons observer l'utilisation. En l'interrogeant, on trouve que « sollen » compte 275 occurrences, tandis que « müssen » en compte 229. A priori, on pourrait penser que « sollen » est à privilégier, mais la différence n'est pas très significative et pourrait être due aux textes sélectionnés. Tâchons de voir les emplois de ces deux verbes en contextes et de les expliquer : par exemple, est-ce qu'une forme ne serait pas privilégiée par rapport à l'autre dans certains sous-corpus ?

Voici donc la répartition de ces deux formes dans chaque sous-corpus :

MÜSSEN :
conditions d'utilisation et règlements intérieurs : 35
extraits de lois : 68
presse : 0
tutoriels : 14

SOLLEN :
conditions d'utilisation et règlements intérieurs : 51
extraits de lois : 107
presse : 0
tutoriels : 15

Voici également un graphe illustrant leur répartition :

erreur 404

Il est étonnant de noter que le trameur ne trouve pas d'occurrences de ces deux verbes dans le sous-corpus presse. Pourtant, lorsqu'on se reporte au tableau de résultats et l'extraction de contextes réalisée par le mini-grep, aussi bien qu'egrep, on s’aperçoit qu'il existe bel et bien un certain nombre d'occurrences. Notre fichier DUMP-TOTAL est bon, la balise <SCORPUS=PRESSE> est bien placée et nous avons vérifié la présence de « sollen » et « müssen » dans le sous-corpus. Nous ne comprenons pas et décidons d'exclure ce sous-corpus pour la suite de notre étude.

Nous remarquons que les deux verbes ont à peu près le même nombre d'occurrences dans les trois sous-corpus, seul le sous-corpus de lois montre une vraie différence. Observons alors les concordances de ces deux formes pour essayer d'en comprendre l'usage.

Pour cette partie, nous décidons de plus travailler à partir du dictionnaire des lemmes, nous reprenons l'expression régulière utilisée dans le script, afin d'observer les différentes formes sous lesquelles se retrouve ces deux verbes. Un tri par formes puis un tri par sous-corpus nous ont permis de faire les observations suivantes :

- « sollen » est très souvent utilisé dans des structures infinitives, en particulier dans le sous-corpus d'extraits de lois.

- « sollen » est très souvent utilisé au subjonctif II, équivalent du conditionnel français, en particulier dans les conditions d'utilisations. En revanche, « müssen » apparait plutôt dans des formes conjuguées qui s'adressent au lecteur.

Ces remarques sont par ailleurs confirmées par l'observation des segments répétés :
werden sollen : 20
müssen Sie : 18
sollten Sie : 14

Nous pouvons donc conclure de cette brève analyse qu'en allemand, les verbes « müssen » et « sollen » sont deux façons d'exprimer l'idée de devoir aussi fréquente l'une que l'autre, mais ils ont des fonctions différentes. « Sollen » sert à exprimer une obligation moins forte, dans des tournures conditionnelles par exemple. C'est la tournure la plus fréquente dans les extraits de lois, mais « müssen » y est utilisé aussi. Nous concluons donc que l'emploi d'un verbe ou de l'autre ne dépend pas tant du registre, mais plutôt du degré d'obligation exprimée.

Analyse Anglais

Pour l'analyse du corpus anglais, on a choisi quatre mots-clés comme motifs afin d'analyser l'utilisation des verbes traduisant l'idée de "devoir" dans les différents contextes. Avec la ventillation dans le trameur, on peut comparer leurs fréquences dans les quatres catégories du corpus. On obtient les chiffres ci-dessous :

SHOULD
conditions d'utilisation et règlements intérieurs : 48
lois : 53
presse : 15
tutoriels : 57

NEED
conditions d'utilisation et règlements intérieurs : 11
lois : 23
presse : 6
tutoriels : 40

MUST
conditions d'utilisation et règlements intérieurs : 65
lois : 50
presse : 24
tutoriels : 21

Par rapport à "should" et à "must", le verbe "need" présente une fréquence plus basse mais avec une certaine de l'hétérogénéité dans chaque sorte de corpus. Quant à "must", qui a un sens plus exigeant, il a la fréquence la plus haute dans le corpus des lois et de la presse alors que "should" présente une fréquence assez haute dans le corpus de tutoriels, de conditions d'utilisations et de lois, mais une fréquence plus faible dans la presse. D'après les tendances d'utilisation de chaque mot, on peut conclure que les trois mots sont formels. Au niveau de leur ton et du degré d'exigence exprimé, la tendance impérative des trois mots varient de la plus forte à la plus faible selon cet ordre : « must », « should », « need ». On peut même vérifier cette conclusion en utilisant les concordances où chaque contexte du motif est présenté en détails :

Analyse Chinois

Quant au chinois, on n'a pas réussi à utiliser le trameur pour traiter le corpus pour des raisons mystérieuses. Mais selon le fichier de contextes global, on peut aussi faire une petite analyse. En chinois, il existe trois verbes différents pour exprimer le sens du "devoir"(必须,不得不,应当) Le ton impératif change du plus faible au plus fort. Pour le mot qui contient un ton impératif plus fort(必须), on le situe souvent dans la plupart des lois et une partie de tutoriels. Quant au mot qui a un sens équivalent au mot "have to"(不得不), il présente plutôt dans la presse et la condition. Par conséquent, on peut conclure que le mot (必须)qui apparaît dans les lois est le plus formel et impératif lors que les deux autres(不得不,应当)expriment aussi un sens de "devoir" mais moins exigeants. En plus des lois, les Chinois utilisent moins le mot (必须)qui exprime un sens très fort, on peut deviner que c'est peut-être en raison de l'aspect culturel. En chinois, on évite le plus souvent les tournures impératives.

Analyse Français

Comme mentionné dans la page Description du projet, nous n'avons pas réussi à ouvrir notre fichier de dump français au trameur pour l'analyse. En conséquence, notre analyse ne sera pas poussée. Nous trouvons un très grand nombre d'occurrences du verbe DEVOIR dans le sous-corpus de lois, mais cela est dû au fait que la quantité de texte dans ce sous-corpus est nettement plus importante, étant donné que nous avons relevé quelques URLS qui correspondaient à des traités ou des constitutions complètes. En observant le fichier de contexte global obtenu avec le mini-grep, on s'aperçoit que les occurrences au conditionnel sont plus rares. Pour donner un chiffre, nous recensons 95 occurrences de mots commençant par le motif "devr". Ce motif correspond de plus, à la fois aux formes au conditionnel, et au futur. La plupart des occurrences du verbe DEVOIR sont donc à l'impératif : 109 occurrences de "devez". L'autre forme la plus fréquente est la forme de la troisième personne du singulier, "doit" : 404 occurrences. Cette forme correspond souvent à des tournures impersonnelles, marquant une obligation plus modérée. Il est difficile pour nous de pousser plus loin notre analyse sans outils lexicométriques. Avec plus de temps et des outils plus précis et un corpus étiqueté, il aurait été intéressant de trouver d'autres façons moins évidentes pour exprimer l'idée de devoir par exemple.