The Perl Toolchain Summit needs more sponsors. If your company depends on Perl, please support this very important event.
# Copyright (C) 2004 Jörg Tiedemann  <joerg@stp.ling.uu.se>
{

#--------------------------------------------------------------------------
# $Author$
# $Id$
#
# french configuration file used by LangData.pm
#
#--------------------------------------------------------------------------

  'encoding' => 'iso-8859-1',
  'french' => {
    'stop words' => {
      'classes' => [
        'pronoun',
        'determiner',
        'prepositions',
        'conjunctions',
        'modal verbs',
        'negation',
        'adverb',
      ]
    },
    'character specifications' => {
     'upper case letter' => 'A-ZÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝ',
      'lower case letter' => 'a-zàáâãäåæçèéêëìíîïðñòóôõöøùúûüý',
      'hyphen' => '\- ',
      'punctuation' => '\.\!\?\¿\,\:\;',
      'digit' => '0-9',
      'closing parantheses' => '\)\]\}',
      'opening parantheses' => '\(\[\{',
      'numeric symbol' => '\.\,E\^\%\+\-\<\>\*\=\/\(\)\[\]\{\}\±\¹\²\³\÷\:\¼\½\¾ ',
      'numeric' => '0-9\.\,E\^\%\+\-\<\>\*\=\/\(\)\[\]\{\}\±\¹\²\³\÷\:\¼\½\¾ ',
      'parantheses' => '\)\]\}\(\[\{',
      'vowel' => 'AEIOUÀÁÂÃÄÅÆÈÉÊËÌÍÎÏÒÓÔÕÖØÙÚÛÜÝaeiouàáâãäåæèéêëìíîïòóôõöøùúûüý',
      'token delimiter' => '\.\!\?\¿\,\:\;\\\'\"\(\[\{\)\]\}\|\/',
      'special symbol' => '\#\$\%\&\@\^\`\~\¡\¢\£\¤\¥\¦\§\¨\©\ª\«\¬\®\°\´\µ\¶\¸\º\»\þ',
      'sentence delimiter' => '\.\!\?\¿',
      'consonant' => 'BCDFGHJKLMNPQRSTVWXYZÇÐÑbcdfghjklmnpqrstvwxyzçð',
      'letter' => 'A-ZÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝa-zàáâãäåæçèéêëìíîïðñòóôõöøùúûüý',
      'quotation' => "'".'"',
      'special alphanumeric symbol' => '\_'
    },
    'determiner' => {
      'numeral' => [
      ],
      'demonstrative' => [
        'ce','cet','cette','ces','ci','là','celui','celle','ceux',
	'celles','celui-ci','celui-la','celle-ci','celle-la','ceci',
	'cela','ça','ceux-ci','ceux-la','celles-ci','celles-la',
      ],
      'possessive' => [
      ],
      'ordinal' => [
      ],
      'simple' => [
        'de',
      ],
      'general ordinals' => [
      ],
      'quantity' => [
	'une','un','autre','autres','le','la','les',
	'la même','le même','les mêmes',
	'tout','toute','tous','toutes',
	'plusieurs','aucun','aucune',
	'chaque','chacun','chacune',
	'quelque','quelques',"quelqu'un",'quelques-uns',
	'quelques-unes','quelque chose','on','personne',
	'rien','ne ... personne','personne ne',
      ],
    },
    'adverb' => {
      'word' => [
        'ainsi','comme','combien','comme cela',
      ],
    },
    'negation' => {
      'word' => [
	'ne ... pas','ne',
      ],
    },
    'modal verbs' => {
      'verbform' => [
	'avoir','ai','as','a','avons','avez','ont',
	'avais','avait','avions','aviez','avaient',
	'eus','eut','eûmes','eûtes','eurent',
	'aie','aies','ait','ayons','ayez','aient',
	'eusse','eusses','eût','eussions','eussiez','eussent',
	'être','suis','es','est','sommes','êtes',
	'sont','étais','était','étions','étiez','étaient',
	'fus','fut','fûmes','fûtes','furent','sois','soit',
	'soyons','soyez','soient',
	'fusse','fusses','fût','fussions','fussiez','fussent',
      ],
    },
    'conjunctions' => {
      'subordinating' => [
        'de','des','du','à','au','aux','quand','lorsque',
	'comme','puisque','parce que','après que','du moment que',
	'bien que','quoique','quoi que','pour que','afin que',
	'combien','si','avant de','pendant que','durant que',
	'tant que','alors que','en raison de','en vertu de',
	'à cause de','depuis que','plus que','moins que','que',
      ],
      'coordinating' => [
        'avant que','avant que ... ne','jusque à ce que',
	'pour que','sans que','bien que','et','ou',
      ],
    },
    'prepositions' => {
      'marginal' => [
      ],
      'simple' => [
        'à','en','dans','de','chez','parmi','entre',"d'entre",
	"d'après",'selon','suivant','sûr','sur','devant','par',
	'pour','comme','avant','avec','contre','envers','vers',
	"jusqu'a",'sous','sur',

      ],
      'complex' => [
	'à la veille de','autour de','au-devant de','à travers',
	'de chez','en avant de','à côté de','auprès de','près de',
	'au-dessous de','hors de','en dehors de','au delà',
      ],
    },
    'pronoun' => {
      'demonstrative' => [
      ],
      'possessive' => [
	'mon','ma','mes','ton','ta','tes','son','sa','ses',
	'notre','nos','votre','vos','leur','leurs','le mien',
	'la mienne','les miens','les miennes',
	'le tien','la tienne','les tiens','les tiennes',
	'le sien','la sienne','les siens','les siennes',
	'le nôtre','la nôtre','les nôtres',
	'le vôtre','la vôtre','les vôtres',
	'le leur','la leur','les leurs',
      ],
      'indefinite' => [
      ],
      'simple' => [
      ],
      'interrogative' => [
        'qui','que','quoi','dont',
	'lequel','laquelle','lesquels','laquelles',
	'duquel','de laquelle','desquels','desquelles',
	'auquel','à laquelle','auxquels','auxquelles',
	'où','quel','quelle','quels','quelles',
	'qui est-ce qui','qui est-ce que','pour quoi','pourquoi',
      ],
      'relative' => [
      ],
      'reciprocal' => [
      ],
      'reflexive' => [
      ],
    },
    'stemmer' => {
      'name' => 'simple french'
    },
    'phrases' => {
      'skip token' => [
        ',','.',';',':','-','/','(','[','{',')',']','}',"\\",
	'!','?','+','*','#','"',"'",'...','--'
      ],
      'skip phrase after' => [
      ],

#--------------------------------------------------------------------
# skip phrases at the following words:

      'skip phrase at' => [

# determiner:
        'ce','cet','cette','ces','ci','là','celui','celle','ceux',
	'celles','celui-ci','celui-la','celle-ci','celle-la','ceci',
	'cela','ça','ceux-ci','ceux-la','celles-ci','celles-la',
# simple determiner:
        'de',
# quantative determiners:
	'une','un','autre','autres','le','la','les',
	'la même','le même','les mêmes',
	'tout','toute','tous','toutes',
	'plusieurs','aucun','aucune',
	'chaque','chacun','chacune',
	'quelque','quelques',"quelqu'un",'quelques-uns',
	'quelques-unes','quelque chose','on','personne',
	'rien','ne ... personne','personne ne',
# adverbs:
        'ainsi','comme','combien','comme cela',
# negation:
	'ne ... pas','ne',
# modal verbs:
#	'avoir','ai','as','a','avons','avez','ont',
#	'avais','avait','avions','aviez','avaient',
#	'eus','eut','eûmes','eûtes','eurent',
#	'aie','aies','ait','ayons','ayez','aient',
#	'eusse','eusses','eût','eussions','eussiez','eussent',
#	'être','suis','es','est','sommes','êtes',
#	'sont','étais','était','étions','étiez','étaient',
#	'fus','fut','fûmes','fûtes','furent','sois','soit',
#	'soyons','soyez','soient',
#	'fusse','fusses','fût','fussions','fussiez','fussent',
# subordinating conjunctions:
        'de','des','du','à','au','aux','quand','lorsque',
	'comme','puisque','parce que','après que','du moment que',
	'bien que','quoique','quoi que','pour que','afin que',
	'combien','si','avant de','pendant que','durant que',
	'tant que','alors que','en raison de','en vertu de',
	'à cause de','depuis que','plus que','moins que','que',
# coordinating conjunctions:
        'avant que','avant que ... ne','jusque à ce que',
	'pour que','sans que','bien que','et','ou',
# simple prepositions:
        'à','en','dans','de','chez','parmi','entre',"d'entre",
	"d'après",'selon','suivant','sûr','sur','devant','par',
	'pour','comme','avant','avec','contre','envers','vers',
	"jusqu'a",'sous','sur',
# complex prepositions:
	'à la veille de','autour de','au-devant de','à travers',
	'de chez','en avant de','à côté de','auprès de','près de',
	'au-dessous de','hors de','en dehors de','au delà',
# possessive pronouns:
	'mon','ma','mes','ton','ta','tes','son','sa','ses',
	'notre','nos','votre','vos','leur','leurs','le mien',
	'la mienne','les miens','les miennes',
	'le tien','la tienne','les tiens','les tiennes',
	'le sien','la sienne','les siens','les siennes',
	'le nôtre','la nôtre','les nôtres',
	'le vôtre','la vôtre','les vôtres',
	'le leur','la leur','les leurs',
# interrogative pronouns:
        'qui','que','quoi','dont',
	'lequel','laquelle','lesquels','laquelles',
	'duquel','de laquelle','desquels','desquelles',
	'auquel','à laquelle','auxquels','auxquelles',
	'où','quel','quelle','quels','quelles',
	'qui est-ce qui','qui est-ce que','pour quoi','pourquoi',
      ],
      'skip phrase at string type' => [
        'numeric',
	'punctuation',
	'parantheses',
	'special symbol',
      ],
      'non-phrase-ender' => [
      ],
      'skip phrase before' => [
      ],
      'non-phrase-starter' => [
      ]
    },
  },
}