Non, le libanais n’est pas un « dialecte arabe»

Published in

East Med Project: History, Philology, and Genetics

16 min readFeb 7, 2018

Traduction par Emilio El-Dib, auteur du Liban expliqué à mes proches.

Les Libanais disent « bét » depuis au moins 3200 ans. Encore aujourd’hui, ils continuent de dire « bét » pour désigner une maison, mais tout d’un coup, ce mot est supposé provenir d’un « dialecte » arabe. Il est insensé de penser qu’une population peut parler une langue, par exemple un cananéen araméisé avec des variantes locales, puis soudainement, tabula rasa, passer à une nouvelle langue avec les mêmes mots.

Il serait anachronique d’affirmer que l’italien est un dialecte catalan. En revanche, on peut dire que l’italien provient du latin (vulgaire). Mais quand il s’agit du libanais — et plus généralement du levantin du nord-ouest — le sujet est traité différemment. Afin de ménager certaines susceptibilités, des think-tanks arabisants et « politiquement corrects » (constitués d’Occidentaux simples d’esprit, formés à quelque chose qu’on appelle « études moyen-orientales ») soutiennent que le libanais est un dérivé de l’arabe. Pour eux, ce serait un « dialecte » arabe. Même des linguistes trouvent des arguments circulaires pour inverser la flèche du temps et servir ainsi les intérêts du panarabisme. Dans les situations où il existe des similitudes entre des mots libanais et arabes, ils insistent sur le fait que ces mots proviennent de l’arabe et non d’une racine commune aux deux langues. (La plupart des Libanais sont eux-même désorientés par leur propre diglossie car une langue parlée n’est pas censée être écrite.) Contrairement aux langues indo-européennes, les langues sémitiques présentent un croisement de racines et une diffusion aréale considérables. Affirmer qu’une langue sémitique est issue d’une autre est donc très délicat. Et des propos tels que « A est un dialecte de B » n’ont pas le même degré de certitude et de netteté que dans d’autres familles de langues. Cela requiert, comme nous le montrerons, des facteurs orthogonaux. Même le mot « arabe » est mal défini (historiquement, il se référait possiblement à une population occidentale non-péninsulaire) et la signification « d’arabe » est largement circulaire. Pour compliquer encore plus les choses, ce que les linguistes appellent « arabe » n’est pas l’arabe classique mais une construction hypothétique nommée « proto-arabe. » S’agissant de « l’arabe, » les linguistes et les politiciens ne parlent donc pas de la même chose.

Ecrivez en libanais / levantin / cananéen moderne !

Indépendamment de son origine, il est inutile de s’obstiner à dégrader la langue parlée. L’arabe reste étranger à un Libanais (surtout aux personnes n’ayant pas étudié dans cette langue), ce qui explique pourquoi les Libanais s’écrivent en français ou en anglais, mais pas en libanais. (Exemple de données : j’ai vendu 97% de mes livres en français et en anglais au Liban, 3% seulement en arabe. Je n’ai aucun ami Libanais de ma génération ou plus jeune qui lit en arabe, sauf des documents juridiques. Je n’ai presque jamais reçu de lettre ou d’email en arabe de la part d’un autre Libanais.) [Écrivez donc en libanais et] utilisez les caractères de votre choix : le latin (qui est d’origine phénicienne) est plus simple car vous n’aurez pas besoin d’un clavier spécial, mais n’importe quel alphabet convient politiquement (y compris l’alphabet arabe) car ils sont tous d’origine phénicienne !

Les points à retenir ici sont les suivants.

1) Le libanais (et plus généralement le levantin du nord-ouest, néo-cananéen) doit être considéré comme un dialecte (ou une langue) sémitique distinct(e) qui provient d’autres langues, y compris l’arabe (qui lui-même a été influencé par ces mêmes prédécesseurs). Mais le libanais n’a pas hérité de l’arabe autant qu’on veut nous faire croire (le libanais a, par exemple, repris les pluriels irréguliers de l’arabe mais pas ses riches formes verbales). Et il ne faut pas ignorer le développement intrinsèque de la langue libanaise, et son évolution qui s’est faite indépendamment d’autres langues sémitiques.

La discussion sur Youtube expliquant pourquoi la classification nécessite des catégories indépendantes.

Les méthodes utilisées par les sémiticologues ne sont pas scientifiques. De plus, la diffusion spatiale rend les flèches de transmission très floues. La seule bonne façon de procéder est par “PCA”, qui explique pourquoi en tant que statisticien , je suis offensé de voir ces conneries appelés “bourse”.

2) La grammaire libanaise, comme nous le verrons plus loin, continue d’être largement non-arabe. Beaucoup des mots qu’on retrouve en libanais et en arabe, et qui ne sont pas communs à l’araméen, existent dans le phénicien du nord (ougaritique).

3) Le vocabulaire libanais est largement antérieur à l’arabe (même dans des cas où nous avons dans le libanais ce qui ressemble à des innovations arabes). J’ai considéré une liste statistique des mots les plus fréquemment utilisés (selon la loi de Zipf, > 80% du vocabulaire) et cherché si ces mots existent à la fois en libanais et en akkadien ou en ougaritique (phénicien du nord). Il s’avère que très peu de ces mots existent en arabe sans avoir de racines équivalentes dans d’autres langues sémitiques, indiquant qu’ils ne peuvent provenir que de l’arabe. (Lamine Souag a fait de même en se basant sur un poème de Saïd Akl, sans méthodologie statistique.)

● ● ●

The White Mountain (Mount Lebanon) from my window in Amioun

Languages renormalize, get divorced from population flows

4) La mission « d’arabisation » promue par l’Université Américaine de Beyrouth dans les années 1860 (à commencer par la (re)traduction de la Bible) semble avoir gagné les Occidentaux les plus simples d’esprit parmi les arabisants des think-tanks et du département d’État américain (des malheureux qu’on peut croiser à des conférences), mais pas les locaux. La plupart des personnes qui ne sont pas d’accord avec mon argument et qui soutiennent l’orthodoxie ne parlent pas libanais ou araméen, ou bien se trompent dans le raisonnement de base concernant ce problème. (En revanche, beaucoup de connaisseurs du syriaque avec qui j’ai échangé sont plutôt d’accord avec mon argument.)

Notons que les arabisants anglo-saxons, simples d’esprit (des prédicateurs protestants à l’origine) ont poussé pour inclure le Liban dans le « Moyen-Orient, » alors que les Catholiques (italiens / provençaux / français) et les Ottomans l’ont positionné culturellement comme faisant partie de la Méditerranée.

5) L’alphabet latin (en fait phénicien) se prête mieux au libanais que l’alphabet arabe, grâce à des glyphes tels que « é » et « o. » Mais ceci est une autre note.

6a) Contrairement à la génétique qui a des formulations mathématiques rigoureuses et des flux clairs (les haplogroupes montrent une transmission directe, verticale plutôt que latérale), les catégories linguistiques sont floues et, pour les langues sémitiques, manquent cruellement de rigueur.

6b) D’un point de vue scientifique, les affirmations linguistiques selon lesquelles le libanais est un dialecte arabe (ou le dialecte d’une construction opportunément abstraite appelée proto-arabe) sont a) des propos superficiels sans la moindre rigueur, et qu’on fini par croire à force de répétition, b) un acharnement pour se plier à quelques règles arbitraires inventées au fur et à mesure (vous choisissez les règles qui font qu’une langue fasse partie du groupe que vous préférez), c) le tout accompagné d’allégations occasionnelles d’intelligibilité mutuelle entre le libanais et l’arabe (ou le proto-arabe) ; tout cela présenté sans aucune tentative de respect des normes minimales de preuve scientifique. (Qu’est ce qui me permet d’écrire ceci ? Comme nous le verrons plus loin, les linguistes jouent aux généticiens en affirmant que « A vient de B et non de C » en oubliant de préciser que c’est beaucoup, beaucoup plus flou puisque « B vient également en partie de C. » En tant que statisticien, je suis révolté par les mélanges d’affirmations causales en présence de variables dépendantes.)

6c) Les modèles linguistiques souffrent d’un problème de réalisme (beaucoup de théorie, peu de pratique), à cause des faiblesses de leurs normes scientifiques et schémas empiriques. Ce qui explique pourquoi le regretté Frederik Jelinek, auteur de l’oeuvre magistrale Statistical Methods for Speech Recognition, était si critique envers la valeur informative contenue dans les règles heuristiques des linguistes. Sa critique est bien connue de par sa formule : « À chaque fois que je vire un linguiste, l’outil de reconnaissance vocale gagne en performance. » En réalité, la distance linguistique se doit d’être considérée comme un problème de distance statistique / informationnelle, traité au mieux par des méthodes d’apprentissage profond en l’absence de facteurs orthogonaux.

7) Les arabisants simples d’esprit et les « experts » en études moyen-orientales nomment la langue libanaise « arabe libanais, » mais leurs pairs qui travaillent sur les langues slaves n’emploient pas les termes « bulgare proto-russe » ou « russe serbe. »

● ● ●

Qu’appelle-t-on « arabe » ?

Dans un sketch diffusé sur la télévision libanaise, un combattant de l’État Islamique se rend dans une commune chrétienne du Liban, Zghorta, et crie en arabe classique (« Les mains en l’air ! » “ارفع يديك”) à un villageois zghortiote, qui lui répond « Parle-moi en arabe ! » (7ki ma3é 3arabé). Pareillement, en Arabie Saoudite, j’ai entendu un jour un Libanais demander au directeur de l’hôtel : « Est-ce que vous servez de la cuisine arabe ? » (signifiant la cuisine de la Méditerranée orientale / libanaise) car le restaurant ne proposait que… de la cuisine arabe (des préparations saoudiennes à base de riz etc.)

L’étymologie même du mot « arabe » déboussole les gens, puisqu’elle peut signifier « occidental, » c’est-à-dire non-arabe (et un homonyme de 3araba qui pourrait provenir d’une autre racine). « Parlez avec moi en arabe » peut vouloir dire « parlez-moi intelligiblement » (3arabé mshabra7) — puisque 3arab signifie grammatical et intelligible — et les gens se sont embrouillés quant à la langue qu’ils parlaient.

Anachronisme

Beaucoup de gens qui parlent couramment le levantin et l’arabe classique ne réalisent pas que la distance entre les deux est plus grande qu’entre beaucoup de langues jugées distinctes, comme le français et le roumain… Les « langues » slaves comme l’ukrainien et le polonais sont beaucoup plus proches les unes des autres que le levantin et l’arabe. De même pour les langues scandinaves et germaniques. Notons également que si des habitants d’Arabie partagent du vocabulaire avec les Libanais, c’est grâce à des flux linguistiques dans les deux sens.

(Si les Libanais connaissent l’arabe, c’est grâce à leur éducation et à la télévision, pas parce qu’ils le parlent.)

Colinéarité et autres lacunes des linguistes

La colinéarité ne permet pas une catégorisation précise : La linguistique traditionnelle catégorise les langues comme des variables indépendantes, sans prendre en compte la colinéarité, c’est-à-dire si Y = a_1 X_1 + a_2 X_2 + \eta (bruit), l’effet montrera un chargement dans a_1 ou a_2, pas les deux. Donc, si le levantin ressemble à l’arabe, et l’arabe ressemble à l’araméen, et l’araméen ressemble au cananéen / phénicien / hébreu, et pour compliquer encore plus les choses, l’arabe ressemble aussi au cananéen, la tendance est de croire que le levantin vient d’une langue (correspondant à l’a_1 avec la charge la plus élevée) et pas de l’autre.

En conséquence, la linguistique simplifiée échoue avec les langues sémitiques à cause de la présence de variables dépendantes, beaucoup plus conséquentes dans les langues sémitiques qu’indo-européennes. En anglais, nous savons que ce qui vient du latin n’a pas de colinéarité avec les sources nord-européennes, sauf pour des racines éloignées.

Donc, si quelqu’un prétend que « le libanais est un dialecte (arabe / araméen / zorgluz…) » ceci est une déclaration plus faible que « l’italien est un dialecte latin. » Nous devons plutôt dire : « le libanais est un dialecte sémitique. »

Le seul remède est de faire, comme en génétique, une analyse en composantes principales ou ACP (des variables orthogonales abstraites) et représenter ainsi les langues sémitiques comme des points sur une carte en 2–3D ayant des bases orthogonales. Ce n’est pas fait par les experts des langues sémitiques et je considère que les critiques linguistiques à l’égard de ce texte sont invalides et hautement non-scientifiques (pas même au niveau d’être fausses).

Influence aréale : S’il existe un continuum de dialectes à travers la région, du Levant au croissant fertile, cela peut être dû à des caractéristiques aréales plutôt que génétiques. En d’autres termes, des influences latérales plutôt que verticales.

Le modèle de Phyla et Waves utilisé par les sémitologues n’est pas très convaincant : nous ne traitons pas un sujet aussi clair que la génétique ; la « preuve » n’est pas élaborée stochastiquement.

Examinons à présent les « marqueurs de l’arabe, » qui s’appliquent dans de nombreux cas mais ne peuvent justifier une catégorisation.

Les soi-disant « marqueurs » et « traits » de l’arabe

Nous allons maintenant considérer sans trop de détails (ce sera l’objet d’une note plus technique) les faiblesses des marquages utilisés à la volée comme motifs de démarcation linguistique. De plus, les méthodes des marqueurs / traits utilisées par les sémitologues souffrent d’une lacune élémentaire de déduction : elles consistent à trouver des traits / marqueurs en

arabe => confirmant leur présence en libanais,

au lieu de l’approche plus rigoureuse de trouver, en plus, des traits / marqueurs en

libanais => confirmant leur présence en arabe.

En d’autres termes, ces méthodes ignorent des développements linguistiques exclusivement locaux.

Cinq voyelles : Le levantin du nord utilise en plus le son français « é » (le rboso diacritique, présent en syriaque) là où l’arabe emploie un « i » (kasra) ou un « i » long (batyté, Ghassén, etc.) (Zré2 est arabisé comme Zurayq à l’université américaine de Beyrouth. Quelqu’un devrait le leur dire.) Le levantin du nord utilise aussi le « o » comme voyelle distincte de « ou. »

La comme particule d’objet : choufto la Antoine ? (Bassal, 2012)

La2 : l’adjonction du coup de glotte au la (négation). La2 n’est pas présent en arabe, il est soit proto-sémitique, soit une innovation locale.

Une autre lacune : la confusion entre le changement de racine et la distance linguistique. La présence d’une innovation d’origine arabe appliquée à une racine non-arabe (2rdh pour 2rtz) ne devrait pas permettre de classer le terme à des fins scientifiques (informatives) et culturelles comme « dérivé de » l’arabe, même si cela a du sens d’un point de vue linguistique, dans une boîte à outils raffinée. Donc, si [une population] a utilisé lb (pour cœur) pendant quelques milliers d’années, puis a ajouté un aleph pour en faire ‘lb (2lb), est-ce à considérer de la même manière qu’un corre ou schmorglub, qui deviennent ‘lb ? Ce n’est pas la même distance ! C’est ce que les linguistes ne saisissent pas à propos de leurs règles heuristiques de classification. Des adaptations mineures telles que « al » pour « ha » ou « han » ne devraient pas être une base suffisante pour proclamer un changement de langue. Ce n’est pas différent du cas de l’hébreu où les ashkénazes emploient une prononciation germanique pour les sons gutturaux, ce qui ne fait pas de leur langue une variété de l’allemand. Les classifications linguistiques sont un fatras !

A « 2 » fort (basta aleph) : le libanais comprend un « a » emphatique, connu sous le nom d’accent « basta » (« chou b22ello ? »), présent également dans d’autres parties des mots « ya 22alla » à Amioun (que j’ai parfois entendu en syriaque quand ils disent « 22aloho. ») A ce sujet, l’idée de Roger Makhlouf est que les sons arabes forts “ص”, “ض”, “ط” etc. sont simplement des consonnes suivies par le 22 emphatique : « t22aleb, » « d22arab, » « chou s22ar ? » Donc, en présence du 22 qui n’existe pas en arabe, le libanais n’a pas besoin de ces consonnes spéciales. Roger présume que si nous n’avons pas ces consonnes, et puisque l’alphabet phénicien ne les avait pas, la conclusion naturelle est de considérer que nous ne les avons jamais utilisées (par pont brownien : si quelque chose n’a existé ni au passé, ni aujourd’hui, cela réduit la probabilité qu’il ait existé au milieu.) Ceci pourrait expliquer l’absence possible du [glissement] araméen de 3ayn en libanais (voir plus loin).

[Verbe-sujet-objet] : L’arabe a nécessairement une structure en VSO verbe-sujet-objet (zahaba el waladou ila il bayt vs. lzghir ra7 3al bét), contrairement au libanais (structure variable).

Accord simple verbe-sujet : La structure grammaticale du libanais est quelque peu similaire à l’araméen. Par exemple, le libanais utilise la forme plurielle d’un verbe devant un sujet pluriel ; en arabe, le verbe reste au singulier.

Ané de la nisba : la forme berrané, jewwéné est restreinte en arabe (Blau, 1967, cité par Bassal, 2012)

Diminutif avec on : dal3oun, mal3oun, etc. (Bassal, 2012)

Formes des verbes : L’arabe a 15 formes verbales (bon d’accord, dont 5 formes rares) ; le levantin et l’araméen ont les mêmes 4 à 6 formes (selon les régions). Remarquons que le présent « yaktoubou » (يَكْتُبُ) devient 3am yiktob, 3am voulant dire « en train de » en araméen.

Notons également que les verbes libanais marquent le temps, pas l’aspect. [ndt : propos placé après ‘formes des verbes’, ok?]

L’article défini : le « al » en arabe n’existe pas en tant que préfixe en araméen (il est suffixé), mais il existe bien en phénicien comme ha et 2a, et en proto-cananéen en tant que hal et l. Et il n’est pas clair que le vieux libanais distingue les lettres lunaires des lettres solaires, comme le fait l’arabe. Pont brownien : il est possible que le libanais ait gardé une partie de l’article défini préfixé, pendant la période d’influence de l’araméen.

La préposition fi : (du mot bouche, « f »), un marqueur de l’arabe absent du libanais. Ana bi-Amioun est la forme levantine de « je suis à Amioun. » En araméen-syriaque (la plupart des versions) ce serait « ana bi-Amioun. » En arabe, « innani fi-Amioun. » (Parfois, mais rarement, « bi. »)

Mim-noun : le mim du pluriel en arabe (baytohom) devient noun en araméen et en levantin du nord (beyton, beytkon). Même Ibrahim devient Brohin.

Ma de la négation : Les classificateurs prétendent que, parmi les langues sémitiques, un marqueur de l’arabe est le « ma » de la négation, comparable aux « la / o » du cananéen. 1) « Ma » est une négation dans les langues indo-européennes, il est donc venu affecter toutes les langues de la région, 2) « ma » se trouve dans la bible hébraïque (Rois, 12:16). Ma est peu fréquent en arabe classique.

Les mots qui contiennent un hamze, qui se transforme en « y, » i.e. mayy en levantin correspond à l’eau (comme en araméen), ma2 en arabe, etc. Et le « y » en arabe peut devenir olaf : yadouhou en arabe correspond à ido (yad-> iyd) en syriaque comme en levantin.

Qad : la grammaticalisation de la particule qad comme morphème perfectif, comme dans qad fa3ala (il a fait), un marqueur de l’arabe, n’existe pas en libanais.

Nounation : un marqueur de l’arabe (tanwin) est absent du libanais. Cela peut être dû à une modernisation, mais reste significatif du point de vue de la distance informationnelle.

Perte de l’utilisation anaphorique ou la forme lointaine du pronom démonstratif de la troisième personne : Les pronoms de la troisième personne sont proprement démonstratifs en sémitique occidental, comme par exemple en hébreu (Al Jallad, 2017) mais pas en arabe. Cela semble être le cas en libanais. Ha-seper ha-hu (hébreu) est ktéb houwé aussi bien que ktéb hayda.

An : Un autre marqueur (Al Jallad, 2017), l’arabe se distingue par l’utilisation de la particule an(na) comme complétif et comme conjonction de subordination, e.g. arada an yazhaba (baddo yrou7). Ce marqueur semble absent du libanais.

Glissement cananéen et phénicien : Au nord du Liban, « allah » devient « alloh, » « Taleb » est prononcé « Toleb, » même le y devient « oy » (léch à Beyrouth, loych à Bcharré. Mon prénom est prononcé « Nsoym. ») Il y a une plaisanterie selon laquelle une personne d’Amioun, partie acheter un iPad à Beyrouth, est rentrée avec un iPod. Mais quand en araméen oriental Sarah correspond à « Saro, » pour nous c’est « Sora. »

L’utilisation du gérondif comme verbe en libanais.

Collection de transformations akh (arabe) vs. khayy (libanais), etc.

Le glissement de 3ayn : Nous avons déjà considéré le cas du basta hamzé emphatique, 22a, plus haut. Mais un argument (Louag) veut que le dhad soit devenu un 3ayn (eretz en hébreu est devenu ar3a en araméen) ; et comme ça ne s’est pas produit en libanais, cela impliquerait que nous l’ayons obtenu des Arabes. Il y aurait donc eu un glissement qui est resté en araméen, mais le levantin utilise le dhad arabe qui n’a pas subi le même glissement (ce qui est censé impliquer que nous n’avons pas obtenu ces mots de l’araméen). Mais notons que, d’après al-Kitab de Sabawayh, les Arabes ne prononçaient pas le dhad comme tzadeh modifié (ce qui montre que les prononciations anciennes n’étaient pas nécessairement comme aujourd’hui, et que la question de lughat al dhad n’est pas encore réglée). Notons également que dans le nord du Liban, les gens peuvent confondre ar3a avec al3a, pour ardh, comme dans Amioun. Cela viendrait peut-être de l’arabe, mais ce n’est pas du tout certain.

(Notons que les pluriels irréguliers, environ la moitié des verbes arabes, représentent une part très réduite d’un vocabulaire, encore une fois, selon la loi de Zipf.)

Une autre lacune grave de la linguistique sémitique

La linguistique sémitique tend à assimiler les flux de langue aux déplacements de population, ce qui, comme je l’ai montré dans Taleb (2018), est faux puisque la langue se re-normalise mais pas les gènes. En d’autres termes, la Turquie parle turque, l’Inde et les États-Unis parlent Anglais, mais les flux de gènes montrent des dynamiques différentes.

Grammaire

Arabe vs. levantin (Beyrouth, Amioun)

1s Ana Ana, ana
2ms Anta inta, int
2fs Anti inte, int
3ms Huwa huwwe, hu
3fs Hiya hiyye, hi
2d Antuma into, ont
3md Huma hinne, hinn
3fd huma hinne, hinn
1p Na7nu ne7na, ne7no
2mp Antum into
2fp Antunna into
3mp Hum hinne, hinn
3fp Hunna hinne, hinn

Arabe vs. levantin

(a long, 2) eh long
1s 2akl 3am bekol [3am signifie « en train de » en syriaque]
2ms ta2kol 3am btekol
2fs ta2kulina 3am tekle
3ms yakulu 3am yekol
3fs takul 3am tekol
2d ta2kulani 3am bteklo
3md yakulani 3am byeklo
3fd na2kul 3amnekol
1p takuluna 3amteklo
2mp takuluna 3amteklo
2fp takulna 3am teklo
3mp yakuluna 3ambyeklo
3fp yakulna 3ambyeklo

Arabe vs. Amioun vs. Beyrouth

Akaltu Kilt Akalt
Akalta Kilt Akalt
Akalti Kilte Akalte
Akala Akol Akal
Akalat Aklet Akalet
Akaltuma kelto Akalto
Akalat eklo Akalo
Akalata Aklo Akalo
Akalna kelna Akalna
Akaltum Kelto Akalto
Akaltunna Kelto Akalto
Akaltu eklo Akalto
Akalna eklo Akalo

Note : Pour semer encore plus la confusion, les linguistes semblent soutenir que le libanais ne provient pas de l’arabe classique sémitique du sud, mais d’une construction hypothétique et abstraite anachroniquement appelée proto-arabe sémitique central, elle-même très différente de l’arabe classique. Mais appeler cette construction « arabe » est déconcertant. Les noms créent des cadres de pensée. Donc s’ils ne veulent pas dire « arabe » …