B2B, n°61 Le tailleur du futur - Le mLearning - News World Summit - François Bourboulon rédacteur en chef numérique des Échos

Ingénierie linguistique : faire le plein d’idées à Avignon


Avignon accueille jusqu’à vendredi l’EACL 2012, à savoir le plus important congrès mondial sur l’ingénierie linguistique ou linguistique computationnelle. Une discipline qui intéresse de plus en plus d’entreprises.


Marc El-Bèze, professeur d’informatique à l’Université d’Avignon et des Pays du Vaucluse. © D.R.

Dans le monde académique, l’ACL (Association for Computational Linguistics) fait incontestablement figure d’autorité en matière d’ingénierie linguistique. A savoir le mariage de l’informatique et de la linguistique appliquées au traitement automatique du langage naturel. Lequel est à l’origine du Speach to Text (reconnaissance de la parole) et du Text to Speach ainsi que de l’automatisation de la compréhension, du résumé et de la traduction de textes… Autant de disciplines qui, aujourd’hui, se retrouvent au cœur des moteurs de recherche, du SEO (Search Engine Optimisation), du marketing 3.0, des réseaux sociaux et du Web sémantique… « C’est la première fois que ce congrès international, qui a lieu tous les 3 ans depuis 39 ans, se déroule en France et a fortiori en Avignon pour accueillir 400 participants ! », se réjouit

Marc El-Bèze, professeur d’informatique à l’Université d’Avignon et des Pays du Vaucluse. « En 2004, nous avions déjà organisé le congrès RIAO (Recherche d’information assistée par ordinateur). »

Tenir compte des différences culturelles. Documents d’entreprise, courriels, murs de Facebook, échanges sur Twitter, requêtes sur Google ou Yahoo… toutes ces données peuvent être stockées, distribuées et même revendues à des fins d’analyse et d’interprétation automatiques ou semi-automatiques. « Si l’on veut affiner les requêtes, par exemple en posant une question en langage naturel, l’idée, c’est de compléter l’analyse statistique du langage jusqu’ici massivement utilisée avec des méthodes symboliques », reprend Marc El-Bèze. Sur ce terrain, les systèmes actuellement les plus performants recourent à des Pattern Recognition, à savoir des "patrons" ou des canevas qui correspondent à la forme d’expression de la réponse qui est attendue. En clair, plus on a de Pattern Recognition, mieux on trouve au lieu d’avoir des pages et des pages de réponses inutiles. « La difficulté, c’est de concevoir des canevas pour des questions et des langues qu’on ne connaît pas », estime le professeur.

Détection automatique d’opinion. Mais ce type de question sera débattu, parmi les 60 tutoriaux, aux côtés du thème de la détection d’opinion et de sentiments. « Préoccupées par leur image, les grandes entreprises (EDF, Orange, Xerox…) cherchent à savoir comment elles sont perçues par leurs clients, prospects ou usagers sur les réseaux sociaux, les forums et les blogs. Les opinions sont-elles positives, négatives, critiques ? », avance Marc El-Bèze dont le laboratoire travaille pour ces entreprises. « A présent, dans ce contexte de campagne électorale, ce sont les hommes qui nous sollicitent pour savoir quels éléments de langage ont plu ou déplu. » Parmi les thématiques, citons la réduction des peines au sujet de la consommation de cannabis. « Inutile de dire que le tir a été corrigé ! », souligne Marc El-Bèze. « Ici, l’enjeu vise surtout à convaincre les indécis, nouvelle cible essentielle aussi bien des politiques, des cinéastes que des grandes entreprises. » Une chose est sûre : la linguistique computationnelle fait réfléchir.

© Erick Haehnsen

About these ads

Discussion

Pas encore de commentaire.

Poster un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Connexion à %s

Les + partagés

%d bloggers like this: