Grants and Contributions:

Title:
Transformation d'une banque de documents en une représentation sémantique pour l'extraction d'opinions par le biais de questions en anglais et en français
Agreement Number:
RGPIN
Agreement Value:
$100,000.00
Agreement Date:
May 10, 2017 -
Organization:
Natural Sciences and Engineering Research Council of Canada
Location:
Quebec, CA
Reference Number:
GC-2017-Q1-03084
Agreement Type:
Grant
Report Type:
Grants and Contributions
Additional Information:

Grant or Award spanning more than one fiscal year. (2017-2018 to 2022-2023)

Recipient's Legal Name:
Gagnon, Michel (École Polytechnique de Montréal)
Program:
Discovery Grants Program - Individual
Program Purpose:

À l'heure actuelle, la consultation d'articles scientifiques se fait par le biais du Web, en utilisant un moteur de recherche ou une plateforme de diffusion numérique. Or, bien que ces moyens permettent d'obtenir des documents, ils ne sont pas adaptés à des besoins plus pointus, comme la réponse à des questions précises. Les questions qu'on est appelé à poser à un tel outil peuvent couvrir plusieurs aspects très complexes, à cause d'une part de la difficulté de les formaliser, d'autre part de la variabilité et de la subtilité de leur expression dans le langage. Aussi, dans bien des cas, il est nécessaire, pour y répondre, de faire des inférences à partir d'informations puisées dans plusieurs segments de textes.
Dans l'état actuel des recherches dans ce domaine, nous sommes très loin de l'atteinte d'un tel objectif. En effet, la plupart des approches proposées se limitent à des factoïdes ou des définitions. Je vais donc m'intéresser à un problème spécifique, soit l'identification d'opinions dans un corpus d'articles scientifiques dans le domaine des sciences humaines. Il s'agit donc ici de tenter de répondre à des questions du type suivant:
- Quels sont les chercheurs qui critiquent le néolibéralisme?
- Que sait-on sur l’impact des technologies dans l’apprentissage des élèves du secondaire?
Pour y parvenir, je propose d'utiliser les citations qu'on retrouve dans les articles. En analysant le texte qui forme le contexte d'une citation, on est en mesure de déterminer s'il s'agit d'une prise de position de l'auteur par rapport au travail cité, ou d'une relation entre les auteurs de l'article cité et certains concepts, phénomènes, théories, technologies, etc.
Il faudra d'abord identifier le type de contexte de citation auquel on a affaire, puis représenter la relation exprimée. Ceci permettra de construire la représentation formelle des opinions, constituant ainsi une base de connaissances qu'il faudra maintenant utiliser pour répondre aux questions. Il s'agit ici d'un autre objectif important de cette recherche, soit la mise en relation entre la question posée et les items de notre représentation formelle qui permettent d'y répondre. Ceci exigera d'une part une analyse sémantique de la question, et la transformation du résultat de cette analyse en une requête qui permet d'extraire de la base de connaissances tous les éléments d'information pertinents pour répondre à la question.
Les résultats espérés pour le programme de recherche proposé auront un impact très important sur la manière d'accéder à l'information: la banque de documents ne sera plus perçue comme un simple ensembles de textes à consulter, mais aussi comme un base de connaissances qui résulte d'une certaine interprétation du contenu de ces textes.