La recherche d'information (RI) dans des documents semi-structur?s (?crits en XML en pratique) combine des aspects de la RI traditionnelle et ceux de l'interrogation de bases de donn?es. La structure a une importance primordiale, mais le besoin d'information reste vague. L'unit? de recherche est variable (un paragraphe, une figure, un article complet...). Par ailleurs, la flexibilit? du langage XML autorise des manipulations du contenu qui provoquent parfois des ruptures arbitraires dans le flot naturel du texte. Les probl?mes pos?s par ces caract?ristiques sont nombreux, que ce soit au niveau du pr?-traitement des documents ou de leur interrogation. Face ? ces probl?mes, nous avons ?tudi? les solutions sp?cifiques que pouvait apporter le traitement automatique de la langue (TAL). Nous avons ainsi propos? un cadre th?orique et une approche pratique pour permettre l'utilisation des techniques d'analyse textuelle en faisant abstraction de la structure. Nous avons ?galement con?u une interface d'interrogation en langage naturel pour la RI dans les documents XML, et propos? des m?thodes tirant profit de la structure pour am?liorer la recherche des ?l?ments pertinents.
Author: Tannier-X |
Publisher: Omniscriptum |
Publication Date: Feb 28, 2018 |
Number of Pages: 272 pages |
Binding: Paperback or Softback |
ISBN-10: 6131526273 |
ISBN-13: 9786131526275 |