1.1 Etablissement de critères pour le choix du corpus
Les critères relatifs aux conditions nécessaires pour maîtriser ce travail sont donc les suivants :
- Taille du corpus Pour une expérimentation de recherche d’information nous avons trouvé quinze articles (voir Annexe A), constituant le nombre minimal susceptible d’être traité dans la limite du temps disponible.
- Taille des articles Les articles choisis ont de trois à cinq pages, dans les fichiers format Word 6.0a, police Times New Roman, style normal, taille 11. Cependant nous avons rencontré des difficultés à les trouver dans cette taille, ce qui a amené à supprimer quelques paragraphes tout en ayant le soin de ne pas perdre les syntagmes nominaux importants.
- Le domaine de connaissance du corpus Un système de recherche d'information utilisant des syntagmes nominaux sera plus performant s'il travaille sur un domaine bien défini. Cette restriction est nécessaire car il faut travailler sur un corpus homogène par rapport à l'ensemble des syntagmes nominaux, avec un minimum d'ambiguïtés, de façon à ce qu'on puisse les organiser sous forme d'arborescence. Selon MINSKY : « Dans le langage naturel, les ambiguïtés ne découlent pas seulement du fait que les mots peuvent être regroupés de diverses façons, mais encore de ce que chaque mot peut avoir plusieurs sens différents... »Marvin MINSKY. Semantic Information Processing. Cambridge, Mass. : M.I.T. Press, 1969, p. 18, cité par Hubert L. DREYFUS. Intelligence Artificielle : mythes et limites. Flamarion, 1984, p. 95. Ainsi, la définition du domaine du corpus d'une base de données est d’une importance capitale pour que les résultats de recherche soient plus précis. Pour les bases de données multidisciplinaires la bonne solution serait plutôt de les partager en plusieurs bases de données regroupées par domaines de connaissances. Nous avons donc ainsi choisi pour ce travail le domaine des Sciences de l'Information (en considérant ici la pluridisciplinarité de ce domaine).
- Langue du corpus Nous avons choisi la langue portugaise pour deux raisons :
-
- afin d’acquérir des connaissances sur l’extraction des syntagmes nominaux dans cette langue et envisageant d’ores et déjà, dans le cadre d’une thèse de doctorat, la possibilité de développement d’un analyseur morpho-syntaxique pour cette langue ;
- du fait que notre but initial était de travailler sur le développement de systèmes de recherche d’information sur des bases de données en langue portugaise. Ajoutons à ces raisons celle d’un engagement personnel avec l’institution qui nous a accordé notre bourse d’études.
- Cependant, les résultats de ce travail, en ce qui concerne l’interface elle-même, pourront servir à des corpus dans d’autres langues, la maquette étant indépendante du traitement de l’information.
- Niveaux des syntagmes nominaux Les syntagmes nominaux possèdent des relations d’emboîtement les uns par rapport aux autres. L’ordre de la relation d’emboîtement, appelé niveau, détermine la hauteur de l’arbre des syntagmes nominaux qui à son tour, restreint les possibilités de raffinement de la recherche d’information. Afin de construire l’arborescence permettant le raffinement d’une recherche d’information, nous avons choisi des articles ayant au moins des syntagmes nominaux de niveau quatre.
Une fois ces critères établis, nous avons choisi des articles publiés dans la revue brésilienne « Ciência da Informação », spécialisée en Sciences de l’Information. Cette revue est publiée et distribuée par l’Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT). Les articles sélectionnés sont dans l’annexe A, dont les titres sont les suivants :
- Conhecimento como recurso estratégico empresarialAnna Soledade VIEIRA. « Conhecimento como recurso estratégico empresarial ». Ciência da Informação. 1993, vol. 22, nº 2. p. 99-101. (La connaissance comme ressource stratégique des entreprises) - mots clés : ressources informationnelles ; intelligence compétitive ;
- Inteligência competititva e decisão empresarialPatrick MAURY. « Inteligência competitiva e decisão empresarial ». Ciência da Informação. 1993, vol. 22, nº 2. p. 138-141. (L’intelligence compétitive et la prise de décision des entreprises) - mots clés : information ; intelligence compétitive ; gestion ; stratégies de décision ;
- Economia da informação (L’économie de l'information)Pedro Onofre FERNANDES. « Economia da Informação ». Ciência da Informação. 1991, vol. 20, nº 2. p. 165-168. - mots clés : économie de l'information ; information / caractéristiques ; analyse du coût-bénéfice / coût / efficacité / performance / valeur ;
- A Informação como insumo estratégicoDorodame Moura LEITÃO. « A informação como insumo estratégico ». Ciência da Informação. 1993, vol. 22, nº 2. p. 118-123. (L'information comme matière première stratégique) - mots clés : information stratégique ; systèmes d'information ; information opérationnelle ; gestion stratégique ;
- Informação técnico-econômica: mais importante do que nuncaJoão Salvador FURTADO. « Informação técnico-econômica : mais importante do que nunca ». Ciência da Informação. 1991, vol. 20, nº 1. p. 20-22. (L'information téchnique-économique : plus important que jamais) - mots clés : information technologique ; information économique ; systèmes d'information technico-économique ; politique de recherche et de développement / entreprises ;
- Perspectivas do agente da informação no contexto brasileiroDenise Werneck de PAIVA. « Perspectivas do agente da informação no contexto brasileiro ». Ciência da Informação.1990, vol. 19, nº 1. p. 48-52. (Perspectives de l’agent de l'information dans le contexte brésilien) - mots clés : agent de l'information ; bibliothécaire ; spécialiste de l'information ;
- Sistemas de informação : a evolução dos enfoquesMarcos DANTAS. « Sistemas de Informação : a evolução dos enfoques ». Ciência da Informação.1992, vol. 21, nº 3. p. 192-196. (Les systèmes d'information : l'évolution de ses approches) - mots clés : systèmes d'information ; théorie des systèmes ; services d'information ;
- Consultoria informatológica em revisão : uma alternativa para serviços de informação personalizadosMariano A. MAURA. « Consultoria Informatológica em revisão : uma alternativa para serviços de informação personalizados ». Ciência da Informação.1993, vol. 22, nº 3. p. 242-247. (Consultation dans le domaine des sciences de l’information en révision : une alternative pour les services d'information personnalisés) - mots clés : services d'information ; bibliothèques spécialisées ; consultation dans le domaine des sciences de l’information ;
- Informação para a indústriaMarisa Gurjão PINHEIRO. « Informação para a Indústria ». Ciência da Informação. 1991, vol. 20, nº 1. p. 16-19. (L'information pour l'industrie) - mots clés : information industrielle ; transfert de l'information ; information technologique ; information technologique / petite et moyenne industrie / Brésil ;
- Interação entre empresas com necessidades de informação (=conhecimento) e a estrutura nacional de centros com provisão de conhecimento acumulado : referência especial à estrutura nacional de serviços de informação, documentação e de bibliotecaKjeld KLINTOE. « Interação entre empresas com necessidades de informação (=conhecimento) e a estrutura nacional de centros com provisão de conhecimento acumulado : referência especial à estrutura nacional de serviços de informação, documentação e de biblioteca ». Ciência da Informação. 1991, vol. 20, nº 1. p. 55-57. (Interaction entre les entreprises ayant besoin d'information (=connaissances) et la structure nationale de centres ayant un fonds : référence spéciale à la structure de services d'information, de documentation et de bibliothèques) - mots clés : politique d'information ; transfert d'information ; flux d'information ; centres et services d'information ; information technologique ;
- Uso da informação na indústria como paradigma para o desenvolvimento econômicoFrancisco das Chagas de SOUZA. « Uso da informação na indústria como paradigma para o desenvolvimento econômico ». Ciência da Informação. 1991, vol. 20, nº 1. p. 34-36. (L’utilisation de l'information dans l'industrie comme paradigme pour le développement économique) - mots clés : information / développement économique ; information technologique ; information industrielle ; information économique ; services d'information / entreprise ;
- A Informação eficaz na empresaAuta Rojas BARRETO. « A informação eficaz na empresa ». Ciência da Informação. 1991, vol. 20, nº 1. p. 78-81. (L'information efficace dans l'entreprise) - mots clés : information technologique ; prospection technologique ; services d'information ; entreprise de consultation ; entraînement de gestion ; ressources humaines ; produits d'information ;
- Gerência da informação: mudanças nos perfis profissionaisRegina de Barros CIANCONI. « Gerência da informação : mudança nos perfis profissionais ». Ciência da Informação. 1991, vol. 20, nº 2. p. 204-208. (La gestion de l’information : changement dans les profils professionnels) - mots clés : administration des ressources d'information ; gestion de l'information ; professionnel de l'information ;
- Informação: instrumento de dominação e de submissãoVânia Maria Rodrigues de ARAÚJO. « Informação: instrumento de dominação e de submissão ».Ciência da Informação. 1991, vol. 20, nº 1. p. 37-43. (L'information : outil de domination et de soumission) - mots clés : transfert d'information ; information technologique ; politique d'information ; développement technologique ; politique de science et technologie ; transfert de technologie ;
- Informação: a chave para a qualidade totalVirgínia Bentes PINTO. « Informação : a chave para a qualidade total ». Ciência da Informação. 1993, vol. 22, nº 2. p. 133-137. (L'information : la clé pour la qualité totale) - mots clés : qualité totale ; information pour la qualité ; unités d'information ; systèmes d'information.
Remarque : les articles ayant été indexés dans la revue Ciência da Informação, les mots-clés ont été traduits.