Les composants fonctionnels d’un SRI, pour distinguer ses principales fonctions, peuvent se regrouper en des modules majeurs. On peut les décrire comme un système constitué : a) d'un ensemble d'information (DOCS) ; b) d’une Procédure de Traitement d’Information (PTI) ; c) d’un ensemble de requêtes (REQS) ; et d) d'un mécanisme qui détermine quelles informations répondent aux requêtes — Procédure de Recherche d’Information (PRI). Ce qui peut être montré par le schéma de la figure 1.2.
La PTI est la procédure responsable par le traitement, par l’indexation et par le stockage des documents. Comme résultat elle génère deux structures de données ou deux groupes de fichiers : 1) INDICES, où sont stockés les descripteurs dans une structure construite de manière à faciliter l’accès à l’information ; 2) MASTER où les contenus de documents sont stockés. L’extraction des descripteurs est faite en ayant comme base un Langage d’Indexation. Ce langage peut être soit pré-spécifié (vocabulaire contrôlé), soit pris librement dans les documents de la base de données (vocabulaire non contrôlé ou termes libres).
La PRI est la procédure chargée de recevoir la requête de l’usager (REQS), de l’interpréter, de déterminer la similitude des items d'information selon ce que demandent ces requêtes, et de donner les réponses à l’usager (REPS). Il faut que la requête soit composée de termes utilisés dans le langage d’indexation et pour l’indexation de la base de données, sinon on échoue complètement dans la recherche. On voit là que l’Interface de Recherche d’Information fait partie de la PRI.
Il faut remarquer que dans la base de données (BD) on peut avoir d’autres fichiers, ceux qu’on appelle habituellement de fichiers auxiliaires, pour simplifier le schéma, ils ne sont pas représentés dans la figure. Une autre remarque concerne la séquence d’exécution de ces deux procédures. D’abord, il faut que les documents de la base de données soient traités et structurés pour que les utilisateurs puissent faire la recherche d’information. La PTI est donc, naturellement, la première procédure à être exécutée. Les deux procédures doivent être exécutées dans des moments différents car il faut que les structures d’accès à l’information soient prêtes et cohérentes pour que la PRI puisse faire la recherche. La mise à jour de données faite en même temps qu’une recherche peut entraîner de mauvais résultats, c’est pourquoi, pour maintenir la cohérence de ceux-ci, il faut que la mise à jour de données soit faite, en dehors et avant que les usagers les utilisent.