Sur le plan de la construction, EN blacklist, black hacker et black server sont identiques : un adjectif précède un substantif. La première séquence est lexicalisée et répertoriée dans les dictionnaires, la deuxième est un terme pas toujours répertorié, la troisième est une séquence fortuite que nous venons de créer et qui n’est donc ni lexicalisée, ni répertoriée. Comme nous l’avons précisé, pour recenser des composés il faut autant que possible les distinguer de toutes les autres unités lexicales. Or, l’existence de deux continuums (collocation-lexie composée et séquence fortuite-lexie composée) complique l’identification des composés. Une séquence fortuite (Part. I, Ch. 1, Sec. 1.2.4.) ou une collocation (Part. I, Ch. 1, Sec. 1.2.5.) peut voir sa fréquence d’emploi augmenter et être lexicalisée puis répertoriée (Tournier, 1991a : 66). Cinq critères de distinction sont traditionnellement utilisés pour lever les ambiguïtés : l’accentuation, la graphie, la distribution, la sémantique et la fréquence. Seront ajoutés quelques autres critères utilisés par Arnaud (2003), Boisson (1980), Lehmann et Martin-Berthet (1997). Appliquer ces critères à des unités du lexique d’Internet qui sont de bons candidats composés, des séquences fortuites et des collocations 40 montre leur manque de fiabilité. Nous considérerons Bauer (1998) pour qui ces critères sont insuffisants pour décider si une séquence anglaise N + N est une construction morphologique (un composé) ou une construction syntaxique (une séquence fortuite). Bauer doute même de l’existence de deux types de constructions séparées.
Les groupements A + N et N + A testés dans ce chapitre sont considérés comme des collocations par Bally (in Hausmann, 1979).