Construire son dictionnaire: propriétés linguistiques
LaComm analyse le texte à deux niveaux: l'énoncé et le mot. Le niveau de l'énoncé, avec des catégories
composées de lemmes complexes et de morphèmes et le niveau du mot, avec des catégories composées de lemmes simples.
1) Les catégories de mots, sont constituées de mots ou de racines que l'on peut retrouver en tout ou en partie,
en tant que racine dans un mot ou en tant que mot. L'objectif de ces catégories est de reconnaitre les
morphèmes sans tenir compte des flexions d'accord ou de conjugaison. L'énoncé est donc découpé à chaque mot et chaque mot est
comparé au dictionnaire, et à
plusieurs reprises si nécessaire.
2) Les catégories d'expressions sont constituées de racines polysémiques ou d'expressions que l'on peut retrouver
en tout et uniquement en tout dans un énoncé.
Les catégories de mots et les catégories d'expressions peuvent faire référence à une même thématique.
Une séquence de mots
codée à la fois par la forme "expressions" et la forme "mots" d'une catégorie est un exemple de paradoxe à éviter, bien que LaComm fournisse
les résultats séparément.