Traiter un corpus d'annonces : méthodologie

Le choix des supports

L'objectif étant de pouvoir de disposer de quelques points de comparaison avec les autres données de marché, il était nécessaire que le corpus présente une vision sinon exhaustive du moins assez complète de l'offre à un instant t 564 . Les supports doivent également être relativement homogènes pour que les stratégies de valorisation puissent être comparables. Pour cette raison, nous avons exclu les journaux d'annonces de particulier, de même que les supports mêlant les offres de particuliers et d'agence (où l'on ne peut pas toujours déterminer la nature de l'annonceur). Cela laissait le choix entre les annonces en ligne et celles des journaux d'annonces. Les premières posent le problème de l'exhaustivité 565 : la recherche sur les sites se fait par critères de telle sorte qu'il est impossible de savoir si toutes les annonces ont été saisies. En revanche, les journaux d'annonces cumulent plusieurs avantages : ils sont réservés aux agences, et laissent la place aux stratégies publicitaires tout en restant assez proches dans la forme. De plus, la majorité des agences du questionnaire lyonnais y recourent. Les journaux de petites annonces permettent donc d'avoir une vision globale. Tous les biens mis en vente n'y figurent pas (les plus anciens mandats par exemple ne sont pas présentés) et ces journaux peuvent apparaître comme une vitrine. Néanmoins, en rassemblant toutes les annonces parues dans ces journaux, on dispose d'un échantillon large et représentatif de l'offre telle qu'elle est présentée par les agences à un instant donné. Les journaux sélectionnés sont ceux qui étaient distribués gratuitement à Lyon (devant les agences et les magasins). Tous sont mensuels, sauf pour Top annonces (hebdomadaire) et Logic-Immo (bimensuel), pour lesquels on a sélectionné l'exemplaire du début du mois (première semaine ou première quinzaine) de février 2006 de façon à avoir un aperçu une offre contemporaine de la passation du questionnaire. Les annonces pour des biens situés hors de Lyon (y compris celles de la proche banlieue) ont été saisies de façon sommaire, avec seulement deux champs (maison ou appartement, mandat simple ou exclusif) tandis que, pour Lyon, plus d'informations ont été retenues, de façon, encore une fois, à limiter l'hétérogénéité du corpus. Les variables suivantes entrent dans le fichier :

  • Le nom du journal et la façon dont l'annonce y est insérée : dans le corps principal du texte, dans un encart réservé à une agence ou encore dans un encart pleine page. On note également la présence, ou non, d'une photo ou d'un plan.
  • L'agence faisant paraître l'annonce et le type de mandat (simple ou exclusif)
  • L'arrondissement (ou seulement Lyon s'il n'est pas précisé, ce qui n'est le cas que pour 25 annonces, soit 1,6%). Le quartier (éventuellement la rue), tel qu'il est indiqué dans le texte de l'annonce.
  • Le prix, la surface (à partir desquels on calcule un prix au mètre carré), le nombre de pièces, la surface additionnelle (qualitative : garage, jardin, cave, etc. et quantitative, en mètres carrés), l'étage.
  • L'état général du logement tel qu'il est indiqué dans l'annonce ("à rafraîchir", "très bon état", etc.)
  • La valorisation elle-même est saisie à travers les différents types de qualificatifs susceptibles de s'appliquer : un jugement général sur le bien ("beau", "charme", etc.), l'incitation faite à l'acquéreur ("à saisir", "urgent", etc.), la qualification de l'intérieur du logement ("calme", "lumineux", "vue", "pierres apparentes", etc.), de son espace ("grand", "beaux volumes", "belles prestations"), de son immeuble ("résidence fermée", "rue calme", etc.)
  • Les autres informations (nombre de chambres, de salles de bains, rénovations partielles, équipements) sont saisies mais pas exploitées.
  • La photo n'est pas décrite dans le fichier. Elle occupe une place importante mais son recodage en texte n'apporte pas beaucoup d'éléments, à moins d'être très détaillé. Si l'on s'en tient à un terme unique, on observe trois types de cas : une photo du salon, une photo du balcon ou de la vue (qui est en général redondante avec la mention "vue" dans le texte de l'annonce), une photo de la façade. Ce dernier cas est rare car il ne faut pas que l'acquéreur puisse repérer l'adresse. Ainsi, Alain nous a décrit comment il essayait de trouver les adresses des maisons lorsque, avant d'ouvrir l'AI, il pratiquait de petites opérations de type marchand de biens à son compte : habitant dans l'Isère, il déterminait (à l'aide du relief montagneux, du type de végétation, etc.) assez précisément l'endroit et faisait ensuite du porte-à-porte dans toutes les maisons susceptibles de correspondre. Précisons à cet égard que les façades des maisons sont plus fréquentes que celles de immeubles. Dans la mesure du possible, elles sont prises lorsque le temps est favorable (le fond pouvant également être retouché). Pour les photos d'intérieur, les agents préfèrent un logement habité qui permet mieux la projection que des volumes vides.

Notes
564.

Pour des raisons de faisabilité, nous n'avons pas regardé l'évolution dans le temps. L'intérêt d'une telle approche résiderait dans le suivi des mêmes biens, suivi qui, étant donné la forme de la source, n'a rien d'évident.

565.

Une comparaison entre les annonces de presse et celles d'Internet a été menée sur le marché du Travail par Emmanuelle Marchal ("Les annonces françaises : une spécificité qui perdure de la presse à Internet", in Emmanuelle Marchal, Géraldine Riençau, Didier Jorny, Des standards nationaux à l'épreuve d'Internet, rapports de recherche du CEE, n°12, juillet 2003, pp. 11-42). Elle note une proximité entre les deux (notamment sur la nature des annonceurs), même si les sites Internet présentent des spécificités : certaines caractéristiques sont moins demandées (comme les langues étrangères ou la bureautique). Le principal effet est toutefois lié à la façon de mener la recherche (sélection de rubriques). Dans l'immobilier le problème est le même : toute l'offre n'apparaît pas et les annonces doivent être recherchées sur critères. Le principal effet nous semble porter sur les choix de localisation, puisque les secteurs sont prédéfinis par les sites (souvent il s'agit de la commune ou de l'arrondissement, pas de quartiers plus précis). Dans l'ensemble toutefois, ces rubriques sont les mêmes que dans la presse : par localisation puis par nombre de pièces (Internet ajoute un cadrage par budget).