Tourism surveying from social mediathe validity of user-generated content (ugc) for the characterization of lodging rankings

  1. MARTIN FUENTES, EVA
Dirigida por:
  1. César Fernández Camón Director

Universidad de defensa: Universitat de Lleida

Fecha de defensa: 18 de julio de 2018

Tribunal:
  1. Jorge Umbelino Presidente/a
  2. Ramón Béjar Torres Secretario
  3. Carlos Cardoso Ferreira Vocal

Tipo: Tesis

Teseo: 580953 DIALNET

Resumen

L'objectiu d'aquesta investigació consisteix en determinar si el contingut generat pels usuaris en llocs webs relacionats amb la indústria de l'allotjament valida els sistemes de classificació de qualsevol establiment i plataforma d'allotjament per crear un sistema internacional de classificació d'hotels que pugui servir també per categoritzar qualsevol tipus d'allotjament. Aquesta memòria presenta el treball dut a terme a través de la descàrrega i l'anàlisi de prop de quaranta milions de ressenyes sobre hotels de tot el món descarregades des de TripAdvisor i Booking.com. D’una banda, s’analitza les valoracions dels usuaris sobre establiments d'allotjament per comparar les seves puntuacions i determinar que la posició que ocupen els hotels en el rànquing està molt relacionada entre TripAdvisor i Booking.com. De l'altra, la investigació consisteix en l'anàlisi dels sistemes de classificació d'hotels, demostrant que hi ha una relació entre les valoracions dels usuaris i les categories d'hotels a tot el món, de tal manera que les categories es poden predir a partir del contingut generat pels usuaris a internet, entre d'altres paràmetres. Finalment, a través de tècniques d'aprenentatge automàtic, es crea un model per classificar els establiments d'allotjament siguin tradicionals o plataformes d'allotjament col·laboratiu, com ara Airbnb, per a què convergeixin els diferents sistemes de classificació de tot el món. El objetivo de esta investigación consiste en determinar si el contenido generado por los usuarios en webs relacionadas con la industria del alojamiento valida los sistemas de clasificación de cualquierestablecimiento y plataforma de alojamiento para crear un sistema internacional de clasificación de hoteles que pueda servir también para categorizar cualquier tipo de alojamiento. Esta memoria presenta el trabajo llevado a cabo a través de la descarga y el análisis de cerca de cuarenta millones de reseñas sobre hoteles de todo el mundo descargadas desde TripAdvisor y Booking.com. Por un lado, esta investigación se centra en analizar la información brindada por los usuarios con sus valoraciones sobre establecimientos de alojamiento para comparar sus puntuaciones y determinar que la posición que ocupan los hoteles en el ranking está muy relacionada entre TripAdvisor y Booking.com. Por el otro, la investigación consiste en el análisis de los sistemas de clasificación de hoteles, demostrando que existe una relación entre las valoraciones de los usuarios y las categorías de hoteles en todo el mundo, de tal manera que las categorías se pueden predecir a partir del contenido generado por los usuarios en internet, entre otros parámetros. Finalmente, a través de técnicas de aprendizaje automático, esta tesis crea un modelo que permite clasificar los establecimientos de alojamiento ya sean tradicionales o plataformas de alojamiento colaborativo, como Airbnb, para que converjan los diferentes sistemas de clasificación de todo el mundo. The aim of this research is to determine whether online User-Generated Content (UGC) about the lodging industry validates the ranking system of any accommodation property or platform in order to create an international hotel classification system that may also serve to categorize any type of accommodation. This thesis presents the work carried out following the collection and analysis of nearly 40 million reviews of hotels worldwide downloaded from TripAdvisor and Booking.com. On the one hand, this research focuses on the analysis of information provided by users, and specifically their reviews of accommodation properties, to compare their scores and to determine whether the position of a hotel in both ranking systems is closely related. On the other hand, the research consists of the analysis of hotel classification systems. It demonstrates that although international classification systems are not unified, there is a relationship between users’ ratings and hotel categories worldwide. Consequently, categories can be predicted from UGC on the Internet, among other parameters. Finally, through machine learning, this thesis creates a model that allows accommodation properties, whether on traditional or collaborative hosting platforms (e.g., Airbnb), to be classified in such a way that different classification systems worldwide are consistent.