Depuis sa création, Syllabs investit dans de nombreux projets de recherche et développement (R&D) et publie ses résultats lors de conférences scientifiques de premier plan.

Ainsi via l’intervention de Rémi Ferrez, nous serons présent lors de la huitième édition de la conférence internationale WEBIST (Web Information Systems and Technologies) pour présenter nos derniers travaux de recherche dans le domaine du Web Mining.

Rémi présentera un article nommé “Self-Supervised Product Feature Extraction using a Knowledge Base and Visual Clues” [Ferrez-de Groc-Couto] dans lequel il est décrit une nouvelle méthode “auto-supervisée” permettant de faciliter le travail d’extraction de données structurées (comme des informations sur des produits) à partir de pages Web.

Voici le résumé de l’article :

“This paper presents a novel approach to extract product features from large e-commerce web sites. Starting from a small set of rendered product web pages (typically 5 to 10) and a sample of their corresponding features, the proposed method automatically produces labeled examples. Those examples are then used to induce extraction rules which are finally applied to extract new product features from unseen web pages. We have carried out an evaluation on 10 major French e-commerce web sites (roughly 1~000 web pages) and have reported promising results. Moreover, experiments have shown that our method can handle web site template changes without human intervention.”

 

Comments are closed.