Skip to content

La-Forge/BpiScrapper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

BpiScrapper

Extract companies data from the BPI website

Dependency requirements:

  • selenium (tested with 3.141.0)

Selenium needs a webdriver to work; more information, proper installation instructions and documentation are available here and here.

Examples

Extract for one company

from BpiScrapper import Company
from pprint import pprint

company = Company("https://lehub.web.bpifrance.fr/startup/askhub")
pprint(company.getData())

Result

{'identity': {'adress': '9 RUE DAREAU\nPARIS 14\n75014 France',
              'business_model': ['B2B', 'SAAS'],
              'creation': '2017',
              'description': 'Experte du traitement automatique du langage '
                             '(TALN) ou Natural Language Processing (NLP), '
                             'AskHub automatise les canaux conversationnels '
                             '(livechats, emails, appels téléphoniques), '
                             'améliore les agents conversationnels (chatbots, '
                             'voicebots, IVRs...) et permet aux entreprises de '
                             'piloter leur performance conversationnelle. \n'
                             '\n'
                             'L’objectif est de générer des gains en termes de '
                             'rapidité de réponse, de taux de conversion, '
                             "d'économies de coûts et de satisfaction client.",
              'headcount': '7',
              'jobs': ['DSI / SÉCURITÉ', 'MARKETING / COMMUNICATION'],
              'linkedin': 'https://www.linkedin.com/company/askhub/',
              'locations': [],
              'logo': 'https://storage.gra.cloud.ovh.net/v1/AUTH_5b52b2f4ab714e20821799649e702a79/production-hubdigital-medias/awsS3-uploads/329aadbc9a2136abe3fe255bab658c0d',
              'market': ['AGRO-ALIMENTAIRE',
                         'ASSURANCE',
                         'AUTOMOBILE',
                         'BANQUE / FINANCE',
                         'CONSUMER GOODS',
                         'DISTRIBUTION',
                         'EDUCATION / FORMATION',
                         'ENERGIE',
                         'GOUVERNEMENT',
                         'IMMOBILIER',
                         'MEDIA & DIVERSTISSEMENT',
                         'PROFESSIONAL SERVICES',
                         'SANTÉ / PHARMACIE',
                         'SERVICES PUBLICS',
                         'TECHNOLOGIE & TELECOMMUNICATIONS',
                         'TRANSPORT',
                         'VOYAGE / TOURISME'],
              'name': 'ASKHUB',
              'siren': '829785476',
              'technologies': ['API', 'INTELLIGENCE ARTIFICIELLE', 'SOFTWARE'],
              'twitter': 'https://twitter.com/AskHub_io',
              'website': 'https://www.askhub.io/'},
 'products': {'description': 'AskHub est une solution SaaS qui génère des '
                             'insights actionnables pour améliorer les '
                             'capacités et l’UX des agents conversationnels '
                             "(chatbots et voicebots) afin d'optimiser leur "
                             'ROI.\n'
                             '\n'
                             'Nos algorithmes propriétaires permettent à nos '
                             'clients :\n'
                             "=> d'accélérer l'entrainement de leur bot\n"
                             "=> d'identifier les besoins des utilisateurs en "
                             'analysant leurs requêtes\n'
                             '=> de comprendre comment les utilisateurs '
                             'interagissent avec leur bot\n'
                             "=> d'analyser les parcours utilisateurs pour "
                             'maximiser le ROI du bot',
              'title': 'Logiciel SaaS AskHubRéduire'},
 'team': [{'function': 'Co-founder', 'name': 'Mathieu Rouxel'}]}

Extraction for all companies from a request. Data is saved in json files.

from BpiScrapper import Company

urlSource = "https://lehub.web.bpifrance.fr/search?advancedmode=1&refinementList%5Btechnologies%5D%5B0%5D=Intelligence%20Artificielle&page=1"
companies = Companies(urlSource)
companies.extractCompanies(folder="./data/")

Disclaimer

The scrapper presented here are proposed for experimentation purposes only. Please be advised that tools designed to automatically fetch data may be incompatible with the terms of use of some website.

About

Extract companies data from the BPI website

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages