B2B, n°46

En janvier 2012, les Data-Journalists auront leur moteur de recherche


Le besoin de trouver, trier et mettre en valeur des données chiffrées prend de plus en plus d’importance dans la société de l’information. Partant de ce constat, la start-up QunB développe un moteur de recherche pour toutes les questions qui commencent par  »combien ».

Cyrille Vincey, créateur de QunB. © D.R.

A l’heure où le gouvernement rend les données publiques accessibles sur internet (data.gouv.fr), les bases de données des organismes publics et autres producteurs de contenu restent bien souvent obscures pour l’utilisateur novice. Que celui-ci se rassure : un nouveau moteur de recherche devrait voir le jour en version bêta dès la mi-janvier. Dénommé Qunb (prononcez  »Qiou and Bi »), ce nouveau service est doté d’algorithmes capables de rechercher parmi 2 000 sources. « Au lancement du site, en janvier, la base de données contiendra près de 100 milliard d’informations », assure Cyrille Vincey, créateur de la plate-forme. « Mi-2012, il devrait y avoir près de 1 trilliard de données. »

95% de données gratuites. Concrètement, il s’agit de données publique (Open Data) émises par des sources officielles comme l’INSEE, ou de données  »UGC » (pour User Generated Content), produites et mises en ligne gratuitement par les utilisateurs de Qunb eux-mêmes. Reste quelques données payantes, notamment les études de marché issues des grands cabinets d’analyse comme Gartner, Xerfi ou encore Eurostaff… En pratique, l’utilisateur les achète  »à la découpe », autrement dit par petits morceaux. « Pour l’instant, 95% des données mises en ligne sont gratuites et, sur ce pourcentage, la moitié est issue de l’Open Data. »

QunB capture d'écran. © D.R.

Recherche & affichage. Tout l’art de Qunb consiste à extraire les données désirées et à les traduire en graphiques. Au départ, l’internaute tape des mots clés dans une barre de recherche. Afin d’affiner son enquête, il dispose d’un certain nombre de paramètres. Par exemple, il peut restreindre sa recherche à une zone géographique précise. Ensuite, un clic sur le résultat suffit pour que l’application génère automatiquement un graphique de type courbe, camembert, histogramme… « En fonction de la donnée, les algorithmes déterminent le meilleur type de graphique disponible », reprend Cyrille Vincey. Afin de croiser plusieurs chiffres, l’utilisateur de Qunb peut également lancer plusieurs recherches supplémentaires et ajouter les nouvelles données au graphique initial, par un simple glisser/déposer. « Le système opère alors des conversions en temps réel afin que les données correspondent de façon cohérente entre elles. »

Processus métier. « Nos premières cibles sont les Data Journalists (Journalistes de données) », lance le créateur de Qunb. A savoir, des professionnels du croisement de données et de la mise en forme graphique du résultat afin d’en faciliter la lecture. Pour coller au processus métier des journalistes, les graphiques de Qunb sont exportables au format Excel, le logiciel de Microsoft. En outre, ils peuvent être embarqués dans une page Web à l’aide d’un code HTML spécifique. Tous sont publiés sous licence Creative Commons et donc adaptés à une utilisation professionnelle, à condition de laisser visible la référence au moteur de recherche Qunb. Notons toutefois que l’information n’est pas vérifiée par Qunb. « Ce n’est pas notre rôle », explique Cyrille Vincey. « Pour évaluer la crédibilité d’une donnée, il faut soit se fier à la source soit regarder le nombre de votes qu’elle a obtenus à travers le système de  »Rating » des informations du site. »

© Guillaume Pierre

Discussion

2 réflexions sur “En janvier 2012, les Data-Journalists auront leur moteur de recherche

  1. c’est une bonne idée, sauf que des datajournalistes doit y’en avoir deux en france, c’est ce qu’on appelle un micromarché.

    Publié par Edouard L. | janvier 2, 2012, 3:56

Rétroliens/Pings

  1. Pingback: QunB : moteur de recherche des Data-Journalistes ? « atbackbook - février 27, 2012

Laisser un commentaire

Les + partagés

Artiste en zone de guerre
La Franche-Comté dope son tourisme au QR Code
Concilier tourisme, accessibilité, multimédia et mobile
Terra Nova publie son rapport sur le numérique
La fusion nucléaire dans un appartement
Ce soir, j'irai dîner chez vous
Des textiles photoluminescents comme des vers luisants
Interview du journaliste : « On n'a pas le droit d'être mauvais, sinon on trahit celui qui se confie à nous »
Interview du journaliste : « Nous sommes définitivement Geeks »
Abriter les chantiers pour réinventer leur organisation