Tout est grand aux Etats-Unis. L’information, la donnée, a vu son marketing renouvelé grâce au terme Big Data. Son exploitation en fait de même. Ainsi, le terme BigQuery est apparu dans les services Google. La query, requête en français, est le fait de consulter une information. Moi qui pensait qu’il s’agissait d’une qualité intrinsèque de la donnée …
Le géant californien se propose de vous faire payer cette action. N’allez pas chercher le mal partout. Libre à vous de conserver vos données là où vous le voulez. Mais sur leur serveur, toute interrogation à un coût. D’ailleurs, ils ne vous feront pas payer les usages de base alors que vous exploitez leurs infrastructures.
Leur plus-value se porte autour des outils utiles à l’exploitation des données. Au classique langage de 4ème génération SQL, Google propose d’autres outils mathématiques pour miner les données. Un schéma vaut mieux que mille mots même s’il est en anglais et relativement technique.
Quel intérêt à déplacer ses données sur les serveurs du géant américain ?
Pour un particulier, à moins de boursicoter avec des modèles performants, aucun. Pour une entreprise qui génère des millions de données quotidiennement, les arguments techniques et financiers sont pertinents.
Le coût
Certes, il y a un prix, mais il faut le comparer à la solution locale. Configurer, installer, mettre à jour un serveur. Cela prend du temps et de l’argent. A cela, il faut ajouter l’électricité quotidienne. Les réseaux actuels font qu’on accède aujourd’hui à un serveur sur Internet dans les mêmes conditions qu’un serveur local.
Le modèle tarifaire de BigQuery est basé sur l’usage. Le prix de stockage des données est correct et le coût de calcul intéressant. Pour le détail, il faut un bon comptable et un bon analyste de données.
La performance
Aucune limite pour le stockage. Le paiement à l’usage est trop intéressant pour brider les clients. Le temps de requêtage ne peut être égalé par une infrastructure privée. Dans la démonstration, le calcul basé sur 120 Go de données* dure 6 secondes. L’accès aux données est optimisé au mieux par un stockage en colonne.
L’outil est intégré dans le nuage du géant américain. Il est donc interconnecté à tous les autres outils de la firme. Cela rend l’acquisition et la restitution des informations plus simple.
La sécurité
Des serveurs répartis au quatre coins du monde, une promesse de disponibilité d’au moins 99,9 %, une entreprise connue pour sa maîtrise d’Internet, les risques sont moindres que si vous deviez administrer vos serveurs tout seuls. Cela devrait rassurer le RSSI qui gèrera la sécurité des données.
Cependant …
Aussi intéressant que paraisse le BigQuery, il dépend en grande partie du talent des informaticiens engagés pour répondre à vos besoins. Une application mal optimisée fera exploser les coûts. Une application mal conçue ne répondra pas à vos attentes. Le classique de tout projet informatique.
Un autre écueil est la protection des données. Au pays de l’oncle Sam, le RGPD ne pèse pas lourd. Il faudrait être naïf pour déposer les données des citoyens français sur des serveurs américains. Si vous gérez un site sur le tricot, cela ne vous dérangera pas. Dans d’autres cas, n’y exposez pas vos données critiques.
Le dernier problème est la partie communication. Il faut être bien versé dans l’informatique pour comprendre le service. Et la propagande inclusive n’aide pas. Mettre un type avec le look informaticien sur un affreux fond vert pour paraître proche alors que le discours est écrit par une armée de marketeux déconnectés, ça n’aide pas à se projeter.
BigQuery est une offre serverless intéressante pour des projets de grandes entreprises ou pour de la recherche scientifique. Les cas d’usage sont variés même si cela ne parle qu’à une fraction de la population.
—
(*) 120 Go de données cela correspond à parcourir 600 000 livres pour retrouver les informations voulues.