Retour d’expérience : passer la certification GCP Data Engineer

À travers cet article, notre consultant Andrea Morabito vous partage un retour d’expérience sur la dernière certification qu’il a obtenu : GCP Data Engineer. En espérant que son expérience vous accompagne, vous aide et peut-être vous guide si vous souhaitez vous certifier.

 

Une certification GCP c’est avant tout une occasion d’apprendre, de vérifier ses compétences et de démontrer la maîtrise des différents outils pour exercer un rôle particulier. Pour autant, il est important de faire les choses dans le bon ordre et de ne pas voir l’obtention de la certification comme une fin en soi. Le but est avant tout d’acquérir les connaissances et qu’elles puissent ensuite être mises en pratique. 

1) Choisir sa certification 

Avant toute chose, il est important de bien comprendre les différents niveaux de certifications et leur contenu. Les certifications GCP sont divisées en trois niveaux : Foundational, Associate, Professional. 

Certification Foundational : 

Pour les personnes n’ayant aucune connaissance du Cloud et souhaitant en apprendre plus sur les fondamentaux et les idées derrière son utilisation. Aucune technicité n’est requise. 


Certification Associate : 

Le niveau au-dessus, intéressant pour ceux ayant une petite expérience technique et souhaitant l’approfondir. Cette certification permet d’avoir les grandes bases de l’utilisation du Cloud et de sa mise en place. 

Certification Professional : 

Ces certifications sont divisées par rôle et valident des connaissances clés pour certains postes. Elles sont les plus spécialisées et les plus compliquées à obtenir. Il est d’ailleurs conseillé d’avoir une certaine base de connaissances et d’expérience sur le sujet avant de se lancer sur ces certifications. 

 

Après avoir pris connaissance de ces informations, on pourrait être tentés de sauter l’étape Associate pour se lancer directement sur une Professional plus réputée et ayant plus de “valeur”. Honnêtement, je ne le conseille pas, surtout si vous avez peu d’expérience. Je parle en effet de Cloud en général et non pas de GCP en particulier car si vous avez des connaissances sur d’autres cloud provider tel que AWS alors la passerelle se fera simplement. 

 

Le niveau Associate permet en effet, d’avoir des bases solides, de confirmer vos connaissances et de s’assurer d’avoir une vue globale du fonctionnement d’un cloud provider. Cette certification peut être une étape intéressante d’un projet sur le long terme, car, encore une fois, le but n’est pas la certification mais les connaissances et comment les utiliser au mieux par la suite.

2) La certification GCP Data Engineer Professional 

Voici mon retour d’expérience puisqu’il s’agit de la certification que j’ai choisie.

L’examen 

L’examen peut soit se faire chez soi, soit en centre de test. Je conseille le centre de test car les contraintes et les vérifications nécessaires sont extrêmement drastiques pour le passer chez soi. Il dure au maximum deux heures, même si une heure peut suffire si vous êtes à l’aise. Il est composé de 50 à 60 questions, 50 dans mon cas. En cas d’échec, il faudra attendre 14 jours, puis 1 mois et enfin 1 an avant de repasser l’examen. 

Les sujets 

La grande majorité des questions de mon examen concernaient BigQuery, l’optimisation des query, la sécurité, le networking et son utilisation dans une pipeline d’ingestion. Connaître le service sur le bout des doigts vous assure une base de points. 

 

Le second sujet concerné les choix autour de la construction d’une pipeline de données notamment à travers différents cas où il faut faire des choix pour optimiser financièrement, en terme de disponibilités ou encore en terme de performances par exemple. Connaître l’agencement des différents services Data mais aussi les raisons pour lesquelles choisir un service plutôt qu’un autre est primordial. Par exemple, Pub/Sub ou Kafka, DataProc avec HDFS ou Cloud Storage, quelle base de données choisir en fonction de différents critères, quel partitionnement ou clustering…

3) Comment se préparer 

Là-dessus il n’y a pas de recette magique, nous apprenons tous différemment et nous ne partons pas des mêmes connaissances donc je ne peux pas vous dire précisément quel parcours sera parfait pour vous. Mais voici mon retour :

Le cursus classique 

Les cours sur la plateforme Coursera, administrées par Google directement, est la meilleure porte d’entrée pour commencer à préparer sa certification tout en ayant des pistes pour appronfondir ses connaissances. Le cours GCP Data Engineering, est construit uniquement pour se jauger sur les différents sujets abordés par la certification. De plus, si comme moi vous venez d’AWS, le cours Spécialisation Google Cloud Infrastructure for AWS Professionals facilite la passerelle entre les deux cloud provider et propose des labs pour prendre en main plus facilement la plateforme GCP. 

 

L’important encore une fois est de trouver la bonne méthode pour vous, donc si vous avez du mal à vous lancer, du mal à rester concentrés et à suivre, ce qui a été mon cas, n’hésitez pas à essayer une autre méthode. Il existe énormément de ressources sur internet sur ces sujets-là donc prenez un peu de temps pour trouver la meilleure façon d’apprendre. Encore plus si c’est la première fois que vous passez une certification. 

Ce qui a fonctionné pour moi

Si comme moi, vous apprenez mieux quand vous êtes proactifs et que vous aimez avoir un cadre clair pour apprendre, laissez-moi vous présenter ma méthode d’apprentissage. Elle sera centrée autour de l’utilisation de Notion mais vous pouvez très bien utiliser d’autres outils similaires. 

 

 

 

Le but est de se créer une base de données de connaissances personnelles. Concrètement, ce sont des fiches sur différents sujets stockées au même endroit. Dans mon cas, j’ai organisé mes fiches par services : GCP, Outils, Vocabulaire et Memo.


Ainsi pour chaque nouveau service, je note les informations qui me paraissent importantes sur son fonctionnement, les coûts, limitations et optimisations possibles. Le même travail est ensuite fait pour les outils extérieurs tels qu’Apache Beam, Hadoop, Airflow, Hive, Kafka. De même pour le vocabulaire : ACID Transactions, Data Mesh, pour ne citer qu’eux. Le dernier type de fiche est le plus intéressant, ce sont les mémos, c’est-à-dire des fiches très simples pour se rappeler de certaines informations importantes. Par exemple, comment choisir la bonne base de données, comment optimiser une requête, wide table ou narrow table. Le but est d’avoir les grands axes de réflexion simplement et directement sur des sujets potentiellement clés. Ce sont en général les dernières fiches à faire mais les premières à réviser avant l’examen. 


 


Le travail peut paraître colossal notamment si vous ne partez de rien et peut sembler un peu démoralisant. C’est pourquoi la seconde partie clé de cette méthode se situe dans l’organisation. Avoir un Jira, un Trello ou comme moi votre liste de tâches dans Notion vous aidera. Tout d’abord pour avoir un rythme d’apprentissage (par exemple une fiche par jour, cinq fiches par semaine), et ensuite d’adapter en fonction de votre rythme.  

 

Le but est ainsi d’engranger des connaissances et d’approfondir les différents termes ou questions que l’on pourrait avoir. 

Les examens blancs 

Le meilleur moyen de tester ses connaissances et de voir si l’on est prêt à passer l’examen. Pour ceux n’ayant jamais passé l’examen, je vous conseille cette série de vidéos Youtube vous montrant pas à pas comment appréhender les questions de l’examen. Pour vous tester, il y a ce set de questions dont certaines étaient très proches de celles de l’examen réel. 

4) Conclusion 

Que ce soit pour tester ses connaissances, pour les approfondir ou pour en acquérir de nouvelles, je vous conseille de passer cette certification. Personnellement, elle m’a poussé à vraiment réfléchir à la meilleure façon pour moi de retenir un grand nombre d’informations concernant un cloud provider totalement nouveau, ayant avant tout travaillé sur AWS.


Les connaissances engrangées sur la façon d’optimiser les requêtes et les différents choix à faire concernant le traitement de la donnée sont des leçons qui me seront toujours utiles notamment dans les prochaines architectures que je serais amené à faire. 


J’espère que ce sera votre cas aussi et vous souhaite autant de réussite dans votre examen. À vous de jouer ! 

Leave a comment:

Your email address will not be published. Required fields are marked *

Top

ADDRESSE
18 Rue de Villiers
92300 Levallois-Perret

SOCIAL MEDIA