Concepteur SRE

Montreal

Offre publiée le 2025-01-30

freelance.ca

DESCRIPTIONS DES ACTIVITÉS DE PROJET

Relevant du Directeur, Fiabilité des services, vous serez responsable de l'analyse et des spécifications pour les dossiers et projets qui vous seront assignés. Vos analyses permettront de définir des solutions et d'assurer la faisabilité des solutions proposées. Vous aurez à travailler de concert avec les équipes PLEX, les unités TI et aux clients d’affaires, ainsi qu'à supporter la réalisation des dossiers fonctionnels et des changements en cours de projet.

Responsabilités

  • Concevoir des solutions SRE évolutives et résilientes sur l’infrastructure AWS
  • Définir et mettre en œuvre des stratégies adaptées aux besoins métier
  • Proposer des améliorations architecturales pour réduire les coûts, améliorer les performances et garantir la haute disponibilité
  • Travailler avec les parties prenantes pour définir des priorités SRE alignées sur les objectifs d’affaires
  • Participer à l’élaboration de la feuille de route technologique et influencer les décisions stratégiques liées aux opérations
  • Former et accompagner les équipes de développement et d’exploitation pour intégrer les pratiques SRE dans les opérations quotidiennes
  • Promouvoir une culture d’amélioration continue et de collaboration interdisciplinaire
  • Développer et maintenir des outils et pipelines CI/CD pour automatiser les déploiements et les opérations
  • Automatiser la gestion des infrastructures et des opérations répétitives
  • Identifier et résoudre les problèmes de fiabilité, de latence et d’évolutivité dans les environnements AWS
  • Mettre en œuvre des pratiques de chaos engineering pour tester la résilience des systèmes
  • Superviser les SLOs, SLIs et SLAs pour garantir des niveaux de service conformes aux attentes
  • Mettre en place des processus robustes de gestion d’incidents et diriger les post-mortems pour documenter les causes profondes
  • Garantir un suivi rigoureux des actions correctives et préventives

EXIGENCES

  • Dix (10) années d'expérience pertinente en gestion des opérations;
  • Sept (7) années d'expérience pertinente en SRE;
  • Sept (7) années d’expérience pertinente en services clés AWS (EC2, S3, RDS, Lambda, Cloudwatch, Route 53, etc…);
  • Maitrise des concepts d’architecture cloud : VPC, IAM, réseautage, sécurité, etc…;
  • Connaissance avancée des concepts IaC (Cloudformation, Terraform, etc…);
  • Capacité à automatiser et gérer les infrastructures dans des environnements complexes;
  • Expertise avec des outils comme Datadog, Cloudwatch et ITOM SNOW;
  • Compréhension des concepts de traces distribuées et logs centralisés;
  • Expérience dans l’utilisation de Azure DevOps, GitHub, Jenkins, Gitlab CI/CD ou autres outils similaires;
  • Connaissance approfondie d’au moins un (1) langage de scripting (Python, Bash) et un langage de programmation (Go, Java, etc…);
  • Expérience dans la gestion d’incidents critiques dans des environnements de production;
  • Compréhension approfondie des pratiques Chaos Engineering;
  • Capacité de structurer et mener des réunions d'intervenants multidisciplinaires et multi-niveaux;
  • Capacité démontrée à collaborer avec des équipes multidisciplinaires et à présenter des idées complexes de manière claire et accessible;
  • Aptitude à convaincre et à influencer les décisions à différents niveaux de l’organisation;
  • Compétence avérée dans la gestion des priorités et dans la résolution rapide de problèmes complexes;
  • S’impliquer occasionnellement sur des incidents critiques de soir, de nuit ou de week-end;
  • Capacité à former, accompagner et motiver des équipes pour adopter une culture SRE;
  • Connaissance et capacité à travailler dans un contexte Agile;
  • Habiletés à effectuer plusieurs tâches sur plusieurs projets en parallèle;
  • Être capable de travailler sous pression;
  • Bilinguisme.

COMPÉTENCES (COMPORTEMENTS, HABILETÉS)

  • Savoir communiquer efficacement;
  • Gestion du changement;
  • Travail d’équipe;
  • Souci aigu du service à la clientèle;
  • Habiletés relationnelles.