Site Reliability Engineer (expérimenté, CDI), Valbonne
Site Reliability Engineer (expérimenté, CDI), Valbonne
-
Valbonne, France
-
Publiée: il y a moins d’une semaine
-
Ajouter
Description
Site Reliability Engineer (expérimenté, CDI)
ALTEN Sophia Antipolis intervient auprès des grands acteurs de l’IT de la technopole. Nous sommes parmi les leaders du conseil en ingénierie et technologie. Fort de nos 37 000 collaborateurs et de notre implantation dans plus de 28 pays, nous apportons des solutions innovantes pour contribuer aux projets et au développement de nosclients issus de secteurs d’activité variés.En tant que Site Reliability Engineer (SRE), vous jouerez un rôle clé dans le maintien, l’optimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement, d’infrastructure et d’opérations pour garantir une disponibilité et une résilience maximales des services et applications critiques.Missions principales: Maintien en conditions opérationnelles
des systèmes et des applications en production, en optimisant leur disponibilité, performance et évolutivité. Automatisation des tâches
répétitives et des processus de déploiement, de surveillance et d’alerting. Conception et mise en œuvre de solutions
permettant d’améliorer la fiabilité des systèmes et de réduire le taux de pannes. Analyse des incidents
et gestion des urgences, avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et d’accroître la résilience. Optimisation des performances
des applications et de l’infrastructure, notamment via la gestion des capacités et des coûts. Collaboration avec les équipes de développement
pour favoriser une approche DevOps et intégrer les pratiques SRE dès les phases de conception. Création et suivi de métriques
pour mesurer la fiabilité et les performances des systèmes (SLI, SLO, SLA). Veille technologique
pour assurer l’amélioration continue des outils et des processus SRE. Compétences requises: Expérience en ingénierie système
: Linux/Unix, gestion de serveurs, stockage, et réseaux. Maîtrise des outils de monitoring et d’alerting
(ex. : Prometheus, Grafana, Datadog, ELK Stack). Compétences en automatisation
: scripting (Python, Bash, etc.), outils de CI/CD (ex. : Jenkins, GitLab CI, GitHub Actions), et infrastructure-as-code (Terraform, Ansible). Expérience avec les environnements cloud
: AWS, GCP, Azure ou autres services cloud, ainsi que les architectures de microservices et conteneurs (Docker, Kubernetes). Compétences en bases de données
: administration et optimisation de bases SQL et NoSQL. Capacité à gérer les incidents
: compétences en diagnostic et résolution de pannes dans un environnement de production. Bonnes compétences en communication
pour collaborer avec deséquipes pluridisciplinaires et documenter les processus et solutions. Compétences bonus Expérience en tant que DevOpsingénieur système ou développeur logiciel Connaissance des méthodologies de développement agile et des pratiques DevOps Participation à la mise en place de processus d'observabilité, de monitoring et de gestion des incidentsExpérience dans la gestion de la disponibilité et de la performance Résistance au stress et capacité à travailler efficacement en cas d’incidents critiques.
#J-18808-Ljbffr
ALTEN Sophia Antipolis intervient auprès des grands acteurs de l’IT de la technopole. Nous sommes parmi les leaders du conseil en ingénierie et technologie. Fort de nos 37 000 collaborateurs et de notre implantation dans plus de 28 pays, nous apportons des solutions innovantes pour contribuer aux projets et au développement de nosclients issus de secteurs d’activité variés.En tant que Site Reliability Engineer (SRE), vous jouerez un rôle clé dans le maintien, l’optimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement, d’infrastructure et d’opérations pour garantir une disponibilité et une résilience maximales des services et applications critiques.Missions principales: Maintien en conditions opérationnelles
des systèmes et des applications en production, en optimisant leur disponibilité, performance et évolutivité. Automatisation des tâches
répétitives et des processus de déploiement, de surveillance et d’alerting. Conception et mise en œuvre de solutions
permettant d’améliorer la fiabilité des systèmes et de réduire le taux de pannes. Analyse des incidents
et gestion des urgences, avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et d’accroître la résilience. Optimisation des performances
des applications et de l’infrastructure, notamment via la gestion des capacités et des coûts. Collaboration avec les équipes de développement
pour favoriser une approche DevOps et intégrer les pratiques SRE dès les phases de conception. Création et suivi de métriques
pour mesurer la fiabilité et les performances des systèmes (SLI, SLO, SLA). Veille technologique
pour assurer l’amélioration continue des outils et des processus SRE. Compétences requises: Expérience en ingénierie système
: Linux/Unix, gestion de serveurs, stockage, et réseaux. Maîtrise des outils de monitoring et d’alerting
(ex. : Prometheus, Grafana, Datadog, ELK Stack). Compétences en automatisation
: scripting (Python, Bash, etc.), outils de CI/CD (ex. : Jenkins, GitLab CI, GitHub Actions), et infrastructure-as-code (Terraform, Ansible). Expérience avec les environnements cloud
: AWS, GCP, Azure ou autres services cloud, ainsi que les architectures de microservices et conteneurs (Docker, Kubernetes). Compétences en bases de données
: administration et optimisation de bases SQL et NoSQL. Capacité à gérer les incidents
: compétences en diagnostic et résolution de pannes dans un environnement de production. Bonnes compétences en communication
pour collaborer avec deséquipes pluridisciplinaires et documenter les processus et solutions. Compétences bonus Expérience en tant que DevOpsingénieur système ou développeur logiciel Connaissance des méthodologies de développement agile et des pratiques DevOps Participation à la mise en place de processus d'observabilité, de monitoring et de gestion des incidentsExpérience dans la gestion de la disponibilité et de la performance Résistance au stress et capacité à travailler efficacement en cas d’incidents critiques.
#J-18808-Ljbffr
Informations clefs
-
Nom de l’entrepriseALTEN
-
Titre de posteSite Reliability Engineer (expérimenté, CDI)
Conseils de Sécurité
Soyez vigilant lorsqu’il s’agit d’une offre stipulant explicitement qu’aucune expérience n’est requise.
Informations supplémentaires sur l’annonce
Site Reliability Engineer (expérimenté, CDI) est visible sur Locanto dans la catégorie Le Cannet Informatique, télécommunications.
Pour Le Cannet il n’y a pas d’autres annonces dans cette catégorie.
Vous voulez en voir plus ? Alors élargissez votre recherche pour consulter les annonces dans les alentours du Cannet, comme par exemple Informatique, télécommunications à Cagnes-sur-Mer, Vallauris ou encore Antibes. Il y a encore plus de petites annonces dans un rayon de 15 km pour cette catégorie. Cliquez ici pour consulter ces annonces.