Sichere Cloud- und DevOps-Modernisierung für Call-Center-Betriebe is a case study by HDWEBSOFT. Industry: Marketing. Services provided: DevOps, Infrastructure Management, Modernization, Migration. Technologies used: AWS, Cloud, Kubernetes. Solutions: Cybersecurity, Quality Management, Compliance, General. Team size: 3. HDWEBSOFT modernisierte die Callcenter-Infrastruktur zu einer [sicheren Cloud- und DevOps-Plattform](/services/devops-services), die den SOC 2-Anforderungen…

MarketingAWSCloudKubernetes

Sichere Cloud- und DevOps-Modernisierung für Call-Center-Betriebe

HDWEBSOFT helped a US-based call center technology company modernize legacy, self-managed infrastructure into a secure hybrid cloud and DevOps platform with governed access, repeatable delivery, and centralized observability.

Branche
Stack
Region
Teamgröße
3

Ein in den USA ansässiges Callcenter-Technologieunternehmen musste seine veraltete, selbstverwaltete Infrastruktur in eine [sichere Cloud- und DevOps-Plattform](/services/devops-servicesDie Umgebung des Kunden musste eine schnelle Softwarebereitstellung ermöglichen und gleichzeitig die Anforderungen an Governance, Zugriffskontrolle, Observability und SOC-2-Compliance über Entwicklung, Produktion, Shared Services und On-Premises-Workloads hinweg konsistent gewährleisten.

HDWEBSOFT unterstützte die Konzeption und Implementierung einer Hybridplattform, die AWS-EKS-Cluster, On-Premises-Rechenzentrumsknoten in Las Vegas und Downtown Los Angeles, GitOps-Bereitstellung, zentralisierte Identitätsverwaltung, Geheimnismanagement, CI/CD-Automatisierung und [Sicherheitsüberwachung](/services/cybersecurityin ein auditierbares Betriebsmodell.

Projektkontext

Die Plattform des Kunden diente dem Betrieb eines Callcenters, in dem Zuverlässigkeit, Sicherheit und Übertragungsgeschwindigkeit von entscheidender Bedeutung waren. Mit dem Wachstum des Unternehmens wurde der konsistente Betrieb der bestehenden Infrastruktur immer schwieriger, was die bei der Migration bestehender Workloads üblichen Planungs-, Abhängigkeits- und Betriebsrisiken widerspiegelte.https://docs.aws.amazon.com/wellarchitected/latest/migration-lens/assess-perf.htmlTeams benötigten eine effizientere Methode, um Umgebungen bereitzustellen, den Zugriff zu steuern, Workloads zu deployen, Vorfälle zu überwachen und nachzuweisen, dass Infrastrukturänderungen bewusst und nachvollziehbar waren.

Das Modernisierungsziel bestand nicht nur darin, Workloads in die Cloud zu verlagern. Ziel war es, eine wiederholbare Plattformgrundlage zu schaffen, die die Migration bestehender Systeme und die Modernisierung selbstverwalteter Server unterstützt./services/application-modernization-servicesKubernetes-basierte Operationen und Compliance-orientierte Bereitstellung ohne Ausbremsung der Entwicklungsteams waren entscheidend. Die Anforderungen von SOC 2 prägten das Plattformdesign von Anfang an, darunter zentralisierte Protokollierung, verwaltete Identitäten, einheitliche Kennzeichnung, nachvollziehbare Infrastrukturänderungen und der Zugriff auf operative Tools.

Stakeholder-Interview

„Dieses Projekt war eine Herausforderung, da die bestehende IT-Umgebung nicht ausreichend zuverlässig dokumentiert war. Bevor wir den Migrationspfad entwerfen konnten, mussten wir die Server direkt untersuchen, Informationen zu Betriebssystem und Paketen sammeln und ermitteln, welche Dienste für die laufende Software tatsächlich erforderlich waren.“

— Duy Duong, Senior DevOps bei HDWEBSOFT

Die Analysearbeit ging über das Lesen von Diagrammen oder Bereitstellungsdokumenten hinaus. Das Team untersuchte bestehende Linux-Server, erfasste die installierten Pakete, überprüfte laufende Dienste und ermittelte Abhängigkeiten zwischen Infrastrukturkomponenten und Anwendungsverhalten. Jedes Paket und jeder Dienst musste sorgfältig geprüft werden: Wurde er für Produktionsworkloads benötigt, unterstützte er eine operative Abhängigkeit oder stellte er ein unnötiges Wartungs- und Sicherheitsrisiko dar?

Diese Untersuchung trug dazu bei, eine unübersichtliche, selbstverwaltete Umgebung in einen Migrationsplan zu überführen, den die Teams für Entwicklung, Sicherheit und Betrieb prüfen konnten. Zudem wurde das Risiko minimiert, undokumentierte Annahmen in die neue Cloud-Plattform zu übertragen.

Hauptmerkmale

Sichere Hybrid-Cloud-Grundlage

Die verwendete Plattform war [AWS Organizations](/services/aws-amazon-web-servicesUm Management, gemeinsame Plattformdienste, Entwicklung, Produktion und die zentrale Protokollspeicherung zu trennen, wurde eine separate Struktur eingeführt. Diese Struktur half dem Team, die Kontogrenzen klar zu halten und gleichzeitig die unterschiedlichen betrieblichen Anforderungen in den verschiedenen Umgebungen zu erfüllen.

Amazon EKS-Cluster unterstützten Entwicklung, Produktion und gemeinsame Plattformdienste. Entwicklungs-Workloads nutzten eine kostenbewusste Rechenstrategie, während die Produktion auf stabile On-Demand-Kapazität mit Karpenter-basiertem Autoscaling setzte. Gemeinsame Dienste dienten als Plattform-Hub für zentrale Tools.

Das Netzwerk wurde für eine geregelte Verbindung zwischen AWS- und On-Premises-Umgebungen konzipiert. Die Plattform nutzte VPC-Netzwerke, Peering, Direct Connect, NAT-Gateways, Flow-Logs und Sicherheitsbaselines, um hybride Workloads über AWS- und Rechenzentrumsknoten hinweg zu unterstützen.

Identitäts-, Zugriffs- und Geheimnismanagement

Okta fungierte als zentraler Identitätsanbieter für Entwicklungs- und Plattformtools. Es föderierte den Zugriff auf AWS IAM Identity Center, GitHub, Grafana, Datadog, Vault, Rancher, Flux UI, Jenkins und Endpoint-Security-Tools.

HashiCorp Vault bot eine zentrale Geheimnisverwaltung für Entwickler, CI/CD-Pipelines und Kubernetes-Workloads. Vault lief im Hochverfügbarkeitsmodus auf der Shared-Services-Plattform EKS, während der External Secrets Operator genehmigte Geheimnisse in Anwendungs-Namespaces synchronisierte.

Die Plattform nutzte außerdem IAM-Rollen für Servicekonten, um Kubernetes-Workloads detaillierte AWS-Berechtigungen zu erteilen. Dadurch wurde der Bedarf an umfassenden Anmeldeinformationen reduziert und der Zugriff auf Workloads leichter überprüfbar.

GitOps-Anwendungsbereitstellung

FluxCD übernahm die kontinuierliche Abstimmung mit Git. Die Plattform nutzte geschichtete Kustomization-Abhängigkeiten, sodass Infrastruktur, Geheimnisse, Anwendungen, Observability und Sicherheitskomponenten kontrolliert bereitgestellt werden konnten.

Das Flux Image Toolkit automatisierte Image-Tag-Aktualisierungen für ausgewählte Services. Dies half Teams, manuelle Release-Schritte zu reduzieren und gleichzeitig das Bereitstellungsverhalten an geprüfte Änderungen in der Quellcodeverwaltung zu koppeln.

Zu den Kernplattformdiensten gehörten Ingress, DNS-Automatisierung, Zertifikatsverwaltung, Autoscaling, WebRTC TURN-Unterstützung, Observability und Multi-Cluster-Management. Diese Dienste ermöglichten Anwendungsteams einen konsistenten Pfad vom Code bis zur Laufzeit.

CI/CD und Entwicklererfahrung

GitHub Actions nutzten selbstgehostete Runner auf der Shared-Services-Plattform EKS. Die Runner-Kapazität skalierte bedarfsgerecht, inklusive punktueller Kapazität für kostenbewusste Ausführung.

OpenTofu-Workflows unterstützten Planungs- und Anwendungsoperationen pro Infrastruktur-Stack. Kommentare im Pull-Request-Plan, die Erkennung geplanter Abweichungen und Vault-basierte Pipeline-Secrets trugen zu mehr Transparenz und gezielter Planung von Infrastrukturänderungen bei.

Jenkins bot eine zentrale Build-Orchestrierung, während Nexus die Artefaktspeicherung übernahm. Dadurch konnte die Plattform sowohl moderne Cloud-native Bereitstellung als auch bestehende Build-Prozesse während der Modernisierung unterstützen.

Observability und Sicherheitsbetrieb

Der Observability-Stack kombinierte Grafana, Loki, Alloy, Datadog und Alarmierungs-Workflows. Dies ermöglichte den Ingenieuren einen besseren Überblick über Cloud-, Kubernetes- und Hybridinfrastrukturebenen.

Der Endpunktschutz CrowdStrike Falcon wurde in EKS-Clustern implementiert, während AWS GuardDuty die Bedrohungserkennung in der Cloud ergänzte. Diese Maßnahmen halfen dem Kunden, seine Sicherheitslage zu verbessern und gleichzeitig die SOC-2-Compliance-Anforderungen zu erfüllen.

Technische Herausforderungen

Koordination mehrerer Automatisierungsebenen

Die Plattform umfasste Infrastruktur als Code, GitOps, Konfigurationsmanagement, CI/CD, Geheimnismanagement und Sicherheitsautomatisierung. Diese Ebenen mussten über mehrere Repositories hinweg reibungslos zusammenarbeiten, ohne versteckte Abhängigkeiten oder unklare Zuständigkeiten zu erzeugen.

Verwaltung mehrerer Umgebungen im großen Maßstab

Entwicklungs-, Produktions-, Shared-Services-, zentralisierte Protokollierungs- und Managementkonten hatten jeweils unterschiedliche Anforderungen. Die Herausforderung bestand darin, Zugriffs-, Tagging-, Netzwerk-, Protokollierungs- und Bereitstellungsregeln konsistent zu halten, ohne die Plattform für die Entwicklungsteams zu unflexibel zu gestalten.

Verwaltung von Hybrid-Cloud-Operationen

Die Modernisierung umfasste sowohl AWS- als auch On-Premises-Rechenzentrumsworkloads. Die Unterstützung von EKS, Proxmox, Rancher-verwalteten Clustern und älteren Betriebsmustern erforderte eine sorgfältige Integration zwischen [Cloud-Netzwerk](/services/cloud-software-development-servicesIdentität, Bereitstellung und Überwachung.

Reduzierung von Dokumentations- und Bestandsabweichungen

Legacy-Systeme führen häufig zu einer Diskrepanz zwischen Dokumentation und tatsächlicher Ausführung. Der Kunde benötigte Git-basierte Definitionen, automatisierte Prüfungen und wiederholbare Bereitstellung, um die Verständlichkeit der Plattform bei Änderungen zu gewährleisten.

Ausgewogenes Verhältnis von Kosten, Zuverlässigkeit und Stabilität

Das Team musste die Rechenkosten optimieren, ohne die Produktionszuverlässigkeit zu beeinträchtigen. Dies erforderte eine praktikable Kapazitätsstrategie für punktuelle Workloads, bedarfsgerechte Produktionskapazität, Autoscaling-Regeln und betriebliche Sicherheitsvorkehrungen.

Unterstützung der SOC-2-Konformität bei schnellen Änderungen

Die Plattform musste die Anforderungen der SOC-2-Konformität erfüllen.https://www.aicpa-cima.com/topic/audit-assurance/audit-and-assurance-greater-than-soc-2/) und ermöglichte gleichzeitig schnelle Auslieferungen durch die Teams. Infrastrukturänderungen, Zugriffsabläufe, die Verwendung von Geheimnissen und operative Ereignisse mussten nachvollziehbar und kontrolliert sein. Die Plattform benötigte zudem konsistente Nachweise für Audits, darunter Änderungshistorie, Zugriffskontrollprotokolle, zentralisierte Protokolle und Ergebnisse der Abweichungserkennung.

Lösungen

Klare Trennung der Zuständigkeiten

HDWEBSOFT trug zur Trennung der Plattformverantwortlichkeiten über die Ebenen Infrastruktur, Geheimnisse, Workloads, Observability und Sicherheit hinweg bei. Dokumentierte Integrationsverträge erleichterten es den Teams, zu verstehen, welches System für welchen Teil des Auslieferungsprozesses zuständig war.

Modulare Infrastruktur als Code

OpenTofu-Stacks waren um isolierte Zustandsgrenzen und automatisierte CI-Gates herum organisiert. Kommentare im Pull-Request-Plan halfen den Reviewern, Infrastrukturänderungen vor der Genehmigung zu verstehen, während die geplante Abweichungserkennung Unterschiede zwischen deklarierter und tatsächlicher Infrastruktur hervorhob.

Mehrschichtige GitOps-Abstimmung

FluxCD war mit expliziten Abhängigkeiten zwischen den Plattformebenen organisiert. Dies reduzierte das Rollout-Risiko und vereinfachte die Wiederherstellung, da Änderungen über Git überprüft, angewendet, rückgängig gemacht und nachverfolgt werden konnten.

Einheitliche Identitäts- und Zugriffsverwaltung

Die Okta SSO-Federation bot Entwicklern und Betreibern ein zentralisiertes Zugriffsmodell für Cloud- und Plattform-Tools. AWS IAM Identity Center, Vault, GitHub, Grafana, Datadog, Rancher, Jenkins und andere Systeme konnten ein einheitlicheres Identitätsmuster verwenden.

Kostenbewusstes Kubernetes-Plattformdesign

Karpenter unterstützte die Plattform bei der Anpassung der Rechenkapazität an die Workload-Anforderungen. Entwicklungs-Workloads konnten kostenbewusste Kapazität nutzen, während die Produktion die Zuverlässigkeitsanforderungen erfüllte.

Vault-basierte CI/CD-Pipelines

CI/CD-Workflows nutzten die Vault-basierte Authentifizierung für sensible Pipeline-Operationen. Dies ermöglichte eine sicherere Infrastrukturbereitstellung, ohne weitreichende, langfristige Geheimnisse für Build-Systeme preiszugeben.

Geschäftsergebnisse

Sicherere und schnellere Bereitstellung

Durch Pull Requests geprüfte OpenTofu-Pläne, GitOps-Abgleich und die automatisierte Drift-Erkennung ermöglichten gezieltere und nachvollziehbarere Infrastrukturänderungen. Entwickler konnten Umgebungen aus Git reproduzieren, über die Quellcodeverwaltung zurückrollen und Probleme anhand einer übersichtlicheren Änderungshistorie diagnostizieren.

Stärkere Sicherheit und SOC-2-Konformität

Zentralisiertes SSO, kontrollierter AWS-Zugriff, Vault-basierte Geheimnisverwaltung, Endpunktschutz, zentrale Protokollierung, Sicherheitsüberwachung und Git-basierte Infrastrukturaufzeichnungen halfen der Plattform, die SOC-2-Konformitätsanforderungen zu erfüllen und gleichzeitig die tägliche Entwicklungsarbeit zu unterstützen.

Bessere Kostenkontrolle ohne Einbußen bei der Zuverlässigkeit

Karpenter und umgebungsspezifische Kapazitätsstrategien halfen dem Kunden, die Rechennutzung zu optimieren. Entwicklungs-Workloads konnten kostenbewusste Infrastruktur nutzen, während Produktions-Workloads die für den Callcenter-Betrieb notwendige Stabilität beibehielten.

Verbesserte Überwachung und Reaktion auf Sicherheitsvorfälle

Grafana, Loki, Alloy, Datadog, GuardDuty und Endpoint-Sicherheitswarnungen ermöglichten den Teams einen besseren Überblick über die Cloud- und Hybridinfrastruktur. Dadurch konnten sie Plattformprobleme besser erkennen, untersuchen und darauf reagieren.

Modernisierte Plattformgrundlage

Das Projekt schuf eine solidere Grundlage für die Migration bestehender Infrastrukturen./services/application-modernization-services), selbstverwaltete Servermodernisierung, Cloud-Betrieb und zukünftige DevOps-Automatisierung. Anstatt sich auf unzusammenhängende Betriebsprozesse zu verlassen, erhielt der Kunde ein besser gesteuertes Plattformmodell für die sichere Bereitstellung von Callcenter-Dienstleistungen.

Fazit

Dieses [DevOps-Modernisierungsprojekt](/services/devops-servicesHDWEBSOFT unterstützte ein US-amerikanisches Callcenter-Technologieunternehmen bei der Migration von einer veralteten, selbstverwalteten Infrastruktur zu einer sicheren Hybrid-Cloud-Plattform. Durch die Kombination von AWS, Kubernetes, GitOps, zentralisierter Identitätsverwaltung, Geheimnismanagement, Observability, Sicherheitskontrollen und einer Compliance-orientierten Plattform-Governance ermöglichte HDWEBSOFT ein schnelleres, besser auditierbares und SOC-2-konformes Bereitstellungsmodell.

Wenn Ihr Team seine bestehende Infrastruktur modernisiert oder eine sichere Cloud-Plattform für die auditfähige Bereitstellung vorbereitet, informieren Sie sich über die DevOps-Services von HDWEBSOFT./services/devops-services) oder kontaktieren Sie uns um die richtige Plattform-Roadmap zu besprechen.

Verwandte Inhalte entdecken

Sehen Sie weitere Fallstudien, Services, Branchen und passende regionale Expertise.