반응형
AWS DataSync는 AWS에서 제공하는 데이터 전송 서비스로, 온프레미스 데이터센터, 네트워크 파일 시스템(NFS), SMB 파일 서버, 또는 AWS 서비스 간에 데이터를 안전하고 빠르게 복사하거나 이동할 수 있도록 지원합니다. 데이터 마이그레이션, 백업, 동기화 등의 작업을 간소화하고, 효율적인 데이터 전송을 제공합니다.
주요 기능
- 고속 데이터 전송
- 데이터를 병렬 처리 방식으로 전송하여 일반적인 오픈 소스 도구보다 빠르게 복사.
- 네트워크 대역폭을 최적화하고 암호화를 적용해 전송.
- 다양한 소스 및 대상 지원
- 소스:
- 온프레미스 NFS 및 SMB 파일 서버
- 객체 스토리지 (S3 호환)
- AWS EFS (Elastic File System)
- 대상:
- Amazon S3
- Amazon EFS
- Amazon FSx (Windows File Server, Lustre 등)
- 소스:
- 증분 데이터 전송
- 변경된 데이터만 전송하여 속도와 비용 효율성을 높임.
- 암호화 및 보안
- 데이터 전송 중 TLS 암호화를 적용.
- AWS Identity and Access Management(IAM)으로 액세스 제어.
- 자동화
- 정기적인 동기화 작업을 스케줄링 가능.
- 클라우드 워크로드와의 통합으로 데이터 파이프라인 구축.
- 모니터링
- AWS CloudWatch와 통합하여 전송 작업 상태를 실시간으로 모니터링.
AWS DataSync의 사용 사례
- 데이터 마이그레이션
- 온프레미스 파일 시스템을 AWS S3, EFS, 또는 FSx로 이동.
- 클라우드로 애플리케이션을 이전하거나 하이브리드 환경 구축.
- 백업 및 복구
- 데이터를 정기적으로 클라우드에 백업.
- 고가용성을 위해 원격지 복제를 구성.
- 데이터 아카이빙
- 온프레미스 데이터를 S3 Glacier로 이동해 장기 보관 비용 절감.
- 하이브리드 클라우드 운영
- 온프레미스와 AWS 간 데이터를 동기화하여 하이브리드 클라우드 환경 구축.
- 빅데이터 분석
- 데이터를 빠르게 AWS로 전송해 분석 서비스와 통합.
AWS DataSync의 구성 요소
- 에이전트(Agent)
- 온프레미스 또는 소스 환경에 배포해 데이터 전송 작업을 수행.
- VMware, Hyper-V, KVM 등의 가상 머신(VM) 환경에서 실행.
- 작업(Task)
- 데이터 전송 작업 단위를 정의.
- 소스, 대상, 전송 설정 등을 포함.
- 네트워킹
- 인터넷 또는 AWS Direct Connect를 통해 데이터를 전송.
- 네트워크 속도와 안정성을 보장.
- CloudWatch
- 작업 진행 상황, 성능 메트릭, 오류 상태를 모니터링.
AWS DataSync의 작동 원리
- 에이전트 설치
- 온프레미스 환경에 DataSync Agent를 설치하고 AWS에 등록.
- 작업(Task) 생성
- DataSync 콘솔에서 작업 생성:
- 소스와 대상 정의
- 전송 속도 제어 및 필터링 설정
- CLI 또는 SDK를 통해 작업 생성도 가능.
- DataSync 콘솔에서 작업 생성:
- 데이터 전송
- 병렬 처리와 네트워크 최적화를 통해 데이터 전송.
- 전송 중 데이터 암호화(TLS) 적용.
- 전송 완료 및 모니터링
- 데이터 전송 결과와 통계 정보를 AWS Management Console 또는 CloudWatch에서 확인.
AWS DataSync의 장점
- 효율적인 전송
- 대량의 데이터를 빠르고 안전하게 클라우드로 이동.
- 비용 효율성
- 사용한 전송 데이터와 작업량에 기반한 요금.
- 유연성
- 다양한 소스와 대상 지원, 네트워크 제약에도 최적화된 전송.
- 보안성
- 암호화된 데이터 전송과 IAM 기반의 세밀한 접근 제어.
- 관리 편의성
- 스케줄링과 자동화로 반복적인 작업 최소화.
AWS DataSync 요금
- 요금은 전송된 데이터 양(GB) 기반으로 부과됩니다.
- 추가 요금:
- S3, EFS, FSx 등 서비스에 데이터를 저장할 때의 저장 비용.
- AWS Direct Connect 또는 인터넷 대역폭 비용.
예제: DataSync를 이용한 파일 서버 -> S3 전송
- DataSync 에이전트 배포
- VMware 환경에서 가상 머신으로 에이전트 설치.
- AWS DataSync 콘솔에서 활성화 코드 등록.
- 작업 생성
- aws datasync create-task \ --source-location-arn "arn:aws:datasync:source" \ --destination-location-arn "arn:aws:datasync:destination" \ --name "OnPremToS3Backup"
- 작업 실행
- aws datasync start-task-execution \ --task-arn "arn:aws:datasync:task:12345"
- 작업 상태 확인
- aws datasync describe-task-execution \ --task-execution-arn "arn:aws:datasync:task-execution:67890"
결론
AWS DataSync는 데이터 마이그레이션 및 동기화를 위한 강력하고 간편한 솔루션입니다. 특히, 대량의 데이터를 효율적으로 처리하고 네트워크와 보안을 최적화하는 데 적합하며, 데이터 전송 작업을 자동화하여 운영 부담을 줄일 수 있습니다.
반응형