카테고리 없음

[K8S] Kubeflow란 무엇일까?

순제로 2025. 7. 20. 00:02
728x90

카카오클라우드 서비스 중 AI 서비스로 Kubeflow를 확인할 수 있다.

쿠버네티스와 머신러닝, 둘 다 익숙하지 않다면 Kubeflow(큐브플로우)라는 이름 자체가 낯설 수 있다.

카카오클라우드 환경에서의 Kubeflow 개념부터 활용까지 알아보자

 

1. Kubeflow란 무엇인가?

Kubeflow는 쿠버네티스(Kubernetes) 환경에서 머신러닝 파이프라인을 손쉽게 구축/관리할 수 있는 플랫폼이다.

핵심 목표: 머신러닝을 쿠버네티으 위에서 쉽게 돌리기

 

주요 특징

Jupyter Notebook, 데이터/모델/아티팩트 관리, 파이프라인 자동화 등 머신러닝 실무에 필요한 모든 워크플로우 제공

빠른 테스트 -> 실전 운영까지 "일과노딘 환경, 자동화" 보장

 

2. 카카오클라우드에서 Kubeflow를 쓰는 이유

클릭 몇 번으로 쿠버네티스 클러스터와 Kubeflow 환경을 구축

관리형 Jupyter Notebook, PVC(데이터 저장소) 할당, 파이프라인 실행 등 머신러닝 전 과정을 "클라우드에서 즉시" 수행 가능

스케일 아웃, 각종 인증 및 보안 설정을 기본 제공

 

3. 카카오클라우드 Kubeflow 주요 기능

기능 설명
Jupyter Notebook 웹에서 코드 작성/실행, 라이브러리 설치, 직관적 데이터 분석
PVC(볼륨) 관리 데이터/모델/아티팩드 등 실습에 필요한 스토리지 손쉽게 할당
파이프라인 단계별 ML 워크플로우를 '자동화 그래프;로 구성, 재사용 용이
실험(Experiment) 하이퍼파라미터 튜닝, 다양한 실험 기록 및 관리
모델 관리/배포 학습 모델 버전 관리, REST API로 온라인 서빙 가능
팀/사용자 관리 클러스터 내부에서 워크스페이스/권한 분리 지원

 

4. 카카오클라우드 Kubeflow 시작 절차

1) 클러스터 생성

- 카카오클라우드 콘솔 > Container Pack > Kubernetes Engine > 클러스터 생성

 

2) Kubeflow 환경 활성화

- Kubeflow 솔루션 배포: [Container Pack > Kubeflow]에서 한 번에 설치 가능

 

3) Jupyter Notebook 서버 생성

- Kubeflow 대시보드 > Notebook > 'New Server' 클릭

 

4) 머신러닝 파이프라인 실습

- 실습 데이터/코드 업로드

- Kubeflow Pipelines 메뉴에서 파이프라인 설계 및 실행

 

5. 실무 예시: 트래픽 예측 모델 튜토리얼

[공통 시나리오]

- 실습용 PVC 3개 생성: dataset-pvc / model-pvc / artifact-pvc

- 각각 Jupyter Notebook 내에서 /home/jovyan/{dataset, modeels, artifacts} 등에 마운트

- 데이터 다운로드 -> 모델 학습 -> 자동화 파이프라인 구축 -> 결과 저장

 

index | 카카오클라우드

클라우드에서 GPU 환경을 구축하여 활용하기 위한 다양한 사용 예제를 제공합니다.

docs.kakaocloud.com

 

6. Kubeflow 적용의 장점

머신러닝 개발,관리,운영이 일관된 환경에서 통합

PVC 활용으로 데이터 손실 걱정 없이 반복 실험/배포

파이프라인 재사용/자동화로 "재현/협업"까지 한 번에 가능

 

7. 추가 정보

5번 트래픽 예측 모데 튜토리얼은 CPU 노드풀로도 충분히 실습 가능

파이프라인, 모델서빙, Notebooks 활용법 등은 튜토리얼/공식 블로그를 참고하면 실습이 쉬움

 

8. 마무리

카카오클라우드의 Kubeflow는 쿠버네티스 기반에서 머신러닝 실험/자동화부터 모델 서비스/협업까지 통합적으로 다루는 [클라우드 ML 올인원 환경]이다.

728x90