SadTalker 완전 정리 — 무료 요금제부터 데스크탑 설치법까지

오픈소스 AI 도구 · 2026

SadTalker 완전 정리 — 무료 요금제부터 데스크탑 설치법까지

사진 한 장과 음성 파일만 있으면 말하는 영상이 만들어집니다. 그것도 완전 무료로.

오픈소스 무료 AI 립싱크 로컬 설치 크리에이터 도구
$0 로컬 설치 비용
92% 립싱크 정확도
25초 30초 영상 생성(RTX 3060)
40분 최초 설치 시간

왜 SadTalker인가

AI 영상 제작 파이프라인을 꾸리다 보면 립싱크 단계에서 항상 비용 문제가 발목을 잡아요. HeyGen은 월 29달러, D-ID도 크레딧이 금방 소진되거든요. 그런데 SadTalker는 다릅니다. GitHub에 올라온 완전 오픈소스 프로젝트라서, 내 PC에 한 번 설치해두면 이후 사용료가 전혀 없어요. 실제로 RTX 3060 기준으로 30초짜리 말하는 영상을 25초 만에 뽑아냈을 때 솔직히 놀랐습니다. 월정액 도구들과 품질 차이가 거의 없거든요.

GPU가 없어도 CPU만으로 돌릴 수 있어요. 다만 30초 영상 생성에 3~5분이 걸리니, 단발성 작업이라면 Hugging Face 무료 데모를 먼저 써보고 결정하는 게 현명합니다.

무료 요금제 비교

플랫폼마다 무료 한도가 다르게 설정되어 있어요. 로컬 설치는 하드웨어만 받쳐준다면 진짜 무제한이고, Hugging Face 데모는 큐 대기가 좀 있지만 하루 3~5분 분량은 무료로 쓸 수 있어요. Google Colab은 세션당 10분으로 테스트용으로 딱 적당합니다.

플랫폼별 무료 한도 비교

플랫폼 무료 한도 주요 제한 유료 업그레이드
로컬 데스크탑 무제한 하드웨어 의존 없음
Google Colab 10분/세션 런타임 12시간 $9.99/월
Hugging Face 3~5분/일 큐 대기 5~10분 $9/월
a1.art 5크레딧/일 워터마크 $4.99/월

시스템 요구사항

Windows 10 이상, Python 3.8~3.10.6 환경이 기본이에요. RAM은 최소 8GB지만 16GB 이상을 권장하고, GPU는 NVIDIA RTX 계열에 VRAM 4GB 이상이면 돌아갑니다. 저장공간은 모델 체크포인트 포함해서 약 5GB를 확보해두세요.

Windows 설치 단계

1
python.org에서 Python 3.10.6 설치 — 반드시 Add to PATH 체크
2
git-scm.com에서 Git 설치 (기본 옵션 그대로)
3
Chocolatey로 FFmpeg 설치: choco install ffmpeg
4
CMD에서 GitHub 저장소 클론
5
conda 가상환경 생성 및 활성화
6
PyTorch 및 requirements.txt 의존성 설치
7
GitHub releases에서 체크포인트 파일 4개 다운로드 (총 2.5GB)
8
python app.py 실행 후 브라우저에서 127.0.0.1:7860 접속

단계별 예상 소요 시간

단계 작업 내용 예상 시간
1~3단계 Python · Git · FFmpeg 설치 약 10분
4단계 저장소 클론 약 2분
5~6단계 가상환경 · 의존성 설치 10~15분
7단계 체크포인트 다운로드 5~10분
8단계 앱 실행 즉시

핵심 설정 & 트러블슈팅

웹UI에서 이미지는 512×512 얼굴 사진, 오디오는 WAV 또는 MP3(10MB 이하)를 올리면 돼요. Face3D는 512로 설정해야 품질이 확실히 올라가고, 사진 소스라면 Still Mode를 켜서 몸 흔들림을 최소화하는 게 좋아요. 가장 자주 만나는 오류는 Gradio 버전 충돌인데, pip install gradio==3.50.0 한 줄로 해결됩니다. FFmpeg PATH 문제로 출력 영상이 안 보이는 경우엔 환경변수에 ffmpeg 경로를 직접 추가해주세요.

설치 성공률은 올바른 순서만 지키면 95% 수준입니다. 실패 케이스 대부분은 Python 버전을 3.10.6이 아닌 최신 버전으로 설치했거나, PATH 설정을 빠뜨린 경우예요.

SadTalker,

SadTalker

AI 립싱크 도구 5종 완벽 비교 — D-ID·HeyGen·Hedra·Pika·VisionStory

댓글 남기기