오픈소스 AI 도구 · 2026
SadTalker 완전 정리 — 무료 요금제부터 데스크탑 설치법까지
사진 한 장과 음성 파일만 있으면 말하는 영상이 만들어집니다. 그것도 완전 무료로.
왜 SadTalker인가
AI 영상 제작 파이프라인을 꾸리다 보면 립싱크 단계에서 항상 비용 문제가 발목을 잡아요. HeyGen은 월 29달러, D-ID도 크레딧이 금방 소진되거든요. 그런데 SadTalker는 다릅니다. GitHub에 올라온 완전 오픈소스 프로젝트라서, 내 PC에 한 번 설치해두면 이후 사용료가 전혀 없어요. 실제로 RTX 3060 기준으로 30초짜리 말하는 영상을 25초 만에 뽑아냈을 때 솔직히 놀랐습니다. 월정액 도구들과 품질 차이가 거의 없거든요.
무료 요금제 비교
플랫폼마다 무료 한도가 다르게 설정되어 있어요. 로컬 설치는 하드웨어만 받쳐준다면 진짜 무제한이고, Hugging Face 데모는 큐 대기가 좀 있지만 하루 3~5분 분량은 무료로 쓸 수 있어요. Google Colab은 세션당 10분으로 테스트용으로 딱 적당합니다.
플랫폼별 무료 한도 비교
| 플랫폼 | 무료 한도 | 주요 제한 | 유료 업그레이드 |
|---|---|---|---|
| 로컬 데스크탑 | 무제한 | 하드웨어 의존 | 없음 |
| Google Colab | 10분/세션 | 런타임 12시간 | $9.99/월 |
| Hugging Face | 3~5분/일 | 큐 대기 5~10분 | $9/월 |
| a1.art | 5크레딧/일 | 워터마크 | $4.99/월 |
시스템 요구사항
Windows 10 이상, Python 3.8~3.10.6 환경이 기본이에요. RAM은 최소 8GB지만 16GB 이상을 권장하고, GPU는 NVIDIA RTX 계열에 VRAM 4GB 이상이면 돌아갑니다. 저장공간은 모델 체크포인트 포함해서 약 5GB를 확보해두세요.
Windows 설치 단계
choco install ffmpegpython app.py 실행 후 브라우저에서 127.0.0.1:7860 접속단계별 예상 소요 시간
| 단계 | 작업 내용 | 예상 시간 |
|---|---|---|
| 1~3단계 | Python · Git · FFmpeg 설치 | 약 10분 |
| 4단계 | 저장소 클론 | 약 2분 |
| 5~6단계 | 가상환경 · 의존성 설치 | 10~15분 |
| 7단계 | 체크포인트 다운로드 | 5~10분 |
| 8단계 | 앱 실행 | 즉시 |
핵심 설정 & 트러블슈팅
웹UI에서 이미지는 512×512 얼굴 사진, 오디오는 WAV 또는 MP3(10MB 이하)를 올리면 돼요. Face3D는 512로 설정해야 품질이 확실히 올라가고, 사진 소스라면 Still Mode를 켜서 몸 흔들림을 최소화하는 게 좋아요. 가장 자주 만나는 오류는 Gradio 버전 충돌인데, pip install gradio==3.50.0 한 줄로 해결됩니다. FFmpeg PATH 문제로 출력 영상이 안 보이는 경우엔 환경변수에 ffmpeg 경로를 직접 추가해주세요.


AI 립싱크 도구 5종 완벽 비교 — D-ID·HeyGen·Hedra·Pika·VisionStory