제품 가이드

AI 더빙 영상 다운로드 방법: 단계별 가이드 (MP4, MP3, SRT)

마지막 업데이트

2026년 5월 12일

Written By

배운태

그로스 총괄 & 프로덕트 오너

요약하기

Chat GPT

Perplexity

Claude

Gemini

Grok

섹션으로 이동

요약하기

Chat GPT

Perplexity

Claude

Gemini

Grok

AI 더빙, 영상 번역, 음성 번역, 립싱크

무료로 사용해보기

Perso Dubbing은 단순히 더빙된 비디오뿐만 아니라, 단 하나의 더빙 프로젝트에서 다운로드 가능한 10개의 파일을 제공합니다. 더빙된 MP4, 소스 및 번역된 오디오 트랙(WAV), 화자별로 분리된 오디오(TAR), 서브 BGM만 추출한 오디오(WAV), 소스 및 번역된 자막(SRT), 그리고 이중 언어 대본(XLSX)을 모두 받으실 수 있습니다. 모든 파일은 월 $6.99의 스타터(Starter) 요금제부터 제공됩니다. 이 가이드에서는 각 파일이 어떤 것인지, 언제 사용해야 하는지, 그리고 다운로드하는 방법을 설명합니다.

수치로 보는 혜택: 모든 AI 더빙 플랫폼은 더빙된 비디오를 내보냅니다. 일부 플랫폼은 자막과 오디오 트랙도 내보낼 수 있습니다. 하지만 Perso Dubbing은 개별 배경 음악, 이중 언어 XLSX 대본, 화자별 분리 오디오를 포함하여 모든 더빙 프로젝트에서 10가지 파일 유형을 내보내며, 이 모든 기능은 엔터프라이즈 제한이나 추가 비용 없이 월 $6.99의 스타터 요금제부터 이용할 수 있습니다.

더빙 후 Perso Dubbing에서 내보낼 수 있는 파일은 무엇인가요?

다음은 Perso Dubbing 더빙 프로젝트를 마친 후 다운로드할 수 있는 전체 파일 목록입니다:

#	파일	형식	내용	이용 가능 요금제
1	더빙 비디오 내보내기	MP4	번역된 음성, 립싱크 및 원본 영상이 포함된 전체 비디오	스타터 (월 $6.99)
2	소스 오디오 내보내기	WAV	업로드한 비디오에서 추출한 원본 오디오 트랙	스타터
3	소스 오디오 (화자별)	TAR	원본에서 감지된 각 화자별로 분리된 개별 오디오 파일	스타터
4	번역 오디오 내보내기	WAV	더빙된 음성 오디오만 제공 (비디오 없음, 배경 음악 없음)	스타터
5	번역 오디오 (배경 음악 포함)	WAV	원본 배경 음악이 믹싱된 더빙 음성 오디오	스타터
6	BGM 내보내기	WAV	목소리가 완전히 제거되고 독립적으로 추출된 배경 음악	스타터
7	소스 자막	SRT	원본 언어로 자동 생성된 자막	스타터
8	번역 자막	SRT	더빙된 오디오 타이밍에 싱크를 맞춘 타겟 언어 자막	스타터
9	소스 대본	XLSX	스프레드시트 형식으로 변환된 원본 오디오의 전체 음성-텍스트 변환	스타터
10	소스 및 번역 대본	XLSX	한눈에 볼 수 있는 이중 언어 대본 — 병렬 열로 나열된 원본 및 번역 텍스트	스타터

Perso Dubbing은 이 10가지 파일을 모두 자동으로 생성합니다. 추가 기능 구매, 추가 크레딧, 별도의 도구는 필요하지 않습니다. 하나의 더빙 프로젝트에서 10개의 결과물을 제공합니다.

단 한 번의 더빙으로 제공받는 모든 파일 확인하기

1. 더빙 비디오 내보내기 (MP4)

정의: 최종 더빙 비디오로, 원본 오디오 대신 번역된 음성으로 대체된 원본 영상입니다. 음성 클로닝 기술을 통해 원본 화자의 톤, 속도, 억양을 그대로 유지합니다. 립싱크는 자동으로 적용됩니다.

사용 시기:

더빙된 버전을 YouTube, TikTok 또는 LMS에 직접 게시할 때
다양한 시장을 위한 랜딩 페이지나 제품 페이지에 삽입할 때
배포하기 전 관계자들과 검토용으로 공유할 때

차별점: 립싱크는 Perso Dubbing 더빙 워크플로우의 선택형 단계로, 사용자가 프로젝트에 필요한지 여부를 고르면 결과물이 하나의 MP4 파일로 제공됩니다. 그러나 진짜 핵심은 품질입니다. 대부분의 경쟁 제품은 립싱크를 제공하지만 입 모양이 어색하게 틀어지거나 화면이 끊기고 기계적인 움직임을 보여 몰입을 방해합니다. Perso Dubbing의 립싱크는 면밀히 살펴보아도 어색하지 않도록 정확한 입 모양, 자연스러운 전환, 방송 품질의 결과물을 보장하도록 설계되었습니다.

2. 소스 오디오 내보내기 (WAV)

정의: 업로드한 비디오에서 고품질 WAV 파일로 추출한 원본 오디오 트랙입니다.

사용 시기:

더빙하기 전에 깨끗한 원본 오디오를 아카이브로 보관할 때
다른 편집 프로젝트(Premiere Pro, DaVinci Resolve, Final Cut 등)에서 원본 음성을 사용할 때
원본 오디오와 더빙 오디오의 품질을 나란히 놓고 비교할 때

3. 화자별 소스 오디오 (TAR)

정의: 원본 비디오에서 감지된 각 화자별 개별 오디오 파일이 담긴 압축 파일입니다. 비디오에 3명의 화자가 있다면 3개의 개별 WAV 파일을 받게 됩니다.

사용 시기:

화자별로 볼륨이나 EQ를 개별적으로 조정해야 하는 팟캐스트 편집자
다른 사람은 그대로 두고 한 화자만 다시 녹음해야 하는 인터뷰 비디오
각 화자의 목소리가 올바르게 클로닝되었는지 다중 화자 QA를 진행할 때

차별점: 화자 분리 오디오는 일반적으로 Descript나 Adobe Podcast 같은 전용 도구가 필요합니다. 하지만 Perso Dubbing은 모든 더빙 프로젝트에서 이를 자동으로 포함하여 제공합니다. 더 자세한 내용은 '비디오에서 화자별로 분리된 오디오를 내보내는 방법'을 참조하세요.

4. 번역 오디오 내보내기 (WAV)

정의: 비디오와 배경 음악 없이 번역된 목소리 트랙만 포함된 더빙 음성 오디오입니다.

사용 시기:

팟캐스트 현지화: 다른 언어로 오디오 전용 버전을 게시할 때
사용자 정의 사후 편집을 위해 고유한 편집 프로그램(Premiere, Final Cut 등) 타임라인에서 오디오만 교체할 때
라디오, 사내 교육 오디오 또는 오디오북 스타일의 음성 전용 고지를 배포할 때

꿀팁: 고유한 영상 편집기(NLE)로 다시 편집하는 경우, 번역 오디오(배경 음악 없음)와 BGM 추출 파일을 각각 따로 다운로드하세요. 이렇게 하면 목소리와 배경 음악 사이의 믹싱 비율을 완벽하게 조절할 수 있습니다. 자세한 작업 과정은 '비디오 없이 더빙 오디오 다운로드하는 방법'을 참조하세요.

5. 번역 오디오(배경 음악 포함) (WAV)

정의: 원본 배경 음악과 더빙된 음성이 함께 믹싱되어 비디오 없이도 완전한 오디오 트랙으로 바로 사용할 수 있는 상태입니다.

사용 시기:

팟캐스트, 사내 소통, 오디오 뉴스레터 등 완전하게 "제작된" 사운드가 필요한 오디오 중심 배포 시

빠른 작업: 직접 믹싱할 필요 없이 배경 음악 밸런스가 이미 조절되어 있습니다
배경 음악을 유지한 소셜 미디어용 오디오 클립을 제작할 때

6. BGM 내보내기 (WAV)

정의: 원본 비디오에서 보컬 영역을 완전히 제거하고 추출한 고유한 배경 음악으로, 깨끗한 악기 트랙만 남습니다.

사용 시기:

DAW 나 영상 편집기에서 원하는 비율로 더빙 음성과 배경 음악을 재믹싱할 때
홍보용 클립, 예고편, 하이라이트 영상에 원본 배경 음악을 사용할 때
AI가 음성과 음악을 올바르게 분리했는지 확인할 때 (QA 단계)

차별점: 다른 AI 더빙 플랫폼은 BGM을 별도로 내보내지 않습니다. Perso Dubbing의 오디오 분리 엔진은 처리 과정에서 보컬과 배경 음악을 개별적으로 떼어내어 각각 다운로드할 수 있게 해줍니다. 자세한 내용은 'AI로 비디오에서 배경 음악을 추출하는 방법'을 읽어보세요.

7. 소스 자막 (SRT)

정의: 비디오의 원본 언어로 자동 생성되어 추출된 표준 SRT 파일입니다. Perso Dubbing의 음성 인식 기술은 음성-텍스트 변환을 위해 100개 이상의 언어를 지원합니다.

사용 시기:

YouTube나 Vimeo의 원본 비디오에 자막을 추가할 때
기존 콘텐츠의 접근성 지침(ADA, WCAG) 준수가 필요할 때
SRT 자막을 다른 번역 도구나 작업 환경에 입력할 때
SEO: YouTube에 SRT를 업로드하면 원본 언어로 검색 및 노출이 원활해집니다

형식 상세: 시퀀스 번호, 타임스탬프(HH:MM:SS,mmm) 및 자막 텍스트가 포함된 표준 SRT 포맷입니다. YouTube, Vimeo, Premiere Pro, Final Cut, DaVinci Resolve 등 모든 주요 비디오 플랫폼과 호환됩니다. 상세한 SRT 작업 절차는 '비디오에서 자동으로 SRT 자막을 만드는 방법'을 확인하세요.

8. 번역 자막 (SRT)

정의: 원본 말하기 타이밍이 아닌, 더빙 오디오의 흐름에 맞춰 타겟 언어로 실시간 동기화된 자막 파일입니다.

사용 시기:

다국어 배포: YouTube에 소스 자막과 번역 자막을 다중 자막 트랙으로 업로드할 때
타겟 시장 사용자를 위한 콘텐츠 접근성을 확보할 때
FFmpeg 이나 사용 중인 편집 프로그램으로 자막을 동영상에 완전히 입히는(Burn-in) 인코딩 작업을 할 때

경쟁 제품과의 주요 차이점: 많은 자막 번역 도구들이 번역된 텍스트 자체는 잘 만들어내지만, 더빙된 음성의 템포에 맞춰 싱크를 재조정하지는 않습니다. Perso Dubbing의 번역된 SRT는 실제 더빙된 음성에 동기화되어 원본 대사가 나오던 타이밍이 아닌, 더빙 목소리가 출력되는 올바른 순간에 자막이 화면에 표시됩니다.

9. 소스 대본 (XLSX)

정의: 스프레드시트 형태로 변환된 원본 비디오의 전체 음성-텍스트 변환 파일입니다. 각 행은 구간별로 매칭되며 타임스탬프, 화자 표시, 변환된 텍스트 열로 구성됩니다.

사용 시기:

콘텐츠 재가공: 동영상 스크립트를 블로그 포스트, 소셜 미디어 설명글 또는 뉴스레터 복사본으로 전환할 때
원본 녹음본에서 실제로 사용된 대사의 법적/규정 준수 여부를 검토할 때
검색 가능한 아카이브 구축: XLSX는 아주 쉽게 검색, 정렬 및 필터링할 수 있습니다

10. 소스 및 번역 대본 (XLSX)

정의: 원본 텍스트와 번역된 텍스트가 좌우로 나란히 배치된 이중 언어 스프레드시트입니다. 각 행에는 동일한 구간의 두 언어가 타임스탬프 및 화자 구분값과 함께 표시됩니다.

사용 시기:

번역 QA: 검토자가 여러 파일을 왔다 갔다 교체하지 않고도 라인별로 편하게 교차 검수를 할 수 있습니다
언어 학습 콘텐츠 제작: 교육자가 이중 언어 스크립트를 학습 자료로 유용하게 사용합니다
현지화 팀과의 협업: 프로젝트 매니저가 Perso Dubbing 계정이 없는 각 로컬 검토진에게 이 XLSX 문서를 전달하여 조율할 수 있습니다
규정 준수 문서화: 규제 대상 산업(의료, 법률, 금융 등)에서 어떤 내용이 논의되었고 어떻게 번역되었는지 이중 언어로 된 영구 기록 문서를 유지할 때

왜 PDF가 아닌 XLSX인가요? 스프레드시트는 편집, 정렬, 필터링이 가능하기 때문입니다. 만약 검토자가 47번째 줄의 번역 오류를 체크해 알려준다면, 편집자는 Perso Dubbing 에디터에서 해당 타임스탬프로 바로 이동해 그 부분을 수정할 수 있습니다. 사용 사례와 세부 워크플로우는 '이중 언어 대본 내보내기: 검수 및 교육을 위한 대조 번역 문서 제작' 편을 확인하십시오.

단계별 파일 다운로드 방법: 3 Steps

Step 1. Perso Dubbing에서 더빙 프로젝트를 완료합니다 (업로드 > 언어 선택 > 진행).

Step 2. 완료된 프로젝트 결과 페이지에서 다운로드 버튼을 클릭합니다. 드롭다운 메뉴에 이용 가능한 모든 파일 유형이 표시됩니다.

Step 3. 필요한 파일을 선택합니다. 대형 압축 파일을 한꺼번에 받을 필요 없이, 필요한 파트만 개별적으로 콕 집어 다운로드할 수 있습니다.

내보내기가 아예 제공되지 않는 무료 플랜을 제외하고, 10가지 파일 유형 모두 스타터 요금제(월 $6.99) 이상부터 모두 지원됩니다.

경쟁사들은 어떤 파일을 내보낼 수 있을까요?

파일 형식	Perso Dubbing	ElevenLabs	Descript	HeyGen	Synthesia	Rask AI
더빙 비디오 (MP4)	지원	지원	지원	지원	지원	지원
소스 오디오 (WAV)	지원	지원	지원	부분 지원	지원	미지원
화자별 분리 오디오	지원 (TAR)	지원 (ZIP)	수동 우회 필요	미지원	미지원	미지원
번역 오디오만 추출	지원	지원	간접 지원	부분 지원	미지원	부분 지원
번역 오디오 + BGM	지원	지원	미지원	미지원	미지원	미지원
BGM 내보내기 (추출된 BGM)	지원	미지원	미지원	미지원	미지원	미지원
소스 자막 (SRT)	지원	지원	지원 (SRT/VTT)	지원 (Pro+)	지원 (SRT/VTT)	지원
번역 자막 (SRT)	지원	지원	지원 (SRT/VTT)	지원 (SRT/VTT/ASS)	지원 (언어별)	지원
소스 대본	지원 (XLSX)	지원 (CSV/TXT)	지원 (TXT/DOCX/MD)	지원 (XLSX, Pro+)	XLIFF (Enterprise)	지원 (TXT/DOCX)
이중 언어 대본	지원 (XLSX)	지원 (CSV)	미지원	미지원	미지원	미지원
지원 가능한 총 파일 수	10	8-9	6-7	5-6	5-6	4-5

Perso Dubbing이 돋보이는 이유

ElevenLabs는 화자별로 구분된 WAV 트랙과 CSV 기반의 이중 언어 대본을 포함하여 8~9가지의 내보내기를 지원하여 근접한 편입니다. 다만 크게 아래 세 가지 영역에서 차이가 발생합니다:

1. 오직 Perso Dubbing에서만 BGM 단독 내보내기가 지원됩니다. 목록에 표시된 어떤 다른 플랫폼도 보컬을 배제한 배경 음악(BGM)을 독립적인 WAV 파일로 제공하지 못합니다. 더빙 보이스와 음악의 믹싱 비율을 커스텀하고자 하는 창작자들에게 이 기능은 별도의 음원 분리 도구를 쓰지 않아도 되는 유일한 해결책입니다.

2. 월 $6.99 요금제부터 모든 파일을 제공합니다. ElevenLabs는 일부 파일 내보내기 기능을 고급 등급 뒤로 가려두었습니다. HeyGen은 SRT 및 스크립트 전송을 위해 Pro+ 이상의 조건이 필수입니다. Synthesia 또한 대본 내보내기(XLIFF)를 Enterprise에만 제한했습니다. 반면 Perso Dubbing은 가장 기초 플랜인 스타터 단계에서 10개 파일을 모두 오픈해 드립니다.

3. 활용도가 떨어지는 CSV 대신 잘 정돈된 XLSX를 제공합니다. ElevenLabs는 이중 언어 번역 대본 검토 시 개발자 중심의 CSV를 내보내 마케팅 팀, 번역가, 프로젝트 매니저가 직관적으로 확인하기 다소 어렵습니다. Perso Dubbing은 구조화된 셀 구성을 가진 XLSX를 제공하므로, 수동 변환 작업 필요 없이 Excel이나 Google Sheets에서 즉시 확인 가능합니다.

자주 묻는 질문 (FAQ)

Q. 10가지 다운로드 파일이 스타터 계획에도 제한 없이 정말 다 들어가나요, 아니면 몇 개는 상위 랭크가 되어야 하나요?

10개 파일 모두 추가 비용 없이 월 $6.99 요금제(스타터)부터 완전 제공받으실 수 있습니다. 개별 청구되는 수수료 요소는 전혀 없습니다. 플랜 등급 제약이 있는 유일한 사양은 더빙 적용 전 사용자 자막을 불러오는 SRT 업로드 기능뿐이며, 이는 최고 등급인 Enterprise 등급에서만 열립니다. 타 경쟁사인 HeyGen이 SRT 및 대본 내보내기를 Pro+ 이상으로 막고, Synthesia가 대본 내보내기를 Enterprise로 귀속해 둔 경우와 좋은 대조를 이룹니다.

Q. 수 주 전 완료한 예전 프로젝트의 파일도 다시 볼 수 있나요?

네. 이전 모든 작업 프로젝트들과 이에 대응하는 출력 가능한 미디어 목록들은 고유의 Perso Dubbing 대시보드 내에 안전하게 아카이브 보관됩니다. 언제든 대시보드로 돌아와 앞서 완료한 프로젝트의 10가지 포맷 리소스를 즉시 다운로드할 수 있습니다.

Q. WAV 오디오 다운로드 파일의 실제 음질 수준은 어떤가요?

Perso Dubbing은 소스 음원의 본연 오리지널 강도를 유지하여 고해상도 규격 그대로 WAV 파일을 추출합니다. WAV 형식을 비압축 무손실 상태로 송출하므로 변조에 의한 열화 현상이 없습니다. 이에 따라 전문 오디오 워크스테이션(DAW)이나 동영상 전용 편집 프로그램 등에서 사후 사운드 작업을 진행하기에 최상의 환경을 제공합니다.

가장 포괄적인 통합 미디어 자산 다운로드 서비스를 경험해 보세요

하나의 미디어를 통한 가치 극대화. 1회의 더빙 프로세스로 비디오, 오디오, 텍스트 원고, 자막 파일 세트를 동시에 정비하세요. 타겟층이 선호하는 모든 채널의 맞춤형 콘텐츠로 손쉽게 재배포할 수 있습니다.

Try Perso Dubbing free 신용카드 없이 시작할 수 있는 맛보기 찬스. 스타터에서 10가지 내보내기 전체 이용 지원 및 33개 이상의 다양한 다국어 더빙 지원.

핵심 가이드:

수치로 보는 혜택: 모든 AI 더빙 플랫폼은 더빙된 비디오를 내보냅니다. 일부 플랫폼은 자막과 오디오 트랙도 내보낼 수 있습니다. 하지만 Perso Dubbing은 개별 배경 음악, 이중 언어 XLSX 대본, 화자별 분리 오디오를 포함하여 모든 더빙 프로젝트에서 10가지 파일 유형을 내보내며, 이 모든 기능은 엔터프라이즈 제한이나 추가 비용 없이 월 $6.99의 스타터 요금제부터 이용할 수 있습니다.

더빙 후 Perso Dubbing에서 내보낼 수 있는 파일은 무엇인가요?

다음은 Perso Dubbing 더빙 프로젝트를 마친 후 다운로드할 수 있는 전체 파일 목록입니다:

#	파일	형식	내용	이용 가능 요금제
1	더빙 비디오 내보내기	MP4	번역된 음성, 립싱크 및 원본 영상이 포함된 전체 비디오	스타터 (월 $6.99)
2	소스 오디오 내보내기	WAV	업로드한 비디오에서 추출한 원본 오디오 트랙	스타터
3	소스 오디오 (화자별)	TAR	원본에서 감지된 각 화자별로 분리된 개별 오디오 파일	스타터
4	번역 오디오 내보내기	WAV	더빙된 음성 오디오만 제공 (비디오 없음, 배경 음악 없음)	스타터
5	번역 오디오 (배경 음악 포함)	WAV	원본 배경 음악이 믹싱된 더빙 음성 오디오	스타터
6	BGM 내보내기	WAV	목소리가 완전히 제거되고 독립적으로 추출된 배경 음악	스타터
7	소스 자막	SRT	원본 언어로 자동 생성된 자막	스타터
8	번역 자막	SRT	더빙된 오디오 타이밍에 싱크를 맞춘 타겟 언어 자막	스타터
9	소스 대본	XLSX	스프레드시트 형식으로 변환된 원본 오디오의 전체 음성-텍스트 변환	스타터
10	소스 및 번역 대본	XLSX	한눈에 볼 수 있는 이중 언어 대본 — 병렬 열로 나열된 원본 및 번역 텍스트	스타터

단 한 번의 더빙으로 제공받는 모든 파일 확인하기

1. 더빙 비디오 내보내기 (MP4)

사용 시기:

더빙된 버전을 YouTube, TikTok 또는 LMS에 직접 게시할 때
다양한 시장을 위한 랜딩 페이지나 제품 페이지에 삽입할 때
배포하기 전 관계자들과 검토용으로 공유할 때

2. 소스 오디오 내보내기 (WAV)

정의: 업로드한 비디오에서 고품질 WAV 파일로 추출한 원본 오디오 트랙입니다.

사용 시기:

더빙하기 전에 깨끗한 원본 오디오를 아카이브로 보관할 때
다른 편집 프로젝트(Premiere Pro, DaVinci Resolve, Final Cut 등)에서 원본 음성을 사용할 때
원본 오디오와 더빙 오디오의 품질을 나란히 놓고 비교할 때

3. 화자별 소스 오디오 (TAR)

사용 시기:

화자별로 볼륨이나 EQ를 개별적으로 조정해야 하는 팟캐스트 편집자
다른 사람은 그대로 두고 한 화자만 다시 녹음해야 하는 인터뷰 비디오
각 화자의 목소리가 올바르게 클로닝되었는지 다중 화자 QA를 진행할 때

4. 번역 오디오 내보내기 (WAV)

정의: 비디오와 배경 음악 없이 번역된 목소리 트랙만 포함된 더빙 음성 오디오입니다.

사용 시기:

팟캐스트 현지화: 다른 언어로 오디오 전용 버전을 게시할 때
사용자 정의 사후 편집을 위해 고유한 편집 프로그램(Premiere, Final Cut 등) 타임라인에서 오디오만 교체할 때
라디오, 사내 교육 오디오 또는 오디오북 스타일의 음성 전용 고지를 배포할 때

5. 번역 오디오(배경 음악 포함) (WAV)

정의: 원본 배경 음악과 더빙된 음성이 함께 믹싱되어 비디오 없이도 완전한 오디오 트랙으로 바로 사용할 수 있는 상태입니다.

사용 시기:

팟캐스트, 사내 소통, 오디오 뉴스레터 등 완전하게 "제작된" 사운드가 필요한 오디오 중심 배포 시

빠른 작업: 직접 믹싱할 필요 없이 배경 음악 밸런스가 이미 조절되어 있습니다
배경 음악을 유지한 소셜 미디어용 오디오 클립을 제작할 때

6. BGM 내보내기 (WAV)

정의: 원본 비디오에서 보컬 영역을 완전히 제거하고 추출한 고유한 배경 음악으로, 깨끗한 악기 트랙만 남습니다.

사용 시기:

DAW 나 영상 편집기에서 원하는 비율로 더빙 음성과 배경 음악을 재믹싱할 때
홍보용 클립, 예고편, 하이라이트 영상에 원본 배경 음악을 사용할 때
AI가 음성과 음악을 올바르게 분리했는지 확인할 때 (QA 단계)

7. 소스 자막 (SRT)

사용 시기:

YouTube나 Vimeo의 원본 비디오에 자막을 추가할 때
기존 콘텐츠의 접근성 지침(ADA, WCAG) 준수가 필요할 때
SRT 자막을 다른 번역 도구나 작업 환경에 입력할 때
SEO: YouTube에 SRT를 업로드하면 원본 언어로 검색 및 노출이 원활해집니다

8. 번역 자막 (SRT)

정의: 원본 말하기 타이밍이 아닌, 더빙 오디오의 흐름에 맞춰 타겟 언어로 실시간 동기화된 자막 파일입니다.

사용 시기:

다국어 배포: YouTube에 소스 자막과 번역 자막을 다중 자막 트랙으로 업로드할 때
타겟 시장 사용자를 위한 콘텐츠 접근성을 확보할 때
FFmpeg 이나 사용 중인 편집 프로그램으로 자막을 동영상에 완전히 입히는(Burn-in) 인코딩 작업을 할 때

9. 소스 대본 (XLSX)

사용 시기:

콘텐츠 재가공: 동영상 스크립트를 블로그 포스트, 소셜 미디어 설명글 또는 뉴스레터 복사본으로 전환할 때
원본 녹음본에서 실제로 사용된 대사의 법적/규정 준수 여부를 검토할 때
검색 가능한 아카이브 구축: XLSX는 아주 쉽게 검색, 정렬 및 필터링할 수 있습니다

10. 소스 및 번역 대본 (XLSX)

사용 시기:

번역 QA: 검토자가 여러 파일을 왔다 갔다 교체하지 않고도 라인별로 편하게 교차 검수를 할 수 있습니다
언어 학습 콘텐츠 제작: 교육자가 이중 언어 스크립트를 학습 자료로 유용하게 사용합니다
현지화 팀과의 협업: 프로젝트 매니저가 Perso Dubbing 계정이 없는 각 로컬 검토진에게 이 XLSX 문서를 전달하여 조율할 수 있습니다
규정 준수 문서화: 규제 대상 산업(의료, 법률, 금융 등)에서 어떤 내용이 논의되었고 어떻게 번역되었는지 이중 언어로 된 영구 기록 문서를 유지할 때

단계별 파일 다운로드 방법: 3 Steps

Step 1. Perso Dubbing에서 더빙 프로젝트를 완료합니다 (업로드 > 언어 선택 > 진행).

Step 2. 완료된 프로젝트 결과 페이지에서 다운로드 버튼을 클릭합니다. 드롭다운 메뉴에 이용 가능한 모든 파일 유형이 표시됩니다.

Step 3. 필요한 파일을 선택합니다. 대형 압축 파일을 한꺼번에 받을 필요 없이, 필요한 파트만 개별적으로 콕 집어 다운로드할 수 있습니다.

내보내기가 아예 제공되지 않는 무료 플랜을 제외하고, 10가지 파일 유형 모두 스타터 요금제(월 $6.99) 이상부터 모두 지원됩니다.

경쟁사들은 어떤 파일을 내보낼 수 있을까요?

파일 형식	Perso Dubbing	ElevenLabs	Descript	HeyGen	Synthesia	Rask AI
더빙 비디오 (MP4)	지원	지원	지원	지원	지원	지원
소스 오디오 (WAV)	지원	지원	지원	부분 지원	지원	미지원
화자별 분리 오디오	지원 (TAR)	지원 (ZIP)	수동 우회 필요	미지원	미지원	미지원
번역 오디오만 추출	지원	지원	간접 지원	부분 지원	미지원	부분 지원
번역 오디오 + BGM	지원	지원	미지원	미지원	미지원	미지원
BGM 내보내기 (추출된 BGM)	지원	미지원	미지원	미지원	미지원	미지원
소스 자막 (SRT)	지원	지원	지원 (SRT/VTT)	지원 (Pro+)	지원 (SRT/VTT)	지원
번역 자막 (SRT)	지원	지원	지원 (SRT/VTT)	지원 (SRT/VTT/ASS)	지원 (언어별)	지원
소스 대본	지원 (XLSX)	지원 (CSV/TXT)	지원 (TXT/DOCX/MD)	지원 (XLSX, Pro+)	XLIFF (Enterprise)	지원 (TXT/DOCX)
이중 언어 대본	지원 (XLSX)	지원 (CSV)	미지원	미지원	미지원	미지원
지원 가능한 총 파일 수	10	8-9	6-7	5-6	5-6	4-5