화자 감지 및 자막 내보내기를 지원하는 AI 음성-텍스트 변환
Perso AI Speech to Text는 오디오 및 비디오 파일을 99개 이상의 언어로 편집 가능한 텍스트로 변환하며, 자동 화자 감지 기능을 갖춘 AI 기반 전사 도구입니다. 전사본을 편집하고, 화자 이름을 다시 지정하며, 단어 수준 타임스탬프가 포함된 SRT, VTT, Excel 또는 JSON 형식으로 내보낼 수 있습니다. 모든 기능을 하나의 프로젝트에서 제공합니다.
설치 불필요 · 무료 플랜 제공 · 몇 초 만에 시작
빠른 · 안전한 · 정확한
자동 언어 감지: 99개 이상의 언어
오디오 또는 비디오 파일을 업로드하세요. Perso AI는 99개 이상의 지원 언어 중에서 음성 언어를 자동으로 감지합니다. 수동 선택은 필요하지 않습니다.
화자 분리 및 레이블 편집
화자를 자동으로 분리하고 각 세그먼트에 레이블을 지정합니다. 감지된 다른 화자로 각 세그먼트를 다시 할당하면 변경 사항이 모든 내보낸 파일에 적용됩니다.
스크립트 및 자막 편집
오디오 또는 비디오 파일을 업로드하세요. Perso AI는 99개 이상의 지원 언어 중에서 음성 언어를 자동으로 감지합니다. 수동 선택은 필요하지 않습니다.
다중 형식 내보내기
오디오 또는 비디오 파일을 업로드하세요. Perso AI는 99개 이상의 지원 언어 중에서 음성 언어를 자동으로 감지합니다. 수동 선택은 필요하지 않습니다.
더빙 및 번역에 직접 연결
오디오 또는 비디오 파일을 업로드하세요. Perso AI는 99개 이상의 지원 언어 중에서 음성 언어를 자동으로 감지합니다. 수동 선택은 필요하지 않습니다.
한 번 업로드, 여러 번 내보내기
자막, 스크립트 또는 타임스탬프가 포함된 원시 데이터. 필요한 형식을 선택하세요.
SRT
SRT 자막
업계 표준 자막 형식입니다. YouTube, Vimeo 및 모든 주요 동영상 플랫폼에서 바로 사용할 수 있습니다.
VTT
WebVTT
스타일링 지원이 포함된 웹 기반 자막 형식입니다. HTML5 비디오 플레이어와 웹 임베드에서 작동합니다.
XLS
엑셀 스크립트
스프레드시트 형식의 전체 녹취록이며, 화자 레이블이 포함되어 있습니다. 회의록, 문서화 또는 기록 보관용으로 사용하세요.
{ }
JSON 데이터
단어 수준 타임스탬프, 화자 ID, 신뢰도 점수가 포함된 구조화된 데이터입니다. API 통합이나 사용자 지정 워크플로에 유용합니다.
자막, 회의록, 강의 대본
같은 도구, 필요에 따라 다른 결과물이 제공됩니다.
콘텐츠 제작자
몇 분 만에 브이로그, 팟캐스트, 동영상을 게시 준비가 된 자막으로 바꾸세요. 업로드, 편집, 내보내기 — 수동 전사 없이도 가능합니다.
YouTube, TikTok, Reels용 자동 자막
내보내기 전에 자막을 인라인에서 편집
99개 이상의 언어 지원
SRT · VTT 내보내기
팀 및 비즈니스
회의 녹음을 검색 가능한 화자별 메모로 변환하세요. 어떤 화상 회의 플랫폼이나 음성 녹음기와도 작동합니다.
자동 화자 분리
체계적인 엑셀 회의록
인용을 위한 단어 수준 타임스탬프
교육자
강의와 강좌 콘텐츠를 높은 정확도로 전사하세요. 접근성을 위한 자막이나 학습용 스크립트를 생성합니다.
장시간 강의 정확도
LMS용 자막 생성
전 세계 학생들을 위한 다국어
접근성 지원
영상 제작자
전사부터 시작해, 다시 업로드하지 않고 더빙이나 번역으로 진행하세요. 한 번 업로드하면 현지화 전체 파이프라인을 모두 처리할 수 있습니다.
전사 → 편집 → 내보내기를 하나의 흐름으로
AI 더빙 및 번역에 연결
오디오 분리 포함
완전한 현지화
Perso AI 대 수동 전사
Perso AI 음성 텍스트 변환이란 무엇이며, 기본 전사 도구와 어떻게 다른가요?
Perso AI Speech to Text는 동영상 및 오디오 파일을 99개 이상의 언어로 정확하게 화자별로 구분된 스크립트로 변환합니다. 기본적인 받아쓰기 도구와 달리, 모든 화자를 자동으로 감지하고, 각 구간을 다른 감지된 화자로 다시 지정할 수 있으며, 자막 제작, 보관, 콘텐츠 워크플로우를 위해 편집 가능한 SRT, VTT, XLSX, JSON 파일로 내보냅니다.




