
최근에는 영상 저작권과 시청 환경에 대한 기준이 매우 엄격해졌습니다.
그렇기에 어렵게 구한 영상이 다른 언어로 되어있다면 자막 파일은 절대 만들어지지 않습니다.
자막이 없는 해외 영상을 파일로 소장하고 있을 때, 그 내용이 궁금해지기 마련이죠. 이번 글에서는 저작권을 준수하는 합법적인 영상들을 기준으로, 누구나 쉽게 한글 자막을 만드는 법을 공유해 보려고 합니다.
이제 자막 파일을 따로 구매하거나 스트리밍 사이트에 의존하는 시대는 끝났습니다.
그저 기술의 최전선에 있는 선생님들이 만들어주신 AI를 ‘딸깍’해서 사용하기만 하면 되는 것이지요.
유튜브에 많은 영상들이 팟플레이어로 번역하는 방법들을 소개해주고 있습니다만 실제 사용해보니 속도도 느리고 여러가지 불편함이 있었습니다.
훨씬 빠르고 직관적인 ‘Subtitle Edit’ 활용법을 4단계로 정리해 드립니다.
다음과 같은 순서로 진행하면 되겠습니다.
- Subtitle Edit 다운로드 및 설치
- 비디오 파일에서 음성을 추출하고 원어 자막 생성
- 자막 파일을 AI로 번역 (google translate API 무료 버전)
- 자막 파일을 AI로 번역 (타 AI API 사용 버전)
1. Subtitle Edit 다운로드 및 설치
https://www.nikse.dk/subtitleedit
구글에 Subtitle Edit를 검색하거나 공식 링크를 통해 접속합니다.

사이트 내 다운로드 버튼(빨간 네모)을 클릭하여 설치를 진행합니다.
그 뒤는 눈치껏 진행
2. 비디오 파일에서 음성을 추출하고 원어 자막 생성

프로그램을 실행한 뒤, 영상을 드래그하여 불러옵니다. (잘못 불러왔을 경우 File -> New로 초기화 가능)

영상 아래의 검은 화면을 클릭해 오디오를 추출합니다.

초록색 파형(Waveform)이 생기면 준비 완료입니다.
Video 메뉴에서 Audio to text에서 Audio to text(Whisper) 모델로 원어를 자막을 생성해주면 됩니다.
다른 모델도 있지만 일어는 Whisper 모델이 가장 나았습니다.

다음은 언어, 모델, 엔진, 가동 순으로 눌러주면 되는데 혹시나 영문 영상으로 한다면 언어쪽만 바꿔서 하면 됩니다.
모델은 더 높은 용량을 쓰는 것도 좋지만 이것저것 써보니 large-v3-turbo가 속도면이나 퀄리티면에서 밸런스가 가장 좋았습니다. 엔진도 웬만하면 저걸로 골라주세요.
골랐다면 Generate 클릭 (1~2시간 영상 기준으로 대략 5~10분가량 소요됩니다.)

그럼 이렇게 원어로 뽑아놓은 자막이 생성됩니다.
(내용으로로 보아하니 회사에 뭔가 좋은 일이 있나봅니다. 뭔가 축하하는 장면이네요)
3. 비디오 파일에서 음성을 추출하고 원어 자막 생성

자막 생성이 완료되면 이제 번역 버튼만 누르면 됩니다. 어떤 AI 엔진을 쓰느냐에 따라 결과물이 달라집니다.



구글 V1을 제외한 나머지 AI는 대부분 API KEY를 삽입해야 한다.
아래 선택지에 따라 고르면되고 구글 V1을 제외한 나머지는 API를 연결해야된다.
그런데 돈주고 쓰는 AI의 API Key를 넣어도 작업이 안될 때가 있다.
그럴 때는 AI를 바꿔보거나 API 설정을 다시 확인해보아야 한다.
이것 저것 써봤지만 일본어에서는 DeepL V2가 괜찮았다.
처음에는 무료로 제공해주는 리소스양이 있으니 연결해서 써보도록 하자.
모든 게 귀찮고 빠르고 어느정도 맥락 파악만 할 줄 안다 -> Google Translate V1 (무료)
나는 어느 정도의 번역 퀄리티를 원한다 -> DeepL V2
이미 사용하고 있는 유료 AI가 있다 -> 유료 AI (Gemini, ChatGPT)
API 가져오는 방법은 대충 검색하면 나오는데 나중에 포스팅하여 첨부하도록 하겠다.
아무튼 일단 구글로 Translate을 누르면?

카에데씨의 직장일로 축하해준다는 내용이라는 것을 대충 알 수 있다.

OK를 누르고 상단의 File -> Save를 누른 뒤 자막파일을 저장하면 끝입니다.
마지막으로 영어나 중국어도 어느 정도 번역하는 것도 나쁘지 않았습니다.
유료 AI API를 사용하지 않으면 문맥이 어색하거나 문체가 어색했지만 맥락과 내용을 파악하는 정도로는 유용했습니다. 팟플레이어를 사용할때는 시간이 너무 더디거나 답답한 경우가 많았는데 훨씬 편하고 직관적으로 자막을 만들 수 있어서 좋았습니다. 앞으로의 AI 발전이 더욱 기대되네요.
qjetkfnsfdnqjdyrzumtdkeohdfeim