서너 시간짜리 편집을 30분으로 줄인 방법

하고 싶은 이야기가 있는 사람들이 있어요. 머릿속엔 분명히 있는데, 막상 기획하고 찍고 편집하는 그 모든 과정이 버거워서 결국 꺼내지 못하는 사람들. 저도 한참을 그랬어요.

말할 거리는 차고 넘치는데, 그걸 영상 한 편으로 만들려면 서너 시간이 통째로 사라지더라고요. 컷 자르고, 자막 달고, 색 맞추고. 그 반복이 지겨워서 "오늘은 그냥 넘기자"가 쌓이고, 결국 하고 싶던 이야기는 머릿속에서만 맴돌다 흩어졌어요.

저는 그게 아까웠어요. 사람마다 자기 이야기가 있는데, 그걸 꺼내는 방법이 너무 비효율적이라는 이유 하나로 포기하게 되는 게요. 그래서 더 효율적이고 생산적인 방법으로 누구나 자기 이야기를 할 수 있게 돕고 싶었어요. 그 마음으로 이 워크플로우를 만들기 시작했습니다. 원칙은 하나였어요. 막히는 지점마다, 그걸 푸는 단계를 하나씩 붙인다.

먼저, 토대를 잡아요

① 소스를 넣는 순간부터 정리가 시작돼요. 영상을 올리면 먼저 화면 비율을 목표 포맷에 맞추고, 촬영할 때 입혀둔 로그(Log) 색 프로파일을 복원하는 단계를 거쳐요. 보통은 이걸 편집 막바지에 손대다 색이 틀어지는데, 시작점에서 기준을 잡아두니 뒤가 흔들리지 않더라고요.

🔧 실제로 이렇게 했어요 - 제가 친 지시는 딱 한 줄이었어요: "화면 비율은 9:16으로 가고, 화면은 꽉 채워서. LUT은 v2로." - 원본은 LUMIX 8K 오픈게이트(5760×4320, 4:3 HEVC) 8개, 합쳐서 35GB쯤. 넣자마자 1440×1080 프록시를 백그라운드로 떠서 무거운 원본을 직접 안 만져요. - 시스템이 원본 평균 채도가 13.7인 걸 읽고 "색이 평평한 Log 소스다"라고 자동 판별해서, 색 복원 LUT을 입힐지 묻는 게이트를 띄워요. - 잠근 값: 9:16 / 중앙 크롭(꽉 채우기) / 복원 LUT arri_log_c_grading_ryan_v2. 최종 출력은 4K 2160×3840.

② 말을 전부 텍스트로 풉니다. 전사를 돌리고, 발화 하나하나에 ID를 매겨요. U001, U002 이런 식으로요. 이게 핵심인데 — 예전엔 "그 말 어디서 했더라" 하고 타임라인을 스크럽하며 뒤졌거든요. 이제는 타임코드를 안 만져요. "이 문장"이라고 가리키면 그게 곧 편집 좌표가 되니까요. 게다가 전사는 백그라운드로 돌아가서, 그 사이에 저는 다른 일을 해요.

🔧 실제로 이렇게 했어요 - 전사는 로컬 Whisper로 돌려요(크레딧 0). 발화 하나하나에 U001~U465 순번을 매기고, 발화 중간을 자를 땐 원본을 보존한 채 조각에 B를 붙여요(예: U240B). - 받아쓰기가 틀린 후보를 시스템이 먼저 모아줘요. 교정은 U012 → 긴 바지죠, U091 → 오픈클로처럼 발화 ID에 고칠 텍스트만 적으면 끝이에요. 타임코드는 끝까지 안 건드려요. - Whisper는 같은 소스를 다시 돌려도 글자까지 똑같이 나와서(결정론적), 재전사 대신 이 교정 게이트 한 번으로 마무리돼요.

그다음, 쓸 것만 골라내요

③ 테이크를 가려내요. 같은 말을 여러 번 한 구간, 말이 꼬이거나 늘어진 테이크를 발화 단위로 분석해요. 애매해서 못 고르겠는 건 비교 클립으로 나란히 뽑아서 눈으로 보고 골라요. 감으로 자르고 나중에 후회하는 일이 확 줄었어요.

🔧 실제로 이렇게 했어요 - 제가 친 건 발화 ID 한 줄이 다였어요: "U363으로 가자", "오케이 363으로 교체하자", "362가 맞다". - 465개 발화 중 21개를 떨궈서 444개로 줄였어요 — 같은 말 반복 테이크 14그룹에서 베스트만 남기고, 말하다 만 false-start 6건은 자동으로 빠져요. - 애매한 그룹은 비교 클립으로 떠줘요. 후보를 0.5초 검은 화면으로 끊어 이어붙인 720×1280 클립(tg07_compare.mp4)인데, 색·크롭 없이 프록시 원본 그대로 + 타임코드는 DB에서 읽어 잘라요. - 여기서 하나 배웠어요. 처음엔 베스트를 '노이즈+길이'로만 매겼더니 false-start가 베스트로 뽑히는 충돌이 났거든요. "false-start를 베스트 후보 풀에서 먼저 빼야 정합이 맞는다" — 그렇게 로직을 고쳤어요. - 실제 엔딩은 U357→U363으로 갔고, 0.99초짜리 끊긴 "잘 부탁드립니다"(U362)는 진정성 인서트로 CTA 직전에 일부러 박았어요.

④ 장면을 읽어요. 대표 프레임을 뽑아서 한 장씩 분석해요. 어떤 장소인지, 어떤 구도인지. 그리고 같은 장소·시간대·구도끼리 하나의 '셋업'으로 묶어요. 서로 다른 데서 찍은 걸 막 섞어 짜깁기처럼 보이는 사고를 막을 수 있어요.

🔧 실제로 이렇게 했어요 - 장면도 말로 가리켜요: "맨 앞에 걸어가는 장면 넣고 싶은데, 훅으로 잡을 만한 의미 있는 발화 없어?" - 대표 프레임을 1440×1080으로 뽑는데, 파일명에 발화 ID가 붙어요(F008_U358.jpg). 이렇게 9장을 한 장씩 분석했어요. - vision이 구도·장소·감정을 읽어 라벨을 달아요 — 정면 풀샷 / 측면 트래킹(걸어가는 컷) / 감정 비트 / 전환컷. - 같은 조건끼리 셋업 S03~S06으로 묶었어요. 로케이션은 시골 도로 / 천변 갈대밭 2곳. 다른 셋업을 의도적으로 섞을 땐 scene_policy: mix_confirmed로 잠가서 "교차해도 문제 없겠어" 확인을 거쳐요. - 예시로, F008(갈대밭에서 모자 뒤로 쓰고 웃는 컷)이 9장 중 감정이 제일 살아서 엔딩 여운 인서트로 박았어요.

마지막으로, 붙이고 마감해요

⑤ 편집 방향을 먼저 정하고 갑니다. 바로 자르지 않아요. 훅·전개·마무리 구조로 방향 후보를 두세 개 먼저 보고, 마음에 들 때까지 다시 뽑아요. "다 자르고 나서 아 방향이 틀렸네"를 원천에서 막는 단계예요.

🔧 실제로 이렇게 했어요 - 방향 후보를 6개 스코어링해서 봤어요(호기심 강도 + 4U[유용·긴급·독창·구체] + 주제 정합 + 3초 적합성). 예: "3개월의 결론" 9.4 / "5%의 비밀" 9.0 / "양립 못 할 두 커리어" 8.5. - 최종으로 dir-5pct-3months("5%의 비밀 → 3개월의 결론")를 골랐어요. 후보는 최소 2개여야 통과하게 막아서, 비교 없이는 못 넘어가요. - 60초 구조: 훅 0~11초("5%가 안 된대요" → 끊기) / 전개 11~42초 / 클로즈 42~53초("모델이 아니라 맥락이 성패를 가른다") / CTA 53~60초. - 플랜 카드 푸터에 "이 카드를 본 뒤의 메시지만 승인으로 인정돼요"가 박혀요. 렌더 직전 재승인을 한 번 강제하고, "오케이 해보자고"를 승인으로 기록했어요.

⑥ 그제서야 실제로 붙입니다. 정해진 결정들을 편집 리스트로 컴파일해서 프리뷰를 렌더해요. 렌더는 큐로 돌아가니 또 붙어 있을 필요가 없어요. 나온 프리뷰는 품질 체크를 거쳐서 컷이 튀거나 어긋난 데가 없는지 봐요.

🔧 실제로 이렇게 했어요 - "1:30 근방에 발화 없는데 들어간 구간 있네? 점검해줘", "2160×3840으로 렌더링해줘" 식으로 던졌어요. - EDL은 발화 ID 단위로 결정론적으로 컴파일돼요(버전별 12~20컷). 렌더 설정은 9:16 / center_crop / loudnorm −14 LUFS / LogC 복원 / 컷 사이 5ms 페이드. - 렌더는 백그라운드 큐(render_id로 추적, 끝나면 봇이 알림). 프리뷰 720×1280, 최종 2160×3840 4K(50Mbps, 약 477MB). 같은 EDL은 dedup으로 재사용해서 크레딧·시간 0으로 즉시 떠요. - QC가 잡은 것들: 6.9초 무음 갭(룸톤 −18dB라 무음 감지를 빠져나간 걸 세그 분할로 제거), "까" 음절 클리핑(U362 삽입을 75.08→75.18초로 0.1초 밀어 _kkafix). 컷 포인트는 워드 레벨 재전사로 검증해요.

⑦ 색과 마감을 입혀요. 컷이 확정되면 그때 룩을 잡아요. 필름 룩 LUT을 올리거나 할레이션 같은 질감을 더해 톤을 만들고, 자막은 ②에서 만든 전사를 그대로 가져다 입히니 다시 받아쓸 일이 없어요.

🔧 실제로 이렇게 했어요 - "필름룩은 할레이션 적용해줘. 자막은 태영화체, 검은 배경에 오렌지 텍스트로, 레퍼런스 이미지 보고 만들어줘" — 이렇게 마감을 지시했어요. - 필름 룩 LUT은 arri_log_c_grading_ryan_v2.cube. 할레이션은 strength 0.35 / sigma 18 — 하이라이트만 뽑아 블러 먹이고 screen으로 다시 얹어 번지게 해요. - 자막은 태영화체 Bold, 색 #E8A33D(주황/탠), 검은 박스 배경(ASS BorderStyle=3), 정중앙, burn-in. 레퍼런스는 제 옛 릴스 이미지였어요. - 렌더 체인 순서가 핵심이에요: 8K 소스 → 2160×3840 크롭 → LUT → 할레이션 → 자막 burn-in → 풀해상도 단일 패스. - 배운 것: 자막 한 줄 글자 수를 13자에서 11자로 줄여달라니 엔진을 고쳐 서버 리로드하고 재렌더했어요. 그리고 본문(채도 14.9)·엔딩(15.2) 채도를 교차검증해서 LUT가 두 번 먹는 더블 그레이딩을 막았어요.

이렇게 단계를 하나씩 붙여놓고 나니, 서너 시간 걸리던 편집이 30분으로 줄었어요. 그것도 그 30분 내내 붙어 있을 필요 없이, 전사하는 사이에 커피를 내리고 렌더 도는 사이에 다음 글을 쓰는 식으로요.

여기서부터가, 진짜 하고 싶은 이야기예요

콘텐츠 한 편을 만들 때마다 이 과정을 처음부터 다시 헤매면, 만들 때마다 같은 비용이 또 들어요. 어떤 순서로 할지, 뭘 먼저 잡을지, 어디서 막힐지 — 그 시행착오 자체가 비용이거든요. 저는 이걸 실증 비용이라고 불러요.

그런데 이 단계들을 가만히 들여다보면, 매번 똑같이 반복되는 부분과 콘텐츠마다 달라지는 부분이 나뉘더라고요. 반복되는 건 로직으로 굳혀버리고, 달라지는 건 그때그때 바꿀 수 있는 값으로 빼두면 — 다음 편부터는 그 비용을 다시 안 내도 돼요.

그래서 저는 이 워크플로우에서 바꿀 수 있는 부분, 로직으로 만들 수 있는 부분을 골라내서 정규화하고 고도화했어요. 그렇게 나온 결과물이 Creator OS예요.

위에 적은 단계들, 사실 따라 하시면 누구나 할 수 있어요. 다만 이걸 매번 다시 헤매지 않게 정규화하고 고도화해 둔 건 — 적어도 제가 아는 한 이것뿐이더라고요. 제가 그걸 했어요.

읽어주셔서 고맙습니다. 다음 편엔 더 다듬어진 결과물로 찾아올게요.

서너 시간짜리 편집을30분으로 줄인 방법

먼저, 토대를 잡아요

그다음, 쓸 것만 골라내요

마지막으로, 붙이고 마감해요

여기서부터가, 진짜 하고 싶은 이야기예요

서너 시간짜리 편집을
30분으로 줄인 방법