모든 글로 돌아가기
스토리 아이디어AI 영상 프롬프트 · 12가지 레시피

2026년 바로 복사해서 쓰는 AI 영상 프롬프트 12선

빈 프롬프트 창 앞에서 시간 낭비 그만. 카메라, 조명, 사운드까지 씬 단위로 명시한 AI 영상 프롬프트 12개 — 마음에 드는 걸 골라 에디터에서 열고 오늘 밤 바로 완성하세요.

2026-06-17 16 분 분량·작성자 Story Into Video Editorial
AI video prompts — overhead storyboard desk flat-lay with a clapperboard, a polaroid of a neon alley, sketched scene frames, and a steaming mug under amber lamp light

온라인에서 찾을 수 있는 대부분의 AI 영상 프롬프트는 마치 사전을 통째로 쏟아부은 것 같습니다 — "시네마틱, 서사적, 하이퍼리얼, 8K, 마스터피스" — 그리고 결과물은 지난 열일곱 번의 시도와 똑같이 플라스틱 같은 복도로 렌더링됩니다. 문제는 생성기가 아닙니다. 문제는 결정 대신 형용사만 나열한 프롬프트가 모델에게 잡고 갈 만한 것을 아무것도 주지 않는다는 점입니다.

이 글은 정반대로 갑니다. 씬별로 이름 붙은 12개의 레시피, 하나하나가 카메라 오퍼레이터, 조명 감독, 사운드 디자이너가 실제로 찍을 수 있도록 한 단락에 담겨 있습니다. 모든 레시피는 다섯 가지 동일한 차원 — 카메라 무브, 조명, 렌즈, 사운드 디자인, 피사체 스테이징 — 으로 분해됩니다. 일단 이 프레임워크가 손에 익으면, 피사체만 갈아끼우면서 구조는 그대로 유지할 수 있습니다. 어느 것이든 에디터에 붙여 넣으면, 다섯 번째가 아니라 첫 번째 생성에서 볼 만한 컷이 나옵니다.

12개 씬은 세 가지 계열로 묶입니다. 시네마틱·스토리 중심 레시피 — 원샷 달리, 누아르 주방 매시업, 하이퍼리얼 클로즈업, 트랜스포메이션 모프 — 는 사용 중인 모델의 일관성, 립싱크, 조명을 한계까지 시험하기 위해 존재합니다. POV·다큐멘터리 스타일 레시피 — 1인칭 캐릭터 브이로그, 가짜 보디캠 영상, 말하는 동물 거리 인터뷰, 행성 카메오 개그 — 는 지금 틱톡과 쇼츠에서 가장 효율이 높은 포맷이며, 화려한 비주얼보다 구조적 프레이밍에 보상이 따릅니다. 마지막 계열인 아이코닉 IP·포맷 차용 레시피는 코미디가 즉시 알아볼 수 있는 톤과 평범한 피사체 사이의 마찰에서 살아난다는 것을 보여줍니다.

각 항목에는 복사-붙여넣기용 프롬프트 블록, "왜 이것이 통하는가" 분해, 그리고 같은 레시피를 에디터에 그대로 불러오는 원클릭 버튼이 함께 따라옵니다. 모델 이름도, 결제 장벽도, 셋업도 없습니다.

5차원 프롬프트 레시피

아래의 모든 항목은 동일한 다섯 가지 차원 — 카메라 무브, 조명, 렌즈, 사운드 디자인, 피사체 스테이징 — 위에서 작성되었습니다. 이유는 간단합니다. 생성기에게 형용사만 ("시네마틱한", "분위기 있는", "놀라운") 던지면 수백만 장의 학습 프레임을 평균 내서 평범한 결과를 돌려줍니다. 하지만 다섯 가지 구체적인 결정을 주면, 모델은 잠글 수 있는 기준점을 갖게 되고 결과물은 더 이상 평범하지 않습니다. 차원 다섯 개를 여기서 한 번 익혀두세요. 모든 레시피에서 반복됩니다.

카메라 무브가 첫 번째 결정인 이유는 그것이 쇼트의 문법을 정하기 때문입니다. 달리 인은 모델에게 "세계 안으로 들어가는 중"이라고 알립니다. 드론 리빌은 "세계를 살펴보는 중", 고정 락드오프 쇼트는 "세계를 관찰하는 중", 핸드헬드는 "세계를 쫓는 중"이라고 알립니다. 한 프롬프트 안에 두 가지를 섞으면 — "팬 하면서 줌" — 거의 항상 렌더러가 흔들리는 결과로 혼란스러워합니다. 한 가지 무브를 골라 그 호에 끝까지 충실하세요.

조명은 대부분의 프롬프트가 무너지는 지점입니다. 글 쓰는 사람들이 물리 대신 분위기 단어에 손을 대기 때문입니다. 방향(카메라 왼쪽에서 키, 뒤에서 림), 색온도(3200K 텅스텐, 5600K 데이라이트, 나트륨등과 네온의 혼합), 질감(딱딱한 정오 햇빛 대 부드러운 흐린 날 반사광)을 명시하세요. "분위기 있는 조명"은 모델에게 아무것도 주지 않습니다. "로우앵글 키, 따뜻한 텅스텐, 뒷벽에 떨어지는 단단한 그림자"는 실제로 렌더링할 수 있는 세 가지 제약을 줍니다.

렌즈는 세상이 프레임에 얼마나 담기는지, 그리고 얼마나 왜곡되는지를 결정합니다. 24mm 광각은 시청자를 방 안에 두고 카메라 쪽으로 향하는 움직임을 과장합니다. 50mm는 눈이 보는 방식대로 보고 존재가 사라집니다. 100mm 매크로는 공간을 평평하게 만들고 질감을 분리시킵니다. 아나모픽은 즉시 영화처럼 읽히는 수평 플레어를 만들어 줍니다. 초점 거리를 명시하면 모델은 더 이상 추측하지 않습니다.

사운드 디자인은 스크린샷과 영상을 가르는 차원입니다. 이 글의 모든 레시피는 시청자가 무엇을 듣는지 명시합니다 — 톤이 지정된 대사("속삭이듯, 반쯤 웃음 섞인"), 환경음 텍스처("금속 차양에 떨어지는 비, 멀리 들리는 사이렌"), 음악 대신 침묵의 선택, 또는 단 하나의 음악 큐. 오디오에 대한 결정이 없으면 렌더러는 일반적인 스톡을 끼워 넣거나 — 더 나쁜 경우 — 음소거 GIF처럼 느껴지는 컷을 남깁니다.

피사체 스테이징은 나머지 네 가지를 묶어줍니다. 누가 프레임 안에 있고, 어디에 블로킹되어 있고, 손과 눈으로 무엇을 하고 있는지. "사람이 걷는다"는 결정이 아닙니다. "택배 라이더가 모페드를 타고 카메라 왼쪽에서 오른쪽으로 1.25배 보행 속도로 지나가며, 헬멧 바이저가 살짝 열려 있다"는 한 컷입니다.

순서를 외워두세요 — 카메라, 조명, 렌즈, 사운드, 스테이징 — 그러면 템플릿을 보지 않고도 프롬프트를 쓸 수 있습니다. 또는 레시피가 미리 로딩된 에디터를 열고 저희 것 중 하나를 자기 피사체에 맞춰 다시 쓰셔도 됩니다.

시네마틱·스토리 중심 프롬프트

이 갤러리의 첫 네 가지 AI 영상 프롬프트는 한 가지 야망을 공유합니다 — 피드에서 스와이프해서 지나치지 않고 40인치 화면에서 끝까지 보고 싶게 만드는 것. 각각 한 가지 어른용 영화 문법 — 길게 끊기지 않는 카메라 무브, 명암 대비가 강한 취조실 조명, 조용한 대사 클로즈업, 원테이크 모프 — 에 기대고, 그 문법을 프롬프트 전체를 떠받치는 내력벽처럼 다룹니다. 점프 컷도, 컴필레이션 몽타주도, 화면 위 자막도 없습니다. 그림 자체가 감정을 짊어져야 합니다.

네 가지에 공통된 DNA는 같습니다. 시각적으로 모든 항목은 한 가지 카메라 언어를 고정하고 유지합니다: 달리, 블라인드, 50mm 인물, 락드오프 와이드. 음향적으로는 어느 것도 음악 베드에 의존하지 않습니다. 룸톤, 비, 시계 소리, 호흡이 무거운 일을 떠맡아서 모델이 트랙 뒤에 숨는 대신 디제틱 오디오를 렌더링하도록 강제합니다. 구조적으로 각 프롬프트는 피사체, 동작, 렌즈, 조명, 사운드, 엔딩을 대체로 그 순서대로 명시합니다 — 뒤에서 풀어볼 5차원 레시피입니다. 이게 "시네마틱한" 프롬프트가 분위기 단어 죽으로 무너지지 않게 막아주는 장치입니다.

1 — 비에 젖은 골목을 가르는 네온 달리

비에 젖은 네온 골목을 천천히 통과하는 달리 쇼트, AI 영상 프롬프트의 기준 씬으로 사용됨

이건 원샷 자랑 — 기본 모델이 3초 이상 한 프레임을 유지할 수 있는지 확인하고 싶을 때 돌리는 프롬프트입니다. 카메라는 단 한 가지 일만 합니다: 새벽 2시 도쿄 뒷골목을 천천히, 앞으로, 미끄러져 갑니다. 도시는 카메라 주변에서 자기 일을 합니다. 왼쪽에는 김을 내뿜는 라멘 포장마차. 오른쪽에는 모페드를 타고 부드럽게 지나가는 택배기사. 머리 위 한자 간판의 핑크와 시안 반사를 담은 물웅덩이들. 편집도, 컷도, 줌도 없이 — 전체 쇼트는 한 번의 조용한 60미터 푸시이고, 시험 대상은 시차, 반사, 안개가 끝까지 일관되게 유지되는가입니다. 나중에 같은 엔진으로 북 트레일러용 구조화된 비트를 다룰 생각이라면, 이게 그 예행 연습입니다.

원문 그대로 복사해서 붙여넣으세요:

A continuous unbroken dolly shot moving forward at 1.2x walking pace down a narrow Tokyo back alley at 2 a.m., shot anamorphic 2.39:1 on a wide cinema lens, slight ground-level perspective. The alley is wet from recent rain, puddles holding pink and cyan reflections of overhead neon kanji signage, atmospheric haze in the deep background, steam rising from a noodle stall vent on the left, a lone courier on a moped easing past on the right, no other foot traffic. Horizontal anamorphic lens flares streak off the neon signs as the camera passes. Lighting is mixed neon practicals only, no key light, deep shadows in doorways. Sound: constant rain hiss on pavement, distant traffic rumble, a faint Japanese AM radio bleeding from the noodle stall, no music. The shot ends with the camera still moving forward as the alley curves out of frame.

이 프롬프트가 러닝타임을 벌어들이는 이유는 모든 차원이 한 가지 일만, 오직 한 가지 일만 하기 때문입니다. 카메라는 단일 연속 달리에 묶여 있어서 모델이 일관성 흐트러짐을 가리려고 컷어웨이에 기댈 수 없습니다. 렌즈 선택 — 아나모픽 2.39:1 — 은 화면비를 고정하고, 어떤 피사체보다 먼저 "이건 영화다"라고 팔리는 수평 플레어 줄기를 엔진에게 허락합니다. 조명은 프랙티컬만 사용하도록 명시되어 있어서, 네온 사인이 장식 텍스처가 아니라 실제 광원으로 작동하도록 강제합니다. 디제틱 사운드 베드가 조용한 자랑입니다: 스코어가 없다는 건 비와 라디오가 깔끔하게 렌더링되어야 한다는 뜻입니다. 그리고 피사체 스테이징은 거의 빼기에 가깝습니다 — 모페드 하나, 포장마차 하나, 다른 사람 없음 — 그래서 골목 자체가 주인공이 됩니다.

핵심 비주얼: 아나모픽 2.39:1로 젖은 포장도로를 가르는 1.25배 보행 속도 달리, 네온 플레어가 수평으로 줄을 그음. 핵심 사운드: 빗소리, 멀리 들리는 차량 소음, 라멘 포장마차에서 새어 나오는 희미한 일본 라디오, 무음악.

2 — 흑백 토스터 형사가 샌드위치를 취조한다

1940년대 누아르 취조실에 토스터 형사와 샌드위치 용의자가 등장하는, 가장 재미있는 AI 영상 프롬프트 중 하나의 장면

생성기에 1940년대 취조실을 던지면 예쁜 결과가 나옵니다. 1940년대 취조실에 크롬 2구 토스터를 형사로, 햄 샌드위치를 용의자로 던지면, 다른 모든 차원이 진지한 표정을 유지할 때에만 농담이 살아납니다. 전구가 흔들립니다. 베네치안 블라인드가 두 "얼굴"에 움직이는 그림자 막대를 던집니다. 샌드위치의 양상추 옆으로 연기가 피어오릅니다. 토스터 레버가 마치 숨쉬듯 부드럽게 딸깍거립니다. 씬 안의 누구도 — 내레이션, 사운드 디자인, 렌즈 선택, 조명 — 한쪽이 주방 가전이라는 사실을 인정하지 않으며, 바로 그 때문에 통합니다. 같은 5차원 골조의 일부는 같은 다섯 차원 위에 만든 호러 스토리 프롬프트 레시피에도 나타납니다. 코미디 대신 위협으로 같은 기법을 보고 싶다면 그쪽도 참고하세요.

원문 그대로 복사해서 붙여넣으세요:

A 1940s film noir interrogation room, shot in black and white on 35mm with visible grain, single bare bulb swinging slowly overhead. Hard chiaroscuro lighting, venetian blinds on the unseen window throwing moving horizontal shadow bars across both faces in the frame. On one side of a battered wooden table sits a chrome two-slice toaster, lever up. Opposite it, on a small enamel plate, sits a single ham sandwich. Camera holds a medium two-shot then slowly pushes in, shallow depth of field, focus pulling between the toaster slot and the sandwich crust. Cigarette smoke curls up between them. Sound: a tinny voice-over monologue in a 1940s radio-announcer register delivering one straight noir interrogation line, distant saxophone, a ticking wall clock, the soft mechanical click of the toaster levers as breathing. No laugh track. The scene ends on the bulb still swinging.

여기서 작동하는 메커니즘은 다섯 차원 모두에 걸친 톤의 일관성입니다. 카메라는 클래식 누아르 스테이징을 하고 있고 — 미디엄 투샷에서 포커스 풀로 들어가는 푸시 — 부조리를 향해 윙크하길 거부합니다. 조명은 명시적으로 단단한 명암 대비와 움직이는 블라인드 그림자로 지정되었고, 이게 대부분의 싸구려 누아르 프롬프트가 잃는 룩입니다. 35mm 그레인 플레이트는 모델에게 깨끗한 디지털 표면을 만들어내는 대신 잠글 수 있는 질감을 줍니다. 사운드 디자인이 농담 전체를 짊어집니다: 진지하게 전달되는 1940년대 라디오 톤, 색소폰, 벽시계, 그리고 호흡으로 재배치된 토스터 레버 — 누구도 "웃긴"이라고 말하지 않으면서 코미디 일을 합니다. 피사체 스테이징은 — 탁자 위 두 물체 — 엔진이 숨을 컷어웨이 공간을 남기지 않습니다.

핵심 비주얼: 흔들리는 전구 하나 아래에서 크롬 토스터와 햄 샌드위치 위로 블라인드가 수평 그림자 막대를 가르는 장면. 핵심 사운드: 양철 소리 같은 누아르 내레이션, 멀리 들리는 색소폰, 벽시계의 째깍 소리, 호흡처럼 딸깍이는 토스터 레버.

3 — 주차된 차 안의 하이퍼리얼 클로즈업 고백

밤에 차 안에서 조용한 한 마디를 내뱉는 운전자의 빡빡한 50mm 클로즈업, AI 영상 프롬프트의 립싱크 벤치마크

이건 립싱크 스트레스 테스트입니다. 한 사람이 밤에 주차된 차의 운전대 뒤에서 조수석에 있는 화면 밖의 누군가에게 단 한 마디만 합니다: "전화 다시 했어야 했는데." 차는 움직이지 않습니다. 와이퍼는 꺼져 있습니다. 다른 대사도, 음악도, 두 번째 앵글도 없습니다 — 단 하나의 빡빡한 50mm 인물 쇼트와 한 번의 숨. 진짜로 평가하는 건 음소와 프레임 사이의 간격입니다: 입 모양, 눈의 미세한 표정, 호흡이 모두 같은 머리 위에 살고 있는가. 같은 감정 절제 규율이 저희 잠자리 동화 영상 생성기에도 나타납니다. 더 부드러운 용도에 똑같은 "그림이 숨 쉬게 두라" 규칙을 적용합니다.

원문 그대로 복사해서 붙여넣으세요:

A tight 50mm portrait close-up of a single character sitting behind the wheel of a stationary car at night, parked on a quiet street. Camera is locked, framing eyes to chin, shallow depth of field with focus on the eyes. Lighting is dashboard amber backlight tracing the jawline plus one slow pass of a streetlight crossing the face from left to right, no key light. Rolling rain blur on the windshield behind. The character looks slightly off-camera toward an unseen passenger and delivers exactly one quiet line, just above a whisper, in native lip-sync audio: 'I should have called you back.' One visible breath after the line, then a small swallow, then stillness. Sound: dull patter of rain on the car roof, distant single car door slamming, ambient interior cabin tone, no music, wipers off. End on the held look.

이 프롬프트는 각 차원이 무엇을 하지 않는지 정확히 명시함으로써 절제력을 벌어들입니다. 카메라는 락드 — 핸드헬드 드리프트 없음, 푸시 인 없음, 랙 없음 — 그래서 프레임 안의 유일한 움직임은 얼굴과 가로등의 스침뿐입니다. 렌즈는 눈에 초점을 맞춘 50mm 인물 렌즈로 주어져 있어서, 대부분의 생성기가 기본값으로 잡는 더 넓고 평평한 "인터뷰" 룩을 피하게 합니다. 조명은 전적으로 프랙티컬에서 옵니다: 대시보드 앰버에 더해 움직이는 가로등, 필 라이트 없음. 사운드 사양은 거의 빼기에 가깝습니다 — 비, 멀리 들리는 차 문, 캐빈 톤 — 대사를 믹스 정중앙에 홀로 남겨서 립싱크가 숨을 곳이 없게 합니다. 그리고 피사체는 한 마디를 하고 멈추도록 스테이징됩니다. 대부분의 프롬프트가 잊는 동작입니다.

핵심 비주얼: 락드 50mm 클로즈업, 눈에 맞춘 초점, 턱선을 그리는 대시보드 앰버, 가로등 한 번의 스침. 핵심 사운드: 속삭임 직전의 한 줄, 차 지붕 위의 비, 멀리서 한 번 닫히는 차 문, 캐빈 톤, 무음악.

4 — 90초 한 번의 패스로 끝내는 차고 글로업 모프

지저분한 차고가 깔끔한 홈짐으로 바뀌는 세로 원테이크 모프, AI 영상 프롬프트의 변신 템플릿

변신 영상은 쇼츠와 릴스에서 가장 과도하게 소비되는 포맷이고, 그래서 AI 버전은 단 한 번에 끝내야 합니다. 지저분한 교외 차고 — 기대어 선 자전거, 부서진 골판지, 죽은 천장 전구 — 가 카메라 앞에서 깔끔한 홈짐으로 변합니다. 90초, 컷 없음. 소품은 디졸브가 아니라 모션 블러로 교체됩니다. 형광등이 따뜻하게 바뀌어 열린 문으로 들어오는 늦은 오후 햇빛으로 옮겨갑니다. 프레임 안에 사람은 한 명도 없는데, 이게 영상이 리노베이션 브이로그로 흘러가지 않게 막고 공간 자체에 초점을 유지시킵니다.

원문 그대로 복사해서 붙여넣으세요:

A vertical 9:16 single continuous shot, locked-off wide of a cluttered suburban two-car garage interior. No human characters in frame at any point. The garage begins messy: leaning bicycles, stacked broken cardboard boxes, an oil-stained concrete floor, a dead overhead fluorescent tube. Over ninety seconds the space transforms in one unbroken take: boxes fade and morph into stacked rubber gym tiles, bikes swap-morph into a rack of dumbbells, the dead bulb warms on and shifts into late-afternoon golden-hour sun spilling through the open garage door, a hanging fern fades in, framed posters resolve on the back wall. Props transition with subtle motion blur, no hard dissolves. Lighting shifts gradually from cold blue fluorescent to warm gold. Sound: a barely-conscious rising synth bed, a single dumbbell clatter as the midpoint cue, last five seconds drop to clean room tone and one breath. End on the finished gym, still locked.

여기서는 구조가 일을 합니다. 카메라는 락드오프, 세로 9:16이므로 엔진은 절대 무브를 만들어낼 필요가 없습니다 — 모든 프레임 변화는 프레임 안쪽에서 와야 합니다. 소품 교체에 "모션 블러, 하드 디졸브 없음"을 명시하는 것이 프롬프트에서 가장 중요한 한 줄입니다. 모델에게 하지 말아야 할 것(게으른 크로스페이드)을 알려주고, 포맷이 실제로 요구하는 모프 동작으로 밀어 넣기 때문입니다. 조명은 컷이 아니라 연속적인 전환으로 작성되어, 방이 교체되는 게 아니라 따뜻해지는 느낌을 줍니다. 사운드 베드는 의도적으로 거의 없습니다 — 상승하는 신스 하나, 덤벨 큐 하나, 5초의 호흡 — 그리고 "사람 등장 안 함" 규칙이 변하는 공간 자체에 초점을 유지시킵니다.

핵심 비주얼: 락드 세로 9:16 와이드, 모션 블러로 교체되는 소품, 차가운 형광 블루에서 따뜻한 골드로 따뜻해지는 빛. 핵심 사운드: 거의 의식 밑의 상승하는 신스, 중간 지점의 단일 덤벨 소리, 5초간의 깨끗한 룸톤.

POV·다큐멘터리 스타일 프롬프트

이 네 가지 AI 영상 프롬프트는 한 가지 트릭을 공유합니다: 카메라가 직업이 있는 척합니다. 헬멧 셀카 캠, 경찰 보디캠, 길거리 기자의 뉴스 장비, 일반인은 절대 갈 수 없는 곳에 떨군 카메오 렌즈 — 각각 이미 세상에 존재하는 영상의 포맷을 빌려와서, 그 빌린 권위를 이용해 불가능한 것을 팝니다. 무표정이 엔진입니다. 화면 안의 누구도 윙크하지 않습니다. 프레임은 자신이 진짜라고 우기고, 농담(또는 경이)은 그게 진짜일 수 없다는 독자의 조용한 깨달음에 자리잡습니다.

네 가지에 공통된 DNA는: 핸드헬드 마이크로 셰이크 또는 기관용 어안렌즈, 스코어 음악 대신 동기 부여된 디제틱 사운드, 속삭임이나 둔탁한 목소리 위의 네이티브 립싱크, 기기를 알리는 화면비(9:16 폰, 4:3 보디캠, 16:9 방송), 그리고 각본 씬처럼 마무리되지 않는 배경 디테일 한 순간 — 실제 영상은 좀처럼 깔끔하게 매듭짓지 않으니까요. 이 다섯 가지를 맞추면, 포맷은 구성된 것이 아니라 포착된 것으로 읽힙니다.

5 — 사막 경비병의 칸티나 화장실 브이로그

갈라진 타일이 깔린 칸티나 화장실에서 거친 형광 그린 조명 아래 무장한 사막 초소 경비병의 세로 셀카 캠 프레임, AI 영상 프롬프트 템플릿

이 쇼트는 외딴 사막 초소의 무장 경비병이 길가 칸티나의 갈라진 타일 화장실에서 세면대에 기대 찍는 연속 세로 셀카입니다. 그는 룸메이트가 마지막 비상식량 바를 먹어치운 것에 대해 불평하고 있습니다. 얼굴은 완전히 가려져 있어서, 연기는 헬멧 기울기, 둔탁한 목소리 리듬, 자유로운 손의 작은 갑옷 제스처에 살고 있습니다. 천장 형광등이 바이저를 시큰한 녹색으로 씻습니다. 뒤쪽 거울에는 망토를 두른 실루엣이 열린 출입구를 지나갑니다. 그는 전혀 눈치채지 못합니다. 그 한 번의 놓친 배경 이벤트가 이 씬을 코스튬 콩트에서 알고리즘이 "잠깐, 방금 뭐였지?"라며 보상해주는 무언가로 뒤집습니다.

원문 그대로 복사해서 붙여넣으세요:

Vertical 9:16 handheld selfie video, point-of-view of a fully armored desert outpost guard in a white helmet and chest plate, holding his own phone-cam at arm's length in front of a dusty bathroom mirror inside a roadside cantina. He vents directly to camera about his roommate eating his rations, voice muffled from inside the helmet, head tilting in small frustrated arcs. Cracked tile walls behind him, harsh overhead green fluorescent buzzing, slight greenish cast on the visor, subtle vertical handheld wobble, occasional autofocus hunt. In the mirror reflection a robed figure walks past the open doorway behind him; he does not react. Distant cantina music thumps through the closed door, a toilet flushes off-frame, armor plates squeak against the sink edge. End on him sighing and lowering the phone.

카메라 선택이 대부분의 일을 합니다: 팔 길이로 잡은 폰은 9:16 프레임, 마이크로 셰이크, 그리고 "이건 렌더링이 아니라 진짜 업로드다"라는 신호를 보내는 오토포커스 헌트를 강제합니다. 유일한 광원을 천장 위에 두고 형광 그린으로 물들이면, 보안 카메라가 보여주는 정확한 피부톤 레지스터로 바이저가 칠해집니다. 그래서 헬멧은 코스튬이 아니라 작업복으로 읽히기 시작합니다. 헬멧 안의 목소리를 둔탁하게 만들면 오디오가 소품의 기하학에 고정되고, 다른 모든 소리(칸티나 박동, 변기 물, 끽 소리)를 디제틱 소스로 한정하면 씬이 "각본 쇼츠" 레지스터에서 벗어납니다. 알아채지 못한 실루엣이 스크롤을 멈추게 하는 요소입니다 — 자기만의 한 프레임 서프라이즈를 던지면 포맷이 완성됩니다. 어느 것이든 에디터에 붙여 넣고 경비병 대신 기사, 심해 잠수부, 또는 하즈맷 기술자로 이 골격을 재실행할 수 있습니다.

핵심 비주얼: 헬멧 바이저에 반사되는 형광 그린, 그 뒤로 알아채지 못한 채 거울을 가로지르는 망토 인물. 핵심 사운드: 헬멧 안에서 둔탁하게 새어 나오는 불평, 멀리 들리는 칸티나 박동, 화면 밖에서 들리는 변기 물 내려가는 소리.

6 — 가정 분쟁 신고 현장의 빅풋 보디캠 영상

교외 주방에서 차분히 설거지를 하는 포토리얼 빅풋의 경찰 보디캠 어안렌즈 프레임, 타임코드 번인, AI 영상 프롬프트 기관용 카메라 템플릿

설정은 교외 듀플렉스로 들어가는 소음 신고 출동이고, 가슴에 장착한 경찰 보디캠의 광각 어안렌즈로 열립니다. 경관의 손전등 빔이 복도를 가로지르며 흔들리고, 그 뒤 주방 출입구를 향해 올라갑니다. 거기에는 완전히 설득력 있는 빅풋이 싱크대에서 설거지를 하고 있습니다. 그가 돌아서 어깨너머로 정중한 으르렁 소리를 내고 다시 설거지로 돌아갑니다. 보디캠은 영화 촬영감독이라면 다시 잡았을 방식으로 절대 다시 잡지 않습니다. 타임코드는 모퉁이에서 계속 번인 됩니다. 그림자 속에서 저해상도 센서 노이즈가 기어다닙니다. 농담 전체는 카메라가 — 미확인 생물체를 제시하는 게 아니라 — 자신의 진짜 일, 정기 안위 확인을 기록하고 있다고 믿는지에 달렸습니다. 이것은 모든 "기관용 카메라가 만난 불가능한 피사체" 쇼츠의 템플릿이며, 톤이 더 어두워져야 할 때 같은 다섯 차원 위에 만든 호러 스토리 프롬프트 레시피 옆에 편하게 자리잡습니다.

원문 그대로 복사해서 붙여넣으세요:

Police body-worn camera footage, chest height, wide-angle fisheye lens with mild rolling shutter, white time-code burn-in 02:14:33 with a battery icon in the upper right, low-resolution sensor noise in the shadows. A uniformed officer enters the front door of a suburban duplex on a noise complaint, duty-belt flashlight beam striping the hallway wall. The beam swings up to a kitchen doorway and finds a fully photoreal Bigfoot at the sink, rinsing dishes calmly under a yellow ceiling light, fur damp at the wrists. He glances over his shoulder, gives a polite low rumble, then returns to scrubbing. Crackling police radio dispatch, running sink water, soft 90s soft rock leaking from a neighbor's apartment, no scored music. End on the officer pausing in the doorway, flashlight still raised.

환상 전체는 크리처 작업이 아니라 카메라 물리학 위에서 굴러갑니다. 프레임 가장자리의 어안 왜곡, 경관이 돌아설 때의 살짝 흔들리는 롤링 셔터, 모퉁이의 타임코드, 그리고 유일한 추가 광원으로서의 손전등 — 시청자가 무의식적으로 "진짜 보디캠"으로 읽는 네 가지 신호입니다. 듀티 벨트 손전등을 키 라이트로 두면 털이 균일한 영화적 와시 대신 단단하고 동기 부여된 빔으로 줄무늬가 생기는데, 이게 정확히 "크리처 영화"와 "포착된 영상"의 차이입니다. 오디오 스택 — 라디오 지지직, 싱크대 물, 이웃의 소프트 록, 미확인 생물체의 낮은 대화체 으르렁거림 — 은 모든 음원을 디제틱으로 유지합니다. 스코어 없음. 연출 없음. 정중하게 어깨너머로 돌아보는 동작이 펀치라인입니다.

핵심 비주얼: 주방 싱크대 위 젖은 빅풋 털을 가르는 어안렌즈 손전등 빔, 모퉁이에는 여전히 번인 되는 타임코드. 핵심 사운드: 흐르는 수돗물과 이웃집 90년대 소프트 록 아래에 깔린 경찰 라디오 지지직.

7 — 빵 부스러기 가격에 대한 길거리 비둘기 인터뷰

분주한 광장에서 폼 커버 뉴스 마이크에 답하는 철제 난간 위 비둘기의 핸드헬드 거리 인터뷰 프레임, AI 영상 프롬프트 가짜 진짜 인터뷰 템플릿

프레임은 부드러운 오후 햇빛 속 분주한 도시 광장에서 열립니다. 길거리 기자의 폼 커버 마이크가 프레임 왼쪽 가장자리에서 들어오고, 마이크 플래그에는 브랜드가 없고, 카메라는 사람 눈높이의 철제 난간에 앉은 비둘기로 초점을 옮깁니다. 기자가 화면 밖에서 2026년 빵 부스러기 가격 상승에 대한 의견을 묻습니다. 비둘기가 깨끗한 인간의 목소리로, 무표정하게, 억양 없이 대답합니다. 관광객들이 활짝 열린 조리개에 흐려진 채 지나갑니다. 끝부분에 화면 밖 웃음 하나가 새어 들어옵니다. 농담은 구조적입니다: 진짜 길거리 인터뷰의 포맷을 100% 진지하게 연기하고, 인터뷰 대상자가 우연히 새일 뿐입니다. 농담을 대본에 쓰지 마세요. 프레이밍이 짊어지게 두세요.

원문 그대로 복사해서 붙여넣으세요:

Handheld 16mm-wide street interview shot in a busy European plaza, soft overcast afternoon light. A foam-covered news microphone with an unbranded blue mic flag drops into frame from the left at chest height. The camera racks focus from the mic foam onto a single pigeon perched at human eye-level on a polished iron railing, feathers in sharp detail, background tourists blurred out by a wide-open aperture. Offscreen reporter asks the pigeon, in a level professional tone, for its view on the 2026 cost-of-crumbs crisis. The pigeon turns its head once, then answers in a deadpan clear human male voice with one slow sentence. Live street ambience — footsteps, distant car horns, a tram bell — soft mic-handoff thunk, one quiet laugh from offscreen at the tail. End on the pigeon staring directly into the lens.

활짝 열린 조리개의 랙 포커스가 포맷을 파는 영상 작업 전부입니다. 렌즈를 마이크 폼에서 시작해 비둘기 눈으로 끌어당기면, 프롬프트는 방송 저널리스트가 실제로 사용하는 카메라 언어로 생성기를 밀어 넣고, 한 마디가 나오기 전에 이미 "진짜 길거리 취재"라는 신호가 갑니다. 브랜드 없는 마이크 플래그는 실제 방송사 로고를 렌더링하기 꺼리는 어느 모델도 피해 가면서 기관 실루엣은 그대로 유지합니다. 조명은 의도적으로 중성 흐림으로 둡니다 — 화창한 거리 인터뷰는 연출된 듯 보이고, 흐린 거리 인터뷰는 계획되지 않은 듯 보입니다. 오디오는 완전히 디제틱입니다: 라이브 광장 소음, 마이크의 작은 물리적 쿵 소리, 비둘기의 무표정 한 마디, 그리고 사람이 안 보여도 인간 스태프가 있다는 걸 확인시키는 화면 밖 웃음 하나.

핵심 비주얼: 광장 관광객이 멀리서 흐려지는 동안 마이크 폼에서 비둘기 눈으로 옮겨가는 초점. 핵심 사운드: 거리 소음과 마이크의 쿵 소리, 그 아래 비둘기의 평탄한 한 줄 답변.

8 — 카메오 자기 삽입: 화성 표면에서의 아침 요가

새벽 붉은 화성 평원에서 우주복 안 카메오 얼굴이 나무 자세를 잡고 있는 와이드 아나모픽 프레임, 멀리 떠오르는 포보스, AI 영상 프롬프트 자기 삽입 템플릿

카메오 모티프는 독자 본인의 알아볼 수 있는 얼굴을, 절대 설 수 없는 장소에 가져다 놓습니다. 여기서는 새벽의 화성 평원의 와이드 아나모픽 비스타입니다: 흰색-주황색 우주복, 프레임을 가로질러 옆으로 흐르는 구리빛 붉은 먼지에 대항해 잡은 나무 자세, 멀리 분화구 능선 위로 솟아오르는 포보스, 지평선을 가로질러 펼쳐지는 태양 플레어. 헬멧 유리는 시안과 장미빛 하늘을, 그리고 희미하게 독자 본인의 턱선을 반사합니다. 핵심은 풍경의 신선함이 아니라 — 불가능한 조명 아래 프레임마다 얼굴 앵커가 일관되게 유지되는가입니다. 프롬프트의 카메오 피사체를 이름이 붙은, 고정된 레퍼런스로 다루고, 그다음 환경, 렌즈, 우주복을 명시하면 생성기에 남는 유일한 변수는 얼굴 주변의 세계뿐입니다.

원문 그대로 복사해서 붙여넣으세요:

Wide cinematic anamorphic 2.39:1 shot at dawn on a red Martian plain, a single figure (cameo subject, face visible through the helmet glass) in a white-and-orange spacesuit holding a tree-pose yoga stance on a flat rocky outcrop. Copper-red dust drifts laterally across the foreground in slow ribbons, Phobos rises low over a distant crater rim, a sun flare opens horizontally across the top of frame. Helmet visor reflects a cyan-and-rose sky and a sliver of the subject's own jawline. Hold the pose for the duration of the shot, only the suit's chest plate rising and falling with breath. Soundtrack is the hush of suit-internal breath through a regulator, an impossibly thin high wind, and a single low synthesised heartbeat layered underneath. End on the sun cresting the crater rim.

얼굴이 자산이고 나머지는 모두 스테이징입니다. 프롬프트 맨 위에 카메오 피사체를 고정된 레퍼런스로 명명하면 생성기에게 정체성이 바이저를 스치는 모든 반사와 먼지 흐름을 견뎌야 한다고 알립니다 — 그게 80번째 프레임에서 얼굴이 평범한 우주인으로 흘러가는 것을 막는 방법입니다. 아나모픽 2.39:1 프레임은 지평선에 숨 쉴 공간을 주고, 카메오를 비좁게 만들지 않으면서 인물을 하단 1/3로 밀어 넣습니다. 바이저를 하늘 색(과 피사체 본인 턱의 일부)을 위한 반사 표면으로 사용하는 것이 스톡 우주복 쇼트를 초상화로 바꿉니다. 오디오는 대부분 침묵입니다 — 레귤레이터 호흡, 얇은 바람, 심장 박동 하나 — 추가되는 어떤 레이어도 시청자의 주의를 두고 얼굴과 경쟁할 것이기 때문입니다.

핵심 비주얼: 멀리 화성 분화구 위로 포보스가 솟아오르는 동안 시안 하늘을 반사하는 헬멧 바이저 안의 카메오 얼굴. 핵심 사운드: 상상할 수 없을 만큼 얇은 바람과 합성된 심장 박동 하나 아래의 레귤레이터 호흡.

아이코닉 캐릭터·포맷 차용 프롬프트

다음 네 가지 AI 영상 프롬프트는 동일한 코미디 엔진 위에서 굴러갑니다: 알아볼 수 있는 캐릭터 아키타입을 잘못된 방에 떨어뜨리거나, 친숙한 시대 포맷을 외과적 정밀도로 재구성하고, 카메라를 향해 윙크하기를 거부하는 것. 네 가지 중 어느 것도 저작권이 있는 캐릭터나 감독의 이름을 직접 부르지 않습니다 — 의도적입니다. 독자는 5분 안에 다시 칠할 수 있는 구조적 템플릿으로서 망토 두른 악당, 작가주의 톤, 1986년 시리얼 광고, 불가능한 ASMR 루프를 받습니다. 공유된 규칙은 톤 일관성입니다: 헬멧은 벗기지 않고, 보이스오버는 절대 웃지 않으며, 스캔라인은 단 한 프레임도 깜빡이지 않습니다.

아래 모든 항목에서 시각 언어는 통째로 빌려옵니다(캐빈 렌즈, 락드오프 거실, VHS 채도, 매크로 오버헤드), 음향 언어는 더 강하게 빌려오며(PA 차임, 거친 톤, 슬랩 베이스 징글, 유리 대 유리 차임), 구조적 트릭은 동일합니다: 낮은 지위(또는 불가능한) 작업에 적용된 높은 지위 톤. 모든 프롬프트는 렌즈, 조명, 사운드 베드, 그리고 정확한 마지막 비트를 명시합니다 — 농담은 생성기가 흘러가는 순간 죽기 때문입니다.

9 — 망토 악당이 6시간 항공 승무원 교대 근무를 한다

검은 헬멧을 쓴 망토 악당이 저가 항공사 캐빈 통로에서 안전 카드를 시연하는, AI 영상 프롬프트 캐빈 프레임

흐르는 검은 망토와 광택 나는 검은 헬멧을 쓴 키 큰 인물이 단거리 저가 항공편의 좁은 통로에 서서, 검은 장갑 낀 손으로 코팅된 안전 카드를 들고 있습니다. 길고 붉은 광선검이 서비스 카트 열쇠 옆 벨트에 깔끔하게 클립으로 꽂혀 있습니다. 그는 그날의 네 번째 비행에 든 승무원의 인내심으로 안전벨트 버클을 시연합니다. 두 줄 뒤에서는 아기가 울고 있습니다. 객실 승무원이 음료를 들고 그를 돌아 지나갑니다. 누구도 코스튬, 호흡, 검을 알아채지 않습니다. 농담은 반응의 부재입니다 — 악당을 포함한 모두가 그저 근무를 마치려 애쓰고 있을 뿐입니다.

원문 그대로 복사해서 붙여넣으세요:

Tight 24mm cabin lens, narrow aisle of a discount short-haul airliner mid-flight, slow dolly forward at walking pace. A tall figure in flowing dark robes and a polished black helmet, long cape brushing seat headrests, demonstrates the seat-belt buckle of a laminated safety card to two seated passengers. A red glowing blade is clipped to his belt next to a service-cart key. Overhead reading lights cast soft top-light, picking out the helmet curve and the seat-back fabric. Sound: heavy mechanical breathing inside the helmet, cabin PA chime, plastic seat-belt clack as he demonstrates, plastic cups rattling on a trolley behind him, a baby crying two rows back, no music. Photoreal. Final beat: he nods once, lowers the safety card, the dolly stops. Generic costume, no franchise logos.

24mm 캐빈 렌즈가 무거운 일을 하는 이유는 통로를 압축해서 망토가 진짜 좌석 등받이를 스치게 강제하기 때문입니다 — 그 접촉이 스테이징을 팝니다. 필름 키 대신 천장 독서등을 두면 조명이 정직하게 형광이 되고, 그래서 코스튬이 시네마틱이 아니라 어울리지 않게 보입니다. 느린 전진 달리는 기내 안전 시연의 리듬을 반영하며 관객이 헬멧 바이저에 김 서리는 호흡을 보게 합니다. 사운드 쪽에서는 PA 차임 아래 헬멧 호흡이 감정적 페이오프 전부입니다 — 교통수단에서 가장 지루한 안내 위에 겹친 고급 위협. 마지막 비트의 끄덕임은 편집자에게 깨끗한 컷 포인트를 줍니다.

핵심 비주얼: 캐빈 천장 독서등 아래 코팅된 안전 카드의 모서리를 집은 망토 두른 검은 헬멧 인물. 핵심 사운드: 명랑한 PA 차임과 멀리서 들리는 아기 울음 아래 깔린 무거운 기계 호흡.

10 — 무표정 다큐멘터리 감독이 이케아 조립을 내레이션한다

창문 햇빛 아래 거실 카펫 위에서 플랫팩 가구를 조립하는 손들, AI 영상 프롬프트 작가주의 내레이션 프레임

거실 단일 쇼트, 눈높이에서 락드오프, 햇빛이 창문을 통해 옆에서 맨바닥과 반쯤 조립된 플랫팩 옷장에 쏟아져 들어옵니다. 손이 프레임으로 들어왔다가 나갑니다: 다월을 돌리고, 패널을 정렬하고, 알렌 렌치를 질문처럼 들고 있습니다. 조립자의 얼굴은 결코 보이지 않습니다 — 몸통과 손, 그리고 천천히 쌓이는 골판지뿐입니다. 그 위에 거친 유럽 억양의 목소리가 긴 휴지를 두고 미리 뚫린 구멍의 무관심과 육각 키의 조용한 굴욕에 대해 읊조립니다. 목소리는 절대 올라가지 않습니다. 손은 절대 멈추지 않습니다. 옷장은 클립 안에서 절대 완성되지 않습니다.

원문 그대로 복사해서 붙여넣으세요:

Static locked-off mid-shot, living room interior at eye level, soft daylight from a window camera-right falling across bare floorboards and a half-assembled flat-pack wardrobe. A pair of hands enters frame, turns a wooden dowel into a particleboard panel, tests an Allen wrench against a hex bolt. Mid-shot of the assembler's torso only — no face visible, neutral grey sweatshirt, cardboard scattered around. Occasional close-up cutaways to a single screw spinning, a torn corner of cardboard. Sound: slow gravelly European-accented voice-over with long pauses, the click of plastic dowels seating, cardboard tearing, distant traffic outside, no music. Photoreal. Final beat: the hands set the Allen wrench down on the floor; voice-over trails off mid-sentence. Generic flat-pack, no brand text.

락드오프 미디엄 쇼트가 보이스오버에게 숨 쉴 공간을 주는 이유는 — 어떤 카메라 움직임도 톤과 경쟁할 것이고, 톤이 농담 전체이기 때문입니다. 측면 창문 햇빛은 의도적으로 불친절합니다. 작업에서 시네마틱한 미화를 제거하고, 내레이션이 진짜 가정의 순간에 대해 코멘트하는 느낌을 만듭니다. 조립자의 얼굴을 프레임 밖에 두면 손이 유일한 캐릭터가 되고, 누구도 가시적으로 연기하지 않으면서 유럽 억양의 목소리가 감정적 톤을 짊어질 수 있게 합니다. 골판지 찢는 소리와 다월 딸깍 소리의 폴리는 대화 볼륨에 자리잡아 내레이션이 사운드 베드와 주의를 두고 경쟁할 필요가 없게 합니다.

핵심 비주얼: 햇빛이 든 거실 카펫 위에서 반쯤 조립된 옷장 패널 위로 알렌 렌치를 든 손들. 핵심 사운드: 플라스틱 다월 딸깍 소리와 희미한 바깥 교통 소음 위 느리고 거친 보이스오버.

11 — 가짜 브랜드를 위한 1986년 시리얼 광고

체크 무늬 벽지의 주방 식탁에 앉은 파스텔 윈드브레이커 차림의 세 아이, AI 영상 프롬프트 레트로 1986 시리얼 광고 프레임

존재한 적 없는 브랜드를 위한 30초 분량의 1986년 시리얼 광고. 파스텔 윈드브레이커 차림의 세 아이가 체크 식탁보가 깔린 주방에 앉아 있고, 원색 빨강과 노랑이 번지기 직전까지 밀려 있고, 우유 가득한 그릇 안으로 미드 줌이 들어가는 동안 화면 밖에서 숟가락이 날아 들어옵니다. 네온 별빛 그래픽이 화면 하단 1/3을 가로질러 폭발합니다. 굵은 목소리의 남자 아나운서가 태그라인을 떨구고, 아이들의 합창이 슬로건을 외치고, 시리얼 박스가 빈 검은 배경 앞에서 천천히 영웅 쇼트로 회전합니다. CRT 스캔라인이 모든 프레임 위로 기어다닙니다. 농담은 브랜드가 아닙니다 — 브랜드는 비워둘 수 있게 남겨두었습니다 — 농담은 포맷이 얼마나 완벽하게 재구축되었는가입니다. 이런 시대 작업은 또한 농담이 선물이 아니라 시대 자체인 생일 영상 생성기 프로젝트의 골조로도 두 배 역할을 합니다.

원문 그대로 복사해서 붙여넣으세요:

1986 children's breakfast cereal television commercial, 4:3 safe-frame composition, heavy CRT scanlines, chroma bleed on saturated reds and yellows. Open on a kitchen with checkerboard wallpaper and a checkered tablecloth, three children aged seven to ten in pastel windbreakers smiling at camera, mid-zoom into a milky cereal bowl as a spoon flies in from the right. Cut to a neon starburst lower-third graphic, cut to the cereal box rotating slowly on a void-black hero shot. Sound: compressed mono mix, upbeat synth-and-slap-bass jingle, children's chorus chanting a four-syllable slogan, deep-voiced male announcer delivering the tagline over the final box shot, classic crunchy cereal-pour foley. Photoreal video-tape aesthetic. Generic fictional brand, no readable text.

4:3 세이프 프레임은 양보할 수 없습니다 — 와이드스크린은 즉시 시대를 깹니다. CRT 스캔라인과 채도 번짐은 필름 프롬프트에서 시대 카메라 그레인이 하는 일을 합니다. 그것이 없으면 채도 높은 빨강은 토요일 아침이 아니라 인스타그램으로 읽힙니다. 그릇으로 들어가는 미드 줌은 그 시대의 모든 시리얼 광고가 사용한 구조적 1980년대 편집 비트이고, 빈 검은 영웅 쇼트는 읽을 수 있는 이름이 없어도 브랜드를 고정시키는 마무리 타블로입니다. 슬랩 베이스 징글과 아이들의 합창은 그 시대의 시그니처 믹스입니다 — 빼면 광고는 패러디로 읽히고, 진지한 헌신으로 읽히지 않습니다. 시대 오디오가 그림이 시작한 환상을 마무리합니다.

핵심 비주얼: 우유 가득한 시리얼 그릇 안으로 들어가는 미드 줌, 오른쪽에서 들어오는 숟가락, 기어다니는 스캔라인의 4:3 프레임. 핵심 사운드: 아이들의 합창과 바리톤 아나운서 태그라인이 얹힌 슬랩 베이스 신스 징글.

12 — 유리 과일 칼 자르기 — 불가능 물리 ASMR 루프

오크 도마 위에서 투명한 유리 사과를 자르는 주방 칼의 톱다운 매크로, AI 영상 프롬프트 ASMR 루프 프레임

깨끗한 톱다운 매크로: 셰프 칼이 오크 도마 위에 놓인 투명한 크리스털 사과 하나를 실시간으로 통과해 내려갑니다. 칼날은 유리에 들어가듯이 저항을 만난 다음, 과일을 중앙에서 깨끗하게 가릅니다. 크리스탈 조각들이 천장 조명을 굴절시켜 나뭇결 위로 얇은 무지개 막대를 던집니다. 음악은 없습니다. 내레이션도 없습니다. 클립은 시작한 곳에서 정확히 끝납니다 — 두 반쪽이 살짝 흔들리다가 정지로 돌아옵니다 — 그래서 영원히 루프될 수 있습니다. 이 씬이 마음에 든다면, 같은 매크로 루프 논리 위에 다른 재료와 소품으로 만든 12개의 ASMR 전용 쇼트 레시피도 찾아보세요.

원문 그대로 복사해서 붙여넣으세요:

Top-down macro shot, locked off, 100mm lens, 0.5x speed. A chef's knife with a brushed steel blade descends slowly into a single fully transparent crystal-glass apple resting on a dark oak chopping board. The fruit splits cleanly, halves rocking apart, revealing tiny faceted glass seeds inside. Single soft overhead key light through a sheer scrim catches the blade edge and throws refracted shards of rainbow light across the wood grain. No hands fully in frame — only fingertips on the knife handle. Sound: a sharp clean glass-on-glass slicing chime as the blade enters, a low resonant ring as the halves rock, a dull wood thud as the knife taps the board, gentle ambient room tone, no music, no narration. Photoreal. Final beat: halves come to rest, three seconds of stillness for a seamless loop.

톱다운 매크로는 불가능 물리 ASMR을 파는 유일한 프레이밍입니다 — 어떤 측면 앵글도 기하학 트릭을 노출시키고 주문을 깹니다. 0.5배속의 100mm 렌즈는 굴절을 등록할 시간을 눈에게 사주며, 그것이 프롬프트가 만들어진 비주얼 페이오프입니다. 스크림을 통과한 단일 부드러운 천장 광원은 자르기를 날려버릴 수 있는 유리 표면 글레어를 피합니다. 오디오 쪽에서는 유리 대 유리 차임이 지배적 비트입니다 — 나무 쿵 소리보다 먼저 와야 하고, 그렇지 않으면 뇌가 물체를 크리스탈이 아니라 레진으로 읽습니다. 3초의 룸톤 꼬리는 루프를 매끄럽게 만드는 요소입니다. 그것이 없으면 재생 봉합선이 매번 반복할 때마다 들립니다.

핵심 비주얼: 투명한 크리스털 사과를 자르는 중인 브러시드 스틸 칼, 오크 도마를 가로지르는 무지개 굴절 조각. 핵심 사운드: 낮은 공명 울림과 둔탁한 나무 쿵 소리로 풀리는 깨끗한 유리 대 유리 차임.

렌더링을 망치는 세 가지 프롬프트 실수

프롬프트가 길어 보여도 볼 만한 렌더링을 죽이는 것들이 있습니다.

모호한 동작 동사. 가장 흔한 실패는 템포, 방향, 종착 자세를 명시하지 않고 동작을 요청하는 것입니다. "돌아다닌다", "뭔가를 한다", "상호작용한다" — 이건 지시가 아니라 어깨를 으쓱하는 것이고, 렌더러는 같은 으쓱거림으로 답합니다. 수백만 클립으로 학습된 모델은 벡터가 필요합니다: 누가 움직이고, 어떤 속도로, 어느 방향으로, 어디서 멈추는지. 모든 부드러운 동사를 구체적인 물리적 동작 + 페이스 큐 + 프레임 관계로 바꾸세요. 단어 열 개 더 쓰고 재생성 세 번을 아낄 수 있습니다.

전: "밤에 도시를 돌아다니는 사람"

후: "택배 라이더가 모페드를 타고 왼쪽에서 오른쪽으로 1.2배 보행 속도로 지나가다 프레임 중앙에서 브레이크를 잡고 스탠드를 내린다"

충돌하는 카메라 무브. 두 번째 난파는 프롬프트가 한 쇼트에 호환되지 않는 두 가지 무브를 요청할 때 발생합니다 — "팬 하면서 천천히 줌", "드론 리빌이 핸드헬드 팔로우로 바뀐다", "360도 오빗 중 달리 인". 실제 영화촬영은 한 무브에 한 쇼트를 줍니다. 렌더러에는 둘을 섞을 안무가 없어서 어색한 평균을 선택하고 결과물은 흔들립니다. 감정에 맞는 무브를 선택하세요(친밀함은 달리, 규모는 드론, 긴급함은 핸드헬드, 불안함은 정지) 그리고 8초 내내 그것을 신뢰하세요.

전: "피사체 얼굴로 줌인하면서 동시에 천천히 패닝하는 쇼트"

후: "락드오프 정지 미디엄 클로즈업, 피사체가 우하단 1/3을 채우고, 카메라 무브 없음"

잊힌 사운드. 세 번째 실수는 프롬프트를 정지 이미지 브리프로 다루는 것입니다. 오디오를 명시하지 않으면 무음, 스톡 음악, 또는 — 최악의 경우 — 비주얼과 싸우는 폴리 트랙을 얻습니다. 이 글의 모든 레시피에는 이유가 있어서 "핵심 사운드:" 줄이 들어 있습니다. 디제틱 소스(젖은 포장도로 위의 발소리, 냉장고 험, 톤 태그가 붙은 단일 대사)를 명명하면 렌더러의 오디오 패스에 목표가 생깁니다. 포맷도 여기서 중요합니다: 명절형 씬을 찾고 있다면, 명절 전용 프롬프트 세트가 단 하나의 사운드 선택 — 라이터의 딸깍, 의자의 끄는 소리 — 이 어떻게 기억 전체를 고정하는지 보여줍니다.

전: "주방의 아버지와 아이, 따뜻한 빛, 감성적"

후: "주방 아일랜드에 있는 아버지와 아이; 핵심 사운드: 머그컵 두 개의 부드러운 딸깍 소리, 조용한 '잘 잤어, 얘야', 그 아래 깔린 냉장고 험"

이 세 가지를 고치면 아래 레시피들이 첫 생성에서 적중합니다.

오늘 밤 배포할 플랫폼에 맞는 레시피를 고르세요 — 포트폴리오 릴에는 원샷 달리, 쇼츠에는 가짜 보디캠 부조리, 스토리 트레일러에는 하이퍼리얼 클로즈업 — 그리고 생성을 누르기 전에 5차원 체크를 돌리세요. 프레임워크는 처음부터 다시 쓰지 않고 피사체를 바꿀 수 있게 해주고, 안티 패턴은 애초에 렌더링될 일이 없었던 프롬프트에 크레딧을 태우는 일을 막아줍니다.

이 12개 이후에도 계속 가고 싶다면, 인접한 두 글이 잘 어울립니다: 1번 항목의 긴 원테이크 카메라 언어는 북 트레일러용 구조화된 비트로 그대로 옮겨갈 수 있고, 누아르 주방과 보디캠 톤은 저희 호러 프롬프트 라이브러리의 시네마틱 공포 전통으로 확장됩니다. 두 글 모두 같은 5차원 골조를 사용하므로 근육 기억이 이어집니다.

/dashboard에서 에디터를 열고 오늘 밤 이 중 하나를 배포하세요.

태그

#AI 영상 프롬프트#AI 비디오 프롬프트#텍스트 투 비디오 프롬프트#시네마틱 AI 영상 프롬프트#AI 영상 프롬프트 예시

자주 묻는 질문

01좋은 AI 영상 프롬프트의 조건은 무엇인가요?
좋은 AI 영상 프롬프트는 평이한 언어로 다섯 가지를 명시합니다: 피사체, 카메라(렌즈, 앵글, 무브먼트), 조명(광원, 색온도, 강도), 스타일(시대, 그레인, 팔레트), 그리고 액션(첫 1초와 마지막 1초에 무슨 일이 일어나는지). 그 외의 모든 것은 장식입니다. 프롬프트가 한 단락보다 길어도 다섯 가지 명확한 답으로 읽힌다면 생성기는 결정할 정보가 충분합니다. '시네마틱하다'나 '아름답다' 같은 모호한 분위기 단어는 거의 아무 역할도 하지 않습니다 — 구체적인 명사와 동사가 모든 일을 합니다.
02영상용 AI 프롬프트는 어떻게 작성하나요?
먼저 포맷을 결정하세요 — POV 브이로그, 보디캠, 원샷 달리, 변신 모프 — 포맷이 카메라와 오디오를 결정하기 때문입니다. 그다음 실제 촬영감독에게 브리핑하듯 씬을 쓰세요: 카메라가 어디에 있고, 어떤 렌즈를 쓰고, 어떻게 움직이고, 전경과 배경에는 뭐가 있고, 빛은 어디서 오는지. 사운드 디자인 한 문장(환경음 + 핵심 사운드)을 더하고, 클립이 시작되고 끝나는 액션을 묘사하는 한 문장을 더하세요. 픽셀로 옮겨지지 않는 형용사는 빼세요 — '서사적', '놀라운', '엄청난' 같은 단어는 아무것도 더하지 않습니다.
03초보자가 쓸 만한 효과적인 AI 프롬프트 예시를 알려주실 수 있나요?
초보자에게 가장 빠른 길은 이 글의 12개 씬 중 하나를 복사해서 변수 하나만 바꾸는 것입니다 — POV 브이로그의 코스튬을 스톰트루퍼에서 예티로, 작가주의 내레이션의 이케아 조립을 셀프 계산대로, 누아르 취조관을 토스터에서 주전자로 바꿔보세요. 단일 변수 변경은 이미 깔끔하게 렌더링되는 것으로 알려진 구조적 골조를 보존하면서, 프롬프트의 어떤 문장이 무거운 일을 하고 있는지 가르쳐 줍니다.
04프롬프트로 영상을 만들 수 있는 AI 도구는 어떤 게 있나요?
대부분의 현대 웹 에디터는 프롬프트를 붙여 넣고, 화면비를 고르고, 백엔드를 선택하지 않은 채로 생성하게 해줍니다. 가장 깔끔한 워크플로우는 모델에 구애받지 않게 프롬프트를 쓰고 — 카메라, 조명, 사운드를 영화 언어로 명명하고 — 에디터의 기본 라우팅이 나머지를 처리하도록 두는 것입니다. 기본 출력이 부드럽게 보인다면, 시스템을 탓하기 전에 먼저 구체성을 높이세요(렌즈 초점 거리, 색온도, 렌즈 플레어 방향 추가). 생성기는 더 큰 형용사가 아니라 구체적인 명사에 보상합니다.
05AI 영상 프롬프트를 무료로 테스트할 방법이 있나요?
대부분의 에디터는 무료 티어나 몇 개의 시작 크레딧을 제공하는데, 주어진 프롬프트 구조가 의도한 대로 렌더링되는지 검증하기에 충분합니다. 무료 횟수를 전략적으로 쓰세요: 카메라 무브 문장을 먼저 테스트하고, 조명을 더하고, 그다음 오디오 노트를 더하세요. 무료 실행이 세 번뿐이라면, 하나는 포맷에, 하나는 조명에, 하나는 최종 조합 프롬프트에 쓰세요. 형용사 미세 조정에 크레딧을 태우지 마세요 — 구조적 결정에 태우세요.
06생성한 영상이 왜 평범해 보이나요?
거의 항상 프롬프트가 물리적 사양 대신 분위기 단어를 사용하기 때문입니다. '시네마틱 조명'은 평범합니다. '카메라 오른쪽에서 노을 색온도의 단일 소프트 키 라이트, 뒤에서 들어오는 단단한 림 라이트, 필 라이트 없음'은 평범하지 않습니다. 카메라('핸드헬드' → '미세한 수직 흔들림이 있는 핸드헬드 16mm 광각')와 사운드('분위기 있는' → '멀리 들리는 차량 소음, 무음악, 화면 밖에서 새어 들어오는 희미한 AM 라디오')에도 동일하게 적용됩니다. 구체성이 평범함의 해독제입니다.

어떤 스토리든 60초 영상으로

Story Into Video는 이미지 생성, 애니메이션, 내레이션, 자막을 하나의 워크플로우로 묶어 줍니다. 무료 크레딧으로 첫 영상을 만들 수 있습니다.

에디터 열기

이 글에서 소개한 도구 사용해 보기