
AI ASMR 视频选题这件事,网上的内容总是掉进两个坑:要么是一长串"该买哪只麦"的教学,要么是 cozy / 雨天 / 治愈 这种含糊的氛围词。两种都救不了今晚你想发的那一支短片。在 ASMR 这个赛道里,决定一切的是格式——你挑哪个触发音、镜头锁在哪一帧、片尾怎么循环回片头,决定了这支视频能不能做完、能不能让人停下来、能不能让人重复点开。
下面是 12 种短视频 ASMR 格式,每一种都写成完整的"配方"——AI 视频生成 + 耳语配音 + 字幕这一条工作流可以原样跑下来。任意一条都可以直接粘到 Story Into Video 编辑器,让默认模型负责画面,今晚就能出一支 30 到 90 秒的成片。每条结尾会给一行 Key sound 和 Key visual —— 让你清楚自己要锁的是哪个声音、哪一帧,再加一个按钮:单击同时把整段配方复制走、并在新标签页打开编辑器。

感官触发型 ASMR 选题
ASMR 最经典的几个格式都在这一组。耳语、敲击、个人关注——这三种触发音养活了整个赛道。它们之所以管用,是因为镜头比"一个陌生人本该距离你"的距离更近,声音比"画面本该允许"的音量更响。两个不对称都要做足。
1 — 贴近麦的耳语

整支视频画面就一个东西:一只录音棚级电容麦的极近景,柔软的网状防喷罩浮在左半边。一个带帽的剪影从画面右边贴过来——近到呼吸都让金属网起一层雾——但脸始终不进画面。视频不剪。任何动作都按"怕吵醒隔壁房间"的速度来。
声音承载整支视频。一段耳语独白持续整个时长,每秒钟有两到三个词擦过麦头,那些 嘶 和 咳 的辅音在防喷罩上轻轻爆开。底下垫一条低且暖的房间底噪,永远不能压过耳语。画面只是给耳朵一个允许放松的理由。
收尾回到开头:同一个角度、同一束侧光、剪影向后退半英寸,最后一个耳语词淡出。让观众循环播放时感觉不到接缝。
Key sound:持续耳语独白,每秒两到三个词,词与词之间能听见换气声。 Key visual:录音棚电容麦近景,一个带帽剪影从一侧贴近,不露脸。
2 — 敲击声道具

在一张深色胡桃木桌上摆四件小道具,一字排开:一只铜铃、一只带铜盖的罐子、一只光滑的木盒、一只厚实的绿玻璃瓶。镜头垂直从上方俯拍、锁死。一双细长的手从画面下方进入,从左到右敲过每件道具——食指敲铜,中指敲罐,拇指敲木,无名指敲玻璃。每件用一种不同的指法、一种不同的节奏。
声音设计就是这支视频的全部卖点。每种材质给一个能一耳辨认的音色:清亮的金属 叮、暖钝的铜 咚、空心胶合板 扣、玻璃风铃 铮。节奏要错开而不是撞在一起——铜在正拍,玻璃在反拍,木做底下的慢脉搏。不加音乐。只有这四个声音和这间房间。
整套节拍重复两次,结束在最先敲到的那个指头上:食指停在铜铃上,定格。剪到黑场用的是余音,不是敲击瞬间。
Key sound:四种敲击音色(铜 / 铜罐 / 木 / 玻璃)层层叠成慢节奏。 Key visual:俯拍一排深色木桌上的小道具,细长的手从画面下方进入。
3 — 个人关注 POV

镜头就是观众的眼睛。画面是一面沙龙镜子,柔和自然光打进来。镜子里只能看到肩膀以上——但脸永远不清晰,因为头微微低着,角度刚好遮过去。一双造型师的手从画外进来,开始一段缓慢、有意识的流程:用宽齿木梳从太阳穴附近分开头发,往后梳顺,用两根指尖把一缕碎发别好。
音轨是梳齿穿过头发的近距离 沙 声,木梳放回瓷碟时小小的干脆 嗒 声,专注做事的人那种小小的吸气声。如果有说话,就一两个词一组,不出现完整句子——这样、快好了、嗯。让观众感受到"被照顾"这件事是从耳朵进来的,不是从台词进来的。
收尾停在一个静止的瞬间:梳子放下,手从画面边缘退出去,头发自己落定。留三秒室内底噪,再剪。
Key sound:梳齿穿过头发、木头碰瓷器的小响、半句呢喃。 Key visual:沙龙镜子的 POV,肩膀和半个头部在柔和日光下,画外有手在动,不露脸。
日常仪式型 ASMR 选题
仪式感是 ASMR 的第二台发动机。观众愿意靠近屏幕,是因为屏幕另一边有人在很认真地对一件小事付出注意力。手、水、布、同样的步骤、同样的顺序,每天来一遍。
4 — 只拍手的厨房 ASMR

一个纯俯拍镜头,画面里是一张撒了面粉的橡木板。一双裸手,袖子卷到手肘,在画面中央揉一个柔软的面团。左上角放一个对半切开的橙子,右上角放一个装着海盐的小陶皿。手始终不停。脸始终不进画面。
声音按层次叠:面粉摩擦木头的干涩声、面团被拉开折叠的湿润声、刀切橙子那一下脆亮的清响、捏一撮盐撒下来时的颗粒声。不加音乐,不加旁白。远处烤箱门被打开关上的那一声闷响,是整支视频里唯一的"事件音"。
收尾把成形的面团举进一只等候的玻璃碗,再撒一点面粉收尾,手退出画面。空木板留一拍——飘下来的面粉慢慢落定——再淡出。
Key sound:手揉面团的拉伸声、面粉刮木板、刀切柑橘、盐颗粒落地。 Key visual:俯拍裸手在撒了面粉的木板上揉面,不露脸。
5 — 图书馆翻书

场景是一间古旧图书馆里的长木桌,时间黄昏。背景是高高的红木书架,画面右侧一盏带青绿色玻璃灯罩的铜台灯亮着。镜头做一次缓慢的横移——从一本翻到一半的精装书上慢慢扫过,再扫过一只搁在半写满字的笔记本上的钢笔,再扫过一只正在轻轻冒蒸汽的小瓷杯。
声音是整间图书馆在呼吸。每六七秒翻一页书,那种长长的纤维 沙 声。钢笔笔尖在纸上写一行字的 沙沙。瓷杯被放回托盘的 嗒。底层是远处走廊上很远很远的脚步声——近不到画面里来。
收尾镜头回到那本翻开的书,定住。让观众的视线落在那一页上,但文字始终隐约辨不清。
Key sound:缓慢的翻页、钢笔在纸上写字、瓷器碰瓷器。 Key visual:古旧图书馆木桌上的开本、钢笔、斜光里漂浮的尘埃。
6 — 慢节奏的茶道

镜头垂直从上方俯拍一场缓慢进行中的茶道。一双手在一个紧凑的构图里工作:一只黑陶 chawan 里装着鲜亮的抹茶绿粉、一支竹筅、一支细瘦的竹勺、画面右侧一只铸铁 tetsubin 壶。一束水汽不断从壶嘴里升起。手从不仓促。镜头从不移动。
声音是这场仪式的微缩声景。水从铁壶倒进碗里——先是细高的一注,再变成更粗的下落,最后是拖尾的滴答声。竹筅在 chawan 内壁上以 m 字形快速摆动,发出柔和的电流般的 嗖嗖 声。抹茶罐的木盖被掀起又放回去。整段大约 60 秒。
收尾停在那只完成的茶碗上,泡沫沉降,碗的外壁上挂着一滴水珠缓缓滑下。剪到黑场用这滴水珠落下的那一瞬,不是用谁开始喝。
Key sound:水注入陶器、竹筅打抹茶、木盖盖回茶罐。 Key visual:俯拍的黑陶 chawan、竹筅、铸铁壶,蒸汽不断上升。
声音道具循环
当触发音只有一种环境音的时候,画面的任务就只是"诚实地告诉观众这个声音是哪里发出来的"。把表面拍出来,把声源拍出来,然后循环。
7 — 雨打不同表面

把整个画面纵向切成三等分,每一份是一种"雨打的表面"。左侧三分之一:肥大的雨珠顺着透明玻璃窗滑下,玻璃背后是模糊的城市夜景。中间三分之一:雨砸在波纹铁皮屋顶上的特写,水沿着波纹笔直地往下淌成亮线。右侧三分之一:雨从宽大的热带阔叶上往下滴,每片叶子先被压弯再弹回去。
音轨把三种表面叠起来,但用不同的混音电平,让观众的耳朵可以挑一个停下来。玻璃那一层在中低频、稳稳的;铁皮在上面又脆又亮、像打击乐;阔叶在最底下、慢且不规则地滴。不加音乐,不加人声。
这支视频不需要结尾——它需要循环。把最后一秒的音轨和第一秒的音轨对齐,让一个把页面挂在那里的人听到的是一场不停歇的雨。
Key sound:三层雨声表面(玻璃 / 铁皮 / 阔叶)按不同电平叠在一起。 Key visual:纵向三联构图,三种雨打表面同框。
8 — 壁炉 + 书 + 猫

一个锁死的中景镜头,对着夜里一座石质壁炉,大块木柴烧成橙红色的火光。画面右边一把磨旧的皮椅,搭着一条格子毛毯,毯上摊着一本翻开的皮面书。椅脚边的地毯上蜷着一只橘色虎斑猫,呼吸缓慢。画面里没有人。整个画面里会自己动的,只有火、猫、和每隔二十秒一次的——格子毯像是有人刚离开座位那样的、缓缓起伏一下。
声音是整支视频的全部。木柴稳稳的噼啪声,时不时一根木柴塌下来发出几声爆响和位移声,几乎听不出来的猫的睡眠呼吸贴在房间底噪上。再混进一点点很远的钟摆声——画外某处一只老旧挂钟。不加音乐,不加台词。
整支循环——火不熄、猫不醒——让把页面留在那里挂一个小时的人,得到 60 分钟的暖房间。
Key sound:持续的木柴噼啪、偶有崩塌声、远处钟摆、缓慢猫呼吸。 Key visual:石质壁炉 + 皮椅 + 睡着的橘猫,浸在深琥珀色火光里。
9 — 威士忌杯里的冰裂

镜头平视吧台。画面正中是一只水晶威士忌平底杯,里面一颗大块的方冰,倒着满满一杯琥珀色酒液。背景的房间昏暗,远处吧台灯只剩柔和的散景。画面里没有别的东西。整段视频就是这一只杯子。
声音分三层。一只贴近冰块的指向麦捕捉冰块掉进温热酒液后每一条发丝般细的裂纹——又短又脆的 叮、然后一条慢半拍、更深一点的 咔 是更长的裂口扩大。第二只麦捕捉酒液浸进新露出的冰面的那种柔和 滋 声。最底下是一间安静酒吧的低频环境噪音——没有人声、没有音乐,只有空气和制冷机。一两次会有一小块冰碎掉,撞在玻璃壁上发出一声 叮。
收尾镜头慢慢推近到一条刚出现的新裂纹上,从里面透出琥珀色光泽,停三秒,剪到黑场。
Key sound:冰里的微裂、酒液浸冰、酒吧低频环境噪音。 Key visual:一只水晶平底杯里正在裂开的方冰和琥珀色酒液,背景昏暗。
沉浸式旅行 / 自然 ASMR
最后一组管用,是因为观众被你"放在另一个地方"。让他坐在火车窗边,坐在缆车里,站在下雪的小屋廊下——一个他自己这个下午到不了的地方——剩下的交给环境声。
10 — 夜行火车窗边座位

画面安在一节夜行火车车厢内,镜头锁死在一张空着的天鹅绒窗边座位上。座位旁边那扇大玻璃窗一片漆黑,上面流着雨痕,每隔一段固定时间会有一串琥珀色城市灯光以模糊光斑的形式划过窗外。座位上方一盏昏暗顶灯打出一小片暖光。画面里没有人。整节车厢只属于你。
声音是一列移动中火车的节奏。稳定的 咔哒-咔哒,咔哒-咔哒,车轮压过铁轨接缝,被车厢壁稍微压低了一点。车厢左右摇晃时偶尔传来一声极轻的金属摩擦声。雨敲在玻璃上是一层稳定的高频背景,每次火车进出隧道口时会有一阵风声变化。不加广播报站,不加音乐。
循环要踩在火车节奏上——把一次车轮 咔哒 对齐一次窗外光斑,让两者在整段时长里同步重复。让观众感觉自己快要靠着窗户睡着、错过下一站。
Key sound:节奏稳定的车轮压轨声、雨打玻璃、轻微的车厢金属摩擦。 Key visual:夜行火车里的一张空窗边座位,窗外是雨痕和滑过的琥珀色灯光。
11 — 雪山缆车

镜头就是缆车舱本身。画面是正前方那扇窗外:一片雾气中的雪山,向白色远方延伸;两根粗壮的承载缆消失在云里;每隔大约十五秒,一座钢质支撑塔从画面右侧划过,给舱内地板扫过一道锐利的金属阴影。光线阴沉、冷。舱内没有任何人。
音轨由三个稳定元素搭起来。一是缆绳穿过头顶轮组的低沉嗡鸣。二是高且细的风声划过缆车金属外壳。三是每次缆车经过支撑塔上方那只滑轮时,那一声节奏稳定的 咚——这是"我们仍在前进"的声音轨道。不加音乐,不加人声。
收尾选一次经过支撑塔的瞬间——滑轮 咚、阴影扫过舱内地板——剪到黑场用阴影离开画面的那一刻。
Key sound:头顶的缆绳嗡鸣、细高的风声、节奏稳定的支撑塔 咚。 Key visual:缆车舱前窗的 POV,外面是雪山和滑过的钢质塔架。
12 — 下雪的小屋廊下

镜头架在一个宽宽的木质小屋廊上,时间黄昏。画面里有两把空着的摇椅,背景是一片落了薄雪的松林。靠近镜头的那把椅子上搭着一条折好的羊毛毯。右后方小屋的窗户里漏出一束温暖的橘黄色灯光,刚好够照亮廊板,让观众看得见正在飘落的雪。雪花一直在画面里落,没有停下。
声音是一个安静的雪夜傍晚。落雪盖在木板和松针上的那种闷闷的一层声。其中一把摇椅在风里慢慢吱呀——动的幅度从来不超过一英寸。远远的地方,一只猫头鹰叫两声,然后没了。镜头背后小屋里,最微弱的一点壁炉柴火噼啪声透过玻璃漏出来。不加音乐,不加人声。
镜头一动不动地停整段时长,让雪本身来做"动"。收尾停在一片大雪花落到那把空摇椅的椅面上的那一瞬,停一拍,剪到黑场。
Key sound:闷闷的落雪声、摇椅慢吱呀、远处猫头鹰、隔着窗户的微弱柴火声。 Key visual:下雪的木屋廊上两把空摇椅,旁边一束暖灯光从窗里漏出来。
12 种格式够你排三个月不重样的发布日历。挑那个"Key sound 你已经能在脑子里听见"的那个开始——它第一次录出来最干净。如果某种格式对你要发的平台来说太长,把循环收紧一点;如果太短,就把中段拉长、把收尾收紧。重点是今晚发出一支,明天回来做下一支。
标签
把任何故事做成 60 秒视频
Story Into Video 把生图、动画、旁白、字幕串成一条工作流。首个视频用免费积分即可完成。
进入编辑器



