Sự ra đời của các công cụ AI tạo video như Google Veo3 đã mở ra một kỷ nguyên mới cho sáng tạo nội dung. Giờ đây, bất kỳ ai cũng có thể trở thành “đạo diễn” cho những thước phim của riêng mình. Tuy nhiên, để AI có thể “hiểu” và tạo ra video chính xác như trong tưởng tượng, bạn cần phải nắm vững nghệ thuật viết prompt (câu lệnh).
Bài viết này, dựa trên việc phân tích hàng chục prompt thành công từ cộng đồng AI Việt Nam, sẽ cung cấp cho bạn một công thức chi tiết và các ví dụ trực quan để làm chủ kỹ năng này.
Tư Duy Cốt Lõi: Hãy Trở Thành Một Đạo Diễn Thực Thụ
Thay vì chỉ viết vài dòng mô tả, hãy tư duy như một đạo diễn phim. Bạn không chỉ viết kịch bản mà còn phải chỉ đạo máy quay, ánh sáng, âm thanh và cả diễn xuất của “diễn viên” AI. Một prompt hiệu quả là một bản chỉ dẫn làm phim hoàn chỉnh.
Công Thức Vàng: Cấu Trúc Của Một Prompt Hoàn Hảo
Một prompt mạnh mẽ và chi tiết thường bao gồm 5 thành phần chính. Hãy đảm bảo bạn cung cấp đủ thông tin cho AI ở mỗi phần.
1. Bối Cảnh & Kịch Bản (Setting & Scene)
Đây là phần trả lời cho các câu hỏi: Cái gì? Ở đâu? Khi nào?
- Mô tả không gian: Càng chi tiết càng tốt. Thay vì “một quán cà phê”, hãy viết “một quán cà phê vỉa hè quen thuộc ở Sài Gòn buổi sáng, với vài chiếc xe đạp cũ và ly cà phê phin đặt trên bàn”.
- Mô tả thời gian và không khí: “Buổi chiều tà với ánh nắng vàng óng”, “ban đêm trong một con hẻm ẩm ướt, ánh đèn neon nhấp nháy”, “bình minh trong sương sớm ở một vùng quê yên tĩnh”.
- Mô tả hành động chính: Kịch bản diễn ra như thế nào? “Cô gái bất ngờ đứng dậy, bỏ đi trong nước mắt”, “ông lão bật cười sảng khoái sau khi nói xong câu thoại”.
2. Nhân Vật (Character)
Trả lời câu hỏi: Ai?
- Ngoại hình: Tuổi tác, giới tính, kiểu tóc, trang phục, vóc dáng. Các chi tiết nhỏ như “áo Gucci giả”, “khăn rằn vắt trên vai”, “lớp trang điểm đậm” sẽ giúp AI tạo ra nhân vật chân thực hơn.
- Biểu cảm & Cảm xúc: “Vẻ mặt bình thản nhưng lời nói sắc bén”, “nụ cười tự tin và lôi cuốn”, “ánh mắt ngơ ngác, sốc toàn tập”.
- Nguồn gốc: “Một cô gái Việt Nam”, “một người đàn ông miền Bắc”, “hai vợ chồng trẻ”.
3. Lời Thoại & Âm Thanh (Dialogue & Audio)
Trả lời câu hỏi: Nghe thấy gì?
- Lời thoại (Dialogue): Ghi rõ từng câu thoại. Nếu cần, hãy chỉ định tông giọng (vd: “giọng mỉa mai”, “thì thầm một cách lãng mạn”, “hét lên đầy vui sướng”).
- Âm thanh nền (Ambient Sound): “Tiếng ồn ào của khu chợ”, “tiếng chim hót và gió xào xạc”, “nhạc ballad buồn và du dương”.
- Hiệu ứng âm thanh (Sound Effects – SFX): “Tiếng phanh xe đột ngột”, “tiếng ‘ting’ của thông báo”, “một tiếng nổ lớn ở phía xa”.
4. Chỉ Dẫn Máy Quay & Ánh Sáng (Camera & Lighting)
Đây là phần kỹ thuật, giúp bạn điều khiển “cái nhìn” của video.
- Góc quay:
close-up(cận cảnh),medium shot(trung cảnh),wide shot(toàn cảnh),drone overhead(quay từ trên cao),POV(góc nhìn thứ nhất). - Chuyển động máy quay:
slow pan(lia máy chậm),pull out(lùi máy ra xa),dolly-in(đẩy máy vào gần),handheld(máy quay cầm tay, tạo cảm giác chân thực). - Ánh sáng: “Ánh sáng tự nhiên ban ngày”, “ánh sáng vàng ấm áp trong phòng ngủ”, “ánh đèn đường le lói, tạo bóng đổ dài”.
5. Phong Cách & Các Chi Tiết “Vàng” (Style & Golden Details)
Phần này quyết định “linh hồn” và chất lượng của video.
- Phong cách (Style):
cinematic(điện ảnh),documentary(tài liệu),viral TikTok format(kiểu video viral TikTok),dark comedy(hài đen),ultra-realistic VFX(kỹ xảo siêu thực). - Tông màu (Tone):
warm tones(tông màu ấm),cold, moody color palette(bảng màu lạnh, u ám). - Thông số kỹ thuật: | Thông số | Mô tả | Ví dụ | | :— | :— | :— | | Resolution | Độ phân giải |
1080p,4K,8K cinematic| | Aspect Ratio | Tỷ lệ khung hình |16:9(ngang),9:16(dọc),1:1(vuông) | | Duration | Thời lượng |8 seconds(8 giây) | | FPS | Tốc độ khung hình |120fps slow motion(chuyển động chậm) |
Mẫu Prompt Ví Dụ (Dựa trên công thức)
Dưới đây là 3 ví dụ hoàn chỉnh cho 3 thể loại khác nhau để bạn tham khảo.
Ví dụ 1: Video Quảng Cáo Hài Hước
Tiêu đề: Quảng cáo quán Phở “Gật Đầu” – Ăn là nghiện!
Thời lượng: 8 giây Tỷ lệ: 9:16 (dọc) Phong cách: Phỏng vấn đường phố hài hước, chân thực, kiểu video viral.
Bối cảnh: Vỉa hè một khu phố cũ ở Hà Nội buổi trưa, nắng nhẹ.
Kịch bản: [0-4s] Một người phỏng vấn đưa micro về phía một ông chú trung niên (khoảng 50 tuổi, mặc áo ba lỗ, mặt khắc khổ) đang ngồi ăn phở ở một quán vỉa hè. Lời thoại (Người phỏng vấn, giọng háo hức):“Chú ơi, chú thấy phở ở đây thế nào ạ?”
[4-8s] Ông chú ngừng ăn, ngẩng mặt lên với vẻ mặt cực kỳ nghiêm túc, mắt nhìn thẳng vào máy quay. Lời thoại (Ông chú, giọng quả quyết): “Ngon! Ngon đến mức chú vừa phải bán cái đồng hồ để ăn thêm bát nữa đây này!” Ông chú giơ cổ tay trần không có đồng hồ lên. Người phỏng vấn đứng hình.
Máy quay: Cầm tay, hơi rung nhẹ để tạo cảm giác chân thực. Bắt đầu từ trung cảnh, sau đó zoom cận vào biểu cảm của ông chú. Âm thanh: Tiếng ồn nhẹ của phố phường Hà Nội. Hiệu ứng âm thanh “khựng lại” (comedic sting) khi ông chú nói xong.
- Phân tích: Prompt này hội tụ đủ yếu tố viral: hài hước, có twist bất ngờ, bối cảnh gần gũi và câu thoại “chất”. Các chỉ dẫn kỹ thuật rõ ràng giúp AI tạo ra video đúng phong cách mong muốn.
Ví dụ 2: Cảnh Phim Tình Cảm
Tiêu đề: Lời chia tay ở sân ga
Thời lượng: 10 giây Tỷ lệ: 16:9 Phong cách: Điện ảnh, lãng mạn buồn (melancholic), tông màu lạnh. Chất lượng: 4K cinematic
Bối cảnh: Sân ga xe lửa cũ vào một buổi chiều mưa, đèn ga vàng vọt.
Nhân vật: Một chàng trai (25 tuổi, mặc áo sơ mi trắng, tóc tai ướt mưa) và một cô gái (24 tuổi, mặc váy hoa, mắt đỏ hoe).
Kịch bản: Chàng trai nắm chặt tay cô gái, không muốn buông. Tiếng còi tàu vang lên. Cô gái nhẹ nhàng rút tay ra, đặt vào tay chàng trai một lá thư cũ. Lời thoại (Cô gái, giọng thì thầm, nghẹn ngào): “Em không đi tìm tương lai nữa… vì tương lai của em đã ở lại đây với anh rồi.” Cô gái quay lưng bước lên tàu, không ngoảnh lại. Chàng trai đứng chết lặng dưới mưa, tay nắm chặt lá thư.
Máy quay: Bắt đầu bằng cảnh cận hai bàn tay đan vào nhau. Lia máy lên khuôn mặt đẫm nước mắt của cô gái. Khi cô quay đi, máy quay lùi ra xa (dolly out) để lại chàng trai một mình giữa sân ga trống vắng. Âm thanh: Tiếng mưa rơi, tiếng còi tàu xa dần, một bản nhạc piano buồn làm nền.
- Phân tích: Prompt này tập trung vào cảm xúc. Việc mô tả chi tiết ánh sáng, thời tiết, biểu cảm và chuyển động máy quay sẽ giúp AI tạo ra một thước phim giàu chất thơ và đầy tâm trạng.
Ví dụ 3: Video Giới Thiệu Dịch Vụ
Tiêu đề: LifeCoach – Tìm lại cân bằng
Thời lượng: 8 giây Tỷ lệ: 1:1 (vuông) Phong cách: Hiện đại, truyền cảm hứng, chuyên nghiệp.
Bối cảnh: Một văn phòng cao tầng tối giản, có cửa kính lớn nhìn ra toàn cảnh thành phố lúc hoàng hôn.
Nhân vật: Một nữ doanh nhân thành đạt (khoảng 35 tuổi, tóc búi cao, mặc vest màu kem thanh lịch).
Kịch bản: Cô đứng khoanh tay nhìn ra ngoài cửa sổ. Sau đó, cô quay lại, nhìn thẳng vào máy quay với nụ cười tự tin và bình yên. Lời thoại (Giọng nói nội tâm – voice-over, ấm áp và truyền cảm): “Tôi từng nghĩ thành công là phải chạy thật nhanh. Giờ tôi nhận ra, thành công là tìm được nhịp điệu của riêng mình. Bạn đã sẵn sàng tìm lại nhịp điệu của bạn chưa?”
Máy quay: Quay từ sau lưng nhân vật, sau đó di chuyển vòng cung (arc shot) ra phía trước để bắt trọn khuôn mặt và khung cảnh thành phố phía sau. Âm thanh: Nhạc nền nhẹ nhàng, truyền cảm hứng. Hiệu ứng: Logo và SĐT của LifeCoach hiện ra một cách tinh tế ở góc màn hình trong 2 giây cuối.
- Phân tích: Prompt này hướng đến việc xây dựng hình ảnh thương hiệu. Sự kết hợp giữa bối cảnh sang trọng, nhân vật uy tín và lời thoại ý nghĩa tạo ra một video quảng cáo vừa tinh tế vừa hiệu quả.
Kết Luận
Viết prompt cho Google Veo3 là một kỹ năng kết hợp giữa sáng tạo nghệ thuật và sự chính xác của kỹ thuật. Bằng cách áp dụng tư duy của một đạo diễn và tuân theo công thức 5 thành phần trên, bạn có thể biến những ý tưởng phức tạp nhất thành những thước phim sống động và đầy cảm xúc.
SMNET là công ty CNTT với nhiều năm kinh nghiệm, cung cấp các giải pháp và dịch vụ CNTT chất lượng cao.
Địa chỉ: Phòng G.01, Tòa nhà The Vital Building, 16 Đặng Tất, P. Tân Định, Q.1, TP.HCM
Website: smnet.vn
Email: hello@smnet.vn
Điện thoại: 028 7301 6068
Hotline/Zalo: 0982 051 150 (Kết nối với SMNET qua Zalo để được tư vấn nhanh chóng: Zalo OA SMNET)






