Gemini có thể tạo và xử lý hình ảnh theo cách trò chuyện. Bạn có thể đưa ra câu lệnh cho mô hình hình ảnh Gemini 2.5 Flash (còn gọi là Nano Banana) có tốc độ nhanh hoặc mô hình hình ảnh Gemini 3 Pro Preview (còn gọi là Nano Banana Pro) nâng cao bằng văn bản, hình ảnh hoặc kết hợp cả hai. Nhờ đó, bạn có thể tạo, chỉnh sửa và lặp lại các hình ảnh một cách dễ dàng:
- Chuyển văn bản, hình ảnh và nhiều hình ảnh thành hình ảnh: Tạo hình ảnh chất lượng cao từ nội dung mô tả bằng văn bản, dùng câu lệnh văn bản để chỉnh sửa và điều chỉnh một hình ảnh nhất định hoặc dùng nhiều hình ảnh đầu vào để tạo cảnh mới và chuyển kiểu.
- Tinh chỉnh lặp đi lặp lại: Tinh chỉnh hình ảnh của bạn qua nhiều lượt trò chuyện, thực hiện các điều chỉnh nhỏ cho đến khi hình ảnh hoàn hảo.
- Hiển thị văn bản có độ trung thực cao: Tạo hình ảnh có văn bản dễ đọc và được đặt đúng vị trí một cách chính xác, phù hợp với biểu trưng, sơ đồ và áp phích.
Tất cả hình ảnh được tạo đều có hình mờ SynthID.
Tạo hình ảnh (chuyển văn bản thành hình ảnh)
Chỉnh sửa hình ảnh (văn bản và hình ảnh thành hình ảnh)
Lời nhắc: Hãy đảm bảo rằng bạn có các quyền cần thiết đối với mọi hình ảnh mà bạn tải lên. Bạn không được tạo nội dung vi phạm quyền của người khác, kể cả video hoặc hình ảnh lừa gạt, quấy rối hoặc gây hại. Khi sử dụng dịch vụ AI tạo sinh này, bạn phải tuân theo Chính sách về các hành vi bị cấm khi sử dụng.
Cung cấp hình ảnh và sử dụng câu lệnh dạng văn bản để thêm, xoá hoặc sửa đổi các phần tử, thay đổi kiểu hoặc điều chỉnh phân loại màu.
Ví dụ sau đây minh hoạ việc tải hình ảnh được mã hoá base64 lên. Đối với nhiều hình ảnh, tải trọng lớn hơn và các loại MIME được hỗ trợ, hãy xem trang Hiểu hình ảnh.
Chỉnh sửa ảnh nhiều lượt
Tiếp tục tạo và chỉnh sửa hình ảnh theo cách trò chuyện. Bạn nên sử dụng tính năng trò chuyện hoặc cuộc trò chuyện nhiều lượt để lặp lại hình ảnh. Ví dụ sau đây cho thấy một câu lệnh để tạo bản đồ hoạ thông tin về quá trình quang hợp.
Sau đó, bạn có thể dùng cùng một cuộc trò chuyện để thay đổi ngôn ngữ trên hình ảnh thành tiếng Tây Ban Nha.
Điểm mới ở Gemini 3 Pro Image
Gemini 3 Pro Image (gemini-3-pro-image-preview) là một mô hình tạo và chỉnh sửa hình ảnh tiên tiến, được tối ưu hoá để sản xuất tài sản chuyên nghiệp. Được thiết kế để giải quyết những quy trình làm việc khó khăn nhất thông qua khả năng suy luận nâng cao, Gemini 1.5 Pro vượt trội trong các nhiệm vụ tạo và sửa đổi phức tạp, nhiều lượt tương tác.
- Đầu ra có độ phân giải cao: Khả năng tạo hình ảnh 1K, 2K và 4K được tích hợp sẵn.
- Kết xuất văn bản nâng cao: Có khả năng tạo văn bản dễ đọc, cách điệu cho đồ hoạ thông tin, thực đơn, sơ đồ và tài sản tiếp thị.
- Cung cấp thông tin thực tế bằng Google Tìm kiếm: Mô hình có thể sử dụng Google Tìm kiếm làm công cụ để xác minh thông tin và tạo hình ảnh dựa trên dữ liệu theo thời gian thực (ví dụ: bản đồ thời tiết hiện tại, biểu đồ cổ phiếu, sự kiện gần đây).
- Chế độ Tư duy: Mô hình này sử dụng quy trình "tư duy" để suy luận thông qua các câu lệnh phức tạp. Công cụ này tạo ra "hình ảnh ý tưởng" tạm thời (có thể thấy ở phần phụ trợ nhưng không tính phí) để tinh chỉnh bố cục trước khi tạo ra thành phẩm chất lượng cao cuối cùng.
- Tối đa 14 hình ảnh tham khảo: Giờ đây, bạn có thể kết hợp tối đa 14 hình ảnh tham khảo để tạo ra hình ảnh cuối cùng.
Sử dụng tối đa 14 hình ảnh tham khảo
Gemini 3 Pro Preview cho phép bạn kết hợp tối đa 14 hình ảnh tham khảo. 14 hình ảnh này có thể bao gồm:
- Tối đa 6 hình ảnh về các đối tượng có độ trung thực cao để đưa vào hình ảnh cuối cùng
Tối đa 5 hình ảnh về con người để duy trì tính nhất quán của nhân vật
Kết nối với Google Tìm kiếm
Sử dụng công cụ Tìm kiếm của Google để tạo hình ảnh dựa trên thông tin theo thời gian thực, chẳng hạn như dự báo thời tiết, biểu đồ cổ phiếu hoặc sự kiện gần đây.
Xin lưu ý rằng khi sử dụng tính năng Căn cứ thông tin bằng Google Tìm kiếm để tạo hình ảnh, kết quả tìm kiếm dựa trên hình ảnh sẽ không được chuyển đến mô hình tạo và sẽ bị loại trừ khỏi câu trả lời.
Phản hồi này bao gồm groundingMetadata chứa các trường bắt buộc sau:
- searchEntryPoint: Chứa HTML và CSS để hiển thị các đề xuất tìm kiếm bắt buộc.
- groundingChunks: Trả về 3 nguồn hàng đầu trên web được dùng để làm cơ sở cho hình ảnh được tạo
Tạo hình ảnh có độ phân giải lên đến 4K
Gemini 3 Pro Image tạo 1.000 hình ảnh theo mặc định nhưng cũng có thể xuất hình ảnh 2K và 4K. Để tạo thành phần có độ phân giải cao hơn, hãy chỉ định image_size trong generation_config.
Bạn phải sử dụng chữ "K" viết hoa (ví dụ: 1K, 2K, 4K). Tham số chữ thường (ví dụ: 1k) sẽ bị từ chối.
Sau đây là một ví dụ về hình ảnh được tạo từ câu lệnh này:
Quá trình tư duy
Mô hình Gemini 3 Pro Image Preview là một mô hình tư duy và sử dụng quy trình suy luận ("Tư duy") cho các câu lệnh phức tạp. Tính năng này được bật theo mặc định và không thể tắt trong API. Để tìm hiểu thêm về quy trình suy nghĩ, hãy xem hướng dẫn Quy trình suy nghĩ của Gemini.
Mô hình này tạo tối đa 2 hình ảnh tạm thời để kiểm thử bố cục và logic. Hình ảnh cuối cùng trong phần Tư duy cũng là hình ảnh được kết xuất cuối cùng.
Bạn có thể xem những suy nghĩ dẫn đến việc tạo ra hình ảnh cuối cùng.
Chữ ký của Thought
Chữ ký suy nghĩ là biểu thị được mã hoá của quy trình suy nghĩ nội bộ của mô hình và được dùng để duy trì bối cảnh lập luận trong các lượt tương tác nhiều lượt. Tất cả các phản hồi đều có trường thought_signature. Theo nguyên tắc chung, nếu nhận được chữ ký suy nghĩ trong phản hồi của mô hình, bạn nên truyền lại chính xác chữ ký đó như khi nhận được khi gửi nhật ký cuộc trò chuyện ở lượt tiếp theo. Nếu không truyền tải được chữ ký ý tưởng, thì có thể phản hồi sẽ không thành công. Hãy xem tài liệu về chữ ký tư duy để biết thêm thông tin giải thích về chữ ký nói chung.
Lưu ý: Nếu bạn sử dụng Google Gen AI SDK chính thức và sử dụng tính năng trò chuyện (hoặc trực tiếp thêm đối tượng phản hồi đầy đủ của mô hình vào nhật ký), thì chữ ký suy nghĩ sẽ được xử lý tự động. Bạn không cần phải trích xuất hoặc quản lý các tham số này theo cách thủ công hoặc thay đổi mã.Sau đây là cách hoạt động của chữ ký tư duy:
- Tất cả các phần inline_data có hình ảnh mimetype nằm trong phản hồi đều phải có chữ ký.
- Nếu có một số phần văn bản ở đầu (trước bất kỳ hình ảnh nào) ngay sau suy nghĩ, thì phần văn bản đầu tiên cũng phải có chữ ký.
- Suy nghĩ không có chữ ký; Nếu inline_data phần có hình ảnh mimetype là một phần của suy nghĩ, thì những phần đó sẽ không có chữ ký.
Đoạn mã sau đây cho thấy ví dụ về vị trí có chữ ký suy nghĩ:
[ { "inline_data": { "data": "<base64_image_data_0>", "mime_type": "image/png" }, "thought": true // Thoughts don't have signatures }, { "inline_data": { "data": "<base64_image_data_1>", "mime_type": "image/png" }, "thought": true // Thoughts don't have signatures }, { "inline_data": { "data": "<base64_image_data_2>", "mime_type": "image/png" }, "thought": true // Thoughts don't have signatures }, { "text": "Here is a step-by-step guide to baking macarons, presented in three separate images.nn### Step 1: Piping the BatternnThe first step after making your macaron batter is to pipe it onto a baking sheet. This requires a steady hand to create uniform circles.nn", "thought_signature": "<Signature_A>" // The first non-thought part always has a signature }, { "inline_data": { "data": "<base64_image_data_3>", "mime_type": "image/png" }, "thought_signature": "<Signature_B>" // All image parts have a signatures }, { "text": "nn### Step 2: Baking and Developing FeetnnOnce piped, the macarons are baked in the oven. A key sign of a successful bake is the development of "feet"—the ruffled edge at the base of each macaron shell.nn" // Follow-up text parts don't have signatures }, { "inline_data": { "data": "<base64_image_data_4>", "mime_type": "image/png" }, "thought_signature": "<Signature_C>" // All image parts have a signatures }, { "text": "nn### Step 3: Assembling the MacaronnnThe final step is to pair the cooled macaron shells by size and sandwich them together with your desired filling, creating the classic macaron dessert.nn" }, { "inline_data": { "data": "<base64_image_data_5>", "mime_type": "image/png" }, "thought_signature": "<Signature_D>" // All image parts have a signatures } ]Các chế độ tạo hình ảnh khác
Gemini hỗ trợ các chế độ tương tác khác với hình ảnh dựa trên cấu trúc câu lệnh và ngữ cảnh, bao gồm:
- Văn bản thành hình ảnh và văn bản (xen kẽ): Tạo ra hình ảnh kèm theo văn bản liên quan.
- Ví dụ về câu lệnh: "Tạo một công thức minh hoạ cho món paella."
- (Các) hình ảnh và văn bản thành(các) hình ảnh và văn bản (xen kẽ): Sử dụng hình ảnh và văn bản đầu vào để tạo hình ảnh và văn bản mới có liên quan.
- Ví dụ về câu lệnh: (Với hình ảnh một căn phòng có đồ nội thất) "Những màu sắc nào khác của ghế sofa sẽ phù hợp với không gian của tôi? Bạn có thể cập nhật hình ảnh không?"
Tạo hình ảnh theo lô
Nếu cần tạo nhiều hình ảnh, bạn có thể sử dụng Batch API. Bạn sẽ nhận được hạn mức tốc độ cao hơn để đổi lấy thời gian xử lý lên đến 24 giờ.
Hãy xem Tài liệu về tính năng tạo hình ảnh bằng Batch API và sổ tay hướng dẫn để biết các ví dụ và mã về hình ảnh bằng Batch API.
Hướng dẫn và chiến lược đặt câu lệnh
Để tạo ra hình ảnh chất lượng cao, bạn cần nắm vững một nguyên tắc cơ bản:
Mô tả cảnh, đừng chỉ liệt kê từ khoá. Điểm mạnh cốt lõi của mô hình này là khả năng hiểu ngôn ngữ một cách sâu sắc. Một đoạn văn mô tả, tường thuật sẽ hầu như luôn tạo ra hình ảnh tốt hơn, mạch lạc hơn so với một danh sách các từ rời rạc.
Câu lệnh để tạo hình ảnh
Các chiến lược sau đây sẽ giúp bạn tạo câu lệnh hiệu quả để tạo ra chính xác những hình ảnh mà bạn đang tìm kiếm.
1. Cảnh giống thật
Để có hình ảnh chân thực, hãy sử dụng các thuật ngữ nhiếp ảnh. Đề cập đến góc máy quay, loại ống kính, ánh sáng và các chi tiết nhỏ để hướng dẫn mô hình tạo ra kết quả siêu thực.
2. Hình minh hoạ và hình dán cách điệu
Để tạo hình dán, biểu tượng hoặc thành phần, hãy nêu rõ phong cách và yêu cầu nền trong suốt.
3. Văn bản chính xác trong hình ảnh
Gemini có khả năng kết xuất văn bản vượt trội. Hãy mô tả rõ ràng về văn bản, kiểu chữ và thiết kế tổng thể. Sử dụng tính năng Xem trước hình ảnh của Gemini 3 Pro để sản xuất tài sản chuyên nghiệp.
4. Bản mô phỏng sản phẩm và ảnh thương mại
Phù hợp để tạo ra những bức ảnh sản phẩm chuyên nghiệp, rõ nét cho thương mại điện tử, quảng cáo hoặc hoạt động xây dựng thương hiệu.
5. Thiết kế tối giản và không gian âm
Rất phù hợp để tạo nền cho trang web, bản trình bày hoặc tài liệu tiếp thị mà văn bản sẽ được đặt lên trên.
6. Nghệ thuật tuần tự (Bảng truyện tranh / Bảng phân cảnh)
Dựa trên tính nhất quán của nhân vật và nội dung mô tả cảnh để tạo các bảng cho việc kể chuyện bằng hình ảnh. Để đảm bảo độ chính xác về văn bản và khả năng kể chuyện, những câu lệnh này hoạt động hiệu quả nhất với Gemini 3 Pro Image Preview.
Đầu vào
Đầu ra
7. Kết nối với Google Tìm kiếm
Sử dụng Google Tìm kiếm để tạo hình ảnh dựa trên thông tin gần đây hoặc thông tin theo thời gian thực. Điều này rất hữu ích đối với tin tức, thông tin thời tiết và các chủ đề khác nhạy cảm về thời gian.
Câu lệnh chỉnh sửa hình ảnh
Những ví dụ này cho thấy cách cung cấp hình ảnh cùng với câu lệnh dạng văn bản để chỉnh sửa, tạo thành phần và chuyển kiểu.
1. Thêm và xoá phần tử
Cung cấp một hình ảnh và mô tả nội dung bạn muốn thay đổi. Mô hình sẽ khớp với kiểu, ánh sáng và góc nhìn của hình ảnh gốc.
Đầu vào
Đầu ra
2. Chỉnh sửa cụ thể (Tạo mặt nạ ngữ nghĩa)
Định nghĩa "mặt nạ" theo cách trò chuyện để chỉnh sửa một phần cụ thể của hình ảnh mà không ảnh hưởng đến phần còn lại.
Đầu vào
Đầu ra
3. Chuyển đổi kiểu
Cung cấp một hình ảnh và yêu cầu mô hình tạo lại nội dung của hình ảnh đó theo một phong cách nghệ thuật khác.
Đầu vào
Đầu ra
4. Bố cục nâng cao: Kết hợp nhiều hình ảnh
Cung cấp nhiều hình ảnh làm bối cảnh để tạo một cảnh ghép mới. Đây là lựa chọn hoàn hảo cho bản mô phỏng sản phẩm hoặc ảnh ghép sáng tạo.
Đầu vào 1
Đầu vào 2
Đầu ra
5. Giữ lại chi tiết có độ trung thực cao
Để đảm bảo các chi tiết quan trọng (chẳng hạn như khuôn mặt hoặc biểu trưng) được giữ nguyên trong quá trình chỉnh sửa, hãy mô tả các chi tiết đó một cách cụ thể cùng với yêu cầu chỉnh sửa của bạn.
Đầu vào 1
Đầu vào 2
Đầu ra
6. Hiện thực hoá điều gì đó
Tải bản phác thảo hoặc bản vẽ thô lên và yêu cầu mô hình tinh chỉnh thành một hình ảnh hoàn chỉnh.
Đầu vào
Đầu ra
7. Tính nhất quán của nhân vật: Chế độ xem 360 độ
Bạn có thể tạo chế độ xem 360 độ của một nhân vật bằng cách lặp lại câu lệnh cho các góc khác nhau. Để có kết quả tốt nhất, hãy thêm những hình ảnh đã tạo trước đó vào các câu lệnh tiếp theo để duy trì tính nhất quán. Đối với những tư thế phức tạp, hãy thêm một hình ảnh tham khảo về tư thế mong muốn.
Đầu vào
Đầu ra 1
Đầu ra 2
Các phương pháp hay nhất
Để nâng kết quả từ tốt lên xuất sắc, hãy kết hợp những chiến lược chuyên nghiệp này vào quy trình làm việc của bạn.
- Càng cụ thể càng tốt: Bạn càng cung cấp nhiều thông tin chi tiết, bạn càng có nhiều quyền kiểm soát. Thay vì "áo giáp giả tưởng", hãy mô tả: "áo giáp dạng tấm của người lùn được chạm khắc hoa văn lá bạc, có cổ áo cao và cầu vai có hình dáng như cánh chim ưng".
- Cung cấp bối cảnh và ý định: Giải thích mục đích của hình ảnh. Khả năng hiểu ngữ cảnh của mô hình sẽ ảnh hưởng đến kết quả đầu ra cuối cùng. Ví dụ: "Tạo một biểu trưng cho một thương hiệu chăm sóc da tối giản, cao cấp" sẽ mang lại kết quả tốt hơn so với chỉ "Tạo một biểu trưng".
- Lặp lại và tinh chỉnh: Đừng mong đợi một hình ảnh hoàn hảo ngay từ lần đầu tiên. Sử dụng tính chất đàm thoại của mô hình để thực hiện các thay đổi nhỏ. Tiếp tục đưa ra các câu lệnh như "Tuyệt vời, nhưng bạn có thể điều chỉnh ánh sáng ấm hơn một chút không?" hoặc "Giữ nguyên mọi thứ, nhưng thay đổi biểu cảm của nhân vật sao cho nghiêm túc hơn."
- Sử dụng hướng dẫn từng bước: Đối với những cảnh phức tạp có nhiều phần tử, hãy chia câu lệnh thành các bước. "Trước tiên, hãy tạo một hình nền là khu rừng yên bình, mờ sương vào lúc bình minh. Sau đó, ở tiền cảnh, hãy thêm một bàn thờ bằng đá cổ được phủ rêu. Cuối cùng, hãy đặt một thanh kiếm phát sáng duy nhất lên trên bàn thờ."
- Sử dụng "Câu lệnh phủ định ngữ nghĩa": Thay vì nói "không có ô tô", hãy mô tả cảnh mong muốn một cách tích cực: "một con đường vắng vẻ, không có dấu hiệu giao thông".
- Kiểm soát camera: Sử dụng ngôn ngữ nhiếp ảnh và điện ảnh để kiểm soát bố cục. Các thuật ngữ như wide-angle shot, macro shot, low-angle perspective.
Các điểm hạn chế
- Để đạt hiệu suất tốt nhất, hãy sử dụng các ngôn ngữ sau: tiếng Anh, tiếng Ả Rập (Ai Cập), tiếng Đức (Đức), tiếng Tây Ban Nha (Mexico), tiếng Pháp (Pháp), tiếng Hindi (Ấn Độ), tiếng Indonesia (Indonesia), tiếng Ý (Ý), tiếng Nhật (Nhật Bản), tiếng Hàn (Hàn Quốc), tiếng Bồ Đào Nha (Brazil), tiếng Nga (Nga), tiếng Ukraina (Ukraina), tiếng Việt (Việt Nam), tiếng Trung (Trung Quốc).
- Tính năng tạo hình ảnh không hỗ trợ dữ liệu đầu vào là âm thanh hoặc video.
- Không phải lúc nào mô hình cũng tạo ra chính xác số lượng hình ảnh mà người dùng yêu cầu một cách rõ ràng.
- gemini-2.5-flash-image hoạt động hiệu quả nhất khi có tối đa 3 hình ảnh làm dữ liệu đầu vào, trong khi gemini-3-pro-image-preview hỗ trợ 5 hình ảnh có độ trung thực cao và tổng cộng tối đa 14 hình ảnh.
- Khi tạo văn bản cho một hình ảnh, Gemini hoạt động hiệu quả nhất nếu bạn tạo văn bản trước rồi yêu cầu tạo hình ảnh có văn bản đó.
- Tất cả hình ảnh được tạo đều có hình mờ SynthID.
Cấu hình không bắt buộc
Bạn có thể tuỳ ý định cấu hình các phương thức phản hồi và tỷ lệ khung hình của đầu ra của mô hình trong trường config của các lệnh gọi generate_content.
Loại đầu ra
Theo mặc định, mô hình sẽ trả về các câu trả lời bằng văn bản và hình ảnh (tức là response_modalities=['Text', 'Image']). Bạn có thể định cấu hình câu trả lời để chỉ trả về hình ảnh mà không có văn bản bằng cách sử dụng response_modalities=['Image'].
Tỷ lệ khung hình và kích thước hình ảnh
Theo mặc định, mô hình sẽ điều chỉnh kích thước hình ảnh đầu ra cho phù hợp với kích thước hình ảnh đầu vào hoặc tạo ra các hình vuông 1:1. Bạn có thể kiểm soát tỷ lệ khung hình của hình ảnh đầu ra bằng cách sử dụng trường aspect_ratio trong image_config trong yêu cầu phản hồi, như minh hoạ ở đây:
Các tỷ lệ hiện có và kích thước của hình ảnh được tạo được liệt kê trong các bảng sau:
Hình ảnh Gemini 2.5 Flash
Tỷ lệ khung hình Độ phân giải Mã thông báo 1:1 1024x1024 1290 2:3 832x1248 1290 3:2 1248x832 1290 3:4 864x1184 1290 4:3 1184x864 1290 4:5 896x1152 1290 5:4 1152x896 1290 9:16 768x1344 1290 16:9 1344x768 1290 21:9 1536x672 1290Bản xem trước hình ảnh của Gemini 3 Pro
Tỷ lệ khung hình Độ phân giải 1K 1.000 mã thông báo Độ phân giải 2K 2.000 mã thông báo Độ phân giải 4K Mã thông báo 4K 1:1 1024x1024 1120 2048x2048 1120 4096x4096 2000 2:3 848x1264 1120 1696x2528 1120 3392x5056 2000 3:2 1264x848 1120 2528x1696 1120 5056x3392 2000 3:4 896x1200 1120 1792x2400 1120 3584x4800 2000 4:3 1200x896 1120 2400x1792 1120 4800x3584 2000 4:5 928x1152 1120 1856x2304 1120 3712x4608 2000 5:4 1152x928 1120 2304x1856 1120 4608x3712 2000 9:16 768x1376 1120 1536x2752 1120 3072x5504 2000 16:9 1376x768 1120 2752x1536 1120 5504x3072 2000 21:9 1584x672 1120 3168x1344 1120 6336x2688 2000Lựa chọn mô hình
Chọn mô hình phù hợp nhất với trường hợp sử dụng cụ thể của bạn.
Bản xem trước hình ảnh của Gemini 3 Pro (Bản xem trước của Nano Banana Pro) được thiết kế để sản xuất tài sản chuyên nghiệp và hướng dẫn phức tạp. Mô hình này có tính năng liên kết với thế giới thực bằng cách sử dụng Google Tìm kiếm, quy trình "Suy nghĩ" mặc định giúp tinh chỉnh thành phần trước khi tạo và có thể tạo hình ảnh có độ phân giải lên đến 4K. Hãy xem trang giá và các chức năng của mô hình để biết thêm thông tin chi tiết.
Hình ảnh Gemini 2.5 Flash (Nano Banana) được thiết kế để mang lại tốc độ và hiệu quả. Mô hình này được tối ưu hoá cho các tác vụ có khối lượng lớn, độ trễ thấp và tạo hình ảnh ở độ phân giải 1024px. Hãy xem trang giá và các chức năng của mô hình để biết thêm thông tin chi tiết.
Trường hợp sử dụng Imagen
Ngoài việc sử dụng các tính năng tạo hình ảnh tích hợp của Gemini, bạn cũng có thể truy cập vào Imagen, mô hình tạo hình ảnh chuyên dụng của chúng tôi, thông qua Gemini API.
Imagen 4 là mô hình bạn nên dùng khi bắt đầu tạo hình ảnh bằng Imagen. Chọn Imagen 4 Ultra cho các trường hợp sử dụng nâng cao hoặc khi bạn cần chất lượng hình ảnh tốt nhất (xin lưu ý rằng bạn chỉ có thể tạo một hình ảnh tại một thời điểm).
Bước tiếp theo
- Bạn có thể tìm thêm ví dụ và mã mẫu trong hướng dẫn về sổ tay hướng dẫn.
- Hãy xem hướng dẫn về Veo để tìm hiểu cách tạo video bằng Gemini API.
- Để tìm hiểu thêm về các mô hình Gemini, hãy xem phần Các mô hình Gemini.