Trí Tuệ Nhân Tạo (AI) Có Thể Tái Tạo Ảnh Biểu Tượng Lịch Sử Giống Đến Đâu? Một Thử Nghiệm Chuyên Sâu

Table of Contents

Các mô hình AI hiện đại đang phát triển với tốc độ chóng mặt, dường như có khả năng làm mọi thứ. Nhưng liệu chúng có thể tái tạo được sự rực rỡ, cảm xúc và không khí đặc trưng của những bức ảnh biểu tượng nhất thế kỷ 20? Bài viết này sẽ đi sâu vào thử nghiệm khả năng của trí tuệ nhân tạo trong việc tái hiện lại các tác phẩm nhiếp ảnh kinh điển, từ chân dung con người đến cảnh quan rộng lớn, và đánh giá xem AI đã tiến bộ đến mức nào trong việc “hiểu” và tái tạo giá trị nghệ thuật, lịch sử.

Mục tiêu cốt lõi của thử nghiệm này là kiểm chứng sức mạnh thực sự của các công cụ AI tạo ảnh hiện nay. Trong khi nhiều người sáng tạo cảm thấy lo ngại về sự thống trị của AI trong tương lai, các nhiếp ảnh gia có thể vẫn an tâm vì một lý do đơn giản: họ đang ghi lại thực tại. Những bức ảnh bạn sẽ thấy trong bài viết này không chỉ là những tuyệt tác của nghệ thuật nhiếp ảnh mà còn là một “viên nang thời gian”, ghi lại những khoảnh khắc lịch sử quý giá. Một mô hình AI có thể tạo ra thứ gì đó với cảm giác tương tự, nhưng việc kỳ vọng một hình ảnh do AI tạo ra sẽ mang bất kỳ giá trị văn hóa quan trọng nào thực sự là điều vô lý. Công cụ được sử dụng trong thử nghiệm này là Fotor AI, một trình tạo ảnh từ văn bản tương đối đơn giản, thường mang lại kết quả ổn định. Tuy nhiên, nó không phải là Midjourney và mặc dù rất tốt cho nhiều phong cách nghệ thuật khác nhau, kỹ năng “nhiếp ảnh” của nó đôi khi còn kém, đặc biệt khi cố gắng tái tạo đúng bối cảnh thời gian của hình ảnh gốc.

AI Xử Lý Chủ Thể Con Người Trong Ảnh Lịch Sử Như Thế Nào?

Để đánh giá khả năng của AI trong việc tái tạo chủ thể con người, chúng tôi đã chọn hai bức ảnh chân dung và cảnh quan có con người mang tính biểu tượng, đại diện cho những khoảnh khắc lịch sử và cảm xúc sâu sắc.

Thử Nghiệm 1: “Người Mẹ Di Cư” của Dorothea Lange

Dorothea Lange là huyền thoại đầu tiên được AI “xử lý”. “Migrant Mother” (Người Mẹ Di Cư) là một trong những bức ảnh biểu tượng nhất mọi thời đại, và chúng tôi đã lầm tưởng rằng Fotor sẽ “quen thuộc” với nó.

Bức ảnh biểu tượng do Dorothea Lange chụp, mô tả một người mẹ ôm các con trong thời kỳ Đại Suy Thoái.Dorothea Lange (1895-1965), Phạm vi công cộng

Tuy nhiên, mô hình AI này không thực sự giỏi với các tên riêng, và chúng tôi phải mô tả chi tiết hình ảnh cho đến khi nó hiểu được ý tưởng. Kết quả khá ổn:

Hình ảnh do AI tạo ra mô tả một người mẹ trong thời kỳ Đại Suy Thoái đang ôm hai đứa con.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Khi xem xét kỹ hơn, vấn đề lớn nhất là ánh sáng. Trong bản gốc, chủ thể được chiếu sáng bằng ánh sáng tự nhiên, trong khi AI lại “ban tặng” cho “người mẹ” của chúng ta một cách xử lý ánh sáng studio hiện đại. Bức ảnh cũng trông quá “mượt mà” theo ý kiến của chúng tôi, mặc dù điều này có thể được khắc phục bằng một chút nhiễu và hạt phim. Về bố cục, đây là một thất bại. Dorothea Lange đã cẩn thận sắp xếp bức ảnh để kể một câu chuyện về những người bị ảnh hưởng bởi Đại Suy Thoái, với từng chi tiết từ cắt ảnh đến ánh sáng đều góp phần vào thông điệp. Mặt khác, AI vẫn gặp khó khăn với ý nghĩa ngầm, vì vậy không có điều đó được chuyển thể vào kết quả cuối cùng.

Fotor cũng cung cấp tùy chọn sử dụng hình ảnh làm đầu vào (image-to-image), và điều này mang lại kết quả gần hơn (ít nhất là về bố cục):

Hình ảnh do AI tạo ra mô tả một người mẹ trong thời kỳ Đại Suy Thoái đang ôm hai đứa con.Sead Fadilpašić/Fotor AI/ MakeUseOf

Mặc dù những hình ảnh này khó phân biệt, chúng tôi không hài lòng với kết quả vì Fotor dường như chỉ áp dụng một bộ lọc “làm đẹp” chất lượng thấp lên chủ thể. Nhưng nếu là một cảnh phức tạp hơn thì sao?

Thử Nghiệm 2: “Nixon ở Trung Quốc” của Oliver F. Atkins

Để thử thách AI với một cảnh phức tạp hơn, chúng ta sẽ tua nhanh đến đầu những năm 70 và thử tái tạo “Nixon ở Trung Quốc” của Oliver F. Atkins.

Bức ảnh mô tả cựu tổng thống Richard Nixon ăn tối với các quan chức Trung Quốc.Oliver F. Atkins (1917-1977), Phạm vi công cộng

Dưới đây là cách Fotor xử lý bức ảnh này. Điều đầu tiên bạn sẽ nhận thấy là Fotor rõ ràng không biết Richard Nixon là ai (mô hình có lẽ sẽ “nổ tung” nếu tôi dùng prompt “Watergate”).

Hình ảnh do AI tạo ra mô tả một người đàn ông dùng đũa tại bàn ăn, xung quanh là các quan chức Trung Quốc.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Ý chính của bức ảnh vẫn còn đó (bao gồm cả sự bối rối khi một miếng thức ăn dính vào đũa), nhưng bố cục và bối cảnh quá khác biệt. Có lẽ sẽ rất khó để nhận ra hình ảnh do AI tạo ra dựa trên cái gì nếu tôi chưa từng xem bản gốc. Chế độ image-to-image cho ra bố cục tương tự nhưng chất lượng tổng thể bị giảm đi đáng kể. Các khuôn mặt bị méo mó, đây là một trong nhiều dấu hiệu nhận biết hình ảnh do AI tạo ra kém chất lượng.

Hình ảnh do AI tạo ra mô tả cựu tổng thống Richard Nixon đang ăn tại một nhà hàng, xung quanh là các quan chức Trung Quốc.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Khả Năng Của AI Với Cảnh Vật Và Vật Thể Vô Tri

Tiếp theo, chúng ta sẽ khám phá xem AI xử lý các cảnh vật và vật thể vô tri như thế nào, với độ phức tạp khác nhau.

Thử Nghiệm 3: “Thảm Họa Hindenburg” của Sam Shere

Hãy bắt đầu với kiệt tác “Thảm Họa Hindenburg” của Sam Shere. Bức ảnh “một lần trong đời” này siêu phức tạp, vì vậy đây sẽ là một thử thách tốt cho AI.

Bức ảnh ghi lại cảnh khinh khí cầu Hindenburg gặp nạn.Sam Shere (1905-1982), Phạm vi công cộng

Fotor ít nhiều đã hiểu những gì chúng tôi yêu cầu nó làm.

Hình ảnh do AI tạo ra mô tả cảnh khinh khí cầu Hindenburg gặp nạn.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Chúng tôi sử dụng cụm từ ‘ít nhiều’ vì khinh khí cầu vẫn còn nguyên vẹn mặc dù nó đã bốc cháy. Nó cũng quá gần mặt đất và không thể tái tạo bố cục của bản gốc. Khi sử dụng hình ảnh gốc làm đầu vào, gần như không thể phân biệt hai hình ảnh:

Hình ảnh do AI tạo ra tái hiện Thảm Họa Hindenburg.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Thử Nghiệm 4: “Khinh Khí Cầu Cactus” của Leon Gimpel

Còn một cảnh không dễ nhận biết ngay lập tức thì sao? “Khinh Khí Cầu Cactus” của Leon Gimpel hoàn toàn phù hợp.

Một bức ảnh mô tả hai khinh khí cầu ở Paris.Léon Gimpel (1873-1948), Phạm vi công cộng

Đây cũng là một trong những ví dụ hiếm hoi về việc sử dụng nhiếp ảnh màu đầu những năm 1900, vì vậy thật thú vị khi xem liệu AI có thể tái tạo vẻ ngoài độc đáo đó hay không. Kết quả cho thấy: AI không thể.

Hình ảnh do AI tạo ra mô tả hai khinh khí cầu trong một không gian kín ở Paris.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Bối cảnh (Grand Palais, Paris) là chính xác, nhưng bố cục và các chủ thể hầu như không giống bản gốc. Màu sắc cũng không đúng với thời kỳ. Sử dụng hình ảnh gốc làm prompt mang lại kết quả tốt hơn nhiều:

Hình ảnh do AI tạo ra mô tả hai khinh khí cầu trong một không gian kín ở Paris.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Tuy nhiên, có một vấn đề nhỏ. Có vẻ như Fotor chỉ đơn giản là tái tạo lại hình ảnh gốc theo phong cách nghệ thuật màu nước/pastel, mặc dù chúng tôi đã sử dụng các prompt phủ định để ngăn mô hình làm điều đó. Do đó, bạn không nên kỳ vọng nhiều vào việc cải thiện ở đây.

AI Tái Tạo Phong Cảnh Và Cảnh Quan Đô Thị Ra Sao?

Cuối cùng, chúng ta sẽ xem xét khả năng của AI trong việc tái tạo phong cảnh thiên nhiên và cảnh quan đô thị, những thể loại đòi hỏi sự tinh tế về ánh sáng, bóng tối và chi tiết.

Thử Nghiệm 5: “Moonrise, Hernandez, New Mexico” của Ansel Adams

Do cách sử dụng bộ lọc đen trắng màu cam và vàng để chơi với độ tương phản cùng kỹ thuật điêu luyện trong phòng tối, phong cách của Ansel Adams ngay lập tức được nhận ra và rất khó tái tạo.

Bức ảnh mô tả mặt trăng trên một thành phố sa mạc tối.Ansel Adams (1902-1984). Phạm vi công cộng

Tất nhiên, chúng tôi đã quyết định cho Fotor một “mặc cảm tự ti”. Mặc dù cảnh không giống chút nào, nhưng độ tương phản lại gợi ý về phong cách của Ansel Adams.

Hình ảnh do AI tạo ra mô tả một cảnh tối với mặt trăng trên một thị trấn sa mạc.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Image-to-image tốt hơn nhiều về tổng thể nhưng hình ảnh đã mất đi tất cả các chi tiết nhỏ hơn:

Hình ảnh do AI tạo ra mô tả một phong cảnh tối với mặt trăng chiếu sáng một thị trấn sa mạc.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Thử Nghiệm 6: “Nụ Hôn Chia Tay Chiến Tranh” của Victor Jorgensen

Chúng tôi là một fan hâm mộ lớn của nhiếp ảnh đường phố, nhưng thật không may, hầu hết các bức ảnh đường phố biểu tượng vẫn chưa thuộc phạm vi công cộng. Do đó, bức ảnh biểu tượng “Kissing the War Goodbye” (Nụ Hôn Chia Tay Chiến Tranh) của Victor Jorgensen sẽ là một lựa chọn phù hợp.

Hình ảnh mô tả một thủy thủ hôn một y tá ở Quảng trường Thời Đại.Victor Jorgensen (1913-1994), Phạm vi công cộng

Đúng như bạn có thể mong đợi từ Fotor vào thời điểm này, kết quả cuối cùng là khá ổn. Tuy nhiên, có hai vấn đề.

Hình ảnh do AI tạo ra mô tả một thủy thủ hôn một y tá ở Quảng trường Thời Đại.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Đầu tiên, nó rất giống một bức ảnh khác về cảnh này do Alfred Eisenstadt chụp, và thứ hai, giờ đây nó trông dàn dựng 100% (bản gốc thì không). Về mặt kỹ thuật, ánh sáng giống với ánh sáng studio hiện đại và bức ảnh quá tương phản theo ý muốn của chúng tôi. Hãy sử dụng hình ảnh gốc làm prompt:

Hình ảnh do AI tạo ra mô tả một thủy thủ hôn một y tá ở Quảng trường Thời Đại.Sead Fadilpašić/ Fotor AI/ MakeUseOf

Cái này là một kết quả “hỗn hợp”. Mặc dù chúng tôi thích vẻ ngoài của các chủ thể chính, nhưng khuôn mặt của những người ở hậu cảnh giờ đây trông thẳng từ một bộ phim kinh dị ra – một điều không mấy hay ho.

Tổng thể, chúng tôi ấn tượng với một số tác phẩm của Fotor, nhưng kết quả quá thiếu nhất quán. Midjourney và DALL-E vẫn vượt trội hơn khi nói đến việc tạo ảnh dựa trên prompt, đặc biệt nếu bạn muốn tạo ra những bức ảnh trông chân thực. Fotor AI vẫn còn một chặng đường dài để có thể tái tạo được sự phức tạp, chiều sâu cảm xúc và bối cảnh lịch sử mà những nhiếp ảnh gia vĩ đại đã ghi lại.

Hãy chia sẻ ý kiến của bạn về khả năng của AI trong việc tái tạo nghệ thuật nhiếp ảnh. Bạn đã thử công cụ AI nào và kết quả ra sao? Đừng quên theo dõi Thuthuatonline.net để đọc thêm các bài phân tích chuyên sâu về công nghệ và AI!