Skip to content

Thủ Thuật Online

  • Sample Page

Thủ Thuật Online

  • Home » 
  • Tin Công Nghệ » 
  • OpenAI Ra Mắt o3 và o4-mini: Khả Năng Suy Luận Hình Ảnh Vượt Trội của ChatGPT

OpenAI Ra Mắt o3 và o4-mini: Khả Năng Suy Luận Hình Ảnh Vượt Trội của ChatGPT

By Administrator Tháng 8 6, 2025 0
o4-mini mô tả hình ảnh trong ChatGPT với khả năng suy luận vượt trội
Table of Contents
Xem thêm: Claude AI Đe Dọa Tống Tiền Kỹ Sư: Góc Khuất Đáng Báo Động Từ Claude Opus 4

Vào ngày 16 tháng 4 năm 2025, OpenAI đã chính thức giới thiệu hai mô hình suy luận AI mới: o3 và o4-mini. Đây là một bước tiến vượt bậc trong năng lực AI của công ty, điều mà chúng ta có thể thấy rõ nhất qua khả năng suy luận hình ảnh hoàn toàn mới, mang lại tiềm năng ứng dụng rộng lớn cho ChatGPT.

Khả Năng “Tư Duy” Bằng Hình Ảnh Của Các Mô Hình Mới

OpenAI cho biết các mô hình AI mới này có thể diễn giải bất kỳ hình ảnh nào mà bạn tải lên, dù đó là một bản phác thảo trên bảng trắng, sơ đồ trong sách giáo khoa hay một tệp PDF đồ họa phức tạp. Theo thông báo ra mắt chính thức của OpenAI về o3 và o4-mini, họ khẳng định: “Chúng không chỉ nhìn thấy một hình ảnh – chúng còn tư duy với nó. Điều này mở ra một lớp giải quyết vấn đề mới, kết hợp lý luận thị giác và văn bản, được thể hiện qua hiệu suất vượt trội của chúng trên các tiêu chuẩn đa phương thức hàng đầu.”

Khả năng phân tích hình ảnh này được tích hợp vào chuỗi suy luận của các mô hình. Các mô hình AI có thể phóng to, xoay hoặc cắt hình ảnh để cải thiện quá trình xử lý. Đặc biệt, chúng vẫn hoạt động hiệu quả ngay cả với những hình ảnh có chất lượng thấp.

Xem thêm: Gmail Ra Mắt Tính Năng Quản Lý Đăng Ký Mới: Dễ Dàng Dọn Sạch Hộp Thư

o4-mini mô tả hình ảnh trong ChatGPT với khả năng suy luận vượt trộio4-mini mô tả hình ảnh trong ChatGPT với khả năng suy luận vượt trội

Ví dụ, khi giải một bài toán khoa học liên quan đến sơ đồ, mô hình có thể phóng to một phần cụ thể của hình ảnh, thực hiện các phép tính bằng Python, sau đó tạo một biểu đồ để giải thích những phát hiện của mình.

Trong quá trình suy luận, o3 và o4-mini có thể sử dụng linh hoạt tất cả các công cụ có sẵn trong ChatGPT, bao gồm duyệt web, thực thi mã Python và tạo hình ảnh. Khả năng tác nhân (agentic capability) này cho phép chúng tự động chọn công cụ ChatGPT lý tưởng nhất cho một nhiệm vụ cụ thể. Điều này giúp người dùng và nhà phát triển có thể thực hiện các quy trình làm việc đa bước và giải quyết những tác vụ phức tạp.

Xem thêm: Grok Studio ra mắt: Bước tiến vượt trội của xAI trong lập trình và văn phòng AI

Phiên bản o4-mini-high là một biến thể của o4-mini, được thiết kế để dành nhiều thời gian và công sức tính toán hơn cho mỗi lời nhắc (prompt) nhằm mang lại kết quả chất lượng cao hơn. Một số kịch bản ứng dụng phổ biến có thể bao gồm:

  • Tạo và đánh giá các nghiên cứu trong sinh học, kỹ thuật và các lĩnh vực STEM khác, cung cấp lý luận từng bước chi tiết và giải thích trực quan.
  • Tìm kiếm và tổng hợp thông tin từ nhiều nguồn khác nhau như cơ sở dữ liệu trực tuyến, báo cáo tài chính, dữ liệu thị trường và biểu đồ, để tạo ra những thông tin chi tiết (insights) về kinh doanh.

Các mô hình này đã được đào tạo thông qua học tăng cường (reinforcement learning) – một khái niệm cốt lõi trong AI. Giờ đây, chúng có thể xử lý tốt hơn các vấn đề “mờ” (fuzzier problems) vì chúng có khả năng suy luận khi nào nên sử dụng một công cụ cụ thể để đạt được kết quả mong muốn.

Các mô hình o3, o4-mini và o4-mini-high hiện đã có sẵn cho tất cả những người dùng có tài khoản ChatGPT Plus, Pro và Team. Riêng o3-pro dự kiến sẽ ra mắt trong những tuần tới và có thể tìm thấy trong menu chọn mô hình. Đối với người dùng miễn phí, bạn có thể trải nghiệm o4-mini bằng cách chọn tùy chọn Think trong giao diện soạn thảo trước khi gửi yêu cầu.

Tại Sao Khả Năng Đa Phương Thức Của ChatGPT Lại Đáng Kinh Ngạc?

Bằng cách cho phép AI “tư duy bằng hình ảnh”, các mô hình mới của OpenAI có thể giải quyết các vấn đề trong thế giới thực đòi hỏi sự diễn giải cả văn bản và hình ảnh. Điều này bao gồm việc gỡ lỗi mã từ ảnh chụp màn hình, đọc chữ viết tay, phân tích sơ đồ khoa học, hoặc trích xuất thông tin chi tiết từ các biểu đồ phức tạp. Kết quả là ChatGPT đã trở nên nhận thức ngữ cảnh tốt hơn đáng kể.

Các mô hình này hiện nay đã tự chủ hơn. Chúng cũng có thể hiệu quả hơn, tự động điều chỉnh một mô hình cụ thể cho từng nhiệm vụ. Vì các tác nhân AI tự chủ này có thể xử lý các nhiệm vụ phức tạp, nhiều bước, khả năng suy luận và trí tuệ thị giác của chúng trở nên cực kỳ quan trọng đối với các lĩnh vực như nghiên cứu, kinh doanh và công việc sáng tạo.

Kết luận:

Sự ra đời của OpenAI o3 và o4-mini đánh dấu một cột mốc quan trọng trong sự phát triển của AI, đặc biệt với khả năng suy luận hình ảnh tiên tiến. Những mô hình này không chỉ nâng cao năng lực của ChatGPT về hiểu và tương tác với thế giới thực, mà còn mở ra vô số cơ hội ứng dụng trong nhiều ngành nghề. Hãy trải nghiệm ngay những cải tiến này để khám phá tiềm năng của AI đa phương thức và chia sẻ ý kiến của bạn!

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Top 10 Ứng Dụng Đọc Sách Miễn Phí Tốt Nhất 2024 Cho Mọi Tín Đồ Sách

Next post

IR Blaster Trên Điện Thoại: Tính Năng Độc Đáo Mà Mọi Flagship Android Nên Có

Administrator

Related Posts

Categories Tin Công Nghệ OpenAI Ra Mắt o3 và o4-mini: Khả Năng Suy Luận Hình Ảnh Vượt Trội của ChatGPT

Cảnh báo: AI tạo video miễn phí có thể ẩn chứa mã độc Noodlophile

Categories Tin Công Nghệ OpenAI Ra Mắt o3 và o4-mini: Khả Năng Suy Luận Hình Ảnh Vượt Trội của ChatGPT

Gmail Ra Mắt Tính Năng Quản Lý Đăng Ký Mới: Dễ Dàng Dọn Sạch Hộp Thư

Categories Tin Công Nghệ OpenAI Ra Mắt o3 và o4-mini: Khả Năng Suy Luận Hình Ảnh Vượt Trội của ChatGPT

iOS 18.5: Cách Đưa Ứng Dụng Mail Về Giao Diện Cũ “Dễ Thở” Hơn

Leave a Comment Hủy

Recent Posts

  • Cách Tìm & Xử Lý Ứng Dụng Ngốn Pin Laptop Windows Hiệu Quả
  • Smart TV Đang Theo Dõi Bạn Thế Nào? Bảo Vệ Quyền Riêng Tư Của Bạn
  • Khám Phá 10 Tùy Chọn Nhà Phát Triển Android Hữu Ích Nhất: Nâng Tầm Trải Nghiệm Sử Dụng Điện Thoại
  • Nâng Tầm Năng Suất: 10 Thủ Thuật AutoHotkey Hữu Ích Độc Đáo Cho Người Dùng Windows
  • 5 Ứng Dụng Thay Thế Pocket Tốt Nhất Sau Khi Ngừng Hoạt Động

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2026 Thủ Thuật Online - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?