OpenAI trình làng GPT-5 Pro và Sora 2, mở rộng hệ sinh thái AI toàn diện
Tại Dev Day 2025, OpenAI giới thiệu GPT-5 Pro, Sora 2 và mô hình giọng nói gpt-realtime mini, đánh dấu bước tiến mới trong hành trình mở rộng hệ sinh thái AI toàn diện, kết hợp ngôn ngữ, hình ảnh và âm thanh.
Tại Dev Day 2025 - sự kiện thường niên dành cho các nhà phát triển toàn cầu của OpenAI, nơi công ty công bố những công nghệ và sản phẩm mới nhất trong hệ sinh thái trí tuệ nhân tạo, OpenAI đã giới thiệu loạt cập nhật lớn cho API, bao gồm mô hình ngôn ngữ thế hệ mới GPT-5 Pro, công cụ tạo video Sora 2 và mô hình giọng nói gpt-realtime mini nhỏ hơn, rẻ hơn.
Những cập nhật này nằm trong chiến lược mở rộng hệ sinh thái dành cho nhà phát triển, song song với việc ra mắt công cụ xây dựng tác nhân và khả năng phát triển ứng dụng trực tiếp trong ChatGPT.

OpenAI công bố GPT-5 Pro và Sora 2, mở rộng tương lai AI đa phương thức (Ảnh minh họa).
GPT-5 Pro: Bước tiến mới cho các ngành yêu cầu độ chính xác cao
Giám đốc điều hành OpenAI Sam Altman cho biết, GPT-5 Pro được thiết kế để phục vụ các ứng dụng trong lĩnh vực tài chính, pháp lý và chăm sóc sức khỏe, nơi cần “độ chính xác cao và khả năng lập luận sâu sắc”.
Altman nhấn mạnh, trong tương lai, AI giọng nói sẽ trở thành một phương thức tương tác chủ đạo giữa con người và máy móc. Để đón đầu xu hướng này, OpenAI giới thiệu “gpt-realtime mini”, mô hình giọng nói mới hỗ trợ phát trực tuyến với độ trễ thấp, chi phí thấp hơn 70% so với thế hệ trước nhưng vẫn giữ được chất lượng và độ biểu cảm tự nhiên.
Sora 2: Mở rộng giới hạn sáng tạo hình ảnh và âm thanh
Bên cạnh đó, OpenAI cũng mang đến Sora 2, mô hình tạo âm thanh và video mới nhất, hiện đã có bản thử nghiệm trong API. Sora 2 được phát hành cùng ứng dụng Sora - nền tảng chia sẻ video ngắn do AI tạo ra, được xem là đối thủ cạnh tranh của TikTok.
Người dùng có thể tạo video về bản thân, bạn bè hoặc bất kỳ chủ đề nào dựa trên lời nhắc (prompt), sau đó chia sẻ trên nguồn cấp dữ liệu được sắp xếp bằng thuật toán. “Các nhà phát triển hiện có thể truy cập cùng mô hình tạo ra những cảnh quay ấn tượng của Sora 2 ngay trong ứng dụng của mình,” Altman chia sẻ.

Hệ sinh thái AI của OpenAI mở rộng với GPT-5 Pro và Sora 2 ra mắt tại Dev Day 2025 (Ảnh minh họa).
So với thế hệ trước, Sora 2 mang đến cảnh quay chân thực hơn, tuân thủ nguyên tắc vật lý, âm thanh được đồng bộ hoàn hảo và khả năng kiểm soát sáng tạo cao hơn, cho phép điều chỉnh góc quay chi tiết hay hiệu ứng hình ảnh nghệ thuật.
Altman minh họa khả năng này bằng ví dụ: “Bạn có thể quay một khung hình từ iPhone và yêu cầu Sora mở rộng nó thành một cảnh quay toàn cảnh điện ảnh. Một trong những điều thú vị nhất mà chúng tôi đang nghiên cứu là cách Sora kết hợp âm thanh và hình ảnh, không chỉ là lời thoại mà còn là âm thanh môi trường, hiệu ứng đồng bộ, và không gian âm thanh giàu chiều sâu.”
AI đi sâu vào quy trình sáng tạo sản phẩm
OpenAI còn tiết lộ ví dụ hợp tác với Mattel, hãng sản xuất búp bê Barbie, trong việc sử dụng AI tạo sinh để hỗ trợ các nhà thiết kế chuyển bản phác thảo thành ý tưởng đồ chơi hoàn chỉnh. Theo Altman, Sora 2 có thể trở thành công cụ phát triển ý tưởng mạnh mẽ, từ việc tạo hình quảng cáo đến giai đoạn thiết kế sản phẩm.
Với GPT-5 Pro, Sora 2 và mô hình giọng nói mới, OpenAI đang tiếp tục củng cố vị thế tiên phong trong cuộc đua mở rộng trải nghiệm AI toàn diện, hướng đến một hệ sinh thái nơi ngôn ngữ, hình ảnh, âm thanh và ứng dụng hòa quyện thành nền tảng sáng tạo thống nhất.