OpenAI Tung GPTBot Lùng Sục Internet: Những Căn Nhà Dữ Liệu Đã Bị Xâm Phạm - Nghĩa AI

OpenAI Tung GPTBot Lùng Sục Internet: Những Căn Nhà Dữ Liệu Đã Bị Xâm Phạm - Nghĩa AI

OpenAI hiện đang sử dụng GPTBot để thu thập dữ liệu từ internet nhằm huấn luyện các mô hình ngôn ngữ lớn như GPT-4. Tuy nhiên, việc này gây ra tranh cãi về vấn đề đạo đức liên quan đến việc sao chép dữ liệu từ các trang web của người khác.

 

Cộng đồng trên HackerNews đang thảo luận về đạo đức của việc phát hành trình thu thập web này để huấn luyện mô hình Trí tuệ Nhân tạo. Một người dùng đã phê phán rằng OpenAI thậm chí không trích dẫn một cách cân nhắc. Họ tạo ra một tác phẩm phái sinh mà không trích dẫn, làm cho việc này trở nên không minh bạch. Hơn nữa, OpenAI không công nhận những trang web đã được sử dụng để xây dựng các mô hình của họ.

Gần đây, OpenAI cũng đã đăng ký nhãn hiệu cho 'GPT-5', cho thấy công ty đang huấn luyện phiên bản tiếp theo của GPT-4, được cho là gần đạt đến Trí tuệ Nhân tạo tổng hợp (AGI) - mục tiêu mà công ty theo đuổi trong thời gian qua. GPTBot rõ ràng sẽ giúp công ty thu thập thêm dữ liệu từ internet để huấn luyện mô hình này. Tuy nhiên, công ty đã ngừng sử dụng Bộ phân loại Trí tuệ Nhân tạo để phát hiện văn bản do GPT tạo ra.

Computer Engineer - Võ Trọng Nghĩa


(*) Xem thêm

Bình luận
  • Đánh giá của bạn
Đã thêm vào giỏ hàng