Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí

Thứ hai - 24/06/2024 08:45 Đã xem: 450 Phản hồi: 0

(CLO) Nhiều công ty trí tuệ nhân tạo (AI) đang vi phạm tiêu chuẩn được các nhà xuất bản sử dụng để chặn việc thu thập nội dung báo chí của họ, theo công ty khởi nghiệp cấp phép nội dung TollBit tiết lộ với các tổ chức tin tức.

Một lá thư gửi cho các nhà xuất bản được hãng tin Reuters xem hôm thứ Sáu xuất hiện trong bối cảnh công ty khởi nghiệp tìm kiếm AI Perplexity và hãng truyền thông Forbes đang tranh chấp pháp lý công khai về việc sử dụng trái phép nội dung tin tức.

Nó cũng diễn ra trong một cuộc chiến rộng lớn của các tổ chức báo chí nhằm bảo vệ nội dung của mình trước sự xâm phạm của các công ty công nghệ trong thời kỳ bùng nổ công cụ AI tạo sinh.

phat hien nhieu cong ty ai am tham thu thap trai phep noi dung bao chi hinh 1 — Ảnh: Reuters

Mối lo của các tổ chức tin tức

Trong vụ tranh chấp giữa Perplexity và Forbes, một cuộc điều tra được xuất bản trong tuần này cho thấy Perplexity có thể đã vượt qua trình chặn thu thập thông tin web của Forbes là Giao thức loại trừ robot hay "robots.txt" - một tiêu chuẩn được chấp nhận rộng rãi nhằm xác định phần nào của trang web được phép thu thập thông tin.

News Media Alliance, một nhóm thương mại đại diện cho hơn 2.200 nhà xuất bản có trụ sở tại Mỹ, bày tỏ lo ngại về việc "thu thập dữ liệu trái phép" này đối với các thành viên của mình.

Danielle Coffey, chủ tịch tập đoàn News Media Alliance cho biết: “Nếu không có khả năng từ chối thu thập dữ liệu lớn, chúng ta không thể kiếm tiền từ nội dung có giá trị của mình và trả tiền cho các nhà báo. Điều này có thể gây tổn hại nghiêm trọng đến ngành của chúng ta”.

TollBit, một công ty khởi nghiệp ở giai đoạn đầu, đang tự định vị mình là người kết nối giữa các công ty AI đói nội dung và các nhà xuất bản trong các thỏa thuận cấp phép nội dung.

TollBit theo dõi lưu lượng truy cập AI đến các trang web của nhà xuất bản và sử dụng phân tích để giúp cả hai bên giải quyết các khoản phí phải trả cho việc sử dụng các loại nội dung khác nhau.

Ví dụ: các nhà xuất bản có thể chọn đặt mức giá cao hơn cho "nội dung cao cấp, chẳng hạn như tin tức mới nhất hoặc thông tin chi tiết độc quyền", theo công ty cho biết trên trang web của mình.

Theo bức thư của TollBit, Perplexity không phải là kẻ phạm tội duy nhất phớt lờ giao thức robots.txt. TollBit cho biết các phân tích của họ cho thấy "nhiều" tác nhân AI đang bỏ qua giao thức, một công cụ tiêu chuẩn được các nhà xuất bản sử dụng để cho biết phần nào trên trang web của họ có thể được thu thập thông tin.

TollBit viết: “Điều này có nghĩa trong thực tế là các tác nhân AI từ nhiều nguồn (không chỉ một công ty) đang chọn bỏ qua giao thức robots.txt để truy xuất nội dung từ các trang web".

Cần ngăn chặn các hành vi vi phạm bản quyền

Giao thức robots.txt được tạo ra vào giữa những năm 1990 như một cách để tránh làm các trang web bị quá tải bởi trình thu thập dữ liệu web. Mặc dù không có cơ chế thực thi pháp luật rõ ràng, nhưng trong lịch sử đã có sự tuân thủ rộng rãi trên web đối với quy định này.

Gần đây hơn, robots.txt đã trở thành một công cụ quan trọng mà các tổ chức tin tức đã sử dụng để chặn các công ty công nghệ “đánh cắp” nội dung báo chí của họ để sử dụng đào tạo các hệ thống AI tạo sinh hoặc thậm chí đưa tin trực tiếp cho người dùng để thu lợi nhuận.

Một số nhà xuất bản, bao gồm cả New York Times, đã kiện các công ty AI vì vi phạm bản quyền đối với những mục đích sử dụng đó. Nhiều nhà phát triển AI bao biện rằng họ không vi phạm luật nào khi truy cập chúng miễn phí, dù thực tế mọi bài báo đều được bảo vệ bản quyền ở mọi quốc gia.

Gần đây, các tổ chức báo chí đã đưa ra cảnh báo và rất lo ngại về các công cụ “xào xáo” tin tức, đặc biệt kể từ khi Google tung ra một sản phẩm vào năm ngoái về việc sử dụng AI để tạo các bản tóm tắt thông tin để trả lời một số truy vấn tìm kiếm, thay vì đưa ra các đường link đến nguồn tin gốc.

Tuy nhiên, thách thức lớn là nếu nhà xuất bản muốn ngăn AI của Google sử dụng nội dung của họ để giúp tạo ra những bản thông tin tóm tắt để trả lời cho người dùng đó, thì họ phải sử dụng cùng một công cụ có thể ngăn chúng xuất hiện trong kết quả tìm kiếm của Google.

Nguồn tin: congluan.vn:

Tags: tổ chức, nội dung, báo chí, công ty, vi phạm, sử dụng, nhà xuất bản, tiêu chuẩn, trí tuệ, thu thập, nhân tạo, tiết lộ

Những tin mới hơn

Những tin cũ hơn

Liên kết website

Thống kê truy cập

Đang truy cập37
Máy chủ tìm kiếm11
Khách viếng thăm26
Hôm nay12,023
Tháng hiện tại58,377
Tổng lượt truy cập32,436,323

Phóng sự

Xem thêm

Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí

(CLO) Nhiều công ty trí tuệ nhân tạo (AI) đang vi phạm tiêu chuẩn được các nhà xuất bản sử dụng để chặn việc thu thập nội dung báo chí của họ, theo công ty khởi nghiệp cấp phép nội dung TollBit tiết lộ với các tổ chức tin tức.

Mối lo của các tổ chức tin tức

Cần ngăn chặn các hành vi vi phạm bản quyền

Liên kết website

Thống kê truy cập

Phóng sự

Hình ảnh nổi bật

Thông tin văn bản

23/QĐ - HNB

327/KH- BTC

09/KH-UBND

12/2024/TT-BTTTT

Mau ĐXKNHV - HNB

Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí

(CLO) Nhiều công ty trí tuệ nhân tạo (AI) đang vi phạm tiêu chuẩn được các nhà xuất bản sử dụng để chặn việc thu thập nội dung báo chí của họ, theo công ty khởi nghiệp cấp phép nội dung TollBit tiết lộ với các tổ chức tin tức.

Mối lo của các tổ chức tin tức

Cần ngăn chặn các hành vi vi phạm bản quyền

Nghị quyết do Trung Quốc dẫn đầu về AI được thông qua tại Liên hợp quốc

Nhóm báo chí điều tra kiện OpenAI và Microsoft vi phạm bản quyền

Thêm 5 nhà báo Palestine thiệt mạng ở Gaza

Quảng Ninh: Bổ nhiệm chức vụ Giám đốc, Tổng Biên tập Trung tâm Truyền thông tỉnh

Khánh thành Nhà bia di tích lịch sử Báo Nhân Dân ra số đầu tiên

Khai mạc Liên hoan Phát thanh toàn quốc lần thứ XVI: Khích lệ sự phát triển đa dạng của các loại hình truyền thông

Liên hoan Phát thanh toàn quốc năm 2026 sẽ được tổ chức tại tỉnh Quảng Ninh

894 tác phẩm vào vòng sơ khảo Giải báo chí toàn quốc “Vì sự nghiệp phát triển văn hóa, thể thao và du lịch” lần thứ hai

Bộ Thông tin và Truyền thông công bố danh sách các nền tảng số quốc gia

Cơ hội và giải pháp trong chuyển đổi số báo chí

THÁI NGUYÊN HƯỚNG TỚI MỘT GIẢI THƯỞNG BÁO CHÍ UY TÍN, THƯƠNG HIỆU VÀ BẢN SẮC

Nâng cao chất lượng tuyên truyền về bảo vệ nền tảng tư tưởng của Đảng

Bức tranh kinh tế báo chí ảm đạm và sự cần thiết của đa dạng hóa nguồn thu

Chỉ 8% độc giả ở Vương quốc Anh sẵn sàng trả tiền cho tin tức

Phát động Giải báo chí toàn quốc viết về Phật giáo lần thứ nhất

Tiếp tục nâng cao hiệu quả công tác tuyên truyền

Thông tấn xã Việt Nam ra mắt chuyên trang thông tin về bảo vệ nền tảng tư tưởng của Đảng

Bổ nhiệm nhà báo Nguyễn Văn Hoài làm Tổng Biên tập Báo Nông thôn ngày nay/điện tử Dân Việt

Liên minh châu Âu ký luật trí tuệ nhân tạo, các công ty AI đưa ra cam kết

Giải báo chí Quốc gia lần thứ XVIII năm 2023: Nhiều tác phẩm có tính phát hiện, sáng tạo

Liên kết website

Thống kê truy cập

Phóng sự

Hình ảnh nổi bật

Thông tin văn bản

23/QĐ - HNB

327/KH- BTC

09/KH-UBND

12/2024/TT-BTTTT

Mau ĐXKNHV - HNB