<!DOCTYPE html>
	<html lang="vi" xmlns="http://www.w3.org/1999/xhtml" prefix="og: http://ogp.me/ns#">
	<head>
<title>Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí</title>
<meta name="description" content="Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí - Savefile - Tin bài">
<meta name="googlebot" content="noindex, nofollow">
<meta name="keywords" content="tin bai">
<meta name="news_keywords" content="tin bai">
<meta name="author" content="Hội Nhà báo tỉnh Thái Nguyên">
<meta name="copyright" content="Hội Nhà báo tỉnh Thái Nguyên [webmaster@hoinhabao.thainguyen.gov.vn]">
<meta name="robots" content="index, archive, follow, noodp">
<meta name="msnbot" content="all,index,follow">
<meta name="generator" content="NukeViet v4.4">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<link rel="shortcut icon" href="https://hoinhabao.thainguyen.gov.vn/uploads/about/logo.png">
<link rel="canonical" href="https://hoinhabao.thainguyen.gov.vn/vi/news/bao-chi-trong-nuoc-va-quoc-te/phat-hien-nhieu-cong-ty-ai-am-tham-thu-thap-trai-phep-noi-dung-bao-chi-2914.html">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/" title="Tin bài" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/chinh-tri-thoi-su/" title="Tin bài - Chính trị thời sự" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/hoat-dong-cong-tac-hoi/" title="Tin bài - Hoạt động Công tác Hội" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/nha-bao-hoi-vien/" title="Tin bài - Nhà báo - Hội viên" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/nghiep-vu/" title="Tin bài - Nghiệp vụ" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/bao-chi-voi-chuyen-doi-so/" title="Tin bài - Báo chí với Chuyển đổi số" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/bao-chi-trong-nuoc-va-quoc-te/" title="Tin bài - Báo chí trong nước và quốc tế" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/giai-bao-chi-huynh-thuc-khang-tinh-thai-nguyen/" title="Tin bài - Giải báo chí Huỳnh Thúc Kháng tỉnh Thái Nguyên" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/tac-pham-bao-chi-chat-luong-cao/" title="Tin bài - Tác phẩm báo chí chất lượng cao" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/ky-niem-100-nam-ngay-bao-chi-cach-mang-viet-nam/" title="Tin bài - Kỷ niệm 100 năm ngày Báo chí cách mạng Việt Nam &#40;21&#x002F;6&#x002F;1925 - 21&#x002F;6&#x002F;2025&#41;" type="application/rss+xml">
<link rel="alternate" href="https://hoinhabao.thainguyen.gov.vn/vi/news/rss/dai-hoi-dang-bo-tinh-thai-nguyen-lan-thu-i-nhiem-ky-2025-2030/" title="Tin bài - Đại hội Đảng bộ tỉnh Thái Nguyên lần thứ I, nhiệm kỳ 2025 - 2030" type="application/rss+xml">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/assets/js/jquery/jquery.min.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/assets/js/language/vi.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/assets/js/DOMPurify/purify.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/assets/js/global.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/assets/js/site.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/js/news.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/js/main.js">
<link rel="preload" as="script" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/js/bootstrap.min.js">
<link rel="StyleSheet" href="https://hoinhabao.thainguyen.gov.vn/assets/css/font-awesome.min.css">
<link rel="StyleSheet" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/css/bootstrap.non-responsive.css">
<link rel="StyleSheet" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/css/style.css">
<link rel="StyleSheet" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/css/style.non-responsive.css">
<link rel="StyleSheet" href="https://hoinhabao.thainguyen.gov.vn/themes/netsite/css/news.css">
<link rel="stylesheet" href="https://hoinhabao.thainguyen.gov.vn/themes/tuyengiao/css/superfish.css" />
<link rel="stylesheet" href="https://hoinhabao.thainguyen.gov.vn/themes/tuyengiao/css/superfish-navbar.css" />
<style type="text/css">
	body{background: #fff;}
</style>
		<!--CSS-->
	</head>
	<body>
	<div id="fb-root"></div>
<div id="print">
	<div id="hd_print">
		<h2 class="pull-left">Hội Nhà báo tỉnh Thái Nguyên</h2>
		<p class="pull-right"><a title="Hội Nhà báo tỉnh Thái Nguyên" href="https://hoinhabao.thainguyen.gov.vn/">https://hoinhabao.thainguyen.gov.vn</a></p>
	</div>
	<div class="clear"></div>
	<hr />
	<div id="content">
		<h1>Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí</h1>
		<ul class="list-inline">
			<li>Thứ hai - 24/06/2024 08:45</li>
			<li class="hidden-print txtrequired"><em class="fa fa-print">&nbsp;</em><a title="In ra" href="javascript:;" onclick="window.print()">In ra</a></li>
			<li class="hidden-print txtrequired"><em class="fa fa-power-off">&nbsp;</em><a title="Đóng cửa sổ này" href="javascript:;" onclick="window.close()">Đóng cửa sổ này</a></li>
		</ul>
		<div class="clear"></div>
		<div id="hometext">
			(CLO) Nhiều công ty trí tuệ nhân tạo (AI) đang vi phạm tiêu chuẩn được các nhà xuất bản sử dụng để chặn việc thu thập nội dung báo chí của họ, theo công ty khởi nghiệp cấp phép nội dung TollBit tiết lộ với các tổ chức tin tức.
		</div>
		<div id="bodytext" class="clearfix">
			<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Một lá thư gửi cho các nhà xuất bản được hãng tin Reuters xem hôm thứ Sáu xuất hiện trong bối cảnh công ty khởi nghiệp tìm kiếm AI Perplexity và hãng truyền thông Forbes đang tranh chấp pháp lý công khai về việc sử dụng trái phép nội dung tin tức.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Nó cũng diễn ra trong một&nbsp;<a href="https://www.congluan.vn/vung-day-va-gianh-lai-nhung-gi-da-mat-post281864.html" rel="noopener" target="_blank">cuộc chiến rộng lớn</a>&nbsp;của các tổ chức báo chí nhằm bảo vệ nội dung của mình trước sự xâm phạm của các công ty công nghệ trong thời kỳ bùng nổ công cụ AI tạo sinh.</span></span></p>

<figure>
<div style="text-align:center"><a data-caption=" Ảnh: Reuters " data-fancybox="gallery" href="https://congluan-cdn.congluan.vn/files/content/2024/06/22/phat-hien-nhieu-cong-ty-ai-am-tham-thu-thap-trai-phep-noi-dung-cua-bao-chi-085332809.jpg"><img alt="phat hien nhieu cong ty ai am tham thu thap trai phep noi dung bao chi hinh 1" data-img-mobile="undefined" height="609" src="https://congluan-cdn.congluan.vn/files/content/2024/06/22/phat-hien-nhieu-cong-ty-ai-am-tham-thu-thap-trai-phep-noi-dung-cua-bao-chi-085332809.jpg" width="960" /></a></div>

<figcaption>
<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Ảnh: Reuters</span></span></p>
</figcaption>
</figure>
<br />
<h2><strong><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Mối lo của các tổ chức tin tức</span></span></strong></h2>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Trong vụ tranh chấp giữa Perplexity và Forbes, một cuộc điều tra được xuất bản trong tuần này cho thấy Perplexity có thể đã vượt qua trình chặn thu thập thông tin web của Forbes là Giao thức loại trừ robot hay &quot;robots.txt&quot; - một tiêu chuẩn được chấp nhận rộng rãi nhằm xác định phần nào của trang web được phép thu thập thông tin.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">News Media Alliance, một nhóm thương mại đại diện cho hơn 2.200 nhà xuất bản có trụ sở tại Mỹ, bày tỏ lo ngại về việc &quot;thu thập dữ liệu trái phép&quot; này đối với các thành viên của mình.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Danielle Coffey, chủ tịch tập đoàn News Media Alliance cho biết: “Nếu không có khả năng từ chối thu thập dữ liệu lớn, chúng ta không thể kiếm tiền từ nội dung có giá trị của mình và trả tiền cho các nhà báo. Điều này có thể gây tổn hại nghiêm trọng đến ngành của chúng ta”.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">TollBit, một công ty khởi nghiệp ở giai đoạn đầu, đang tự định vị mình là người kết nối giữa các công ty AI đói nội dung và các nhà xuất bản trong các thỏa thuận cấp phép nội dung.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">TollBit theo dõi lưu lượng truy cập AI đến các trang web của nhà xuất bản và sử dụng phân tích để giúp cả hai bên giải quyết các khoản phí phải trả cho việc sử dụng các loại nội dung khác nhau.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Ví dụ: các nhà xuất bản có thể chọn đặt mức giá cao hơn cho &quot;nội dung cao cấp, chẳng hạn như tin tức mới nhất hoặc thông tin chi tiết độc quyền&quot;, theo công ty cho biết trên trang web của mình.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Theo bức thư của TollBit, Perplexity không phải là kẻ phạm tội duy nhất phớt lờ giao thức robots.txt. TollBit cho biết các phân tích của họ cho thấy &quot;nhiều&quot; tác nhân AI đang bỏ qua giao thức, một công cụ tiêu chuẩn được các nhà xuất bản sử dụng để cho biết phần nào trên trang web của họ có thể được thu thập thông tin.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">TollBit viết: “Điều này có nghĩa trong thực tế là các tác nhân AI từ nhiều nguồn (không chỉ một công ty) đang chọn bỏ qua giao thức robots.txt để truy xuất nội dung từ các trang web&quot;.</span></span></p>

<h2><strong><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Cần ngăn chặn các hành vi vi phạm bản quyền</span></span></strong></h2>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Giao thức robots.txt được tạo ra vào giữa những năm 1990 như một cách để tránh làm các trang web bị quá tải bởi trình thu thập dữ liệu web. Mặc dù không có cơ chế thực thi pháp luật rõ ràng, nhưng trong lịch sử đã có sự tuân thủ rộng rãi trên web đối với quy định này.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Gần đây hơn, robots.txt đã trở thành một công cụ quan trọng mà các tổ chức tin tức đã sử dụng để chặn các công ty công nghệ “đánh cắp” nội dung báo chí của họ để sử dụng đào tạo các hệ thống AI tạo sinh hoặc thậm chí đưa tin trực tiếp cho người dùng để thu lợi nhuận.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Một số nhà xuất bản, bao gồm cả New York Times, đã&nbsp;<a href="https://www.congluan.vn/vu-kien-openai-cua-new-york-times-se-giup-bao-chi-doi-lai-quyen-loi-da-mat-post278922.html" rel="noopener" target="_blank">kiện các công ty AI</a>&nbsp;vì vi phạm bản quyền đối với những mục đích sử dụng đó. Nhiều nhà phát triển AI bao biện rằng họ không vi phạm luật nào khi truy cập chúng miễn phí, dù thực tế mọi bài báo đều được bảo vệ bản quyền ở mọi quốc gia.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Gần đây, các tổ chức báo chí đã đưa ra cảnh báo và rất lo ngại về các&nbsp;<a href="https://www.congluan.vn/cac-hang-tin-lo-ngai-cong-cu-tim-kiem-ai-cua-google-se-la-mot-tham-hoa-post296851.html" rel="noopener" target="_blank">công cụ “xào xáo” tin tức</a>, đặc biệt kể từ khi Google tung ra một sản phẩm vào năm ngoái về việc sử dụng AI để tạo các bản tóm tắt thông tin để trả lời một số truy vấn tìm kiếm, thay vì đưa ra các đường link đến nguồn tin gốc.</span></span></p>

<p><span style="font-size:18px;"><span style="font-family:Times New Roman,Times,serif;">Tuy nhiên, thách thức lớn là nếu nhà xuất bản muốn ngăn AI của Google sử dụng nội dung của họ để giúp tạo ra những bản thông tin tóm tắt để trả lời cho người dùng đó, thì họ phải sử dụng cùng một công cụ có thể ngăn chúng xuất hiện trong kết quả tìm kiếm của Google.</span></span></p>
		</div>
				<div id="author">
						<p>
				<strong>Nguồn tin:</strong>
				congluan.vn:
			</p>
		</div>
	</div>
	<div id="footer" class="clearfix">
		<div id="url">
			<strong>URL của bản tin này: </strong><a href="https://hoinhabao.thainguyen.gov.vn/vi/news/bao-chi-trong-nuoc-va-quoc-te/phat-hien-nhieu-cong-ty-ai-am-tham-thu-thap-trai-phep-noi-dung-bao-chi-2914.html" title="Phát hiện nhiều công ty AI âm thầm thu thập trái phép nội dung báo chí">https://hoinhabao.thainguyen.gov.vn/vi/news/bao-chi-trong-nuoc-va-quoc-te/phat-hien-nhieu-cong-ty-ai-am-tham-thu-thap-trai-phep-noi-dung-bao-chi-2914.html</a>

		</div>
		<div class="clear"></div>
		<div class="copyright">
			&copy; Hội Nhà báo tỉnh Thái Nguyên
		</div>
		<div id="contact">
			<a href="mailto:webmaster@hoinhabao.thainguyen.gov.vn">webmaster@hoinhabao.thainguyen.gov.vn</a>
		</div>
	</div>
</div>
        <div id="timeoutsess" class="chromeframe">
            Bạn đã không sử dụng Site, <a onclick="timeoutsesscancel();" href="https://hoinhabao.thainguyen.gov.vn/#">Bấm vào đây để duy trì trạng thái đăng nhập</a>. Thời gian chờ: <span id="secField"> 60 </span> giây
        </div>
        <div id="openidResult" class="nv-alert" style="display:none"></div>
        <div id="openidBt" data-result="" data-redirect=""></div>
<div id="run_cronjobs" style="visibility:hidden;display:none;"><img alt="" src="/index.php?second=cronjobs&amp;p=z3L83nU6" width="1" height="1" /></div>
<script src="https://hoinhabao.thainguyen.gov.vn/assets/js/jquery/jquery.min.js"></script>
<script>var nv_base_siteurl="/",nv_lang_data="vi",nv_lang_interface="vi",nv_name_variable="nv",nv_fc_variable="op",nv_lang_variable="language",nv_module_name="news",nv_func_name="savefile",nv_is_user=0, nv_my_ofs=7,nv_my_abbr="+07",nv_cookie_prefix="nv4",nv_check_pass_mstime=1738000,nv_area_admin=0,nv_safemode=0,theme_responsive=0,nv_is_recaptcha=0,XSSsanitize=1;</script>
<script src="https://hoinhabao.thainguyen.gov.vn/assets/js/language/vi.js"></script>
<script src="https://hoinhabao.thainguyen.gov.vn/assets/js/DOMPurify/purify.js"></script>
<script src="https://hoinhabao.thainguyen.gov.vn/assets/js/global.js"></script>
<script src="https://hoinhabao.thainguyen.gov.vn/assets/js/site.js"></script>
<script src="https://hoinhabao.thainguyen.gov.vn/themes/netsite/js/news.js"></script>
<script src="https://hoinhabao.thainguyen.gov.vn/themes/netsite/js/main.js"></script>
<script type="text/javascript">
$(document).ready(function() {
var aboveHeight = $('header').outerHeight();
    $(window).scroll(function(){
        if ($(window).scrollTop() > aboveHeight){
        $('sticknav').addClass('fixed').css('top','0').next().css('padding-top','60px');
        } else {
       $('sticknav').removeClass('fixed').next().css('padding-top','0');
        }
    });
});
</script>
<script type="text/javascript">
$(document).ready(function() {
var aboveHeight = $('header').outerHeight();
    $(window).scroll(function(){
        if ($(window).scrollTop() > aboveHeight){
        $('thongbao').addClass('fixedd').css('top','0').next().css('padding-top','60px');
        } else {
       $('thongbao').removeClass('fixedd').next().css('padding-top','0');
        }
    });
});
</script>
<script type="text/javascript">
	(function(){
		$(window).scroll(function(){
			if( $(window).scrollTop() == 0 ) {
					$('#go_top').stop(false,true).fadeOut(600);
			}else{
					$('#go_top').stop(false,true).fadeIn(600);
			}
		});
		$('#go_top').click(function(){
			$('body,html').animate({scrollTop:0},400);
			return false;
		})
	})(jQuery);
</script>
<script language="javascript">
	/***************************************************************************************
	* Run when page load
	***************************************************************************************/
	$(document).ready(function()
	{
		initSlideShow();
	});
	/***************************************************************************************
	****************************************************************************************/
	function initSlideShow()
	{
		if($(".slideshow div").length > 1) //Only run slideshow if have the slideshow element and have more than one image.
		{
			var transationTime = 5000;//5000 mili seconds i.e 5 second
			$(".slideshow div:first").addClass('active'); //Make the first image become active i.e on the top of other images
			setInterval(slideChangeImage, transationTime); //set timer to run the slide show.
		}
	}
	/***************************************************************************************
	****************************************************************************************/
	function slideChangeImage()
	{
		var active = $(".slideshow div.active"); //Get the current active element.
		if(active.length == 0)
		{
			active = $(".slideshow div:last"); //If do not see the active element is the last image.
		}
		var next = active.next().length ? active.next() : $(".slideshow div:first"); //get the next element to do the transition
		active.addClass('lastactive');
		next.css({opacity:0.0}) //do the fade in fade out transition
				.addClass('active')
				.animate({opacity:1.0}, 1500, function()
				{
					active.removeClass("active lastactive");	
				});
	}

</script>
<script src="https://hoinhabao.thainguyen.gov.vn/themes/netsite/js/bootstrap.min.js"></script>
</body>
</html>