Tóm tắt:
Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đặt ra những thách thức mới đối với việc bảo hộ quyền tác giả trong việc tiếp cận và khai thác dữ liệu phục vụ hoạt động huấn luyện AI. Cơ chế bảo hộ quyền tác giả hiện hành làm tăng chi phí giao dịch, từ đó thúc đẩy xu hướng tích tụ và hình thành nguy cơ độc quyền dữ liệu. Trong khi đó, pháp luật Việt Nam chưa có quy định đặc thù trong việc điều chỉnh mối quan hệ này. Bài viết phân tích mâu thuẫn giữa chi phí giao dịch và độc quyền dữ liệu dưới góc độ quyền tác giả trong kỷ nguyên AI, đánh giá thực trạng pháp luật Việt Nam, từ đó đưa ra một số kiến nghị nhằm hoàn thiện khung pháp lý trong bối cảnh phát triển AI.
Từ khóa: chi phí giao dịch, độc quyền dữ liệu, mâu thuẫn, quyền tác giả, trí tuệ nhân tạo (AI).
1. Đặt vấn đề
Sự phát triển của trí tuệ nhân tạo (AI) làm gia tăng nhu cầu khai thác khối lượng lớn dữ liệu để huấn luyện thuật toán, trong đó nhiều dữ liệu là các tác phẩm được bảo hộ quyền tác giả. Điều này làm phát sinh mâu thuẫn giữa việc giảm chi phí giao dịch nhằm thúc đẩy phát triển AI và nguy cơ hình thành độc quyền dữ liệu khi quyền kiểm soát dữ liệu bị tập trung vào một số chủ thể. Tuy nhiên, pháp luật Việt Nam hiện chưa có cơ chế rõ ràng để điều chỉnh vấn đề này. Do đó, việc nghiên cứu và đề xuất các giải pháp hoàn thiện pháp luật nhằm cân bằng giữa bảo hộ quyền tác giả và yêu cầu phát triển AI là cần thiết.
2. Một số khái niệm liên quan về mâu thuẫn giữa chi phí giao dịch và độc quyền dữ liệu dưới góc độ quyền tác giả trong kỷ nguyên trí tuệ nhân tạo
Thứ nhất, chi phí giao dịch (transaction cost) được hiểu là các chi phí phát sinh trong quá trình thiết lập, thực hiện và quản lý một giao dịch trên thị trường, bao gồm cả chi phí tài chính và phi tài chính như thời gian, công sức, nguồn lực và chi phí tổ chức cần thiết để đạt được sự thỏa thuận giữa các bên. Dưới góc độ quyền tác giả, chi phí giao dịch thể hiện ở những chi phí liên quan đến việc xác định chủ thể quyền, tìm kiếm thông tin về tác phẩm, tiến hành đàm phán và thiết lập thỏa thuận cấp phép cũng như chi phí giám sát và thực thi quyền khi có tranh chấp phát sinh. Trong bối cảnh các hệ thống trí tuệ nhân tạo cần khai thác khối lượng dữ liệu khổng lồ để huấn luyện thuật toán, các loại chi phí này có xu hướng gia tăng đáng kể do sự phân mảnh của quyền đối với dữ liệu, sự phức tạp trong việc xác định chủ thể quyền cũng như khó khăn trong việc đàm phán và quản lý cấp phép ở quy mô lớn.
Thứ hai, độc quyền dữ liệu là tình trạng một hoặc một số chủ thể nắm giữ quyền kiểm soát đối với nguồn dữ liệu có giá trị trên thị trường, từ đó có khả năng chi phối việc khai thác dữ liệu và hạn chế sự tham gia của các đối thủ cạnh tranh. Dưới góc độ quyền tác giả, trạng thái này có thể hình thành khi quyền đối với tác phẩm, cơ sở dữ liệu hoặc các thỏa thuận khai thác được sử dụng như công cụ pháp lý để kiểm soát việc tiếp cận và tái sử dụng dữ liệu. Trong kỷ nguyên trí tuệ nhân tạo, quyền kiểm soát các tập dữ liệu dùng để huấn luyện thuật toán có thể chuyển hóa thành lợi thế cạnh tranh mang tính cấu trúc, tạo ra các rào cản gia nhập thị trường đối với các chủ thể khác.
Thứ ba, kỷ nguyên trí tuệ nhân tạo đánh dấu một bước chuyển dịch mô hình kinh tế và công nghệ mang tính cấu trúc, nơi dữ liệu trở thành yếu tố sản xuất cốt lõi thay thế cho các nguồn lực truyền thống. Đây không chỉ đơn thuần là giai đoạn bùng nổ của các thuật toán học máy hay mô hình ngôn ngữ lớn, mà còn là sự thay đổi căn bản về phương thức kiến tạo và khai thác giá trị tri thức. Đặc trưng nền tảng của kỷ nguyên này là sự phụ thuộc tuyệt đối của các hệ thống trí tuệ nhân tạo vào khối lượng và chất lượng của dữ liệu huấn luyện thông qua hoạt động khai thác văn bản và dữ liệu tự động.
Thứ tư, mâu thuẫn giữa chi phí giao dịch và độc quyền dữ liệu dưới góc độ quyền tác giả phản ánh sự xung đột giữa cơ chế bảo hộ truyền thống và nhu cầu phát triển trí tuệ nhân tạo. Việc pháp luật duy trì nguyên tắc mặc định xin phép đối với mọi hành vi khai thác dữ liệu đã tạo ra một cấu trúc chi phí giao dịch khổng lồ (bao gồm tìm kiếm thông tin, đàm phán và phòng ngừa rủi ro). Mức chi phí này trở thành rào cản loại trừ khốc liệt, khiến chỉ các tập đoàn công nghệ lớn mới đủ năng lực tài chính để tuân thủ, trong khi các doanh nghiệp khởi nghiệp bị gạt ra ngoài lề. Tuy nhiên, chế định quyền tác giả thay vì thúc đẩy sáng tạo lại vô hình trung trở thành công cụ bảo trợ cho các hệ sinh thái khép kín, tiếp tay cho độc quyền dữ liệu và làm suy yếu môi trường cạnh tranh.
3. Thực trạng pháp luật Việt Nam về mâu thuẫn giữa chi phí giao dịch và độc quyền dữ liệu dưới góc độ quyền tác giả trong kỷ nguyên AI
Quá trình phát triển trí tuệ nhân tạo (AI) tại Việt Nam đang gặp phải một mâu thuẫn lớn: cơ chế bảo hộ bản quyền truyền thống đang cản trở nhu cầu huấn luyện dữ liệu quy mô lớn của AI. Sự xung đột này đẩy chi phí giao dịch lên mức quá cao, từ đó tạo ra rào cản dẫn đến độc quyền thị trường. Thực trạng này xuất phát từ hai nguyên nhân cốt lõi sau:
Thứ nhất, sự thiếu ngoại lệ pháp lý đối với hoạt động khai thác dữ liệu đã đẩy chi phí giao dịch lên ngưỡng loại trừ. Hệ thống pháp luật sở hữu trí tuệ hiện hành vận hành theo nguyên tắc "mặc định cấp phép", vốn được thiết kế cho các hành vi tiêu dùng văn hóa truyền thống thay vì phương thức xử lý dữ liệu tự động hóa. Việc chưa luật hóa ngoại lệ cho hoạt động khai thác văn bản và dữ liệu (TDM) đặt quá trình sao chép tác phẩm phục vụ huấn luyện thuật toán trước rủi ro pháp lý mang tính hệ thống. Do đó, các chủ thể phát triển AI buộc phải tiến hành đàm phán cấp phép đơn lẻ. Trong bối cảnh hạ tầng thông tin bản quyền tại Việt Nam còn phân mảnh, yêu cầu này làm gia tăng phi mã chi phí tìm kiếm, đàm phán và tuân thủ pháp luật. Hệ quả tất yếu là các doanh nghiệp khởi nghiệp và tổ chức nghiên cứu nội địa bị triệt tiêu khả năng tiếp cận nguồn nguyên liệu số hợp pháp.
Thứ hai, rào cản chi phí giao dịch tạo điều kiện cho sự hình thành cấu trúc "độc quyền kép" của các tập đoàn công nghệ thống lĩnh. Mức chi phí giao dịch khổng lồ nêu trên đóng vai trò như một rào cản gia nhập thị trường khắc nghiệt. Theo đó, chỉ những tập đoàn công nghệ sở hữu tiềm lực tài chính vượt trội hoặc có sẵn hệ sinh thái dữ liệu người dùng nội bộ mới đủ năng lực để hấp thụ mức chi phí này để tiến hành khai thác hợp pháp. Tận dụng ưu thế đó, các thực thể nắm giữ dữ liệu lớn có xu hướng lạm dụng đặc quyền tài sản và các biện pháp bảo vệ công nghệ nhằm khước từ chia sẻ dữ liệu. Thực trạng này dẫn đến hệ quả độc quyền kép: thâu tóm nguồn dữ liệu đầu vào và chi phối thị trường sản phẩm AI đầu ra. Hơn nữa, sự thiếu vắng các quy phạm trong pháp luật cạnh tranh nhằm kiểm soát hành vi lạm dụng quyền sở hữu trí tuệ để từ chối cung cấp dữ liệu đang tạo ra khoảng trống pháp lý, cho phép các chủ thể thống lĩnh thao túng thị trường và làm suy yếu môi trường cạnh tranh lành mạnh.
4. Một số khuyến nghị hoàn thiện pháp luật về mâu thuẫn giữa chi phí giao dịch và độc quyền dữ liệu
Thứ nhất, cần cụ thể hóa ngoại lệ khai thác văn bản và dữ liệu nhằm giảm thiểu chi phí giao dịch. Mặc dù khoản 5 Điều 7 Luật Sở hữu trí tuệ năm 2025 đã cho phép sử dụng dữ liệu hợp pháp để huấn luyện trí tuệ nhân tạo nhằm triệt tiêu chi phí đàm phán ban đầu, nhưng điều kiện không ảnh hưởng bất hợp lý đến quyền lợi tác giả vẫn mang tính định tính. Do đó, pháp luật cần thiết lập cơ chế quyền từ chối thông qua các biện pháp kỹ thuật máy đọc được. Cơ chế này mặc định cho phép khai thác dữ liệu nhằm giảm rào cản đàm phán tiền giao dịch, song vẫn trao quyền tự quyết cho chủ sở hữu thông qua các biện pháp từ chối tiếp cận có thể kiểm chứng, giúp tái định hình ranh giới giữa quyền tư và lợi ích công cộng mà không làm suy yếu nền tảng bảo hộ quyền tác giả.
Thứ hai, cần thiết lập các thiết chế điều tiết thị trường chủ động thông qua việc vận dụng học thuyết cơ sở thiết yếu vào thực tiễn thực thi pháp luật cạnh tranh. Các tập dữ liệu quy mô lớn, mang tính độc quyền tự nhiên và không thể tái tạo vốn là điều kiện tiên quyết để phát triển các mô hình nền tảng phải được xem xét như một dạng cơ sở hạ tầng thiết yếu. Mọi hành vi lạm dụng các biện pháp bảo vệ công nghệ, dựng tường phí, hoặc từ chối cấp phép khai thác dữ liệu từ các doanh nghiệp thống lĩnh mà không có cơ sở thương mại chính đáng cần bị định danh là hành vi hạn chế cạnh tranh. Chế tài đi kèm sẽ buộc các chủ thể này phải chia sẻ dữ liệu dựa trên các điều khoản công bằng, hợp lý và không phân biệt đối xử, qua đó triệt tiêu rào cản gia nhập thị trường đối với các doanh nghiệp khởi nghiệp.
Thứ ba, cần thúc đẩy mạnh mẽ cơ chế chia sẻ dữ liệu mở và cấp phép bắt buộc trong tư duy quản trị dữ liệu quốc gia. Đối với khối dữ liệu hình thành từ ngân sách nhà nước hoặc gắn liền với lợi ích công cộng, nguyên tắc dữ liệu mở phải được áp dụng mặc định, cho phép cộng đồng phát triển công nghệ khai thác với chi phí danh nghĩa. Đối với các tập dữ liệu tư nhân đóng vai trò huyết mạch đối với an ninh quốc gia hoặc tiến bộ khoa học, pháp luật cần dự liệu cơ chế cấp phép bắt buộc trong các tình huống khẩn thiết. Sự kết hợp biện chứng giữa việc hạ thấp chi phí giao dịch trong hệ thống bản quyền và kiểm soát hành vi thao túng thông qua pháp luật cạnh tranh sẽ kiến tạo một khung pháp lý kép toàn diện, bảo đảm môi trường cạnh tranh công bằng và thúc đẩy hệ sinh thái đổi mới sáng tạo bền vững tại Việt Nam.
5. Kết luận
Sự phát triển của trí tuệ nhân tạo đã làm nổi bật mâu thuẫn giữa yêu cầu giảm chi phí giao dịch trong việc khai thác dữ liệu và nguy cơ hình thành độc quyền dữ liệu dưới cơ chế bảo hộ quyền tác giả. Trong khi đó, pháp luật Việt Nam hiện nay vẫn chưa có quy định đầy đủ để điều chỉnh hiệu quả mối quan hệ này. Vì vậy, việc hoàn thiện pháp luật theo hướng vừa giảm chi phí giao dịch trong khai thác dữ liệu, vừa kiểm soát nguy cơ độc quyền dữ liệu là cần thiết nhằm bảo đảm sự cân bằng giữa bảo hộ quyền tác giả và thúc đẩy phát triển hệ sinh thái trí tuệ nhân tạo tại Việt Nam.
TÀI LIỆU THAM KHẢO:
Bộ Khoa học và Công nghệ (2025). Băn khoăn với quy định về ngoại lệ bản quyền cho AI. Truy cập tại https://mst.gov.vn/ban-khoan-voi-quy-dinh-ve-ngoai-le-ban-quyen-cho-ai-19725121316080722.htm.
Nguyen Thi Que Anh (2022). Improving Vietnamese intellectual property law in the context of developing artificial intelligence. Journal of Science: Legal Studies. https://doi.org/10.25073/2588-1167/vnuls.4481.
Toan Huu Bui & Van Phuoc Nguyen (2022). The impact of artificial intelligence and digital economy on Vietnam’s legal system. International Journal for the Semiotics of Law, 36, 969-989. https://doi.org/10.1007/s11196-022-09927-0.
Dao Ngoc Anh Nguyen, Van Phuoc Nguyen & Kim Hieu Bui (2023). Vietnam’s regulation on intellectual property rights protection: The context of digital transformation. International Journal for the Semiotics of Law, 37, 259-278. https://doi.org/10.1007/s11196-023-10076-1.
OECD (2024). Intellectual property issues in artificial intelligence trained on scraped data. https://infojustice.org/archives/44946.
Legal recommendations for resolving the conflict between transaction costs and data monopoly in Vietnam from a copyright perspective in the era of artificial intelligence
Nguyen Huong Giang1
Le Thi Ngoc Anh1
Vu Thu Hien1
Vu Uyen Nhi1
Vu Thanh Toan2
1Student, Foreign Trade University
2Lecturer, Foreign Trade University
Abstract:
The rapid advancement of artificial intelligence (AI) presents significant challenges to copyright protection in the access to and use of data for AI training. Existing copyright regimes tend to increase transaction costs, which may hinder data accessibility while simultaneously encouraging data concentration and raising the risk of monopolistic control. In the absence of specific regulatory provisions in Vietnamese law, these tensions remain inadequately addressed. This study examines the interplay between transaction costs and data monopolization from a copyright perspective in the AI era, evaluates the current legal framework in Vietnam, and analyzes its limitations in responding to emerging technological and market dynamics.
Keywords: transaction cost, data monopoly, conflict, copyright, artificial intelligence (AI).
[Tạp chí Công Thương - Các kết quả nghiên cứu khoa học và ứng dụng công nghệ, Số 7 năm 2026]
