【橙訊】人工智能(AI)技術迅速發展,全球掀起了AI浪潮。從AI生成的短視頻、照片到語言模型的廣泛應用,已經深入人們的日常生活和工作領域。OpenAI、DeepSeek等平台的出現,讓大眾意識到AI不僅是生活的好幫手,也能在商業、教育、媒體等多個領域發揮重要作用。為推動AI發展,政府計劃修訂《版權條例》,引入特定版權豁免,允許版權作品用於AI訓練。這一舉措引發了科技界與版權持有人間的爭議。
李勁華強調AI是「學習」而非「複製」,所以需要大量學習的材料。
商務及經濟發展局與知識產權署早前就版權修訂條例完成諮詢,當局指,大部分回應者,包括創科業界、法律業界、知識產權界的專業團體等,支持引入文本及數據開採豁免,即容許版權使用者在未經版權擁有人特許下,為電腦數據分析及處理目的而複製版權作品,協助AI模型訓練。
要訓練一個聰明的AI系統,並非易事。香港無線科技商會主席李勁華(Keith)指出,語言模型的訓練過程非常複雜,首先需要大量的資料來源,並對這些資料進行整理和分析。如果僅僅依賴搜尋網站獲取資料,數據的清晰度和準確性往往不足,這會直接影響AI模型的表現。
訓練粵語AI模型須有足夠資料庫作基礎
生成式AI的核心在於「學習」而非「複製」。李勁華解釋,生成式AI並非直接抽取已知的資料,而是通過學習內容生成知識。這就像人類學習知識一樣,並非逐字背誦,而是將知識吸收後,用自己的語言表達出來。AI模型通過分析字與字之間的關係,生成新的句子。
儘管OpenAI和DeepSeek這類AI在英文和中文領域中,已經有良好基礎,但在粵語及香港資料方面,AI模型仍然存在明顯的不足。李勁華指出,粵語資料的數量不足,是訓練粵語AI模型的一大障礙。
例如,我們嘗試向AI詢問關於香港本地男團Mirror的成員名字時,AI就將成員名字混淆,甚至將非成員的名字誤認。這種現象反映了粵語資料的缺忽。李勁華強調,要訓練一個聰明的粵語AI模型,必須有足夠的粵語語言資料庫作為基礎。然而,目前粵語資料的數量遠遠不足以支持高質量的AI訓練。
李勁華指,AI現今在粵語語言模型上,仍有很多不足地方。
AI學習方式能夠創造出獨特的內容,但也引發了版權持有人的擔憂,AI在訓練過程中若使用了大量受版權保護的材料,這是否會損害原創者利益?香港書刊商會會長蘇惠良表示,版權的基本概念是創作者創造作品後,自動擁有版權。然而, 建議的豁免機制允許AI在商業和非商業用途上使用版權材料,這與版權精神存在矛盾。
憂壓縮教科書生存空間
蘇惠良特別提到,教科書行業對AI的應用感到憂慮,事關教科書的內容具有高度的資料性,如果AI在學習過程中取用了所有資料,可能會對教科書的生存空間造成嚴重影響。此外,教科書的設計和編寫需要投入大量心血,如果AI無償使用這些內容,將直接損害版權持有者的利益。
為應對這一問題,條例中設有「退出選項」機制,版權持有人可以提出禁止AI取用其資料。然而,蘇惠良指出,這一機制在實際執行中可能有困難。例如,如何確保AI開發者在取用資料時的透明度?是否需要提供取樣報告?這些問題都需要進一步探討。
蘇惠良業界基本上支持修訂條例,但希望當局平衡版權持有人的利益。
為平衡AI發展與版權保護,業界希望借鑑過往的授權計劃。例如,過去香港一些學校會影印報紙作為教學材料,為此設立了一個授權安排,學校支付合理費用後即可合法使用這些資料。蘇惠良建議,類似的授權計劃可以套用於AI訓練。如果AI開發者需要使用版權材料,可以通過支付費用的方式獲得授權,從而保障版權持有人的利益。
蘇惠良強調,業界基本上支持修訂條例,因為科技發展需要與時並進。然而,政府在修訂過程中應多與業界溝通,了解持份者的需求,確保修例內容能夠平衡科技界與版權持有人的利益。
業界擔心當局為AI提供方便之門的同時,令版權精神蕩然無存。
除了出版業,傳媒行業也是AI學習的重要資料來源。浸會大學新聞系主任李文教授認為,政府的修例建議及時且合理,有助於推動AI技術的發展。然而,傳媒行業對AI的應用持觀望態度,主要擔憂集AI可能影響版權利益,以及AI生成內容的真實性和準確性。
他解釋,現今全球媒體對AI的態度並不一致。例如,美聯社與OpenAI簽署了合作協議,允許其內容用於AI訓練,同時也獲得了使用OpenAI產品的權限。然而,紐約時報則堅決反對AI使用其內容,甚至將OpenAI告上法庭,指控其侵權。李文教授提醒業界,AI的使用將愈來愈廣泛,過於猶豫可能錯失機遇。
圖:橙新聞
編輯:Mars
拍攝、剪接:Vicky
責編 | 李永康
編輯 | 趙慧敏
編輯推薦
有片|港深西部公路車禍 車cam拍下警員跳橋保命一刻
有片︱港足周二啟德主場鬥印度交通攻略 禁帶任何水瓶容器入場
專題 | 西貢划獨木舟受內地遊客追捧 店家小紅書宣傳吸大批回頭客
有片|水務署:皇后山邨山麗苑樣本顯示大部分為瀝青 水質符合標準可安全飲用
有話直說|門券騙案暴露機制漏洞 推實名制打擊不正之風
有話直說|持續監測水質打消疑慮 加強解說呼籲理性看待
有話直說|周日半價難見港鐵誠意 惠及市民還需換位思考
有片|李家超:與中聯辦加強溝通有利香港 確保「一國兩制」行穩致遠
有話直說|引入網安專才 捍衛金融安全