YM說多肽:公開蛋白數(shù)據(jù)庫訓(xùn)練 AI 模型 生成物知識產(chǎn)權(quán)風(fēng)險何在?
使用公開蛋白質(zhì)數(shù)據(jù)庫訓(xùn)練的 AI 模型,其輸出成果是否受數(shù)據(jù)庫知識產(chǎn)權(quán)約束?這一問題直擊 AI 制藥領(lǐng)域知識產(chǎn)權(quán)風(fēng)險的核心。
簡言之,公開蛋白質(zhì)數(shù)據(jù)庫本身的法律約束與AI 生成多肽的專利性,是兩個截然不同層面的問題,其中后者風(fēng)險更高,更是決定成果歸屬的核心關(guān)鍵。
兩者的核心差異與關(guān)聯(lián)可通過下表清晰區(qū)分:
|
層面
|
數(shù)據(jù)庫的知識產(chǎn)權(quán)約束(輸入層面)
|
AI 生成物的專利風(fēng)險(輸出層面)
|
|
約束對象
|
對數(shù)據(jù)庫本身的訪問、使用和分發(fā)行為
|
AI 模型輸出的具體多肽序列能否被認(rèn)定為專利法意義上的 “發(fā)明”
|
|
主要風(fēng)險
|
違反數(shù)據(jù)庫的使用許可協(xié)議(如未按要求署名、用于禁止的商業(yè)用途等)
|
專利權(quán)根本不被授權(quán),或因 AI 被視為 “發(fā)明人” 導(dǎo)致專利被判無效
|
|
法律依據(jù)
|
數(shù)據(jù)庫的使用條款、開源許可協(xié)議(如 CC 協(xié)議)
|
專利法中關(guān)于 “發(fā)明人”“創(chuàng)造性” 和 “充分公開” 的要求
|
|
現(xiàn)狀與趨勢
|
大多數(shù)科學(xué)數(shù)據(jù)庫鼓勵開放共享,但要求合規(guī)使用。政策傾向于保障 “輸入端” 的數(shù)據(jù)獲取
|
法律尚不明確,存在重大不確定性,是當(dāng)前爭議和訴訟的焦點
|
核心問題詳解:數(shù)據(jù)庫約束可管理 AI 生成物專利性是關(guān)鍵挑戰(zhàn)
數(shù)據(jù)庫約束:可管理的 “準(zhǔn)入規(guī)則”
PDB、AlphaFold DB 等主流科學(xué)數(shù)據(jù)庫,設(shè)立初衷便是促進科學(xué)共享。它們大多采用開放許可(如 CC-BY 協(xié)議),這意味著只要遵守署名等基本要求,即可免費用于商業(yè)研發(fā)。
例如,歐洲 DSSP 數(shù)據(jù)庫明確聲明其數(shù)據(jù) “免于所有版權(quán)限制”,可自由應(yīng)用于商業(yè)用途。在中國,國家基因庫生命大數(shù)據(jù)平臺也作出規(guī)定,利用其公開數(shù)據(jù)產(chǎn)出的成果,知識產(chǎn)權(quán)由用戶自行約定。
總而言之,只要合規(guī)使用,數(shù)據(jù)庫約束本身通常不會成為成果商業(yè)化的障礙。其關(guān)鍵在于,使用者需仔細研讀每一個數(shù)據(jù)庫的 “使用條款”,確保行為合法合規(guī)。
專利性風(fēng)險:AI 制藥的 “阿喀琉斯之踵”
相較于數(shù)據(jù)庫約束,AI 生成多肽的專利性風(fēng)險才是真正的核心挑戰(zhàn),尤其是在多肽、抗體這類序列明確、合成相對容易的分子領(lǐng)域。具體風(fēng)險主要體現(xiàn)在三方面:
-
發(fā)明人身份問題:專利法要求有明確的 “人類發(fā)明人”。若 AI 僅憑一個提示就生成具有突破性的多肽序列,而人類研究者僅負責(zé)執(zhí)行合成驗證,專利局或法院可能認(rèn)定 AI 才是真正的 “構(gòu)思者”,進而導(dǎo)致專利無效。
-
“構(gòu)思” 與 “付諸實踐” 的界限問題:對于合成路徑復(fù)雜的分子,人類在將數(shù)據(jù)轉(zhuǎn)化為實物過程中作出的貢獻,可能被視為 “構(gòu)思” 的一部分。但多肽的序列本身就足以構(gòu)成完整 “構(gòu)思”,因此這一領(lǐng)域的專利風(fēng)險更高。
-
創(chuàng)造性與充分公開問題:AI 生成的多肽可能被質(zhì)疑不具備 “非顯而易見性”,也就是專利法意義上的 “創(chuàng)造性”。同時,若專利申請未能充分揭示 AI 模型的訓(xùn)練和生成邏輯,也可能因 “公開不充分” 被駁回。
行動建議:多維度規(guī)避風(fēng)險 筑牢知識產(chǎn)權(quán)防線
面對上述知識產(chǎn)權(quán)風(fēng)險,相關(guān)研發(fā)團隊可采取以下主動措施,提前做好防范:
|
行動目標(biāo)
|
具體措施
|
|
合規(guī)使用數(shù)據(jù)庫
|
建立數(shù)據(jù)庫使用臺賬,記錄每個訓(xùn)練數(shù)據(jù)源的 URL 和許可協(xié)議(如 CC-BY 4.0)。在使用成果時,嚴(yán)格履行署名等義務(wù)
|
|
強化人類貢獻
|
在研發(fā)記錄中,詳細記載人類研究者的關(guān)鍵決策:如定義篩選條件、設(shè)計模型架構(gòu)、對 AI 輸出結(jié)果進行創(chuàng)造性解釋與優(yōu)化等。證明是 “人主導(dǎo)的 AI 輔助發(fā)明”
|
|
專利策略前置
|
在提交專利申請前,與專利律師重點討論如何撰寫以突出人類發(fā)明步驟,并評估潛在風(fēng)險??紤]對 AI 模型本身、新型多肽骨架或特定藥物劑型進行并行保護
|
|
選擇有利法域
|
關(guān)注不同國家 / 地區(qū)的司法動態(tài)。例如,美國的專利體系相對靈活,可能更早給出判例。同時,中國的司法實踐也提出了在數(shù)據(jù) “輸入端” 構(gòu)建合理使用制度的思路
|
總結(jié):合規(guī)筑基 人類智慧賦能是破局關(guān)鍵
總體而言,使用公開數(shù)據(jù)庫訓(xùn)練 AI 模型本身的風(fēng)險可控,但由此生成的多肽序列能否獲得穩(wěn)定的專利權(quán),是當(dāng)前最大的法律不確定性所在。
未來在 AI 制藥領(lǐng)域的勝出者,必將是那些能巧妙地將人類智慧深度融入 AI 設(shè)計循環(huán),并能用法律語言清晰證明這一點的團隊。