文/北京集佳知識產權代理有限公司 馮柳偉
涉及人工智能的發(fā)明專利申請,有時需要在權利要求書中布局用于保護模型訓練過程的權利要求。其中,權利要求書應當以說明書為依據(jù),清楚、簡要地限定要求專利保護的范圍。然而,因模型訓練過程通常采用循環(huán)迭代方式進行實現(xiàn),因此如何清楚地撰寫出用于保護模型訓練過程的權利要求是專利代理師在進行專利申請代理過程中需要著重考慮的問題。本文將結合圖1所示的模型訓練過程分享一些撰寫方式以及這些撰寫方式的優(yōu)缺點。
撰寫方式一
1.一種模型訓練方法,其特征在于,所述方法包括:
步驟1,獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù);
步驟2,對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結果;
步驟3,利用機器學習模型對所述第一處理結果進行第二處理,得到第二處理結果;
步驟4,判斷是否達到預設停止條件,若否,則依據(jù)所述第二處理結果和所述標簽數(shù)據(jù)之間的差距,更新機器學習模型中的模型參數(shù),并繼續(xù)執(zhí)行所述步驟1至所述步驟4;若是,則保存或者使用所述機器學習模型執(zhí)行相應的數(shù)據(jù)處理任務。
撰寫方式一的優(yōu)缺點以及建議
優(yōu)點:撰寫方式一能夠清楚的限定出所需保護的模型訓練過程。
缺點:
?。?)普適性弱,其理由為:如果模型訓練過程中各個步驟之間的時序性比較弱,如一些步驟之間沒有必然的先后執(zhí)行順序等,則采用撰寫方式一所撰寫的權利要求容易無法覆蓋一些可能的實施方式,如此導致權利要求的保護范圍受到影響。
?。?)限定性太強,其理由為:①“判斷是否達到預設停止條件”這一步驟的執(zhí)行時間通常對模型訓練效果所產生的影響不大,以使這一步驟的執(zhí)行時間可以靈活地設置,如設置在更新之前或者設置在更新之后等,從而使得采用撰寫方式一所撰寫的權利要求容易無法覆蓋一些可能的實施方式,如此導致權利要求的保護范圍受到影響。②非首輪訓練過程中所執(zhí)行的步驟也是可以靈活設置的,如非首輪訓練過程中所執(zhí)行的步驟包括圖1中S1-S4,或者,非首輪訓練過程中所執(zhí)行的步驟包括圖1中S2-S4,如此使得采用撰寫方式一所撰寫的權利要求容易無法覆蓋一些可能的實施方式,從而導致權利要求的保護范圍受到影響。
?。?)不清楚,其理由為:因“判斷是否達到預設停止條件”這一技術特征中出現(xiàn)的“預設停止條件”這一內容屬于自造詞,以使該技術特征無法準確地表示出何時停止訓練,從而使得采用撰寫方式一所撰寫的權利要求的保護范圍不清楚,進而使得日后可能會面臨一些風險。
建議:除非必要,本文不推薦撰寫方式一。
撰寫方式二
1.一種模型訓練方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結果;
利用機器學習模型對所述第一處理結果進行第二處理,得到第二處理結果;
依據(jù)所述第二處理結果和所述標簽數(shù)據(jù)之間的差距,更新機器學習模型中的模型參數(shù),并繼續(xù)執(zhí)行所述獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù)的步驟及其后續(xù)步驟,直至在達到預設停止條件時,保存或者使用所述機器學習模型執(zhí)行相應的數(shù)據(jù)處理任務。
撰寫方式二的優(yōu)缺點以及建議
優(yōu)點:相對于撰寫方式一,更簡要并且滿足“判斷是否達到預設停止條件”這一步驟的執(zhí)行時間的靈活性要求。
缺點:
?。?)不清楚,其理由為:①因“繼續(xù)執(zhí)行所述獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù)的步驟及其后續(xù)步驟”這一技術特征中出現(xiàn)的“及其后續(xù)步驟”這一內容比較含糊,如“其”這個字指代誰、“后續(xù)步驟”是指哪些步驟等,以使采用撰寫方式二所撰寫的權利要求的保護范圍不清楚,從而使得日后可能會面臨一些風險。②因“在達到預設停止條件時”這一技術特征中出現(xiàn)的“預設停止條件”這一內容屬于自造詞,以使該技術特征無法準確地表示出何時停止訓練,從而使得采用撰寫方式二所撰寫的權利要求的保護范圍不清楚,進而使得日后可能會面臨一些風險。
?。?)限定性強,其理由為:非首輪訓練過程中所執(zhí)行的步驟也是可以靈活設置的,如非首輪訓練過程中所執(zhí)行的步驟包括圖1中S1-S4,或者,非首輪訓練過程中所執(zhí)行的步驟包括圖1中S2-S4等,如此使得采用撰寫方式二所撰寫的權利要求容易無法覆蓋一些可能的實施方式,從而導致權利要求的保護范圍受到影響。
建議:除非必要,本文不推薦撰寫方式二。
撰寫方式三
1.一種模型訓練方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結果;
利用機器學習模型對所述第一處理結果進行第二處理,得到第二處理結果;
依據(jù)所述第二處理結果和所述標簽數(shù)據(jù)之間的差距,更新機器學習模型中的模型參數(shù),并繼續(xù)執(zhí)行所述獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù)的步驟,直至在達到預設停止條件時,保存或者使用所述機器學習模型執(zhí)行相應的數(shù)據(jù)處理任務。
撰寫方式三的優(yōu)缺點以及建議
優(yōu)點:相對于撰寫方式一,更簡要并且滿足“判斷是否達到預設停止條件”這一步驟的執(zhí)行時間的靈活性要求;相對于撰寫方式二,克服了因“及其后續(xù)步驟”這一內容所導致的不清楚。
缺點:
(1)不清楚,其理由為:因“在達到預設停止條件時”這一技術特征中出現(xiàn)的“預設停止條件”這一內容屬于自造詞,以使該技術特征無法準確地表示出何時停止訓練,從而使得采用撰寫方式三所撰寫的權利要求的保護范圍不清楚,進而使得日后可能會面臨一些風險。
?。?)限定性強,其理由為:非首輪訓練過程中所執(zhí)行的步驟也是可以靈活設置的,如非首輪訓練過程中所執(zhí)行的步驟包括圖1中S1-S4,或者,非首輪訓練過程中所執(zhí)行的步驟包括圖1中S2-S4等,如此使得采用撰寫方式三所撰寫的權利要求容易無法覆蓋一些可能的實施方式,從而導致權利要求的保護范圍受到影響。
建議:相較于撰寫方式一和撰寫方式二,本文更推薦撰寫方式三。
基于上文撰寫方式一、撰寫方式二以及撰寫方式三的相關內容可知,這三種方式的部分或者全部缺點均來自于用于限定迭代循環(huán)這一過程的技術特征。然而,因通過迭代循環(huán)方式實現(xiàn)模型訓練是一種比較常規(guī)的技術手段,以使涉及人工智能的發(fā)明專利申請的發(fā)明點通常很少出現(xiàn)在迭代循環(huán)方式上,而是大部分出現(xiàn)在其他地方,如類似于圖1中S2這類的用于對樣本數(shù)據(jù)進行前期處理的步驟和/或類似于圖1中S3這類的用于借助模型進行數(shù)據(jù)處理的步驟等地方;還因這些地方通常會出現(xiàn)在某一輪訓練過程或者每一輪訓練過程,故可以通過限定一輪訓練過程的方式進行發(fā)明點保護?;诖?,本文給出了一種新的撰寫方式,也就是,下文撰寫方式四。
撰寫方式四
1.一種模型更新方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結果;
利用機器學習模型對所述第一處理結果進行第二處理,得到第二處理結果;
依據(jù)所述第二處理結果和所述標簽數(shù)據(jù)之間的差距,更新機器學習模型中的模型參數(shù)。
撰寫方式四的優(yōu)缺點以及建議
優(yōu)點:
(1)相對于撰寫方式一至撰寫方式三,更簡要并且克服了這些撰寫方式的所有缺點。
?。?)擴大了保護范圍,其理由為:因“一種模型更新方法”這一技術特征只是限定了權利要求所保護的方法用于實現(xiàn)模型更新處理,未限定應用領域必須是模型訓練這一領域,以使該權利要求所保護的方法適用于任一具有模型更新需求的領域。
缺點:撰寫方式四不適于保護迭代更新方式方面的發(fā)明點。
建議:相較于撰寫方式一、撰寫方式二、以及撰寫方式三,本文更推薦撰寫方式四。
另外,對于上文撰寫方式一、撰寫方式二、撰寫方式三以及撰寫方式四來說,這四種撰寫方式均涉及了“更新機器學習模型中的模型參數(shù)”這一技術特征,而且這個技術特征能夠準確地限定出模型更新時需要更新什么信息。然而,隨著人工智能技術的不斷發(fā)展,模型的更新不再局限于通過參數(shù)更新的方式進行實現(xiàn),還可以通過增加網(wǎng)絡模塊的方式,如lora微調進行實現(xiàn),以使“更新機器學習模型中的模型參數(shù)”這一技術特征無法涵蓋這種新增的模型更新方式?;诖耍疚慕o出了一種新的撰寫方式,也就是,下文撰寫方式五。
撰寫方式五
1.一種模型更新方法,其特征在于,所述方法包括:
獲取樣本數(shù)據(jù)和所述樣本數(shù)據(jù)對應的標簽數(shù)據(jù);
對所述樣本數(shù)據(jù)進行第一處理,得到第一處理結果;
利用機器學習模型對所述第一處理結果進行第二處理,得到第二處理結果;
依據(jù)所述第二處理結果和所述標簽數(shù)據(jù)之間的差距,更新機器學習模型。
撰寫方式五的優(yōu)缺點以及建議
優(yōu)點:克服了上文“更新機器學習模型中的模型參數(shù)”這一技術特征所導致的缺陷,如無法涵蓋通過增加網(wǎng)絡模塊方式實現(xiàn)模型更新的技術方案。
缺點:撰寫方式五不適于保護迭代更新方式方面的發(fā)明點。
建議:相較于撰寫方式一、撰寫方式二、撰寫方式三以及撰寫方式四,本文更推薦撰寫方式五。
基于上文五種撰寫方式的相關內容可知,對于涉及人工智能的發(fā)明專利申請來說,如果該申請的發(fā)明點能夠借助一輪訓練過程說清楚,則可以采用上文撰寫方式五撰寫該申請的獨立權利要求;如果該申請的發(fā)明點必須借助多輪訓練過程才能說清楚,則可以優(yōu)先選擇類似于上文撰寫方式三的撰寫方式撰寫該申請的獨立權利要求;如果該申請的發(fā)明點不涉及模型更新內容,則可以選擇使用“更新機器學習模型”這一技術特征撰寫該申請的獨立權利要求。
以上是筆者的一些個人經(jīng)驗總結,如有不妥之處,還請讀者批評指教。