近日,DeepSeek凭借其高超的“深度思考”能力在一夜之间收获诸多拥趸。一些用户在与之几轮对话后,迅速“触类旁通”,让其为自己撰写“年度工作总结”或者“会议发言材料”。
早在生成式人工智能诞生时起,就有人尝试利用它们撰写“爽文小说”,或者生成短视频,以此赚取流量。
“林深把最后一件T恤塞进行李箱时,窗外正飘着细雨。十六平方米的出租屋里,霉斑在墙角蔓延成地图,老式空调发出苟延残喘的嗡鸣……”
你恐怕很难想象,这样一段文字是由AI根据记者要求,自行生成的。在这“开篇”内容之外,还有千余字的剧情桥段,描绘了一个普通人“逆袭”成为职场精英的故事。
除了代劳撰写小说外,一些大学生早早发现了AI的潜力,偷摸利用AI为自己撰写学术论文。由于AI撰写的论文素材有不少来源于公开的文献资料,这不仅给使用者带来剽窃的隐忧,还增加了知识产权纠纷风险。因此,国内多所高校已经启用技术工具,去除论文中的“AI味”。
利用AI作为创作辅助,需要注意哪些法律风险?
即使使用公开资料进行AI训练,也可能产生侵权风险。“AI生成的内容可能是有原型的,而这个原型有可能拥有版权方。”长期从事AI领域研究的清华大学教授沈阳认为,相较于使用公开资料进行模型训练,使用自有数据所造成的侵权风险相对更低,但仍要留意相关训练语料的版权来源。
即使是用户作为自然人“指导”AI生成相关内容,也可能不享受著作权利。“AI生成的内容是否有版权现在是‘世界性难题’。”世辉律师事务所合伙人王新锐告诉记者,从现有司法实践看,由AI生成的内容是否享有著作权利还要看该内容是否融入了用户的“独创性思维”。加之因AI生成内容的过程涉及软件开发者、所有者、使用者等多方主体,即便这些生成内容本身受著作权法的保护,其版权应归属哪一方同样是目前各界争论的焦点。
2024年,国家网信办出台《人工智能生成合成内容标识办法(征求意见稿)》,其中明确“在生成合成内容的文件元数据中添加隐式标识”,而“文件元数据”即用于记录该文件的来源、属性、用途和版权等内容。
王新锐等法律界专家建议,AI大模型的所有者在进行机器训练时,要识别和审查训练语料的版权来源,对于有明确版权方的素材,应事先获得其授权许可;对于独创性较为显著、商业价值较高的素材,尤其要予以重点关注。同时,建立AI生成内容知识产权的合规审查流程,完善面向公众和版权人的投诉举报处理渠道,尽可能降低AI生成内容的侵权风险。
据新华社电