本文转载自微信公众号“数据法盟”
作者:麻策
该指南是一个难得的优质标准,总共近44页,通过非常完整的版块以及详尽的技术解释、并附以通俗易懂的场景案例。

韩国个人信息保护委员会认为,现行韩国法律中没有明确的标准来处理公开的个人信息,因此企业的不确定性很高。对此,个人信息委员会通过此次指南明确介绍为AI开发和服务而合法处理公开个人信息的法律依据。
韩国在生成式人工智能领域非常卷,其个人信息委员会在2023年8月发布《AI时代安全个人信息利用政策方向》,2024年2月发布非结构化数据假名处理标准,在5月又发表的《合成数据生成参考模型》之后,这一次又发布了《处理人工智能(AI)开发和服务中使用“公开数据”标准指南》,具体落实了适用于快速变化的人工智能、数据处理环境的个人信息保护原则和标准。为了使大规模语言模型(LLM)等AI开发的“核心原料”——公开的个人信息能够合法、安全地使用,韩国个人信息保护委员会提出了一定的标准,旨在降低企业的不确定性,提高国民的信任。
韩国个人信息保护委员会认为,公开的个人信息与个人信息处理者和信息主体之间没有以特定服务为媒介进行连接的直接关系,因此很难根据个人同意或合同签订等进行操作。对此,考虑到AI开发的目的和公开的个人信息的特性、风险水平等,“正当利益”条款可以成为实质性的合法依据。
以下是总结的划重点Q&A:
一、预训练和服务
二、提示词数据
三、公开的个人信息
四、敏感公开个人信息
五、企业措施限度

六、AI企业责任
七、合法利益运用
八、安全措施不确定
九、数据集验证
十、跨国企业歧视
十一、恶意犯罪利用

十二、开源和闭源模型

十三、用户权利保护
十四、指南其它Q&A