(上海海事大学,上海市201306)
前言
自2016年3月,获得日本第三届日经新闻社“星新一奖”的人工智能小说,再到谷歌公司预收购的DeepMind研究所研发创造的人工智能程序——AlphaGo“围棋大师”,在与世界级人类棋手的争锋对决中,一举击败对手,引发了国际热议,在人们的一片热议中,人工智能被推上了社会各领域研究的浪潮,与此同时,人工智能与著作权法间千丝万缕的联系也自然受到人们的关注。
一、人工智能自我学习的内涵
在了解了人工智能自我学习的广泛应用后,不可否认地要探讨其中隐含的法律问题,即人工智能生成物是否构成作品。
我们需要暂且抛开对主体符合性的“循环论证”,因为《著作权法》中对于作者的要求是自然人,即使是法人,也仅仅是将其“视为”作者,那么如果从主体方面对人工智能生成物的作品进行评判的话,从一开始就会得出否定结论,这就比如证明“未满18岁的孩子不能进网吧的原因是其未成年”,这种证明方式本身就是错误的,因为这只是在用结果论证原因,对于未满18岁的孩子不能进网吧的原因,应该是这些孩子心智尚未成熟,自我控制力差,而不能用其未成年的结果论证不能进网吧的原因。在对待人工智能自我学习所形成生成物是否构成作品的问题中同样也是如此,其是否构成作品的原因应该是生成物是否具有构成作品的特征,而不能够用主体不是自然人的结果去论证原因。因此,讨论的焦点应该是“人工智能的自我学习是否具有独创性”。
二、人工智能自我学习的分类
什么是人工智能的自我学习,即计算机学习
首先是“监督式学习”,假设X是一名房地产经纪人,生意蒸蒸日上,因此X雇了一批新员工来帮忙,但麻烦的却是X作为有经验的房地产经纪人,他有能力评价预估出房子的大致价位,但是作为初来乍到的员工却不能利用丰富的经验得出恰当的结论,为房子给出适合的价格。那么为了帮助新员工,就不妨创造一款能够按照房子的承载面积、所处地段以及同行业竞争价格等要素来预测房子成交价的智能软件,来具体应用至其余房子的成交价格,这就可称得上是“监督式学习”。即在已经了解问题答案的情况下,反向寻找出处理问题的逻辑。很明显,这类人工智能的运作方式与传统的《著作权法》中对于作品特征的认定相差甚远,其是在设计者给定的参数与设计下进行的监督学习,最大的特点在于输入有限的数据,得出有限的结论,结论完全依赖于初始参数,作为生成物“主体”的计算机不但得不到独立创作的空间,甚至连“演绎作品”的规制范围也无法触及,因为其局限性使之难以得出新的内容,只能充其量算作是不断进行地交叉复制所形成的复制品。
何为“非监督式学习”?再以房地产经纪人为例,在不知道每栋房子售价的情况下,即使所知道的仅仅是每栋房屋的大小、位置等信息,即使此时并无法尝试预测未知的数据(如价格),但是也可以运用机器学习做一些有意思的事。例如可以通过算法运作,自行根据参数提供的数据进行区分,调控出承载因素不同的市场,便会得出比较有意思的结论,比如,在大学城附近的房屋需求者比较倾向于户型不大,但卧室分配多的房源,而郊区的房屋需求者则倾向于普通三卧室的较大户型。利用这种“学习方式”可以得出与初始参数领域差别较大的结论,得到了一种看似接近于“独创性”的结论。这就是我们所说的“非监督式学习”。
三、从“非监督式学习”算法探究其是否具有独创性
“非监督式学习”的生成物是否能够超越人类成为具有独创性的作品,即为最大的争议焦点,那么对其探究的第一步,就要从它的具体算法说起,人工智能的算法很多,包括遗传算法、神经网络等。在诸多算法中,最具争议以及人工智能最常用的则是神经网络算法,所以其他算法在本文中暂无论述必要。
神经网络,回归本质,就是设计者希望通过对现实中的生物思维进行实际模拟,以望实现直接的人工思维,利用“神经网络”实现人工智能,又称“深度学习”神经网络,是现阶段的人工智能最常使用的算法之一,它的存在可以说是人工智能是否具有“独创性”极具代表性的评价标准,但具体分析其操作过程,根本不存在计算机的具体创作空间,不具有独创性。
一方面,“非监督式自我学习”不具有“独”。“非监督式自我学习”是未来机器学习的方向,继续以AlphaGoZero版本为例,其能够在自我左右互搏中,产生训练数据,具体是指,能够通过神经网络的深度学习,在某些特定的领域,看似不再依赖于设计者的数据输入。但是,这一切先进算法的起源是由于初始标签——“围棋规则”在起作用,而不是完全由计算机程序自我完成的,并不具有著作权法上“独”的意义。专家指出,AlphaGoZero的技术虽然足以降低算法对数据的需要,但这仍然需要大量的数据输入。因此AlphaGoZero不可能拥有《著作权法》中对作品创作所要求的“自主思考”,即按自身意识设定目标、创意。
另一方面,“非监督式学习”不具有“创”的特征。其一,AlphaGoZero的自主学习带来的技术革新并不是万能的“智能”,它的存在并不可能与所有人工智能领域相契合。除了它与人对弈的基本功能外,AlphaGoZero的具体算法操作很难作用于其他领域,因为其缺乏“创”的空间,不能自行创作出适用于其他领域的技术,即使是大家所看好的新材料开发,新药的化学结构探索等等领域,暂且不说尚且需要时间来验证,况且针对语音识别、图像识别、自然语音理解、无人驾驶等领域,运转机器所用的数据是无法一一列举,逐一输入的,同样也不可能由计算机凭空产生。
四、小结
总而言之,探讨人工智能生成物是否具有独创性,还是要立足于人工智能的实际发展程度。人类的数据是一步步摸索过来的,机器学习虽然原理和人类不一样,但它也是需要一步步去积累学习,这就是“非监督式学习”,然而,机器在完全不知道任何事项的情况下,不可能做出判断结果,也就是说,一件事物如果想让机器去了解,那必定需要海量的数据去支持,去做它的初始资源,并且就现阶段的发展程度而言,而后的生成物是不可能脱离初始资源的,同样也是不可能有足够空间让计算机进行“独立创作”的。
参考文献
[1]孙祥瑜:《机器学习方法在手写数字识别中的应用》,载《中国战略新兴产业》2017年第44期.
[2]陈嘉博:《机器学习算法研究及前景展望》,载《信息通信》2017年第6期.
[3]刘肖楠:《神经网络在人工智能中的应用》,载《信息技术与信息化》2015年第1期.
[4]王迁:《论人工智能生成的内容在著作权法中的定性》,载《法律科学(西北政法大学学报)》2017年第5期.
作者简介:杨玲(1995.08-),女,陕西省咸阳市人,学历:硕士在读,研究方向:法律。