作者:{CX}@ArkTeam
在2018年6月30日举办的中国国际软件博览会上,中国工程院方滨兴院士在题为”人工智能安全之我见”的专题演讲中,首次提出了人工智能保险箍(以下简称AI保险箍)的概念,其内涵如下。
人工智能行为体:人工智能行为体是AI保险箍的宿主,能够感知外部环境并作为输入,通过内部算法进行决策,并利用自身驱动装置与物理世界产生交互行为的自治硬件实体。其中,外部环境包括所处自然环境及相关生物体等;内部算法是预置在人工智能行为体内部、用于产生决策的程序;驱动装置指的是可与物理世界交互或可改变人工智能行为体所处空间坐标的硬件;自治指的是人工智能行为体可以自己设定目标函数或自主决策。
人工智能行为体失控三要素:未来出厂的任何人工智能行为体,只要满足失控三要素,都存在失控风险,都需要带上”AI保险箍”。
串接位置:人工智能行为体一般由”AI决策系统”和”AI驱动装置”组成,而AI保险箍则是串接在两者之间,以硬件形态存在。
基本功能:类似于僵尸网络,AI保险箍需支持远程控制;AI保险箍可按照默认或远程指令对人工智能行为体的能源进行控制和优先占用;类似于飞机上黑匣子,可记录人工智能行为体全部数据并安全保存。基本功能是所有AI保险箍的最小实现。
安全机制:反摘除,一旦失效,AI行为体无法工作或开始自毁;防篡改,类似U盾,不可被篡改;健壮性,能在各种恶劣环境下具备基本工作能力;多模表决,提高容错能力。
增强功能与安全围栏:限于篇幅,不做展开。
综上,AI保险箍既像”保险丝”,又像”紧箍”,它串联在人工智能行为体中,可按照默认或远程指令对人工智能行为体的能源、行为、状态等进行控制、监听、记录以防止其失控。