当前位置: 首页 > 工具软件 > Mycroft > 使用案例 >

使用开放式AI语音助手Mycroft保护隐私

宦高岑
2023-12-01

语音辅助技术非常流行。 目前已经有25亿台这样的设备在使用中,到2023年,这一数字有望翻三番,达到80亿台。尽管主流语音辅助技术存在隐私和安全漏洞 ,但这种增长似乎还是势不可挡。

其中之一是“打开窗口”漏洞,例如,恶意人员在打开的窗户旁边行走并大喊:“嘿,打开门!” 并获得进入房屋的权限。 研究人员还为Alexa和Google识别了数千个假阳性唤醒词 ,这是注入恶意命令的潜在攻击媒介。 有些人冒着通过电视注入亚音速命令的风险。 亚马逊可能已经在使用频率操纵来阻止Alexa在其广告期间激活。 并且,与任何与网络连接的计算机设备一样,也存在潜在的后门和其他常见漏洞。

开源的隐私和安全

Mycroft AI这样的开源语音助手通过设计为安全性和隐私性提供了途径。 从本质上讲,开源软件鼓励对代码进行审查,以发现漏洞。

我为Mycroft服务的公司建立在语音辅助技术可以安全的想法之上。 我们有一个过程来处理所披露的常见漏洞利用和漏洞 (CVE)。 作为开发人员工具,我们严重依赖SSH等系统,并始终鼓励更改设备上的默认密码,包括设置向导。 我们还将诸如意图解析,技能和文本语音转换(TTS)之类的内容移至该设备,而其他主要参与者则在云中进行了操作。 对于精通技术的家庭用户,我们将很快发布必要的文章,以在防火墙后的家庭中提供完整的体验。 我们希望为用户提供对软件的尽可能多的控制。

语音打印使AI能够通过语音区分人,应该使用户能够为特定人员分配锁,购买和其他敏感功能的权限,从而缓解“打开窗口”和假阳性唤醒词漏洞。 。 这些都可以通过两因素身份验证或使用一次性口头密码的更深层语音生物特征来加强。 谷歌和亚马逊已经在其助手中部署了一些语音打印,我们正在与一些在该领域表现出希望的公司建立联系。 唤醒词发现的改进将限制可用假阳性的列表。 在设计合理的反馈循环中,误报应该不太可能起作用,因为它会在Mycroft的Precise tagger之技术中进行标记。

开源创新

从历史上看,鼓励实验的方法是通过开源。 这就是真正的创新发生和建立新技术的方式。

我们为创新者提供了机会,以更少的附加条件尝试语音助手技术。 开源使该软件成为社区的工作。 例如,Mycroft并非由16人组成的团队由9名技术人员组成,而是由成千上万的开发人员提供反馈,构建新功能并为核心软件做出贡献。 而且,借助我们的许可,创新者可以轻松地通过新的,出色的实施方案转而建立业务。

更深层次的说,开放意味着这项技术可以充分代表用户,而不仅仅是提供它的公司。 语音助手具有改变人们与所有技术交互方式的能力。 语音将以尚未想到的方式改变家庭,办公室,移动设备和公共场所。

我们希望人们提出的问题是:“我是否希望仅出于我的最大利益,还是零售商或搜索和数据公司的最大利益,使用这项技术?” 我们认为大多数人会选择前者。 我们知道提供这种服务的唯一方法是开放,透明和社区驱动。

语音助手功能

Mycroft的功能与其他语音助手相同,但有所不同。 大多数语音助手的语音堆栈使用设备上的唤醒词识别,然后将其余的交互发送到处理该交互的云中,并将响应流回发给扬声器。

Mycroft将其中的大部分转移到运行该软件的设备上。 我们使用设备上的唤醒词发现来侦听命令。 当检测到唤醒词时,该命令将被记录并发送到云中以进行语音到文本的转录。 转录后,文本文件将发送回设备,在该设备中执行自然语言处理,技能处理和语音合成。

技能赋予Mycroft他的能力。 我们一直在将内部团队和社区的技能稳定地添加到新的Mycroft技能市场中 。 Mycroft可以控制多个音乐源,连接到众多物联网平台,从Wikipedia和Wolfram | Alpha等12个源获取常规信息,玩游戏,掷骰子,讲故事,进行速度测试等等。

我们将Mycroft模块化,因此用户可以轻松交换零件。 例如,我们目前提供两个唤醒词和三个声音,并且还有更多,但Mycroft还可以运行来自任何提供商(云或本地)的自定义唤醒词和TTS声音。

如果您想了解Mycroft的工作原理,请观看展示Mycroft 技能的视频, 以尝试YouTube上进行 社区贡献

翻译自: https://opensource.com/article/19/2/mycroft-voice-assistant

 类似资料: