苹果全球开发者大会WWDC将由6月10日美东时间下午1点(北京时间11日凌晨1点)的主旨演讲拉开序幕。外界普遍将其定义为苹果把AI功能全面整合进各大硬件操作系统的关键时刻。
WWDC历来是以软件为中心的发布活动,去年推出Vision Pro苹果首款混合现实头显设备而成为例外。分析称,今年苹果或专注于宣传软件功能的AI更新来追赶竞争对手,例如将人工智能添加到表情符号emoji、照片编辑、短信和电子邮件中,而不会宣布任何真正具有革命性的东西。
预计下周将发布新一代iOS 18手机操作系统和macOS 15电脑操作系统的更新,智能手表、iPad平板电脑和Vision Pro混合现实头显的操作系统应该也会融入更多AI功能,例如可以在苹果手表使用虚拟助手Siri在其他设备上播放音乐等。
还有分析称,iPad和iPhone上的眼动追踪以及VisionOS上的实时字幕功能已经官宣,下周可能听到更多有关这些与无障碍功能相关的更新以及确切发布时间。
AI助力“更智能的Siri”,但更复杂功能可能明年才推出
在最有可能基于人工智能而大力增强的功能中,首当其冲的便是苹果虚拟助手Siri。
据信苹果正在全面重建一个能够由大语言模型提供支持的Siri,这些大语言模型可能会由苹果自研的端侧AI Ajax LLM和微软支持的OpenAI ChatGPT技术相结合而成。
但利用人工智能对Siri改头换面的任务规模巨大,可能要到明年某个时候才能全面推出,下周在iOS 18最新手机操作系统中可能仅会发布一个初始版本,拥有一些基本AI功能。
例如,Siri处理多步骤任务的能力或推迟到明年发布,今年9月iOS 18中的新版Siri可能每次只能处理一条语音指令。苹果最终的计划是令Siri允许用户一次性输入多个指令,例如利用AI总结会议录音、或智能剪裁修饰完照片后,再马上用邮件发送给相关人士。
重建后,除了完成多步骤任务的能力,AI助力下“更智能的Siri”预计还将实现以下功能:
更智能地理解用户需求,利用AI分析用户在设备上的操作,并自动启用由Siri控制的功能;
用语音回答用户提问,而不是显示网络链接,而且声音听上去更自然;
为短信提供基于端侧大语言模型生成的自动回复建议,并用AI生成自定义表情符号emoji;
了解用户的联系人、约会日程、方位等,以便作出更智能的响应;
能将语音备忘录实时转写成文字版,能够总结通知、短信、网页、长篇文档等所有内容;
能够与其他应用程序交互,例如用户可以要求“将这篇笔记Note移动到我的新主文件夹”,或者打开Apple News应用中的特定出版物;
通过语音控制应用程序内的单个功能,例如可以要求Siri执行删除电子邮件、通过电子邮件发送网络连接,或智能编辑照片等高级操作;
使用人工智能自动确定某项功能在端侧AI还是云端服务器处理,更好地保护用户数据隐私。
有分析称,苹果将评级新版Siri正式进入AI时代。