安卓的实时字幕现在可以帮助你“读懂言外之意”

谷歌在2019年的Google I/O大会上首次推出了实时字幕(Live Caption)功能。这项被低估的无障碍功能可以为设备中播放的任何语音生成字幕。尽管功能本身相当实用,但屏幕上的简单文本却难以准确表现场景音频中的情绪和强度。现在,谷歌通过表现字幕(Expressive Captions)对实时字幕进行了升级,利用AI捕捉语音和声音的情感强度,并以文本形式展现出来。

安卓的实时字幕现在可以帮助你“读懂言外之意”
安卓的实时字幕现在可以帮助你“读懂言外之意”

谷歌将在美国推出表现字幕,支持运行Android 14及以上系统且已启用实时字幕功能的安卓设备。

表现字幕通过AI捕捉语调、音量、环境提示以及人类发出的声音。尽管这些看似是微不足道的细节,但它们在超越普通文字传递信息方面起到了重要作用。通过个性化的字幕和标注,表现字幕更加贴近音频的生动表现。

安卓的实时字幕现在可以帮助你“读懂言外之意”

表现字幕为实时字幕新增了以下功能:

  • 全大写文字:字幕将用大写字母反映语音的情绪强度。例如,当朋友兴奋地祝你“HAPPY BIRTHDAY!”时,你将看到其情绪,而不仅仅是普通的“Happy birthday!”
  • 声音标注:字幕现在可以识别更多的声音,如叹气、咕哝和喘气,为用户传递重要的语调信息。
  • 环境声音:前景和背景中的额外声音,如掌声和欢呼声,也将被标注,从而更全面地展示环境中发生的情况。
安卓的实时字幕现在可以帮助你“读懂言外之意”

由于表现字幕是实时字幕的一部分,因此它适用于手机上的各种应用程序。无论是直播、社交媒体帖子还是来自亲友的视频消息,你都可以使用表现字幕。实时字幕和表现字幕均在设备上实时生成,即使在飞行模式下也可以使用。

上一篇 2024年12月6日 01:40
下一篇 2024年12月6日 01:47

相关推荐

  • DJI最新款无人机DJI Flip折叠起来几乎难以辨认

    CES 2025可能已经在我们身后,但科技公司仍然有许多新设备,正准备正式亮相。或许我们1月名单中最大的名字是三星,随着Galaxy S25发布的Unpacked活动即将在一周后举行,但今天是DJI继续推动这一势头,因为该公司推出了新的Vlogger相机无人机DJI Flip。 DJI为Flip配备了1/1.3英寸48MP CMOS传感器,能够以高达60FP…

    2025年1月15日
    1.1K
  • RingConn 新款智能戒指可为你提供血压检测

    智能戒指已经保持相对稳定一段时间了,所以如果你现在的戒指还能正常使用,其实没有太大的升级理由。但情况正在发生变化。在 2026 年 CES 展会上,RingConn 推出了第三代(Gen 3),承诺不仅仅是对第二代的小幅更新。 RingConn Gen 3 依旧使用钛金属,但现在提供五种颜色和三种表面处理:拉丝银(Brushed Silver)、拉丝玫瑰金(…

    2026年1月5日
    200
  • 苹果认为AI开发至少落后两年

    苹果Apple Intelligence于6月WWDC大会亮相,但即便已展示AI服务,不过《彭博社》记者Mark Gurman 最新专栏指出,现在传出部分员工认为,苹果AI开发落后约两年。 苹果WWDC大会亮相许多Apple Intelligence功能,显示朝人工智慧领域迈出第一步。苹果打造许多 AI 功能,如通知摘要、重要讯息通知、了解上下文新Siri、…

    2024年10月21日
    862
  • 摩托罗拉Razr Plus 2025以热红色版本重新亮相

    Razr Plus 2024目前是市场上最好的折叠手机之一,但你可能不应该购买它,因为它很快就要更新了。据报道,摩托罗拉正在准备发布其继任者——Razr Plus 2025,我们最近首次看到了它的设计和规格。现在,又一张渲染图在网上曝光,展示了这款设备的闪亮Rio Red配色。 这张新的渲染图由著名泄密者Evan Blass提供,展示了Moto Razr P…

    2025年2月25日
    776
  • 在等待OnePlus Open 2吗?我们有个坏消息

    OnePlus凭借OnePlus Open强势进入折叠屏手机市场,因其设计和功能获得了我们以及许多其他人的赞誉。自然,继任者的发布期待也逐渐升温,传闻指向2025年发布。然而,OnePlus现在已确认,今年不会推出新款折叠屏手机,这也结束了关于OnePlus Open 2的猜测。 在OnePlus社区论坛的一篇帖子中,Open产品经理Vale Gu回顾了原始…

    2025年2月14日
    707