安卓的实时字幕现在可以帮助你“读懂言外之意”

谷歌在2019年的Google I/O大会上首次推出了实时字幕(Live Caption)功能。这项被低估的无障碍功能可以为设备中播放的任何语音生成字幕。尽管功能本身相当实用,但屏幕上的简单文本却难以准确表现场景音频中的情绪和强度。现在,谷歌通过表现字幕(Expressive Captions)对实时字幕进行了升级,利用AI捕捉语音和声音的情感强度,并以文本形式展现出来。

安卓的实时字幕现在可以帮助你“读懂言外之意”
安卓的实时字幕现在可以帮助你“读懂言外之意”

谷歌将在美国推出表现字幕,支持运行Android 14及以上系统且已启用实时字幕功能的安卓设备。

表现字幕通过AI捕捉语调、音量、环境提示以及人类发出的声音。尽管这些看似是微不足道的细节,但它们在超越普通文字传递信息方面起到了重要作用。通过个性化的字幕和标注,表现字幕更加贴近音频的生动表现。

安卓的实时字幕现在可以帮助你“读懂言外之意”

表现字幕为实时字幕新增了以下功能:

  • 全大写文字:字幕将用大写字母反映语音的情绪强度。例如,当朋友兴奋地祝你“HAPPY BIRTHDAY!”时,你将看到其情绪,而不仅仅是普通的“Happy birthday!”
  • 声音标注:字幕现在可以识别更多的声音,如叹气、咕哝和喘气,为用户传递重要的语调信息。
  • 环境声音:前景和背景中的额外声音,如掌声和欢呼声,也将被标注,从而更全面地展示环境中发生的情况。
安卓的实时字幕现在可以帮助你“读懂言外之意”

由于表现字幕是实时字幕的一部分,因此它适用于手机上的各种应用程序。无论是直播、社交媒体帖子还是来自亲友的视频消息,你都可以使用表现字幕。实时字幕和表现字幕均在设备上实时生成,即使在飞行模式下也可以使用。

上一篇 2024年12月6日 01:40
下一篇 2024年12月6日 01:47

相关推荐

  • 想知道Google I/O的日期吗?你得先帮忙解开一个谜题

    Google I/O 是一个开发者活动,几乎总是会发布硬件公告和现有产品的新功能。这个活动通常在5月举行,但我们通常直到有人破解谷歌每年发布的谜题才会知道确切的日期。如果你有兴趣挑战一下,可以尝试参与公司最新的游戏,以揭示2025年Google I/O的日期。 去年,社区需要通过一个名为《Break the Loop》的游戏(现在仍然可以玩)才能得知活动定于…

    2025年2月12日
    727
  • 谷歌去年在阻止Play商店中的恶意应用方面大量依赖AI

    如果2024年会因为某些事情被铭记,那么很可能它会被记住为生成性AI首次占据文化思潮的年份。无论你走到哪里,似乎都能看到关于AI的内容。在谷歌,公司全面投入了AI,几乎将其Gemini系统注入到他们所提供的每一项产品和服务中。 事实证明,这也适用于谷歌的安全团队。例如,谷歌Play安全团队刚刚发布了他们每年一次的报告,内容讲述了他们在背后所做的工作,如何保护…

    2025年1月30日
    534
  • 安卓上的Gemini新增图像搜索快捷方式—使用方法详解

    谷歌在其生成式人工智能的应用中,已经用更强大、更智能的Gemini取代了旧版助手。虽然我们在安卓系统和主要应用中几乎无处不见新的聊天机器人,但目前的状态仍有待改进。其中一个亟需的改进已经被解决,特别是在询问Gemini关于图像时。 在最新的Google Gemini应用中,用户可以在任何应用内分享图像,包括Google Photos,分享菜单中将新增Gemi…

    2024年10月3日
    1.1K
  • Galaxy S26 系列可能会让你花更多钱

    三星 Galaxy S25 系列在美国的定价与 Galaxy S24 系列保持一致,尽管硅片成本有所上涨。现在,有消息称 Galaxy S26 系列可能会涨价。 据 ET News 报道(感谢 Twitter 用户 Jukanlosreve 提供线索),由于零部件成本上涨,Galaxy S26 手机可能会面临价格上调。报道称,关键零部件的价格都在同时上涨。 …

    2025年11月4日
    245
  • 科学家们或许终于破解了柔性电池的关键难题

    智能手机制造商至今已相当成功地证明,折叠屏手机在商业上是可行的。当然,能够弯曲和折叠的屏幕,可能永远无法像传统的平面刚性屏幕那样耐用,但只要使用得当、细心呵护,它们一般不会出问题。如今,许多人已经开始憧憬下一步的发展,想知道折叠手机技术是否还能进一步进化,变得更加灵活——无论是字面上的,还是意义上的。如今,电池工程领域的一项新突破,让我们对此充满希望。 折叠…

    2025年4月15日
    495