Live API - 搜索 News

7 天

Google推出Gemini 3.5实时语音翻译：支持70多种语言，延迟仅几秒

Google推出Gemini 3.5实时语音翻译：支持70多种语言，延迟仅几秒,翻译,谷歌,语音识别,机器翻译,gemini,译后 ...

7 天

Gemini 3.5 Live Translate正式发布：流畅自然的实时语音翻译体验

二十年前，Google 翻译作为机器学习领域的先驱实验之一正式起步，致力于将语言科学转化为人与人之间的沟通桥梁。经过多年发展，这一项目已覆盖数十亿用户，每月翻译字词量超过一万亿。时至今日，Google 迎来新的里程碑，正式发布了 Gemini ...

6 天

谷歌干掉了「等你说完才翻译」，70+语言边听边译

Google 发布 Gemini 3.5 Live Translate，把实时同传从「等你说完再翻」推进到「边听边说」，70+语言、几秒延迟、语气保留。一句话还没说完，译音已经响在你耳边——而且是对方的语速、对方的语调，只慢几秒。

腾讯网

Meta开源全新移动端AI生成神器PyTorch Live，造个AI应用5分钟，安卓iOS都 ...

【新智元导读】近日，一年一度的PyTorch开发者大会召开。会上，Meta发布了PyTorch Live，这是一套可以为安卓和iOS用户提供人工智能体验的工具。近日，一年一度的PyTorch开发者大会召开。在会上，Meta（原名 Facebook）发布了PyTorch Live，这是一套可以为移动端用户 ...

腾讯网

Gemini 3.1 Flash Live：让语音AI更自然可靠

今天，我们通过 Gemini 3.1 Flash Live 推进了 Gemini 的实时对话能力，这是我们迄今为止质量最高的音频和语音模型。它为新一代语音优先AI提供了所需的速度和自然节奏，为开发者、企业和日常用户提供更直观的体验。 3.1 Flash Live 已在各种 Google 产品中推出：开发者 ...

新浪网

谷歌干掉「请再说一次」！Gemini 3.1毫秒级接话，实时Agent时代来了

【新智元导读】语音AI最烦人的一句话，可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验：不仅更快、更自然，连在交通声、电视声这样的真实噪音里，也更能听清你在说什么。刚刚，谷歌把语音AI最烦人的一句话狠狠干掉 ...

8 天

谷歌发布实时语音互译模型 Gemini 3.5 Live Translate：可识别 70 余种语言 ...

IT之家6 月 9 日消息，北京时间 9 日（今天）晚间，谷歌正式发布最新的实时语音互译音频模型 Gemini 3.5 Live Translate，迈出实时翻译的下一步。 Gemini 3.5 Live Translate 可自动识别 70 多种语言，并生成流畅、自然的翻译语音，同时保留说话者的语调、语速和音高。根据介绍，传统轮流式系统通常要等说话者说完后才开始翻译，Gemini 3.5 Li ...

来自MSN

谷歌发布最高质量音频模型Gemini 3.1 Flash Live，低延迟、高精度响应 ...

在生成式AI竞争加速向“实时交互”演进之际，谷歌正式推出Gemini 3.1 Flash Live模型。这一主打音频与语音实时能力的新模型，不仅强化低延迟对话体验，还进一步扩展至开发者生态，标志着Gemini体系正从“多模态理解”迈向“实时智能代理”的关键一步。谷歌将 ...

36氪

Facebook live向第三方开发者开放API，大疆无人机入选首批合作伙伴

Facebook对直播的再次进击。旧金山时间4月12日上午，Facebook的F8开发者大会在梅森堡举行。大会上，扎克伯格带了一台DJI（大疆无人机）上台，并现场演示了无人机直接在Facebook上进行视频直播的场景。据Facebook预计，截至2021年在线视频将会消耗70%的网络流量。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果