| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

黄页/二手

旅游

谷歌: 憋了几个礼拜,谷歌开发者大会信息量爆炸了

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
北京时间5月22日凌晨,一年一度的 Google I/O 大会在加州山景城盛大开幕了。谷歌憋了好几周的大招,终于舍得一口气放出来,直接来了一波信息轰炸。


差评也派出前线小记者,世超不仅看了大会,还近距离接触了一把谷歌 CEO Sundar Pichai。

逛完一大圈,咱这就带大家伙儿实地走进 I/O,看看谷歌都整了哪些新活儿。


总结一下,这次谷歌把能更新的全做了一遍,AI在各种产品上的应用更是全面开花。

首先迎面向我们走来的是语言模型大军。

作为谷歌的头牌之一,自三月发布以来,Gemini 2.5 Pro 的表现一直表现非常出色,在 WebDev Arena 和 LMArena 排行榜处于全球领先的地位。

这回,谷歌在 Gemini 2.5 Pro 的基础上继续探索,加入了深度思考模式,推出 Gemini 2.5 Pro Deep Think。

虽然具体的技术细节没有公布,但从他们放出的这张图可以看出,能深度思考的 Gemini 2.5 Pro 在数学、编程、多模态推理方面的效果都十分惊人,甚至在数学上碾压了 OpenAI 的 o3。






有了好模型做支撑,谷歌尝试在这个基座上再玩点新东西。

他们通过更新 Live API 推出了原生音频输出功能,不仅能够输出人味十足的声音,还能捕捉对话的情绪,自动调整语气。


在 Gemini 的加持下,Live AI 不仅说话的声音像人,说话的内容、方式也像人。

具体效果大家可以看下面的视频

不知道各位差友感觉如何,世超听到第十秒的恶魔低语,鸡皮疙瘩都起来了。

除此之外,谷歌还优化了侧重效率的主力模型 Gemini 2.5 Flash,推出了 AI agent —— Project Mariner。

值得注意的是,除了常规的模型更新,他们还推出了 Gemini Diffusion,不使用 Transformer 架构,表现可以和 Gemini 2.0 Flash-Lite 相当,但速度是它的五倍。


觉得新闻不错,请点个赞吧     好新闻没人评论怎么行,我来说几句
上一页1234下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0350 秒 and 3 DB Queries in 0.0012 秒